开源模型
DeepSeek V3获竞技场最强开源认证!与Claude 3.5 Sonnet对比实测来了
国产模型DeepSeek V3在竞技场中表现优异,但在部分逻辑陷阱问题上略逊一筹。量子位进行了实测对比,发现Claude 3.5 Sonnet在理解某些脑筋急转弯和弱智吧问题上更为精准。
超越Claude 3.5紧追o1!DeepSeek-V3-Base开源,编程能力暴增近31%
DeepSeek AI开源最新混合专家语言模型DeepSeek-V3-Base,性能优于多个竞品模型,编程能力大幅提升。
LangChain:2024 年 AI 应用开发报告
文章总结了LangChain平台在2024年的用户行为和数据趋势,包括开源模型的使用增加、Agent模式的发展、Top 10 LLM提供商的变化、向量数据库的增长以及开发者对AI Agent的关注等。文章还探讨了可观测性的重要性、不同编程语言的选择变化、流程复杂度增加、工具调用行为的增长以及Llm调用量的变化,最后讨论了评估和人类反馈在提升应用质量中的作用。
全球首个全模态理解开源端模型:长语音自动总结,图文音啥都会!300%推理速度领先,来自无问芯穹
全球首个端侧全模态理解开源模型Megrez-3B-Omni发布,支持图片、音频、文本三种模态数据,在多种测评基准中表现优异。
NeurIPS 2024|哈工深提出新型智能体Optimus-1,横扫Minecraft长序列任务
本文提出了一种名为Optimus-1的智能体框架,结合知识引导规划器和经验驱动反思器,在Minecraft环境中实现了对长序列任务的成功率显著提升。
旋律即所需!开源项目MG²重新定义音乐生成新范式
MG² 模型通过旋律引导机制,仅使用有限资源实现了高质量音乐生成。该模型在参数量和训练数据上均显著低于现有 SOTA 模型,并在多个客观指标及主观评估中表现出色,展示了其在音乐创作领域的潜力。
ChatGPT发布两周年,OpenAI市占率怎么还下降了?
自ChatGPT上线以来,大模型行业经历了显著变化。尽管OpenAI仍保持领先,但市占率下降且开源模型未取得预期效果。大模型商业化的挑战明显,而AI应用领域显示出强劲的增长势头,如AppLovin的股价增长7倍。