开源模型归档 - 第9页共10页

书生·浦语大模型升级，突破思维密度，4T数据训出高性能模型

2025年1月16日22时作者 GiantPandaCV

上海人工智能实验室对书生大模型进行了升级，推出了InternLM3.0版本，通过精炼数据框架提升了数据效率和思维密度，节约了75%以上训练成本，并实现了常规对话与深度思考能力融合。

2025年1月14日14时作者 AI技术研习社

文章介绍了开源本地大语言模型LLaMA2如何在本地环境中实现文本转SQL功能，强调了其在数据隐私保护中的重要性。

2024年12月31日16时作者量子位

国产模型DeepSeek V3在竞技场中表现优异，但在部分逻辑陷阱问题上略逊一筹。量子位进行了实测对比，发现Claude 3.5 Sonnet在理解某些脑筋急转弯和弱智吧问题上更为精准。

2024年12月26日18时作者机器之心

DeepSeek AI开源最新混合专家语言模型DeepSeek-V3-Base，性能优于多个竞品模型，编程能力大幅提升。

2024年12月16日14时作者量子位

全球首个端侧全模态理解开源模型Megrez-3B-Omni发布，支持图片、音频、文本三种模态数据，在多种测评基准中表现优异。

2024年12月8日22时作者极市干货

本文提出了一种名为Optimus-1的智能体框架，结合知识引导规划器和经验驱动反思器，在Minecraft环境中实现了对长序列任务的成功率显著提升。

2024年12月5日20时作者 PaperWeekly

MG² 模型通过旋律引导机制，仅使用有限资源实现了高质量音乐生成。该模型在参数量和训练数据上均显著低于现有 SOTA 模型，并在多个客观指标及主观评估中表现出色，展示了其在音乐创作领域的潜力。

2024年12月5日13时作者 AI前线

作者 | David Gilbertson
译者 | 平川
策划 | 褚杏娟
本文最初发布于 Dav

2024年12月3日20时作者乌鸦智能说

自ChatGPT上线以来，大模型行业经历了显著变化。尽管OpenAI仍保持领先，但市占率下降且开源模型未取得预期效果。大模型商业化的挑战明显，而AI应用领域显示出强劲的增长势头，如AppLovin的股价增长7倍。