开源模型
颠覆LLM格局!AI2新模型OLMo2,训练过程全公开,数据架构双升级
非营利机构AI2推出完全开放模型OLMo 2,其在同等大小模型中表现最优,并公开了训练数据和方法。OLMo 2系列包括7B和13B型号,在多个任务上优于Llama-2系列模型,同时降低了能耗。
OpenAI掀桌子!免费版ChatGPT,提供o3-mini模型!
专注AIGC领域的专业社区报道OpenAI免费版ChatGPT上线及背后影响。DeepSeek-R1开源迫使OpenAI加速o3模型推出,虽然免费使用次数有限制,但已有用户表示满意。
书生·浦语大模型升级,突破思维密度,4T数据训出高性能模型
上海人工智能实验室对书生大模型进行了升级,推出了InternLM3.0版本,通过精炼数据框架提升了数据效率和思维密度,节约了75%以上训练成本,并实现了常规对话与深度思考能力融合。
DeepSeek V3获竞技场最强开源认证!与Claude 3.5 Sonnet对比实测来了
国产模型DeepSeek V3在竞技场中表现优异,但在部分逻辑陷阱问题上略逊一筹。量子位进行了实测对比,发现Claude 3.5 Sonnet在理解某些脑筋急转弯和弱智吧问题上更为精准。
超越Claude 3.5紧追o1!DeepSeek-V3-Base开源,编程能力暴增近31%
DeepSeek AI开源最新混合专家语言模型DeepSeek-V3-Base,性能优于多个竞品模型,编程能力大幅提升。
LangChain:2024 年 AI 应用开发报告
文章总结了LangChain平台在2024年的用户行为和数据趋势,包括开源模型的使用增加、Agent模式的发展、Top 10 LLM提供商的变化、向量数据库的增长以及开发者对AI Agent的关注等。文章还探讨了可观测性的重要性、不同编程语言的选择变化、流程复杂度增加、工具调用行为的增长以及Llm调用量的变化,最后讨论了评估和人类反馈在提升应用质量中的作用。
全球首个全模态理解开源端模型:长语音自动总结,图文音啥都会!300%推理速度领先,来自无问芯穹
全球首个端侧全模态理解开源模型Megrez-3B-Omni发布,支持图片、音频、文本三种模态数据,在多种测评基准中表现优异。