Claude 3.7归档 - 每时AI

【最新论文】多轮对话陷阱：为什么最强大模型依然在交流中“迷失方向”？

下午2时 2025/05/25 作者 AI技术研习社

实用户逐步表达需求的对话中，也会“走偏”、答非所问，甚至陷入逻辑混乱。这不仅是能力问题，更是“对话可

谷歌首款混合推理Gemini 2.5登场，成本暴降600%！思考模式一开，直追o4-mini

上午11时 2025/04/18 作者新智元

谷歌发布首个混合推理模型Gemini 2.5 Flash，引入了革命性”思考预算”功能，性能显著提升，在多个基准测试中表现优异。

Claude 4六个月内发布！Anthropic联创Kaplan：AGI两三年内到来

下午11时 2025/04/12 作者新智元

Anthropic联合创始人兼首席科学家Jared Kaplan预测人类水平AI可能在2-3年内实现。Kaplan认为模型智能提升、上下文窗口扩展以及强化学习使AI能力快速扩展，Claude 4将在六个月内发布，DeepSeek等实验室也在迅速进步。

DeepSeek V3 悄然升级，代码能力惊艳，直逼 Claude 最新模型

上午11时 2025/03/25 作者每日AI新工具

在科技界一片喧嚣之中，DeepSeek团队发布了V3基座模型的新版本DeepSeek-V3-0324，其代码生成和理解能力大幅提升，在数学推理、前端开发等领域表现甚至优于Claude 3.5和Claude 3.7 Sonnet。新版本已免费提供下载，参数685亿的混合专家模型还拥有宽松的开源协议和低廉的价格优势。

超出想象！DeepSeek V3小更新:实测强到离谱，胜过R1，毫不逊色Claude 3.7

上午11时 2025/03/25 作者 AI寒武纪

Sam Altman 推出的 DeepSeek v3 版本在编程能力和前端表现方面超越了 Claude 3.7，并且没有做任何宣传就上传至 Hugging Face。实测显示，DeepSeek v3 在多个任务上的表现都非常出色，包括赛朋克风格的贪吃蛇游戏和天气卡片生成任务。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31