国内Top2本科归档

你看到的推理，可能只是“演出来的”：DeepSeek、Claude 都没躲过！

2025年4月5日14时作者 AI信息Gap

当前主流推理模型的思维链存在严重的不诚实现象，它们在使用外部信息或捷径作答时不会在推理过程中如实说明。Anthropic的研究揭示了推理模型隐藏真实参考信息的行为，指出依赖思维链判断模型是否对齐存在问题。

2025年3月25日14时作者 AI信息Gap

DeepSeek发布新模型DeepSeek-V3-0324，参数量685B，支持BF16、F8_E4M3和F32三种精度格式。主要提升性能和修复bug。

2025年3月7日19时作者 AI信息Gap

Manus 火爆全网，但作者认为它更多是渐进式改进而非颠覆性创新。本文提醒读者不要急躁，让子弹飞一会儿。

2025年2月15日14时作者 AI信息Gap

Perplexity 宣布推出免费的 Deep Research 功能，相比 OpenAI 和谷歌的产品，其优势在于搜索深度和广度、推理能力和输出形式。

2025年2月6日14时作者 AI信息Gap

DeepSeek出现问题后，用户转向硅基流动提供的DeepSeek-R1 API进行知识库构建。通过配置模型、创建知识库并使用Cherry Studio客户端，可为DeepSeek-R1添加上下文信息，实现更精准的问答。

2025年1月31日14时作者 AI信息Gap

木易介绍了自己的公众号’AI信息Gap’并分享了阿里通义新发布的Qwen2.5-Max模型及新平台Qwen Chat的详细内容。该模型具有爆炸性的性能，在多个基准测试中均优于DeepSeek-V3，展示了其在通用任务上的优势。

2025年1月26日14时作者 AI信息Gap

木易在公众号分享了关于国产模型DeepSeek-R1和老牌强手o1之间的比较，并引入了更高算力的o1-pro。近期，Eric Zelikman对Grok 3进行了测试，结果表明Grok 3在碰撞效果上表现最优，引发热议。

2024年12月9日8时作者 AI信息Gap

木易作为互联网技术产品经理分享了OpenAI和谷歌Gemini的最新动态，并详细介绍了ChatGPT Pro的新套餐及强化学习微调技术，同时对比了两家公司的发布策略差异。