AI播客Day02:Anthropic推理模型引担忧、Devin 2.0发布价格从500$下调至20$、千问3进入最终开发阶段
在本期AGI Hunt播客中,智子和John讨论了AI领域最新动态,包括Anthropic关于推理模型不准确性研究发现、Devin 2.0价格下调等。他们还探讨了AI代理技术的爆发、ChatGPT图像生成成绩惊人以及开源AI模型的进展与挑战等问题。
在本期AGI Hunt播客中,智子和John讨论了AI领域最新动态,包括Anthropic关于推理模型不准确性研究发现、Devin 2.0价格下调等。他们还探讨了AI代理技术的爆发、ChatGPT图像生成成绩惊人以及开源AI模型的进展与挑战等问题。
OpenAI的o3推理模型成本从预估的3000美元飙升至3万美元,远超预期。尽管o3-high试图通过暴力试错生成大量文本解答问题,但被ARC-AGI系统排除在外,因为每个任务的成本高达3万美元。
MLNLP社区致力于促进机器学习与自然语言处理领域的学术交流与进步。文章介绍了如何解决大型推理模型(LRMs)带来的冗余思考问题,包括字数预算、双系统切换、模型路由等方法,并探讨了未来高效推理的发展方向。
谷歌发布最强推理模型Gemini 2.5 Pro,在多个测试平台超过GPT-4等知名模型,编程能力显著提升,已面向高级用户提供并计划上线Vertex AI。
腾讯正式推出推理模型混元-T1,基于TurboS基座打造,具备强大的长文理解和加速能力。通过强化学习和大规模训练,T1能有效提升推理性能,并且在多个基准测试中表现优异。
OpenAI上线o1-pro模型API,其输入价格为150美元/100万输入/输出token,输出价格为600美元。相比R1贵270倍,引起网友争议。
百度发布新款推理AI模型Ernie 4.5,免费向用户开放。该模型在文本生成方面优于GPT-4.5,并已在云收入增长和收购YY直播平台交易中得到体现。