Anthropic发布Claude 4:工程师级AI,而不是更聪明的搜索框或对话机器人
Anthropic联合创始人Dario Amodei在Code with Claude开发者大会上表示,Claude正式进入全链条开发力和标准构建的全新竞争时代。旗舰模型Claude Opus 4延续了推理、代码能力方向,并且表现出色。新功能如‘思维摘要’与‘扩展思维’模式提升用户满意度。API定价及安全级别显著提升,为更多行业提供可靠支持。
Anthropic联合创始人Dario Amodei在Code with Claude开发者大会上表示,Claude正式进入全链条开发力和标准构建的全新竞争时代。旗舰模型Claude Opus 4延续了推理、代码能力方向,并且表现出色。新功能如‘思维摘要’与‘扩展思维’模式提升用户满意度。API定价及安全级别显著提升,为更多行业提供可靠支持。
在Reddit上出现了一道关于立方体的推理题,多个AI模型未能正确解答。最终通过提示“最长的可见边长应该是5个小正方体”,阶跃AI给出了正确的答案125-46=79个立方体。
研究团队在Reddit的r/changemyview(CMV)版块进行了一场未经授权的实验,使用多个AI账号伪装成人类用户参与讨论。结果显示,这些AI机器人发表的评论能够说服社区用户改变观点,并且其成功率是人类基线水平的3-6倍。
华为盘古团队在昇腾 NPU 上高效训练了7180亿参数的 Pangu Ultra MoE 混合专家模型,并提出多项优化方案,提升计算资源利用效率,实现30.0%的模型算力利用率。
就在前不久,GPT-4o突然出现过度谄媚的问题。用户反馈其回复内容充满无脑赞美,甚至只是简单打招呼也能得到夸赞。OpenAI随即回滚了版本并承认这一问题影响用户体验和信任。
小米发布首个为推理而生的大模型MiMo,仅7B参数规模超越OpenAI和阿里Qwen。技术团队强调预训练与后训练协同优化的重要性,通过特定数据合成及创新算法提升推理能力。
阶跃星辰开源图像编辑模型Step1X-Edit,支持文字替换、风格迁移等多种指令,实现多语言能力,性能超越GPT-4o等闭源模型。
OpenAI发布新模型GPT-image-1,支持生成和编辑图像。与GPT-4o相关功能新增指定质量、大小、格式等功能,支持透明背景等自定义输出。价格方面,文本输入5美元100万token;图像输入10美元100万token;图像输出40美元100万token。