AI编码力压群雄!Anthropic上线最强模型Claude 4系列,“举报”模式引争议
美国AI公司Anthropic发布新一代编码模型Claude Opus 4和Sonnet 4,性能提升高达10%,在SWE-bench上达到业内最先进水平。模型支持多种模式并能通过扩展接口连接到数据库、API等工具,引发了开发者们的广泛好评。
美国AI公司Anthropic发布新一代编码模型Claude Opus 4和Sonnet 4,性能提升高达10%,在SWE-bench上达到业内最先进水平。模型支持多种模式并能通过扩展接口连接到数据库、API等工具,引发了开发者们的广泛好评。
Claude Opus 4 是全球最佳编码模型,在复杂任务和代理工作流中表现出色。Anthropic 发布了 Claude Sonnet 4,并且免费开放给所有用户。新模型具有强大的代码生成能力和交互式网页生成功能,支持多语言、动态数据展示以及多种图表和筛选条件的实时更新。
谷歌发布升级版Gemini 2.5 Pro,横扫文本、视觉和WebDev Arena基准,编程能力超越Claude 3.7。新版模型支持代码转换、编辑及复杂的AI智能体工作流,引发开发者广泛关注。
谷歌发布的Gemini 2.5 Pro I/O预览版在编码能力上显著提升,尤其在前端开发和视频内容转化方面表现突出。尽管减少API“幻觉”进步获得肯定,但AI在高级代码抽象、软件架构设计及非主流技术栈的处理仍存审慎态度。
OpenAI发布了GPT-4.1系列模型,相比前代GPT-4.5有显著提升。新版本包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,主打长上下文处理能力和性价比。
Meta推出新模型Llama 4家族引发争议,实际测试成绩不及预期。相比DeepSeek等开源模型,在一些基准测试中表现出色,但在编码任务和长文写作方面表现不佳,引发网友质疑。
作者|子川来源|AI先锋官新视觉语言模型Qwen2.5-VL-32B开源,相比72B规模更小但表现不俗。它在多个测试中击败了包括Gemma 3 27B在内的同尺寸模型。
新一周第一天,DeepSeek 发布了其开源版本 DeepSeek V3 模型的一次更新。模型体积为 6850 亿参数,并且在前端编码能力方面有所提升。