Kimi-Dev:强大的开源编程LLM,助力软件开发任务
Kimi-Dev 是一款强大的开源编程LLM,性能超越其他开源模型,在SWE-bench Verified上达到60.4%;支持本地部署和Hugging Face使用,并通过大规模强化学习优化解决方案的准确性和鲁棒性。
Kimi-Dev 是一款强大的开源编程LLM,性能超越其他开源模型,在SWE-bench Verified上达到60.4%;支持本地部署和Hugging Face使用,并通过大规模强化学习优化解决方案的准确性和鲁棒性。
Kimi发布开源代码模型Kimi-Dev,在SWE-bench Verified上取得60.4%成绩,参数量只有72B。该模型采用BugFixer和TestWriter两种角色的结合进行训练,目前权重和代码均已发布。
美国AI公司Anthropic发布新一代编码模型Claude Opus 4和Sonnet 4,性能提升高达10%,在SWE-bench上达到业内最先进水平。模型支持多种模式并能通过扩展接口连接到数据库、API等工具,引发了开发者们的广泛好评。
Mistral发布开源编程模型Devstral,在软件工程任务上超过DeepSeek全家桶和Qwen3 235B。参数仅24B,可在单卡RTX4090甚至32G内存的Mac上运行。
Anthropic 宣布完成35亿美元E轮融资,投后估值达615亿美元。该资金将用于开发下一代AI系统、增强计算能力及深化研究。
Anthropic发布Claude 3.7 Sonnet和配套工具Claude Code,首个集成混合推理能力的AI模型提升了编码效率。Claude Code让开发者能直接在终端完成复杂的编码任务,提升开发速度。
Anthropic 推出 Claude 3.7 Sonnet 混合推理模型,不仅可即时回答问题,还能进行逐步思考。它在编码方面表现出色,并推出代理编程工具 Claude Code。Claude 3.7 Sonnet 的价格与前代相同,适用于免费至企业多个计划。
Anthropic发布了新款Claude 3.7和Claude Code,Claude 3.7是首个混合推理模型,可在不同模型间选择答案,并展示思考过程。它在多个基准测试中表现优异,在SWE-bench Verified 和 TAU-bench 中表现出色,在零售和航空场景下的表现也优于其他模型。Anthropic还推出了代理编码工具Claude Code,能帮助用户完成代码任务。
Anthropic发布新模型Claude 3.7 Sonnet,这是一个混合推理模型,提供即时回答和深入思考两种模式。Claude 3.7 Sonnet在编程测试中表现出色,并且推出了辅助编程工具Claude Code。
Anthropic发布了其新模型Claude 3.7 Sonnet,这是一个混合推理模型,具备标准思考和扩展思考模式。它在多个测试中表现出色,并改进了代理训练能力。虽然Claude 3.7 Sonnet在一些指标上不如其他顶级推理模型,但Anthropic强调其在解决GitHub上的实际软件问题方面表现出色,并推出了智能编码工具Claude Code。