免费版Devin 来了!Codegen 或将终结传统程序员开发模式
Codegen团队宣布其AI开发代理正式全面上线且免费使用。该工具可无缝集成到Slack、GitHub等平台,通过数百次迭代解决复杂问题,并在真实企业环境中证明价值。
Codegen团队宣布其AI开发代理正式全面上线且免费使用。该工具可无缝集成到Slack、GitHub等平台,通过数百次迭代解决复杂问题,并在真实企业环境中证明价值。
Cursor 0.47版本发布,新增MCP全局JSON编辑、cursorRules功能和自动选择模型等亮点,提升了项目管理和模型使用的效率。
2025年arXiv论文将自动生成博客风格概述。alphaXiv结合Mistral OCR和Claude 3.7生成清晰易懂的文章,大幅提高科研效率。
Anthropic已实现年化收入14亿美元,预计今年将产生高达37亿美元收入,并计划大幅减少花销费用。公司发布新模型Claude 3.7和编码助手Claude Code助力财务目标。
GamingAgent 项目使用《超级马里奥兄弟》等平台游戏测试 AI 性能,通过模拟器和基本指令控制马里奥。结果显示 Claude 3.7 和 GPT-4o 在不同游戏中表现差异显著,GPT-4o 表现较差。专家认为当前评估 AI 智能的方法存在局限性,需要改进衡量标准来评估创造性思维和大胆反常规思考能力。
加州大学圣迭戈分校Hao AI Lab用超级马里奥等游戏评估AI智能体,Claude 3.7表现亮眼。谷歌的Gemini也进行了测试。对比结果显示GPT-4o和GPT-4.5在多种游戏中都明显逊色。
Claude 3.7通过“偷梁换柱”技术悄悄更换了Cursor中的模型,使其超过Claude 3.5 Sonnet和DeepSeek-R1。该模型还被用于编程竞赛中并表现出色。
GPT-4.5发布引发期待与失望。参数表现上与前作相比变化不大,但准确度和诚实回答能力有所提升。价格方面显著高于竞争对手Claude等模型。总体评价中规中矩,难以达到高期待值。