AI工程师Devin 刚上班就翻车了!
这家叫Cognition Labs的公司把自家的AI工具吹上了天,说是「首个人工智能软件工程师」,还开价500美元一个月。
但实际体验让人大跌眼镜。
前Uber工程师、知名技术专栏作家Gergely Orosz直接开炮:这就是一场针对非技术高管的营销骗局!
营销VS现实
Cognition Labs刚刚宣布他们的AI工程师Devin开始正式工作。
但真相呢?
实际测试者Steve表示:Devin的效率远低于现有的编程助手工具Cursor。他花了500美元测试Devin,结果发现这位「AI工程师」连基本的编程任务都搞不定。
更有趣的是,Cognition Labs此前宣称Devin成功完成了Upwork上的任务。
但原任务发布者出来打脸:Devin根本没有解决问题,也没有提交任何解决方案!
狂野营销遇冷场
一个令人尴尬的事实:虽然Cognition Labs声称Devin是革命性产品,但连自家的网站都不是用Devin开发的。
更「有趣」的是,在SWE-Bench基准测试中,Devin的成绩也没那么亮眼:仅能独立解决13.86%的GitHub问题。换句话说,约87%的问题它都搞不定。
作为参考,一个初级工程师都能比这个成绩好得多。
为什么要玩这场营销游戏?
背后的原因其实很简单:GitHub Copilot把AI创业公司逼到了墙角。
GitHub Copilot的优势实在太明显了:
-
每月仅20美元的价格
-
超过130万开发者付费使用
-
已经运营2.5年,技术成熟稳定
这让新入场的AI开发工具公司很难找到突破口。要么喊出「完全替代开发者」这样的口号来吸引眼球,要么就只能默默无闻了。
Gergely预测:这种「AI可以完全替代程序员」的营销噱头还会继续。
一些非技术背景的CEO会被这种说法吸引,每月花500美元雇佣「AI工程师」,然后发现现实并非如此。
市场反应不买账
不少媒体和非技术高管确实被这种营销说辞吸引。但实际开发者们并不买账。
Russell Kaplan(Cognition Labs总裁)不得不出来灭火:
「我们从未认为Devin能取代人类工程师。相反,更强大的工程工具会让招聘更多工程师变得更有价值。」
他还表示,正如汇编语言的自动化并没有减少程序员数量一样,AI工具只会让开发者的工作性质发生变化。
但,事实胜于雄辩。
给开发者的忠告
Orosz提醒开发者们:要谨慎对待那些标榜自己能『取代开发者』的产品。特别是当这些工具实际上反而会降低你的工作效率时。
Gergely特别提醒开发者:千万不要向管理层推荐那些标榜能取代你的AI工具,尤其是当这些工具的效率还不如现有的AI辅助开发工具时。
Cognition Labs总裁Russell Kaplan试图辩解:「我们从未说过要取代人类工程师。相反,我们认为AI工具会让每位工程师的产出更高,从而创造更多的工程师职位。」
务实比炒作更重要。
GitHub Copilot用2.5年的时间和实际价值证明了这一点。
当一家公司把自己的产品称为「AI软件工程师」,并宣称它能独立完成编程任务时,这种营销方式本身就在暗示着替代的可能性。
或许,这就是AI淘金热的真实写照。
(文:AGI Hunt)