硅谷大佬们在X上是如何花式夸DeepSeek的
OpenAI和Anthropic为代表的‘警惕派’与更多科技大佬们之间关于DeepSeek模型R1的讨论热烈进行。从马斯克质疑显卡用量到美国政客搬出盗取技术帽子,再到HuggingFace联合创始人Thomas Wolf对DS与R1的认可,开源已成为不可阻挡的趋势,有助于打破国界和技术壁垒。
OpenAI和Anthropic为代表的‘警惕派’与更多科技大佬们之间关于DeepSeek模型R1的讨论热烈进行。从马斯克质疑显卡用量到美国政客搬出盗取技术帽子,再到HuggingFace联合创始人Thomas Wolf对DS与R1的认可,开源已成为不可阻挡的趋势,有助于打破国界和技术壁垒。
Andrej Karpathy认为OpenAI的Operator项目类似于数字世界的’人形机器人’,预言未来十年将是智能体(Agent)发展的时代。尽管存在挑战,Karpathy仍对智能体充满信心,并描述了其未来的发展蓝图。
OpenAI联合创始人Andrej Karpathy分享了中国开源大模型DeepSeek-v3,仅使用280万小时GPU算力即超越Llama-3。该模型在多种基准测试中表现优异,并采用MLA和MoE等高效策略节省大量计算资源。
Andrej Karpathy 推荐的文章指出,认知负荷才是软件开发的关键问题。文章强调了减少外在认知负担的重要性,通过简化代码、使用组合而非继承等方式来降低理解成本。
Andrej Karpathy分享了他阅读的200多本书单,包括科幻、人工智能类及生活相关书籍。推荐的作品有Ted Chiang的小说、《自私的基因》等,并认为Elon Musk十分认可此书单。
Andrej Karpathy 读完200本书后道出超级人工智能的恐怖真相,书中关于超级智能、信息技术演变和未来战争的预测引发深思。
NotebookLM团队负责人宣布离职创业引发关注。其推出的AI播客功能使用户只需一个链接或文档几分钟内就能转成高质量对谈音频。ElevenLabs和PodLM.ai等初创公司也推出了类似功能,使人人可以做AI播客成为可能。
知名AI学者Andrej Karpathy认为,大型语言模型的对话回答主要是模仿人工标注数据的结果,并非真正的人工智能。他批评了RLHF(奖励学习强化学习)的方法。
2024年,AI Agent成为热点。OpenAI、Anthropic等公司纷纷推出Agent产品,打破大模型局限。国内大模型公司如智谱发布AutoGLM和GLM-PC,实现多样化操作任务的自主执行。未来,LLM操作系统将推动AI应用落地,智能设备互联互通将成为可能。