机器学习
大模型也需要自我反思,上海AI Lab合成“错题本”让大模型数学成绩提升13.3%
上海AI Lab提出LEMMA项目,通过构建‘错误-反思-修正’数据让大模型从错误中学习,Llama3-8B数学题准确率提升13.3%,有效提高模型的纠错和泛化能力。
网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一
DeepSeek新版R1-0528在编程能力测试中表现突出,能在网页编程上击败Claude Opus 4。实测显示其能快速生成太阳系动画、AGI主题网站及俄罗斯方块游戏代码,并且对国内用户更为友好。
10张图全面理解AI Agents、Agentic、RAG、MCP技术栈。
分享了AI Agents、Agentic、RAG、MCP等AI技术的概念、应用和挑战,涵盖工具框架、实际案例以及路线图等内容。
刚刚,Scale AI CEO Alexandr Wang正式官宣:Meta重金投资并挖走了我
Meta 将以 148 亿美元投资 Scale AI,Alexandr Wang 加入 Meta 领导新的「超级智能」实验室。
Meta发布V‑JEPA 2:无需标注,让AI像人类一样看世界、推理、行动
Meta发布V-JEPA 2模型,通过学习超过一百万小时的原始视频建立直觉世界模型,无需人工标注帮助AI Agents理解物理常识并规划行动。该模型采用联合嵌入预测架构训练,在视频上进行自监督学习,能处理多视角短视频,并具备强大的视觉空间下自回归规划能力。