强化学习
AI 教母李飞飞展望:LLM 之上是 Agent AI
李飞飞发布Agent AI综述性报告,指出LLM之上是Agent AI,并从多模态感知、交互、学习、应用等方面进行阐述,革新游戏、机器人、医疗等行业,推动AI迈向通用人工智能。
智源发布2025十大AI技术趋势:从Agent到Agentic AI
智源研究院发布2025年人工智能技术及应用趋势,包括AI4S推动科学研究、具身智能元年、多模态大模型实现高效、RL+LLMs提升基础模型性能等。
具身智能赛道迎来另类玩家,同时布局智能+传感+控制三大技术,已批量出货韩国
深谋科技同时专注于先进控制、传感与通用智能三大类关键共性技术,通过自主研发突破多项核心技术,并已形成从器件设计到商业化应用的闭环。公司产品涵盖六维力传感器、高精度陀螺仪等,在传感器领域取得创新进展;在自动控制方面采用模型预测控制和强化学习结合的方法,解决机器人控制难题;通用智能领域探索新型具身智能世界模型研究。
仅需一万块钱!清华团队靠强化学习让 7B模型数学打败GPT-4o
清华大学等团队提出PRIME方法,仅用8张A100,在不到10天时间训练出一个数学能力超过GPT-4o的7B模型Eurus-2-7B-PRIME,准确率提高显著。该方法采用隐式过程奖励解决大模型强化学习中的奖励稀疏问题,有望推动复杂推理能力提升。
具身智能工业场景需求明确,扩大应用场景和处理复杂数据仍是发展重点|云深处李超@MEET2025
云深处科技联合创始人李超在MEET 2025智能未来大会上表示,具身智能提高了传统机器人的泛化能力。目前行业处于L2级,主要应用于工业场景。云深处已推出多款面向电力、消防、救援等行业的机器人产品,并展示了其在实际应用中的优势和挑战。