DeepSeek团队新作:把代码变成思维链,大模型推理各种能力全面提升
利用300多万个实例将代码转换成思考过程构建数据集CODEI/O,提升Qwen、Llama等模型推理能力,覆盖常识、数学、代码、物理、工程等多个领域。
利用300多万个实例将代码转换成思考过程构建数据集CODEI/O,提升Qwen、Llama等模型推理能力,覆盖常识、数学、代码、物理、工程等多个领域。
AIxiv专栏介绍及其新成果HugWBC控制器,支持机器人同时掌握多种步态及精细调整行为指令,提高运动控制能力。该研究成果在模拟环境中训练,并通过评估验证其有效性。
上海交通大学提出SiTo方法,通过基于相似性的令牌剪枝技术,无需训练且硬件友好地加速扩散模型。显著提升了生成质量并减少了内存和计算成本。
集智俱乐部联合上海交通大学等组织发起「具身智能」读书会,采用自下而上的层级结构探讨机器人与具身智能技术前沿。读书会涵盖硬件系统设计、数据及仿真环境应用、机器人学习方法以及具体应用场景分析等内容,旨在促进跨学科合作,解决复杂性挑战、学习泛化等问题。
近期研究提出自回归移动扩散(ARMD)模型,该模型重新定义了时间序列的扩散过程,通过滑动操作和历史序列迭代生成未来序列预测。相较于传统基于噪声的方法,ARMD更好地模拟了时间序列的连续性演化特性,展示了在多个数据集上的优越性能。
上海交通大学和东方理工的研究团队提出了一种新的自回归移动扩散模型(ARMD),旨在解决当前基于扩散的时间序列预测方法在时间连续性上的不足。ARMD 模型利用历史数据预测未来,通过滑动操作生成中间状态,与传统方法不同的是,它实现了采样和预测目标的统一,提升了时间序列预测的效果。
中国AI创业者倾向于在毕业学校所在地或之前工作过的公司所在地创业。以清华、北大、浙大等高校为例,AI创业者更倾向于在北京、上海和浙江注册公司;而阿里系、百度系及腾讯系的AI创业者则偏好选择在浙江、北京和广东等地。