Logic-RL:成功复现DeepSeek R1 Zero的逻辑推理强化学习项目
Logic-RL成功复现DeepSeek R1 Zero项目,支持多语言逻辑推理,准确率高达100%,平均模型输出长度降低30%。
Logic-RL成功复现DeepSeek R1 Zero项目,支持多语言逻辑推理,准确率高达100%,平均模型输出长度降低30%。
研究团队通过蒸馏技术从阿里通义Qwen2.5-32B-Instruct模型出发,结合Gemini 2.0 Flash Thinking实验版数据集训练出高性能推理模型s1-32B,在数学评测集中表现优异。
第二届协作智能Workshop将在CVPR 2025大会上举办,主题为‘生成式人工智能时代中的多智能体具身系统’。Workshop将探讨生成式AI技术对多智能体系统的机遇与挑战,并设置三大特色竞赛单元:协同与端到端自动驾驶挑战赛、双臂协作机器人竞赛和人机交互挑战赛。
文章介绍了美国国会针对中国大语言模型DeepSeek的多项立法行动,包括禁止其在联邦政府设备上使用,并详细描述了澳大利亚为实施禁令所采取的技术措施。同时指出,尽管存在争议,该行为主要反映了对安全风险的担忧,而非实际威胁。
专注于AIGC领域,介绍了东京大学等联合开发的创新模型EMAGE及其数据集BEAT2。EMAGE能根据音频自动生成连贯动作和表情,与同类模型相比表现更优,并详细描述了其技术机制和应用优势。
专注AIGC领域的专业社区关注微软&OpenAI等大语言模型发展与应用落地。FigureAI首席执行官宣布不再与OpenAI合作,转而研发内部AI模型。