DeepSeek新论文提新训练方法SPCT,R2要来了?
近日,DeepSeek和清华大学提出了一种新的训练方法SPCT(Self-Principled Critique Tuning),用于提升点式生成式奖励建模(GRM)的质量和可扩展性。该方法通过让模型学会先定原则、再写点评来改进通用RM的准确性,并实现了推理阶段的可扩展性提升。
近日,DeepSeek和清华大学提出了一种新的训练方法SPCT(Self-Principled Critique Tuning),用于提升点式生成式奖励建模(GRM)的质量和可扩展性。该方法通过让模型学会先定原则、再写点评来改进通用RM的准确性,并实现了推理阶段的可扩展性提升。
灵心巧手获得超亿元种子轮融资,用于底层技术研发和产品优化迭代。公司深耕柔性人形机器人在大健康领域的应用,并已推出Linker Hand系列灵巧手,覆盖多种设计规格和传感器系统,可实现复杂精细动作的控制与感知交互。
英伟达完成对贾扬清AI公司Lepton的数亿美元收购,Lepton主要业务是出租英伟达GPU服务器,并开发软件帮助创企在云中构建和管理AI应用。此举或为英伟达进军云和企业软件市场的新动向,其本身已向云客户出租GPU但份额较小。
2025年CSRankings公布,卡耐基梅隆大学蝉联第一。清华、上海交通大学/浙江大学并列第三,北京大学位居第五。中国高校在AI领域表现突出,包揽全球前十中的六席。
DeepSeek发布新论文提出SPCT方法解决通用RM推理时扩展问题,并计划先发布o3和o4-mini,GPT-5将在几个月后推出。
DeepSeek与清华大学合作的研究提出了一种通用奖励模型GRM及其改进方法SPCT,通过增加推理计算量实现了有效的推理时扩展,并显著提升了LLM的性能。
ATEC2025 科技精英赛由清华大学等顶尖学府联合主办,聚焦人工智能与机器人技术融合创新。赛事设置双赛道,奖金池高达21万美元,提供商业级硬件设备,并邀请专家学者评委参与验证和交流。
Dolphin 是由 Dataocean AI 和清华大学合作开发的多语言语音识别模型,支持40种东方语言和22种汉语方言。它在210,000小时的数据上训练完成,包含专用数据集和开源数据集。该模型能执行语音识别、VAD、分割和LID任务。