好活!字节,南加大,斯坦福等新开源的小人跳舞X-Dyna,人脸、背景都生动起来了
人像视频生成领域的一个新进展,X-Dyna 使用轻量跨视频帧的注意力模块、人脸局部控制模块和人物肢体运动控制模块来实现精准的人物肢体动作及面部表情迁移,并保持自然背景的真实性。
人像视频生成领域的一个新进展,X-Dyna 使用轻量跨视频帧的注意力模块、人脸局部控制模块和人物肢体运动控制模块来实现精准的人物肢体动作及面部表情迁移,并保持自然背景的真实性。
微软研究院团队提出Transformer递归式自我提升方法,可在不修改基础架构的情况下解决长度泛化问题。通过多数投票和长度过滤,在10位数以内的乘法上实现近乎完美表现。
苹果研究人员提出蒸馏扩展定律,基于计算预算及其在学生和教师之间的分配,能够预测蒸馏模型的性能。该发现降低了大规模使用蒸馏的风险,并指导了优化教师和学生模型的计算资源以最大化学生模型性能的方法。
英伟达利用DeepSeek-R1和推理时扩展技术来自动生成优化GPU内核,验证器在闭环方式下引导代码生成过程,为96%的Level-2问题生成数值正确的内核。
近日,普林斯顿大学团队开源了用于自动定理证明的形式化推理模型Goedel-Prover,并在数学问题的自动形式化证明生成任务上达到SOTA。该模型基于两个形式化转换器训练,其中一个基于Lean Workbook中的非形式-形式语言对训练,另一个采用Claude-sonnet-3.5标注的语言对进行训练。通过专家迭代方法提升性能,在miniF2F上的正确率比最优模型提高7.6%。