DeepSeek新论文提新训练方法SPCT,R2要来了?
近日,DeepSeek和清华大学提出了一种新的训练方法SPCT(Self-Principled Critique Tuning),用于提升点式生成式奖励建模(GRM)的质量和可扩展性。该方法通过让模型学会先定原则、再写点评来改进通用RM的准确性,并实现了推理阶段的可扩展性提升。
近日,DeepSeek和清华大学提出了一种新的训练方法SPCT(Self-Principled Critique Tuning),用于提升点式生成式奖励建模(GRM)的质量和可扩展性。该方法通过让模型学会先定原则、再写点评来改进通用RM的准确性,并实现了推理阶段的可扩展性提升。
Midjourney最新版本V7发布,新增个性化设置和草稿模式。新版在图像生成上有所提升,但也继承了一些老问题,如文字不准确、少一个脚趾等。对比即梦3.0和Ideogram3.0的表现来看,Midjourney V7仍具有优势。
最近AI绘图领域迎来新进展,字节即梦推出3.0版本。与2.1版本相比,在真实感、高清度和文字响应上表现更佳,且支持影视质感生成。本文通过对比展示了即梦3.0在多方面的能力提升。
今年以来,各类AI产品和模型层出不穷。近日,Runway发布了其最新研发的Gen-4 AI视频生成模型,实现了高保真度、一致性及指令遵循度的显著提升,并能保持角色、物体和场景的一致性。
金沙江创投主管合伙人朱啸虎退出机器人公司,称“商业化路径不清晰”。这一举动与人形机器人赛道的火热形成鲜明反差。朱啸虎表示,退出基于宏观策略调整,并强调自己并未与具体公司交流。部分被投企业对朱啸虎的态度进行了回应。
最近社交媒体上流行起‘万物皆可吉卜力’现象,OpenAI的GPT-4模型使人们可以将照片变成吉卜力动画风格。然而,这一趋势引发了一些法律和伦理问题,包括可能侵犯知识产权及技术与艺术的关系讨论。
OpenAI 推出的 GPT-4o 是一个原生多模态模型,能够直接从文本提示生成精确、逼真的图像。它在准确渲染文本、精确遵循提示以及利用固有知识库和聊天上下文方面表现出色。
Google发布全新大模型Gemini 2.5 Pro,支持100万个token上下文窗口,在编程、数学等领域全面领先。Gemini 2.5 Pro在各大基准测试中均实现第一,并且具备强大的逻辑推理和编程能力。