2025-02-19 - 第10页共11页 - 每时AI

ICLR 2025 Spotlight 让城市「动」起来！DynamicCity突破4D大场景生成技术边界

下午12时 2025/02/19 作者机器之心

多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，

OpenAI推出真实世界百万报酬AI编程能力测试基准：实测Claude 3.5 最强！

下午12时 2025/02/19 作者 AI寒武纪

OpenAI联合一众大佬发布SWE-Lancer，一个评估前沿LLM在真实软件工程任务中的基准测试。它从Upwork精选了超过1400个真实的软件工程任务，总价值高达100万美元。SWE-Lancer包含个人贡献者和技术领导者的两种类型的任务，采用端到端测试模拟真实环境。研究结果显示模型表现仍有提升空间，OpenAI开源了数据集以促进更多研究。

大型语言扩散模型

上午8时 2025/02/19 作者 NLP工程化

LLaDA 将扩散模型应用于大规模语言建模，提出了一种新方法解决传统语言模型无法逆向生成内容的问题，并在多个任务上表现出色。

LLM 分词可视化工具

上午8时 2025/02/19 作者 NLP工程化

LLM 分词可视化工具介绍，参考了 https://tiktokenizer.vercel.app/。欢迎支持 NLP 工程化知识星球及资料群。

专注于强化学习（RL）提升大语言模型（LLM）推理能力的资源库

上午8时 2025/02/19 作者 NLP工程化

Awesome-RL-based-LLM-Reasoning 是一个专注于提升大语言模型推理能力的资源库，汇集了最新的相关论文、幻灯片和开源项目，涵盖多种RL方法和LLM推理优化技巧。

阶跃星辰刚刚开源了其30B参数视频生成模型：Step-Video-T2V

上午8时 2025/02/19 作者 NLP工程化

阶跃星辰发布30B参数视频生成模型Step-Video-T2V，支持中英双语输入及可变长度视频生成，提供标准版和加速版。采用DiT架构与3D全注意力机制，使用DPO技术优化质量，配置推荐使用步骤推理步数及cfg_scale值。

Awesome-Slow-Reason-System：深度探索慢思考推理系统的前沿进展与实践

上午8时 2025/02/19 作者 NLP工程化

Awesome-Slow-Reason-System介绍了一种慢思考推理系统的前沿进展与实践，涵盖了50多篇最新研究成果，涉及多种技术如MCTS、RL等，并提供复现资源。

Step-Audio-TTS-3B是业界首个能够生成RAP和哼唱的TTS模型

上午8时 2025/02/19 作者 NLP工程化

业界首个能够生成RAP和哼唱的TTS模型Step-Audio-TTS-3B发布，标志着语音合成领域的一次重大进步。

SkyReels-V1-Hunyuan-I2V：天工基于混元微调了一个图生视频模型

上午8时 2025/02/19 作者 NLP工程化

天工基于混元微调的图生视频模型支持400多种自然动作组合，专注于捕捉33种独特面部表情。

一个刚刚开源的浏览器翻译插件，支持DeepSeek等20+种翻译引擎！

上午8时 2025/02/19 作者开源星探

最近发现了一款名为FluentRead的开源免费浏览器翻译插件，支持20+种语言和多种翻译服务，提供双语对照、自定义选项及跨平台兼容性。用户可以在Chrome、Edge和Firefox等主流浏览器中快速安装使用。