OpenAI推出真实世界百万报酬AI编程能力测试基准:实测Claude 3.5 最强!

OpenAI联合一众大佬发布SWE-Lancer,一个评估前沿LLM在真实软件工程任务中的基准测试。它从Upwork精选了超过1400个真实的软件工程任务,总价值高达100万美元。SWE-Lancer包含个人贡献者和技术领导者的两种类型的任务,采用端到端测试模拟真实环境。研究结果显示模型表现仍有提升空间,OpenAI开源了数据集以促进更多研究。

阶跃星辰刚刚开源了其30B参数视频生成模型:Step-Video-T2V

阶跃星辰发布30B参数视频生成模型Step-Video-T2V,支持中英双语输入及可变长度视频生成,提供标准版和加速版。采用DiT架构与3D全注意力机制,使用DPO技术优化质量,配置推荐使用步骤推理步数及cfg_scale值。

一个刚刚开源的浏览器翻译插件,支持DeepSeek等20+种翻译引擎!

最近发现了一款名为FluentRead的开源免费浏览器翻译插件,支持20+种语言和多种翻译服务,提供双语对照、自定义选项及跨平台兼容性。用户可以在Chrome、Edge和Firefox等主流浏览器中快速安装使用。