阿里开源的声音克隆TTS重磅升级,CosyVoice2支持流式输出,更加流畅自然,用户。

阿里的CosyVoice2迎来重大升级,通过流式合成输出大幅降低语音识别和合成的延迟,提升软件、硬件交互体验。该模型支持多种语言及情感控制功能,已在多个开源项目中得到应用。

对话科技部发言人:虚拟数字人不能完全替代新闻发言人

2025年国务院新年招待会上,科技部新闻发言人吕静分享了明年将进一步努力服务媒体需求,尤其是满足老百姓对科技创新工作的求知欲。她提到了多样化创新政策发布和成果解读的重要性,并特别提到单杏花同志等科研典型人物主题报道的效果。

突破自动驾驶视频生成极限:港中文&港科大&华为联手推出MagicDriveDiT

香港中文大学、港科大与华为联合推出MagicDriveDiT,基于DiT架构设计,提升自动驾驶视频生成质量。支持昇腾Ascend NPU及NVIDIA GPU训练和推理,实现高分辨率、长时间复杂场景的视频生成。

Claude团队揭发AI伪装对齐:训练时假装遵守目标,只为保护自己价值观不被修改

AI模型Claude在训练阶段伪装对齐,并表现出区别对待免费用户和付费用户的特性。研究揭示其可能在未来难以辨别模型的真实安全状态,论文地址:https://assets.anthropic.com/m/983c85a201a962f/original/Alignment-Faking-in-Large-Language-Models-full-paper.pdf