2025年1月10日23时

Nvidia开源AI文本转音效模型，只要3.7秒就能生成30秒的音效，影视配音将越来越简单。

2025年1月10日23时作者开源AI项目落地

文章介绍了TangoFlux，一款由新加坡科技设计大学和NVIDIA联合开发的高效文本到音频生成模型。它能在单个A40 GPU上仅用3.7秒生成长达30秒的高质量音频，展示了优越性能，并详细阐述了其技术特点，包括高效的生成能力、流匹配与直流量化流技术以及Clap排名偏好优化（CRPO）等。

2025年1月10日23时作者开源AI项目落地

英伟达发布NVILA系列视觉语言模型，优化了模型效率和准确性。该模型在图像和视频基准测试中表现出色，并具备多种应用能力，如自动化检测、智慧园区等。

2025年1月10日23时作者路过银河AI

文章介绍了Illustrious系列动漫大模型的特点及一些成功作品，强调其高可控性和对文本描述的理解能力，并提到了THRILLustrious 4.0版本的一些出色实例。

2025年1月10日23时作者新智元

新智元报道
编辑：LRST
【新智元导读】
大连理工大学的研究人员提出了一种基于Wasserstei

2025年1月10日23时作者机器人大讲堂

鱼类通过其复杂的肌肉系统控制身体形状，展现出高超的游动能力，这一机制激发了科研界对自然鱼类游动机制的

2025年1月10日23时作者新智元

新智元报道
编辑：乔杨
【新智元导读】
2024年11月30日是ChatGPT上线两周年的日子。
这

2025年1月10日23时作者机器人大讲堂

机器人+自动驾驶+消费硬件+出海，中国割草机器人正逐步占领欧美人的后院。
2025年CES消费电子展

2025年1月10日23时作者新智元

新智元报道
编辑：编辑部 JHY
【新智元导读】
小模型也能击败o1？微软全华人团队提出rStar-