21.7K 标星的开源TTS!FishAudio开源情感语音核弹:200万小时炼成“声优AI”!
FishAudio团队发布了全新的OpenAudio S1语音模型,在TTS-Arena榜单上荣登第一名。该模型基于200万小时音频数据训练,支持50+情感标记和多种语言,提供了旗舰版S1(4B参数)和开源版S1-mini(0.5B参数)。
FishAudio团队发布了全新的OpenAudio S1语音模型,在TTS-Arena榜单上荣登第一名。该模型基于200万小时音频数据训练,支持50+情感标记和多种语言,提供了旗舰版S1(4B参数)和开源版S1-mini(0.5B参数)。
马斯克发布了Grok3大模型系列,包括轻量版Grok3mini。Grok3大幅超越了其他多个AI模型,在数学、科学和编程等领域表现突出,并且具备强大的推理能力和智能体能力。
商汤的‘日日新’融合大模型能够处理文字、图像等多种信息,并且在多个权威评测中表现优异。它能识别手写数学题、理解抽象玩偶设计、解读复杂图表并进行推理分析等,展示了多模态AI的能力突破。该模型未来将应用于智能硬件、教育、医疗等多个领域,实现跨模态交互和提升用户体验。