Step-Audio 归档

开源端到端语音大模型：直接从原始音频输入，生成语音输出

2025年7月2日16时作者 AIGC开放社区

专注于大语言模型在多任务应用的研究及AIGC开发者生态建设。Step-Audio团队开源了端到端语音大模型Step-Audio-AQAA，能够直接生成自然流畅的音频回答。

跃问APP开源的130B语音模型 Step-Audio，快手开源运动控制DragAnything，微软智能体入门10个免费课程

2025年2月18日12时作者每日AI新工具

Step-Audio是首个支持多语言对话、情感表达和方言的开源智能语音交互框架；Frames of Mind项目通过思维链可视化思考过程；DragAnything实现对象运动控制；《AI Agents for Beginners》课程教授初学者构建AI代理技能；Chat2Geo结合遥感数据进行地理空间分析。

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31