香港中文大学(深圳)开源的一款语音理解模型:Soundwave
香港中文大学(深圳)开源的Soundwave语音理解模型仅需1万小时训练数据,即达到Qwen2-Audio同等性能,具备智能对话和复杂语音交互能力。
香港中文大学(深圳)开源的Soundwave语音理解模型仅需1万小时训练数据,即达到Qwen2-Audio同等性能,具备智能对话和复杂语音交互能力。
Qwen2.5-QwQ-37B-Eureka-Triple-Cubed 是一个增强版的AI模型,专注于推理和思考能力。它采用了’Triple Cubed’方法,支持128K上下文,并适用于多种任务如科学研究、创意写作等,具有高温度推理支持和性能优化等特点。
一款名为SmolDocling的轻量级OCR模型,仅256M参数,支持文档中的标题、正文、图表等多任务识别,并能导出为Markdown、HTML等多种格式。
有人宣称创办一家通过包装现有基础模型实现全新体验的”套壳公司”。这一声明引发了科技圈热烈讨论,认为看似简单的行为实际上体现了无数成功的科技公司在竞争中获胜的关键因素:优秀的用户体验。
波士顿动力Atlas人形机器人通过与AI机构RAI Institute的合作,利用动作捕捉服和强化学习技术,模仿真人动作。这项研究展示了大量模拟数据对机器人的训练效果,并强调了实际应用之间的差距需要深入探讨。