自然度归档 - 每时AI

从找眼镜到当导购，我和豆包的24小时”室友”体验

下午4时 2025/05/29 作者硅星人Pro

作者在北京最繁华商圈随机询问10位年轻人使用AI助手的习惯，发现大多数人因体验不佳而放弃。豆包推出视频通话功能后，用户可以直接与AI进行视频对话，体验提升显著。文章介绍了多场测试，展示了豆包在室内和室外环境下的表现及其带来的便利性，并强调了交互方式的改变对用户体验的影响。

上午8时 2025/03/08 作者 NLP工程化

OCTAVE TTS首个理解说话内容的文本转语音模型，音频质量、自然度超70%用户偏好，能生成多样化语音。

下午11时 2025/02/27 作者智东西

感智能技术AI创企
Hume AI
昨天发布了
新款文生语音大模型Octave
，该大模型可依据用户

上午8时 2025/01/28 作者开源星探

卡兹克分享了自己通过AI撰写新年祝福短信的经历和技巧，包括如何让AI写出自然流畅且具有个人特色的祝福内容，并提供了个性化定制的prompt模板。

下午10时 2025/01/20 作者智能涌现

语音通话功能的提升，让AI落地的场景从教培和客服扩展到情感陪伴、心理咨询等更多领域。豆包更新了端到端的语音大模型，提高了对话流畅度、情感表达能力和角色扮演能力。

下午4时 2025/01/09 作者 PaperWeekly

近年来，多模态大语言模型（MLLMs）主要聚焦在视觉和文本模态的融合上，对语音的关注较少。然而，语音