从找眼镜到当导购,我和豆包的24小时”室友”体验
作者在北京最繁华商圈随机询问10位年轻人使用AI助手的习惯,发现大多数人因体验不佳而放弃。豆包推出视频通话功能后,用户可以直接与AI进行视频对话,体验提升显著。文章介绍了多场测试,展示了豆包在室内和室外环境下的表现及其带来的便利性,并强调了交互方式的改变对用户体验的影响。
作者在北京最繁华商圈随机询问10位年轻人使用AI助手的习惯,发现大多数人因体验不佳而放弃。豆包推出视频通话功能后,用户可以直接与AI进行视频对话,体验提升显著。文章介绍了多场测试,展示了豆包在室内和室外环境下的表现及其带来的便利性,并强调了交互方式的改变对用户体验的影响。
语音通话功能的提升,让AI落地的场景从教培和客服扩展到情感陪伴、心理咨询等更多领域。豆包更新了端到端的语音大模型,提高了对话流畅度、情感表达能力和角色扮演能力。
近年来,多模态大语言模型(MLLMs)主要聚焦在视觉和文本模态的融合上,对语音的关注较少。然而,语音