一、AI 语音技术最新突破
2024年,AI语音技术取得了重大进展。新型对话模型的开发简化了基础设施架构,显著降低了语音代理的延迟并提升了性能。这些改进主要体现在过去六个月内推出的新对话模型上。
此外,这些对话模型的成本也在逐渐降低。2024年12月,OpenAI将GPT-4o实时API的输入价格下调了60%(至每百万标记40美元),输出价格下调了87.5%(至每百万标记2.5美元)。GPT-4o mini也已通过实时API提供。
这些进展使得AI语音代理更具可行性和经济性,推动了其在各个行业的广泛应用。
二、AI 语音智能体最近进展
2024年下半年,AI语音代理市场呈现爆炸式增长。根据Cartesia的数据,在最新一届Y Combinator(YC)创业公司中,专注于语音技术的公司占比达22%。
语音代理也被越来越多地添加到横向或多模态产品中。在2024年,我们看到对话语音技术栈的多个层面上的公司吸引了资金和市场关注,包括:
-
模型公司:如ElevenLabs和Cartesia。
-
横向平台:如Vapi和Bland。
-
垂直化平台:如HappyRobot和Wayfaster。
特别是在大型企业中,我们很少看到从完全由人类接听电话直接转向完全由AI接听的情况。创始人们通常会找到一个切入点(“楔子”),开始时只处理客户中一小部分的电话,然后希望随着时间的推移,逐步扩展到处理更多类型的电话和工作流程。我们观察到的这些切入点包括:
-
客户服务:使用AI语音代理处理常见的客户查询,减轻人工客服的负担。
-
预约安排:通过语音代理自动安排和管理客户预约,提高效率。
-
订单处理:利用AI语音系统处理简单的订单,减少人工干预。
这些应用为AI语音代理在企业中的更广泛采用奠定了基础。
三、AI 语音智能体融资概况
根据硅谷科技评论(SVTR)AI创投库,2024年,AI语音代理领域的融资活动显著增加,多个初创公司获得了大额投资,推动了市场的快速发展。以下是一些值得关注的融资事件:
-
ElevenLabs:这家专注于AI语音合成技术的公司在2024年完成了2.5亿美元的C轮融资,估值达到30-33亿美元。
-
Cartesia:2024年12月,语音AI初创公司Cartesia宣布完成了2700万美元的新一轮融资,由Index Ventures领投。
-
Rox:致力于为销售人员开发人工智能代理的初创公司Rox于2024年11月获得了5000万美元的融资,投资者包括红杉资本和General Catalyst。
此外,我们深度分析过的企业音频市场拓荒者AssemblyAI、用AI缓解全球医护人员短缺Hippocratic AI,AI虚拟销售员11x.ai, 同样值得关注。
四、垂直行业是AI语音智能体的核心市场
语音代理的早期应用通常集中在现有呼叫中心或业务流程外包(BPO)开销较高的领域。然而,针对那些由本地员工偶尔接听电话的行业,其痛点和潜在收益通常不足以推动大规模应用,除非有大量员工专职从事电话接听/拨打。此外,这些行业中结果/节省的量化较为困难,难以建立明确的商业案例。
以下是语音代理的主要垂直领域及潜力:
1、主要垂直领域
每个主要行业(如金融服务、B2C、B2B、政府和医疗保健)都可能拥有自己的核心供应商,这些供应商的角色类似于行业专用的记录系统。预计在以下领域会有大量创业活动:
-
金融服务:如债务催收等高频任务。
-
保险业:覆盖面包括客户服务和后台办公室任务。
-
政府:包括公共服务和相关的行政任务。
-
支持服务:处理复杂的客户服务电话,例如IT帮助台需要技术专长的案例。
2、其他应用场景
在某些高薪职位领域,我们观察到针对AI语音代理的支付意愿较强。这些代理被用于教练或培训的案例,可以显著提高员工的实际工作表现。这不仅能够取代劳动力开支(如销售教练),还可以替代低效的软件工具。
3、早期创业动态
通过分析Y Combinator(YC)的创业公司数据,可以看出语音代理的建设趋势:
-
自2020年以来,已有90家语音代理公司。这个趋势随着每一届新公司而加速。
-
2025年冬季(W25)班中,有10家语音代理公司(尚未完全公布)。
在2023年之前的创业公司中,大多数是最近一年内向语音代理方向转型的公司。
根据YC创业公司的数据:
-
B2B用例占比最高(约69%)。最常见的子行业为金融科技(16.9%)和运营支持(主要为客户支持,占12.4%)。
-
医疗保健领域占比约18%。语音代理主要面向前台(患者交互)或后台(药房、保险等交互),具体分布为:普通医学(11.2%)、牙科(3.4%)、兽医(2.2%)、物理治疗(1.1%)。
-
消费类用例占比约13%。
语音代理正在多个垂直领域崭露头角,并迅速渗透到传统行业和新兴场景中。未来,这些技术将进一步提升行业效率并扩展应用范围。
五、AI 语音智能体的投资标准
a16z 投资语音代理公司时,关注的不仅是技术优势,还包括产品适配行业需求、明确的经济效益和对客户需求的精准满足。优秀的语音代理公司需要在技术、商业模式和客户价值之间找到平衡点,并在市场中通过差异化竞争建立自己的护城河。
-
行业选择
-
电话为首选客户演示媒介的行业:如物流等行业,电话是最直接、有效的沟通工具。
-
法规要求:某些行业如债务催收,法规对电话效率有较高要求,语音代理更具优势。
-
高成功率行业:医疗保健等领域中,电话比其他媒介有更高的成功率。
-
通话特点
-
受控通话:通话在时长、格式和结果上受到严格限制。
-
明确的数据点与结果:通话数据和交付结果可清晰量化,方便评估效果。
-
降低企业对 AI 的疑虑:量化结果能够提高企业对 AI 技术的接受度。
-
成本效益
-
显著的成本节约:语音代理可以减少 30%-50% 的成本,同时保持与人类相似的成功率。
-
人力的重新分配:客户希望通过语音代理大幅减少或重新分配人力资源。
-
显著的 ROI(投资回报率):企业对 AI 的内部怀疑意味着语音代理必须展示显著的经济回报才能赢得信任。
-
客户需求
-
生死攸关的通话:对客户而言,某些通话任务非常关键,因此他们愿意支付高额费用确保任务完成。
-
非工作时间通话:许多客户从非工作时间或“不重要”电话任务开始使用语音代理,因为这些任务的性能要求较低。
-
经济价值
-
直接创造收入:语音代理可以帮助客户预约更多业务或收取更多款项,例如在人力配置中。
-
关键成本组成:在利润微薄的行业(如汽车餐厅点餐窗口),通话是业务运作的重要成本来源。
-
产品集成与销售
-
针对 SMB/中端市场:语音代理产品需要能够方便地集成到 VoIP 或其他软件中,且设置流程需支持自助服务。
-
针对企业级客户:复杂的早期集成可以成为竞争壁垒(“护城河”),通过简单的早期集成,语音代理产品可以实现自然扩张的销售机会。
六、附录
硅谷科技评论(SVTR.AI),在ChatGPT问世之际,创立于美国硅谷,依托#AI创投库、#AI创投会、#AI创投营 和风险投资,打造全球前沿科技(AI)创新生态系统。联系凯瑞(pkcapital2023),加入我们,共创未来。点击文末阅读原文,访问SVTR.AI,发现更多机会与内容!
Startup
+
11x.ai:AI虚拟销售员,半年内突破200万美元 |
AlphaSense,金融界的“谷歌” |
AMP Robotics,如何用AI拯救垃圾场? |
Anduril Industries:AI 重新定义现代战争与和平 |
Anthropic:OpenAI”宫斗”背后的公司 |
Bardeen:让AI代理更稳更快 |
Brightwave,AI驱动的投研助手 |
Calendly:日程安排助手,AI效率工具鼻祖 |
Canva:从Adobe、Figma、Canva 到 OpenAI |
Carta:想要取代纽交所的股权管理工具 |
Cerebras,打造世界最大芯片挑战AI霸主英伟达 |
Cohere:为企业提供大模型 |
Consensus:用AI解锁学术 |
CoreWeave:GPU租赁独角兽,英伟达的好盟友 |
Databricks:从数据湖到大模型丨人工智能战略 |
DeepL:从机器翻译到AI写作的语言沟通利器 |
Discord:腾讯多次押注,打造属于你自己的线上互动社区 |
DoNotPay:世界首款AI机器人律师 |
Duolingo:如何改写语言学习 |
E2B:为 AI 代理构建自动化云平台 |
Figma:从Adobe、Figma、Canva 到 OpenAI |
Figure,从体力劳动中解放全人类 |
Glean:重塑知识工作的未来 |
Grammarly:从论文查重到AI写作的沟通利器 |
Helion,AI的终极能源梦想 |
Hippocratic AI,用AI缓解全球医护人员短缺 |
Hugging Face:开源AI的未来 |
Jenni AI:如何通过AI写作实现年入千万 |
Letta:AI代理技术栈市场地图 |
Marblism:一句AI提示词自动生成各类软件 |
Midjourney:0融资,11人,$1亿收入 |
Mistral,欧洲大模型,性价比之王 |
MultiOn,用人工智能代理给软件装上大脑 |
Neuralink:让失明者重见光明,让瘫患者再次行走,让人类与AI融合永生 |
OpenAI:人工智能突破的前沿丨员工丨董事会丨营销丨GPT Store丨奥特曼丨马斯克丨微软丨产品生态 |
Pika:AI视频的未来 |
Rad AI:如何用 AI 改变医疗保健 |
Reddit:奥特曼押注基于兴趣社交的美版“贴吧” |
Replicate:1人AI公司背后的幕后英雄 |
Replite:教马斯克的儿子如何写代码 |
Rows:一年内用户增长20倍背后的故事 |
Perplexity:挑战谷歌,站在AI搜索最前沿 |
Runway:AI视频的未来 |
Scale AI:如何成为数字世界的“水源” |
Shein:打造下一个“中国首富” |
Skild AI,打造通用机器人“大脑 |
SpaceX:梦想照进现实,人类星际生命的曙光 |
Stability AI:SD 背后的公司和创始人 |
Stripe:马斯克和奥特曼押注的支付王者 |
Substack:美版公众号,为价值付费 |
Superhuman:邮件超人,拥抱 AI |
Telegram,俄罗斯兄弟的密聊纸飞机 |
Vannevar Labs:AI+国防,军事人工智能掘金者 |
Vercel,如何用AI引领技术开发? |
Zapier:ChatGPT最受欢迎插件的过去和未来 |
People(找人) |
如何找到创业合伙人丨如何聘请CEO丨如何确定CEO的薪水丨如何分配股权和头衔丨如何组建和召开董事会丨选择自己的创业导师 丨找这种人实现快速裂变丨如何找到那个“改变命运”的第一位员工? |
Funding(找钱) |
如何写商业计划书丨初创公司估值丨如何做电梯演讲丨如何确认真实投资意愿丨如何选择VC丨早期融资的“科学”与策略丨初创公司的融资生存法则丨风险投资人最关心的一个指标丨“七条法则”让投资人主动“敲门” |
Vision(找方向) |
性格决定创业成败丨如何成为亿万富翁丨如何做出困难的决定丨如何寻找创业方向丨如何在海外启动新产品丨GTM指南丨不要像投资人那样思考丨创始人与市场契合度丨为什么初创公司会失败丨什么决定创业成败丨如何建立社交媒体形象丨PMF决定初创的未来丨创始人的必读书单丨 5 点创业洞见丨如何做增长 |
AI创业 |
如何打造AI驱动的公司丨AI创业如何选赛道丨如何打造AI软件产品丨AI公司要不要融资丨AI初创公司商业模式丨AI原生公司定价策略丨AI初创公司增长策略丨2B还是2C |
Venture
+
A16Z:全球AI产品Top100丨人工智能到底能做什么丨AI将会拯救世界 |
Air Street Capital:State of AI(2024) |
Alphabet谷歌战投:全球最牛AI战投是如何炼成的丨人工智能战略 |
Altimeter:谁是AI C端赢家 |
Amazon:人工智能战略 |
Apple:产品收入变迁丨 AI 并购之王 |
Battery Ventures:AI正推动云计算的下一波增长丨AI正带来 4 万亿美元市场机会 |
Bessemer Venture Partners:Cloud 100(2024)丨如何打造AI核心竞争力 |
Bond:AI将改变教育和教学方法 |
Coatue:AI革命丨AI是超级周期的开始 |
Cowboy:AI大势所趋 |
Daniel Gross:硅谷90后AI投资人 |
Dawn Capital:如何通过人工智能增强人脉 |
Elad Gil:关于人工智能我所不知道的事情 |
Emergence:生成式 AI 六大最新趋势 |
FirstMark:MAD 24问,AI 2023年总结,2024年展望 |
Forerunner:超个性化和动态交互才是未来 |
Foundation Capital:服务即软件的万亿机会 |
Founders Fund:如何投出下一个独角兽丨彼得·泰尔丨泰尔研究员 |
General Catalyst:AI+医疗支持者 |
ICONIQ:小扎的朋友圈丨AI成为大企业战略核心 |
Insight Partners:AI应用将如何实现人机协同丨AI Agent正在颠覆自动化 |
Lightspeed:AI+法律市场机会地图 |
M12(微软):如何抢占AI投资制高点丨收入拆解 |
Menlo Ventures:2024企业Gen AI现状报告丨AI代理全面崛起丨Gen AI 应用拐点已到丨AI+安全市场地图丨企业AI架构的设计原则 |
NVIDIA:收入丨AI投资策略 |
Sam Altman(山姆·奥特曼):如何做早期投资丨地产生意丨投资帝国丨婚礼丨阅读清单 |
Sapphire:AI原生应用丨AI进入调整期丨AI 行研 丨 销售人工智能如何重塑 GTM |
Scale Venture Partners:如何用AI工具解决硬件难题? |
Sequoia(红杉资本):如何做投资丨代理型AI应用崛起丨生成式AI进入第二阶段 |
Sierra Ventures:垂直场景将是最大的创业机会 |
SOSV: 从草根到帝国 |
TRAC:风投界的水晶球 |
Thrive Capital:高位接盘OpenAI |
Union Square Ventures(USV) |
Wing Venture Capital:2024年企业科技 30 强(ET 30) |
YC:全球排名第一的AI投资机构丨给年轻创始人建议丨如何独立思考丨YC与A16Z的押注有何异同 |
20VC:从播客主持人到风投大佬 |
LP |
精品基金/超级基金丨AI驱动VC丨通才/专才风投人丨VC/PE丨孵化器丨加速器丨初创工作室丨如何发掘下一个伟大的投资人 |
GP |
如何及早识别独角兽丨如何避免7大投资陷阱丨合伙人是怎么炼成的丨Souring的艺术丨颜值如何影响VC决策丨如何快速解读对方性格丨硅谷投资人的武器库丨如何用数据控制初创公司团队风险丨什么决定创业成败 |
AI投资 |
如何评估AI初创公司丨海外投资人谈AI新趋势丨应该关注哪些AI公司丨AI 创投七大新趋势丨全球AI创投生态丨全球AI投资机构Top10 |
Technology
+
AI工程师有多强?3天上线全球首个AI数库 |
“AI张雪峰”诞生,北大团队用 AI 重塑教育咨询 |
1人团队,百万营收的AI套壳 |
2024 年必读人工智能书单 |
加密信条:数字货币的前世、今生和未来 |
内容创作指南,如何通过写作赚钱? |
传统公司如何抓住AI浪潮? |
全球七大科技巨头的 4000 亿美元 AI 战略布局 |
全球 Gen AI 独角兽大盘点,中国4家大模型上榜 |
AI大模型:海外 | 数学 | 性价比 | 编程 | 医疗 | 评估 | 训练成本 | 小模型 |
AI 创始人 | 华裔创始人 | 北美科技人才中心地图丨职业经历丨教育背景丨斯坦福丨普林斯顿丨多伦多大学 |
AI 公司地理和行业分布 | 以色列 | 德国 | 旧金山湾区 | 欧洲丨法国 |
福布斯AI 50 | 斯坦福AI指数 | 企业科技AI 30 | 高增长AI 50 | C端AI 50 | 工具AI 50 | SVTR AI 100 | 自力更生AI 25丨2024年全球最具价值独角兽丨Gen AI专利公司 Top20丨开源 AI 初创公司 Top 75丨开源 AI 开发者工具 Top 20丨全球数据中心按功耗排名 Top 50 |
AI代理:创始人该如何站上3000亿美元的风口? |
AI+国防安防:如何重新定义现代战场的核心竞争力 |
AI+人力资源:用科技重塑就业与招聘的未来 |
AI+搜索:全球新锐公司谁能杀出重围? |
AI+社交:该怎么玩? |
AI+编程:公司排行榜丨市场地图丨AI工程师丨SaaS的新曙光 |
AI+金融:如何缔造下一个金融科技传奇丨大模型在金融投资领域的应用丨AI将如何改变会计 |
AI+游戏:市场研究报告丨初创公司Top 10 |
AI+机器人 |
AI+医疗:市场地图丨心理/精神公司 |
AI+教育:市场地图 |
AI+客服:市场地图 |
AI+法律:市场地图 |
AI+视频:市场地图丨3D视频 |
AI+生产力工具市场地图 |
AI+科研 |
Review
+
001 | 002 | 003 | 004 | 005 | 006 | 007 | 008 | 009 | 010 |
011 | 012 | 013 | 014 | 015 | 016 | 017 | 018 | 019 | 020 |
021 | 022 | 023 | 024 | 025 | 026 | 027 | 028 | 029 | 030 |
031 | 032 | 033 | 034 | 035 | 036 | 037 | 038 | 039 | 040 |
041 | 042 | 043 | 044 | 045 | 046 | 047 | 048 |
049 |
050 |
051 | 052 |
053 |
054 |
055 |
056 |
057 |
058 |
059 |
060 |
061 |
062 |
063 |
064 |
065 | 066 |
067 |
068 | 069 | 070 |
071 | 072 | 073 | 074 | 075 | 076 | 077 | 078 | 079 | 080 |
081 | 082 | 083 | 084 | 085 | 086 | 087 | 088 | 089 | 090 |
(文:硅谷科技评论)