
孟旭指出,从多年的经验和认知出发,有道智能学习硬件的进化本质是用户需求、硬件创新与 AI 技术三者的螺旋推进,三者像齿轮一样咬合转动,推动产品进化。即使是在大模型爆发的当下,纯软件升级或者纯硬件创新都更像是炫技,唯有软硬结合才能让技术润物无声地渗入场景,去解决用户的真问题 ,这也是垂类硬件在技术爆发时代的生存法则。
以下根据演讲实录整理(部分内容有删改),供大家深入了解:
大家好,我来自网易有道硬件产品团队,我叫孟旭。
现在 AI 可以说无处不在了,作为智能学习硬件的产品团队,我们也一直在思考:当 AI 教育碰撞,如何让这项前沿技术真正成为孩子学习成长路上的”智慧引路人”? 如何突破传统学习工具的局限,解决孩子在学习过程中遇到的实际痛点,为他们打造更高效、更沉浸、更个性化的学习体验?
今天我会以我们今年推出的全新品类——有道 AI 答疑笔——的创新点来展开说说,大模型催化下的 AI 学习硬件经历了什么样的变革。
网易有道被大家熟知是因为有道词典、有道翻译官、有道云笔记等应用,所以我们在查词翻译、语言学习上有非常深的积累,而我们有道词典笔也在智能学习硬件领域深耕多年,今年年初有道词典笔累计销量突破了 1000 万台,这对于我们是一个里程碑,代表了这么多年超过千万的孩子和家长对我们的信任。
在这个过程中,我们发现学习硬件产品迭代过程呈现“需求牵引 – 技术支撑 – 体验升级”的螺旋式发展路径。即先由用户场景需求牵引,推动硬件创新和人工智能技术在产品中的应用;随着硬件和技术的提升,又为用户带来更好的使用体验,而新的体验又会催生用户更多、更高级的需求,如此循环往复,推动智能硬件不断向前演进。
具体来说,
这是智能硬件发展的起点,也是核心驱动力。需求场景虽然会随着时代进行变化,但变化的路径和方向是有迹可循的。我们在最开始推出有道词典笔,解决的是在用户英语学习时候提供一个趁手的智能工具。基于有道词典在语言翻译方面积累了大量的专业数据,同时硬件技术能够实现扫描 – 识别 – 输出的快捷过程,词典笔就应运而生。
后来,我们在大量用户的使用日志中发现,因为扫描翻译这个动作很方便,用户在学习中文遇到不懂的字词,也会习惯性的扫一下,所以我们紧接着丰富了扫描翻译的语种和内容,不光是双语的学习,还引入了小语种和古诗文的释义,乃至文言文的讲解。
再接下来,我们又看到,随着孩子年龄的增长,会面临学习任务的升级,他们也会自然而然地想到,随手拿起词典笔能不能解决下数学、物理、化学这些学科问题,乃至能不能脱离桌面学习的空间,到随时随地都能够互动学习……这就是为什么从需求层面,我们会从词典笔扩展到 AI 答疑笔这个路径上来。
当明确用户需求后,就需要通过硬件创新来实现。这涉及到材料科学、电子工程等多领域技术突破。例如,为了让有道词典笔更便于携带和操作,可能需要在保证性能的前提下,对其外观尺寸、材质进行优化;为了实现更快速的识别和处理速度,要升级芯片等硬件组件。同时,也要考虑规模化的成本问题。可以说,硬件创新是将用户需求转化为实际产品功能的关键环节。
人工智能技术为智能硬件注入了“智慧”灵魂。像图像识别技术能让词典笔精准识别文字;自然语言处理技术使其能够理解用户提问,并给出准确解答。人工智能技术的不断进步,如算法优化、深度学习能力提升等,为智能硬件实现更智能、更人性化的功能提供了技术支撑。
那今天,前沿的 AI 大模型和教育场景碰撞带来了什么新的变化呢?
首先,在语言交互方面,大模型具有先天优势,尤其是在语言学习领域。有道早在 2023 年就在词典笔上落地并优化大模型,优先应用于翻译和多语言学习场景。大模型能够更好地理解自然语言,尤其是结合上下文,从而显著提升翻译的准确度、表达方式、情绪色彩和流畅度。
这里可以提一下,其实我们去年率先在行业内首次落地了端侧离线大模型,主要用于中英离线翻译,团队还在推进文言文翻译和小语种翻译功能的开发。选择离线大模型的原因在于,许多孩子的学习场景中存在无网络或网络不稳定的情况,如学校、图书馆等,离线模型能够保证低延迟、高质量的学习体验,同时降低成本。
为此,有道定制了首颗 AI 芯片,提升芯片算力以满足大模型需求,同时实现超低功耗,满足孩子长时间使用不充电的需求。离线大模型的落地面临诸多挑战,如算力、内存、功耗和成本的限制,但团队成功实现了高质量的翻译,使得离线大模型翻译质量优于原有的 NMT 模型。
其次,推理模型展示了类真人的逻辑思考链,在答疑辅导场景中进行应用,让 AI 更接近真人老师的讲解方式,实现了自然语言交互模拟一对一的对话过程,真正实现了教与学的双向交互。
以我们自己的产品突破为例,在最新的有道 AI 答疑笔上,与传统基于题库的答疑方式不同,小 P 老师能够随时随地解答多学科、新题难题,不限制学科和题目来源,就像前段时间我们拿 AI 答疑笔试了下今年北京海淀的高考二模题,也能拿下不错的成绩,达到了清北分数线。
同时,小 P 老师能够做到分步骤讲解解题思路,单独抽离知识点供用户追问,并提供举一反三的练习,包括真题练习和大模型生成的练习。并且,大模型的知识覆盖面直接拓展到了全学科领域,契合当下教育目标迈向学科融合发展的趋势,能够更好地承担起多学科高效辅助的角色。
这样,大模型解决了传统人力问题,孩子在学习过程中遇到问题可以随时获得精细化讲解,无需等待固定时段询问老师。此外,多模态技术的发展让有道 AI 答疑笔能支持多种交互方式,如扫描、拍照、语音等,也让用户能够拓展更多个性化学习体验,比如拍照朗读不同风格的文章、拍照自定义背单词等功能。
可以看到,目前大模型应用已经能够解决一些以往产品没能很好解决的问题。但是如果看长远一点,我们认为下一个阶段可能是 AI Agent 和教育生态的深度融合,也是我们正在探索的方向。
随着孩子学习方式从以老师为中心转变为以学生为中心,以及从单一学科到多学科融合、从被动接受到主动探索的各种转变,传统学习工具的局限性愈发明显。
比如,我们看到学生在预习课本的时候,就会探究课本以外的发散知识,有的孩子可能会好奇作者的生平,有的孩子可能会想了解文章的写作背景和故事等等,其实就是学习的个性化本质,也是教育的终极诉求。我们一直追求“因材施教”,但现在没有任何一个工具、一个产品能真正做到。
我们也还在往这个方向去努力,哪个孩子不希望自己有个随身家教呢?所以我们一方面在答疑智能化上做功夫,比如让 AI 答疑笔可以根据你的“错题本”记录,提供更好的讲解;另外一个方面,是进一步提高产品层面端到端的成熟度,现在 AI 答疑笔里面有几十个应用,不同的应用处理不同的学习需求,比如背单词有专门的 APP,口语训练又是专门的 APP,然后课内同步学习又是不同的入口。
那未来是不是能把这些散点功能串联成整个学习流程?
基于这样的构想,我们 AI 答疑笔一开始就是定位于 AI 原生智能硬件,软硬件相结合的自研系统具备集成的条件,或许未来能实现人、内容和流程的整合,当 AI Agent 解决孩子各类学习问题的时候,AI 答疑笔就能真正成为孩子专属的 AI 设备。
6 月 27~28 日的 AICon 北京站将继续聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent 构建、多模态应用、大模型推理性能优化、数据智能实践、AI 产品创新等热门议题,深入探讨技术与应用融合的最新趋势。欢迎持续关注,和我们一起探索 AI 应用的无限可能!

今日荐文
曝豆包多模态负责人准备离职;马云频繁要求汇报 Qwen3 开发进度;北大“韦神”粉丝破2000万,评论区变高考许愿池 |AI周报
别被MCP的包装骗了!重构系统、向智能体转型,CEO亲述:关键时刻还是RPA兜底?
王兴兴回应比赛风波:挣到钱了,但现在的机器人别指望它能干活
13 年苦熬到 170 亿市值,一夜间被用户抛弃!一封“AI吹”全员信让网友“不喷不行”
天塌了,Claude 全面断供Windsurf!CEO喊冤控诉也挡不住开发者退订,祸起OpenAI收购?

你也「在看」吗?👇
(文:AI前线)