项目简介
本项目基于乐鑫的 ESP-IDF 进行开发。
本项目是一个开源项目,主要用于教学目的。我们希望通过这个项目,能够帮助更多人入门 AI 硬件开发,了解如何将当下飞速发展的大语言模型应用到实际的硬件设备中。无论你是对 AI 感兴趣的学生,还是想要探索新技术的开发者,都可以通过这个项目获得宝贵的学习经验。
欢迎所有人参与到项目的开发和改进中来。如果你有任何想法或建议,请随时提出 Issue 或加入群聊。
已实现功能
-
Wi-Fi / ML307 Cat.1 4G
-
BOOT 键唤醒和打断,支持点击和长按两种触发方式
-
离线语音唤醒 ESP-SR
-
流式语音对话(WebSocket 或 UDP 协议)
-
支持国语、粤语、英语、日语、韩语 5 种语言识别 SenseVoice
-
声纹识别,识别是谁在喊 AI 的名字 3D Speaker
-
大模型 TTS(火山引擎 或 CosyVoice)
-
大模型 LLM(Qwen2.5 72B 或 豆包 API)
-
可配置的提示词和音色(自定义角色)
-
短期记忆,每轮对话后自我总结
-
OLED / LCD 显示屏,显示信号强弱或对话内容
硬件部分
面包板手工制作实践
详见飞书文档教程:
👉 《小智 AI 聊天机器人百科全书》
面包板效果图如下:
已支持的开源硬件
-
立创·实战派 ESP32-S3 开发板
-
乐鑫 ESP32-S3-BOX3
-
M5Stack CoreS3
-
神奇按钮 2.4
-
虾哥 Mini C3
固件部分
免开发环境烧录
新手第一次操作建议先不要搭建开发环境,直接使用免开发环境烧录的固件。固件使用的是作者友情提供的测试服,目前开放免费使用,请勿用于商业用途。
👉 Flash烧录固件(无IDF开发环境)
开发环境
-
Cursor 或 VSCode
-
安装 ESP-IDF 插件,选择 SDK 版本 5.3 或以上
-
Linux 比 Windows 更好,编译速度快,也免去驱动问题的困扰
AI 角色配置
如果你已经拥有一个小智 AI 聊天机器人,可以参考 👉 后台操作视频教程
详细的使用说明以及测试服的注意事项,请参考 👉 小智测试服的帮助说明。
项目链接
https://github.com/78/xiaozhi-esp32
扫码加入技术交流群,备注「开发语言-城市-昵称」
(文:GitHubStore)