OpenAI 宣布开源嵌入式实时语音 SDK

项目简介

OpenAI 宣布开源嵌入式实时语音 SDK至此 Web,API,嵌入式,手机,桌面端还有短信/电话基本实现无死角覆盖,OpenAI 要将用户扩展到 10 亿量级的野心近一步扩展


该 SDK 已在esp32s3linux上开发并测试。您不需要任何物理硬件来运行此 SDK。您可以直接从 Linux 使用它。


要在硬件上使用它,请购买这些微控制器之一。其他的可能有效,但这正是开发的目的。

  • Freenove ESP32-S3-WROOM

  • Sonatino – ESP32-S3 Audio Development Board

您可以在 eBay/AliExpress 上以更少的钱购买 ESP32S3。


安装

protoc必须位于安装了protobufc的路径中。


使用您要定位的平台调用set-target 。目前仅支持linuxesp32s3 。

  • idf.py set-target esp32s3


配置设备特定设置。目前不需要

  • idf.py menuconfig


将您的 Wifi SSID + 密码设置为环境变量

  • export WIFI_SSID=foo

  • export WIFI_PASSWORD=bar

  • export OPENAI_API_KEY=bing

构建

  • idf.py build


如果您是为esp32s3构建的,请运行以下命令以刷新到设备

  • sudo -E idf.py flash


如果您是为linux构建的,则可以直接运行二进制文件

  • ./build/src.elf

请参阅build.yaml了解 Docker 命令,以一步完成这一切。


项目链接

https://github.com/openai/openai-realtime-embedded-sdk

扫码加入技术交流群,备注开发语言-城市-昵称

(文:GitHubStore)

欢迎分享

发表评论