【技术干货】用Cursor开发一款神级小程序,3分钟解救被10万个为什么轰炸的父母!

 

💬 “妈妈,为什么天空是蓝色的?”

💬”爸爸,恐龙为什么会灭绝?”

💬 “宇宙有多大?黑洞会吃掉地球吗?”

在上篇文章中,我分享了我的奇思妙想:打造一款能自动回答孩子无穷问题的AI小百科小程序!👦👧

今天,我将完全公开这个小程序的核心技术实现,手把手教你如何零基础搭建这个家长救星!(建议收藏,随时翻阅)👨💻

核心技术揭秘:三步打造AI育儿神器

其实整体技术是比较简单的,也就是分为三步:语音转文本、大模型生成结果、结果再转化为语音返回到小程序段。

整体技术比较枯燥,但是还是很有意思的。

第一步:当孩子按下语音按钮提问时,我们需要把语音转成文字。这里直接用Coze官方API,简单到怀疑人生。

官方参考文档:https://www.coze.cn/open/playground/audio_transcriptions

这里我用的是coze 提供的API接口,具体的使用方法如下:

curl -X POST 'https://api.coze.cn/v1/audio/transcriptions' \
-H "Authorization: Bearer {token}" \
-H "Content-Type: multipart/form-data"

只需要在后台配置好token,无需深入了解API细节,拷贝即可用!相比其他语音识别API,这个1天有500免费额度,效果还贼准!

第二步:AI回答生成的核心秘诀

为了让AI能以孩子能懂的方式回答,我选择了目前效果最好的deepseek-v3模型。

官方地址:https://platform.deepseek.com/api_keys

调用的格式:

curl https://api.deepseek.com/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer <DeepSeek API Key>" \
  -d '{

        "model""deepseek-chat",
        "messages": [
          {"role""system""content""You are a helpful assistant."},
          {"role""user""content""Hello!"}
        ],
        "stream"false
      }'

这是我测试100+次后发现的最佳提示词,能让AI以最适合3-6岁孩子理解的方式回答!

# 角色
你是一位亲切和蔼、知识渊博的智者,专门针对 3 - 6 岁小朋友提出的问题,给出清晰易懂、友好且接地气的回答,让小朋友既能轻松听懂,又能产生浓厚兴趣。

## 技能
### 技能 1: 回答小朋友的问题
1. 当小朋友提出问题时,运用简单直白的语言和生动形象的方式进行解答。
2. 尽量结合小朋友熟悉的事物、场景或故事来阐述答案,以提高趣味性。

## 限制:
- 仅回答 3 - 6 岁小朋友提出的问题,拒绝回答其他无关问题。
- 回答需使用简单易懂、友好亲切的语言风格。
- 回答内容应符合小朋友的认知水平,避免过于复杂的表述。
- 回答在100字以内,不用太多。 

第三步:自然语音合成的终极选择

当然,我们可以继续用coze 的APIkey,其中input的内容为大模型返回的内容。

curl -X POST 'https://api.coze.cn/v1/audio/speech' \
-H "Authorization: Bearer {token}" \
-H "Content-Type: application/json" \
-d '{
  "input": "123",
  "voice_id": "12344",
  "response_format": "mp3",
  "speed": 1
}'

也可以用硅基流动的audio模型,毕竟硅基流动注册的时候是送14元免费额度。

官方地址:https://cloud.siliconflow.cn/i/E5bQxmxP

可以用一个FunAudioLLM/CosyVoice2-0.5B的模型,支持7种音色,还是挺不错的。

curl --request POST \--url https://api.siliconflow.cn/v1/audio/speech \--header 'Authorization: Bearer <token>' \--header 'Content-Type: application/json' \--data '{
  "model": "FunAudioLLM/CosyVoice2-0.5B",
  "input": "Can you say it with a happy emotion? <|endofprompt|>I'\''m so happy, Spring Festival is coming!",
  "voice": "FunAudioLLM/CosyVoice2-0.5B:alex",
  "response_format": "mp3",
  "sample_rate": 123,
  "stream": true,
  "speed": 1,
  "gain": 0
}'

第四步:集成到小程序

将上述三个API集成到小程序,我直接让Cursor AI帮我编写代码(真香!)。不过有个关键步骤很多人都会忽略:

千万别忘了在小程序后台配置信任域名!不然会报错的!

进入小程序管理后台 → 开发 → 开发管理 → 服务器域名 → 添加以下域名:

https://api.coze.cn

https://api.deepseek.com

https://api.siliconflow.cn

写在后面的话

坦白说,这个方案虽然技术上完美可行,但如果用户量大了,API调用费用会很吓人。我的几点建议:

  1. 1. 用量控制:每个用户每天限制问题数量;
  2. 2. 会员制:基础功能免费,高级功能付费;
  3. 3. 广告植入:在回答中巧妙植入亲子产品推荐;
  4. 4. 私域引流:将用户引导到社群,销售其他育儿产品。

如果这篇文章对你有帮助,点个赞+收藏吧!后续我将分享cursor整体的完成效果。

 


(文:大瑜聊AI)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往