llama.cpp 原生支持音频输入,接口可以直接上传音频数据。图中展示的是上传了一个录音,然后让模型总结这个录音。

参考文献:
[1] https://github.com/ggml-org/llama.cpp/pull/13714
知识星球服务内容:Dify源码剖析及答疑,Dify对话系统源码,NLP电子书籍报告下载,公众号所有付费资料。加微信buxingtianxia21进NLP工程化资料群。
(文:NLP工程化)
llama.cpp 原生支持音频输入,接口可以直接上传音频数据。图中展示的是上传了一个录音,然后让模型总结这个录音。
参考文献:
[1] https://github.com/ggml-org/llama.cpp/pull/13714
知识星球服务内容:Dify源码剖析及答疑,Dify对话系统源码,NLP电子书籍报告下载,公众号所有付费资料。加微信buxingtianxia21进NLP工程化资料群。
(文:NLP工程化)