🍹 Insight Daily 🪺
Aitrainee | 公众号:AI进修生
Hi,这里是Aitrainee,欢迎阅读本期新文章。
就在刚刚,OpenAI 又出新货了。
三个音频模型:gpt-4o-mini-tts(文字转语音),gpt-4o-transcribe 和 gpt-4o-mini-transcribe(语音转文字)。
新的 SOTA Speech2Text 模型(明显优于 Whisper 3),而新的文本转语音模型,允许提示个性和情感。




这个文本转语音的,官方给了一个交互网站:https://www.openai.fm/

但也有人发现,这模型对日语好像不太灵光,有些字会跳过去,估计是日
语数据练得还不够。
英语的挺好,中文的我试了一下感觉也就一般吧。国内的豆包、minmax好多了。
三款模型定价如下:

不少网友表示。这次价格良心,跟之前的 Whisper 差不多,mini 版更便宜。
这两套模型下来又为开发提供了新的方向和可能,还是挺有用的:



最后,这个交互网站也不错:https://www.openai.fm/,感兴趣的就去玩玩吧。
[1] https://web.lmarena.ai/leaderboard
点这里👇关注我,记得标星哦~
(文:AI进修生)