原生多模态输入输出归档 - 每时AI

Gemini 2.0发布！主打Agent+多模态，性能超1.5 Pro、可直接生成音频、图片

2024年12月12日8时作者 Founder Park

谷歌发布Gemini 2.0 Flash，成为首家实现原生多模态输入输出的模型。它不仅在执行过去任务上表现更优，还能生成音频和图像，并支持多语言文本转语音。