日期: 2024 年 11 月 22 日
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
新智元报道
编辑:LRS
【新智元导读】
Meta最近开源了一个7B尺寸的Spirit LM的多模态
如今的智能体,已经像人一样「浏览」视频了,国内就有
英伟达的NVIDIA AI Blueprint和OmAgent项目展示了AI技术如何帮助用户更好地理解和分析视频内容,OmAgent提供了原生多模态智能体框架,支持设备开发和使用。
仅仅一天,Gemini就夺回了GPT-4o拿走的头名
谷歌和OpenAI在大模型领域竞争激烈,近期Google的Gemini-Exp-1114和Gemini-Exp-1121模型迅速更迭Top榜单。有人担忧当前的人工智能基准测试方法可能简化了模型评估,引发对安全性和可靠性等问题的关注。