多模态
大模型开源及RAG用于综述写作进展:兼看mobile agent在应用场景选择上一些思考
今天是2025年02月24日,星期一。文章讨论了mobile agent的思考和开源进展,包括MoE小模型Moonlight-16B-A3B、Qwen2.5-VL及deepseek开源周day1开源FlashMLA等项目。此外还介绍了RAG在写作场景中的应用进展。
音乐检索进入“多模态对齐”时代:清华 CLaMP-3 的三大极限突破
清华大学朱文武教授团队推出的CLaMP 3是一款多模态、多语言的音乐信息检索框架,实现了跨模态检索和零样本分类等功能。它支持27种语言,并基于对比学习训练模型,使用XLM-R预训练模型实现强大的多语言文本嵌入。
速递|英伟达支持的机器人初创Field估值20亿美金,已有数百万美元收入
机器人初创公司Field AI正洽谈以20亿美元估值筹集数亿美元资金,将使该公司的估值较去年翻四倍。这反映了投资者对利用生成性人工智能技术开发机器人的初创公司的兴趣增加。
R1强化学习策略用在多模态推理开源实现:兼看社区不可思议被侵权之遇
今天是2025年02月20日,星期四。文章提到了NLP社区的一则有趣事件,并讨论了R1在多模态推理中的进展,包括视频和图像处理的相关工作及技术细节。
还没发布,xAI 工程师公开承认 Grok 3 不如 OpenAI,遭马斯克怒火解雇!马斯克:Grok 3 打遍天下无敌手
epSeek 走,该模型被认为有可能使先进人工智能技术的使用更加民主化。
但与此同时,其他 AI 玩