1小时+1.3元成本!让MiniMind-V教你零代码训练自己的多模态AI模型!

一款名为MiniMind-V的开源模型简化了多模态视觉语言模型(VLM)的训练流程,仅需1小时和不到1.3元的成本即可完成训练。该模型参数量为26M,适合个人开发者从零开始学习,并提供了详细的数据处理、预训练和指令微调代码。

Gemini 2.0 重磅发布:多模态 AI 进入“快车道”!

Google DeepMind 发布 Gemini 2.0,主打多模态、高性能、低成本和易用性。包含 Flash、Flash-Lite 和 Pro Experimental 三个版本,支持文档处理、代码生成、AI 智能体和科学研究等领域,并强调其在多模态能力上的优势。