智源研究院
智源研究院院长王仲远:至少5-10年,具身智能模型才能成熟落地|
智源研究院发布首个跨本体具身大小脑协作框架RoboOS和开源具身大脑RoboBrain,推动单机智能迈向群体智能。王仲远认为具身智能仍处于早期阶段,但具有长期发展优势。通过研发具身大模型提升迭代能力,实现从单机到群体智能的转变。
多模态方向开源数据集资源汇总
MINT-1T 数据集是一个 1 万亿个文本标记和 34 亿张图像的开源数据集,扩展了现有开源数据集的 10 倍。WuDaoCorpora 是一个由北京智源人工智能研究院构建的大规模、高质量数据集。Conceptual Captions 提供超过 300 万张带有自然语言字幕的配对图像。SBU Captions 数据集中有 100 万带标题的照片描述图像。MiniGPT-4 使用高质量图文对进行微调,Ego-Exo4D 包含三种精心同步的语言视频数据集。
智源开源多模态向量模型BGE-VL:多模态检索新突破
智源研究院联合开发的BGE-VL模型在多模态检索任务中取得最佳效果,通过大规模合成数据MegaPairs训练而成。该方法具备优异的可扩展性和卓越的数据质量优势。
智源发布2025十大AI技术趋势:从Agent到Agentic AI
智源研究院发布2025年人工智能技术及应用趋势,包括AI4S推动科学研究、具身智能元年、多模态大模型实现高效、RL+LLMs提升基础模型性能等。
活动回顾 计算-网络-软件-算法-生态的协同发展,2024 Meet AI Compiler 圆满收官!
2024 Meet AI Compiler 第 6 期技术沙龙在上海成功举办,涵盖编译器架构设计、性能优化策略等内容。来自地平线、智源研究院、字节跳动等专家分享最新研究成果,并与观众深入讨论计算-网络-软件-生态协同发展的主题。