o1的风又吹到多模态,直接吹翻了GPT-4o-mini
开源项目LLaVA-o1展示了其在自主多阶段推理方面的优越性,超过了一些大型甚至封闭源代码的模型,在复杂任务中的性能显著提高。它包括总结、图像解释、逻辑推理和结论生成四个关键阶段,并采用了结构化推理框架和阶段性束搜索策略来增强其推理能力。
开源项目LLaVA-o1展示了其在自主多阶段推理方面的优越性,超过了一些大型甚至封闭源代码的模型,在复杂任务中的性能显著提高。它包括总结、图像解释、逻辑推理和结论生成四个关键阶段,并采用了结构化推理框架和阶段性束搜索策略来增强其推理能力。
mistral.ai发布了124B参数的Pixtral Large多模态模型及AI助手le Chat,支持网页搜索、Canvas编辑、文档理解等能力,并在数学推理任务上超过其他模型。
微软TinyTroupe通过LLM驱动的Multi-Agent角色模拟,允许创建具有特定个性、兴趣和目标的人智能体(TinyPerson),可用于广告评估、软件测试、培训生成合成数据、产品管理和头脑风暴等多个领域。
Chonkie 是一个轻量级的 RAG 分块库,提供多种分块器支持固定大小标记块、单词、句子和语义相似性分块,速度比竞争对手快3-2.5倍。通过 pip 安装 Chonkie 并使用 TokenChunker 等分块器进行文本分块。