IBM 悄无声息的发布了 granite-3.2-8b 开源模型
Granite-3.2-8B-Instruct-Preview 是一款早期发布的 8B 长上下文模型,专为增强推理能力而进行微调,基于 Granite-3.1-8B-Instruct 构建,并使用开放许可开源数据集和合成数据训练。
Granite-3.2-8B-Instruct-Preview 是一款早期发布的 8B 长上下文模型,专为增强推理能力而进行微调,基于 Granite-3.1-8B-Instruct 构建,并使用开放许可开源数据集和合成数据训练。
MiniCPM-o 2.6 是性能最佳的多模态大模型之一,支持视觉、语音和多模态流式能力达到GPT-4级别,并新增了可配置声音功能及情感/语速/风格控制等新特性。
微软在MEDEC研究中意外公布了其部分主要闭源大型语言模型的参数规模,包括Claude 3.5 Sonnet (175B),GPT-4 (~1.76T),Claude 3.5 Claude 3.5 (8B)和o1-preview (~300B)。