IBM 悄无声息的发布了 granite-3.2-8b 开源模型

Granite-3.2-8B-Instruct-Preview 是一款早期发布的 8B 长上下文模型,专为增强推理(思考)能力而进行了微调。该模型基于 Granite-3.1-8B-Instruct 构建,使用了混合的开放许可开源数据集和内部生成的专为推理任务设计的合成数据进行训练。该模型允许对其思考能力进行控制,确保仅在需要时应用。

参考文献:
[1] https://huggingface.co/ibm-granite/granite-3.2-8b-instruct-preview



(文:NLP工程化)

发表评论