32K归档 - 每时AI

小红书开源了个模型 142b，激活14b

上午8时 2025/06/07 作者 NLP工程化

中等规模的dots.llm1模型在仅使用11.2万亿高质量真实数据的情况下达到与Qwen2.5-72B相当的性能水平，上下文长度达32K，参数量为140亿（14B）和1420亿（142B），并提供预训练中间检查点。