Qwen2.5技术报告解读 下午2时 2024/12/27 作者 机器学习算法与自然语言处理 Qwen团队发布《Qwen2.5 Technical Report》,该报告展示了大规模语言模型在预训练和后训练方面的改进,包括数据集扩展、架构优化和强化学习应用等。
阿里Qwen团队发布首个开源推理模型QwQ-32B-preview! 上午10时 2024/11/29 作者 AI信息Gap 木易分享国内首个开源推理模型QwQ-32B-preview的表现及其在基准测试中的优异成绩,并指出其局限性。该模型由阿里Qwen团队发布,参数仅有32B,适用于多种场景,但仍需优化安全性和连贯性等问题。