李飞飞、DeepSeek为何偏爱这个国产模型?

阿里云通义千问的Qwen模型在短短时间内取得了显著突破,仅用1000个样本在H100上监督微调26分钟就训练出与顶尖推理模型相当的新模型s1-32B。这一成果引起了AI社区的关注和赞誉,取代了Llama成为开源AI社区的重要标杆基座模型。

23 年爆火的大模型综述,如今出纸质书了丨文末送书

优质的AI教学资源稀缺。清华NLP实验室等机构联合推出大模型公开课及教材《大语言模型》,覆盖全流程技术并配有配套代码与工具包,适合各类读者学习。新年之际发放十本电子版《大语言模型》作为福利。