DeepSeek外还有全球屠榜的Qwen 2.5 Max,看下它和o3-mini 的 PK

阿里云Qwen2.5-Max在最新排行榜上位列全球第七,并在数学和编程等领域表现出色。其功能强大且适应能力强,不仅继承了DeepSeek的通用能力优势,还通过垂直领域深耕开辟出差异化赛道。模型采用MoE架构及超大规模数据预训练等技术优化提升性能。

“李飞飞团队50美元复刻DeepSeek R1”之辨

斯坦福大学李飞飞团队联合华盛顿大学研究人员利用不到50美元的云计算费用训练出了名为s1的推理模型,其数学与编码能力表现接近OpenAI、DeepSeek等大模型。该模型已在GitHub上发布,并且通过精心挑选的数据集和蒸馏方法实现了低成本高效训练。

实测豆包全家桶 ,推理、视觉、语音能力大增,唱歌居然跑调

临近春节,豆包1.5 Pro发布,包含基础模型、视觉和实时语音模型。测试显示其推理能力、视觉理解能力和语音识别能力均有提升,但仍有待提高。基础模型已开始灰度测试,其他两个模型已上线。