陶哲轩:通义千问QwQ奥数真厉害,开源大模型顶流

一个刚发布两天的开源模型QwQ在AI数学奥林匹克竞赛AIMO上创造了新纪录,其表现甚至比之前的开源模型更好。QwQ系列大模型,特别是QwQ-32B,在科学推理能力方面表现出研究生水平,并在多个评测中取得了高分。

UC伯克利:给大模型测MBTI,Llama更敢说但GPT-4像理工男

加州大学伯克利分校的研究表明,不同语言模型在回复语气和风格上存在差异。研究通过VibeCheck方法评估了多个大模型的回复,发现这些模型在友好性、正式性等方面具有不同的特征,并能用于指导开发者选择合适的模型进行应用。