数学问题
皮尤报告:Z世代正在用ChatGPT来完成学业,26%人使用过
皮尤研究中心调查发现,约1400名美国青少年中有26%使用了OpenAI的ChatGPT完成学业任务。不过他们对这项技术缺陷的认识有限。
开源Llama版o1来了,3B小模型反超80B,逆向工程复现OpenAI新Scaling Law
Hugging Face团队利用Llama 1B模型在数学测试中超过8倍大模型的性能,并改进了搜索策略以提升模型表现。研究涉及多种方法,最终发现DVTS方法能显著提高简单/中等难度问题的性能。
陶哲轩:通义千问QwQ奥数真厉害,开源大模型顶流
一个刚发布两天的开源模型QwQ在AI数学奥林匹克竞赛AIMO上创造了新纪录,其表现甚至比之前的开源模型更好。QwQ系列大模型,特别是QwQ-32B,在科学推理能力方面表现出研究生水平,并在多个评测中取得了高分。