微软 Phi-4 震撼发布:14B 参数模型性能超越 一众大模型,数学推理性能提升显著

微软发布的Phi-4大语言模型在数学推理方面表现出色,准确率达到91.8%。该模型通过高质量合成数据集、精心策划的数据以及先进的后训练技术实现了这一成就,并已在Azure AI Foundry平台发布。

完整视频! Ilya Sutskever最新论断,预训练时代将终结,新方向将会是…

前OpenAI联合创始人、SSI创始人Ilya Sutskever近日在神经信息处理系统会议上表示,大语言模型预训练规模扩展已达瓶颈,未来AI发展将转向构建代理和工具。他预测2025年将成为AI Agent元年,推动AI领域进入新阶段。

重磅!OpenAI发布满血o1、无限使用,最强大模型来了

专注AIGC领域的专业社区报道了微软&OpenAI等大语言模型的发展和应用。近日OpenAI发布了ChatGPT Pro,并宣布12天技术分享直播已启动。o1模型数据及训练涉及多样化的公开与非公开数据集,且具备自我改进能力。

精度与通用性不可兼得,北大、华为理论证明低精度下Scaling Law难以实现

大模型量化通过降低精度来提高推理速度,但研究发现不同精度下大语言模型在基本数学任务上的表现显著下降。研究证明足够的精度是解决这些任务的重要前提,而量化会严重损害大模型的数学推理能力。

多样任务真实数据,大模型在线购物基准Shopping MMLU开源|NeurIPS&KDD Cup 2024

基于亚马逊真实购物数据,港科大与圣母大学联合构建了大规模评测基准Shopping MMLU,评估大语言模型在线购物领域的应用潜力。该基准覆盖多项任务及能力,强调多任务学习、少样本学习和特定领域知识理解的重要性,并且已被公开用于研究和应用。

LLM也怕你妈叫你回家吃饭这种模糊请求,纽大提出指导LLM澄清问题

MLNLP社区致力于促进国内外自然语言处理领域内的学术交流与进步。该论文提出了一种新的标注方法,用于训练LLMs在多回合交互中询问澄清问题,显著提高了其在处理模糊请求时的性能。