腾讯发布DeepMath-103K,数学能力断崖式超过所有基线!
MLNLP社区是国内外知名的机器学习与自然语言处理社区。《数学能力的重大突破:腾讯发布的DeepMath-103K》介绍了一种包含10.3万道高难度数学题的数据集,旨在提升模型的数学推理能力。
MLNLP社区是国内外知名的机器学习与自然语言处理社区。《数学能力的重大突破:腾讯发布的DeepMath-103K》介绍了一种包含10.3万道高难度数学题的数据集,旨在提升模型的数学推理能力。
智谱发布GLM-4-32B-0414系列模型,包含基座、推理和沉思模型,支持MIT License,并上线MaaS开放平台。其中推理模型GLM-Z1-32B为国内最快的模型之一,适用于不同场景。通过实测及示例展示了其在问答和功能调用应用中的优势。
DeepSeek V3 SGLang 优化
继续我们的DeepSeek V3与SGLang集成的技术
梳理了大模型体系构成和应用关系,介绍了神经网络作为机器学习的一种深度学习方式的基本原理及其在自然语言处理、计算机视觉等领域的结合应用,并阐述了不同架构如Transformer、RNN的工作机制,强调了神经网络并非万能及需要具体任务场景来发挥作用。