监督学习归档 - 每时AI

下一代 AI 系统怎么改？让 AI 自己改？!

2025年7月13日12时作者机器之心

下一代AI系统如何改进？让AI自己改！DGM验证了怎样的路径？‘自进化’范式有哪些特征？Sakana AI和UBC提出‘达尔文哥德尔机’探索AI自主学习能力

多模态数学推理新突破：多样化视角让模型“开窍”！

2025年7月9日19时作者机器学习算法与自然语言处理

MLNLP社区发布了关于多模态数学推理的研究论文《Multimodal Mathematical Reasoning with Diverse Solving Perspective》。该研究提出了一种新的数据集MathV-DP，以及基于Qwen-VL模型的Qwen-VL-DP，旨在提升大型多模态语言模型在数学推理任务中的表现，并强调了从多样化的解题视角学习的重要性。

电子书《理解机器学习：从理论到算法》

2025年4月7日8时作者 NLP工程化

一本老书全面介绍机器学习理论基础和算法实现，涵盖多种学习范式，提供系统学习框架。

仅靠逻辑题，AI数学竞赛能力飙升！微软、九坤投资：7B小模型也能逼近o3-mini

2025年2月25日16时作者机器之心

多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，

苹果牛津发现「蒸馏Scaling Law」！必须满足两个条件，蒸馏才有优势

2025年2月14日16时作者新智元

系列实验，深入剖析了蒸馏与监督学习的优劣，以及模型表现与计算资源的关系，探索模型优化的新路径。
众所

苹果也在蒸馏大模型，给出了蒸馏Scaling Laws

2025年2月14日12时作者机器之心

苹果研究人员提出蒸馏扩展定律，基于计算预算及其在学生和教师之间的分配，能够预测蒸馏模型的性能。该发现降低了大规模使用蒸馏的风险，并指导了优化教师和学生模型的计算资源以最大化学生模型性能的方法。

开源复现DeepSeek R1的文本到图谱抽取训练open-r1-text2graph

2025年2月10日23时作者 GitHubStore

该项目基于Hugging Face Open-R1和trl构建，并重现了DeepSeek R1训练方案。通过合成数据生成、监督训练和强化学习（使用GRPO策略优化）等步骤，旨在提高模型进行文本到图信息提取的能力。