泛化能力归档

成本暴降88%！通义实验室、北大发布ZeroSearch，无需搜索即可激活LLM检索能力

下午4时 2025/05/29 作者机器之心

本文提出ZeroSearch框架，无需真实搜索引擎即可激活大语言模型搜索能力。通过轻量级监督微调将LM转为检索模块，并采用课程学习逐步降低文档质量来激发推理能力，显著降低训练成本和提高性能。

下午11时 2025/05/21 作者新智元

」，英伟达直接用视频生成模型让机器人「做梦」学习！新方法DreamGen不仅让机器人掌握从未见过的新

下午11时 2025/05/19 作者极市干货

VAE 和 LDM，以实现最佳生成性能？
>>
加入极市CV技术交流群，走在计算机视觉的最前沿
太长

下午2时 2025/05/18 作者老刘说NLP

rompt的事件引发了大家的广泛关注，其中会有些思考，例如System Prompt到底是个啥？作用

下午4时 2025/05/16 作者机器之心

腾讯研究团队采用强化学习结合课程采样策略训练意图识别模型，显著提升其在未知意图上的泛化能力。该方法能有效指导模型关注更具挑战性的数据样本，并通过实验验证了GRPO算法优于传统SFT方法的性能优势。

下午4时 2025/05/14 作者 HyperAI超神经

浙江大学和哈佛大学的研究团队推出了In-Context Edit（ICEdit），一款基于指令的图像编辑框架，仅需极少的文本指令即可实现精准的图像修改。

下午4时 2025/05/10 作者机器之心

深度学习深陷低效 Scaling Law 而无法自拔时，我们是否可以回到起点重看模型表征本身——究竟

下午4时 2025/05/09 作者量子位

yuanCustom
。
“自定义”主打的就是主体一致性，用一张图片就可以确定视频主角，
其一致性评

下午4时 2025/05/08 作者机器之心

清华大学团队提出傅里叶位置编码（FoPE），通过鲁棒性强的位置编码克服Transformer在处理长文本时的周期性延拓限制，显著提升模型的长文本泛化能力。

下午4时 2025/05/06 作者新智元

新智元报道
具身智能公司Physical Intelligence推出π0.5 VLA模型，通过异构任务协同训练实现广泛泛化能力，机器人能在多种环境中完成复杂任务。