学术归档 - 第3页共217页

[Triton编程][基础] Triton Fused Softmax Kernel详解: 从Python源码到PTX分析

下午7时 2025/05/29 作者 GiantPandaCV

562146477609112
编辑丨GiantPandaLLM
0x00 前言
Triton Fu

原来Veo 3早有苗头！人大联合值得买科技在CVPR 2025提出全新「图像到有声视频」生成框架

下午4时 2025/05/29 作者机器之心

。第一作者王希华是人大高瓴博士生（导师：宋睿华），他的研究兴趣主要在多模态生成，之前提出利用音频布局

RSS 2025｜从说明书学习复杂机器人操作任务：NUS邵林团队提出全新机器人装配技能学习框架Manual2Skill

下午4时 2025/05/29 作者机器之心

伟、郭京翔、胡越、陈浩楠、陈俊廷、吴睿海。通讯作者为新加坡国立大学计算机学院助理教授邵林，研究方向为

成本暴降88%！通义实验室、北大发布ZeroSearch，无需搜索即可激活LLM检索能力

下午4时 2025/05/29 作者机器之心

本文提出ZeroSearch框架，无需真实搜索引擎即可激活大语言模型搜索能力。通过轻量级监督微调将LM转为检索模块，并采用课程学习逐步降低文档质量来激发推理能力，显著降低训练成本和提高性能。

刚刚，AI科学家Zochi在ACL「博士毕业」，Beta测试今日上线

下午4时 2025/05/29 作者机器之心

Intology 的 AI 科学家 Zochi 的论文《Tempest: Automatic Multi-Turn Jailbreaking of Large Language Models with Tree Search》被顶级科学会议 ACL 接收，成为首个独立通过 A* 级别科学会议同行评审的人工智能系统。

还得是华为！Pangu Ultra MoE架构：不用GPU，你也可以这样训练准万亿MoE大模型

下午4时 2025/05/29 作者机器之心

万亿 MoE 模型，此前发布了英文技术报告[1]。最近华为盘古团队发布了 Pangu Ultra M

中国团队让AI拥有「视觉想象力」，像人类一样脑补画面来思考

下午4时 2025/05/29 作者机器之心

于各个专业领域和日常生活的方方面面。
图 1：需要借助「脑补」图像进行思考的真实世界任务。这些任务通

135 个项目、七大趋势、三大赛道：撕开大模型开源生态真相，你会怎么卷？

下午4时 2025/05/29 作者机器之心

Claude
三大开发者大会接连登场的一周里，微软为
Windows
加装模型上下文协议（
MCP

深入剖析！如何区分有价值和无价值的数据？

下午2时 2025/05/29 作者机器学习算法与自然语言处理

MLNLP社区分享了关于RHO-1论文的解读，该论文提出了选择性语言建模(SLM)，通过分析文本中的不同token对模型学习的影响，提出只对有价值的token进行训练的方法。此方法能够显著提升效率并提高性能。

Agent也能蒸馏了！性能超好

下午2时 2025/05/29 作者机器学习算法与自然语言处理

MLNLP社区是国内外知名的机器学习与自然语言处理社区。该社区致力于促进学术界、产业界和爱好者间的交流与进步，特别是针对初学者的提升。近期有论文提出Agent蒸馏技术，通过使用检索工具和代码工具让小模型学会像人类一样解决问题，显著提升了小模型在某些任务上的性能。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30