PaperWeekly，作者每时AI - 第23页共37页

又水了一篇顶会！不知道博士咋毕业的，来看看我咋水的

下午4时 2025/02/18 作者 PaperWeekly

新手科研需学习顶会大牛方法论和思想，提升创新性。图灵学术邀请大牛导师一对一指导，前30名可免费获取课程及学术资料。

下午11时 2025/02/17 作者 PaperWeekly

中，有几个关键元素至关重要：首先是奖励模型和价值函数，它们用于评估每个动作或策略的优劣，从而决定模型

下午11时 2025/02/17 作者 PaperWeekly

言模型、推荐系统
论文题目：
Unleash LLMs Potential for Sequenti

下午11时 2025/02/14 作者 PaperWeekly

理模型）异常火爆，Kimi 和 DeepSeek 陆续推出自家的产品 K1.5 和 R1，效果追评甚

下午11时 2025/02/14 作者 PaperWeekly

建了一个极具挑战性的大规模基准数据集 BEE24。
论文标题：
TOPIC:A Parallel A

下午12时 2025/02/13 作者 PaperWeekly

X-R1 是一个低成本且易入门的强化学习训练框架，旨在降低 R1 的复现门槛。通过使用0.5B预训练模型，在4张3090/4090显卡上仅需2小时就实现了 ‘aha Moment’，展示了极小模型也能触发Aha Moment的现象。

下午12时 2025/02/13 作者 PaperWeekly

图神经网络、协同感知
论文题目：
SAMGPT: Text-free Graph Foundati

下午11时 2025/02/12 作者 PaperWeekly

大语言模型（LLMs）的注意力头功能与工作机制引起了广泛关注。《Attention Heads of Large Language Models》综述论文整合了现有研究，提出四阶段认知框架和详细分类，并梳理实验方法与评估基准，为LLM可解释性研究提供了系统性的理论支持与实践指导。

下午11时 2025/02/12 作者 PaperWeekly

的 Gemini、DeepSeek 和 Qwen-QwQ 等，通过模拟人类推理过程，在多个专业领域

下午11时 2025/02/12 作者 PaperWeekly

文章介绍了字节跳动豆包大模型团队提出的新稀疏模型架构 UltraMem，该架构有效解决了 MoE 推理时高额的访存问题，推理速度提升2-6倍，成本降低83%。