性能提升归档

大模型不再“自由发挥”？KAG-Thinker引入结构化思维，重塑大模型复杂推理范式

2025年7月10日23时作者 PaperWeekly

G-Thinker 模型，该模型是 KAG 框架的重要迭代升级，聚焦于为通用或专业领域复杂推理任务构

2025年7月1日23时作者极市干货

提出低分辨率自注意力（LRSA）机制及LRFormer模型，通过在固定低维空间计算全局注意力，大幅降

2025年6月19日8时作者 NLP工程化

Gemini 2.5 技术报告发布，涵盖深度学习和自然语言处理技术的最新进展。

2025年6月16日23时作者 PaperWeekly

方法 SCAR（Style Consistency-Aware Response Ranking），

2025年6月11日23时作者 APPSO

只是上新，也都有实打实的升级，持续把行业的竞争门槛推高一大截。
1 月，豆包 1.5 pro 模型上

2025年6月10日23时作者极市干货

海交通大学、腾讯优图、浙江大学联合推出 IAR 方法，通过码本重排策略和面向簇的交叉熵损失，提升自回

2025年6月6日23时作者机器之心

字节跳动提出预训练模型平均（PMA）技术，在不增加计算成本的情况下显著提升大模型性能。通过合并稳定期检查点，PMA能预测衰减阶段表现，节省资源并加速训练进程。

2025年6月5日23时作者量子位

ZIP Lab和Monash团队提出ZPressor模块，通过信息瓶颈原理解决了前馈3D高斯泼溅模型的信息过载问题。该方法显著提升了实时渲染能力、推理时间和显存占用，并在多种基准数据集上提高了模型的鲁棒性和性能表现。

2025年5月29日23时作者新智元

nel」，将Llama-1B模型前向传播完整融合进单一GPU内核，实现推理时间低于1毫秒。在B200

2025年5月26日23时作者头部科技

e研究数据显示，中国AI Server市场预计外购英伟达、AMD等芯片比例会从2024年约63%进一