2025年5月7日11时 - 第8页共9页

ICML 2025 Spotlight｜华为诺亚提出端侧大模型新架构MoLE，内存搬运代价降低1000倍

2025年5月7日11时作者机器之心

Mixture-of-Experts（MoE）架构尽管稀疏激活减少了计算量，但显存资源受限的端侧部署仍面临挑战。研究提出Mixture-of-Lookup-Experts（MoLE），通过将专家输入改为嵌入(token) token，利用查找表代替矩阵运算，有效降低推理开销，减少数千倍传输延迟。

2025年5月7日11时作者机器之心

Google DeepMind的Gemini 2.5 Pro更新提升了编程能力和多模态推理功能，可构建Web应用、游戏和模拟程序，并根据自然图像生成代码。

2025年5月7日8时作者 NLP工程化

通过逆向工程解析现代NVIDIA GPU微架构设计，构建更准确模拟器模型研究其性能和行为。

2025年5月7日8时作者 NLP工程化

Agent S2 是一个开源代理框架，专为构建智能 GUI 代理而设计，这些代理能从经验中学习并在计算机上执行复杂任务。

2025年5月7日8时作者 NLP工程化

UGBench是用于评估大语言模型知识遗忘问题的基准测试工具，支持3个数据领域和多种遗忘方法，使用两种不同规模的语言模型进行测试。

2025年5月7日8时作者 NLP工程化

RealtimeVoiceChat项目提供实时语音与AI对话功能，支持即时反馈、低延迟和多种模型引擎定制，可在GitHub上获取源码（https://github.com/KoljaB/RealtimeVoiceChat）。

2025年5月7日8时作者开源星探

英伟达发布Parakeet TDT 0.6B V2开源语音识别模型，参数仅600M，平均词错误率（WER）6.05%，可在1秒内完成60分钟音频转录，支持英文，已入驻Hugging Face Open ASR榜单首位。