2025年3月24日16时 - 第6页共10页

给语音模型戴上「眼镜」，错误率降低12.5%！人大CMU最新开源 AAAI 2025

2025年3月24日16时作者新智元

BPO-AVASR通过双焦点偏好优化方法提升了视觉和音频结合的语音识别性能，解决了噪声、口语化表达及同音词混淆等问题，在多个基准数据集上取得了最优表现。

2025年3月24日16时作者钛媒体AGI

蚂蚁集团Ling Team团队利用AI Infra技术开发了两个百灵系列开源MoE模型，并在训练阶段使用国产AI/GPGPU芯片产品降低了成本。相关成果发表在预印版Arxiv平台上。

2025年3月24日16时作者机器之心

谷歌在MWC上推出Project Astra与Gemini Live集成的新AI功能，包括屏幕共享和实时视频回答问题。这些功能提升了实时人工智能交互的能力，使Gemini Live能够更好地理解和响应用户的需求。

2025年3月24日16时作者机器之心

设计 RLHF 的奖励模型时也是一样。
我们知道，一个 RLHF 算法是否成功的一大关键在于其奖励模

2025年3月24日14时作者老刘说NLP

案例出发，看看Dify的知识库分段及召回逻辑设计，这个比看论文要踏实的多。
抓住根本问题，做根因，专

2025年3月24日14时作者老刘说NLP

，从MetaGPT、LangGraph看Agent记忆实现机制，以加强昨日关于Agent机记忆体的认

2025年3月24日14时作者小兵的AI视界

是一个高性能的
C/C++
库，专门用于运行
LLM
，支持多种硬件加速选项。
本文将详细介绍如何

2025年3月24日14时作者 AI技术研习社

容。
最近，越来越多新朋友加入，为了让大家快速上手，我特意整理了一份
RAG关键知识总结
，让你系统