可信度归档 - 每时AI

一套LLM幻觉检测工具：uqlm

上午8时 2025/05/27 作者 NLP工程化

一套LLM幻觉检测工具uqlm提供多种评测方式评估AI输出一致性、不确定性及可靠性

下午4时 2025/04/08 作者量子位

型竞技场
（Chatbot Arena）
官方亲自下场开怼：
竞技场上，Meta提供给他们的是特供版

下午1时 2024/11/28 作者机器之心

机器之心报道
编辑：佳琪、Panda
最近，正处于评议阶段的 ICLR 2025 论文真是看点连连，