自动化评测归档

DeepEval：LLM 应用评测不再玄学，让大模型评测像写单元测试一样简单

上午8时 2025/06/05 作者 AI工程化

在大模型应用开发中，DeepEval 提供了一个自动化和标准化的LLM评测框架，支持本地运行，并且集成于多种LLM应用开发框架中。它内置了多种主流的评测指标，能够满足实际场景需求，并支持批量数据集评测和组件级追踪。