分享一款 GitHub 上开源的 LLM 应用评估框架：opik

2025年1月1日8时作者 NLP工程化

这是一个用于构建评估、测试和监控 LLM 应用平台的框架，它提供直观的 Web 界面，能够记录开发和生产期间的所有 LLM 调用，支持反馈分数记录、测试用例存储和 CI/CD 集成等功能，适用于 RAG 聊天机器、代码助手和复杂的代理管道等应用场景。

参考文献：
[1] https://github.com/comet-ml/opik
[2] https://www.comet.com/docs/opik/

（文：NLP工程化）