分享一款 GitHub 上开源的 LLM 应用评估框架:opik

这是一个用于构建评估、测试和监控 LLM 应用平台的框架,它提供直观的 Web 界面,能够记录开发和生产期间的所有 LLM 调用,支持反馈分数记录、测试用例存储和 CI/CD 集成等功能,适用于 RAG 聊天机器、代码助手和复杂的代理管道等应用场景。

参考文献:
[1] https://github.com/comet-ml/opik
[2] https://www.comet.com/docs/opik/


(文:NLP工程化)

欢迎分享

发表评论