这是一个用于构建评估、测试和监控 LLM 应用平台的框架,它提供直观的 Web 界面,能够记录开发和生产期间的所有 LLM 调用,支持反馈分数记录、测试用例存储和 CI/CD 集成等功能,适用于 RAG 聊天机器、代码助手和复杂的代理管道等应用场景。



参考文献:
[1] https://github.com/comet-ml/opik
[2] https://www.comet.com/docs/opik/
(文:NLP工程化)
这是一个用于构建评估、测试和监控 LLM 应用平台的框架,它提供直观的 Web 界面,能够记录开发和生产期间的所有 LLM 调用,支持反馈分数记录、测试用例存储和 CI/CD 集成等功能,适用于 RAG 聊天机器、代码助手和复杂的代理管道等应用场景。
参考文献:
[1] https://github.com/comet-ml/opik
[2] https://www.comet.com/docs/opik/
(文:NLP工程化)