分享一款 GitHub 上开源的 LLM 应用评估框架:opik 上午8时 2025/01/01 作者 NLP工程化 这是一个用于构建评估、测试和监控 LLM 应用平台的框架,它提供直观的 Web 界面,能够记录开发和生产期间的所有 LLM 调用,支持反馈分数记录、测试用例存储和 CI/CD 集成等功能,适用于 RAG 聊天机器、代码助手和复杂的代理管道等应用场景。 参考文献:[1] https://github.com/comet-ml/opik[2] https://www.comet.com/docs/opik/ (文:NLP工程化) 欢迎分享