优化
一文详解:DeepSeek 第二天开源的 DeepEP
DeepSeek本周发布的新版本DeepEP为混合专家模型提供高效的通信解决方案,支持Hopper GPU架构。通过优化的核心、低延迟操作和创新的通信-计算重叠方法提升了模型在训练和推理阶段的性能。
RAG评估框架:RAG Triad框架及其实战
RAG三元组由三个关键指标组成:答案相关性、忠实度和上下文相关性。通过合理调整这些超参数,可以优化每个评估指标,实现更高效和准确的问答系统。使用deepeval库中的评估方法简单易行。
质量超越o1,成本仅4%,UCSD张怡颖教授团队开源生成式AI工作流自动优化器
UCSD 张怡颖教授团队推出的 Cognify 是一款优化生成式 AI 工作流的工具,能够提高 48% 的生成质量并降低 90% 的成本。Cognify 提供了多种模型和提示词进行优化,目前支持 LangChain、DSPy 和基于 Python 的工作流。