日期: 2025 年 1 月 29 日
增强RAG系统落地效果的9条最佳实践
通过系统研究RAG系统的多个关键因素,包括语言模型大小、提示设计、文档块大小等,得出了9条最佳实践,并提出了一系列实验设计以评估RAG系统的性能,涵盖TruthfulQA和MMLU数据集。
DeepSeek绕开CUDA垄断,V3论文细节再挖出!英伟达护城河不存在了?
新智元报道
DeepSeek团队通过优化英伟达GPU的PTX指令集,绕过了CUDA实现了高效训练超大规模语言模型。这一突破引发了业界对CUDA护城河的质疑。
中国不只有DeepSeek,阿里除夕夜抛出重磅新模型,是时候整体重估中国AI资产了吗?
阿里云发布Qwen2.5-Max大模型,在多个权威基准测试中表现出与全球顶级模型比肩的性能。该模型采用超大规模MoE架构,支持高达100万token的上下文窗口,并在低成本高性能方面具有潜力,引发市场对中国AI资产重估的讨论。