1200行代码逆袭!DeepSeek工程师开源轻量级vLLM,吞吐量逼近原版

Nano-vLLM 是一个由 DeepSeek AI 研究者俞星凯构建的轻量级 vLLM 实现,代码简化至 1200 行。其亮点包括快速离线推理、简洁易读的代码库以及优化套件等功能。与 vLLM 相比,Nano-vLLM 在输出 token 和时间上表现相近,但略逊于 vLLM 的吞吐量。

硅谷巨震!Alexandr Wang加入Meta,一夜之间让OpenAI、微软、谷歌沦为“透明人”

硅谷发生地震:28岁华人天才创始人加入Meta,带来150亿美元投资。Alexandr Wang创办的Scale AI专注于数据标注,掌握AI核心资源。这被视为Meta在AI竞赛中的重大战略布局。

三种主流文本嵌入编码范式及KG-Infused RAG做问题扩展新思路

今天是2025年6月13日,星期五,北京晴天。文章介绍了三种embedding编码范式(Bi-encoders、Cross-encoder、ColBERT)及其对比,并探讨了知识图谱与RAG结合在问答系统中的应用,重点介绍《KG-Infused RAG: Augmenting Corpus-Based RAG with External Knowledge Graphs》的研究工作及其步骤。