
还记得那个号称全球首位 AI 软件工程师 Devin 吗?它的创造者Cognition Labs公司刚刚推出了一个名为 DeepWiki 的项目。简单来说,这是一个目标宏大的计划:为全世界每一个 GitHub 代码仓库(Repo)提供可以实时交流、即时更新的文档

你可以把它想象成一个由 Devin 技术驱动的、专门针对 GitHub 的“深度研究”工具
亮点:免费、免注册、即刻可用
最关键的是,对于开源项目,这项服务完全免费,甚至无需注册

怎么用?非常简单:
-
1. 访问 deepwiki.com,探索已经收录的热门开源项目的 Wiki -
2. 或者,更直接的方式:把你正在浏览的任何 GitHub 仓库 URL 中的 github.com
替换成deepwiki.com
,即可无缝跳转到该仓库的 DeepWiki 页面 -
能做什么?
对话式文档: 你可以直接向代码库“提问”,DeepWiki 会尝试理解你的问题并给出文档级的解答
深度研究 (Deep Research): 对于复杂问题,可以开启此功能,让 AI Agent 进行更深入的分析和回答
按需索引: 如果你关心的公开仓库还没被收录,可以请求 DeepWiki 为你索引
私有仓库支持: 对于私有仓库,可以通过注册 Devin 账户(devin.ai)来获得服务
轻松分享: 生成的 Wiki 页面和问答结果都可以通过链接分享,方便团队成员保持信息同步
投入与规模
Cognition Labs 为了 DeepWiki 可谓投入巨大:
-
• 已索引约 3 万个 GitHub 仓库 -
• 处理了超过 40 亿行代码 -
• 索引过程的计算成本就超过了 30 万美元 -
• 总计处理了超过 1000 亿个 Token
据称,平均索引一个仓库的成本约为 12 美元,但目前对所有开源项目完全免费开放
技术探秘:理解全局结构与提交历史
我们知道,LLM 理解局部代码的能力已经很强,但要掌握庞大代码库的全局结构是真正的难点。DeepWiki 的核心技术正是为了解决这个问题:

-
1. 层级化系统分解: 它首先将代码库分解成一个层级化的高阶系统(high-level systems)结构 -
2. 系统级 Wiki 生成: 然后为每一个识别出的系统生成对应的 Wiki 页面,构建出整个项目的知识图谱
此外,DeepWiki 还利用了一个非常有价值的信号:代码提交历史 (commit history)。通过分析“哪些文件经常被哪些开发者一同修改”(这可以表示成一个图),DeepWiki 能够挖掘出代码库中隐藏的模式、模块边界和开发者协作关系,这些都是理解复杂项目的关键信息
写在最后
目前,DeepWiki 网站上已经有 3 万个仓库的 Wiki 可供探索。对于开发者来说,尤其是面对庞大、复杂的开源项目时,DeepWiki 无疑提供了一个强大的新工具,有望极大提升代码理解效率,降低学习和参与门槛
比较好奇DeepWiki背后使用的模型,哈哈
⭐
(文:AI寒武纪)