看不懂GitHub代码?刚刚这个AI工具让全球每个GitHub项目开口说话


 

还记得那个号称全球首位 AI 软件工程师 Devin 吗?它的创造者Cognition Labs公司刚刚推出了一个名为 DeepWiki 的项目。简单来说,这是一个目标宏大的计划:为全世界每一个 GitHub 代码仓库(Repo)提供可以实时交流、即时更新的文档

你可以把它想象成一个由 Devin 技术驱动的、专门针对 GitHub 的“深度研究”工具

亮点:免费、免注册、即刻可用

最关键的是,对于开源项目,这项服务完全免费,甚至无需注册

怎么用?非常简单:

  1. 1. 访问 deepwiki.com,探索已经收录的热门开源项目的 Wiki
  2. 2. 或者,更直接的方式:把你正在浏览的任何 GitHub 仓库 URL 中的 github.com 替换成 deepwiki.com,即可无缝跳转到该仓库的 DeepWiki 页面

能做什么?

对话式文档: 你可以直接向代码库“提问”,DeepWiki 会尝试理解你的问题并给出文档级的解答

深度研究 (Deep Research): 对于复杂问题,可以开启此功能,让 AI Agent 进行更深入的分析和回答

按需索引: 如果你关心的公开仓库还没被收录,可以请求 DeepWiki 为你索引

私有仓库支持: 对于私有仓库,可以通过注册 Devin 账户(devin.ai)来获得服务

轻松分享: 生成的 Wiki 页面和问答结果都可以通过链接分享,方便团队成员保持信息同步

投入与规模

Cognition Labs 为了 DeepWiki 可谓投入巨大:

  • • 已索引约 3 万个 GitHub 仓库
  • • 处理了超过 40 亿行代码
  • • 索引过程的计算成本就超过了 30 万美元
  • • 总计处理了超过 1000 亿个 Token

据称,平均索引一个仓库的成本约为 12 美元,但目前对所有开源项目完全免费开放

技术探秘:理解全局结构与提交历史

我们知道,LLM 理解局部代码的能力已经很强,但要掌握庞大代码库的全局结构是真正的难点。DeepWiki 的核心技术正是为了解决这个问题:

  1. 1. 层级化系统分解: 它首先将代码库分解成一个层级化的高阶系统(high-level systems)结构
  2. 2. 系统级 Wiki 生成: 然后为每一个识别出的系统生成对应的 Wiki 页面,构建出整个项目的知识图谱

此外,DeepWiki 还利用了一个非常有价值的信号:代码提交历史 (commit history)。通过分析“哪些文件经常被哪些开发者一同修改”(这可以表示成一个图),DeepWiki 能够挖掘出代码库中隐藏的模式、模块边界和开发者协作关系,这些都是理解复杂项目的关键信息

写在最后

目前,DeepWiki 网站上已经有 3 万个仓库的 Wiki 可供探索。对于开发者来说,尤其是面对庞大、复杂的开源项目时,DeepWiki 无疑提供了一个强大的新工具,有望极大提升代码理解效率,降低学习和参与门槛

比较好奇DeepWiki背后使用的模型,哈哈



(文:AI寒武纪)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往