本文使用Dify v1.4.0版本，主要介绍了Dify服务启动的入口点。

一.app.py源码

源码位置：dify\api\app.py

这个 Python 文件是一个 Flask 应用的入口点，主要功能如下：

判断是否执行数据库迁移命令，如果是则使用 create_migrations_app() 创建应用
在非调试模式下，使用 gevent 进行异步支持，包括对 gRPC 和 PostgreSQL 连接的异步补丁
在普通模式下，使用 create_app() 创建应用并初始化 Celery
当直接运行此文件时，在 0.0.0.0:5001 端口启动 Flask 开发服务器，禁用自动重载功能

这个文件处理了不同环境下的应用初始化，特别关注了调试模式与异步支持的兼容性问题。

import os
import sys


defis_db_command():
if len(sys.argv) > 1and sys.argv[0].endswith("flask") and sys.argv[1] == "db":
returnTrue
returnFalse


# create app
if is_db_command():
from app_factory import create_migrations_app

    app = create_migrations_app()
else:
# It seems that JetBrains Python debugger does not work well with gevent,
# so we need to disable gevent in debug mode.
# If you are using debugpy and set GEVENT_SUPPORT=True, you can debug with gevent.
if (flask_debug := os.environ.get("FLASK_DEBUG", "0")) and flask_debug.lower() in {"false", "0", "no"}:
from gevent import monkey

# gevent
        monkey.patch_all()

from grpc.experimental import gevent as grpc_gevent  # type: ignore

# grpc gevent
        grpc_gevent.init_gevent()

import psycogreen.gevent  # type: ignore

        psycogreen.gevent.patch_psycopg()

from app_factory import create_app

    app = create_app()
    celery = app.extensions["celery"]

if __name__ == "__main__":
    app.run(host="0.0.0.0", port=5001)

二.功能划分

1.数据库命令检测

defis_db_command():
if len(sys.argv) > 1and sys.argv[0].endswith("flask") and sys.argv[1] == "db":
returnTrue
returnFalse

is_db_command() 函数用于检测当前命令是否为Flask数据库相关命令
通过检查命令行参数判断是否执行了类似 flask db 的命令

2.应用程序创建逻辑

# create app
if is_db_command():
from app_factory import create_migrations_app

    app = create_migrations_app()
else:
# It seems that JetBrains Python debugger does not work well with gevent,
# so we need to disable gevent in debug mode.
# If you are using debugpy and set GEVENT_SUPPORT=True, you can debug with gevent.
if (flask_debug := os.environ.get("FLASK_DEBUG", "0")) and flask_debug.lower() in {"false", "0", "no"}:
from gevent import monkey

# gevent
        monkey.patch_all()

from grpc.experimental import gevent as grpc_gevent  # type: ignore

# grpc gevent
        grpc_gevent.init_gevent()

import psycogreen.gevent  # type: ignore

        psycogreen.gevent.patch_psycopg()

from app_factory import create_app

    app = create_app()
    celery = app.extensions["celery"]

根据不同情况创建不同类型的应用实例：

数据库命令模式：使用 create_migrations_app() 创建应用
普通运行模式：使用 create_app() 创建应用

3.异步支持配置

这段代码在启动 Flask 服务时根据 FLASK_DEBUG 环境变量决定是否启用 gevent-驱动的协作式并发：只有当 FLASK_DEBUG 被显式设为 “false/0/no” 表示非调试模式时，才对标准库进行 monkey.patch_all()，并分别为 gRPC (grpc_gevent.init_gevent()) 与 PostgreSQL 驱动 (psycogreen.gevent.patch_psycopg()) 注入 gevent 兼容的非阻塞实现，使网络 I/O 与数据库操作都由单线程的 gevent 事件循环调度。

# It seems that JetBrains Python debugger does not work well with gevent,
# so we need to disable gevent in debug mode.
# If you are using debugpy and set GEVENT_SUPPORT=True, you can debug with gevent.
if (flask_debug := os.environ.get("FLASK_DEBUG", "0")) and flask_debug.lower() in {"false", "0", "no"}:
from gevent import monkey

# gevent
    monkey.patch_all()

from grpc.experimental import gevent as grpc_gevent  # type: ignore

# grpc gevent
    grpc_gevent.init_gevent()

import psycogreen.gevent  # type: ignore

    psycogreen.gevent.patch_psycopg()

在非调试模式下配置gevent支持：应用gevent的monkey patching；初始化gRPC的gevent支持；为PostgreSQL驱动配置gevent支持。代码详细解释，如下所示：

if (flask_debug := os.environ.get("FLASK_DEBUG", "0")) and flask_debug.lower() in {"false", "0", "no"}:

使用:=运算符获取环境变量FLASK_DEBUG的值，默认为”0″
检查应用是否处于非调试模式（值为”false”、”0″或”no”）
只有在非调试模式下才执行后续异步配置代码

from gevent import monkey

导入gevent的monkey模块，用于monkey patching

monkey.patch_all()

对Python标准库应用monkey patching，使标准库中的阻塞操作变为协作式的
这使程序可以在IO等待时释放控制权，提高并发性能

from grpc.experimental import gevent as grpc_gevent # type: ignore

导入gRPC的gevent支持模块
# type: ignore告诉类型检查器忽略此行可能的类型错误

grpc_gevent.init_gevent()

初始化gRPC的gevent支持，使gRPC能够在gevent环境中工作

import psycogreen.gevent # type: ignore

导入psycogreen的gevent模块，用于支持PostgreSQL数据库的异步操作

psycogreen.gevent.patch_psycopg()

对psycopg2（PostgreSQL适配器）应用补丁，使数据库操作在gevent环境下变为非阻塞式

注解：若处在 JetBrains 的调试模式（FLASK_DEBUG=1 等）则跳过这些补丁，以免 gevent 与调试器冲突（除非使用支持 gevent 的 debugpy 并显式设置 GEVENT_SUPPORT=True）。

4.应用程序运行

如果直接运行此脚本，在0.0.0.0:5001启动Flask应用。

if __name__ == "__main__":
    app.run(host="0.0.0.0", port=5001)

二.技术要点

1.`:=`运算符

:=运算符是 Python 3.8 引入的”海象运算符”(Walrus Operator)，它允许在表达式内部进行变量赋值。这行代码的作用是：

flask_debug := os.environ.get("FLASK_DEBUG", "0")

获取环境变量 FLASK_DEBUG 的值(默认为”0″)并赋给变量 flask_debug
同时使用这个变量进行条件判断

不使用海象运算符的等效代码：

flask_debug = os.environ.get("FLASK_DEBUG", "0")

因此，海象运算符让代码更简洁，并将变量作用域限制在条件语句内。

2.`monkey.patch_all()`原理

monkey.patch_all() 在程序启动时对 Python 标准库做”monkey patching”：把会阻塞线程的同步接口（socket、ssl、select、time、thread、subprocess 等）的底层实现替换成 gevent 的非阻塞版本，使它们在遇到 I/O 等待或 sleep 时自动向 gevent 的事件循环（基于 libev/libuv）让出控制权；这样多个 Greenlet 就能在单线程内通过协作式调度并发运行，而代码仍保持同步、直观的写法。

3.`grpc_gevent.init_gevent()`原理

grpc_gevent.init_gevent()把 gRPC-Python 的底层 C-core 轮询与计时机制切换为 gevent 兼容的事件引擎：它在调用时创建一个后台 Greenlet 来轮询 gRPC 的 Completion Queue，并把 gRPC 内部用于等待 I/O、定时器和互斥锁的阻塞式实现替换成 gevent 的协作式版本。这样，gRPC 的客户端/服务器调用（包括网络收发、超时和流控）就能在单线程的 gevent 事件循环里与其它 Greenlet 非阻塞地并发运行，而无需改动现有同步风格的 gRPC 代码。

4.`psycogreen.gevent.patch_psycopg()`原理

psycogreen.gevent.patch_psycopg() 利用 psycopg2 内建的异步接口，把原本阻塞式的 PostgreSQL 读写操作改造成”非阻塞 + 回调”模式：它将连接套接字设为 non-blocking，并把等待 I/O 就绪的逻辑注册到 gevent 的事件循环（通过 gevent.hub.get_hub().loop.io 监听 fileno）。这样每当数据库查询需要等待网络收发或结果返回时，当前 Greenlet 会主动让出控制权，其它 Greenlet 得以继续执行，实现单线程内的协作式并发，而应用层 SQL 调用方式保持不变。

5.gRPC和gevent

在代码中，grpc_gevent.init_gevent()初始化了gRPC与gevent的集成，使gRPC服务能够利用gevent的事件循环和协程调度机制，从而在处理多个RPC调用时获得更好的性能。在gRPC中使用gevent主要是为了提高并发性能和资源利用率：

高并发处理：gevent是一个基于协程的并发库，使用了轻量级的greenlets，可以处理大量并发连接而不需要创建大量系统线程。
非阻塞I/O：通过monkey.patch_all()，gevent能够将Python标准库中的阻塞I/O操作转换为非阻塞操作，使服务器在等待I/O时能够处理其他请求。
性能优势：相比传统的多线程模型，gevent的协程模型在I/O密集型应用中通常有更好的性能表现，且消耗更少的系统资源。
解决GIL限制：Python的全局解释器锁（GIL）会限制多线程性能，而gevent的协程模型可以在单线程内实现高并发。

6.greenlets微线程

Greenlet 是 Python greenlet 库提供的一种”用户态微线程”原语：每个 Greenlet 拥有独立的执行栈和寄存上下文，但所有 Greenlet 共享同一 OS 线程；它们不会被内核或解释器预先抢占，而是通过代码显式调用 greenlet.switch()（或由 gevent、eventlet 等框架在 I/O 等待点隐式调用）来协作式地让出和恢复执行。由于上下文切换仅在用户态完成、无需进入内核，Greenlet 切换成本通常比线程或 asyncio Task 更低，适合高并发、I/O 密集场景，同时保持同步直观的编程模型。不过它并不能利用多核，需要结合多进程或其它并行机制才能发挥多核性能。

7.pydevd与debugpy关系

特性	pydevd	debugpy	联系
定义	Python 调试器的底层核心引擎	基于 `pydevd` 的调试适配器	`debugpy` 是 `pydevd` 的封装，依赖其核心功能
主要开发者	PyDev（Fabio Zadrozny）	Microsoft（VS Code 官方团队）	均由 Python 调试生态的核心开发者维护
核心作用	提供断点、单步执行、变量查看等底层调试功能	实现 DAP 协议，桥接 IDE 与 `pydevd`	`debugpy` 调用 `pydevd` 实现实际调试操作
协议支持	私有协议（PyDev 协议）	调试适配器协议（DAP）	`debugpy` 将 DAP 指令翻译为 `pydevd` 的私有协议
典型应用场景	PyCharm、PyDev、VSCode（旧版）	VS Code（默认 Python 调试器）	`debugpy` 在 VS Code 中替代了直接使用 `pydevd` 的旧方案
架构层级	底层引擎	中间适配层 + 引擎	`debugpy = DAP 适配层 + pydevd`
安装方式	`pip install pydevd`	`pip install debugpy`	独立安装，但 `debugpy` 会隐式依赖 `pydevd`
远程调试	支持（需手动配置）	支持（简化配置，`listen` API）	`debugpy` 对远程调试进行了高层封装，底层仍用 `pydevd`
性能	更高（直接调用无转换层）	略低（存在协议转换开销）	在常规调试中差异不明显

三.可能遇到的问题

1.非FLASK_DEBUG模式（正常）

本质：FLASK_DEBUG=False。

# 结果为True
(flask_debug := os.environ.get("FLASK_DEBUG", "0")) and flask_debug.lower() in {"false", "0", "no"}

2.FLASK_DEBUG模式（路径问题）

本质：FLASK_DEBUG=True和自动加载。

# 结果为False
(flask_debug := os.environ.get("FLASK_DEBUG", "0")) and flask_debug.lower() in {"false", "0", "no"}

启动app时因为路径问题而报错，如下所示：

FLASK_APP = app.py
FLASK_ENV = development
FLASK_DEBUG = 1
In folder F:/Dify资料/ai408_dify/api
F:\Dify资料\ai408_dify\api\.venv\Scripts\python.exe -X pycache_prefix=C:\Users\wangs\AppData\Local\JetBrains\PyCharm2025.1\cpython-cache "D:/Program Files/JetBrains/PyCharm 2023.3.3/plugins/python-ce/helpers/pydev/pydevd.py" --module --multiprocess --qt-support=auto --client 127.0.0.1 --port 12646 --file flask run --host 0.0.0.0 --port=5001
Connected to pydev debugger (build 251.26094.141)
F:\Dify资料\ai408_dify\api\controllers\web\remote_files.py:7: UserWarning: To use python-magic guess MIMETYPE, you need to run `pip install python-magic-bin`
from controllers.common import helpers
 * Serving Flask app 'app.py'
 * Debug mode: on
2025-06-2401:33:12,291 INFO [_internal.py:97]  WARNING: This is a development server. Do not use it in a production deployment. Use a production WSGI server instead.
 * Running on all addresses (0.0.0.0)
 * Running on http://127.0.0.1:5001
 * Running on http://172.16.21.54:5001
2025-06-2401:33:12,291 INFO [_internal.py:97]  Press CTRL+C to quit
2025-06-2401:33:12,295 INFO [_internal.py:97]   * Restarting with stat
D:\Python311\python.exe: can't open file 'D:\\Program': [Errno 2] No such file or directory

Process finished with exit code 2

原因：主要是因为PyCharm的安装位置为D:\Program Files\JetBrains\PyCharm 2023.3.3\bin\pycharm64.exe，造成空格把路径截断了。因此，建议以后安装PyCharm的路径最好不好包含空格。

3.FLASK_DEBUG模式（路径问题的一种解决方法）

本质：FLASK_DEBUG=True和–no-reload（非自动加载）。

在 Flask 中，–no-reload 参数用于禁用开发服务器的自动重新加载功能。它的作用如下所示：

Flask 开发服务器（flask run 或 app.run()）默认启用了代码热重载（Debug + Reloader），当检测到代码变动时会自动重启服务器，方便开发调试。
使用 --no-reload 会关闭这一功能，即使代码发生变化，服务器也不会自动重启。
--no-reload 需要调试模式已启用（即 --debug 为 True）才会生效。如果调试模式关闭（--debug=False），重载器本身就不会启动。

说明：如果调试Dify源码，建议FLASK_DEBUG=True和–no-reload（非自动加载）。因为这种配置比较适合复杂状态调试，FLASK_DEBUG=1可保留调试器和详细日志，而--no-reload防止各种情况：WebSocket 连接意外中断、数据库连接池被重置、异步任务状态丢失等。

参考文献

[0] Dify服务启动的入口点：https://z0yrmerhgi8.feishu.cn/wiki/ZJ6fwRBIWicMIakiUmece4d0nTh

[1] What is gevent：http://www.gevent.org/install.html

[2]gevent github：https://github.com/gevent/gevent

[3] gevent For the Working Python Developer：https://sdiehl.github.io/gevent-tutorial/

[4] flask gevent：https://flask.palletsprojects.com/en/stable/deploying/gevent/

[5] gRPC Python’s documentation：http://grpc.github.io/grpc/python/

[6] gRPC Quick start：https://grpc.io/docs/languages/python/quickstart/

[7] psycogreen github：https://github.com/psycopg/psycogreen

[8] Psycopg 3 – PostgreSQL database adapter for Python：https://www.psycopg.org/psycopg3/docs/

[9] debugpy github：https://github.com/microsoft/debugpy

[10] https://pypi.org/project/debugpy/

[11] https://pypi.org/project/pydevd/

知识星球服务内容：Dify源码剖析及答疑，Dify对话系统源码，NLP电子书籍报告下载，公众号所有付费资料。加微信buxingtianxia21进NLP工程化资料群。

（文：NLP工程化）

2025 年 6 月
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30