估算自托管 Dify 工作流的并发聊天用户数

我想询问一下 Dify 中单个 Workflow 支持的并发对话数量——具体来说,同时可以有多少用户与它聊天。我注意到每个 Workflow 都有一个“最大并发请求数”设置,但我知道在自托管环境中,实际限制取决于硬件配置。

假设我获得一台专门用于运行 Dify 的虚拟机(4 核心,8 GB 内存),那么可以支持多少用户同时聊天?我的 Workflow 不使用 RAG 或向量数据库,但流程相对较长(约 25 个节点),每条消息输出大约需要 4–8 秒。

据我所知,目前没有公开的明确性能指南(尤其是针对社区版)。

即使出现某种性能问题,我认为瓶颈发生的位置——无论是 API、沙盒、插件守护进程、CPU、内存、数据库连接池等——都会因应用程序的构建方式而有很大差异。

由于很难用强有力的证据来计算这些点,我认为更现实的做法是引入资源监控,然后根据需要考虑垂直或水平扩展。