我想询问一下 Dify 中单个 Workflow 支持的并发对话数量——具体来说,同时可以有多少用户与它聊天。我注意到每个 Workflow 都有一个“最大并发请求数”设置,但我知道在自托管环境中,实际限制取决于硬件配置。
假设我获得一台专门用于运行 Dify 的虚拟机(4 核心,8 GB 内存),那么可以支持多少用户同时聊天?我的 Workflow 不使用 RAG 或向量数据库,但流程相对较长(约 25 个节点),每条消息输出大约需要 4–8 秒。
我想询问一下 Dify 中单个 Workflow 支持的并发对话数量——具体来说,同时可以有多少用户与它聊天。我注意到每个 Workflow 都有一个“最大并发请求数”设置,但我知道在自托管环境中,实际限制取决于硬件配置。
假设我获得一台专门用于运行 Dify 的虚拟机(4 核心,8 GB 内存),那么可以支持多少用户同时聊天?我的 Workflow 不使用 RAG 或向量数据库,但流程相对较长(约 25 个节点),每条消息输出大约需要 4–8 秒。
据我所知,目前没有公开的明确性能指南(尤其是针对社区版)。
即使出现某种性能问题,我认为瓶颈发生的位置——无论是 API、沙盒、插件守护进程、CPU、内存、数据库连接池等——都会因应用程序的构建方式而有很大差异。
由于很难用强有力的证据来计算这些点,我认为更现实的做法是引入资源监控,然后根据需要考虑垂直或水平扩展。