自己ホスト型Difyワークフローの同時チャットユーザー数の推定

Difyの1つのWorkflowが同時にサポートできる会話の数についてお尋ねしたいと思います。具体的には、何人のユーザーが同時にチャットできるのかです。各Workflowには「最大同時リクエスト数」の設定があることに気づきましたが、セルフホスト環境では実際の制限はハードウェアに依存すると理解しています。

Difyの実行専用のVM(4コア、8GB RAM)が提供されていると仮定した場合、何人のユーザーが同時にチャットできるでしょうか?私のWorkflowはRAGやベクターデータベースを使用していませんが、比較的長いWorkflow(約25ノード)です。各メッセージの出力には約4〜8秒かかります。

私の知る限り、パフォーマンスに関する明確なガイドラインは公開されていません(特にコミュニティエディションの場合)。

何らかのパフォーマンス問題が発生したとしても、ボトルネックがAPI、サンドボックス、プラグインデーモン、CPU、メモリ、データベース接続プールなど、どの部分で生じるかは、アプリケーションの構築方法によって大きく異なります。

これらのポイントを強力な根拠に基づいて計算するのは困難であるため、リソース監視を導入し、必要に応じて垂直または水平スケーリングを検討する方が現実的だと考えます。