私はnova-2-multimodal-embeddings-v1:0を使用してマルチモーダルRAGを構築しようとしています。
Dify Extractorを使用して、画像とテキストを含むPDFファイルを処理した際、テキスト情報のみを取得できました。
以下のドキュメントに基づくと、Dify ExtractorではなくDoc Extractorを使用する必要があると考えています:
https://docs.dify.ai/en/use-dify/knowledge/knowledge-pipeline/knowledge-pipeline-orchestration#doc-extractor
しかし、https://cloud.dify.ai/の環境でDoc Extractorを見つけることができません。
このデータ処理ツールはどこにありますか?


