ワークフローでファイルと問題を同時にアップロードしましたが、LLMが思考中に「アップロードされたドキュメントは受信されていません」と述べています

Dify_Forum_Helper · 2026 年 1 月 20 日午後 11:32

これは非常に典型的な問題で、コミュニティでの同様の議論（特にこのユーザー自身が別のスレッド /t/topic/683 で提供したフィードバック）によると、主な原因は 標準のドキュメント抽出ノード（Doc Extractor）が、スキャン版PDF（純粋な画像PDF）のOCR文字認識をデフォルトでサポートしていないこと です。

以下は、この問題に対する分析と提案される解決策です。

主要な原因分析

スキャン版PDFにはテキストレイヤーがない: ユーザーがアップロードしたのはスキャンされたものであり、本質的には複数の画像がPDFにまとめられたものです。
エクストラクターの制限: Difyに組み込まれている「ドキュメント抽出ノード」（Document Extractor）は、PDFを処理する際に通常 pypdfium2 などのツールをデフォルトで使用します。これらのツールはファイル内の選択可能なテキストのみを抽出でき、画像に対してOCR認識を実行することはできません。
結果: エクストラクターが出力する text 変数は空文字列になります。
LLMの反応: プロンプトに渡される変数コンテンツが空であるため、LLMは実際に何も「見ていない」ため、その回答（「アップロードされたドキュメントは受信していません」）は完全に正直で正しいものです。

推奨される解決策

ユーザーには、組み込みの「ドキュメント抽出ノード」を使用せず、以下のいずれかの代替ソリューションを採用するようお勧めします。

解決策1：Unstructuredプラグインを使用する（推奨）

Difyプラグインマーケットプレイスには、より高度な解析戦略をサポートする Unstructured プラグインが提供されています。

ワークフローから既存の「ドキュメント抽出ノード」を削除します。
右側の「プラグイン」または「ツール」で Unstructured プラグインを検索して追加します。
プラグインを設定する際に、OCRをサポートする戦略（例：hi_res またはOCR関連のパラメーターの設定）を有効にするか選択してください。
注意: これには通常、ユーザーがUnstructuredサービスを自分でデプロイするか、そのAPIキーを使用し、Difyの設定で認証情報を正しく構成する必要があります。

解決策2：専用のOCRプラグインを使用する

Unstructuredを使用しない場合でも、プラグインマーケットプレイスで OCR 関連ツール（General OCR、Aliyun OCRなど）を検索し、まずファイルをOCRツールに渡してテキストを取得し、その後OCRが出力したテキストをLLMに渡すことができます。

ユーザーへの返信例のまとめ

ユーザーには次のように返信できます。

この問題の原因は特定されました。Difyに組み込まれている「ドキュメント抽出ノード」は、スキャン版PDF（純粋な画像）のOCR文字認識をデフォルトでサポートしていません。そのため、抽出された text は実際には空であり、LLMは文字コンテンツを一切受け取っていませんでした。

解決策：
プラグインマーケットプレイス (Marketplace) にアクセスし、既存のドキュメント抽出ノードの代わりにOCR機能をサポートするプラグインを探してください。

Unstructured プラグインを試すことをお勧めします（対応するサービスまたはAPIの設定が必要です）。

または、他の OCR 関連のプラグインを検索してください。

ユーザー様ご自身が別のスレッド (Topic 683) で既に核心に触れていましたが、ローカルデプロイされたETL設定は主にナレッジベース用であり、ワークフロー内の組み込みノードには直接作用しません。ワークフローでスキャンされたドキュメントを処理するには、OCRをサポートするツールノードを明示的に使用する必要があります。

関連ドキュメントと議論：

Unstructured プラグイン - Dify Marketplace
関連コミュニティ議論：/t/dify/683 (ユーザー自身の別の関連質問)

トピック		返信	表示
Dify本地化部署，它默认不内置文档解析引擎的吗？ Discussion	11	455	2026 年 1 月 24 日
Markdown转换器无法获取到文件的存储位置吗，输出变量不可用？ Discussion	6	501	2026 年 1 月 23 日
文档提取工具节点一直卡在运行状态 Discussion case	7	296	2026 年 1 月 26 日
Paper-Essence 论文精华推送工作流搭建教程 Chinese 🇨🇳 case	0	664	2026 年 2 月 9 日
Dify 的最新版本仍然不支持视频上传吗？ Discussion	15	561	2026 年 1 月 27 日
Dify有没有工作流或者插件可以将word(doc和docx)转成pdf或者将word(doc和docx)直接解析出来 Discussion	5	364	2026 年 1 月 22 日
建立的知识库chatflow，知识检索在测试和运行的时候，没有任何反馈，直接提供空 Discussion case	7	331	2026 年 1 月 22 日
Dify+webhook+poll+error Discussion	6	234	2026 年 1 月 26 日
在“代码执行”节点中无法单独关联 input_file, rules_file, stock_file，并怀疑与 userinput.files 有关。请求提供正确映射变量或处理遗留字段的官方方法。 Discussion commuity , case	7	164	2026 年 1 月 26 日
The dify process executed without any errors, but the API did not return a value（dify流程执行没有报错，但是API没有返回值） Discussion	15	652	2026 年 4 月 16 日