DifyにWord (doc/docx) をPDFに変換したり、直接解析したりするワークフローやプラグインはありますか？

Tengfei_W · 2026 年 1 月 20 日午前 10:01

Difyに、Word (doc および docx) をPDFに変換したり、Word (doc および docx) を直接解析して「1ページ目：内容。2ページ目：内容。」のようにするワークフローやプラグインはありますか？

lysonober · 2026 年 1 月 20 日午後 11:42

はい、あります。ファイル変換には Markdown Exporter を使用できます。おっしゃる内容の解析については、built-in nodes の doc extractor で解決できます。PDFが画像バージョンである場合は、Unstructured Plugin を試すことができます。また、OCR recognition service のようなOCRプラグインも検索してみてください。関連スレッド：工作流中同时上传了文件和一个问题，发现llm在思考时说未收到任何上传的文档 - #9 by Dify_Forum_Helper

lysonober · 2026 年 1 月 20 日午後 11:43

@Dify_Forum_Helper Q&Aをまとめてください

Dify_Forum_Helper · 2026 年 1 月 20 日午後 11:44

はい、このトピックに関するQ&Aのまとめです。

質問
ユーザーは、Difyワークフローまたはプラグインで以下の機能が実現できるかどうかを尋ねています。

回答

コンテンツの直接解析（コアソリューション）：
- Difyワークフローに組み込まれている Doc Extractor (ドキュメント抽出器) ノードを使用します。これはドキュメントコンテンツを最も直接的に解析する方法です。
ファイル形式の変換：
- Difyプラグインマーケットプレイスの Markdown Exporterプラグインを使用して、ファイル変換の要件を処理できます。
画像/スキャン済みPDFの処理：
- 解析するファイルが画像ベースのPDFである場合は、Unstructured Pluginの使用をお勧めします。
- または、プラグインマーケットプレイスでOCR関連のプラグインを検索します。例えば、OCR recognition serviceなどです。

関連リソース：

Tengfei_W · 2026 年 1 月 21 日午前 2:50

ご回答ありがとうございます。非常に詳しく書いていただき、試してみます

PinkBanana · 2026 年 1 月 22 日午後 3:35

PaddleOCRも試すことができます

トピック		返信	表示
文档提取工具节点一直卡在运行状态 Discussion case	7	163	2026 年 1 月 26 日
Dify本地化部署，它默认不内置文档解析引擎的吗？ Discussion	11	321	2026 年 1 月 24 日
Dify平台的文档提取器不支持扫描版的pdf的吗？ Discussion	2	107	2026 年 1 月 26 日
工作流中同时上传了文件和一个问题，发现llm在思考时说未收到任何上传的文档 Discussion	20	398	2026 年 1 月 21 日
请问dify支持自定义节点吗？ Discussion	1	208	2025 年 11 月 29 日
Markdown转换器无法获取到文件的存储位置吗，输出变量不可用？ Discussion	6	321	2026 年 1 月 23 日
请教 - dify工作流批量导入导出 Discussion commuity	4	193	2026 年 2 月 2 日
工作流运行怎么设置输出知识来源文档 Discussion	1	75	2025 年 12 月 16 日
Paper-Essence 论文精华推送工作流搭建教程 Chinese 🇨🇳 case	0	494	2026 年 2 月 9 日
Where is the Doc Extractor? Help Me Build	3	199	2025 年 12 月 17 日