LLMノードはどのようにマルチモーダル入力をサポートしますか？

andrew · 2025 年 12 月 13 日午前 8:31

doubao-seed-1-6 または qwen3-omni-flash を使用する場合、image_url または video_url を渡す必要があります。LLM ノードでどのように実装すればよいですか？

page · 2025 年 12 月 26 日午前 3:04

image_urlに対してLLMを接続する方法について、私の実装方法を以下に示します（より多くの共有や議論を歓迎します）：

「HTTPリクエスト」ノードを追加
GETリクエストを使って image_url を呼び出し、出力結果として files のファイルリストを取得する。
「リスト操作」ノードを追加
files のファイルリストを入力として、出力ファイル first_record を取得する。
「LLM」ノードを追加
これで、前のノードのファイルを参照できるようになる。

注意：最初のHTTPリクエストで取得できる画像は、拡張子がjpg/png/jpegなどであるものの、実際にはgif形式のものがある可能性があるため、LLMがエラーを出すのを防ぐために、事前にif判断を行う必要がある。

keyleaf · 2025 年 12 月 30 日午前 6:38

andrew · 2026 年 1 月 9 日午前 7:34

少し面倒ですね。私は現在、LLMの代わりにHTTPノードを使用しています。下の返信を見ると、LLMノードがドキュメント入力をサポートしているようです。

andrew · 2026 年 1 月 9 日午前 7:35

どのバージョンをお使いですか？私は1.10.1を使用していますが、ドキュメント入力オプションがありません。

keyleaf · 2026 年 1 月 12 日午前 1:00

自己参照の可視化部分のロジックを変更し、documentのモデルに対して対応する設定を追加しました。

page · 2026 年 1 月 16 日午前 7:51

実装方法はいくつかあります。私の方法は、まずHTTPリクエストでファイルを解析し、その後LLM-VLモデルとプロンプトを組み合わせて画像の内容を抽出するというものです。下の皆さんは、その画像に対応するモデルを使って直接抽出する方法を試してみてください。どちらの方法も試してみることができ、モデルのコストを考慮して自分に合った方法を選んでください。

トピック		返信	表示
使用豆包视觉模型doubao-seed-1.6-vision，在LLM节点无法选择【视觉】，模型管理界面也没有视觉选项 Discussion	1	250	2025 年 11 月 22 日
有没有方法可以将2张图片拼接成一张图片后，输入LLM的视觉中（以file等可以输入的类型） Discussion	0	69	2025 年 12 月 31 日
如何将用户上传的文件放入知识库？ Discussion	0	68	2026 年 1 月 23 日
Llm归纳后的文档写入到知识库 Discussion	2	143	2026 年 3 月 27 日
Dify 的最新版本仍然不支持视频上传吗？ Discussion	15	557	2026 年 1 月 27 日
Dify是不是只能发挥模型的文本能力？ Discussion readme , commuity , case	3	156	2026 年 1 月 18 日
LLM Node – Using Language Models in Workflows English 🇬🇧 ai , course-beginner	0	132	2026 年 1 月 28 日
Dify chatflow 最后的直接回复节点引用了开始节点的files Discussion	1	66	2026 年 1 月 13 日
大模型的上下文不能接收Array[Object]类型吗？ Discussion	1	82	2026 年 2 月 4 日
Llm节点同时连接两个知识库时，上下文只能选择一个知识库结果吗？ Discussion	0	110	2026 年 1 月 4 日

LLMノードはどのようにマルチモーダル入力をサポートしますか？

関連トピック