与dify_helper讨论出来的问题

与官方沟通:这是很典型的「插件层报错」

从你提供的日志看,这是一个可以、也应该报给官方/插件维护者的问题,建议你整理如下信息提交:

  1. 环境信息:

    • Dify 版本:1.11.4

    • 部署方式:Docker / 自建

    • Jina API Key 已配置且前端显示 connected

  2. 复现步骤(越简单越好):

    • 使用官方的「知识库流水线」模板;

    • 在网站数据源节点中选择 Jina Reader;

    • 输入任意 URL(如 https://example.com);

    • 运行后报错。

  3. 错误信息(你刚才贴的这段就很关键,可以原样带上):

    Error in stream response for plugin {'code': -500, 'message': '{"message":"{\\"args\\":{},\\"error_type\\":\\"ValueError\\",\\"message\\":\\"An error occurred: Failed to crawl\\"}","error_type":"PluginInvokeError","args":null}', 'data': None}
    Error during website crawl.
    Traceback (most recent call last):
      File "/app/api/services/rag_pipeline/rag_pipeline.py", line 631, in run_datasource_workflow_node
        for website_crawl_message in website_crawl_result:
      File "/app/api/core/plugin/impl/base.py", line 306, in _request_with_plugin_daemon_response_stream
        self._handle_plugin_daemon_error(error.error_type, error.message)
      File "/app/api/core/plugin/impl/base.py", line 348, in _handle_plugin_daemon_error
        raise PluginInvokeError(description=message)
    core.plugin.impl.exc.PluginInvokeError: req_id: 5424c10501 PluginInvokeError: {"args":{},"error_type":"ValueError","message":"An error occurred: Failed to crawl"}
    
    
  4. 补充说明:

    • 容器内通过 curl 测试外网和 jina.ai 都是 200;

    • 同一环境下其他网络相关功能正常。

这些信息足够让维护者判断:

  • 是 Jina Web Reader 插件那一端(插件 daemon / 调用 Jina 的那层)有 bug;

  • 还是 Jina 最近变更了接口/权限,导致抓取逻辑统一抛出 Failed to crawl