dify(Version 1.10.1) 通过api上传pptx文件到流水线知识库报错

dify(版本 1.10.1)通过知识库 API 上传 pptx 文件到流水线知识库时报错 invalid_param,但 message 为空。

调用接口:https://api.dify.ai/v1/datasets/{dataset_id}/document/create-by-file

传递的参数 data:

{
    "doc_form":"hierarchical_model",
    "indexing_technique":"high_quality",
    "process_rule": {
        "mode":"hierarchical",
        "rules": {
            "pre_processing_rules": [
                {
                    "id":"remove_extra_spaces",
                    "enabled": true
                }
            ],
            "segmentation": {"max_tokens": 1000, "separator": "\n\n", "chunk_overlap": 0},
            "parent_mode":"paragraph",
            "subchunk_segmentation": {
                "separator":"\n",
                "max_tokens": 256,
                "chunk_overlap":0
            }
        }
    }
}

file:pptx 文件

返回信息:

{
    "code": "invalid_param",
    "message": "",
    "status": 400
}

我使用以上方式上传 docx 等文件时没有问题,上传 pptx 格式的文件返回 invalid_param,但 message 为空,导致我不知道具体遇到了什么问题,尝试各种方法修改参数都无法解决。

api上传接口不支持pptx。

可能你会好奇,流水线中的数据集已经定义了支持pptx格式,为什么接口不支持。

经过我个人测试发现,api接口上传知识库文档时并没有走流水线的流程。

我现在也是这个问题,api上传文档不走pipeline,这个现在有什么好的解决方法嘛。