最近在使用Dify构建RAG问答的时候遇到了一些问题,就是在构建知识库的时候,当前的功能不能很好的处理PDF数据?如图所示,尽管当前的PDF片段是有这个数据的,我在进行召回测试的时候,还是没能召回对应的数据。遇见这种情况该怎么处理?是考虑自己先把数据进行清洗一遍,再使用dify构建知识库。还是说有更方便的方法进行处理?
原本切分是有切分除相关的内容的