知识库中相同文本块的不同相似度分数

您好,如果块内的文本相同,那么可以合理地预期它们将具有相同的向量。

我想了解一下您的环境。您使用的是 Dify Cloud,还是自托管 Dify?您使用的是哪个嵌入模型(embedding model)?如果您是自托管,您使用的是哪个 Dify 版本和哪个向量数据库?

此外,似乎另一个帖子表现出反直觉的行为。

由于我无法在我的环境中重现这个问题,您的向量数据库中的数据可能存在某种不一致。
您能否尝试从头开始创建一个新的知识库,上传相同文档,然后看看问题是否仍然存在?

1 个赞