智能客服助手怎么缩短大模型的深度思考时间？

felix.chang · 2026 年 4 月 14 日午前 10:55

Dify使用的Qwen3.5:27b大模型做智能客服助手，知识库检索传过来的数据，大模型需要50秒的时间才能产生结果，显示深度检索的过程信息，这个怎么优化呢？