智能客服助手怎么缩短大模型的深度思考时间?

Dify使用的Qwen3.5:27b大模型做智能客服助手,知识库检索传过来的数据,大模型需要50秒的时间才能产生结果,显示深度检索的过程信息,这个怎么优化呢?