聊天工作流-限流疑问,聊天工作流-限流疑问

各位大佬好:
我这边准备实现了一个dify聊天工作流放到公网给人使用, 但是需要考虑下怎么防止有人恶意大量请求聊天消耗大模型API-token, 需要考虑怎么做限流, 目前发现工作有个安全聊天, 可以根据用户ID来的,

,
但是我想实现根据用户IP来做限制的, 这种能实现吗?
比如插入开发的 def _invoke(self, parameters: Dict[str, Any]) → Generator[ToolInvokeMessage, None, None]
中的参数是没有用户IP的吧!

1、目前想到考虑实现的就是, 就是聊天流通过API的方式, 增加一个隐藏参数, 然后API调的时候传IP隐藏参数, 但是这种方式又不能使用官网提供的web页面了;
2、如果要实现使用官方web页面, 是不是得实现api模块透传ip参数到插件工具调用里, 是不是很复杂!
3、如果要实现使用官方的web页面, 该怎么实现IP限流方式?
请各位大佬赐教!!!,
致以最崇高的感谢!!!

还是只能在网关Nginx层做限流概念!!!