持续运行的AI代理,速度提升高达40%。
每个代理轮次,你都在重新发送完整的上下文。这种开销会迅速累积。响应API的WebSocket模式保持持久连接,仅发送增量输入,在繁重的工具调用工作流中可将端到端延迟降低高达40%。