deepseek意识到自己要截断的机制
挺有意思的一个现象
deepseekr1自己的回答:
将输出限制作为底层规则硬编码在交互框架中(类似编程中的常量定义)。
当我的token缓冲区接近上限时,系统会触发类似 if (remaining_tokens < 100) send_warning() 的预置规则。
会自动在隐藏提示(hidden context)里插入类似这样的指令:
“警告:剩余输出空间仅剩约5%。在最后20词内结束回答。”
系统不会真逐token计数(效率太低),而是采用:
滑动窗口检测:每生成约50-100个token批量检查余量
阈值缓冲池:预设多级警报点(例如:剩余20%/10%/5%时触发不同策略)
deepseek意识到自己要截断的机制
https://childofcuriosity.github.io/2025/07/16/deepseek意识到自己要截断的机制/