deepseek意识到自己要截断的机制

挺有意思的一个现象

deepseekr1自己的回答:

将输出限制作为​​底层规则硬编码​​在交互框架中(类似编程中的常量定义)。
当我的token缓冲区接近上限时,系统会触发类似 if (remaining_tokens < 100) send_warning() 的​​预置规则​​。
会自动在隐藏提示(hidden context)里插入类似这样的指令:
“警告:剩余输出空间仅剩约5%。在最后20词内结束回答。”
系统不会真逐token计数(效率太低),而是采用:
​​滑动窗口检测​​:每生成约50-100个token批量检查余量
​​阈值缓冲池​​:预设多级警报点(例如:剩余20%/10%/5%时触发不同策略)


deepseek意识到自己要截断的机制
https://childofcuriosity.github.io/2025/07/16/deepseek意识到自己要截断的机制/
Author
childofcuriosity
Posted on
July 16, 2025
Licensed under