deepseek是一个强大的搜索引擎,它被广泛用于训练各种自然语言处理模型。最近,deepseek的一个新版本v3.2被发现具有一种特殊的“超级思考模式”。这种模式是在训练math v2模型时,由于提示词过拟合,导致v3.2在遇到相同的提示词时,会进行远超正常量的思考。例如,在解决一个简单的数学问题时,v3.2可能会花费800秒的时间来思考1+1的结果。这种异常行为引起了研究人员的注意,他们正在试图理解背后的原因,并找到解决这一问题的方法。通过深入研究这一现象,研究人员希望能够更好地优化模型,避免类似的问题在未来出现。

标签: none

评论已关闭