Gemini 3.1 Pro 的强大思考能力
Gemini 3.1 Pro 确实强在其卓越的思考能力。以 ABC447G 为例,3 flash 无法思考出正解,而 3.1 Pro 给出了比官方解法还要简单的确定性做法。作者通过学习随机化做法,在 debug 的时候,发现 3.1 Pro 的注意力(洞察力)明显强于 3 系的两个模型,能发现隐蔽的漏洞。例如位掩码全集打错了一个字符,初始化的最小值(负无穷)不够小等问题。这显示了 3.1 Pro 在处理复杂问题和细节上的优势。
Gemini 3.1 Pro 确实强在其卓越的思考能力。以 ABC447G 为例,3 flash 无法思考出正解,而 3.1 Pro 给出了比官方解法还要简单的确定性做法。作者通过学习随机化做法,在 debug 的时候,发现 3.1 Pro 的注意力(洞察力)明显强于 3 系的两个模型,能发现隐蔽的漏洞。例如位掩码全集打错了一个字符,初始化的最小值(负无穷)不够小等问题。这显示了 3.1 Pro 在处理复杂问题和细节上的优势。
评论已关闭