在比较不同人工智能模型处理问题的能力时,我们观察了GPT 5.2 Pro、Claude Opus 4.5和Gemini 3 Pro在解决同一数学问题时的表现。GPT 5.2 Pro在经过一次提示后,花费了133分钟来思考并给出了正确答案,平均每次思考需要70分钟。这表明GPT 5.2 Pro在处理复杂问题时具有强大的持续思考能力。Claude Opus 4.5在尝试解决问题时,未能给出正确答案,并且在重新思考后自动关闭了回复,没有输出结果。这反映了Claude Opus 4.5在处理复杂问题时可能存在局限性。Gemini 3 Pro在尝试解决问题时同样未能给出正确答案。这些结果揭示了不同AI模型在处理复杂问题时的不同表现,GPT 5.2 Pro在持续思考和解决问题的能力上表现出了优势。

标签: none

评论已关闭