豆包升级模型后,在处理逻辑题时表现不佳,超能模式专注于搜索而忽略了题目规则,思考模式也似乎没有正确理解规则。Gemini 3 Pro Preview 在经过两次纠错后成功解出了同一逻辑题。用户建议其他对模型表现感兴趣的人可以参考这一案例。文章中提供了更多细节的链接,以及相关图片链接,但图片似乎无效。此反馈可能对模型开发者提供改进方向,特别是在处理复杂逻辑任务时如何更好地结合搜索能力和规则理解。

标签: none

评论已关闭