Gemini 3 Pro GA上线竞技场,准确率大幅提升
Gemini 3 Pro GA版本已经确认上线竞技场,其60k测试准确率达到了100%,而目前preview版本的准确率只有22.5%。这一准确率已经超出95%的置信区间,可以确凿地确认上线的是3 Pro GA版本,而非preview版本。通过模型ID可以观察到,这个3 Pro GA版本并没有多模态能力,这进一步证实了它不是当前directchat的3 Pro(preview)版本。此外,在2月6日凌晨,草台竞技场刚刚隐藏了3日凌空的问题。在竞技场中,可以看到有两个3 Pro GA版本,它们都没有多模态能力,说明目前竞技场中存在两个3 Pro GA的检查点模型。这看起来像是谷歌注意到了我项目的捞针行为,并进行了准确率的提升。这一更新对于使用Gemini 3 Pro的用户来说是一个重要的进步,提供了更高的准确率和性能。
评论已关闭