gemini的AB测试:版本2.5与3的比较分析
gemini目前似乎仍在进行AB测试,比较的是版本2.5和版本3。用户在参与测试时,观察到两个版本的风格存在明显差异:版本2.5显得较为谄媚,而版本3则倾向于结尾追问。此外,版本2.5的思考时间明显长于版本3,根据在aistudio聊天框中的token量预估,版本2.5的token量为2200,而版本3为1200。尽管选择了版本2.5,用户在更多选项中看到的模型仍然是3pro。
gemini目前似乎仍在进行AB测试,比较的是版本2.5和版本3。用户在参与测试时,观察到两个版本的风格存在明显差异:版本2.5显得较为谄媚,而版本3则倾向于结尾追问。此外,版本2.5的思考时间明显长于版本3,根据在aistudio聊天框中的token量预估,版本2.5的token量为2200,而版本3为1200。尽管选择了版本2.5,用户在更多选项中看到的模型仍然是3pro。
评论已关闭