gemini的AB测试：版本2.5与3的比较分析

gemini目前似乎仍在进行AB测试，比较的是版本2.5和版本3。用户在参与测试时，观察到两个版本的风格存在明显差异：版本2.5显得较为谄媚，而版本3则倾向于结尾追问。此外，版本2.5的思考时间明显长于版本3，根据在aistudio聊天框中的token量预估，版本2.5的token量为2200，而版本3为1200。尽管选择了版本2.5，用户在更多选项中看到的模型仍然是3pro。

gemini的AB测试：版本2.5与3的比较分析

评论已关闭