关于新Opus判别方法的新发现,LMArena测试结果显示,在多次测试中,使用thinking版本时才会输出稀后,而没有使用thinking版本时则输出稍后。在其他渠道的测试中也得到了相同的结果。尽管这种判断方法并不是非常稳定,目前所有输出“稀后”的案例都是Opus-thinking版本,但也存在输出“稍后”的情况。值得注意的是,之前的日本女名乱码测试结果相对准确。此外,使用官方api-key进行测试也证实了这一发现。

在论坛上,有人提出了一个关于Opus 4.5模型的最简单判断方法:直接提问,如果模型回复‘稀后’,则很可能是Opus 4.5;如果回复‘稍后’,则可能是其他模型。这一方法虽然简单,但并不是百分之百准确。此外,论坛还提供了多个相关链接,供用户进一步了解和讨论。

附上相关链接:

  1. [是否是opus4.5判断简单方法]1220949)
  2. 开发调优
  3. [Read full topic]1362150)

此外,还有一些图片资源提供了视觉上的辅助说明,帮助用户更好地理解这一新发现。

标签: none

评论已关闭