gpt-oss-safeguard 技术报告结论的重新评估

在阅读了gpt-oss-safeguard的技术报告后，我发现其中某些部分的结论似乎过于乐观。报告中的图1显示，两个safeguard模型在性能上与原始版本相当，但在生产基准测试的某些类别上表现有所下降。然而，图2中的表格5和表格4显示，这两个模型仅在2个或2-3个类别上比原始版本稍好，这表明它们的表现并不如报告中所描述的那样优异。

报告前面提到，这些测试是在聊天设置下进行的，这也是他们不推荐的用法。尽管如此，我认为结论应该与图表相符，不能有误导性。因此，我建议对报告中的结论进行重新评估，以确保它们与提供的数据一致，避免产生幻觉式的误导。

gpt-oss-safeguard 技术报告结论的重新评估

评论已关闭