刷榜式AI：高分≠高能，蒸馏模型能走多远？

在人工智能领域，刷榜现象已成为一个不容忽视的问题。Anthropic的创始人Dario Amodei对此提出了尖锐的批评。他指出，许多中国的开源AI模型，虽然能在公开测试中表现出色，获得高分数，但在面对真实世界的问题时却表现不佳。这些模型被形容为‘考试型选手’，它们专门为跑分而设计，而非解决实际问题。Amodei认为，这些模型的技术根源很多是从美国大实验室的模型中‘蒸馏’出来的，这种做法本质上是为了追求高分，而非真正的智能。他打了一个比方，AI就像雇员，你是要世界第一的程序员，还是要排名第一万的？能力的天壤之别，任何一个老板都懂。真正顶级的AI，认知能力最强的那个，才是唯一的赢家。价格和形式，在绝对的聪明面前，都不重要。刷分和模仿，能做出最聪明的AI吗？这条路，到底能走多远？

这种刷榜现象在科技产品领域也屡见不鲜。例如，极客湾爆出的国产手机送测机都是特调机，都是为了刷分，而消费者最终购买到的手机与送测的不一样。这种现象不仅存在于AI领域，也存在于其他科技产品中，它反映了一种急功近利的心态，即追求表面上的高分和排名，而忽视了真正的技术进步和用户体验。这种做法不仅对消费者不利，也阻碍了科技行业的健康发展。因此，我们需要更加重视AI和其他科技产品的实际应用价值，而非仅仅追求表面的分数和排名。

刷榜式AI：高分≠高能，蒸馏模型能走多远？

评论已关闭