刷榜式AI:高分≠高能,蒸馏模型能走多远?
在人工智能领域,刷榜现象已成为一个不容忽视的问题。Anthropic的创始人Dario Amodei对此提出了尖锐的批评。他指出,许多中国的开源AI模型,虽然能在公开测试中表现出色,获得高分数,但在面对真实世界的问题时却表现不佳。这些模型被形容为‘考试型选手’,它们专门为跑分而设计,而非解决实际问题。Amodei认为,这些模型的技术根源很多是从美国大实验室的模型中‘蒸馏’出来的,这种做法本质上是为了追求高分,而非真正的智能。他打了一个比方,AI就像雇员,你是要世界第一的程序员,还是要排名第一万的?能力的天壤之别,任何一个老板都懂。真正顶级的AI,认知能力最强的那个,才是唯一的赢家。价格和形式,在绝对的聪明面前,都不重要。刷分和模仿,能做出最聪明的AI吗?这条路,到底能走多远?
这种刷榜现象在科技产品领域也屡见不鲜。例如,极客湾爆出的国产手机送测机都是特调机,都是为了刷分,而消费者最终购买到的手机与送测的不一样。这种现象不仅存在于AI领域,也存在于其他科技产品中,它反映了一种急功近利的心态,即追求表面上的高分和排名,而忽视了真正的技术进步和用户体验。这种做法不仅对消费者不利,也阻碍了科技行业的健康发展。因此,我们需要更加重视AI和其他科技产品的实际应用价值,而非仅仅追求表面的分数和排名。
评论已关闭