一篇发表在Arxiv上的论文《Real Money, Fake Models》揭露了市场上第三方“暗影API”的掉包问题。研究发现,45.83%的API端点未通过指纹测试,意味着用户可能在使用GPT-5时,实际上后台运行的是GLM-4或DeepSeek-V3等模型。此外,一些所谓的“思维模型”如DeepSeek-Reasoner在代理中被替换为普通的Chat模型,导致性能大幅下降。论文还总结了三种经济收割套路:信息溢价、折扣替换和倒卖加价。更令人担忧的是,有187篇学术论文(包括ACL、CVPR顶会)基于这些不可靠的暗影API进行实验,其研究结论的可靠性受到质疑。论文提出了几种识破这些暗影API的手段,包括LLMmap指纹识别、MET统计测试和元数据分析。这些发现对于依赖这些API进行研究和开发的用户来说,无疑是一个警钟。

标签: none

评论已关闭