Mimo-V2-Flash 在世界知识测试中取得了20.6%的准确率,这一成绩与ACG-SimpleQA数据集进行了对比测试。ACG-SimpleQA是一个专门针对中文二次元领域(包括动画、漫画和游戏)的客观知识问答数据集。在这次测试中,从数据集中随机选取了4000条数据进行评估,测试方法与SimpleQA保持一致。Mimo-V2-Flash的表现水平被认为与qwen3-235b相当。这次测试的数据和结果来源于类脑项目,并且已经获得了作者的许可。测试结果的具体图表和更多讨论可以在的论坛上找到,链接为:[](https:///t/topic/1325549)。更多详情请参考: - (作者: gungun)。请注意,由于媒体链接无效,无法直接查看测试结果的图片。

标签: none

评论已关闭