新浪微博近日宣布开源其首个大模型VibeThinker-1.5B,这一模型仅包含15亿参数,却展示了惊人的智能水平。VibeThinker-1.5B通过微博AI研发人员提出的创新“频谱到信号原理”(SSP)方法训练,在多个高难度数学测试集上超越了参数量远超其自身的模型,如DeepSeek-R1-0120和MiniMax-M1。此外,VibeThinker-1.5B在编程算法题测试集LiveCodeBench v6中的表现也相当出色。该模型的后训练成本仅为8000美元,远低于其他大型模型的数十万美元。VibeThinker-1.5B的开源,为全球的中型企业及高校研究团队提供了高性价比的研发新路径,使得人人都可以训练最前沿的大模型。

标签: none

评论已关闭