OpenAI企鹅家族全新模型矩阵的泄露,带来了令人震惊的内部信息。这次泄露揭示了四档推理预算的全新模型:旗舰Emperor512、中端Rockhopper64、轻量Macaroni16以及零推理Mumble0。这些模型旨在满足从云端到边缘的全场景需求。其中,Emperor512拥有高达512单位的推理预算,是现行模型的8-10倍,但端到端延迟却控制在80ms以内,实现了“零等待”对话体验。此外,四档预算对应四种延迟,从Macaroni的极速到Mumble彻底去推理,满足不同场景的需求。记忆搜索功能也将与这些模型一同上线,用户可以通过自然语言输入即时检索历史记忆。除了这些,OpenAI还可能推出Shallotpeat和Garlic两款新模型,分别针对推理性能和预训练知识密度进行优化。这些模型目前正在进行神秘测试,预示着AI领域的又一波革新。

标签: none

评论已关闭