Grok 4.20 模型的新发现与改进分析

Grok 4.20 模型在最新版本中展现出了显著的改进，尤其是幻觉现象的减少。尽管如此，该模型在视觉处理和编程能力方面仍存在不足。此外，网页版的输入限制在表面上显示为390K，但实际测试发现限制为256K。目前Beta版本的Grok采用的是Small/A8变体，据分析大约拥有500B的参数量，且激活参数更少，这使得它在推理效率上更为出色。在处理日常问题时，Grok能够快速响应，对于复杂问题则能进行长时间的深入思考。关于Grok的四个角色，它们并非完全独立的模型，而是共享大部分权重，在单次推理中同时扮演四个角色，最终由Grok这个agent输出内容。这种设计大大降低了成本。Xai团队提出的“Rapid Learning / Continuous Learning”架构允许模型通过聊天记录和数据进行训练，实现每日小更新和每周大更新。Grok在搜索联网能力方面表现突出，这得益于Xai的爬虫优化和设计。此外，Grok支持多种工具，并在一致性和上下文召回题目上表现出色，例如DeepSeek在不开思考的情况下无法正确处理某些图像和数字任务，而Grok则能轻松应对。这些测试表明，Grok在处理复杂任务时具有巨大潜力，尽管其联网能力有时会带来挑战。

Grok 4.20 模型的新发现与改进分析

评论已关闭