Grok 4.20 模型的新发现与改进分析
Grok 4.20 模型在最新版本中展现出了显著的改进,尤其是幻觉现象的减少。尽管如此,该模型在视觉处理和编程能力方面仍存在不足。此外,网页版的输入限制在表面上显示为390K,但实际测试发现限制为256K。目前Beta版本的Grok采用的是Small/A8变体,据分析大约拥有500B的参数量,且激活参数更少,这使得它在推理效率上更为出色。在处理日常问题时,Grok能够快速响应,对于复杂问题则能进行长时间的深入思考。关于Grok的四个角色,它们并非完全独立的模型,而是共享大部分权重,在单次推理中同时扮演四个角色,最终由Grok这个agent输出内容。这种设计大大降低了成本。Xai团队提出的“Rapid Learning / Continuous Learning”架构允许模型通过聊天记录和数据进行训练,实现每日小更新和每周大更新。Grok在搜索联网能力方面表现突出,这得益于Xai的爬虫优化和设计。此外,Grok支持多种工具,并在一致性和上下文召回题目上表现出色,例如DeepSeek在不开思考的情况下无法正确处理某些图像和数字任务,而Grok则能轻松应对。这些测试表明,Grok在处理复杂任务时具有巨大潜力,尽管其联网能力有时会带来挑战。
评论已关闭