Gemma 4-26B-A4B模型在3090显卡上的性能测试

用户分享了自己使用NVIDIA 3090显卡测试Gemma 4模型（26B-A4B版本）的经历。由于3090显卡存在显存限制的问题，用户将显卡功率限制在78%，温度也控制在78度以内，成功将26B-A4B模型完全加载进显存。实际测试中，该模型能够达到75TPS（每秒事务处理量），速度快时甚至接近100TPS。更令人惊喜的是，该模型在回答问题的质量上也非常令人满意。用户还测试了网页翻译功能，发现其速度和翻译质量都很高。基于这些优异的表现，用户建议从Qwen3.5模型切换到Gemma 4模型。该讨论可以在(https:///t/topic/1889002)上找到更多详情。

Gemma 4-26B-A4B模型在3090显卡上的性能测试

评论已关闭