用户分享了自己使用NVIDIA 3090显卡测试Gemma 4模型(26B-A4B版本)的经历。由于3090显卡存在显存限制的问题,用户将显卡功率限制在78%,温度也控制在78度以内,成功将26B-A4B模型完全加载进显存。实际测试中,该模型能够达到75TPS(每秒事务处理量),速度快时甚至接近100TPS。更令人惊喜的是,该模型在回答问题的质量上也非常令人满意。用户还测试了网页翻译功能,发现其速度和翻译质量都很高。基于这些优异的表现,用户建议从Qwen3.5模型切换到Gemma 4模型。该讨论可以在(https:///t/topic/1889002)上找到更多详情。

标签: none

评论已关闭