在使用 Google 的 Gemini API 体验 gemma4 模型时,用户可能会遇到一个常见的限制问题,即在使用 hermes 发送请求时可能会触发 TPM(Token Processing Limits)限制。Gemini API 的结算政策显示,尽管第一层级中 gemma4 模型每分钟只有 16,000 token 的限额,但在免费层级中,gemma4 模型每分钟的 token 使用却不受限制。这一政策可能让许多用户感到意外,因为通常我们会认为免费服务会有更多的限制。因此,如果用户想要体验 gemma4 模型,建议创建项目时选择使用免费 tier,而无需设置结算层级。这样的设置可以避免不必要的限制,同时也能充分利用模型的性能。用户在体验过程中应当注意这一政策,以避免触发限制,影响使用体验。

标签: none

评论已关闭