Z.ai网页版GLM4.6模型在处理200K上下文时,首次输出需要耗费50秒的时间,并且没有出现思考的过程。然而,在第二次尝试中,当导入大约160K上下文的《三体》小说时,从发送到开始思考的时间缩短到了30秒,并且出现了思考过程。这表明模型在处理较大数据量时,首次响应时间较长,但随着数据的逐渐适应,响应时间有所减少,思考过程也得以展现。这一发现对于理解模型在处理大量信息时的性能表现具有重要意义。同时,这也提示我们,在应用此类模型时,可以考虑逐步增加数据量,以优化响应时间和提高思考的质量。

标签: none

评论已关闭