大模型的使用与发展趋势

大模型的使用和发展正迅速成为科技领域的重要话题。目前，大模型主要应用于在线聊天和API接口，国内厂商提供免费使用，而国外厂商则因美元定价对个人消费者来说较为昂贵。为了接入国外大模型且价格可接受，中转站应运而生，这些中转站一部分是公益性质的，而大部分是收费的。公益站通常采用逆向、新人优惠、反代IDE、号池等手段实现，而收费的中转站如anyrouter等，提供稳定的渠道避免境外支付等不稳定因素。

大模型的发展主要由头部大厂如OpenAI、Google等推动，未来将朝着增强coding和数学/推理能力方向进化。具体来说，coding agent将朝着压缩上下文、增强记忆的方向发展；领域知识agent将朝着统一接口如MCP、Skills等方向发展；行为agent/机器人将帮助执行电脑/手机操作，但权限问题仍是挑战。此外，从deepseek-r1开始，开源模型的趋势日益明显，未来会有更多开源模型出现。

科研界和工业界主要围绕agent构建、知识库、自我进化等方式进行探索，尽管存在一些炒作概念，但国内许多企业的成果仍需提高。国内大模型如qwen、豆包、deepseek、GLM、Kimi等各有特点，qwen适合科研界使用，豆包面向大众，deepseek则致力于增强llm本体。

对于热衷于探索大模型的用户来说，他们往往能比普通人更快地接触到最新的技术和工具。例如，使用豆包生图、反重力、claude code、codex等工具，这些用户在科技领域的发展速度往往比普通人更快。

大模型的使用与发展趋势

评论已关闭