大模型的使用与发展趋势
大模型的使用和发展正迅速成为科技领域的重要话题。目前,大模型主要应用于在线聊天和API接口,国内厂商提供免费使用,而国外厂商则因美元定价对个人消费者来说较为昂贵。为了接入国外大模型且价格可接受,中转站应运而生,这些中转站一部分是公益性质的,而大部分是收费的。公益站通常采用逆向、新人优惠、反代IDE、号池等手段实现,而收费的中转站如anyrouter等,提供稳定的渠道避免境外支付等不稳定因素。
大模型的发展主要由头部大厂如OpenAI、Google等推动,未来将朝着增强coding和数学/推理能力方向进化。具体来说,coding agent将朝着压缩上下文、增强记忆的方向发展;领域知识agent将朝着统一接口如MCP、Skills等方向发展;行为agent/机器人将帮助执行电脑/手机操作,但权限问题仍是挑战。此外,从deepseek-r1开始,开源模型的趋势日益明显,未来会有更多开源模型出现。
科研界和工业界主要围绕agent构建、知识库、自我进化等方式进行探索,尽管存在一些炒作概念,但国内许多企业的成果仍需提高。国内大模型如qwen、豆包、deepseek、GLM、Kimi等各有特点,qwen适合科研界使用,豆包面向大众,deepseek则致力于增强llm本体。
对于热衷于探索大模型的用户来说,他们往往能比普通人更快地接触到最新的技术和工具。例如,使用豆包生图、反重力、claude code、codex等工具,这些用户在科技领域的发展速度往往比普通人更快。
评论已关闭