Gemini 3 Pro 与 GPT-5/5.1 在搜索 Agent 下的表现对比分析

Gemini 3 Pro, GPT-5 和 GPT-5.1 在简单搜索 Agent 下的表现对比分析

在当前的技术环境中，人工智能模型的表现成为了业界关注的热点。本文将对比分析 Gemini 3 Pro、GPT-5 和 GPT-5.1 在一个简单的搜索 Agent 下的表现。测试环境设定为模型被提供两个工具：search_web 和 grep_page，分别用于互联网搜索和网页内容检索。三个模型均采用最佳调用实践，并在无系统提示词的情况下进行测试，以评估其裸模表现。

测试结果显示，Gemini 3 Pro 在搜索范围上表现有限，即使经过特别提示也未能改善，输出质量在三者中最低。GPT-5 的输出格式较为朴素，但其查阅大量信息的能力最强，总结的细致和系统程度最佳。GPT-5.1 则具有更风格化的输出格式，工具调用熟练，速度快，整体质量接近 GPT-5，但有时表现不稳定。

这一测试强调了不同模型在特定任务上的优势和局限性。Gemini 3 Pro 在搜索广度上表现不佳，而 GPT-5 和 GPT-5.1 在信息处理和输出质量上表现更优。未来，根据不同模型的特点，可能需要进行更完善的测试，以进一步了解它们在不同场景下的表现。

这一分析为技术选择和模型优化提供了参考，有助于开发者在实际应用中选择最合适的模型，以实现最佳性能。

Gemini 3 Pro 与 GPT-5/5.1 在搜索 Agent 下的表现对比分析

评论已关闭