Deepseek官网的联网搜索是否是一个agent系统?如何复刻?

Deep Research一直有几个痛点:

● 如何把问题拆分成搜索检索词
● 合适的搜索引擎
● 如何爬取网页内容
● 如何最终汇总(比如爬取的内容+汇总可能超过单个上下文窗口长度)

但是Deepseek官网的联网搜索,从去年年初刚上线就非常神奇:

● 动辄能搜到50+的网页内容
● 相对于通常其较短的输出,开网页搜索并提问复杂问题时,回答可以成为一个小Deepresearch

更不用说Deepseek V3.2已经可以多段网络搜索。

我看到开源的deep research方案,基本都用SERP+JINA/firecrawl这样的商业组合,非常贵——deepseek的api已经很便宜了,我觉得应该不是用商业化方案。

在我看来Deepseek内部必然有自己的搜索接口和爬虫,甚至可能还有rag技术(因为一次搜索到的内容太多了)

我很想知道如何复刻?

我真觉得deepseek官网的联网搜索方案是我目前见过的最好的了——又快又便宜,如果能自定义搜索接口那就完美了

1 post - 1 participant

via - (author: 欣 郁)

标签: none

评论已关闭