过去三十年中,传统网络搜索的基本机制始终未变:搜索引擎依据相关性和权威性呈现十条左右的结果列表。然而,大型语言模型(LLM)的崛起正推动搜索从“结果排序”转向“答案生成”。德国鲁尔大学与马克斯普朗克研究所的最新研究系统比较了谷歌传统搜索与四种生成式搜索引擎(Google AI Overview、Gemini、GPT-4o Search、GPT-4o Tool),涵盖政治、科学、商品与新闻等六大领域,揭示出信息来源、知识依赖与内容结构的深刻变革。
研究显示,生成式搜索引擎在信息来源广度上显著超过传统搜索。以Google AI Overview(AIO)为例,其平均有53%的信息来源不在传统搜索前十名结果中,27%甚至不在前一百名。AIO在生成答案时平均调用8.6个网页,而GPT-4o Tool仅调用0.4个网页,显示不同模型在外部信息依赖程度上的极大差异。即便如此,GPT-Tool仍能覆盖全部主题中71%的概念,表明即便减少检索数量,主题完整性未显著下降。
来源结构也展现出系统性差别。传统搜索结果中89%的网站来自全球访问量前一百万的域名,而GPT类模型仅为81%。生成式引擎常引用排名较低、主流度较弱的域名,其信息多样性与新颖度高于传统结果。同时,它们在网站类型上更倾向引用企业网站与百科类内容,而社交媒体与论坛类来源显著减少,呈现更“专业化”的信息面貌。
在内容维度上,生成式搜索的输出从“列表”转为“叙事”。AIO平均生成1656字符的答案,Gemini更长达2500字符,而GPT-Tool仅约1000字符。研究利用LLM主题识别模型(LLooM)分析发现,尽管总体主题覆盖度相近(传统搜索为0.78,GPT-Search为0.78,Gemini为0.77),但不同系统呈现的概念集合重叠度低,信息呈“多极分化”。在歧义性强的查询(如同名人物或多义词)中,传统搜索仍优于生成式引擎,前者对模糊问题的主题覆盖达67%,后者则降至48%。
时间敏感性是另一关键差异。面对“2025艾美奖获奖名单”此类实时话题,Google AIO几乎不触发生成(仅3%),而依赖外部搜索的GPT-Search与Gemini表现更佳,主题覆盖率分别为72%与66%。反之,主要依赖模型内部知识的GPT-Tool因缺乏时效信息,在16%的案例中出现理解偏差或事实错误。
总体来看,生成式搜索以更广的来源、更高的概念压缩度和更连贯的叙事结构,重塑了用户与信息的交互方式。但其内部知识依赖与来源不透明性,可能带来观点偏移与事实模糊的风险。未来的搜索评价体系需从“排名精度”转向“内容综合度”“信息多样性”与“时间敏感性”的多维指标,才能准确衡量AI时代的信息检索质量。趋势上,搜索正从“找信息”走向“整合知识”,而如何在高效与多元之间取得平衡,将决定下一代搜索引擎的公信力与认知影响力。

文档链接将分享到199IT知识星球,扫描下面二维码即可查阅!
更多阅读:
