天工搜索，大模型时代的搜索拉开帷幕

搜索是一些公司永远的梦，也是一些公司永远的战场。

lessismore

Aug 25, 2023

搜索

TABLE OF CONTENTS

搜索引擎的几个机会

从搜索到服务的路径变化

从人问互联网到机器问互联网

搜索是下一代通用智能助手

昆仑万维 23 日发布了融入大语言模型的搜索引擎 —— 天工 AI 搜索，并开启内测申请，官方对产品的介绍和定义如下：

从寻找内容，到获取答案。传统搜索引擎基于关键词匹配，即根据用户输入的关键词识别检索范围，并匹配可能符合用户意图的海量信息。换言之，用户通过传统搜索获得的是无穷的可能性，因此只能将大量时间耗费在“寻找”和“筛选”上。而基于大模型能力的AI搜索是一种生成式搜索，用户可通过自然语言清晰表达自己的意图，并获得有效组织和提炼后的答案，不再为冗余信息浪费时间。如果说传统搜索引擎的体验，是人通过关键词来适应搜索引擎的工作方式，自然语言式交互则是第一次让搜索引擎以人性化的方式来适应人类。

从信息，到知识。传统搜索提供给用户的是海量的“信息”，AI搜索将第一次有能力为用户提供“知识”。基于大模型能力的AI搜索可以根据上下文语义与用户展开多轮次、深度的对话，从而实现对于复杂问题的深入研究。天工AI搜索的“追问”功能让用户可以就一个问题展开20轮次以上交互，以此展开深度探索。此外，大模型使得AI搜索具备了整合、提炼、串联信息的能力，因此AI搜索能更好地应对开放式问题，在处理知识类以及创意类搜索时，其体验与效率将远胜于传统搜索引擎。基于人类反馈强化学习（RLHF）进行训练的大语言模型，更进一步提升了AI搜索的答案对于人的价值。

从模糊到精确；从通用到个性。传统搜索引擎通过关键词识别匹配检索范围，却难以通过寥寥几个单词准确理解用户的意图。大模型赋能的AI搜索使意图识别成为可能，用户完全可以通过自然流畅的对话式交互来清晰表达自己的意图，从而获得精准、有效且个性化的答案。用户将第一次在搜索上获得“量身定做”和“千人千面”式体验。

从鱼龙混杂，到可追溯可信赖。传统搜索的痛点之一，在于不同来源的海量信息带来的大量冗余和信息不一致；与此同时，大语言模型的生成机制，也无法完全规避“一本正经地胡说八道”现象。天工AI搜索在所有回答中加入了信源索引，以此保障答案可追溯、可考证、可信赖。同时，用户可将每轮次的搜索结果留存在天工内，便于随时查阅回溯，也可一键分享给他人。

不管天工如何解读自己，一个不容忽视的事实是，搜索引擎还会只是搜索引擎吗？

搜索引擎的几个机会

搜索引擎的发展历史可以追溯到上世纪 90 年代。首个真正意义上的搜索引擎被认为是 1990 年推出的 Archie，用于搜索 FTP 服务器上的文件，而非 Web 。在此之后，中国的搜索引擎发展也取得了一系列重要的里程碑。

搜狐是最早参与网络信息分类导航的网站之一，于 1996 年 8 月成立。它于 1998 年 2 月推出了分类目录搜索引擎，相当于当年的中国版 Yahoo!。此后，搜狐努力在门户方向发展，并于 2000 年 7 月12 日在美国纳斯达克上市。

百度则是中国最大的中文搜索引擎。它于 1999 年底由李彦宏创立，开始致力于中国互联网和中文搜索引擎服务的发展。百度拥有一支由数万名研发工程师组成的顶尖技术团队，是目前国内搜索份额持续排名第一的服务提供商，十年前是这样，今天也依然是，但由于大模型的加持，未来搜索引擎还会有新的变化和机会。

从搜索到服务的路径变化

搜索引擎的发展经历了从单纯提供信息搜索服务到多样化服务平台的转变。除了提供普通的网络搜索功能外，搜索引擎不断向更加个性化、定制化的服务提供方向转变，由此也衍生出来了很多垂直服务，但在未来搜索引擎的进化会变得更加智能，由单纯的索引网页信息到变成直接为用户提供具体的服务，百度过去一直在推从搜索到服务的进化，未来会更具象也更有意义。

从人问互联网到机器问互联网

搜索这些年的产品形态，一直是用户在输入框里提出问题或者关键词，搜索引擎索引网页返回索引结果。但大模型出来后，在大模型的能力加持下，用户和搜索引擎的交互极有可能会变成用户向机器提需求，模型把需求提交给搜索引擎，然后完整的给出答案和服务，今天 GPT4 就是通过这样的方式来提供结果的，此后人和互联网信息的交互，大概率会变成机器和互联网信息的交互。