文/陈锋
(资料图片)
编辑/子夜
这几天,金沙江创投董事总经理朱啸虎和猎豹移动CEO傅盛关于大模型的讨论备受关注。
杜克大学电子与计算机工程系教授陈怡然总结了他们的观点,朱啸虎认为看不到创业公司的机会,因为大模型参数多,所需算力大,而模型、算力、数据三大支柱都向大厂商集中,而傅盛认为大模型催生了很多新的架构在大模型之上的创业机会,包括直接在大模型上搭建不同应用,和由于数据隐私带来的垂直领域的大模型等。
这场大讨论的背景是,大模型爆火出圈半年,热潮已经席卷了整个市场,大厂和创业者跑步进场,在这波大浪中寻找机会。
一方面是不断涌现的大模型。中国科学技术信息研究院5月发布的《中国人工智能大模型地图研究报告》显示,截至5月28日,国内10亿级参数规模以上基础大模型,至少已经发布了79个,“百模大战”正徐徐展开。
另一方面,踏入大模型浪潮的玩家们也在思考,大模型将为世界带来哪些改变、将在各行各业中产生怎样的作用、这些作用将怎样发生。
目前来看,作为最大的AI应用场景,大模型对搜索行业的改造进度最快、效果最明显,也最具启发意义。
自2月份微软宣布推出新必应、开启ChatGPT+搜索模式以来,谷歌、百度、Opera等纷纷跟进。
而且各大厂商均表示,将AI技术集成到搜索引擎只是第一步,未来将有更多的AI功能集成到浏览器中。比如百度在 5 月份开始内测“AI伙伴”和“AI BOT”等功能,同时还有集成以上功能的NEW App。
值得注意的是,对搜索企业而言,接入大模型带来的效果很显著。
在当前百度搜索每天已有的问答需求中,首条满足的比例已达到70%,半年前这个比例只有40%,开年以来,百度搜索日均新增问答需求超过3000万次。
在这背后,最先被改造的搜索行业,已经来到了代际变革的拐点时刻,而作为中国最大搜索公司、也是布局大模型最久最深的百度,已经走在了这轮颠覆式变革的最前沿。
01.搜索与大模型,并非对立关系
2022年底,ChatGPT爆红之后,其在编程、文本生成等NLP领域展现出的强大能力,在部分行业引发了担忧。
搜索行业是其中之一。由于ChatGPT拥有基于对话形式接收指令并输出结果的能力,与传统的搜索引擎功能具有一定的重合性,关于“ChatGPT会不会影响搜索引擎”的讨论,一度甚嚣尘上。
谷歌积极摆出了防御姿态,针对OpenAI的攻势,谷歌管理层发布了“红色代码”警报。在硅谷,这意味着拉响了火警。
不过过去半年以来,大模型创业热潮下,业界对大模型应用场景的探索也在不断加深,对大模型所能带来的颠覆性变化,认识也更加清晰,这同时帮助人们解开了一些疑惑。
比如生成式AI并不会抢走搜索的生意,反而,当大语言模型应用到搜索引擎,能够带来更大的想象力。
近日,在微博、新浪新闻联合推出的“新智者首席Time”栏目上,百度集团副总裁、搜索平台负责人肖阳指出,大语言模型跟搜索结合之后,能够提升搜索效果,而且用户是买单的。
“我觉得大模型+搜索是个飞轮,百度一手有搜索,一手有文心一言大模型,可以比喻为,倚天剑和屠龙刀双剑合璧,会产生更大的价值。”肖阳如此说道。
背后的逻辑在于,在大算力、大模型、大数据的技术支持下,会导致AI的“智能涌现”:
过去的人工智能是,我想让机器学会什么技能,就教它什么技能,教过的有可能会,没教过的就不会。而在大模型出现“智能涌现”之后,以前没有教过的技能,它也能掌握。
按百度创始人、董事长兼首席执行官李彦宏的说法,在这一过程中,人工智能的发展方向会从辨别式走向生成式。而搜索引擎就是典型的辨别式,也因此,搜索被普遍认为是当前AI最大规模的应用场景。
也就是说,AI非但不是搜索引擎的对手,而且还是搜索引擎接下来新故事的起点。
搜索公司现在面临的一个必要性的挑战在于,如何让大模型与搜索的飞轮转得更快,如何通过大模型打造更前沿的搜索能力,赋予用户更好的搜索体验。
尤其对百度、谷歌等头部搜索玩家而言,他们有必要走在最前面,用AI思维重构搜索,通过大模型的颠覆能力,引领搜索体验的代际变革,引领行业的颠覆式创新。
这也是他们现在正在做的事情。前段时间的万象大会上,肖阳指出,在百度搜索多年深厚积累的基础上,百度将语义检索技术与大语言模型结合起来,搜索的理解、推理、组织甚至创作能力都释放出了巨大的潜力。
在肖阳看来,语义检索技术与大语言模型的融合,标志着搜索的奇点时刻已经来临,搜索行业,也将迎来新一轮代际变革。
02.推动搜索代际变革
搜索代际变革,头部搜索公司如何做,将成为行业的风向标。
因为搜索是“马太效应”十分明显的行业,拥有用户、技术、数据、算力的公司将获得最多用户,并且很难被后来者赶超。
大模型也有类似的特征,其需要算力、算法、数据积累,资金与技术门槛都极高,具备资金规模、技术积累等多重要素的企业,优势会进一步凸显,并持续扩大。
就目前来看,在中国市场,最具有代表性的玩家是百度。
一方面,百度搜索引擎在国内的市场份额长期保持第一且遥遥领先;另一方面,今年3月,基于文心大模型3.0打造的百度新一代知识增强大语言模型“文心一言”公开邀测,时隔三个多月,文心大模型3.5版本即取得了效果、功能和性能上的全面提升。
无论是市场份额的领先,还是在这波大模型浪潮中的率先前行及探索,根源上都来自于技术积累。
“百度是技术的信仰者,信仰技术的长期主义。只要你在技术这条路上一直往前走,总会有反馈。你让用户满意了,用户就会留下来。搜索引擎用户迁移的成本是最低的,也正是因为迁移成本低,而且这个事又很难、投入很大、数据壁垒高,才会产生马太效应,用户用脚投票,随时可以走,但最强者会获得最多的用户。”肖阳说道。
他还表示,百度只要自己努力,利用好自身的条件,不断拓展搜索边界,被颠覆的可能性,就是自己对自己的颠覆。
而回顾百度搜索的变迁就不难发现,过去多年,百度搜索一直在进行边界探索,始终走在行业搜索变革的最前沿。
从早期推出百度贴吧、百度知道、百度百科,以及上线图片、新闻、flash、文档等搜索入口,到后来提出“框计算”概念,到 2017 年以后开始重押AI,都推动百度搜索从最初输入文字匹配一个网页结果的列表,逐渐进化成一个智能搜索引擎,对问题的理解和包容力不断提高、内容和服务也更加准确丰富。
再到如今,百度搜索积极探索与大模型的融合,成为推动搜索行业代际变革的核心力量。
我们看到,目前,一些颠覆性的新变化已经出现。
比如在文心一言的加持下,百度搜索引擎的思考能力大大提升,“极致满足”的效果得到逐步提升。
举两个例子。如果你想找一部教小朋友画画的艺术动画片,过去你需要自己花时间搜索、浏览、筛选、判断和总结,现在百度搜索可以为用户整理多个答案,并标注每个答案被提到的次数,减少用户无谓的精力损耗。
如果你想查类似于“辽宁本溪往年十一月天气”这样冷门的问题,百度搜索引擎能够提供数据趋势图,避免用户分别搜索、比较和计算。
也就是说,相较以前,百度搜索理解用户自然语言的能力变强了、理解内容的能力变强了、回答能力也变强了。
正如肖阳所说,“我们希望搜索引擎就像一位勤奋的全能学者,通过阅读、理解、推理和总结海量的知识,充分理解用户的需求,并对信息进行整理和加工,让更多、更复杂的问题在第一条搜索结果中得到全面满足”,百度搜索正逐步朝着这一方向迈进。
03.越强大,越简单
更强大的搜索引擎应该是怎样的?业界过去半年的探索,在某种程度上已经指明了方向:
搜索引擎需要比之前变得更加聪明,能够更好地理解用户的自然语言,让用户通过最短的操作流程得到最佳的结果。
同时,AI时代的搜索引擎不应该只是一款工具,它需要向用户提供“搜索”之外的外延价值,提供除了搜索行为之外更多的可能性。
换言之,越强大的搜索引擎,能够让事情变得越发简单。
正如肖阳所言,百度在推动搜索变革时一直在思考,能不能让用户找到所求的全过程,再极致一些,再简单一些,再高效一些,让AI普惠到每一个人,帮助每一个人成长,让复杂的世界变得更简单。
基于这一思考,过去二十年至今,百度围绕搜索进行的探索,聚焦为三点。
一是不断降低用户表达需求的门槛,让每个人都能以更自然的方式表达搜索需求;
二是降低用户获取内容和服务的门槛,通过各种手段提供更极致便捷的满足方式;
三是丰富搜索引擎的内容供给,建立生态机制,使商家、机构等参与者都能与用户精准匹配。
我们也看到,除了百度搜索引擎思考能力的提升,带来的提供“极致满足”能力的完善,百度还为搜索行业带来了新的变革方向。
比如当下正在内测的“AI伙伴”,就是一个集低门槛、多能力于一体的AI产品。
连线Insight注意到,“AI伙伴”并非只是一个单纯的人机交互的对话窗,从娱乐到职场、到学习、甚至到命理、情感,几乎生活中任何领域,都有所涉及。
用户一方面能够通过这一入口与AI进行语音互动,它能听懂用户的任何问题,据肖阳此前的介绍,其还能帮助用户标记答案中的重点,同时提供权威来源;另一方面,基于丰富的应用,用户也可以根据自身意图进行图片、文案等方方面面的内容创作。
值得注意的是,目前这一平台还支持普通用户自己创建应用,门槛极低且操作便捷。
不难发现,无论是“极致满足”功能,还是全能的“AI伙伴”,在大语言模型为搜索带来的革命性变革中,用户能直观感受到体验上的代际进步,对搜索行业而言,这才是变革最大的意义所在。
与此同时,针对B端用户,百度搜索还提出了新的解决方案——AI BOT,通过大语言模型和 AI技术,为各行各业的内容和服务提供者深度赋能,降低他们与搜索融合的门槛。
据悉,目前其已经有创作者、商家、机构、服务和品牌等多种类型的AI BOT。
“他们能够利用自身优质、独特的内容、知识和服务,直接回答用户的问题,建立更高的信任度,促进C端用户和B端伙伴之间建立更紧密的联系。而且,所有这一切变得前所未有的简单。”肖阳如此表示。
综上所述,作为当前搜索行业代际变革的引领者,百度搜索的进化,是我们观察大模型如何赋能各行各业的一个视角。
近日,在出席“世界互联网大会数字文明尼山对话”会议时,李彦宏就指出,相比起大模型的数量,建立在大模型基础上的AI原生应用,将更加重要。
这也是当前的业界共识,即大模型成为了人工智能时代的操作系统,所有应用都将基于大模型开发,模型之上是应用层,包括各种各样的AI原生应用。
可以预见的是,接下来,大模型在不同行业所带来的代际变革,将同时在C端和B端,都提供直观的变革体验。
在C端,这种体验是比以往更优质的服务,在B端,则是比以往更深程度的降本增效。