编者按:本文来自微信公众号“俊世太保”(ID:taibaocaijing),作者李俊。36氪经授权转载。
在11月15日的「今日头条创作者生机大会」大会上,刚刚履新今日头条CEO的朱文佳在其演讲伊始就谈到了头条进入全网搜索领域的话题,从2017年组建团队,到2018年低调上线,再到如今直言「瞄着第一去做的」,今日头条入局搜索的意图无疑已经十分明显。
但走过20年来,百度和Google如今依然还是国内外搜索市场地位稳固的两大巨头。根据 StatCounter Global Stats,百度在近12个月中始终保持着约80%的中国搜索引擎市场占有率,而在海外市场,Google则是豪揽近90%的市场占有率。
经济学的基本原理从一开始就告诉我们,从来不存在绝对高壁垒的市场,因为高壁垒带来超额利润,就自然会吸引更多的玩家进入,但为什么搜索市场价值巨大,但大浪淘沙之后却只剩下Google和百度——因为罗马从不是一天建成的。
为什么人人都想做搜索?
在国内搜索市场,头条并不是第一个试图挤入搜索引擎市场的公司,在此之前,无论是来自美国的谷歌、Bing、雅虎,还是国内的搜搜、搜狗、360,甚至人民搜索,都曾尝试过入局国内搜索引擎市场。而在国外,Google也曾面临过Yahoo、Bing甚至很多硅谷创业者的挑战。
1996年成立的搜狐,最早的定位就是网络信息分类导航网站,甚至打出过「出门找地图,上网找搜狐」的口号,但随着网络信息量的爆发式增长,这种人工信息分类的局限性逐渐明显,信息分类模式逐渐被基于robot自动抓取智能分类的信息技术取代。
直到2000年诞生的第一个真正意义上的中文搜索引擎——百度面世,才让中文搜索从搜狐、新浪的门户信息分类时代转变为了可以主动且自动根据搜索关键词获得信息的搜索时代。可以说搜索引擎需求的发展,就是伴随着解决不断增长的网络信息量与人们内心相对明确的信息获取需求之间的矛盾所进化。
20 年前,Google搜索当时仅有2500 万页的索引,内容约只有一个小型图书馆的书籍,而现在Google搜索的索引已经高达数千亿页,每天执行数十亿次用户查询,服务范围涵盖 190 个国家提供超过 150 种语言,比世界上所有图书馆加起来可提供的信息量还要多。
如何从浩如烟海的信息中获取自己真正需要的信息,那搜索则是让人从海量信息中快速找到自己想要的信息的最重要手段,只要信息量一大,搜索的需求就自然会产生。这也就是怎么回事最初Yahoo、搜狐这样的门户网站会衍生出自己的搜索引擎,也是为什么头条会很自然的想到去做搜索。
搜索引擎市场的商业价值大,这也是一个公开的秘密。互联网最大的价值是连接人与人,连接人与信息,而搜索就是连接人与信息的关键入口,且这种分发形式的精准度要远高于个性化推荐。因为用户一旦有搜索行为,就从另一方面代表着他有了明确的信息获取需求,自然由此可以产生更精准的商业价值。理解了这一点,就容易让我们看懂为什么这么多公司都曾想挤入搜索市场。
罗马不是一天建成的,为什么搜索不好做?
搜索的诞生来源于百度搜索引擎的理论技术基础,来自于其创始人李彦宏发明的专利——超链分析技术,该技术是现代搜索引擎的重要技术基础,也曾影响过Google的两位创始人。可以说搜索本身就是技术发展所带来的产物。
在20多年的发展过程中,搜索引擎的不断优化也是在技术的推动之下完成的。在搜索引擎领域,有一项很重要的指标就是「首条满足率」,即用户搜索得到的结果的第一条信息,就能够很好的满足客户的真实需求的比例,李彦宏曾在2019年世界互联网大会上透露,百度搜索在2017年首条的满足率是16%,2018年涨到了37%,而今天已达到56%左右。
由此可见,搜索引擎并不是像很多人想象的那样,是一个已经过时老旧的技术,其本身依然在不断的迭代和优化,这也和用户不断变化和提升的需求有着直接关系。
对于用户而言,首要需求是能搜到自己想要的结果,这就需要搜索结果更懂用户、准确唯一化——为此搜索历经pc、移动时代,已经从为用户更好的提供多样化的搜索结果,到为用户更好的提供唯一的优势结果,搜索技术演变为AI能力让搜索读懂用户,Google、百度、搜狗等搜索引擎公司都在致力于AI技术的发展。
较高的技术门槛——目前移动端很多产品仅能提供最基础的站内检索服务,尚达不到搜索引擎的高度。如果想做全网搜索,就需要解决通用人工智慧(AGI)问题,也就是不管用户说什么,搜索引擎都能听懂,并且提供习惯的搜索结果,这需要非常大的投入,做起来不容易。因为相比于相对窄数据量的站内搜索,全网搜索面对的用户搜索需求的多样性和复杂度完全不是一个数量级的。
用户并不是为了搜到某个网页,而是为了解决自己面临的问题,即达成结果。但这需要完整的生态支撑,为此百度增强知识体系建设、内容、服务生态的打造,让用户从搜索入口触达更多的内容与服务闭环,极大丰富了搜索外延,而Google的搜索引擎也从当初的一款搜索引擎到旗下拥有8款用户量超10亿产品,大量周边产品围绕搜索引擎产品构建了一个完整的开环+闭环生态。
尤其是在当前移动端和PC端内容、服务逐渐割裂的时点,搜索引擎对于内容的抓取比以往更加困难,这就更需要一定的生态基础作为支撑。搜索引擎必须要完整的产品内容生态才能支撑用户更高效的达成搜索目标,而这一切都需要很长时间的积累。因此,搜索引擎市场向来不乏挑战者,但站在金字塔最顶端的始终都是那么几家。
下一代搜索引擎长什么样?
进入人工智能时代,智能搜索正在突破“框”的限制,从手机向智能音箱、智能汽车等场景延伸,并将成为一个无处不在的超级智能交互入口。搜索的交互方式正在发生巨大的变化,慢慢的变多人也开始通过语音助理查询天气、地图和服务,下一代搜索引擎已是呼之欲出。
2015年Google逐步推出了AI算法RankBrain,将其应用于部分搜索结果上,如今这一算法已经应用在了55亿多次的搜索服务中,在 Google 用来决定网页排名的数百个因素中,RankBrain 的重要性已经位居第三。
据统计,用户在Google上输入的搜索词条中有15%是搜索引擎此前没有遇到过的,而通过RankBrian,Google可以将对这部分词条做多元化的分析和重新匹配,从而使得搜索结果更加准确。而RankBrain真正需要攻克的人工智能技术问题便是语义理解,即让机器如何的读懂人。
百度也很早就关注人工智能技术与搜索的结合,从2010年起,百度陆续布局了自然语言处理、机器翻译、语音、图像、知识图谱、机器学习、数据挖掘、用户理解等技术的研发,在百度看来,从搜索到智能搜索是必然的趋势,而百度为此也做了大量的技术储备,百度在语音交互领域也进行了大量的布局。
除了Google、百度之外,搜狗在人工智能领域也十分活跃,智能语音转写、AI合成主播、将搜索逐步向智能问答推动……2016年正式提出AI战略的搜狗,也在基于其自身的产品线和特征寻找AI与搜索引擎的结合点,在王小川看来,搜狗的未来在于「对语言为核心人工智能领域持续投入」。
至于Bing,作为世界市值最高的科技公司,微软在人工智能领域也从未缺席,除了在其搜索引擎产品中应用AI,使Bing搜索具有更自然的对话性和精确性,微软推出的对话式AI机器「微软小冰」的最终目的可并不是陪人聊天解闷,而是为了在未来提供更好的对话式搜索引擎服务。
AI和语音交互正在给搜索带来翻天覆地的变化,对此Google搜索主管本·戈麦斯(Ben Gomes)表示通过将AI语音技术与搜索引擎的结合,「此举将世界上最大的搜索引擎从基于关键词的搜索转变为更接近语言(语音搜索)的东西。
我们离完全处理问题还很远,但这是向前迈出的一大步……如果人们能获得更多问题的答案,他们就会问更多的问题,这会给整个生态系统带来更多流量」。
正如传播学者麦克卢汉所言,「媒介即信息」,信息形式的变化带来了不同的信息分发规则与结果,人们希望获取信息的方式是多样性且随时随地一样,搜索这种信息分发方式也在随之多元化。
在今年,Google就曾向外界展示了增强现实(AR)、计算机视觉、语义识别与搜索功能相结合时所呈现出的奇妙效果。从最初的文字搜索这一种载体形态开始,到如今的图像搜索、视频搜索、语音搜索、AR搜索,搜索的未来还有很多可能性。
20多年的历史对于互联网产品而言已经算得上「高龄」,但对于这样一个站在用户本质性需求高点的产品而言,20年或许还只是开始,人工智能等新技术带来的影响才刚刚显现,「罗马城」不过初见容貌,搜索的进化仍有很长的路要走。