搜索引擎是一个没有生命的程序,它是不能够像人类一样进行思考的,它的一切行为都依赖于算法。
搜索引擎也有它特定的思考方式,我们称为 “机器学习” 或 “人工智能” ,但是这一切的前提是基于大数据。
接下来,我通过一些点来说明它是如何思考的。
一、跳出率(搜索跳出率)
首先如果你的网站没有放置搜索引擎的相关产品代码(如:百度分享,百度统计),或者你的浏览器没有装有搜索引擎的插件(如:百度工具条,谷歌工具条),搜索引擎是无从跟踪用户进入你站点之后的行为。(百度输入法之类的软件是否会通过数据包来收集信息,我不清楚,也不做考虑)
如果搜索引擎不能监控到用户进入我们网站之后的行为,那么它是如何统计跳出率的呢?
答案就是:如果你点击了排名一的网站,10秒后又点击了排名二的网站,那么排名一就会被统计为 不满意的点击,也即跳出。那点击排名一的网站,30秒后没有点击排名后,没有点击其它排名的网站,而是关闭搜索引擎呢?亦或者是搜索了相关的同类的词,或者不同的类的词呢?你可以思考一下,什么样的行业算是一次满意的点击,什么样的行为算是不满意的点击。
前面的10秒,30秒只是一个举例,要表达的是搜索引擎可以通过用户在搜索引擎上的操作行为来评估每次点击的效果。
别说什么搜索引擎用cookie等来根踪用户进入网站的行为,这些都是扯淡。其前提是 你的网站挂了搜索引擎的相关产品。
二、还是跳出率
什么样的网站才能佣有更低的跳出率呢?那就是把对的用户带到对的页面。
a、什么叫做对的用户?
如果你的网站是卖机械的,你却做一些非相关的词来获得流量(你懂的之类的词),那么这些用户就是错的用户,搜索引擎统计到的 搜索跳出率 自然就高。如果你的词就是你的机械的名称或属性相关的词,那过来的就是潜在用户,那就是对的用户。
b、什么叫做对的页面?
把对A产品有需求的用户带到A产品的介绍页面,就是对的页面,带到B产品的页面,那就是错的页面。
一句话,让用户在你的网站就能得到他想要的。这句话说的容易,但是搜索引擎带来的流量有时候是你意想不到的,一个页面可能命中的词也可能是你意想不到的词,但是可以肯定的是带来的流量基本都是同一个主题的流量。
c、举例:
“美的豆浆机” 页面可能命中的需求:
1、要了解美的豆浆机怎么样
2、了解美的豆浆机价格
3、要购买美的豆浆机的,
4、其它的豆浆机的需求
针对这些需求的多样性,页面如何更好的满足用户的需求,就能减少跳出率,就能把用户留在站内。
可以通过丰富页面的内容来尽可能的留住访客,比如除了介绍美的豆浆机基本情况,还可以推荐不同款式的美的豆浆机,并列出价格,还可以列出美的豆浆机的购买地址,常见问题等内容,万一访客看完之后不喜欢美的了,我们还可以推荐不同品牌的豆浆机,只要访客不再返回搜索引擎搜索同类词或点击排名,那么搜索引擎就认为你满足了需求。
三、搜索引擎的思考(大数据,机器学习)
终于来到本文要说的重点了,搜索引擎通过 评估每个点击的满意度 来给计算页面的质量,这是有前提的,那就是需要先给页面排名,并导入流量,这样才能计算。这也就是为什么有的网站刚开始排名都不错,后来就不好的一个可能原因。
但搜索引擎不能每个网站都一上来就给好排名呀,这不科学,用户体验也不好,那有没有其它办法。
如果我们把拥有排名之后搜索引擎的评估称之为:事后判断,后验概率
那么在还没有排名之前的判断则称之为:事前判断,先验概率
通过事前判断拥有合格的质量得分的页面才会进入排名,进入排名后进入事后判断,重新计算质量得分。
那事前判断的标准是什么,事前判断就是从大量的进行过 事后判断的页面 中提取数据样本进行分析,得出一系列特征码来进行事前评分。
举个生活的例子:
通过抽样我们可以很容易的 得出 “中国人的中文 比 外国人的中文 好”。但这个不是100%正确。
机器学习也是通过大数据进行特征统计,得出一个大概率和特征,然后对页面进行事前评分
通过前面的搜索跳出率,有没有以下的可能:
1、一个页面能够满足越多同种类的需求,那么跳出率就越低 ?
2、一个页面广告越少,跳出率越低?
3、一个页面有弹窗,跳出率越高?
4、一个页面访问速度越慢,跳出率越高?
等等。
搜索引擎的思考大概就是这样子,真实的搜索引擎比这个肯定是要复杂的多,但是本质的思路我认为都是一样。