搜索引擎对网站质量评级

   随着互联网的飞速发展,互联网的信息越来越多,互联网上的网站也越来越多,而大家都知道搜索引擎不可能爬行收录所有的网站页面信息,百度官方也明确表示蜘蛛只可以抓取到尽可能多的有价值资源并保持系统及实际环境中页面的一致性,搜索引擎的目的就是尽量快而全的发现资源链接,提高抓取效率,只有这样蜘蛛才能尽量满足绝大部分网站。因为如此所以对于不同的网站搜索引擎的爬行收录情况都是不一样的,这就要对网站质量进行评级。
  对一个质量高的网站进行爬取肯定能获得更多的优质资源,能节省很多时间。百度对于新浪和对小网站的抓取程度肯定是不一样的,因此要对网站的质量进行评级,通过级别来判断网站需要抓取的程度,从而提高蜘蛛效率。这就相当于一个企业去招聘人才,不可能一个人一个人的去考察,为了节省时间,很多企业就会重视毕业证,而这个就是对求职者的一个评级,有初中、高中、大学、研究生等,评级高的自然也会更多企业面试的机会,甚至评级更高的不用面试直接上岗。搜索引擎也是这样对于新站评级肯定低,收录也少;对于一般站,级别会高点,抓取频率和数量都会慢慢变多;而对于一些大型知名站,基本是不断的在抓取,并且基本没有审核,直接收录,这不仅提高搜索引擎的效率,也满足了绝大部分用户的需求。
  搜索引擎如何进行评级?
  很明显这个评级不是简简单单靠人工能完成的,部分网站会人工判断,而绝大部分都是需要更智能的方法,通过数据计算在站中自动发现规律来完成质量评级。  
  首先,搜索引擎结合人工挖掘一批质量优异的站点,将其作为数据库系统的基本集合,减少反垃圾反作弊的代价,提高系统检索结果的稳定性和权威性,减少用户的不良反应,选取符合用户体验的集合,提取这些页面的特征。比如:
  1、百度权重
  百度权重对于站点质量评级来说是个很重要的因素,是一个网站重要程度和用户需求程度一个直接的体验,也是网站整体情况的是个浓缩,所以一般权重值高的网站就代表着高可信度和权威,这对于站点评级非常关键。
  2、收录速度
  一些信息很丰富的网站,尤其是一些综合类的新闻网站甚至这类网站的博客、论坛等产品。一旦有新的信息丰富,在短短数秒内就会被百度抓取,并释放出来通过关键词就可以检索出来。一次偶尔的秒收也不不能说明什么,但是如果一个网站发布的内容,已经习惯被秒收,那就说明搜索引擎已经对这个网站信任,收录速度习惯性的高不仅表现在搜索引擎的看重,同时也说明该网站的文章质量、更新频率长时间良好,说明网站是一个合格的新闻源。
  3、相对收录数量
  相对收录数量就是网站里面的实际内容与被搜索引擎检索收录的内容的比值。一个网站的总收录数量多,说明网站内容丰富,但是相对收录量更直接反应着网站的质量好坏。只有网站质量比较高,搜索引擎对网站比较重视,相对收录量才会比较高。对一个网站而言,最理想的状态是相对收录量和绝对收录量都非常高。
  4、外链量
  经过百度的不断过滤,剩余的网站外链质量越来越高,当前而言网站有比较多的外链直接表示着第三方网站对于你网站的推荐,尽管外链的作用在下滑,但你可以去看一下那些大型网站的外链数量肯定不会少,网站是需要有效外链推荐的。
  5、用户参与量
  用户的参与,与网站的互动关系越来越受到搜索引擎的重视,包括用户的内容参与、用户点击、用户分享、评论、收藏等等,包括360“我的搜索”,百度现在在搜索结果页增加的用户行为都是搜索引擎对于用户投票的重视,而好的用户投票会越来越多参与到百度对网站的质量评级中。
  当然这个优质站点的特征还有很多,在这里就不一一例举了,根据这些特征对比,搜索引擎就会给不同的网站进行智能的评级,区分优质站点和劣质站点,这就和搜索引擎给网站排序打分的过程很相似,通过对比就可以区分不同站点的级别,当然中间的过程肯定不会就这么简单,需要非常复杂的数据计算,其中不同行业不同性质等的网站评级标准也是不会一样的。

«1»