SITE命令和百度统计数字均不准确

 已经在网络营销交流基地写过了一篇《从6.27看百度-百度大批量K站幕后分析》链接地址是:http://seo.chhua.com/web-note49,不过,那篇文章主要是针对了百度的K站情况写了一下我的一些感想,从原则上来讲,算不上是一个分析报告,其实,这次百度K站的规模和涉及的行业之广泛,也许是百度有史以来最大的一次规模,而百度K站的这个话题也成了SEO界最热门的话题,我也整合了一些网友发表的文章和看法,现把我自己的分析如下:
  一、从涉及行业
  这次百度K掉的网站多数是一些商业运营的网站,从利为汇到ly,从购物导购到淘宝客……,这些均是一些商业运营的网站。
  二、从关键词来分
  K掉的多数是一些关键词排名很好的站点,并且这些关键词全是非常有价值的关键词,远了不说,就只说久久的“减肥产品”和ly的“SEO培训”以及利为汇的“SEO培训”,这几个词的价值大家都非常清楚,如果这几个词在百度做推广一天没有个几千元钱你是烧不下来的。
  三、从站点的年限和更新速度以及外链来看
  这次K掉的多数是一些内容和链接在短期内暴涨的网站,还有一些是关键词排名飞升的网站。一些域名比较早的站点,以前有内容,到现在一直没有更新的,可能躲过了此劫。
  这次K站所表现出来的怪现象:
  一、排名不稳定
  如果你仔细观察,会发现有一些词在短短的几十分钟内可能就会变化,我观察了一下“SEO”,这个关键词,点石互动 的网站一开始是倒数第一,过了几分钟,就成了倒数第三了,再说,这个网站已经是好久不更新了,可能是2011年除了评论就没有更新过。
  二、收录不稳定
  有的网站一会收录几十页,一会收录就成了两页,再过一会,也许就没有了。
  三、收录递增和递减比较吓人
  网站收录快的,一下子能翻好几倍,如果说K甚至是从几十万页只留下几页。
  四、SITE命令和百度统计数字均不准确
  我在6.27事件大猜想(http://seo.chhua.com/web-note23 )一文中已经写过,这次的SITE命令不准确,百度官方声称百度统计的数字准确,根据观察百度统计的数字依然不准确,不知道百度应该做何解释。
  五、site命令不出来的网页可以通过关键词搜索出来
  有些网页,只能说有些,不概括全部,本来网站只留下了一个首页,可是通过关键词能搜索到其它的网页。
  根据以上的分析,我们做出以下猜测:
  一、百度整风行动
  百度要整掉一些通过作弊和不正常手法把关键词排名上来的网站,另外就是K掉一些垃圾网站,例如采集站和淘宝客API站点。
  二、百度为以后上新的项目铺路
  大家知道,百度已经出来了购物搜索,但是效果不是太乐观,例如“减肥产品”这样的词恰恰是购物搜索的天敌,所以,这样的站和把一些购物导购网站K站是为百度的购物搜索扫清障碍。
  三、为百度业务扫清障碍
  现在很多公司知道,百度的业务员是天天打电话问做不做推广,真是烦人,在大家心目中已经开始不太相信百度的推广了,因为网友和经常上网的人都知道那个带“推广”二字的链接是一个广告,再加上现在的SEO热,百度的业务肯定是在下降,所以把一些商业化的词和价值高的词K掉,不管是通过什么方法,也许是人工K掉。
  四、百度玩不起了
  SEO本来就是和搜索引擎玩的一种游戏,百度玩不起这个游戏了,最后羞恼成怒,耍起娘们脾气。
  五、PR值影响了百度算法
  这次的百度规模性K站几乎是和PR更新同时进行,以常规来说,谷歌和百度两家公司不可能是商量好一块行动的,这个猜想比较大胆,那就是百度也把谷歌的PR值当做了排名算法里的一个因素,当PR值非正常更新的时候,百度的算法出现了紊乱,然后影响了一系列的问题。
  六、百度数据库故障
  根据上次我参加的CNDS和CTO俱乐部举办的大型数据架构的座谈会上听百度的基础架构师称,百度一天处理的数据要在60TB,大家可以想像,这个数据量的庞大,如果真出现数据丢失的情况,那么后果可想而知,现在K掉的网站对于百度的数据量来说只是牛之一毛。再从SITE命令的失效,也可以猜到这一点。
  七、百度数据更新
  互联网中的数据已经太老了,甚至都有几年前的数据,再保存已经没有了意义,同时对搜索引擎的数据存储和数据处理来说也是一个负担,所以来一个大换血,慢慢的K掉老的数据,再慢慢的收录新的数据。
  OK,先讲这些,我还会继续关注百度,最新文章我会发表在我的seo.chhua.com上,大家可以看一下,是一个新的小站,刚上线,还没有被收录,就赶上了百度的K站风波,也算是一个苦命的站吧,大家支持一下。

«1»