seo常见问题之五:抓取(12-16)

百度是否跟踪JavaScript链接?
官方回复:javascript的解析,是很多搜索引擎正在做的事情;同理,对flash的解析。毕竟有那么多应用javascript或者flash的网站,其实并没有意识到,他们的做法给搜索引擎的收录和索引带来的麻烦。所以,如果期望不被搜索引擎收录的话,最直接的手段,还是写robots文件。
 
百度是否能抓取CSS样式表并识别分析?
官方回复:百度是能够抓取并分析CSS的。
 
对较多图片和flash的页面,搜索引擎会如何处理?
问题补充:目前很多页面可能会没有很多的文字,比较多图片和flash,对没有很多文字的页面,搜索引擎能很好的将这个页面中的资源识别出来吗?
官方回复:目前在推一个工具,将spider抓取日志展示出,去看下是否符合站长的抓取意愿,且对某些js较多的网站,假设目前收录不好,可先尽量减少js的使用。
 
百度蜘蛛现在可以抓取HTML5的标签吗?
官方回复:百度可以解析HTML5的标签。
 
百度蜘蛛如何爬取不存在的路径?
官方回复:Baiduspider只抓取能从互联网上找到的url,如果Baiduspider大量抓取你网站上不存在的url,可能有两个原因:
1) 内链:你网站内有部分网页指向其他网页的url格式不正确。
2) 外链:互联网上有其他网站指向了你网站内不存在的网页。另外,Baiduspider抓取到不存在的网页,服务器应该返回404错误。

«1»