百度优化

关键词优化_搜索引擎排名优化-网站优化就找迈联科技

浅析百度蜘蛛机器人爬行规律

百度蜘蛛的机器人除了可以按照谷歌的分类方法,按等级分之外,更多的是按抓取方式来分的。谷歌的蜘蛛分类方法是按被抓取的网页的PR等级来分的。不同PR等级的蜘蛛抓取的速率,范围,深度,都不同。而百度,则是按抓取方式来的。

抓取方式分类其实很简单,第一,广度抓取,从百度服务器出发;第二,深度抓取,从百度服务器出发;第三,新网页抓取,从互联网任何一个连接地址出发。

第一种是按百度自己的抓取频率设置一个时间,定时从百度自己的服务器出发,抓回上千万个网站页面。很多的时候都是先首页再内页。有时候也有相反。第二种是百度认为的权重稍微高点的网站,要用深度抓取方法。或者就是让蜘蛛直接在该网站蹲点,随时刷新,等候新页面诞生,一旦诞生就抓回去。第三种是在前两种方法的抓取过程中,把遇到的所有连接都带回家,然后让服务器分析,哪些页面目前在数据库里还不存在,然后再派遣蜘蛛出去抓这些新鲜的网页。

百度的抓取方式其实很简单。而不同的方式对应分配的蜘蛛的能力也并不一样。比如深度抓取的蜘蛛的运行效率就比广度蜘蛛要高。因为深度网页必然是门户站大站,需要更高效的蜘蛛以达到最终的高效。而一般的广度抓取就算分配很强劲的蜘蛛过去也未免能达到如此高效,毕竟普通网页的响应速度还不能跟百度相比。

分页:[«]1[»]

Powered By Z-Blog 1.8 Arwen Build 90619

Copyright 2010 www.bdyouhua.cn 百度优化 Rights Reserved.网站地图