百度和google是站长们的衣食父母,而做好搜索引擎优化的第一步就是蜘蛛的抓取,以下5条简单的Linux命令可以让你清楚的了解蜘蛛的爬行情况做到有的放矢。
百度和google是站长们的衣食父母,而做好搜索引擎优化的第一步就是蜘蛛的抓取,以下5条简单的Linux命令可以让你清楚的了解蜘蛛的爬行情况做到有的放矢。
请首先看看日志文件的大小,如果特别大的话(比如:超过50MB)建议不要用这些命令分析,因为这些命令较消耗CPU,或者抓下来放到分析机上执行,以免影响网站的速度。如果是Dreamhost等共享主机的话,分析大日志很消耗CPU,进程很容易被Kill掉。
这些命令都是Linux下的shell命令,在Windows主机下无法执行。
一 百度蜘蛛爬行的次数
cat access.log.2009-04-18 | grep Baiduspider+ | wc
这代表百度蜘蛛一共爬行了173次
二 百度蜘蛛的详细记录(如果记录很长不想看了可以Ctrl+C终止)
cat access.log.2009-04-18 | grep Baiduspider+
你也可以用如下命令:
cat access.log.2009-04-18 | grep Baiduspider+ | tail -n 100
cat access.log.2009-04-18 | grep Baiduspider+ | head -n 100
只看最后100条或者最前100条
三 百度蜘蛛抓取首页的详细记录
cat access.log.2009-04-18 | grep Baiduspider+ | grep "GET / HTTP"
初步研究发现,百度蜘蛛对首页非常热爱,24小时每小时都要看我的某个新站的首页,而googe和yahoo蜘蛛更喜欢内页,一天中各自只看了2次首页。不知道是真的有这个规律还是只是我的小站这样。
四 Baidu蜘蛛派性记录时间点分布
cat access.log.2009-04-18 | grep "Baiduspider+" | awk '{print $4}'
五 Baidu蜘蛛爬行页面按次数降序列表
cat access.log.2009-04-18 | grep "Baiduspider+" | awk '{print $7}' | sort | uniq -c | sort -r
本文中的每条命令把Baiduspider+改成Googlebot都可以查看Google的对应的数据。
附:(Mediapartners-Google)Google adsense蜘蛛的详细爬行记录
cat access.log.2009-04-18 | grep Mediapartners
Mediapartners-Google是什么?Google adsense广告之所以能与内容相关,就是因为每个包含着adsense的广告被访问后,几秒钟内就有一个Mediapartners-Google蜘蛛来到这个页面,所以几分钟后再刷新就能显示相关性广告了。
重庆中技互联网信息咨询有限公司
重庆网站建设事业部官方网:www.zjcoo.com
电子商务建站事业部咨询电话:023-67742189
门户网站品牌加盟推广电话:023-67742189
7*24小时服务电话:023-67742189
媒体合作电话:13883323406
投资合作电话:13896068183
QQ及邮件地址:446515345@qq.com
企业网站建设解决方案 营销型网站建设解决方案 行业门户网站建设解决方案 外贸网站解建设决方案 品牌形象网站建设解决方案 购物商城网站建设解决方案 政府网站建设解决方案 手机网站建设解决方案 教育培训网站建设解决方案 珠宝高端奢饰品网站建设解决方案 房地产、地产项目网站建设解决方案 集团、上市企业网站建设解决方案 数码、电子产品网站建设解决方案 美容、化妆品行业网站建设解决方案
10年专业互联网服务经验 重庆最专业网站团队 资深行业分析策划 B2C营销型网站建设领先者 最前沿视觉设计、研发能力 时刻最新技术领先研发能力 具有完备的项目管理 完善的售后服务体系 深厚的网络运营经验
中技互联一直秉承专业、诚信、服务、进取的价值观,坚持优秀的商业道德,以用户最终价值为导向,向用户提供优质产品和优质服务,从而赢得了用户的信赖。始终以不懈的努力、更高的目标来要求自己。
主营业务:网站建设 | 重庆网站建设 | 重庆网站设计 | 重庆网站制作 | 重庆网页设计 | 重庆网站开发
CopyrightZJCOO technology Co., LTD. All Rights Reserved.
渝ICP 备11003429号