咨询电话:023-88959644    24小时服务热线:400-023-8809
NEWS CENTER ·
新闻动态
关注中技互联 关注前沿

解析Web日志蜘蛛访问数据的行为

发表日期:2012-12-13    文章编辑:小杰    浏览次数:30    标签:

  网络日志的日志文件分析后,我们能够看到的用户和搜索引擎蜘蛛访问数据的行为,让我们来剖析健康的用户和蜘蛛,网站的喜好和网站。我们的主要需求分析Web日志分析中的蜘蛛行为。

        在蜘蛛爬行的过程,其中包括,搜索引擎会给予特别重视网站分配适当的资源量。搜索引擎友好的网站,应该是这些资源的大量应用,蜘蛛能够快速,准确,全面的抓取有价值的,用户喜欢的内容,浪费资源,而不是无用的,不正常的访问内容。

        网站日志数据过载,所以重庆网站优化人员一般都通过网站日志分析工具的需求进行查看。日志分析工具:光年日志分析工具,网络日志exploer。

        在解析日志,日志文件在一个单一的一天,我们分析的需求:访问,停留时间,爬行,抓取的目录统计信息,抓取统计页面蜘蛛访问IP,HTTP状态代码蜘蛛活泼的时期,蜘蛛爬行的方式;有关日志文件的许多我们分析需求内容:蜘蛛访问的天数往往停留时间的趋势,整体编目往往目录爬行往往抓取期间,蜘蛛活泼的周期。

        让我们来看看如何分析Web日志?

        网站日志数据的分析解读:

        1,访问次数,停留时间,抓取

        我们可以知道这三个数据:统一我们每次抓取的页面数单页的抓取战争的每一个停留时间停留时间。

        均匀每次我们抓取的页面数=总抓取/访问

        单页的抓取住宿每次住宿/每次检索

        均匀每次停留时间=总停留时间/访问

        从这些数据中,我们可以看到蜘蛛活泼的亲和力水平,抓取深度,总访问次数,停留时间,更高的抓取,抓取页面的统一制服的停留时间,标记等网站更多的搜索引擎。单页面抓取居住时间标记的网站页面的访问速度,时间越长,表示该网站的访问速度,速度较慢,不太有利,包括搜索引擎抓取,我们应该进步的页面加载速度和减少的停留时间,单一的常设,所以爬行动物资源抓取索引。

        此外,根据这些数据,我们也可以过一段时间的统计数据,该网站的整体方法的性能,如:蜘蛛访问往往停留时间往往会抓取倾向。

        2,目录检索统计资料

        日志分析后,我们能看到的网站,用蜘蛛抓取的目录的目录深度的重要目录的抓取,无效的页目录的抓取。后cf目录的网页并包括情况下,我们将能够发现更多的问题。关于非常重要的目录,需要通过内部和外部的调整,增加了重量,爬行,停止在robots.txt屏蔽无效页。

        经过多天的日志统计信息,我们就可以看到效果的站内外行为带来的目录,优化合理的达到预期的效果。关于在长期的一段时间看同一个目录下,我们可以看到的目录页,推测基于行为表现的原因。

        3,网页抓取

        Web日志分析,我们可以看到详细的蜘蛛爬行的页面。在这些网页上,重庆SEO专员可以分析出蜘蛛抓取的页面,需要停止爬行,爬行没有包含在值的页面,抓取重复页面的url蜘蛛资源,丰富的应用程序,我们要求这些地址制止的在robots.txt爬行。

        此外,我们也能剖析为什么不爬不包括页面,但不包括或爬行,但没有公布新的文章。关于阅读页面的一些意义不大,我们要求它爬行通道,在这些网页上,我们是否可以做NOINDEX标签等。另一方面,将弱智的蜘蛛抓取的页面你依靠这些毫无意义的频道页面上的蜘蛛不明白网站地图的吗?在这方面,笨鸟有疑问,寻求分享经验]

        4,蜘蛛访问IP

        它已经提出了蜘蛛的IP段判别网站降权的情况,前笨鸟认为这是没有意义的,因为后者的智力也。降权更前三个数据应该受到歧视歧视的意义不大,只用一个IP段。 IP更多有用的分析,应区分是否存在收集蜘蛛,的假蜘蛛的恶意点击蜘蛛。

        5,获得国家代码

        蜘蛛经常出现的状态代码,如301404,及时处置,防止产生不良的影响在网站上显示这些状态码。

        6,抓取时间段

        爬行蜘蛛小时比照多个单日量进行分析,我们可以了解一个特定的蜘蛛关于本网站热闹的特定时间段。 CF每周数据,我们将在一个星期内,可以看到一个特定的蜘蛛的活跃周期。明白了这一点,有一定的指导意义,之前所谓的小三,四,网站内容的更新,都是不科学的争论。

        7,蜘蛛爬行的方法

Web日志,我们能够追踪到具体的IP接入方式,如果我们追踪的途径,可以找到一个特定的蜘蛛访问的网站偏好结构下的蜘蛛爬行途径。因此,我们可以适当的引导蜘蛛爬行途径,更重要的,有价值的,新的更新页的蜘蛛爬行。抓取方面,我们双解析的喜好网址的逻辑结构,物理结构的途径爬行的喜好。在这些之后,让我们检查从搜索引擎的角度来看自己的网站。

如没特殊注明,文章均为中技互联原创,转载请注明来自www.zjcoo.com
上一篇:视频推广方法详细介绍 下一篇:已经是最后一篇了
相关新闻

CopyrightZJCOO technology Co., LTD. All Rights Reserved.    

渝ICP 备11003429号

  • qq客服
  • 公众号
  • 手机版
  • 新浪微博