论文代写网可分享到:0
论文代写 > 计算机论文 > 基于Web的网站流量统计系统的设计

基于Web的网站流量统计系统的设计

作者:2016-10-17 21:49阅读:文章来源:论文代写
  1 引言 
   
  网站经营状况的调查可以从多个方面进行,比如广告投放效果、单位时间网站访问量、用户调查、在国际排名网站的排名情况等一系列指标。以上这些指标体系大体可以分为两方面:一是人(用户)对网站的直接评价,也叫感性评价;二是通过定量的数据分析得出的统计结果,也叫理性评价。这两种评价方式应该有机结合,克服对方的缺点,才能真正得出有利于网站发展的客观评价结果。而在定量分析的方法中对访问者流量的采集和分析又是网站调查必不可少的重要手段。 
  从网站管理者的角度来讲,网站访问流量分析是指在获得网站访问量基本数据的情况下,对有关数据进行统计、分析,从中发现用户访问网站的规律,并将这些规律与网络营销策略等相结合,从而发现目前网络营销活动中可能存在的问题,为进一步修正或重新制定网络营销策略提供依据的一种分析方法。网站访问流量分析是进行网络效果评价和网络营销诊断的重要依据。 
  随着计算机网络技术的发展,大部分网站访问流量统计方法已经由传统的简单计数器计数的方式转变为对Web服务器访问日志进行分析或者使用嵌入式脚本对网站访问情况进行实时监控的方式。传统的网站访问流量统计分析只是采用计数器的方式对访问者进行数量上的统计,并不能针对访问者行为进行跟踪和记录,实际应用意义不大。而且,由于网络环境复杂性的存在,致使计数器统计方式统计的数据缺乏准确性,在一定程度上无法正确的反映网站的实际运营情况。为解决该问题,众多网站都采取了日志分析和脚本嵌入分析的方法对网站访问流量和实际用户行为进行统计分析。这两种统计分析方法对于网站经营者而言,可以对大部分有意义用户访问数据进行获取、统计和分析工作,从而对网络营销战略的制定起到积极的推动作用。新型的网站访问流量分析方法还可以为网站的管理者和开发者提供有意义的用户行为信息,以便对网站的逻辑结构、服务器负载、网站运行状况等具体情况进行更具有针对性的改进。 
   
  2 流量分析的重要评价指标 
   
  流量分析是从用户使用的角度,掌握用户的实际使用情况从而对一个网站的运营状况进行分析的一项重要手段。它对网站的内容评价、实施评价、运行状况评价和服务质量评价具有重要的指导意义。流量分析不仅能够给网站建设者提供参考,也能够给经营决策者提供分析报告,进而更好的进行网站营销工作。进行流量分析的数据指标有很多,其中最重要的有: 
  访问量:访问的用户数,20分钟内的重复访问不记入访问量 
  独立访问者数量:该项指标描述了网站访问者的总体状况,指在一定统计周期内访问网站的访问者数量(例如每天、每月),每一个固定的访问者只代表一个唯一的用户,与访问次数无关。独立访问者越多,说明网络营销的效果卓有成效,是网站评价中最有说服力的评价指标之一。 
  页面浏览数量:在一定统计周期内所有访问者浏览的页面数量。 
  每用户页面浏览数量:指在一定时间内全部页面浏览数量与该段时间内额所有访问者数量之比,即一个用户浏览的网页数量。这一指标表明了访问者对网站内容或者产品信息感兴趣的程度,也就是常说的网站“粘性”。 
  访问者的停留时间:包括在页面的停留时间和在网站的停留时间,该指标能够反映出用户对网站中哪些页面的内容感兴趣,能够帮助进一步对网站进行结构上、内容上的优化。 
  用户地理方位:根据用户的IP地址,再配合IP数据库得到网站访问者的地理方位。 
  用户入站方式(直连、搜索):该项数据可以确定出用户进站的方式,帮助网站营销人员进一步优化网站广告投放方式,提高网站推广的效率。 
  获得以上数据后,可以根据实际需求进行个性化的数据分析。与数据挖掘技术相结合,可以对用户信息行为进行进一步研究。 
   
  3 实现方式 
   
  网站流量分析过程中最重要的是网站流量数据的获取。通过某种方式获得网站的访问记录,包括访问量、独立用户数量、总用户数量、页面浏览数、用户地理方位等等一系列对网站运行分析具有指导性意义的数据记录。分析数据就是采用某种算法对采集的数据记录进行综合分析,从而从数据上把握网站运行的状态,进而制定下一步运营策略。目前,获取数据主要有两种方法:日志分析法和脚本嵌入法。下面简单介绍一下这两种方法: 
  主流的Web服务器软件如IIS和Apache都具有一套完整灵活的日志系统。以apache的日志文件access.log中的一条记录为例:127.0.0.1 - - [04/Jun/2007:09:08:13 +0800] "GET /network_dns/content.html HTTP/1.1" 304 – 我们可以从中分析出访问这的IP地址、访问时间、访问者所在的时区、访问方式、用户请求访问的内容和用户使用的应用层协议。日志分析是网站流量分析最简易、最普遍的方法之一,日志分析的方式仅仅需要对日志文件内容进行数据挖掘工作,所以不受时间地点的限制也不会对服务器的稳定运行造成任何影响。目前有众多日志分析软件能够提供Web流量的数据挖掘和分析工作。比较著名的有:Webtrends、AWStats、Webalizer。不过日志分析方式也存在着一些不足:首先,日志分析仅仅局限于对Web服务器软件提供的Web运行日志文件进行分析,尽管可以通过日志配置的方式来增加一些重要的数据指标,但Web服务器日志提供的数据指标项目毕竟有限,使得在用户访问细节方面很难深入,通常都只是对现有数据进行简单的汇总,这种模式化的分析结果难以与网络营销策略结合起来。第二,对于大型网站来讲,日志分析并不方便,可能会耗费分析机的大量CPU资源,数据汇总的速度也受到日志文件大小的影响,长期数据汇总的结果还要占用大量硬盘空间。第三,日志分析难以实现实时的分析,网站管理员必须把日志数据下载到另外一台分析服务器上进行分析,这样数据的时效性受到了一定的影响。 
  除了日志分析法,还可以采用基于Web方式的脚本嵌入式的数据获取分析方法。这种方法是在需要统计的网站页面上嵌入一段javascript代码,该代码的作用就是向统计分析服务器发送各种统计数据,包括访问者的各种信息。在服务器端一般具有处理程序来实时存储和处理javascript代理程序发送过来的数据,大多数分析系统都是采用数据库来存储流量统计数据,使用Web的方式向网站管理者提供网站运行报告,形成一整套流量分析系统平台(如图1)。 
   
  图1流量统计平台工作原理图 
   
  以下是脚本嵌入法的分析原理和实现过程。 
  在被监控Web页面上设置 js文件,该文件的作用就是获取访问者的信息,并将搜集到的访问者信息写入到客户端的cookie当中供服务器程序取用。这些访问这信息都是与流量统计有关的各种统计指标,比如访问者操作系统的屏幕分辨率、访问者入站时间、访问者浏览器安装各种插件的状况等一系列数据。以下是一段简单的js代码,说明js程序是如何获取用户信息的: 
  //取得用户数据的函数代码 
  function vis_getUrlStat(vis_urlPmv, vis_site, vis_urlDoc, vis_pname, vis_typeClick, vis_vars) 
  { 
   var vis_getvars=''; 
   if (vis_vars) { 
  for (var i in vis_vars){ 
   if (!Array.prototype[i]){ 
   vis_getvars = vis_getvars + '&a_vars['+ escape(i) + ']' + "=" + escape(vis_vars[i]);
   } 
   } 
   } 
   var vis_da = new Date(); 
   var vis_src = vis_urlPmv; 
   vis_src += '?url='+escape(vis_urlDoc)+'&pagename='+escape(vis_pname)+vis_getvars; 
   vis_src += '&id='+vis_site+'&res='+screen.width+'x'+screen.height+'&col='+screen.colorDepth; //访问者屏幕分辨率情况 
   vis_src += '&h='+vis_da.getHours()+'&m='+vis_da.getMinutes()+'&s='+vis_da.getSeconds();//访问者入站时间 
   vis_src += '&flash='+vis_fla+'&director='+vis_dir+'&quicktime='+vis_qt+'&realplayer='+vis_rea;
   vis_src += '&pdf='+vis_pdf+'&windowsmedia='+vis_wma+'&java='+vis_jav+'&cookie='+vis_cookie;//客户端浏览器安装插件情况 
   if ((vis_typeClick) && (vis_typeClick != "")) vis_src += '&type='+escape(vis_typeClick); 
   vis_src += '&ref='+escape(vis_rtu); 
   return vis_src; 
  } 
  在访问流量分析系统上设置数据处理程序程序,该程序的作用是将cookie中的信息进行处理并存入到数据库中,数据库操作的一段代码如下: 
  //将统计数据插入到数据库中 
  $r = query("INSERT INTO ".T_VISIT." (idsite, idcookie, returning, last_visit_time, server_date, server_time, md5config, referer, os, browser_name, browser_version, resolution, color_depth, pdf, flash, java, javascript, director, quicktime, realplayer, windowsmedia, cookie, local_time, ip, hostname_ext, browser_lang, country, continent, total_pages, total_time, entry_idpage, entry_idpageurl, exit_idpage) VALUES ('$idSite', '$idCookie', '$returningVisitor', CURRENT_TIME(), '$serverDate', '$serverTime', '$md5Config', $refererUrl, '$os', '".$a_browser['shortName']."', '".$a_browser['version']."', '$resolution', '$colorDepth', '$pdf', '$flash','$java', '$javascript', '$director', '$quicktime', '$realPlayer', '$windowsMedia', '$cookieAccept', '$localTime','$ip2long', '$hostExt', '$browserLang', '$country', '$continent', 1, '".DEFAULT_TIME_PAGE ."', '$idPage', '$idPageUrl', '$idPage')"); 
  $idVisit = mysql_insert_id(); 
  脚本嵌入法具有很多优点,同时也有不足之处。它的优点有: 
  (1)数据全面:可以统计各种数据 甚至包括用户客户端软件的信息、分辨率、逗留时间等一系列指标; 
  (2)实时远程查看:网站管理者可以实时进行远程查看,随时掌握网站的运行情况; 
  (3)数据管理方便:通过使用数据库进行数据的存储,提高了数据管理的效率,便于流量数据信息的提取和挖掘。 
  缺点有: 
  (1)嵌入的js脚本可能会增加一部分Web服务器负担; 
  (2)要有一台专门做分析服务的服务器,增加运营成本,不过,目前互联网上有众多提供免费流量分析的网站如google analyse等,可以选择运行成熟的公司代为管理流量分析系统来解决该问题。 
   
  4 存在的问题 
   
  基于Web的网站数据统计系统的建立只是整个网站营销分析的第一步,仅仅应用于流量数据的采集和整理,网络营销真正需要的是结合网站自身特点进行更深层次的分析。在流量分析的过程中,经常采用数据挖掘技术来对获取的流量数据进行归纳和整理,最终分析出对网站营销具有指导意义的分析结果。这个分析结果一定要与网站具有针对性。 
  虽然,目前的流量统计系统能够获得各种各样的网站访问数据,但如果结合互联网网站服务的多样性来讲,流量统计分析的国内外标准的难以统一致使分析结果没有可比性,同一的流量分析指标并不是适合所有的网站。 
   
  5 结束语 
   
  基于Web的网站数据统计系统克服了传统的简单的计数分析和日志分析中数据类型相对简单的弊端。能够提供丰富的分析指标,网站管理者能够对用户的访问数量,页面的访问数量,以至访问者的来源等一系列数据指标进行统计和管理,进而制定对更加切合实际的网络营销规划。 
   
  参考文献: 
  [1]蔡巍,王飞龙.政务网站的性能测试与流量分析[J].厦门大学学报, 2004,vol.43(增刊):336-339. 
  [2]焦蓉梅.浅谈网站流量统计分析法[J].科技信息,2007, (6):518.  硕士代写论文网文章地址:/jsjlw/2103.html

相关阅读

最新更新

毕业论文代写

写作技巧

认准本站唯一联系方式

论文代写: 78312064

论文发表: 78312674

咨询电话:13281127927

haoyiceo@163.com

安排论文送知网报告

检测结果与学校一致

扫一扫咨询官方微信