Articles tagged with: 基本概念
基础知识, 海外资源 »
译者前言:
本文译自Avinash的博客文章:Standard Metrics Revisited: #4 : Time on Page & Time on Site,这是下部分。上部分请见《Avinash文章精选:Time on page和Time on site(1)》
[转载请事先声明并得到许可,版权归作者所有。]
续上回:
用多标签页面(Tab)的浏览器浏览网站时Time on Site和Time on Page如何被计算: Firefox的多标签页面浏览方式为其赢得了声誉——我真的不知道,如果没有这个功能,我这几年的网站浏览体验会变的怎样糟糕!新近几个版本的IE也同样支持多标签页面浏览,因此大多数人现在都在使用这个令人愉快的功能。【点击标题阅读全文】
基础知识, 海外资源 »
译者前言:
本文译自Avinash的博客文章:Standard Metrics Revisited: #4 : Time on Page & Time on Site 翻译这个文章是很有意义的,因为Avinash的这篇文章精辟的讲解了二者的含义和区别。其中Time on page指访问在页面上的停留时间;Time on site则指访问在网站上的停留时间。下面是译文,因为原文较长,因此改为上下两期连载,下部分在:http://www.chinawebanalytics.cn/?p=159,请大家关注。最后感谢亲爱的Avinash!【点击标题阅读全文】
基础知识 »
1, 2, 3, 4, 5, 6
七、其它可度量指标
带宽(Bandwidth)
定义:网站流量的度量标准(以数据传递的千字节为单位)。
度量方法:使用分析日志文件的方式进行统计可以根据日志文件中每条记录中返回文件的大小来统计网站的带宽。
重载(Reload)
定义:访问者点击浏览器中的重载(Reload)按钮或者是刷新(Refresh)按钮重新载入当前的页面的动作。
度量方法:用分析访问日志文件的方式进行统计,当访问者执行重载操作时都会重新发起对该页面的请求,可以将30秒内相同的请求判断为访问者执行了重载的操作,记录重载次数。
评论:重载操作的数目无法完全准确的被判断。我们建议并列页面阅览数和重载数,而不必从页面阅览数中减去重载数。迎程度和访问者对网站的忠诚度。
点击(Click)
定义:一次点击是指访问者的鼠标在一个超文本链接上的一次单击,目的是为了沿着它的链接获得更多访问者感兴趣的信息。
度量方法:只有使用分析日志文件的方式可以统计出对于某个超文本链接点击次数。
评论:点击数量(Click-Through、Clickthrough)和点击是同一术语。点击通常被用于网络广告的统计。
点击率(Click Rate)(事实上,目前的点击率所用的英文是Click Through Rate,简写为CTR,引用者注)
定义:点击链接的百分比。
度量方法:点击数除以链接所在页面的请求数。(更容易理解的方法是,点击率 = 链接被点击的次数/链接被曝光的次数。点击率一般用在横幅广告即Banner上,因此更简单的公式是,CTR = Click / Impression,引用者注)
评论:收益(Yield)和点击率是同一术语。点击率有多方面的价值,在网络广告中,它是广告有效性的表现,它表示访问者已到达广告客户的网站,而且这些网站还可以提供其它信息。
广告请求(Ad Request)
定义:指访问者对页面中广告元素的请求。
度量方法:广告请求的度量方法参考页面阅览的度量方法。
八、讨论(FAQ)
Q.
统计的实现有没有其它方式?
A.
另一种方式就是在希望进行统计的页面上嵌入一段统计的代码,这段代码引用了另一服务器上的资源,这个资源通常是由一个CGI程序(或其它类似的程序)动态生成的,当访问者访问该页面时,将向此CGI程序(或其它类似的程序)所在的那一台服务器发出请求,这样该页面被访问的信息及访问者的信息就会同时被那个CGI程序所记录。这种方式易于做到实时的统计分析,统计信息较为丰富,而且不会增加Web服务器端的负荷。但是这种方式容易被欺骗,也容易由于带宽等原因而造成统计信息收集的失败。这种方式由于易被欺骗而存在着不安全的因素,也许在安全问题得以解决之后,它将成为更好的统计实现方式。从易用性,内容丰富的程度来看,对这种统计方式的探索是有价值的。
(有意思的是,这种方式是目前我最常用的方式,也是操作最为简单的方式。我喜欢这种方式。引用者注)
Q.
为什么用户会话的时间期间定为20分钟?
A.
我们参考了国际互联网络界关于用户会话时间期间的使用,发现主要使用的时间期间为30分钟和20分钟。这个时间期间将影响到用户会话数的度量,如果该时间期间更加接近于用户在网站上的平均停留时间,则用户会话数将更加接近于网站的用户访问人次数。CNNIC对国内部分网站的统计表明,用户在信息量大的网站上停留的时间更长一些。我们认为目前用户会话时间期间定为20分钟是合适的。我们会调整这个时间期间以适应国内互联网络的发展。
Q.
广告客户想知道他们的广告确切地被访问者看到的数目,而不是仅仅知道访问者曾发出过请求。用什么指标可以回答广告客户的问题?
A.
我们非常理解广告客户想知道他们广告实际被看到的数目的要求,但实际上是无法完全准确地度量出这样的数据的。如其它媒体一样,广告客户为潜在的阅览数量付费(如按印刷的数量)。我们所能获得的准确的数据只有访问者发出的请求。在此文档中我们建议统计于”请求”的层次而不是”递送”的层次,因为网站是否成功地将内容递送给用户是由多方面因素决定的,其中包括网络的状况和用户的行为偏好等,所以难以被精确统计。可以用广告请求这一指标来近似表明访问者看到的广告的数目。
Q.
我们的网站想了解访问者是从哪一个省、市、自治区来访的,可是似乎没有这方面的统计指标?
A.
尽管访问者的地理位置是一个很有价值的信息,但列出访问者是由哪个地理区域来访的是很困难的,仅仅由IP地址来判断以地域划分的访问者来源是不可靠的,而且目前也没有近似的指标来表明访问者的地理位置。(这一点迄今为止似乎也没有精确的解决办法,从IP判断仍然是主要的方法,但这一方法的确不准确。Google Analytics目前似乎做的不错,但还没有证据表明,这个工具用了别的什么办法来精确化这一报告。引用者注)
Q.
页面阅览和页面请求似乎是不同术语,为什么这份文档认为它们是同一术语呢?
A.
页面阅览一词侧重于测量访问者真实看到的页面,页面请求则侧重于由访问者发起的请求数量,即使最后可能访问者并未真正阅览到页面。认为它们是同一术语有两个原因,其一是曾经提到的我们建议统计于”请求”的层次而不是”递送”的层次,因此这两个词的度量方法是一致的,其二是我们希望此文档能够简化过于繁杂的术语,将术语的数量精减,并有统一的解释。但当提到服务器接收到的对HTML文档的请求时,仍可以使用页面请求一词。
(我认为不应该混淆此二名词,二者并不等同。请参看我的相关帖子。引用者注)
Q.
我看到报纸上有报道说”某某网站首页访问量在两个月内达到70万人次”,这是什么意思?
A.
这是不准确的说法,因为精确的访问人次在目前的技术水平下是无法被测量到的,将用户会话数解释为访问人次是错误的。如果网站的用户会话数为70万,则报道就应该说”某某网站用户会话数在两个月内达到70万”而不是”某某网站首页访问量在两个月内达到70万人次”。
Q.
这些术语的定义和度量方法实现在我们现有的系统上是否很困难?
A.
对于大多数网站来讲,这并不会是一个大问题。因为在起草这份文档时,我们参考了一些国内外现有的统计和度量网站访问量的服务和软件工具,事实上它们基本已经在使用这些术语和度量方法。但是网站访问量的统计和度量还是一个缺乏标准的领域,我们起草这份文档的初衷之一正是希望此领域能够变得有章可循。
未完,待续……
基础知识 »
1, 2, 3, 4, 5, 6
五、访问者特征指标及度量
浏览器(Browser)
定义:一个用于定位和阅览HTML文档的程序(例如:Netscape Communicator、Mosaic、Microsoft Internet Explorer)。度量方法:
可以从日志文件中获得浏览器类型的信息,以此获得统计的数据。
评论:通常可以获得软件厂商的名字、浏览器的版本等信息。但是浏览器字符串(BrowserString)没有标准的格式,这是分析它的一个困难之处。
平台(Platform)
定义:访问网站的访问者使用的操作平台。
度量方法:同分析浏览器一样可以分析浏览器字符串(Browser String)来获得关于操作平台的信息。
评论:考虑到特殊的浏览器如WebTV和SEGA,称为操作平台比称为操作系统更恰当一些。它们可以通过伴随URL请求而来信息加以识别。
浏览器语言(Browser Language)
定义:浏览器所用的语言。
度量方法:可以通过浏览器字符串(Browser String)来得到浏览器的语言,HTTP_ACCEPT_LANGUAGE环境变量也可以反映浏览器所希望接收的HTML文档的语言。
评论:并不是所有浏览器都可以获得它所用的语言。使用分析日志文件的方式无法获得浏览器语言的数据。
域名(Domain Name)
定义:互联网络上对应于计算机的IP地址的文本地址,它是连接在互联网络上的计算机的正式的名字。
度量方法:度量域名实际上是考察远程计算机所在的一级或二级域(Domain),如:.com、.edu、.cn、.com.cn、.net.cn等等。REMOTE_HOST环境变量和日志文件都会记录远程计算机的主机名和域名,但并不是所有情况下都可以获得远程计算机的主机名和域名。
评论:并不是所有连入互联网络的计算机都可记录其主机名和域名,大部分计算机被记录的仍然是IP地址而不是它们的主机名和域名,对于没有主机名和域名的计算机,统计其所在域时应标明”未知”。不同的服务器及其配置,会影响到是否可以获得远程计算机的主机名和域名。可被反向解析IP地址的远程计算机往往会被记录下其主机名和域名,但是在记录日志文件时进行IP地址的反向解析将增大服务器的负荷,尤其对访问量很大的网站。可以在分析日志文件时再进行IP地址的反向解析,当然这也将减慢分析的速度。
指引链接(Referrer、Referral Link)
定义:访问者点击一个页面中的链接而被引导至当前HTML页面,则该链接是当前页面的指引链接。
度量方法:从HTTP_REFERER环境变量和对服务器日志文件的分析中可获得指引链接的信息。
评论:有时候也会遇到指引页面(Referring Page)一词,它们的意义相近,在浏览器中总是由指引的URL到达目标的URL。
六、访问者行为指标及度量
每页面请求的平均时间(Average Time Per Page Request)
定义:访问者每次多个页面请求的平均时间。
度量方法:用户会话的第一次请求至最后一次请求间的时间 ÷ (用户会话期间的页面请求数-1)。
评论:每页面请求的平均时间应该在一个比较大的范围内求得,计算用户会话时长之前应该已计算出这个值。
用户会话时长(User Session Length)
定义:一次用户会话的时间长度。
度量方法:用户会话的第一次请求至最后一次请求间的时间 + 每页面请求的平均时间。
评论:用户访问时长和用户会话时长是同一术语。
平均用户会话时长(Average User Session Length)
定义:网站访问者用户会话的平均时间长度。
度量方法:总计的用户会话时长 ÷ 用户会话数。
评论:平均用户访问时长和平均用户会话时长是同一术语。
返回访问(Return Visits)
定义:在一特定时间内,访问者在不同用户会话中再次访问网站的次数。
度量方法:度量在一特定时间内,访问者在不同用户会话中再次访问网站的次数。
评论:这一特定时间可以由进行统计的机构决定。建议的时间可以是一天或者不设置这一特定时间,后者可以表明访问者总共访问该网站的次数。返回访问的次数表明了网站的受欢迎的程度。
未完,待续……
