<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>网站分析在中国——从基础到前沿 &#187; 度量</title>
	<atom:link href="http://www.chinawebanalytics.cn/tag/%e5%ba%a6%e9%87%8f/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.chinawebanalytics.cn</link>
	<description></description>
	<lastBuildDate>Mon, 23 Jan 2012 13:23:05 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.2</generator>
		<item>
		<title>网站分析度量、意义以及不为人所知的（2）</title>
		<link>http://www.chinawebanalytics.cn/metrics-and-its-back-story-2/</link>
		<comments>http://www.chinawebanalytics.cn/metrics-and-its-back-story-2/#comments</comments>
		<pubDate>Tue, 23 Nov 2010 21:28:31 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[Featured]]></category>
		<category><![CDATA[网站分析工具]]></category>
		<category><![CDATA[网站分析的基本度量]]></category>
		<category><![CDATA[网站分析经验分享]]></category>
		<category><![CDATA[Cookie]]></category>
		<category><![CDATA[CWA]]></category>
		<category><![CDATA[Google Analytics]]></category>
		<category><![CDATA[Omniture]]></category>
		<category><![CDATA[SiteCatalyst]]></category>
		<category><![CDATA[工具]]></category>
		<category><![CDATA[度量]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=3216</guid>
		<description><![CDATA[　　感谢大家在上篇文章中的踊跃参与！集体智慧太强大了！我准备整理大家的发言，也加上我的发言，汇集成一个单独的文章。
　　近期又在出差，前几天跟同事学习了一些关于Adobe Omniture Discover的特点，一时激动，在微薄上发了一个帖子，说这是个超级工具，结果受到了大家的普遍兴趣。也许有些言重，但很久没有这么激动的感觉了，若有言语不妥，请朋友们海涵。
　　今天继续度量这个话题，对Visitor和Visit进行更深入一点儿的挖掘。这个话题本来是不存在的，但是看到大家对这个系列第一集中关于visitor和visit的一些小疑惑，发现还是值得拿出来再说一说。仍然说它的原因，并不在于让大家死记住这两个度量本身的相关规定，而是这两个度量涉及了原理、方法和工具，这些是更有价值的知识。
为什么Visitor和Visit容易让我们疑惑？
　　Visitor让我们疑惑的，值得澄清的地方在于如下几点：

Visitor的含义是指访问的人数，但visitor并不可能等同于真正的访问你的网站的自然人的数量。
Visitor与visit和page view这两个度量不同的是，visitor跟时间的粒度（granularity）有关：即使相同的时间长度，时间粒度取的不同，visitor的数量也会不同。
相对而言，利用log file（日志法）对visitor的计数有先天不足，因此visitor这个概念对日志法较少使用。（关于什么是日志法，什么是标记法请看我的这个文章：服务器日志法网站分析的原理及优缺点）

　　对于上面三点稍作一点儿解释。第一点，visitor的含义是网站的访问人数，是具体的人。可是，并不可能真正知道到底有多少人访问了你的网站。为什么呢？假如你和你的朋友公用一台电脑，而且都用同一个浏览器访问我的博客（www.chinawebanalytics.cn, www.cwachina.com)，这个时候用技术的方法来精确分辨出是两个访问者非常困难&#8212;&#8212;总不能在你的电脑上装上一个摄像头窥视吧！因此，无论技术发展到何种程度，我认为100%准确记录访问网站的人数都是不太可能的，不仅是网站分析的工具难以做到，其他不同方法和不同工具也做不到（关于网站分析计数准确性的研究，请大家看这篇文章：网站分析&#8212;&#8212;我们的数据准确吗？）。 因此，人们采用了一些变通的方法来解决识别visitor数量的问题，我后面会重点讲到。
　　第二点，visitor跟时间的粒度有关。所谓粒度，就是我们所说的截取的时间范围。举个例子，2010年11月14日到11月20日这一周的七天，你在每天都访问了CWA网站一次（感谢这么忠诚的读者。:) ），那么如不同的时间粒度下visitor的计数不同。Weekly visitor是1，而daily visitor则是7。值得注意的是，对于所有的网站分析工具，weekly、monthly或者quarterly、yearly这样的时间粒度都是指日历上的自然周、月或者季度和年。因此，虽然11月24日到11月30日也是七天，而且你分别在这期间的11月25日和11月29日访问了我的CWA网站，weekly visitor仍然会被记录为2。
　　第三点，日志法对于记录visitor的数量是采用分辨IP的方法的。因此，在日志法中，我们常常提到的一个概念是独立IP的数量，并借此指代实际的访问者数量。但是，今天的IP地址已经不可能再跟计算机一一对应了，更不用说跟使用计算机的人一一对应。因此，用这个方法统计visitor的数量存在很大误差，逐渐被人们抛弃掉。
　　相对而言，visit的麻烦其实更多一点：

为什么要存在visit？
Visit和session是什么关系？
关闭浏览器窗口对visit的计数有没有影响？
关闭浏览器标签（Tab）对visit的计数有没有影响？
从不同来源访问网站，一定会使这个网站visit的计数增加吗？
Visit和unique page view是什么关系？

　　这些问题普遍反映了大家对visit和（标记法）网站分析的疑惑，但实际上，如果我们深入领会了visit的本质，解答这些问题其实很容易。
　　首先，为什么要存在visit？我们说过，网站分析不是分析孤立的数据（这是跟过去网站简单的流量统计有本质的区别的地方），而是分析网站访问者的行为。page view本身是一个个的孤立数据，不能解答网站访问过程中，网页之间的相互关系。例如，我说首页的page view是19,807，网站分析工具频道首页的page view是2,303次，这不能说明首页就一定更受欢迎。而visit，是指访问者来到网站的一系列打开页面的访问过程，是行为，是联系page view和visitor的桥梁。Visit这个度量的重要性就在于，它几乎是其他所有网站分析度量的基石，或者直接影响到了其他所有的网站分析度量。

　　其次，visit和session是什么关系呢？session和visit肯定不完全是一回事，但是你可以认为这二者是一样的名词。因为这涉及到一些历史。session是计算机原理课中的一个名词，即一个&#8220;会话&#8221;，如果你学过网络的七层结构模型，你就一定还记得其中有一个session layer&#8212;&#8212;会话层，就是指它。在日志法网站分析中，人们用session来表示一个连结的建立和解除，以用之描述visit。不过，由于标记法网站分析的出现，visit直接采用了别的更好的方法表述（马上也会重点讲到），这样就使session这个名词实际上弃用了，而直接使用visit来表示一次访问行为。当然，session作为技术上的一个名词，是不会被丢掉的，但在网站分析上，人们采用了更符合自然语言的表达。
　　剩下还有几个问题，关于visit的计数，以及visit和unique page view的关系，我会在下面首先跟朋友们解答visit和visitor的计数原理，然后在这个系列的下一篇中说明visit和unique page view的区别和联系，因为这一点将要引发出来的课题非常重要。为了弄清楚网站分析工具对于visit和visitor的计数，我们先要搞清楚怎样查看网站分析是否记录到了网站访问者的行为数据。
怎样查看网站分析工具是否捕捉到了数据
　　回答这个问题，我们不能靠猜测了，我们要用几种HTTP Sniffer（HTTP数据包嗅探器）工具（其实一般一种就够了，但不妨我们多了解几种）来探测，如同用雷达探测天上的飞机。首先，我推荐一个我最喜欢的工具：
 HttpWatch
　　HttpWatch（http://www.httpwatch.com/）肯定不是最强大的，但我觉得是最容易上手的，能够跟IE和火狐很好的整合，并且很稳定。
其他工具
　　然后其他工具大家也可以试试。Charles（www.charlesproxy.com/），是最强大的工具。firebug，主要用来查看cookie，这是个免费工具。另外还有WASP（http://webanalyticssolutionprofiler.com/），专门用来查验各种网站分析工具的软件。还有httpfox，也是免费的，从firefox的插件库中可以找到，功能也基本上齐全了。
　　如果不想付费，建议装上httpfox（或者基本版的HttpWatch），firebug和WASP（试用版）就足够了。
怎样查看网站分析工具是否捕捉到了数据
　　下面我以HTTPWatch为例，介绍如何查看网站分析工具是否捕获到了数据。对这个部分熟知的朋友直接跳过。
　　1. 在Firefox浏览器空白页中，打开（快键Shift+F2）打开HTTPWatch。
　　2. 启动HTTPWatch的记录模式，即点击下图中的红色框中的红button。

　　3. 在地址栏中输入你要检查的网页URL，打开网页。这个步骤可不需要拘泥于在地址栏中输入URL，你一样可以通过点击外部链接来到这个页面，HTTPWatch仍然会忠实的记录页面打开过程中的HTTP数据包。这时，你可以看到一条条的浏览器传输的数据记录产生了。
&#160;　　请千万不要把这些记录当做是网站服务器的Log记录，这是两回事。
　　4. 上面的数据很多，怎么能看到网站分析工具捕获的数据呢？利用过滤功能就好了。利用快捷键Ctrl+F9，调出过滤器，然后勾选Enabling Filtering，再勾选URL Contains，其下输入&#8220;-analytics&#8221;，再点OK之后就过滤出页面中GATC（Google Analytics Tracking Codes）发送的信息，如图所示的两条。如果你的页面上加有多个GA profile ID，那么这个数据也可能是多条。如果过滤之后没有数据了，说明网页没有正常运行GATC，或者没有加入GATC，那当然就是不能完成正常监测啦。

　　对于Omniture SiteCatalyst，在过滤器中输入&#8220;2o7&#8221;，就能把只是Omniture Tracking Code发出的监测数据过滤出来。
　　现在，你有了这个好武器，它的用途可不只是让你看看监测代码正常工作了没有。我们下面要用它来检查网站分析工具是如何计数visit和visitor的。
Visitor和visit如何计数？
　　你可能会问，上面过滤之后的这两条信息是什么东西？想要搞清楚这个问题，我们得打开另外一个话题，即网站分析工具获取数据的原理。如果大家感兴趣，我会另开一篇帖子，如果没兴趣就算了，反正也不太影响大家直接进行网站分析的实践，在我未来计划（现在还只是计划，实在是忙的对不起大家）的书中会再专门提及。下面我们还是聚焦在网站分析工具如何计数这个问题上。
　　你可以先阅读这个帖子&#8212;&#8212;网站分析工具如何辨别UV，然后再继续往下看，一定会有新的收获。在标记法的网站分析中，除了page view之外，visitor和visit以及一切我们分析报告中显现的度量和计数其实都是通过cookie实现的，只有在没有cookie的情况下，才通过其他的方法实现，因此，如果想要搞清楚visitor或者visit到底是如何被网站分析工具记录的，最好的办法是直接看看cookie是怎么记录的。
　　不同网站分析工具cookie记录的方法有所不同，但核心思想是一致的。因此，这里先说说Google Analytics的cookie设置，未来有机会再聊Omniture SiteCatalyst的，因为后者的架构相对更加复杂。
Google Analytics的cookie设置
　　利用HttpWatch，我们点入第二条信息，然后选择&#8220;Query String&#8221;标签，在下方的检视窗口中出现了更多的信息。

　　先不管其他信息，我们直接看utmcc，这条记录是GA跟visit和visitor相关的cookie信息。如下：

utmcc&#160;&#160;&#160; __utma=148702437.1696395432.1289879776.1290424992.1290508917.6;+__utmz=148702437. 
		1289882757.1.6.utmcsr=google&#124;utmccn=(organic)&#124;utmcmd=organic&#124;utmctr=%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90;

　　现在，我们一条条的看这些数据到底是什么意思。

utma

　　记录visitor的信息，utma后面的信息，包括域的hash值，visitor的ID、访问时间相关信息和访问次数。utma对应的信息，除非人为删除，否则它在两年后才失效。为了免去我自己作图的痛苦，我直接利用了Google转化大学中的图，因此下图中的数字信息跟上面的不一样，但相应信息的含义是完全一样的。

本图的来源为http://services.google.com/analytics/breeze/en/ga_cookies/index.html 
	版权归Google所有
　　第一个蓝色的字段是域名的哈希串，对于一个确定的域名来说，这个值是不会改变的。
　　第二个字段（绿色字段）是识别visitor的ID，就是这个绿色字段，标识了不同的访问者，不同的值就意味着不同的访问者。这就是GA能够辨别不同访问者的原因。这个值如果不发生人为地删除cookie的情况的话，两年后才会被替换为一个新的值。
　　第三个字段（紫色字段）是这个visitor第一次访问网站的时间，如果不删除cookie，两年内这个值也不会变。这个时间是UNIX时间，0000000001代表着1970年1月1日0点0分1秒，之后每过一秒，数字加一。实际上UNIX时间是有点小错误的，但是已经不会再对使用产生影响。这里同学们需要注意了。这里以及cookie中其他的UNIX时间记录，构成了GA的整个时间度量系统。时间是这么创造的！
　　第四个字段（浅蓝色字段）是这个visitor前一个visit开始的时间。
　　第五个字段（浅紫色字段）是这个visitor这一次visit开始的时间。
　　第六个字段（最后那个独立数字）太重要了，是记录这个visitor访问网站的次数。
　　现在，再回头看看前面的我的网站（CWA，China Web Analytics，http://www.chinawebanalytics.cn）的utma，大家会发现这个visitor（就是我）已经有6次访问了。
　　通过第六个字段值的增加与否，就能判断GA是否记录某一次访问行为为一次新的visit。

utmz

　　utmz的功能是用来记录网站访问者的来源（即Traffic Source或者Campaign），如下：


　　这里各个字段的含义除了Campaign Number之外就不多解释了，大家肯定能看懂。Campaign Number是指这个访问者通过不同来源（除了直接来源）访问网站的来源数。如果通过了一个新的来源访问了网站，即使是在一个visit之内，campaign number也会加一，但visit并不会增加。
　　Campaign number的作用我并不是很明确，很希望知道的朋友告诉我。我知道的是，如果在一个visit之内，访问者通过多个来源访问了网站，那么GA默认把最后的那个来源归为这个visit的主人。如果你用utm_nooverride=1配置，那么GA则会把第一个来源记录为这个visit的主人。

utmb和utmc

　　utmb和utmc是另外两个重要的cookie信息，在免费版本的HttpWatch中看不到，不过没关系，大家用firebug就能看到。
　　简单讲，utmb和utmc都是记录visit的cookie。两个cookie的区别是，utmb在30分钟后过期，如果utmb过期刷新，那么visit也被刷新。utmc是浏览器关闭则随浏览器一起关闭（失效），再打开浏览器访问那个网站，visit也被刷新。这就是为什么GA的visit在不活动30分钟后结束，以及关闭浏览器结束的原因。

　　好了，讲到这里，可能很多朋友会有恍然大悟的感觉。我希望你们能有这样的感觉，否则我真的应该隐退了。如果您有这样的感觉，一定在留言框中写点儿什么&#8212;&#8212;心得、意见、问题，或者其他什么都可以。
　　出差很忙很累，所以博客发晚了些，请大家原谅。后面是否写写网站分析工具获取数据的原理，看朋友们的反馈咯！
　　11月底了，悉尼已经可以看到圣诞节的气氛，到处都能看到圣诞树，可是这里的圣诞在夏天，感觉实在是太怪了。北京的圣诞节，时有下雪，感觉自然完全不同。预祝朋友们圣诞愉快！
]]></description>
			<content:encoded><![CDATA[<p>　　感谢大家在<a href="http://www.chinawebanalytics.cn/wa-case-study-interaction-1-revenue-target/" target="_blank">上篇文章</a>中的踊跃参与！集体智慧太强大了！我准备整理大家的发言，也加上我的发言，汇集成一个单独的文章。</p>
<p>　　近期又在出差，前几天跟同事学习了一些关于Adobe Omniture Discover的特点，一时激动，在微薄上发了一个帖子，说这是个超级工具，结果受到了大家的普遍兴趣。也许有些言重，但很久没有这么激动的感觉了，若有言语不妥，请朋友们海涵。</p>
<p>　　今天继续度量这个话题，对<a href="http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e6%9c%80%e5%9f%ba%e6%9c%ac%e6%a6%82%e5%bf%b5%ef%bc%882%ef%bc%89%e2%80%94%e2%80%94uv/" target="_blank">Visitor</a>和<a href="http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e6%9c%80%e5%9f%ba%e6%9c%ac%e6%a6%82%e5%bf%b5%ef%bc%881%ef%bc%89%e2%80%94%e2%80%94visit/" target="_blank">Visit</a>进行更深入一点儿的挖掘。这个话题本来是不存在的，但是看到大家对这个系列第一集中关于visitor和visit的一些小疑惑，发现还是值得拿出来再说一说。仍然说它的原因，并不在于让大家死记住这两个度量本身的相关规定，<strong>而是这两个度量涉及了原理、方法和工具，</strong>这些是更有价值的知识。<span id="more-3216"></span></p>
<h3>为什么Visitor和Visit容易让我们疑惑？</h3>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/confusion.jpg"><img align="left" alt="confusion" height="244" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/confusion_thumb.jpg" style="margin: 10px 25px 5px 0px; display: inline" title="confusion" width="192" /></a>　　Visitor让我们疑惑的，值得澄清的地方在于如下几点：</p>
<ul>
<li>Visitor的含义是指访问的人数，但visitor并不可能等同于真正的访问你的网站的自然人的数量。</li>
<li>Visitor与visit和page view这两个度量不同的是，visitor跟时间的粒度（granularity）有关：即使相同的时间长度，时间粒度取的不同，visitor的数量也会不同。</li>
<li>相对而言，利用log file（日志法）对visitor的计数有先天不足，因此visitor这个概念对日志法较少使用。（关于什么是日志法，什么是标记法请看我的这个文章：<a href="http://www.chinawebanalytics.cn/wa-server-logfile-basic-pros-and-cons/">服务器日志法网站分析的原理及优缺点</a>）</li>
</ul>
<p>　　对于上面三点稍作一点儿解释。第一点，visitor的含义是网站的访问人数，是具体的人。可是，并不可能真正知道到底有多少人访问了你的网站。为什么呢？假如你和你的朋友公用一台电脑，而且都用同一个浏览器访问我的博客（<a href="http://www.chinawebanalytics.cn">www.chinawebanalytics.cn</a>, <a href="http://www.cwachina.com">www.cwachina.com</a>)，这个时候用技术的方法来精确分辨出是两个访问者非常困难&mdash;&mdash;总不能在你的电脑上装上一个摄像头窥视吧！因此，无论技术发展到何种程度，我认为<strong>100%准确记录访问网站的人数都是不太可能的，不仅是网站分析的工具难以做到，其他不同方法和不同工具也做不到</strong>（关于网站分析计数准确性的研究，请大家看这篇文章：<a href="http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e6%88%91%e4%bb%ac%e7%9a%84%e6%95%b0%e6%8d%ae%e5%87%86%e7%a1%ae%e5%90%97%ef%bc%9f/">网站分析&mdash;&mdash;我们的数据准确吗？</a>）。<a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/publiccom.jpg"><img align="right" alt="publiccom" height="209" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/publiccom_thumb.jpg" style="margin: 5px 0px 5px 25px; display: inline" title="publiccom" width="248" /></a> 因此，人们采用了一些变通的方法来解决识别visitor数量的问题，我后面会重点讲到。</p>
<p>　　第二点，visitor跟时间的粒度有关。所谓粒度，就是我们所说的截取的时间范围。举个例子，2010年11月14日到11月20日这一周的七天，你在每天都访问了<a href="http://www.chinawebanalytics.cn/" target="_blank">CWA网站</a>一次（感谢这么忠诚的读者。:) ），那么如不同的时间粒度下visitor的计数不同。Weekly visitor是1，而daily visitor则是7。值得注意的是，对于所有的网站分析工具，weekly、monthly或者quarterly、yearly这样的时间粒度都是指日历上的自然周、月或者季度和年。因此，虽然11月24日到11月30日也是七天，而且你分别在这期间的11月25日和11月29日访问了我的<a href="http://www.chinawebanalytics.cn/" target="_blank">CWA网站</a>，weekly visitor仍然会被记录为2。</p>
<p>　　第三点，日志法对于记录visitor的数量是采用分辨IP的方法的。因此，在日志法中，我们常常提到的一个概念是独立IP的数量，并借此指代实际的访问者数量。但是，今天的IP地址已经不可能再跟计算机一一对应了，更不用说跟使用计算机的人一一对应。因此，用这个方法统计visitor的数量存在很大误差，逐渐被人们抛弃掉。</p>
<p>　　相对而言，visit的麻烦其实更多一点：</p>
<ul>
<li>为什么要存在visit？</li>
<li>Visit和session是什么关系？</li>
<li>关闭浏览器窗口对visit的计数有没有影响？</li>
<li>关闭浏览器标签（Tab）对visit的计数有没有影响？</li>
<li>从不同来源访问网站，一定会使这个网站visit的计数增加吗？</li>
<li>Visit和unique page view是什么关系？</li>
</ul>
<p>　　这些问题普遍反映了大家对visit和（标记法）网站分析的疑惑，但实际上，如果我们深入领会了visit的本质，解答这些问题其实很容易。</p>
<p>　　首先，为什么要存在visit？我们说过，网站分析不是分析孤立的数据（这是跟过去网站简单的流量统计有本质的区别的地方），而是分析网站访问者的行为。page view本身是一个个的孤立数据，不能解答网站访问过程中，网页之间的相互关系。例如，我说首页的page view是19,807，网站分析工具频道首页的page view是2,303次，这不能说明首页就一定更受欢迎。<strong>而visit，是指访问者来到网站的一系列打开页面的访问过程，是行为，是联系page view和visitor的桥梁</strong>。Visit这个度量的重要性就在于，它几乎是其他所有网站分析度量的基石，或者直接影响到了其他所有的网站分析度量。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/osilayer.jpg"><img alt="osi-layer" border="0" height="309" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/osilayer_thumb.jpg" style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="osi-layer" width="545" /></a></p>
<p>　　其次，visit和session是什么关系呢？session和visit肯定不完全是一回事，但是你可以认为这二者是一样的名词。因为这涉及到一些历史。session是计算机原理课中的一个名词，即一个&ldquo;会话&rdquo;，如果你学过网络的七层结构模型，你就一定还记得其中有一个session layer&mdash;&mdash;会话层，就是指它。在日志法网站分析中，人们用session来表示一个连结的建立和解除，以用之描述visit。不过，由于标记法网站分析的出现，visit直接采用了别的更好的方法表述（马上也会重点讲到），这样就使session这个名词实际上弃用了，而直接使用visit来表示一次访问行为。当然，session作为技术上的一个名词，是不会被丢掉的，但在网站分析上，人们采用了更符合自然语言的表达。</p>
<p>　　剩下还有几个问题，关于visit的计数，以及visit和unique page view的关系，我会在下面首先跟朋友们解答visit和visitor的计数原理，然后在这个系列的<strong>下一篇</strong>中说明visit和unique page view的区别和联系，因为这一点将要引发出来的课题非常重要。为了弄清楚网站分析工具对于visit和visitor的计数，我们先要搞清楚怎样查看网站分析是否记录到了网站访问者的行为数据。</p>
<h3>怎样查看网站分析工具是否捕捉到了数据</h3>
<p>　　回答这个问题，我们不能靠猜测了，我们要用几种HTTP Sniffer（HTTP数据包嗅探器）工具（其实一般一种就够了，但不妨我们多了解几种）来探测，如同用雷达探测天上的飞机。首先，我推荐一个我最喜欢的工具：</p>
<p><a href="http://httpwatch.com"><img align="left" alt="image" border="0" height="92" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image3.png" style="border-right-width: 0px; margin: 5px 10px 5px 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="image" width="260" /></a> <strong>HttpWatch</strong></p>
<p>　　HttpWatch（<a href="http://www.httpwatch.com/">http://www.httpwatch.com/</a>）肯定不是最强大的，但我觉得是最容易上手的，能够跟IE和火狐很好的整合，并且很稳定。</p>
<p><strong>其他工具</strong></p>
<p>　　然后其他工具大家也可以试试。Charles（<a href="http://www.charlesproxy.com/">www.<b>charles</b>proxy.com/</a>），是最强大的工具。firebug，主要用来查看cookie，这是个免费工具。另外还有WASP（<a href="http://webanalyticssolutionprofiler.com/" title="http://webanalyticssolutionprofiler.com/">http://webanalyticssolutionprofiler.com/</a>），专门用来查验各种网站分析工具的软件。还有httpfox，也是免费的，从firefox的插件库中可以找到，功能也基本上齐全了。</p>
<p>　　如果不想付费，建议装上httpfox（或者基本版的HttpWatch），firebug和WASP（试用版）就足够了。</p>
<p><strong>怎样查看网站分析工具是否捕捉到了数据</strong></p>
<p>　　下面我以HTTPWatch为例，介绍如何查看网站分析工具是否捕获到了数据。对这个部分熟知的朋友直接跳过。</p>
<p>　　1. 在Firefox浏览器空白页中，打开（快键Shift+F2）打开HTTPWatch。</p>
<p>　　2. 启动HTTPWatch的记录模式，即点击下图中的红色框中的红button。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image4.png"><img alt="image" height="260" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image_thumb3.png" style="display: inline" title="image" width="547" /></a></p>
<p>　　3. 在地址栏中输入你要检查的网页URL，打开网页。这个步骤可不需要拘泥于在地址栏中输入URL，你一样可以通过点击外部链接来到这个页面，HTTPWatch仍然会忠实的记录页面打开过程中的HTTP数据包。这时，你可以看到一条条的浏览器传输的数据记录产生了。</p>
<p>&nbsp;<a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image5.png"><img alt="image" height="313" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image_thumb4.png" style="display: block; float: none; margin-left: auto; margin-right: auto" title="image" width="550" /></a>　　请千万不要把这些记录当做是网站服务器的Log记录，这是两回事。</p>
<p>　　4. 上面的数据很多，怎么能看到网站分析工具捕获的数据呢？利用过滤功能就好了。利用快捷键Ctrl+F9，调出过滤器，然后勾选Enabling Filtering，再勾选URL Contains，其下输入&ldquo;-analytics&rdquo;，再点OK之后就过滤出页面中GATC（Google Analytics Tracking Codes）发送的信息，如图所示的两条。如果你的页面上加有多个GA profile ID，那么这个数据也可能是多条。如果过滤之后没有数据了，说明网页没有正常运行GATC，或者没有加入GATC，那当然就是不能完成正常监测啦。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image6.png"><img alt="image" height="353" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image_thumb5.png" style="display: inline" title="image" width="558" /></a></p>
<p><strong>　　对于Omniture SiteCatalyst，在过滤器中输入&ldquo;2o7&rdquo;，就能把只是Omniture Tracking Code发出的监测数据过滤出来。</strong></p>
<p>　　现在，你有了这个好武器，它的用途可不只是让你看看监测代码正常工作了没有。我们下面要用它来检查网站分析工具是如何计数visit和visitor的。</p>
<h3>Visitor和visit如何计数？</h3>
<p>　　你可能会问，上面过滤之后的这两条信息是什么东西？想要搞清楚这个问题，我们得打开另外一个话题，即网站分析工具获取数据的原理。如果大家感兴趣，我会另开一篇帖子，如果没兴趣就算了，反正也不太影响大家直接进行网站分析的实践，在我未来计划（现在还只是计划，实在是忙的对不起大家）的书中会再专门提及。下面我们还是聚焦在网站分析工具如何计数这个问题上。</p>
<p>　　你可以先阅读这个帖子&mdash;&mdash;<span class="Apple-style-span" style="font-family: Arial, Helvetica; line-height: 21px; "><a href="http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e6%9c%80%e5%9f%ba%e6%9c%ac%e6%a6%82%e5%bf%b5%ef%bc%883%ef%bc%89%e2%80%94%e2%80%94%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e5%b7%a5%e5%85%b7%e5%a6%82%e4%bd%95/" style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; padding-top: 0px; padding-right: 0px; padding-bottom: 0px; padding-left: 0px; color: rgb(60, 120, 167); text-decoration: none; ">网站分析工具如何辨别UV</a></span>，然后再继续往下看，一定会有新的收获。<strong>在标记法的网站分析中，除了page view之外，visitor和visit以及一切我们分析报告中显现的度量和计数其实都是通过</strong><a href="http://www.chinawebanalytics.cn/%e6%8d%8d%e5%8d%abcookie%e2%80%94%e2%80%94%e6%b2%a1%e6%9c%89cookie%ef%bc%8c%e6%88%91%e4%bb%ac%e4%bb%80%e4%b9%88%e9%83%bd%e6%b2%a1%e6%9c%89%e4%ba%86/" target="_blank"><strong>cookie</strong></a><strong>实现的</strong>，只有在没有cookie的情况下，才通过其他的方法实现，因此，如果想要搞清楚visitor或者visit到底是如何被网站分析工具记录的，最好的办法是直接看看cookie是怎么记录的。</p>
<p>　　不同网站分析工具cookie记录的方法有所不同，但核心思想是一致的。因此，这里先说说Google Analytics的cookie设置，未来有机会再聊Omniture SiteCatalyst的，因为后者的架构相对更加复杂。</p>
<p><strong>Google Analytics的cookie设置</strong></p>
<p>　　利用HttpWatch，我们点入第二条信息，然后选择&ldquo;Query String&rdquo;标签，在下方的检视窗口中出现了更多的信息。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image7.png"><img alt="image" height="364" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image_thumb6.png" style="display: inline" title="image" width="573" /></a></p>
<p>　　先不管其他信息，我们直接看utmcc，这条记录是GA跟visit和visitor相关的cookie信息。如下：</p>
<blockquote>
<p>utmcc&nbsp;&nbsp;&nbsp; __utma=148702437.1696395432.1289879776.1290424992.1290508917.6;+__utmz=148702437. <br />
		1289882757.1.6.utmcsr=google|utmccn=(organic)|utmcmd=organic|utmctr=%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90;</p>
</blockquote>
<p>　　现在，我们一条条的看这些数据到底是什么意思。</p>
<ul>
<li><strong>utma</strong></li>
</ul>
<p>　　记录visitor的信息，utma后面的信息，包括域的hash值，visitor的ID、访问时间相关信息和访问次数。utma对应的信息，除非人为删除，否则它在两年后才失效。为了免去我自己作图的痛苦，我直接利用了<a href="http://services.google.com/analytics/breeze/en/ga_cookies/index.html" target="_blank">Google转化大学</a>中的图，因此下图中的数字信息跟上面的不一样，但相应信息的含义是完全一样的。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image8.png"><img alt="image" border="0" height="354" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image_thumb7.png" style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="image" width="575" /></a></p>
<p align="center">本图的来源为<a href="http://services.google.com/analytics/breeze/en/ga_cookies/index.html">http://services.google.com/analytics/breeze/en/ga_cookies/index.html</a> <br />
	版权归Google所有</p>
<p align="left">　　第一个蓝色的字段是域名的哈希串，对于一个确定的域名来说，这个值是不会改变的。</p>
<p align="left">　　第二个字段（绿色字段）是识别visitor的ID，就是这个绿色字段，标识了不同的访问者，<strong>不同的值就意味着不同的访问者。这就是GA能够辨别不同访问者的原因。</strong>这个值如果不发生人为地删除cookie的情况的话，两年后才会被替换为一个新的值。</p>
<p align="left">　　第三个字段（紫色字段）是这个visitor第一次访问网站的时间，如果不删除cookie，两年内这个值也不会变。这个时间是UNIX时间，0000000001代表着1970年1月1日0点0分1秒，之后每过一秒，数字加一。实际上UNIX时间是有点小错误的，但是已经不会再对使用产生影响。这里同学们需要注意了。<strong>这里以及cookie中其他的UNIX时间记录，构成了GA的整个时间度量系统</strong>。时间是这么创造的！</p>
<p align="left">　　第四个字段（浅蓝色字段）是这个visitor前一个visit开始的时间。</p>
<p align="left">　　第五个字段（浅紫色字段）是这个visitor这一次visit开始的时间。</p>
<p>　　第六个字段（最后那个独立数字）太重要了，是记录这个visitor访问网站的次数。</p>
<p>　　现在，再回头看看前面的我的网站（CWA，China Web Analytics，<a href="http://www.chinawebanalytics.cn">http://www.chinawebanalytics.cn</a>）的utma，大家会发现这个visitor（就是我）已经有6次访问了。</p>
<p><strong>　　通过第六个字段值的增加与否，就能判断GA是否记录某一次访问行为为一次新的visit。</strong></p>
<ul>
<li><strong>utmz</strong></li>
</ul>
<p>　　utmz的功能是用来记录网站访问者的来源（即Traffic Source或者Campaign），如下：</p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image9.png"><img alt="image" border="0" height="147" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image_thumb8.png" style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="image" width="561" /></a></p>
<p align="right"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image10.png"><img alt="image" border="0" height="122" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image_thumb9.png" style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="image" width="319" /></a></p>
<p>　　这里各个字段的含义除了Campaign Number之外就不多解释了，大家肯定能看懂。Campaign Number是指这个访问者通过不同来源（除了直接来源）访问网站的来源数。如果通过了一个新的来源访问了网站，即使是在一个visit之内，campaign number也会加一，但visit并不会增加。</p>
<p>　　Campaign number的作用我并不是很明确，很希望知道的朋友告诉我。我知道的是，如果在一个visit之内，访问者通过多个来源访问了网站，那么GA默认把最后的那个来源归为这个visit的主人。如果你用utm_nooverride=1配置，那么GA则会把第一个来源记录为这个visit的主人。</p>
<ul>
<li><strong>utmb和utmc</strong></li>
</ul>
<p>　　utmb和utmc是另外两个重要的cookie信息，在免费版本的HttpWatch中看不到，不过没关系，大家用firebug就能看到。</p>
<p>　　简单讲，utmb和utmc都是记录visit的cookie。两个cookie的区别是，utmb在30分钟后过期，如果utmb过期刷新，那么visit也被刷新。utmc是浏览器关闭则随浏览器一起关闭（失效），再打开浏览器访问那个网站，visit也被刷新。这就是为什么GA的visit在不活动30分钟后结束，以及关闭浏览器结束的原因。</p>
<p style="text-align: center; "><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image11.png"><img alt="image" border="0" height="438" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image_thumb10.png" style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="image" width="569" /></a></p>
<p><strong>　　好了，讲到这里，可能很多朋友会有恍然大悟的感觉。我希望你们能有这样的感觉，否则我真的应该隐退了。如果您有这样的感觉，一定在留言框中写点儿什么&mdash;&mdash;心得、意见、问题，或者其他什么都可以。</strong></p>
<p>　　出差很忙很累，所以博客发晚了些，请大家原谅。后面是否写写网站分析工具获取数据的原理，看朋友们的反馈咯！</p>
<p>　　11月底了，悉尼已经可以看到圣诞节的气氛，到处都能看到圣诞树，可是这里的圣诞在夏天，感觉实在是太怪了。北京的圣诞节，时有下雪，感觉自然完全不同。预祝朋友们圣诞愉快！</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/metrics-and-its-back-story-2/feed/</wfw:commentRss>
		<slash:comments>28</slash:comments>
		</item>
		<item>
		<title>网站分析度量、意义以及不为人所知的（1）</title>
		<link>http://www.chinawebanalytics.cn/metrics-and-its-back-story-1/</link>
		<comments>http://www.chinawebanalytics.cn/metrics-and-its-back-story-1/#comments</comments>
		<pubDate>Sun, 07 Nov 2010 10:56:59 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[Featured]]></category>
		<category><![CDATA[基础知识]]></category>
		<category><![CDATA[网站分析的基本度量]]></category>
		<category><![CDATA[网站分析经验分享]]></category>
		<category><![CDATA[Bounce Rate]]></category>
		<category><![CDATA[CWA]]></category>
		<category><![CDATA[Exit Rate]]></category>
		<category><![CDATA[page view]]></category>
		<category><![CDATA[unique visitor]]></category>
		<category><![CDATA[UV]]></category>
		<category><![CDATA[Visit]]></category>
		<category><![CDATA[度量]]></category>
		<category><![CDATA[蹦失率]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=3166</guid>
		<description><![CDATA[【前言】网站分析的度量是网站分析入门的课程之一。我看到很多朋友提出了与之相关的很多问题，说明这个领域大家还是最想了解，也最拿捏不透的。准确把握度量，才使准确把握网站分析成为可能。
【正文】
　　首先三个通知：
　　1. 网站启用了新的域名：www.cwachina.com，同时，www.chinawebanalytics.cn作为永久域名仍然保留。
　　新的域名是为了让朋友们更容易输入这个博客而启用的，希望大家喜欢。
　　2. 十月份的度假结束了，感谢关心我的朋友们。我的旅途很棒，除了在厦门遇到了台风。同时要给很多朋友道个歉，你们的问题我没有来得及回答，就已经积累了太多了。我希望大家能够把这些问题集中到http://tech.groups.yahoo.com/group/chinawebanalytics/，这里有很多的网站分析从业朋友，大家可以集思广益。
　　3. 受中国传媒大学的邀请，可能在下个月的某个周末会给传媒大学的同学做一次关于网络营销和监测分析的分享。如果大家有兴趣，也请关注我的通知。希望大家能够带着最想解决的问题一起来。
　　今天的话题回到度量，因为度量是网站分析的骨骼，所谓皮之不存毛将焉附，没有度量，网站分析就成为不了一门科学。度量也是最多朋友们问起的问题，例如下面这个问题：

宋星老师： 
		有个困惑已久的问题.在GA里面的跳出率和退出率的问题。 
		他们的含义都知道：但是当他们同时存在时，主要看哪个数据比较好？ 
		如果是单独出现时还行，但是在GA里面 是同时出现的。

　　这是一个好问题，体现了非常棒的探究精神，以及直击问题本质的敏锐观察。类似的问题太多了，所以，重新发一系列帖子是必不可少的。现在开始，我们从最基本的，一些容易让我们混淆的度量概念开始。同时这篇文章不会再重复过去的内容（关于度量的内容，请大家看博客的网站地图），而只是画龙点睛，说一说大家最该了解的东西。
最基本的流量度量也有陷阱
　　Page view，visit和visitor是三个最基本的流量度量，这三个度量按照监测难度来区分是这样的：
Visit &#62; Visitor &#62; Page View
　　原因在于：
　　Page view只是一个简单计数，只是页面中的网站分析监测代码被运行了一次，仅此而已。它最简单。
　　Visitor同样是一个简单计数，是网站分析监测代码识别了一个不同的cookie，或是一个不同的IP（对某些工具，没有cookie的时候，用IP分辨visitor）来到了网站而已。但visitor肯定比page view复杂，因为它包含了对cookie或者IP的记录和判断。
　　Visit代表某一个visitor一系列的网站访问动作，每个动作之间的间隔不超过特定的时间（例如不超过30分钟）。它意味着判断几个事情：（1）要有一个visitor，如果判断不出visitor，visit也就没有意义；（2）要判断page view或者其他网站分析工具能够识别的网站访问动作；（3）要识别动作与动作之间的间隔时间。所以visit的判别最复杂。所以，我们在最早的用log file进行网站分析的时候，是没有非常明确的visit的概念的，只有session的概念。
　　那么，陷阱在哪儿呢？
　　Visitor和page view没有什么陷阱，它们俩是简单的计数度量，触发了就触发了，记录下来即可。可是visit存在陷阱。这个陷阱在于如下几种可能：

我在A网站访问了20分钟，第21分钟的时候从A网站（比如CWA网站：http://www.chinawebanalytics.cn）的链接（这个链接连接到B网站）跑到B网站，然后在25分钟的时候，又从B网站的链接（这个链接指回A网站）回到A网站。这个过程中浏览器窗口并没有关闭，那么这个过程A网站有几个visit？
我在A网站访问了20分钟，第21分钟的时候关闭A网站的页面，然后打开一个新的浏览器窗口，然后在25分钟的时候又打开新窗口输入A的网址回到A网站，这个过程中网站A有几个visit？
我在A网站访问了20分钟，第21分钟的时候关闭A网站的页面，然后打开一个新的浏览器页面，即Tab（注意，浏览器没有关闭），然后在25分钟的时候又打开新Tab输入A的网址回到A网站，这个过程中网站A有几个visit？


　　答案：首先，一定要明确不同的网站分析工具，对于上面三种情况的计数是不一样的。我们先看看GA是怎么做的。
1. 在30分钟内，且没有关闭浏览器&#8212;&#8212;注意是浏览器而不是浏览器Tab，即使从新的外部入口（例如不同的搜索引擎，不同的referring site，例如本例中中的B网站），也不会被记录为新的session。这意味着第一个题目的答案是1个visit。
2. 关闭了浏览器，意味着一个浏览器的session结束了。对于GA而言，这意味着一个新的visit。因此这个情况下visit是2。
3. 关闭了浏览器tab，但浏览器没有关闭，因此浏览器的session没有结束。对于GA而言，这不意味着一个session的结束，因此没有增加新的visit。这个情况下visit是1。
对于Omniture的SiteCatalyst，情况可能有一点不同。
1. 30分钟内，不会被记录为新的visit，因此是1个visit，跟GA情况一样。
2. 这个地方跟GA不同。Omniture的SiteCatalyst不以浏览器session结束作为新的visit的判定条件，因此这个visit还是1。
3. 跟GA一样，仍然是1个visit。
看来很多事情跟我们想的的确不太一样，不是吗？:)


图：Tab，伟大的Tab
　　我不想在这个里跟大家讨论这个三个问题的答案，欢迎大家在留言中讨论，要提醒的一点是不同的网站分析工具对于这些过程的定义都不太一样。所以，如果我们要选择一个网站分析工具，我们最好让供应商告诉我们他们对于这些基本度量的基本定义和监测方法是什么。
　　不过这三个问题直接回答了我们下面的问题：
（1）为什么Omniture SiteCatalyst监测到的visit只有Google Analytics的80%啊！
（2）为什么Google Analytics的数据和我服务器日志的数据相差那么远！
　　如果它们的数据一样我才会觉得奇怪呢 ！按下这些不同工具的不同区别不表（同类工具有些过大的区别当然可能意味着监测实施的不正确）。我想说的是，我们应该至少明白visit其实是一个非常复杂的度量，它绝对不像我们想象的那样简单。
　　因此，我们走出对这个度量的一般性理解，而进入一个根本性的问题&#8212;&#8212;为什么要设置&#8220;visit&#8221;这个度量？为什么我们不用page view或者visitor就可以了？
　　如果你能把这个问题想清楚，我想才算真正理解了visit。

图：It&#8217;s not as easy as you thought! 
　　答案其实很简单&#8212;&#8212;狭义的网站分析（Web Analytics）是分析什么的科学？是分析网站访问者行为的科学，因此落脚点是行为。所以，只有visitor肯定不行，visitor不附加上与之对应的行为，没有意义。但是，如果行为是孤立的，没有来龙去脉，同样意义不大，所以只有page view同样不行。Visit是为此而建立的，是为了衡量一个visitor的一系列体现为page view的行为。它是一个桥梁，让visitor和page view建立关系，也让访问者和行为建立联系，并以数据的方式进行表达。
　　听起来这是多么艺术的一个过程啊。这就是网站分析的美。如果你细细平常一些为什么背后的为什么，你会发现原来一花一世界。
即使是基本度量，也并非都有统一的定义
　　什么是质量，什么是长短，什么是速度，这些现实生活中我们经常用到的度量都有世界统一的标准的定义和单位。可是，在网站分析的世界中，并不是所有的度量都有统一的定义。
　　这是因为网站分析还是一个非常新的学科。网站分析这门学科的名字最初实际上也是不确定的。最早，人们用e-metrics（e度量），之后又有用web metrics（网站度量）的，直到最后越来越多的人开始用web analytics（网站分析），这门学科才有了正式的名字。
　　尽管学科名字被确定下来，但是学科内的很多度量还有这不同的解释。例如bounce rate（蹦失率），这个度量至今仍然存在两种以上的常见解释。除了解释的不同，不同的监测工具对于一些度量的算法也存在差异，例如上面说过的，对于如何辨识visitor，不同的工具就有不同的算法，visit也是如此。
　　为了解决不一致产生的矛盾，部分聪明的网站分析工具提供商会提供一些能够自定义度量的功能，可以让用户更加灵活的根据需要调整度量的定义和尺度，这客观上极大的增加了网站分析的适应性，产生了很好的效果。

　　但是，定义不一致毕竟不是一件好事，尤其是对于一些基本度量。因此业界的一些组织也在致力于建立一些国际标准，这些组织包括：英国发行量审计局（Britain&#8217;s Audit Bureau of Circulation，www.abc.org.uk）,网站标准联合产业委员会（the Joint Industry Committee for Web Standards，www.jicwebs.org）以及网站分析协会（the Web Analytics Association，www.webanalyticsassociation.org）。
　　对于不同的定义，最终可能的结果是，某一些被最多人使用的度量定义将成为业界约定俗成的定义，被最终成为实施标准。
　　但，千万别觉得一个网站分析工具的定义就代表了网站分析业界，那也许只是无数种定义和规定中的一种罢了。关键，是要理解这些度量存在的目的是什么，以及它对应的网站在现实世界中的状态是什么。
最基本的度量构成复合度量
　　最基本的度量非常简单，不足以描述更复杂的网站浏览行为，因此人们开始引入复合度量。所谓复合度量，就是多个基本度量应用四则运算组合而成的新度量。比如bounce rate，比如exit rate，比如PV / visit。
　　复合度量给新手朋友们带来了许多困扰。下面的文字希望能够解决你们的困扰。
　　首先看看Bounce Rate。Bounce Rate被称为跳出率（Google Analytics），或者蹦失率（China Web Analytics），你可以选择任何一种叫法，大家应该都能听得懂，我喜欢我发明的后者。
　　Bounce Rate一定要记住以下几点：

Bounce Rate不是衡量所有页面的度量，而是衡量所有页面仅仅作为landing page时候的度量。
它是一个特殊的度量。它可以衡量整个网站的表现，也可以用来衡量某个页面作为landing page时的表现。即，它既是一个网站级的度量，又是一个页面级的度量，关于这个，本文的后面再讲。
不同的网站分析工具对它的定义不同。（如果你想了解这一点，一定要读这个帖子：网站分析的最基本度量（5）&#8212;&#8212;Bounce Rate。）
它的公式不重要，它的目的和含义更重要。

　　现在我来谈谈它的目的是什么。
　　Bounce Rate的目的非常明确，即帮助人们搞清楚访问者进入你的网站的第一印象如何。请注意，是第一印象，是从网站外部进入网站的第一印象。
　　在这个目的之下，人们开始想，该怎样用一个度量来描述它呢？人们最先想到的，是用你进入网站开始到离开网站的时间间隔。比如，你来到腾讯网，你随便看了几眼，然后啐了一口口水说，&#8220;草，垄断&#8221;，然后就关了窗口，整个过程可能就5秒钟。这说明这个网站给你的印象不佳。所以，用时间来描述真是一个好主意。这是人们最初设想的方法，也是Avinash先生最初在他的博客上提倡的方法。
　　可是这个方法，存在一个很大的问题，那就是时间问题。你可能讨厌腾讯网，但由于网页tab的存在，你可能并不急于关闭它，而是打开一个新的网页，例如打开360杀毒的首页，津津有味的读起周鸿祎先生抨击腾讯网的&#8220;檄文&#8221;，然后半个小时后才发现怎么&#8220;恶心的&#8221;腾讯网还开着，这才关掉它。这个时候，时间来判断就存在偏差。另外一个很大的问题是，网站分析工具对于时间的监测和我们真实的在网页上浏览的时间并不可能完全一致。因此，时间方法来衡量网站第一印象，执行起来挺难。
　　但是人脑总是聪明的，虽然站在宇宙尺度上这样的聪明不过是浮云，和凤姐的美貌程度不见得能有多大差异，但我们并不畏惧困难。因此，另一种想法诞生了&#8212;&#8212;如果你进入这个网站的第一页就觉得讨厌，那么你不太可能花费时间继续浏览这个网站的其他页面，这就使bounce rate诞生了。bounce rate衡量的就是&#8212;&#8212;只访问一个页面的访问（visit）占总体访问（visit）的比例，或者是只访问一个页面的访问者（visitor）占总体访问者（visitor）的比例。至于何种数学定义并不重要，关键是，人们总算找到了一个跟时间无关的，而且容易计算的方法来衡量网站的第一印象。

　　这就是bounce rate的故事，所以bounce rate不用来衡量所有页面的所有访问，而只是用来衡量页面作为landing page时候的访问印象，因为landing page才是网站带给访问者的第一印象。所以，你也应该明白：一个网站的每个页面都有可能是landing page（因为搜索引擎能够把流量带到你的网站的任何一个页面上），但相对于不同的visit，每个页面只有一部分可能是landing page&#8212;&#8212;当且仅当这个visit进入网站访问的第一个页面是这个页面时。
　　Exit Rate呢？则是另外一个故事。Exit Rate衡量的是人们离开网站的行为。人总要离开一个网站，虽然我想吉尼斯世界纪录应该统计连续上网时间最长的人，但这个人毕竟也是会死的，所以即使他能100年持续访问一个网站，他也终须离开他心爱的网站。再说，cookie也没有那么长的时限。因此，人们更多的从网站的什么地方离开这个网站成为大家关心的问题。
　　Exit rate就是衡量这个事情的，说白了，exit rate就是一个网页作为网站出口的几率大小。exit rate=87%，就说明，经过这个页面所有的访问中，有87%的可能性从这个页面离开网站。这个网站当然要承担不能&#8220;留住&#8221;访问者的责任。
　　这样看来，bounce rate和exit rate两个度量被发明的初衷是没有什么关系的，它们各自衡量各自的，虽然很像，但其实逻辑完全不同。我刚刚学习网站分析的时候，我也很疑惑，拼命想搞清楚这两个度量的关系。现在看来，搞清这两者的关系其实没有多大意义，搞清楚什么时候该用它们中的哪一个才更有意义。

　　所以，我们不要让复合度量在数学上弄糊涂我们。我相信Google Analytics被发明出来的时候没有想到人们最后会那么精确计算这些复合度量，所以我们才会现在发现Google Analytics上有那么多数字对不拢的情况。但是，这根本不妨碍我们分析，因为在什么情况下该用什么我们早已了然于心。
计数度量和复合度量
　　现在，总结一下什么事计数度量，什么事复合度量。计数度量（count）是指不需要计算的，以记录个数、次数、时间长短等为目的的一元度量。page ...]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/W020070907413128626417.jpg"><img align="left" alt="W020070907413128626417" height="176" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/W020070907413128626417_thumb.jpg" style="margin: 5px 10px 0px 0px; display: inline; float: left" title="W020070907413128626417" width="172" /></a>【前言】网站分析的度量是网站分析入门的课程之一。我看到很多朋友提出了与之相关的很多问题，说明这个领域大家还是最想了解，也最拿捏不透的。准确把握度量，才使准确把握网站分析成为可能。</p>
<p>【正文】</p>
<p>　　首先三个通知：</p>
<p>　　1. 网站启用了新的域名：<a href="http://www.cwachina.com">www.cwachina.com</a>，同时，<a href="http://www.chinawebanalytics.cn">www.chinawebanalytics.cn</a>作为永久域名仍然保留。</p>
<p>　　新的域名是为了让朋友们更容易输入这个博客而启用的，希望大家喜欢。<span id="more-3166"></span></p>
<p>　　2. 十月份的度假结束了，感谢关心我的朋友们。我的旅途很棒，除了在厦门遇到了台风<img alt="微笑" class="wlEmoticon wlEmoticon-smile" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/wlEmoticon-smile.png" style="border-bottom-style: none; border-right-style: none; border-top-style: none; border-left-style: none" />。同时要给很多朋友道个歉，你们的问题我没有来得及回答，就已经积累了太多了。我希望大家能够把这些问题集中到<a href="http://tech.groups.yahoo.com/group/chinawebanalytics/" title="http://tech.groups.yahoo.com/group/chinawebanalytics/">http://tech.groups.yahoo.com/group/chinawebanalytics/</a>，这里有很多的网站分析从业朋友，大家可以集思广益。</p>
<p>　　3. 受中国传媒大学的邀请，可能在下个月的某个周末会给传媒大学的同学做一次关于网络营销和监测分析的分享。如果大家有兴趣，也请关注我的通知。希望大家能够带着最想解决的问题一起来。</p>
<p>　　今天的话题回到度量，因为度量是网站分析的骨骼，所谓皮之不存毛将焉附，没有度量，网站分析就成为不了一门科学。度量也是最多朋友们问起的问题，例如下面这个问题：</p>
<blockquote>
<p>宋星老师： <br />
		有个困惑已久的问题.在GA里面的跳出率和退出率的问题。 <br />
		他们的含义都知道：但是当他们同时存在时，主要看哪个数据比较好？ <br />
		如果是单独出现时还行，但是在GA里面 是同时出现的。</p>
</blockquote>
<p>　　这是一个好问题，体现了非常棒的探究精神，以及直击问题本质的敏锐观察。类似的问题太多了，所以，重新发一系列帖子是必不可少的。现在开始，我们从最基本的，一些容易让我们混淆的度量概念开始。同时这篇文章不会再重复过去的内容（关于度量的内容，请大家看博客的网站地图），而只是画龙点睛，说一说大家最该了解的东西。</p>
<h3>最基本的流量度量也有陷阱</h3>
<p>　　<a href="http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e6%9c%80%e5%9f%ba%e6%9c%ac%e6%a6%82%e5%bf%b5%ef%bc%884%ef%bc%89%e2%80%94%e2%80%94pv-page-view/">Page view</a>，<a href="http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e6%9c%80%e5%9f%ba%e6%9c%ac%e6%a6%82%e5%bf%b5%ef%bc%881%ef%bc%89%e2%80%94%e2%80%94visit/">visit</a>和<a href="http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e6%9c%80%e5%9f%ba%e6%9c%ac%e6%a6%82%e5%bf%b5%ef%bc%882%ef%bc%89%e2%80%94%e2%80%94uv/">visitor</a>是三个最基本的流量度量，这三个度量按照监测难度来区分是这样的：</p>
<p align="center"><strong>Visit &gt; Visitor &gt; Page View</strong></p>
<p>　　原因在于：</p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/theory-of-gravity.jpg"><img align="right" alt="theory-of-gravity" height="184" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/theory-of-gravity_thumb.jpg" style="margin: 5px 0px 0px 10px; display: inline; float: right" title="theory-of-gravity" width="240" /></a>　　Page view只是一个简单计数，只是页面中的网站分析监测代码被运行了一次，仅此而已。它最简单。</p>
<p>　　Visitor同样是一个简单计数，是网站分析监测代码识别了一个不同的cookie，或是一个不同的IP（对某些工具，没有cookie的时候，用IP分辨visitor）来到了网站而已。但visitor肯定比page view复杂，因为它包含了对cookie或者IP的记录和判断。</p>
<p>　　Visit代表某一个visitor一系列的网站访问动作，每个动作之间的间隔不超过特定的时间（例如不超过30分钟）。它意味着判断几个事情：（1）要有一个visitor，如果判断不出visitor，visit也就没有意义；（2）要判断page view或者其他网站分析工具能够识别的网站访问动作；（3）要识别动作与动作之间的间隔时间。所以visit的判别最复杂。所以，我们在最早的用log file进行网站分析的时候，是没有非常明确的visit的概念的，只有session的概念。</p>
<p>　　那么，陷阱在哪儿呢？</p>
<p>　　Visitor和page view没有什么陷阱，它们俩是简单的计数度量，触发了就触发了，记录下来即可。可是visit存在陷阱。这个陷阱在于如下几种可能：</p>
<ol>
<li>我在A网站访问了20分钟，第21分钟的时候从A网站（比如CWA网站：<a href="http://www.chinawebanalytics.cn">http://www.chinawebanalytics.cn</a>）的链接（这个链接连接到B网站）跑到B网站，然后在25分钟的时候，又从B网站的链接（这个链接指回A网站）回到A网站。这个过程中浏览器窗口并没有关闭，那么这个过程A网站有几个visit？</li>
<li>我在A网站访问了20分钟，第21分钟的时候关闭A网站的页面，然后打开一个新的浏览器窗口，然后在25分钟的时候又打开新窗口输入A的网址回到A网站，这个过程中网站A有几个visit？</li>
<li>我在A网站访问了20分钟，第21分钟的时候关闭A网站的页面，然后打开一个新的浏览器页面，即Tab（注意，浏览器没有关闭），然后在25分钟的时候又打开新Tab输入A的网址回到A网站，这个过程中网站A有几个visit？</li>
</ol>
<blockquote>
<p>　　答案：首先，一定要明确不同的网站分析工具，对于上面三种情况的计数是不一样的。我们先看看GA是怎么做的。</p>
<p>1. 在30分钟内，且没有关闭浏览器&mdash;&mdash;注意是浏览器而不是浏览器Tab，即使从新的外部入口（例如不同的搜索引擎，不同的referring site，例如本例中中的B网站），也不会被记录为新的session。这意味着第一个题目的答案是1个visit。</p>
<p>2. 关闭了浏览器，意味着一个浏览器的session结束了。对于GA而言，这意味着一个新的visit。因此这个情况下visit是2。</p>
<p>3. 关闭了浏览器tab，但浏览器没有关闭，因此浏览器的session没有结束。对于GA而言，这不意味着一个session的结束，因此没有增加新的visit。这个情况下visit是1。</p>
<p>对于Omniture的SiteCatalyst，情况可能有一点不同。</p>
<p>1. 30分钟内，不会被记录为新的visit，因此是1个visit，跟GA情况一样。</p>
<p>2. 这个地方跟GA不同。Omniture的SiteCatalyst不以浏览器session结束作为新的visit的判定条件，因此这个visit还是1。</p>
<p>3. 跟GA一样，仍然是1个visit。</p>
<p>看来很多事情跟我们想的的确不太一样，不是吗？:)</p>
</blockquote>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image.png"><img alt="image" height="62" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image_thumb.png" style="margin: 5px 10px 0px 0px; display: inline" title="image" width="486" /></a></p>
<p align="center"><strong>图：Tab，伟大的Tab</strong></p>
<p>　　我不想在这个里跟大家讨论这个三个问题的答案，欢迎大家在留言中讨论，<strong>要提醒的一点是不同的网站分析工具对于这些过程的定义都不太一样</strong>。所以，如果我们要选择一个网站分析工具，我们最好让供应商告诉我们他们对于这些基本度量的基本定义和监测方法是什么。</p>
<p>　　不过这三个问题直接回答了我们下面的问题：</p>
<p>（1）为什么Omniture SiteCatalyst监测到的visit只有Google Analytics的80%啊！</p>
<p>（2）为什么Google Analytics的数据和我服务器日志的数据相差那么远！</p>
<p>　　如果它们的数据一样我才会觉得奇怪呢<img alt="眨眼" class="wlEmoticon wlEmoticon-winkingsmile" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/wlEmoticon-winkingsmile.png" style="border-bottom-style: none; border-right-style: none; border-top-style: none; border-left-style: none" /> ！按下这些不同工具的不同区别不表（同类工具有些过大的区别当然可能意味着监测实施的不正确）。我想说的是，我们应该至少明白visit其实是一个非常复杂的度量，它绝对不像我们想象的那样简单。</p>
<p>　　因此，我们走出对这个度量的一般性理解，而进入一个根本性的问题&mdash;&mdash;为什么要设置&ldquo;visit&rdquo;这个度量？为什么我们不用page view或者visitor就可以了？</p>
<p>　　如果你能把这个问题想清楚，我想才算真正理解了visit。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/Not_As_Easy_As_You_Think.png"><img alt="Not_As_Easy_As_You_Think" border="0" height="246" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/Not_As_Easy_As_You_Think_thumb.png" style="background-image: none; border-bottom: 0px; border-left: 0px; margin: 5px 10px 0px 0px; padding-left: 0px; padding-right: 0px; display: inline; border-top: 0px; border-right: 0px; padding-top: 0px" title="Not_As_Easy_As_You_Think" width="244" /></a></p>
<p align="center"><strong>图：It&rsquo;s not as easy as you thought! <img alt="微笑" class="wlEmoticon wlEmoticon-smile" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/wlEmoticon-smile.png" style="border-bottom-style: none; border-right-style: none; border-top-style: none; border-left-style: none" /></strong></p>
<p>　　答案其实很简单&mdash;&mdash;狭义的网站分析（Web Analytics）是分析什么的科学？是分析网站访问者行为的科学，因此落脚点是行为。所以，只有visitor肯定不行，visitor不附加上与之对应的行为，没有意义。但是，如果行为是孤立的，没有来龙去脉，同样意义不大，所以只有page view同样不行。Visit是为此而建立的，是为了衡量一个visitor的一系列体现为page view的行为。它是一个桥梁，让visitor和page view建立关系，也让访问者和行为建立联系，并以数据的方式进行表达。</p>
<p>　　听起来这是多么艺术的一个过程啊。这就是网站分析的美。如果你细细平常一些为什么背后的为什么，你会发现原来一花一世界。</p>
<h3>即使是基本度量，也并非都有统一的定义</h3>
<p>　　什么是质量，什么是长短，什么是速度，这些现实生活中我们经常用到的度量都有世界统一的标准的定义和单位。可是，在网站分析的世界中，并不是所有的度量都有统一的定义。</p>
<p>　　这是因为网站分析还是一个非常新的学科。网站分析这门学科的名字最初实际上也是不确定的。最早，人们用e-metrics（e度量），之后又有用web metrics（网站度量）的，直到最后越来越多的人开始用web analytics（网站分析），这门学科才有了正式的名字。</p>
<p>　　尽管学科名字被确定下来，但是学科内的很多度量还有这不同的解释。例如bounce rate（<b>蹦失率</b>），这个度量至今仍然存在两种以上的常见解释。除了解释的不同，不同的监测工具对于一些度量的算法也存在差异，例如上面说过的，对于如何辨识visitor，不同的工具就有不同的算法，visit也是如此。</p>
<p>　　为了解决不一致产生的矛盾，部分聪明的网站分析工具提供商会提供一些能够自定义度量的功能，可以让用户更加灵活的根据需要调整度量的定义和尺度，这客观上极大的增加了网站分析的适应性，产生了很好的效果。</p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/web-standards.jpg"><img align="left" alt="web-standards" border="0" height="142" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/web-standards_thumb.jpg" style="background-image: none; border-bottom: 0px; border-left: 0px; margin: 5px 10px 0px 0px; padding-left: 0px; padding-right: 0px; display: inline; float: left; border-top: 0px; border-right: 0px; padding-top: 0px" title="web-standards" width="240" /></a></p>
<p>　　但是，定义不一致毕竟不是一件好事，尤其是对于一些基本度量。因此业界的一些组织也在致力于建立一些国际标准，这些组织包括：英国发行量审计局（Britain&rsquo;s Audit Bureau of Circulation，<a href="http://www.abc.org.uk">www.abc.org.uk</a>）,网站标准联合产业委员会（the Joint Industry Committee for Web Standards，<a href="http://www.jicwebs.org">www.jicwebs.org</a>）以及网站分析协会（the Web Analytics Association，<a href="http://www.webanalyticsassociation.org">www.webanalyticsassociation.org</a>）。</p>
<p>　　对于不同的定义，最终可能的结果是，某一些被最多人使用的度量定义将成为业界约定俗成的定义，被最终成为实施标准。</p>
<p>　　但，千万别觉得一个网站分析工具的定义就代表了网站分析业界，那也许只是无数种定义和规定中的一种罢了。<strong>关键，是要理解这些度量存在的目的是什么，以及它对应的网站在现实世界中的状态是什么。</strong></p>
<h3>最基本的度量构成复合度量</h3>
<p>　　最基本的度量非常简单，不足以描述更复杂的网站浏览行为，因此人们开始引入复合度量。所谓复合度量，就是多个基本度量应用四则运算组合而成的新度量。比如bounce rate，比如exit rate，比如PV / visit。</p>
<p>　　复合度量给新手朋友们带来了许多困扰。下面的文字希望能够解决你们的困扰。</p>
<p>　　首先看看Bounce Rate。Bounce Rate被称为跳出率（Google Analytics），或者蹦失率（China Web Analytics），你可以选择任何一种叫法，大家应该都能听得懂，我喜欢我发明的后者。<img alt="微笑" class="wlEmoticon wlEmoticon-smile" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/wlEmoticon-smile.png" style="border-bottom-style: none; border-right-style: none; border-top-style: none; border-left-style: none" /></p>
<p>　　Bounce Rate一定要记住以下几点：</p>
<ol>
<li>Bounce Rate不是衡量所有页面的度量，<strong>而是衡量所有页面仅仅作为<a href="http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e6%9c%80%e5%9f%ba%e6%9c%ac%e6%a6%82%e5%bf%b5%ef%bc%886%ef%bc%89%e2%80%94%e2%80%94home-page%e5%92%8clanding-page/">landing page</a>时候的度量</strong>。</li>
<li>它是一个特殊的度量。它可以衡量整个网站的表现，也可以用来衡量某个页面作为landing page时的表现。即，它既是一个网站级的度量，又是一个页面级的度量，关于这个，本文的后面再讲。</li>
<li>不同的网站分析工具对它的定义不同。（如果你想了解这一点，一定要读这个帖子：<a href="http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e6%9c%80%e5%9f%ba%e6%9c%ac%e6%a6%82%e5%bf%b5%ef%bc%885%ef%bc%89%e2%80%94%e2%80%94bounce-rate/">网站分析的最基本度量（5）&mdash;&mdash;Bounce Rate</a>。）</li>
<li>它的公式不重要，它的目的和含义更重要。</li>
</ol>
<p>　　现在我来谈谈它的目的是什么。</p>
<p>　　Bounce Rate的目的非常明确，即<strong>帮助人们搞清楚访问者进入你的网站的第一印象如何</strong>。请注意，是第一印象，是从网站外部进入网站的第一印象。</p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/1st_impression.jpg"><img align="right" alt="1st_impression" border="0" height="194" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/1st_impression_thumb.jpg" style="background-image: none; border-bottom: 0px; border-left: 0px; margin: 5px 0px 0px 10px; padding-left: 0px; padding-right: 0px; display: inline; float: right; border-top: 0px; border-right: 0px; padding-top: 0px" title="1st_impression" width="171" /></a>　　在这个目的之下，人们开始想，该怎样用一个度量来描述它呢？人们最先想到的，是用你进入网站开始到离开网站的时间间隔。比如，你来到腾讯网，你随便看了几眼，然后啐了一口口水说，&ldquo;草，垄断&rdquo;，然后就关了窗口，整个过程可能就5秒钟。这说明这个网站给你的印象不佳。所以，用时间来描述真是一个好主意。这是人们最初设想的方法，也是<a href="http://www.kaushik.net/avinash">Avinash先生</a>最初在他的博客上提倡的方法。</p>
<p>　　可是这个方法，存在一个很大的问题，那就是时间问题。你可能讨厌腾讯网，但由于网页tab的存在，你可能并不急于关闭它，而是打开一个新的网页，例如打开360杀毒的首页，津津有味的读起周鸿祎先生抨击腾讯网的&ldquo;檄文&rdquo;，然后半个小时后才发现怎么&ldquo;恶心的&rdquo;腾讯网还开着，这才关掉它。这个时候，时间来判断就存在偏差。另外一个很大的问题是，网站分析工具对于时间的监测和我们真实的在网页上浏览的时间并不可能完全一致。因此，时间方法来衡量网站第一印象，执行起来挺难。</p>
<p>　　但是人脑总是聪明的，虽然站在宇宙尺度上这样的聪明不过是浮云，和凤姐的美貌程度不见得能有多大差异，但我们并不畏惧困难。因此，另一种想法诞生了&mdash;&mdash;如果你进入这个网站的第一页就觉得讨厌，那么你不太可能花费时间继续浏览这个网站的其他页面，这就使bounce rate诞生了。bounce rate衡量的就是&mdash;&mdash;只访问一个页面的访问（visit）占总体访问（visit）的比例，或者是只访问一个页面的访问者（visitor）占总体访问者（visitor）的比例。至于何种数学定义并不重要，关键是，人们总算找到了一个跟时间无关的，而且容易计算的方法来衡量网站的第一印象。</p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/QQfxck360.jpg"><img align="left" alt="QQfxck360" border="0" height="165" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/QQfxck360_thumb.jpg" style="background-image: none; border-bottom: 0px; border-left: 0px; margin: 5px 10px 0px 0px; padding-left: 0px; padding-right: 0px; display: inline; float: left; border-top: 0px; border-right: 0px; padding-top: 0px" title="QQfxck360" width="244" /></a></p>
<p>　　这就是bounce rate的故事，所以bounce rate不用来衡量所有页面的所有访问，而只是用来衡量页面作为landing page时候的访问印象，因为landing page才是网站带给访问者的第一印象。所以，你也应该明白：一个网站的每个页面都有可能是landing page（因为搜索引擎能够把流量带到你的网站的任何一个页面上），但相对于不同的visit，每个页面只有一部分可能是landing page&mdash;&mdash;当且仅当这个visit进入网站访问的第一个页面是这个页面时。</p>
<p>　　Exit Rate呢？则是另外一个故事。Exit Rate衡量的是人们离开网站的行为。人总要离开一个网站，虽然我想吉尼斯世界纪录应该统计连续上网时间最长的人，但这个人毕竟也是会死的，所以即使他能100年持续访问一个网站，他也终须离开他心爱的网站。再说，cookie也没有那么长的时限。因此，人们更多的从网站的什么地方离开这个网站成为大家关心的问题。</p>
<p>　　Exit rate就是衡量这个事情的，说白了，exit rate就是一个网页作为网站出口的几率大小。exit rate=87%，就说明，经过这个页面所有的访问中，有87%的可能性从这个页面离开网站。这个网站当然要承担不能&ldquo;留住&rdquo;访问者的责任。</p>
<p>　　这样看来，bounce rate和exit rate两个度量被发明的初衷是没有什么关系的，它们各自衡量各自的，虽然很像，但其实逻辑完全不同。我刚刚学习网站分析的时候，我也很疑惑，拼命想搞清楚这两个度量的关系。现在看来，搞清这两者的关系其实没有多大意义，搞清楚什么时候该用它们中的哪一个才更有意义。</p>
<p style="text-align: center; "><img align="absMiddle" alt="" height="629" src="http://www.chinawebanalytics.cn/wp-content/uploads/360vs_qq.jpg" width="345" /></p>
<p>　　所以，我们不要让复合度量在数学上弄糊涂我们。我相信Google Analytics被发明出来的时候没有想到人们最后会那么精确计算这些复合度量，所以我们才会现在发现Google Analytics上有那么多数字对不拢的情况。但是，这根本不妨碍我们分析，因为在什么情况下该用什么我们早已了然于心。</p>
<h3>计数度量和复合度量</h3>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/integrating.jpg"><img align="left" alt="integrating" height="182" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/integrating_thumb.jpg" style="margin: 5px 10px 0px 0px; display: inline; float: left" title="integrating" width="179" /></a>　　现在，总结一下什么事计数度量，什么事复合度量。计数度量（count）是指不需要计算的，以记录个数、次数、时间长短等为目的的一元度量。page view，visit，visitor都是计数度量，overall time on page，也是计数度量。计数度量不可以再拆分。</p>
<p>　　复合度量(calculate)是指由多个计数度量进行公式运算（一般是四则运算）组合而成的度量。例如，我们常用的衡量访问者访问页面广度的度量&mdash;&mdash;page view/visit，即是用page view除以visit而得来。</p>
<p>　　计数度量和复合度量有涉及到如何通过数据表达的问题。通常，网站分析对于度量具体数值的表达都是用计数的方法展现的，例如，网站在5月份的visit是34,567个，访问者是23,456个云云。计数度量常常都对应其数据报告的计数表达。</p>
<p>　　对于复合度量，同样也用计数报告来表示，例如网站的bounce rate是13.3%。计数报告是最常见的网站分析报告。下面的报告就是典型的计数报告：</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image1.png"><img alt="image" height="236" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image_thumb1.png" style="margin: 5px 10px 0px 0px; display: inline" title="image" width="492" /></a></p>
<p>　　另一种报告被称为分布报告，记录了不同统计维度的分布情况，例如图D就是一个典型的分布报告，标明了不同路径长度所对应的visit的数量。</p>
<p>　　下图也是一个典型的分布报告，所展示的是不同时间长度的访问的数量分布：</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image2.png"><img alt="image" height="211" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image_thumb2.png" style="margin: 5px 10px 0px 0px; display: inline" title="image" width="494" /></a></p>
<p>　　计数报告和分布报告都是网站分析工具常用的数据展示形式，在制作网站分析报告的时候，我们也同样经常使用这两种形式。可以说，计数和分布是我们每天都要打交道的最常见模型。</p>
<p>　　好了，今天就谈到这里。大家如果有什么想法，欢迎多多留言！最后分享一个电影&mdash;&mdash;<a href="http://www.mtime.com/movie/109928/">《第三十六个故事》</a>是台湾的文艺小品类型的电影，文艺腔调十足，但我觉得够给力，想起了我以前开餐厅的岁月，推荐给喜欢&ldquo;网站分析在中国&rdquo;的女生们&mdash;&mdash;当然，最好你们也能顺带喜欢我 <img alt="吐舌笑脸" class="wlEmoticon wlEmoticon-smilewithtongueout" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/wlEmoticon-smilewithtongueout.png" style="border-bottom-style: none; border-right-style: none; border-top-style: none; border-left-style: none" />。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/metrics-and-its-back-story-1/feed/</wfw:commentRss>
		<slash:comments>42</slash:comments>
		</item>
		<item>
		<title>Avinash：什么是目标、度量、KPI、维度和细分</title>
		<link>http://www.chinawebanalytics.cn/wa-basic-terms/</link>
		<comments>http://www.chinawebanalytics.cn/wa-basic-terms/#comments</comments>
		<pubDate>Fri, 07 May 2010 12:24:22 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[Featured]]></category>
		<category><![CDATA[海外资源]]></category>
		<category><![CDATA[网站分析经验分享]]></category>
		<category><![CDATA[Avinash]]></category>
		<category><![CDATA[KPI]]></category>
		<category><![CDATA[度量]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=2265</guid>
		<description><![CDATA[　　周末准备好好出去逛一下，所以，提前把这周的作业交了，给朋友们一个交代哦！:)
　　今天看到了Avinash的一篇文章：Web Analytics 101: Definitions: Goals, Metrics, KPIs, Dimensions, Targets，正是我想在影响网站转化率的10大误区中准备给大家说说的，但Avinash写得更好，所以我直接翻译（意译，加上我的理解和一些其他补充资料）了，介绍给大家。
　　首先，我们要讨论的，是多个关于&#8220;尺度&#8221;的术语。这些术语容易混淆，包括：

Business Objectives （商业目的）
Goals（目标）
Metrics（度量）
Key Performance Indicators（关键绩效指标）
Targets（指标）
Dimensions（维度）
Segments（细分）

　　其实，翻译上面的这些说法让我挺郁闷的。Objective、Goal、Target在汉语里面都只有一个翻译&#8212;&#8212;&#8220;目标&#8221;，顶多可以多说一个&#8220;目的&#8221;，可是英语里面却是完完全全有差别的意思！这些细微的差别，已经超过了我的汉语的解释能力了，我只能说说我的感觉：Objective是大的目的，是宏观的；Goal是大目的下的小目标；这两个事物都会具体到某些事情上。Target则是另一个维度的衡量，是为每个具体目标设定的可以丈量的值。
　　举个不恰当的例子。男生找老婆，是一个很重大的目的（Objective）。为了找到老婆，决定每星期跟女生看电影、吃饭、逛街&#8230;&#8230;这是具体的目标（Goal）。这个案例下的Target是每星期至少看1场电影，吃3次饭，逛2次街&#8230;&#8230;相信你能理解了。
　　我们看看Avinash是怎么解说的。
Business Objectives:
　　商业目的是回答如下问题：&#8220;为什么你的网站存在于这个世界上？&#8221;
　　或者，是回答：&#8220;在生意上，你的网站想要实现些什么？&#8221;
　　或者，是回答：&#8220;你的网站优先级最为重大的三个事情是什么？&#8221;
　　以及其他类似的回答。这些问题如此重要，因为如果你不知道你想到哪儿，那么你就不知道该选什么路！
　　Business Objective需要符合DUMB原则，也就是Doable（可行的）、Understandable（可被你以及其他人达成共识的）、Manageable（可被管理的）、Beneficial（有利可图的）。很多时候，客户手中的数据充裕，但有用的信息的极度匮乏，这根本就是因为商业目的不符合DUMB原则造成的，因而导致了大量的网站分析项目失败。
　　从我（Sidney）自己的理解看，Business Objective在一个时期内，不应该是多元的，而应该是专注的。网站最常见的Business Objective的目标是增加的网站的盈利能力；或者增加网站对受众的影响力（指那些不直接赚钱的网站）；或者更好的服务于受众（例如政府网站）。这些其实都是大目标，是相对抽象的愿望，但是却又是实实在在的网站存在的价值所在。
　　不建议商业目的多元的原因在于，我们不容易把握多个目标之间的关系，容易顾此失彼，结果两头不就。能操作多个商业目的的天才肯定也有，但试错之后才知你我是不是其中一个，有时候代价太大。
Goals:
　　Avinash的解释是：采取的某些针对性的策略以撬动商业目的的实现（Goals are specific strategies you&#39;ll leverage to accomplish your business objectives），这个解释其实还是有些模糊。我觉得，所谓Goal就是为了实现商业目的而需要实现的一些具体的里程碑的事件。在Omniture中，这些事件被称为Success Event。Avinash这里用的撬动（leverage）这个词很好，这些事件也许不是直接的目的所在，但是实现这些事情能够撬动商业目的的实现，是推手，是支点，也是杠杆。
　　Goal可能仍然是比较高屋建瓴的，但是已经比较具体。例如，以增加网站盈利能力的Business Objective而言，Goal可以是增加更多的销售量（Success Event1）+节约营销成本（Success Event2）。这两个Goal同时作用是能够撬动盈利能力的增加的。另一个例子，以更好地服务于受众来看，Goal可以是提升网站访问者使用数字化服务工具的数量（Success Event1）+降低用户的意见或投诉（Success Event2）。同样，这两个Goal是实现优质服务的支点。
　　因此，旨在提升盈利的Goal们通常具有如下的形式：

做某事；
提升什么；
降低什么；

　　Goal代表着具体的策略，这是与Objective有最明显区别的地方，他们必须是符合DUMB原则的，而且这些Goal属于那些一说出来，人人都能立即会意，而且都完全认同的东西。
　　由于Goal意味着具体的策略，因此我们在Google Analytics中设置的那些被称为&#8220;Goal&#8221;的事件，事实上并不一定都是真正的Goal。

　　例如上图中的Goal中，其实只有第四个&#8220;Subscribers（提交）&#8221;是真正意义上的Goal，因为它的存在代表着网站对访问者的说服。而其他的Goal则没有明显的策略性，只是记录了发生的相关性事件。
Metric:
　　Metric恐怕是大家最熟悉的了，就是度量。我们天天跟它们打交道。度量包括计数度量（count，例如Page View，Visit和Visitor等）和复合度量（ratio，例如bounce rate，Page View/Visit等），是我们进行网站分析的砖和瓦。Metric其实最对应的汉语实际上是&#8220;量词&#8221;，比如&#8220;一片、一个、一次&#8221;等等。
　　Avinash非常经典的说，度量就是那些似乎永远都只能作为&#8220;列&#8221;的名称而不作为&#8220;行&#8221;的名称的东西。似乎在Google Analytics和Omniture中的确如此。度量大家都清楚，就不多说了，看看下图，都是常用（或者不常用）的度量。:)

Key Performance Indicator:
　　好了，终于轮到关键绩效指标了，台湾人也有翻译成关键绩效指针的，都一样。Avinash对于KPI的定义是，帮助你理解你所达到的商业目的程度的度量。我的理解是，KPI本质上就是度量，计数度量和复合度量都可能，这些度量是直接反应Business Objective对应的Goal的实现情况的。
　　因为每个公司的Business Objective都可能不一样，因此，每个公司的KPI基本上也要具有自己的特色。
　　Avinash举了几个好例子。例如，百思买（www.bestbuy.com）网站的商业目的是依靠售卖盈利，它的KPI中肯定有平均订单金额（Average Order Size）。但是，我们也用过Visit，或者视频播放量作为报告中的分析度量，可是这些度量却很少被称为KPI。
　　当然，在我们国家，其实也有不少网站是把Visit作为KPI的，不过在国外相对比较少见。
　　如果使用Omniture，那么Omniture中eVar所定义的那些success events经常会被选出来作为KPI，而s.prop定义的那些traffic度量，则几乎很少被用作KPI。原因同上。
　　如果是纽约时报网站（www.nytimes.com），Avinash建议了两个KPI，一个是访问者的忠诚度（用一个访问者平均一个月内访问次数来衡量）；另一个则是访问者点击广告的数量。当然，如果是我的这个博客（www.chinawebanalytics.cn），我还会加两个KPI，那就是平均文章的留言数量和RSS订阅数量。
　　由于KPI和Business Objective和Goal紧密相连，因此如果Business Objective没有定义好，那么KPI也就不会正确。从重要性看，有如下的不等式：
　　Business Objectives -&#62; Goals -&#62; KPI&#39;s -&#62; Metrics -&#62; Magic. （最后的Magic当然是Avinash在跟我们开玩笑了）
Targets:
　　Target是一个具体的数字，用来衡量KPI应该达到的量。一个KPI肯定会有一个target，没有target的KPI什么都不是。

　　Target不是订的越高越好。但是我（Sidney）的经验是，Target在我曾经的客户那边总是越来越高。这次项目达到了100，下次就要做到200，再下次就要300，结果到了总有一天实现不了的程度却还在不断往上加。结果，咳，造就了一些啼笑皆非的数字，而且这些数字至今还在维系&#8230;&#8230;不只是杯具还是洗具。
　　上面的不等式现在可以扩展为Business Objectives -&#62; Goals -&#62; KPIs -&#62; Metrics -&#62; Targets -&#62; Minor Orgasms。
Dimension:
　　Dimension可以翻译成方面或者维度，但是又是一个无法找到具体对应汉语词的词语。Dimension指网站访问者或者网站本身的某一个属性。例如，下图就是一个访问者的诸多属性：

　　访问者的来源（例如referring urls, campaigns, 国家等）也都是网站分析数据的不同维度。
　　常见的维度还有，页面的名称、产品名称、搜索关键词等等。所以，Dimension是属性。
　　忽然想到一个例子，我们都玩网络游戏，网游中你的各项属性名称：生命、体力、经验、魅力等等，都是属性，都是Dimension，只不过他们的metric名称都一样罢了&#8212;&#8212;点数，比如生命点数还剩多少。网站分析的维度和度量其实跟网游的道理一样。
　　Avinash说，Dimension就是那些数据行的名称。

这个图中，Page URL就是Dimension，度量当然是Visits和Avg. clicks啦

两个Dimension在一起也没问题。在Omniture的Data Warehouse中，可以定义多个Dimension叠加（类似数据透视表的多个属性叠加），不过数据处理就是海量了。
　　在GA和Yahoo网站分析工具中，当然是可以自己定义维度和度量之间的组合咯。不过组合要合理。这个就不说了，大家自己摸索一下GA的Custom Report就知道了，很简单。

Segments:
　　终于到细分了。我直接写我的理解。细分就是对某一个维度进行的进一步区分。例如，对访问者的忠诚度进行细分，我们可以定义所有访问者中，平均每次Visit浏览的页面PV超过了3页的访问者。另一个例子是，访问者中，属于亚洲国家的访问者。或者，所有的网站页面中，页面名字中间包含了&#8220;webanalytics&#8221;的页面。
　　
　　你可以看到，所谓细分就是按照一定的规则对Dimension进行的再次细化。这个规则可以是单一规则，当然也可以是多重规则。你可以筛选所有访问者中访问时间长于3分钟的访问者，同时，你还可以再加一个限定条件，即超过3分钟，却又浏览页面少于3个PV的访问者。It&#39;s up to you!
　　还记得我说的网站分析的三个基本思维模型吗&#8212;&#8212;细分、趋势和转化。哈哈，就是这个细分咯！请记住：没有细分，就没有真知灼见！
Web Analytics Measurement Framework
　　最后，我们把上面所有这些术语集合在一起，看看大图景是什么样的。我们用Avinash的例子。
　　Avinash是美国国家La Raza委员会的负责人，对这个协会的网站进行测量的框架如下（我就不翻译了，大家一看即明）：
&#160;
Business Objective:

Attendance at immigration rallies.

Goals:

Increase web sign ups.

Key ...]]></description>
			<content:encoded><![CDATA[<p><img align="left" alt="" height="111" src="http://www.kaushik.net/avinash/wp-content/uploads/2010/04/cluster.jpg" width="171" />　　周末准备好好出去逛一下，所以，提前把这周的作业交了，给朋友们一个交代哦！:)</p>
<p>　　今天看到了<a href="http://www.kaushik.net/avinash">Avinash</a>的一篇文章：<a class="APEdocument APEinternal" href="http://www.kaushik.net/avinash/2010/04/web-analytics-101-definitions-goals-metrics-kpis-dimensions-targets.html" rel="bookmark" target="_blank" title="Permanent Link: Web Analytics 101: Definitions:  Goals, Metrics, KPIs, Dimensions, Targets">Web Analytics 101: Definitions: Goals, Metrics, KPIs, Dimensions, Targets</a>，正是我想在<a href="http://www.chinawebanalytics.cn/top10-misunderstanding-for-web-analytics-part1/">影响网站转化率的10大误区</a>中准备给大家说说的，但Avinash写得更好，所以我直接翻译（意译，加上我的理解和一些其他补充资料）了，介绍给大家。</p>
<p>　　首先，我们要讨论的，是多个关于&ldquo;尺度&rdquo;的术语。这些术语容易混淆，包括：<span id="more-2265"></span></p>
<ul>
<li>Business Objectives （商业目的）</li>
<li>Goals（目标）</li>
<li>Metrics（度量）</li>
<li>Key Performance Indicators（关键绩效指标）</li>
<li>Targets（指标）</li>
<li>Dimensions（维度）</li>
<li>Segments（细分）</li>
</ul>
<p>　　其实，翻译上面的这些说法让我挺郁闷的。Objective、Goal、Target在汉语里面都只有一个翻译&mdash;&mdash;&ldquo;目标&rdquo;，顶多可以多说一个&ldquo;目的&rdquo;，可是英语里面却是完完全全有差别的意思！这些细微的差别，已经超过了我的汉语的解释能力了，我只能说说我的感觉：Objective是大的目的，是宏观的；Goal是大目的下的小目标；这两个事物都会具体到某些事情上。Target则是另一个维度的衡量，是为每个具体目标设定的可以丈量的值。</p>
<p>　　举个不恰当的例子。男生找老婆，是一个很重大的目的（Objective）。为了找到老婆，决定每星期跟女生看电影、吃饭、逛街&hellip;&hellip;这是具体的目标（Goal）。这个案例下的Target是每星期至少看1场电影，吃3次饭，逛2次街&hellip;&hellip;相信你能理解了。</p>
<p>　　我们看看Avinash是怎么解说的。</p>
<p><span class="Apple-style-span" style="color: rgb(41, 48, 59); font-family: Verdana; font-size: 13px; line-height: 19px; "><strong><font color="blue">Business Objectives:</font></strong></span></p>
<p>　　<u>商业目的</u>是回答如下问题：&ldquo;为什么你的网站存在于这个世界上？&rdquo;</p>
<p>　　或者，是回答：&ldquo;在生意上，你的网站想要实现些什么？&rdquo;</p>
<p>　　或者，是回答：&ldquo;你的网站优先级最为重大的三个事情是什么？&rdquo;</p>
<p>　　以及其他类似的回答。这些问题如此重要，因为如果你不知道你想到哪儿，那么你就不知道该选什么路！</p>
<p>　　Business Objective需要符合DUMB原则，也就是Doable（可行的）、Understandable（可被你以及其他人达成共识的）、Manageable（可被管理的）、Beneficial（有利可图的）。很多时候，客户手中的数据充裕，但有用的信息的极度匮乏，这根本就是因为商业目的不符合DUMB原则造成的，因而导致了大量的网站分析项目失败。<img align="right" alt="" height="215" src="http://www.kaushik.net/avinash/wp-content/uploads/2010/04/progress_objectives_directions.png" width="160" /></p>
<p>　　从我（<a href="http://www.chinawebanalytics.cn">Sidney</a>）自己的理解看，Business Objective在一个时期内，不应该是多元的，而应该是专注的。网站最常见的Business Objective的目标是增加的网站的盈利能力；或者增加网站对受众的影响力（指那些不直接赚钱的网站）；或者更好的服务于受众（例如政府网站）。这些其实都是大目标，是相对抽象的愿望，但是却又是实实在在的网站存在的价值所在。</p>
<p>　　不建议商业目的多元的原因在于，我们不容易把握多个目标之间的关系，容易顾此失彼，结果两头不就。能操作多个商业目的的天才肯定也有，但试错之后才知你我是不是其中一个，有时候代价太大。</p>
<p><span class="Apple-style-span" style="color: rgb(41, 48, 59); font-family: Verdana; font-size: 13px; line-height: 19px; "><strong><font color="blue">Goals:</font></strong></span></p>
<p>　　Avinash的解释是：采取的某些针对性的策略以<strong>撬动</strong>商业目的的实现（Goals are specific strategies you&#39;ll leverage to accomplish your business objectives），这个解释其实还是有些模糊。我觉得，所谓Goal就是为了实现商业目的而需要实现的一些具体的里程碑的事件。在Omniture中，这些事件被称为Success Event。Avinash这里用的撬动（leverage）这个词很好，这些事件也许不是直接的目的所在，但是实现这些事情能够撬动商业目的的实现，是推手，是支点，也是杠杆。</p>
<p>　　Goal可能仍然是比较高屋建瓴的，但是已经比较具体。例如，以增加网站盈利能力的Business Objective而言，Goal可以是增加更多的销售量（Success Event1）+节约营销成本（Success Event2）。这两个Goal同时作用是能够撬动盈利能力的增加的。另一个例子，以更好地服务于受众来看，Goal可以是提升网站访问者使用数字化服务工具的数量（Success Event1）+降低用户的意见或投诉（Success Event2）。同样，这两个Goal是实现优质服务的支点。</p>
<p>　　因此，旨在提升盈利的Goal们通常具有如下的形式：</p>
<ul>
<li>做某事；</li>
<li>提升什么；</li>
<li>降低什么；</li>
</ul>
<p>　　Goal代表着具体的策略，这是与Objective有最明显区别的地方，他们必须是符合DUMB原则的，而且这些Goal属于那些一说出来，人人都能立即会意，而且都完全认同的东西。</p>
<p>　　由于Goal意味着具体的策略，因此我们在Google Analytics中设置的那些被称为&ldquo;Goal&rdquo;的事件，事实上并不一定都是真正的Goal。</p>
<p style="text-align: center; "><img alt="" height="390" src="http://www.kaushik.net/avinash/wp-content/uploads/2010/04/goal_conversions_in_google_analytics.png" vspace="5" width="495" /></p>
<p>　　例如上图中的Goal中，其实只有第四个&ldquo;Subscribers（提交）&rdquo;是真正意义上的Goal，因为它的存在代表着网站对访问者的说服。而其他的Goal则没有明显的策略性，只是记录了发生的相关性事件。</p>
<p><span class="Apple-style-span" style="color: rgb(41, 48, 59); font-family: Verdana; font-size: 13px; line-height: 19px; "><strong><font color="blue">Metric:</font></strong></span></p>
<p>　　Metric恐怕是大家最熟悉的了，就是度量。我们天天跟它们打交道。度量包括计数度量（count，例如Page View，Visit和Visitor等）和复合度量（ratio，例如bounce rate，Page View/Visit等），是我们进行网站分析的砖和瓦。Metric其实最对应的汉语实际上是&ldquo;量词&rdquo;，比如&ldquo;一片、一个、一次&rdquo;等等。</p>
<p>　　Avinash非常经典的说，度量就是那些似乎永远都只能作为&ldquo;列&rdquo;的名称而不作为&ldquo;行&rdquo;的名称的东西。似乎在Google Analytics和Omniture中的确如此。度量大家都清楚，就不多说了，看看下图，都是常用（或者不常用）的度量。:)</p>
<p style="text-align: center; "><img alt="" height="494" src="http://www.kaushik.net/avinash/wp-content/uploads/2010/04/web_analytics_metrics.png" vspace="5" width="495" /></p>
<p><span class="Apple-style-span" style="color: rgb(41, 48, 59); font-family: Verdana; font-size: 13px; line-height: 19px; "><strong><font color="blue">Key Performance Indicator:</font></strong></span></p>
<p>　　好了，终于轮到关键绩效指标了，台湾人也有翻译成关键绩效指针的，都一样。Avinash对于KPI的定义是，帮助你理解你所达到的商业目的程度的度量。我的理解是，KPI本质上就是度量，计数度量和复合度量都可能，这些度量是直接反应Business Objective对应的Goal的实现情况的。</p>
<p>　　因为每个公司的Business Objective都可能不一样，因此，每个公司的KPI基本上也要具有自己的特色。</p>
<p>　　Avinash举了几个好例子。例如，百思买（www.bestbuy.com）网站的商业目的是依靠售卖盈利，它的KPI中肯定有平均订单金额（Average Order Size）。但是，我们也用过Visit，或者视频播放量作为报告中的分析度量，可是这些度量却很少被称为KPI。</p>
<p>　　当然，在我们国家，其实也有不少网站是把Visit作为KPI的，不过在国外相对比较少见。</p>
<p>　　如果使用Omniture，那么Omniture中eVar所定义的那些success events经常会被选出来作为KPI，而s.prop定义的那些traffic度量，则几乎很少被用作KPI。原因同上。</p>
<p>　　如果是纽约时报网站（www.nytimes.com），Avinash建议了两个KPI，一个是访问者的忠诚度（用一个访问者平均一个月内访问次数来衡量）；另一个则是访问者点击广告的数量。当然，如果是我的这个博客（www.chinawebanalytics.cn），我还会加两个KPI，那就是平均文章的留言数量和RSS订阅数量。</p>
<p>　　由于KPI和Business Objective和Goal紧密相连，因此如果Business Objective没有定义好，那么KPI也就不会正确。从重要性看，有如下的不等式：</p>
<p>　　Business Objectives -&gt; Goals -&gt; KPI&#39;s -&gt; Metrics -&gt; Magic. （最后的Magic当然是Avinash在跟我们开玩笑了）</p>
<p><span class="Apple-style-span" style="color: rgb(41, 48, 59); font-family: Verdana; font-size: 13px; line-height: 19px; "><strong><font color="blue">Targets:</font></strong></span></p>
<p>　　Target是一个具体的数字，用来衡量KPI应该达到的量。一个KPI肯定会有一个target，没有target的KPI什么都不是。</p>
<p style="text-align: center; "><img alt="" height="302" src="http://www.kaushik.net/avinash/wp-content/uploads/2010/04/missed_target.jpg" vspace="5" width="443" /></p>
<p>　　Target不是订的越高越好。但是我（Sidney）的经验是，Target在我曾经的客户那边总是越来越高。这次项目达到了100，下次就要做到200，再下次就要300，结果到了总有一天实现不了的程度却还在不断往上加。结果，咳，造就了一些啼笑皆非的数字，而且这些数字至今还在维系&hellip;&hellip;不只是杯具还是洗具。</p>
<p>　　上面的不等式现在可以扩展为Business Objectives -&gt; Goals -&gt; KPIs -&gt; Metrics -&gt; Targets -&gt; Minor Orgasms。</p>
<p><span class="Apple-style-span" style="color: rgb(41, 48, 59); font-family: Verdana; font-size: 13px; line-height: 19px; "><strong><font color="blue">Dimension:</font></strong></span></p>
<p>　　Dimension可以翻译成方面或者维度，但是又是一个无法找到具体对应汉语词的词语。Dimension指网站访问者或者网站本身的某一个属性。例如，下图就是一个访问者的诸多属性：</p>
<p style="text-align: center; "><img alt="" height="267" src="http://www.kaushik.net/avinash/wp-content/uploads/2010/04/web_analytics_dimensions.png" vspace="5" width="480" /></p>
<p>　　访问者的来源（例如referring urls, campaigns, 国家等）也都是网站分析数据的不同维度。</p>
<p>　　常见的维度还有，页面的名称、产品名称、搜索关键词等等。所以，Dimension是属性。</p>
<p>　　忽然想到一个例子，我们都玩网络游戏，网游中你的各项属性名称：生命、体力、经验、魅力等等，都是属性，都是Dimension，只不过他们的metric名称都一样罢了&mdash;&mdash;点数，比如生命点数还剩多少。网站分析的维度和度量其实跟网游的道理一样。</p>
<p>　　Avinash说，Dimension就是那些数据行的名称。</p>
<p style="text-align: center; "><img alt="" height="292" src="http://www.kaushik.net/avinash/wp-content/uploads/2010/04/yahoo_web_analytics_visits_average_clicks_to_a_page.png" vspace="5" width="480" /></p>
<p style="text-align: center; ">这个图中，Page URL就是Dimension，度量当然是Visits和Avg. clicks啦</p>
<p style="text-align: center; "><img alt="" height="284" src="http://www.kaushik.net/avinash/wp-content/uploads/2010/04/google_analytics_multiple_dimensions_and_metrics.png" vspace="5" width="490" /></p>
<p style="text-align: center; ">两个Dimension在一起也没问题。在Omniture的Data Warehouse中，可以定义多个Dimension叠加（类似数据透视表的多个属性叠加），不过数据处理就是海量了。</p>
<p>　　在GA和Yahoo网站分析工具中，当然是可以自己定义维度和度量之间的组合咯。不过组合要合理。这个就不说了，大家自己摸索一下GA的Custom Report就知道了，很简单。</p>
<p style="text-align: center; "><img alt="" height="535" src="http://www.kaushik.net/avinash/wp-content/uploads/2010/04/web_analytics_tools_dimension_chooser.png" vspace="5" width="493" /></p>
<p><span class="Apple-style-span" style="color: rgb(41, 48, 59); font-family: Verdana; font-size: 13px; line-height: 19px; "><strong><font color="blue">Segments:</font></strong></span></p>
<p>　　终于到细分了。我直接写我的理解。细分就是对某一个维度进行的进一步区分。例如，对访问者的忠诚度进行细分，我们可以定义所有访问者中，平均每次Visit浏览的页面PV超过了3页的访问者。另一个例子是，访问者中，属于亚洲国家的访问者。或者，所有的网站页面中，页面名字中间包含了&ldquo;webanalytics&rdquo;的页面。</p>
<p style="text-align: center; ">　　<img alt="" height="354" src="http://www.kaushik.net/avinash/wp-content/uploads/2010/04/analytics_segments_kaushik.net_.png" vspace="5" width="495" /></p>
<p>　　你可以看到，所谓细分就是按照一定的规则对Dimension进行的再次细化。这个规则可以是单一规则，当然也可以是多重规则。你可以筛选所有访问者中访问时间长于3分钟的访问者，同时，你还可以再加一个限定条件，即超过3分钟，却又浏览页面少于3个PV的访问者。It&#39;s up to you!</p>
<p>　　还记得我说的网站分析的三个基本思维模型吗&mdash;&mdash;细分、趋势和转化。哈哈，就是这个细分咯！请记住：没有细分，就没有真知灼见！</p>
<p><span class="Apple-style-span" style="color: rgb(41, 48, 59); font-family: Verdana; font-size: 13px; line-height: 19px; "><a class="APEignored" name="WAMF" style="color: rgb(173, 126, 24); text-decoration: none; "><strong><font color="blue">Web Analytics Measurement Framework</font></strong></a></span></p>
<p>　　最后，我们把上面所有这些术语集合在一起，看看大图景是什么样的。我们用Avinash的例子。</p>
<p>　　Avinash是<a href="http://www.nclr.org/" target="_blank">美国国家La Raza委员</a>会的负责人，对这个协会的网站进行测量的框架如下（我就不翻译了，大家一看即明）：</p>
<p>&nbsp;</p>
<p style="margin-top: 0px; margin-right: 0px; margin-bottom: 1em; margin-left: 0px; padding-top: 0px; padding-right: 0px; padding-bottom: 0px; padding-left: 0px; line-height: 1.5em; "><span class="Apple-style-span" style="color: rgb(0, 0, 0); font-family: Georgia, 'Times New Roman', Times, serif; font-size: 14px; line-height: 17px; "><strong>Business Objective:</strong></span></p>
<blockquote style="background-image: initial; background-attachment: initial; background-origin: initial; background-clip: initial; background-color: rgb(246, 246, 245); border-left-width: 2px; border-left-style: solid; border-left-color: rgb(238, 172, 29); margin-top: 1em; margin-right: 0px; margin-bottom: 1em; margin-left: 0px; padding-top: 10px; padding-right: 10px; padding-bottom: 10px; padding-left: 10px; background-position: initial initial; background-repeat: initial initial; ">
<p style="margin-top: 0px; margin-right: 0px; margin-bottom: 1em; margin-left: 0px; padding-top: 0px; padding-right: 0px; padding-bottom: 0px; padding-left: 0px; line-height: 1.5em; "><span class="Apple-style-span" style="color: rgb(0, 0, 0); font-family: Georgia, 'Times New Roman', Times, serif; font-size: 14px; line-height: 17px; ">Attendance at immigration rallies.</span></p>
</blockquote>
<p style="margin-top: 0px; margin-right: 0px; margin-bottom: 1em; margin-left: 0px; padding-top: 0px; padding-right: 0px; padding-bottom: 0px; padding-left: 0px; line-height: 1.5em; "><span class="Apple-style-span" style="color: rgb(0, 0, 0); font-family: Georgia, 'Times New Roman', Times, serif; font-size: 14px; line-height: 17px; "><strong>Goals:</strong></span></p>
<blockquote style="background-image: initial; background-attachment: initial; background-origin: initial; background-clip: initial; background-color: rgb(246, 246, 245); border-left-width: 2px; border-left-style: solid; border-left-color: rgb(238, 172, 29); margin-top: 1em; margin-right: 0px; margin-bottom: 1em; margin-left: 0px; padding-top: 10px; padding-right: 10px; padding-bottom: 10px; padding-left: 10px; background-position: initial initial; background-repeat: initial initial; ">
<p style="margin-top: 0px; margin-right: 0px; margin-bottom: 1em; margin-left: 0px; padding-top: 0px; padding-right: 0px; padding-bottom: 0px; padding-left: 0px; line-height: 1.5em; "><span class="Apple-style-span" style="color: rgb(0, 0, 0); font-family: Georgia, 'Times New Roman', Times, serif; font-size: 14px; line-height: 17px; ">Increase web sign ups.</span></p>
</blockquote>
<p style="margin-top: 0px; margin-right: 0px; margin-bottom: 1em; margin-left: 0px; padding-top: 0px; padding-right: 0px; padding-bottom: 0px; padding-left: 0px; line-height: 1.5em; "><span class="Apple-style-span" style="color: rgb(0, 0, 0); font-family: Georgia, 'Times New Roman', Times, serif; font-size: 14px; line-height: 17px; "><strong>Key Performance Indicators:</strong></span></p>
<blockquote style="background-image: initial; background-attachment: initial; background-origin: initial; background-clip: initial; background-color: rgb(246, 246, 245); border-left-width: 2px; border-left-style: solid; border-left-color: rgb(238, 172, 29); margin-top: 1em; margin-right: 0px; margin-bottom: 1em; margin-left: 0px; padding-top: 10px; padding-right: 10px; padding-bottom: 10px; padding-left: 10px; background-position: initial initial; background-repeat: initial initial; ">
<p style="margin-top: 0px; margin-right: 0px; margin-bottom: 1em; margin-left: 0px; padding-top: 0px; padding-right: 0px; padding-bottom: 0px; padding-left: 0px; line-height: 1.5em; "><span class="Apple-style-span" style="color: rgb(0, 0, 0); font-family: Georgia, 'Times New Roman', Times, serif; font-size: 14px; line-height: 17px; "># of NCLR Sign-ups for NCLR Action Alerts</span></p>
<p style="margin-top: 0px; margin-right: 0px; margin-bottom: 1em; margin-left: 0px; padding-top: 0px; padding-right: 0px; padding-bottom: 0px; padding-left: 0px; line-height: 1.5em; "><span class="Apple-style-span" style="color: rgb(0, 0, 0); font-family: Georgia, 'Times New Roman', Times, serif; font-size: 14px; line-height: 17px; "># of Individual Memberships</span></p>
</blockquote>
<p style="margin-top: 0px; margin-right: 0px; margin-bottom: 1em; margin-left: 0px; padding-top: 0px; padding-right: 0px; padding-bottom: 0px; padding-left: 0px; line-height: 1.5em; "><span class="Apple-style-span" style="color: rgb(0, 0, 0); font-family: Georgia, 'Times New Roman', Times, serif; font-size: 14px; line-height: 17px; "><strong>Target:</strong></span></p>
<blockquote style="background-image: initial; background-attachment: initial; background-origin: initial; background-clip: initial; background-color: rgb(246, 246, 245); border-left-width: 2px; border-left-style: solid; border-left-color: rgb(238, 172, 29); margin-top: 1em; margin-right: 0px; margin-bottom: 1em; margin-left: 0px; padding-top: 10px; padding-right: 10px; padding-bottom: 10px; padding-left: 10px; background-position: initial initial; background-repeat: initial initial; ">
<p style="margin-top: 0px; margin-right: 0px; margin-bottom: 1em; margin-left: 0px; padding-top: 0px; padding-right: 0px; padding-bottom: 0px; padding-left: 0px; line-height: 1.5em; "><span class="Apple-style-span" style="color: rgb(0, 0, 0); font-family: Georgia, 'Times New Roman', Times, serif; font-size: 14px; line-height: 17px; ">Action Alert: 14,000 per month</span></p>
<p style="margin-top: 0px; margin-right: 0px; margin-bottom: 1em; margin-left: 0px; padding-top: 0px; padding-right: 0px; padding-bottom: 0px; padding-left: 0px; line-height: 1.5em; "><span class="Apple-style-span" style="color: rgb(0, 0, 0); font-family: Georgia, 'Times New Roman', Times, serif; font-size: 14px; line-height: 17px; ">Memberships: 4,800 per month</span></p>
</blockquote>
<p style="margin-top: 0px; margin-right: 0px; margin-bottom: 1em; margin-left: 0px; padding-top: 0px; padding-right: 0px; padding-bottom: 0px; padding-left: 0px; line-height: 1.5em; "><span class="Apple-style-span" style="color: rgb(0, 0, 0); font-family: Georgia, 'Times New Roman', Times, serif; font-size: 14px; line-height: 17px; "><strong>Segments:</strong></span></p>
<blockquote style="background-image: initial; background-attachment: initial; background-origin: initial; background-clip: initial; background-color: rgb(246, 246, 245); border-left-width: 2px; border-left-style: solid; border-left-color: rgb(238, 172, 29); margin-top: 1em; margin-right: 0px; margin-bottom: 1em; margin-left: 0px; padding-top: 10px; padding-right: 10px; padding-bottom: 10px; padding-left: 10px; background-position: initial initial; background-repeat: initial initial; ">
<p style="margin-top: 0px; margin-right: 0px; margin-bottom: 1em; margin-left: 0px; padding-top: 0px; padding-right: 0px; padding-bottom: 0px; padding-left: 0px; line-height: 1.5em; "><span class="Apple-style-span" style="color: rgb(0, 0, 0); font-family: Georgia, 'Times New Roman', Times, serif; font-size: 14px; line-height: 17px; ">Acquisition: Organic search, Email campaigns, Mid-western US states</span></p>
<p style="margin-top: 0px; margin-right: 0px; margin-bottom: 1em; margin-left: 0px; padding-top: 0px; padding-right: 0px; padding-bottom: 0px; padding-left: 0px; line-height: 1.5em; "><span class="Apple-style-span" style="color: rgb(0, 0, 0); font-family: Georgia, 'Times New Roman', Times, serif; font-size: 14px; line-height: 17px; ">Behavior: Visits to conversions (Action Alerts, Memberships)<br />
		</span></p>
</blockquote>
<p>　　另一个例子如下，这个也非常直观，我很喜欢这样的图解。</p>
<p style="text-align: center; "><a href="http://www.kaushik.net/avinash/wp-content/uploads/2010/04/matt_smedly_web_analytics_measuremet_framework.png" target="_blank"><img alt="" height="399" src="http://www.kaushik.net/avinash/wp-content/uploads/2010/04/matt_smedly_web_analytics_measuremet_framework_sm.png" vspace="5" width="486" /><br />
	</a></p>
<p>　　好了，就写这么多了。明天就是周末，祝大家玩儿的开心！有什么想法，请大家留言，我不会懒惰，会尽快回复！谢谢！</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/wa-basic-terms/feed/</wfw:commentRss>
		<slash:comments>23</slash:comments>
		</item>
		<item>
		<title>新度量&#8211;深度互动时间</title>
		<link>http://www.chinawebanalytics.cn/%e6%96%b0%e5%ba%a6%e9%87%8f-%e6%b7%b1%e5%ba%a6%e4%ba%92%e5%8a%a8%e6%97%b6%e9%97%b4/</link>
		<comments>http://www.chinawebanalytics.cn/%e6%96%b0%e5%ba%a6%e9%87%8f-%e6%b7%b1%e5%ba%a6%e4%ba%92%e5%8a%a8%e6%97%b6%e9%97%b4/#comments</comments>
		<pubDate>Sun, 20 Dec 2009 11:13:55 +0000</pubDate>
		<dc:creator>Tenly</dc:creator>
				<category><![CDATA[Featured]]></category>
		<category><![CDATA[网站分析的基本度量]]></category>
		<category><![CDATA[网站分析经验分享]]></category>
		<category><![CDATA[GA]]></category>
		<category><![CDATA[工具]]></category>
		<category><![CDATA[度量]]></category>
		<category><![CDATA[理论]]></category>
		<category><![CDATA[研究]]></category>
		<category><![CDATA[虚假互动]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=1399</guid>
		<description><![CDATA[　　在前面的文章提到，仅仅关注 Bounce Rate 是不够的。因为 Bounce Rate 也会被虚假互动所影响。

　　市面上有很多流量购买源，可以导入降低 Bounce Rate 的流量。

　　如果你运营的网站是商业性质的，会购买广告媒介来进行市场和销售的推广与促进，那么你就不得不关注这些看似高质量的流量，并能进行有效的甄别。否则，营销效果是好是坏？如何评估？将无法解答。像句俗话：“被人骗了还帮别人数钱”。

　　如何甄别虚假互动呢？网站分析师或者网站管理人员，需要有效的方法论来指导工作。此文将详细讲述另一种流量质量评估的新度量——深度互动时间（Time Spend on Deep Content）。

下面将按照以下逻辑进行叙述：1.发现虚假互动。2.研究虚假互动的特性。3.分析建立模型来进行甄别。4.实证研究，看看模型的效果。]]></description>
			<content:encoded><![CDATA[<p><img align="left" alt="深度互动--很深很深" border="1" class="alignleft size-full wp-image-1443" height="123" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/12/20e083abd2142ce76df4efbfc817253f.jpg" title="深度互动--很深很深" width="111" />　　在<a href="http://www.chinawebanalytics.cn/?p=1400" target="_blank">前面的文章</a>提到，仅仅关注 Bounce Rate 是不够的。因为 Bounce Rate 也会被虚假互动所影响。</p>
<p>　　市面上有很多流量购买源，可以导入降低 Bounce Rate 的流量。搜索&ldquo;流量购买&rdquo;即可查到。</p>
<p>　　如果你运营的网站是商业性质的，会购买广告媒介来进行市场和销售的推广与促进，那么你就不得不关注这些看似高质量的流量，并能进行有效的甄别。否则，营销效果是好是坏？如何评估？将无法解答。像句俗话：&ldquo;被人骗了还帮别人数钱&rdquo;。</p>
<p>　　如何甄别虚假互动呢？网站分析师或者网站管理人员，需要有效的方法论来指导工作。此文将详细讲述另一种流量质量评估的新度量&mdash;&mdash;深度互动时间（Time Spend on Deep Content）。</p>
<p>下面将按照以下逻辑进行叙述：1.发现虚假互动。2.研究虚假互动的特性。3.分析建立模型来进行甄别。4.实证研究，看看模型的效果。</p>
<p style="text-align: center;"><span class="Apple-style-span" style="color: rgb(51, 51, 51); font-family: Arial,Helvetica; line-height: 21px;">[&nbsp;<a href="http://www.chinawebanalytics.cn/?author=3" style="margin: 0px; padding: 0px; color: rgb(60, 120, 167); text-decoration: none;" target="_blank" title="点击查看更多Tenly的文章">Tenly Wu</a>&nbsp;版权所有欢迎转载，但请事先在下方评论知会作者，并注明出处] &nbsp;</span></p>
<h2>1、发现问题：</h2>
<p>　　在前面的文章提到：网站的Bounce Rate很正常，或者很好，可网站的互动行为却非常的不正常。</p>
<p>　　这样的后果是：如果使用不全面、不科学的的分析方法，分析研究结论会被误导为&ldquo;获得良好的效果&rdquo;。</p>
<h2>2、研究问题：</h2>
<p>　　研究发现，停留时间是甄别虚假互动的突破口。因为虚假互动可以伪造点击，但是深度的停留时间很难伪装，仔细研究现象就会露马脚。</p>
<p>　　以Google Analytics为例，在时间上有很多度量（之前有一篇文章《<a href="http://www.chinawebanalytics.cn/?p=1053" target="_blank">Google Analytics时间观</a>》）。下面我们以一个图说明&ldquo;时间上&rdquo;的问题：</p>
<p>　　图中有四种情况，黄色的为Time on Page，蓝色的Time on Site。如果页面的访问深度是1，那么就会有Bounce。访问深度是大于等于2，就不会Bounce。如图中第二种情况，当深度 = 2 时，Landing Page Time on Page = Landing Page Time on Site。注意到第三和四种情况，深度大于 2 后，Landing Page 的 Time on Site 的时间比 Time on Page 更多。原因是访问者通过Landing Page到达后，会进行一系列的互动，在其它页面的互动时间会算在该页面的 Time on Site 这个度量上。</p>
<p><span style="color: rgb(0, 0, 255);"><strong>Landing Page Time on Site =&nbsp;<br />
	Landing Page Time on Page + Deep Content A Time on Page + Deep Content B Time on Page + &#8230;</strong></span></p>
<p style="text-align: center;"><img align="middle" alt="时间研究" border="1" height="240" src="http://pic.yupoo.com/tenlywu/040758916732/aojwvvky.jpg" width="600" /></p>
<p>　　互动的更深（访问页面多）更久（各页面停留更久），反映了访问者对内容感兴趣，推广效果、网站运营效果良好。</p>
<p>　　现阶段虚假互动能够操作影响到的都是在第一个页面上， 即来到&ldquo;Landing Page&#8211;&gt;停留-&gt;点击链接&rdquo;，我们只需要通过一个度量将这些元素所造成的影响剔除，才可以研究真正的互动程度。</p>
<p style="text-align: center;"><span class="Apple-style-span" style="color: rgb(51, 51, 51); font-family: Arial,Helvetica; line-height: 21px;">[&nbsp;<a href="http://www.chinawebanalytics.cn/?author=3" style="margin: 0px; padding: 0px; color: rgb(60, 120, 167); text-decoration: none;" target="_blank" title="点击查看更多Tenly的文章">Tenly Wu</a>&nbsp;版权所有欢迎转载，但请事先在下方评论知会作者，并注明出处] &nbsp;</span></p>
<h2>3、建立解决模型：</h2>
<p><strong><span style="color: rgb(0, 0, 255);">Average Time Spend on Deep Content = <br />
	( Landing Page Time on Site &#8211; Landing Page Time on Page ) / Landing Page Pageview</span></strong></p>
<p><strong>公式简单说明：</strong>登陆页的全站停留时间，除去登陆页的页面停留的时间。余下的时间就是访问者在页面其它深度页面的停留时间。然后除以这个登陆页的浏览量，则可以求得一个平均的深度互动时间。这个值反映了平均每个访问者，点击登陆页内容后，除掉在登陆页的时间外，在网站上其它页面花的时间长短。有效的剔除了容易被&ldquo;虚假流量&rdquo;影响的登陆页停留时间这个度量。</p>
<h2>4、实证模型：</h2>
<p>举例：建立自定义报告（可以自行定义，但保证Entrance是第一个度量，这样可以保证主要的 Landing Page 显示在前面，也要保证 Time on Page、Time on Site 和 Pageview 这三个度量选中，以便新度量的计算。</p>
<p>下面是我建立的自定义报告共享连接：</p>
<p><a href="http://www.google.com/analytics/reporting/edit_custom_report?share=P01MqyUBAAA.5cmZVfTgv7FSDQaf3SApcOxsrvVFOMhXTyWae26xzB8D2OsZLRP6CRorB5cbkn53KnEyuJAzLj-2rfM18IeuWw.-djiSrTR40xr_JrPt1z4Ow" title="http://www.google.com/analytics/reporting/edit_custom_report?share=P01MqyUBAAA.5cmZVfTgv7FSDQaf3SApcOxsrvVFOMhXTyWae26xzB8D2OsZLRP6CRorB5cbkn53KnEyuJAzLj-2rfM18IeuWw.-djiSrTR40xr_JrPt1z4Ow">http://www.google.com/analytics/reporting/edit_custom_report?share=P01MqyUBAAA.5cmZVfTgv7FSDQaf3SApcOxsrvVFOMhXTyWae26xzB8D2OsZLRP6CRorB5cbkn53KnEyuJAzLj-2rfM18IeuWw.-djiSrTR40xr_JrPt1z4Ow</a></p>
<p style="text-align: center;"><img align="middle" alt="使用新度量后，虚假互动就原形毕露" border="1" height="319" src="http://pic.yupoo.com/tenlywu/824348916734/ptagu07f.jpg" width="360" /></p>
<p>　　套用了新度量进行不同的媒体的评估就显得很清晰了。原来左边第一个 Bounce Rate 特别的好，可是在 Average Time Spend on Deep Content 这个度量上，显得特别的低，开始矛盾了。这说明，最左边的流量中含有大量的虚假互动。</p>
<p>　　那么这个度量值在多少属于差？多少属于好呢？</p>
<p style="text-align: center;"><span class="Apple-style-span" style="color: rgb(51, 51, 51); font-family: Arial,Helvetica; line-height: 21px;">[&nbsp;<a href="http://www.chinawebanalytics.cn/?author=3" style="margin: 0px; padding: 0px; color: rgb(60, 120, 167); text-decoration: none;" target="_blank" title="点击查看更多Tenly的文章">Tenly Wu</a>&nbsp;版权所有欢迎转载，但请事先在下方评论知会作者，并注明出处] &nbsp;</span></p>
<p>　　下面是我们的经验值：对于一些有广告推广的网站而言，低于 1 秒就是很差了，说明推广的效果非常差。5 秒以上就是很不错了。</p>
<p>　　你知道<a href="http://www.chinawebanalytics.cn">宋星</a>的这个博客：Chinawebanalytics.cn的深度互动时间么？123秒。<span style="color: rgb(255, 0, 0);"><strong>也欢迎大家把你的博客的深度互动时间与大家分享。</strong></span></p>
<p>　　没错，这个度量很好的扩大了真流量与虚假流量的差距，这种杠杆方法常用在统计学研究中当中。</p>
<p>　　俗话说：偏之毫厘，差之千里。那么一点点的具有虚假互动性质的流量，都会对这个度量有明显的影响。</p>
<p>　　像老虎的猫，终究是猫。所以流量的质量是客观的，好与不好，换个方法照样能把它甄别出来。</p>
<p>　　由于时间仓促，文章只将概要的思路与大家分享，欢迎大家拍砖或提问，我一一为你解答。或者不足的地方还请大家留言帮助我完善。实在留言解答不了的问题，可以 Gtalk 联系我。谢谢！</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/%e6%96%b0%e5%ba%a6%e9%87%8f-%e6%b7%b1%e5%ba%a6%e4%ba%92%e5%8a%a8%e6%97%b6%e9%97%b4/feed/</wfw:commentRss>
		<slash:comments>23</slash:comments>
		</item>
		<item>
		<title>Google Analytics的时间观与自定义报告</title>
		<link>http://www.chinawebanalytics.cn/google-analytics%e7%9a%84%e6%97%b6%e9%97%b4%e8%a7%82%e4%b8%8e%e8%87%aa%e5%ae%9a%e4%b9%89%e6%8a%a5%e5%91%8a/</link>
		<comments>http://www.chinawebanalytics.cn/google-analytics%e7%9a%84%e6%97%b6%e9%97%b4%e8%a7%82%e4%b8%8e%e8%87%aa%e5%ae%9a%e4%b9%89%e6%8a%a5%e5%91%8a/#comments</comments>
		<pubDate>Fri, 25 Sep 2009 00:48:53 +0000</pubDate>
		<dc:creator>Tenly</dc:creator>
				<category><![CDATA[监测工具]]></category>
		<category><![CDATA[Google Analytics]]></category>
		<category><![CDATA[度量]]></category>
		<category><![CDATA[时间]]></category>
		<category><![CDATA[自定义报告]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=1053</guid>
		<description><![CDATA[前言
在Google Analytics中，有很多个时间度量：
Time on Page，&#8721; Time on Page，Avg. Time on Page；      
Time on Site，&#8721; Time on Site，Avg. Time on Site。(Avg.是Average的缩写）
在WA的过程中，基本度量非常重要，原理一定需要百分之百清楚。我以前想当然地以为自己理解了，但事实并不是这样。下面就严谨地详细地与大家分享一 下（有些枯燥）：
说明与定义：

为标准化度量名称，本文相关度量均用英文表示；
文中的&#8220;本站&#8221;，指添加了同一UA ID Google Analytics监测代码的所有页面集合；
&#8220;站外&#8221;，指未添加Google Analytics监测代码或&#8220;本站&#8221;UA ID不一致的页面集合。
&#8220;站外&#8221;与&#8220;本站&#8221;的关系：本站 &#8745; 站外 = 0，本站 &#8746; 站外 = &#8734;（即整个互联网）。
监测部署是以标准的Google Analytics监测代码为准，不考虑使用虚拟 Pageview Tracker 或 Event Tracker 等定制化监测情况。


基于页面的时间度量
Time on Page and &#8721; Time on Page：
访问者停留在某个页面的时间，所有访问者在一批页面的停留时间总和。对于跳出到站外的访问， Google Analytics将无法统计最后一个访问页面的停留时间。英文详细标准定义如下：

This field indicates how long a visitor spent on a particular page or set of pages. It is calculated by subtracting the initial view time for a particular page from the initial view time for a subsequent ...]]></description>
			<content:encoded><![CDATA[<h3><strong>前言</strong></h3>
<p>在Google Analytics中，有很多个时间度量：</p>
<p><strong>Time on Page，<strong>&sum;</strong> Time on Page，</strong><strong>Avg. Time on Page；      <br />
Time on Site，<strong>&sum; Time on Site</strong>，<strong>Avg. Time on Site。</strong>(Avg.是Average的缩写）</strong></p>
<p>在WA的过程中，基本度量非常重要，原理一定需要百分之百清楚。我以前想当然地以为自己理解了，但事实并不是这样。下面就严谨地详细地与大家分享一 下（有些枯燥）：</p>
<h3><strong>说明与定义：</strong></h3>
<ul>
<li>为标准化度量名称，本文相关度量均用英文表示；</li>
<li>文中的&ldquo;本站&rdquo;，指添加了同一UA ID Google Analytics监测代码的所有页面集合；</li>
<li>&ldquo;站外&rdquo;，指未添加Google Analytics监测代码或&ldquo;本站&rdquo;UA ID不一致的页面集合。</li>
<li>&ldquo;站外&rdquo;与&ldquo;本站&rdquo;的关系：本站 &cap; 站外 = 0，本站 &cup; 站外 = &infin;（即整个互联网）。</li>
<li>监测部署是以标准的Google Analytics监测代码为准，不考虑使用虚拟 Pageview Tracker 或 Event Tracker 等定制化监测情况。</li>
</ul>
<p><span id="more-1053"></span></p>
<h3><strong>基于页面的时间度量</strong></h3>
<p><strong><u>Time on Page and <strong>&sum; Time on Page</strong></u></strong>：</p>
<p>访问者停留在某个页面的时间，所有访问者在一批页面的停留时间总和。对于跳出到站外的访问， Google Analytics将无法统计最后一个访问页面的停留时间。英文详细标准定义如下：</p>
<blockquote>
<p><em>This field indicates how long a visitor spent on a particular page or set of pages. It is calculated by subtracting the initial view time for a particular page from the initial view time for a subsequent page. Thus, this metric does not apply to exit pages for your site.</em></p>
</blockquote>
<p><strong><u>Avg. Time on Page</u></strong>：</p>
<p>一个特定页面的平均停留时间 等于 所有访问者在该页面的停留时间之和，除以该页面的 Pageview 与 Exit（或Entrance）之差。</p>
<blockquote>
<p>公式：Avg. Time on Page = &sum; Time on Page / (Pageviews&ndash; Exits)</p>
</blockquote>
<p>需要说明的是：如果访问者只访问该页面一次，且这该页面是离开本站前的最后一个页面，那么他的停留在该页面时间为零。</p>
<h3>基于网站（页面的集合）的时间度量</h3>
<p><img width="500" height="200" border="0" src="http://pic.yupoo.com/tenlywu/2122081f1f07/medium.jpg" alt="Time-on-site" /></p>
<p><strong><u>Time on Site</u></strong>：一个访问者在本站所停留的时间，即停留在本站所有页面的时间之和。如上图一个访问者，Time on Site = Time on Page A + Time on Page B + <strong>Time on Page C</strong> = 2:25。尽管 Time on Page C = 0，但它也会参与到Time on Site的求和计算过程中。下方是官方英文标准定义：</p>
<blockquote>
<p><em>The time a visitor spends on your site.</em></p>
</blockquote>
<p><strong><u>&sum; Time on Site</u></strong>：一类访问者在本站所停留的时间之和。</p>
<p><strong><u>Avg. Time on Site</u></strong>：访问者在本站平均停留时间。公式为：</p>
<blockquote>
<p>Avg. Time on Site = &sum; Time on Site / Visits</p>
</blockquote>
<p>对于本站而言，Visits 的值等于所有的登陆页的 Entrances 之和。    <br />
这里的除数是包括了Bounce部分，意味着，有些Entrance并未造成停留时间增加。因为一个 Visit Entrance到登陆页，什么都没干 Bounce 走了，虽然 Entrance + 1，Pageview + 1，Visit + 1，但这个访问 Time 为 0 。而他们要在公式中与其它 Visits 分享 Time on Site。</p>
<h3><strong>利用自定义报告理解度量间关系</strong></h3>
<p>在Google Analytics的自定义报告中，左边有许多的 Dimensions 和 Metrics 供你选择，大家不妨拖拽着玩玩，了解主体与度量之间的关系。比如说：</p>
<ul>
<li>当你选择 Dimensions 为 Landing Page， Exit Page 的时候，Time on Site 与 Avg. Time on Site 就会变灰（无法选择）。因为作为特定的功能页主体，是无法具有 Time on Site 这种属性度量的。</li>
<li>但是当你选择 Dimensions 为 Source， City 的时候， Time on Site 与 Avg. Time on Site 就能选择。因访问者类型作为主体时，就能使用 Time on Site 这种属性度量。</li>
<li>更奇怪的是，当你选择 Dimensions 为 Page 的时候， Time on Site 与 Unique Pageviews 两种分别为 Site Usage 和 Content 类的度量只能二选一。</li>
</ul>
<p>最后，跑一个Dimensions 为 Landing Page 的自定义报告，大家可研究一下度量间的关系，结论公式如下：</p>
<blockquote>
<p><strong>Time on Page / Avg. Time on Page + Entrances or Exits = Pageviews</strong></p>
</blockquote>
<p><img width="760" height="240" border="0" src="http://pic.yupoo.com/tenlywu/2505381f10d1/faxl2ku5.jpg" alt="Table" /></p>
<h3><strong>思考题</strong></h3>
<p>最后留一个问题让大家思考，帮助大家自己研究体会，欢迎大家留言交流解答（正确答案将在国庆节公布）：</p>
<p>如果再跑一个Dimensions 为 Page 的自定义报告，大家会发现，同样的 Page 01，02 的各个页面，Time on Page、Avg. Time on Page、 Exits、Pageviews、 Unique Pageviews 度量的数据都不同了。为什么呢？</p>
<p><a href="http://pic.yupoo.com/tenlywu/2218881f2898/kp9jwzps.jpg" title="放大查看"><img width="760" height="155" border="0" src="http://pic.yupoo.com/tenlywu/2218881f2898/kp9jwzps.jpg" alt="Table2" /></a></p>
<p>期待您的回答。。。</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/google-analytics%e7%9a%84%e6%97%b6%e9%97%b4%e8%a7%82%e4%b8%8e%e8%87%aa%e5%ae%9a%e4%b9%89%e6%8a%a5%e5%91%8a/feed/</wfw:commentRss>
		<slash:comments>33</slash:comments>
		</item>
		<item>
		<title>从头到尾说网站分析过程中的度量(上)</title>
		<link>http://www.chinawebanalytics.cn/%e4%bb%8e%e5%a4%b4%e5%88%b0%e5%b0%be%e5%88%97%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e8%bf%87%e7%a8%8b%e4%b8%ad%e7%9a%84%e5%ba%a6%e9%87%8f%e4%b8%8a/</link>
		<comments>http://www.chinawebanalytics.cn/%e4%bb%8e%e5%a4%b4%e5%88%b0%e5%b0%be%e5%88%97%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e8%bf%87%e7%a8%8b%e4%b8%ad%e7%9a%84%e5%ba%a6%e9%87%8f%e4%b8%8a/#comments</comments>
		<pubDate>Wed, 10 Sep 2008 15:55:53 +0000</pubDate>
		<dc:creator>Tenly</dc:creator>
				<category><![CDATA[基础知识]]></category>
		<category><![CDATA[Cost]]></category>
		<category><![CDATA[CPC]]></category>
		<category><![CDATA[CPM]]></category>
		<category><![CDATA[Loss rate]]></category>
		<category><![CDATA[广告]]></category>
		<category><![CDATA[度量]]></category>
		<category><![CDATA[网站分析]]></category>
		<category><![CDATA[网络营销]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=214</guid>
		<description><![CDATA[　　Hi，我是Tenly，又和大家见面了，这个月会为大家再分享两篇文章。
　　经常和Sidney等同事说起网站分析软件工具问题，我们都有一个共识，那就是EXCEL是网站分析极端需要掌握的工具。理论上，网站分析怎么也算是数据分析（我的职位就是数据分析师）的一种，而高端的数据分析往往需要一些大型的软件：如SPSS，SAS，MATLAB，EVIEW等。事实上我在大学就使用过MATLAB（高等数学时使用）与EVIEW（计量经济学时使用），然而在网站分析的实践过程当中，总觉得与它们联系不起来。按我个人的观点有几个原因：

网站分析过程中的度量不多，不需要运用复杂的数学定理建立数学模型。
网站分析工具（如GA，OMNITURE等）对数据进行了第一轮的处理，这一轮处理分析师是无法干预的。
暂时以个人的力量还没有积累庞大的网站分析所需要的数据库供数据挖掘使用。
网站分析过程中误差与不定因素较多，较难建立相同或类似环境下的数据对照。
当然也可能是本人水平层次还不够吧：）

　　不管怎么说，尽管sidney以前的文章还是详细说明了各种度量，而这文章的主要内容还是为了把网站分析过程中的大部分度量按照易懂的思路给列出来，帮助形成体系。希望大家不要嫌弃，毕竟基本功要扎实是真理。
　　下面就列一下这曲指可数的一些度量吧：
第一篇：入口篇
　　入口是指线上广告入口。这些入口可以多种多样，熟悉网络营销的人可以侃侃而谈：

Banner，焦点图，摩天楼，浮动框等原始硬广告。
邮件营销的链接入口。
友情链接。
搜索引擎入口，包括但不限于百度竞价排名，合作专区（如百度brand zone），ADwords，SEO结果页。
软文中的链接。
流氓软件及软件的推广入口。
游戏客户端广告。
……时代在发展，手段在革新，还有很多

　　总的来说这种入口吸引访问者进行点击，使访问者通过点击，来到了一个专门为访问者准备好内容的页面，就是我们常说的Landing Page.
　　在这个过程中，我们会涉及以下度量：

Impression：广告被展示了多少次。

监测方法：Flash广告会通过加入Action script代码实现监控；Video会和Flash播放器通过特定的JS调用服务器数据监测；JPG,GIF等图片入口会通过在其HTML源代码后面紧跟一个1*1象素的透明小GIF代码实现监测，该小GIF放在第三方服务器上，一旦该GIF被用户从服务器上读取一次，即被算一次Impression；至于文字链接一般不好监测，也不会做监测，如果实在想监测也可以按JPG和GIF的方式。


Clicks：指广告被点击了多少次。

监测方法：通过跳转实现监控。


CTR：Clicks/Impression，表现广告点击率，反映广告是否吸引人的度量。
Engagement：有一些富媒体会有一些让浏览者进行互动的行为。这些互动的富媒现阶段主要使用Flash与JS的技术解决方案。在富媒体设计与编程时，会记录浏览者的互动行为与次数。关于Engagment含义的精僻分析，请参见Sidney的相关文章。
Cost：花钱买广告的成本。
CPM：(Cost / Impression) × 1000，广告展示一千次所花的钱。
CPC：Cost / Click 每点击一次入口广告所花的钱。
Loss rate：(1- Visits / Clikcs) * 100%。
这是容易迷糊的地方。这里的Visits是指广告指向的 Landing Page 的 Visits。注意：这里的Visits是指由对应的广告入口带来的Visits，因为Landing Page会有多个广告入口导流量进来，分子分母要对应。
Loss Rate 永远大于等于 0 ，只有理想的情况下才会等于0，也就是说 Visits 永远小于或等于广告的 Clicks。原因是浏览者经常在点击广告后，在目标页面没有打开或没有完全打开的情况下就会把网页关掉。
Freebies：这是一个很具实战经验的词。在媒体购买过程中，经常会有一些package或者赠送打折之类的情况，简称为优惠赠送。而这些优惠虽然不花钱，但做为商品也有他的明码标价的价格。在此只是提一提，很少用。

　　我还有遗忘了基于广告入口的哪个度量么？欢迎纠正。有任何疑问，欢迎留言，一起探讨。
　　下周还会带来更多篇章，敬请期待：
第二篇：合作网站篇
第三篇：本站篇
第四篇：其它篇
]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2008/09/click.png"></a><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2008/09/click.png"></a>　　Hi，我是Tenly，又和大家见面了，这个月会为大家再分享两篇文章。</p>
<p>　　经常和Sidney等同事说起网站分析软件工具问题，我们都有一个共识，那就是EXCEL是网站分析极端需要掌握的工具。理论上，网站分析怎么也算是数据分析（<span style="color: #888888;">我的职位就是数据分析师</span>）的一种，而高端的数据分析往往需要一些大型的软件：如SPSS，SAS，MATLAB，EVIEW等。事实上我在大学就使用过MATLAB（高等数学时使用）与EVIEW（计量经济学时使用），然而在网站分析的实践过程当中，总觉得与它们联系不起来。按我个人的观点有几个原因：</p>
<ol>
<li>网站分析过程中的度量不多，不需要运用复杂的数学定理建立数学模型。</li>
<li>网站分析工具（如GA，OMNITURE等）对数据进行了第一轮的处理，这一轮处理分析师是无法干预的。</li>
<li>暂时以个人的力量还没有积累庞大的网站分析所需要的数据库供数据挖掘使用。</li>
<li>网站分析过程中误差与不定因素较多，较难建立相同或类似环境下的数据对照。</li>
<li>当然也可能是本人水平层次还不够吧：）</li>
</ol>
<p>　　不管怎么说，尽管sidney以前的文章还是详细说明了各种度量，而这文章的主要内容还是为了把网站分析过程中的大部分度量按照易懂的思路给列出来，帮助形成体系。希望大家不要嫌弃，毕竟基本功要扎实是真理。</p>
<p>　　下面就列一下这曲指可数的一些度量吧：</p>
<h2><span style="color: #800000;">第一篇：入口篇</span></h2>
<p>　　入口是指线上广告入口。这些入口可以多种多样，熟悉网络营销的人可以侃侃而谈：</p>
<ul>
<li>Banner，焦点图，摩天楼，浮动框等原始硬广告。</li>
<li>邮件营销的链接入口。</li>
<li>友情链接。</li>
<li>搜索引擎入口，包括但不限于百度竞价排名，合作专区（如百度brand zone），ADwords，SEO结果页。</li>
<li>软文中的链接。</li>
<li>流氓软件及软件的推广入口。</li>
<li>游戏客户端广告。</li>
<li>……时代在发展，手段在革新，还有很多</li>
</ul>
<p>　　总的来说这种入口吸引访问者进行点击，使访问者通过点击，来到了一个专门为访问者准备好内容的页面，就是我们常说的<strong><span style="color: #000000;">Landing Page</span>.</strong></p>
<p>　　在这个过程中，我们会涉及以下度量：</p>
<ul>
<li><strong>Impression</strong>：广告被展示了多少次。
<ul>
<li>监测方法：Flash广告会通过加入Action script代码实现监控；Video会和Flash播放器通过特定的JS调用服务器数据监测；JPG,GIF等图片入口会通过在其HTML源代码后面紧跟一个1*1象素的透明小GIF代码实现监测，该小GIF放在第三方服务器上，一旦该GIF被用户从服务器上读取一次，即被算一次<strong>Impression</strong>；至于文字链接一般不好监测，也不会做监测，如果实在想监测也可以按JPG和GIF的方式。</li>
</ul>
</li>
<li><strong>Clicks</strong>：指广告被点击了多少次。
<ul>
<li>监测方法：通过跳转实现监控。<img class="alignright" style="float: right; border: 1px solid black;" src="http://www.chinawebanalytics.cn/wp-content/uploads/2008/09/click.png" alt="" width="599" height="419" /></li>
</ul>
</li>
<li><strong>CTR</strong>：<strong>Clicks</strong>/<strong>Impression</strong>，表现广告点击率，反映广告是否吸引人的度量。</li>
<li><strong>Engagement</strong>：有一些富媒体会有一些让浏览者进行互动的行为。这些互动的富媒现阶段主要使用Flash与JS的技术解决方案。在富媒体设计与编程时，会记录浏览者的互动行为与次数。关于<strong>Engagment</strong>含义的精僻分析，请参见Sidney的相关文章。</li>
<li><strong>Cost</strong>：花钱买广告的成本。</li>
<li><strong>CPM</strong>：<strong>(Cost</strong> / <strong>Impression)</strong> × 1000，广告展示一千次所花的钱。</li>
<li><strong>CPC</strong>：<strong>Cost</strong> / <strong>Click</strong> 每点击一次入口广告所花的钱。</li>
<li><strong>Loss rate：(1-</strong> <strong>Visits</strong> / <strong>Clikcs) * 100%。<br />
</strong>这是容易迷糊的地方。这里的<strong>Visits</strong>是指广告指向的 <strong>Landing Page </strong>的 <strong>Visits</strong>。注意：这里的<strong>Visits</strong>是指由对应的广告入口带来的<strong>Visits</strong>，因为<strong>Landing Page</strong>会有多个广告入口导流量进来，分子分母要对应。<br />
<strong>Loss Rate </strong>永远大于等于 0 ，只有理想的情况下才会等于0，也就是说 <strong>Visits </strong>永远小于或等于广告的 <strong>Clicks</strong>。原因是浏览者经常在点击广告后，在目标页面没有打开或没有完全打开的情况下就会把网页关掉。</li>
<li><strong>Freebies</strong>：这是一个很具实战经验的词。在媒体购买过程中，经常会有一些package或者赠送打折之类的情况，简称为优惠赠送。而这些优惠虽然不花钱，但做为商品也有他的明码标价的价格。在此只是提一提，很少用。</li>
</ul>
<p>　　我还有遗忘了基于广告入口的哪个度量么？欢迎纠正。有任何疑问，欢迎留言，一起探讨。</p>
<p>　　下周还会带来更多篇章，敬请期待：</p>
<p>第二篇：合作网站篇<br />
第三篇：本站篇<br />
第四篇：其它篇</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/%e4%bb%8e%e5%a4%b4%e5%88%b0%e5%b0%be%e5%88%97%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e8%bf%87%e7%a8%8b%e4%b8%ad%e7%9a%84%e5%ba%a6%e9%87%8f%e4%b8%8a/feed/</wfw:commentRss>
		<slash:comments>12</slash:comments>
		</item>
		<item>
		<title>网站分析的最基本度量（7）——Impression，Click和CTR</title>
		<link>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e6%9c%80%e5%9f%ba%e6%9c%ac%e6%a6%82%e5%bf%b5%ef%bc%887%ef%bc%89%e2%80%94%e2%80%94impression%ef%bc%8cclick%e5%92%8cctr/</link>
		<comments>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e6%9c%80%e5%9f%ba%e6%9c%ac%e6%a6%82%e5%bf%b5%ef%bc%887%ef%bc%89%e2%80%94%e2%80%94impression%ef%bc%8cclick%e5%92%8cctr/#comments</comments>
		<pubDate>Fri, 15 Feb 2008 06:55:12 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[基础知识]]></category>
		<category><![CDATA[Click]]></category>
		<category><![CDATA[CTR]]></category>
		<category><![CDATA[Impression]]></category>
		<category><![CDATA[Metric]]></category>
		<category><![CDATA[基本概念]]></category>
		<category><![CDATA[度量]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=56</guid>
		<description><![CDATA[　　终于又有时间写些什么了，这样的时间可不多，要倍加珍惜。 　　前面关于网站分析基本概念的5个文章，都是有关于站点本身的。但是，有一个概念要澄清的是，尽管网站分析的主要分析领域是网站本身，它也需要对网络营销活动进行一些相关分析。因为让visitor上网站是目的，而网络营销则是手段。只分析目的而不看手段，不可能达到分析的目的。
[转载请事先声明并得到许可，版权归作者www.chinawebanalytics.cn所有]
	　　因此，今天，我们进入一个新的领域，即把流量（Traffic）带到网站上来的一个主要源头（Source）之一&#8212;&#8212;Media。 　　Media是什么？汉语翻译是媒体，在网络营销中，往往就是承载你广告的网站。如果你在新浪上做了广告，那么新浪就是你的一个Media。【点击标题阅读全文】

图：新浪是Media，红框内是广告
	　　而衡量Media上广告效果的指标有两个是最为基本的，那就是我们今天标题提到的这两个&#8212;&#8212;Impression和Click。 　　Impression的意思是&#8220;显示&#8221;，很简单，一个广告被显示了多少次，它就计数多少。比如，你打开新浪的一个页面，这上面的所有广告就被&#8220;显示&#8221;了一次，每个广告增加1个Impression；如果你刷新这个页面，所有的广告就显示了两次，每个广告总计增加2个Impression。没有歧义，非常简单。因此，在一个知名门户网站上的Impression通常极为巨大，几十万到几百万，到几千万，都有可能。 　　那么Click呢？Click是指互联网用户点击这个广告的次数。你可能误点击了一个广告，然后弹出一个新的页面，你甚至还没有让这个页面全部显示在你的屏幕中，就啪的一下关闭了它。这个时候，还算1个Click吗？答案是，算，当然算。Click就是Click，点一下算一下，而不管其后用户到底做了些什么。因此，Click也非常简单，简直有些&#8220;弱智&#8221;。
[转载请事先声明并得到许可，版权归作者www.chinawebanalytics.cn所有]
	　　但是简单的代价，往往是价值也很低。Impression和Click很难作为单独的衡量指标告诉网络营销的效果到底如何，广告主也很难从中间获得什么见解。因此，现在已经很少单纯用它们做分析了。当然，它们仍然很重要，是很多更复杂分析的基础，CTR就是其中之一。 　　什么是CTR呢？接着看，也很简单。一般而言，Click比Impression要小很多。因为我们中的大多数，都只浏览网页不看广告，更不会去用鼠标点击它。有些时候，要100个Impression才能有1个Click。因此，我们把这个广告的实际被点击（Click）的数量除以它的Impression的数量，就是Click Through Rate，汉语名字是点击通过率，或简称点击率 （CTR），如果一个广告的Impression是100次，被点击了1次，那么CTR就是1个Click除以100个Impression，即CTR=1%。如果你的广告有1%的CTR，那么要恭喜你，你的广告情况好于大多数，一般中国的CTR，在千分之几的数目上徘徊，即1000个Impression才可能产生几个Click，而且其中还可能有误点击的。&#8212;&#8212;做一次广告真不容易啊！！:(
[转载请事先声明并得到许可，版权归作者www.chinawebanalytics.cn所有]
	　　有什么想说的吗？对于Impression和Click，还有什么不了解的？比如，它们如何被网站监测工具 监测并计算？想要知道更多，请给我留言吧！
]]></description>
			<content:encoded><![CDATA[<div>　　终于又有时间写些什么了，这样的时间可不多，要倍加珍惜。 　　前面关于网站分析基本概念的5个文章，都是有关于站点本身的。但是，有一个概念要澄清的是，尽管网站分析的主要分析领域是网站本身，它也需要对网络营销活动进行一些相关分析。因为让<a href="http://www.chinawebanalytics.cn/?p=10" target="_blank"><span style="font-size: x-small; color: rgb(136, 136, 136);">visitor</span></a>上网站是目的，而网络营销则是手段。只分析目的而不看手段，不可能达到分析的目的。</p>
<p style="text-align: center;"><span style="text-decoration: underline;"><span style="text-decoration: underline;">[转载请事先声明并得到许可，版权归<a href="http://www.chinawebanalytics.cn/?author=1" target="_blank"><span style="color: rgb(85, 119, 153);">作者</span></a><a href="http://www.chinawebanalytics.cn/">www.chinawebanalytics.cn</a>所有]</span></span></p>
<p>	　　因此，今天，我们进入一个新的领域，即把流量（Traffic）带到网站上来的一个主要源头（Source）之一&mdash;&mdash;Media。 　　Media是什么？汉语翻译是媒体，在网络营销中，往往就是承载你广告的网站。如果你在新浪上做了广告，那么新浪就是你的一个Media。【点击标题阅读全文】<span id="more-56"></span></p>
<p style="text-align: center;"><img alt="新浪是Media，红框内是广告" height="191" src="http://www.chinawebanalytics.cn/wp-content/uploads/2008/04/sina.jpg" style="vertical-align: middle;" width="500" /></p>
<p align="center"><strong>图：新浪是Media，红框内是广告</strong></p>
<p>	　　而衡量Media上广告效果的指标有两个是最为基本的，那就是我们今天标题提到的这两个&mdash;&mdash;Impression和Click。 　　Impression的意思是&ldquo;显示&rdquo;，很简单，一个广告被显示了多少次，它就计数多少。比如，你打开新浪的一个页面，这上面的所有广告就被&ldquo;显示&rdquo;了一次，每个广告增加1个Impression；如果你刷新这个页面，所有的广告就显示了两次，每个广告总计增加2个Impression。没有歧义，非常简单。因此，在一个知名门户网站上的Impression通常极为巨大，几十万到几百万，到几千万，都有可能。 　　那么Click呢？Click是指互联网用户点击这个广告的次数。你可能误点击了一个广告，然后弹出一个新的页面，你甚至还没有让这个页面全部显示在你的屏幕中，就啪的一下关闭了它。这个时候，还算1个Click吗？答案是，算，当然算。Click就是Click，点一下算一下，而不管其后用户到底做了些什么。因此，Click也非常简单，简直有些&ldquo;弱智&rdquo;。</p>
<p style="text-align: center;"><span style="text-decoration: underline;">[转载请事先声明并得到许可，版权归<a href="http://www.chinawebanalytics.cn/?author=1" target="_blank"><span style="color: rgb(85, 119, 153);">作者</span></a><a href="http://www.chinawebanalytics.cn/">www.chinawebanalytics.cn</a>所有]</span></p>
<p>	　　但是简单的代价，往往是价值也很低。Impression和Click很难作为单独的衡量指标告诉网络营销的效果到底如何，广告主也很难从中间获得什么见解。因此，现在已经很少单纯用它们做分析了。当然，它们仍然很重要，是很多更复杂分析的基础，CTR就是其中之一。 　　什么是CTR呢？接着看，也很简单。一般而言，Click比Impression要小很多。因为我们中的大多数，都只浏览网页不看广告，更不会去用鼠标点击它。有些时候，要100个Impression才能有1个Click。因此，我们把这个广告的实际被点击（Click）的数量除以它的Impression的数量，就是Click Through Rate，汉语名字是<strong>点击通过率</strong>，或简称<strong>点击率 （CTR），</strong>如果一个广告的Impression是100次，被点击了1次，那么CTR就是1个Click除以100个Impression，即CTR=1%。如果你的广告有1%的CTR，那么要恭喜你，你的广告情况好于大多数，一般中国的CTR，在千分之几的数目上徘徊，即1000个Impression才可能产生几个Click，而且其中还可能有误点击的。&mdash;&mdash;做一次广告真不容易啊！！:(</p>
<p style="text-align: center;"><span style="text-decoration: underline;"><span style="text-decoration: underline;">[转载请事先声明并得到许可，版权归<a href="http://www.chinawebanalytics.cn/?author=1" target="_blank"><span style="color: rgb(85, 119, 153);">作者</span></a><a href="http://www.chinawebanalytics.cn/">www.chinawebanalytics.cn</a>所有]</span></span></p>
<p>	　　有什么想说的吗？对于Impression和Click，还有什么不了解的？比如，它们如何被网站监测工具 监测并计算？想要知道更多，请给我留言吧！</p></div>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e6%9c%80%e5%9f%ba%e6%9c%ac%e6%a6%82%e5%bf%b5%ef%bc%887%ef%bc%89%e2%80%94%e2%80%94impression%ef%bc%8cclick%e5%92%8cctr/feed/</wfw:commentRss>
		<slash:comments>18</slash:comments>
		</item>
		<item>
		<title>为什么&#8221;Bounce Rate&#8221;应该成为一个关键度量</title>
		<link>http://www.chinawebanalytics.cn/%e4%b8%ba%e4%bb%80%e4%b9%88bounce-rate-%e6%98%af%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e4%b8%ad%e6%9c%80%e5%85%b3%e9%94%ae%e7%9a%84%e4%b8%80%e4%b8%aa%e5%ba%a6%e9%87%8f/</link>
		<comments>http://www.chinawebanalytics.cn/%e4%b8%ba%e4%bb%80%e4%b9%88bounce-rate-%e6%98%af%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e4%b8%ad%e6%9c%80%e5%85%b3%e9%94%ae%e7%9a%84%e4%b8%80%e4%b8%aa%e5%ba%a6%e9%87%8f/#comments</comments>
		<pubDate>Mon, 28 Jan 2008 15:20:06 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[基础知识]]></category>
		<category><![CDATA[Bounce Rate]]></category>
		<category><![CDATA[Metric]]></category>
		<category><![CDATA[度量]]></category>
		<category><![CDATA[蹦失率]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=48</guid>
		<description><![CDATA[From Longmarch.chinalytics.com, by Florian Pihs
　　这个博客最常提到的一些主题，会聚焦在一些对于任何在线营销（网络营销）和网站主都会非常在意的一些度量之上，并且会解释它们如何和在线营销相联系，尤其是在中国。可能在后面的博客中，不会有一个安排的非常特殊的顺序，但我打算覆盖那些最重要，尤其是在中国尤为重要的那些度量。
[转载请事先声明并得到许可，版权归作者www.chinawebanalytics.cn所有]
　　第一个纳入我视野的是&#34;Bounce Rate&#34;（蹦失率）。网站分析协会（Web Analytics Association）定义（defines）Bounce Rate = Single Page Visits / Entry Pages（单PV的Visits / 进入页面）。即，测量有多少个Visits进入网站的第一个页面（即进入页面，Entry Page）后，不再进入其他的页面，即单一页面的访问数量（Single Page Visits）。或者用网络营销的语言：你的Landing Page对用户而言，是否足够有趣到吸引他们采取一些行动（即，点击页面上的链接）。【点击标题阅读全文】
　　现在，为什么Bounce Rate对于在线营销如此重要呢？在传统的媒体广告中，我们分析电视排行、媒体传播和其他一些评测方法来分析有多少人接触到我们的广告。然后，我们用调查的方式去了解广告有没有突破各种媒体的噪音，有没有有效的影响到受众。更多的时候，这也正是我们在中国做在线营销时所用的方法。我们先是测量广告页面被显示的次数（Impressions），接着测量广告条或者搜索引擎关键词的点击数（Click）和点击通过率（Click Through Rates），再接着我们对受众进行有关于品牌偏好的调研&#8230;&#8230;。经常（在中国则是&#34;大多数时候&#34;）被完全忽略的是，究竟用户在点击横幅广告（Banner）后做了些什么！既然这正是使网络广告区别于传统广告之处，也是与传统广告相比，最独一无二之处，因此不研究它真是一个完完全全的浪费！
[转载请事先声明并得到许可，版权归作者www.chinawebanalytics.cn所有]
　　一旦一个访问者（Visitor）点击了我们的广告，我们知道他对我们传达的信息是感兴趣的。更好的是，他在点击之后，会进入到一个我们能够100%控制的环境中。这是一个我们能够真正把品牌概念影响到访问者/用户/潜在客户的地方。这个环境能够增加他们的品牌认知、品牌偏好，甚至让他们直接购买我们的产品或是服务。
　　Bounce Rate告诉你，你对于上面的这个优势利用的如何，而不仅仅只是将网络广告作为一个漂亮的新的信息渠道。答案是，在中国，在这个时期，很遗憾，我们做的非常非常差。我在与我的客户、朋友和行业专家的讨论中，他们都告诉我中国的在线营销的Bounce Rate介于90%~99%之间。好的营销活动能够接近90%，但很少有低于90%的。但在美国，平均的Bounce Rate接近于60%。这表明，2007年中国60亿到70亿元人民币的网络广告营销费用，有至少55亿元打了水漂。换句话说，如果我们能够接近美国的数字，我们就能够至少300%的提高我们的在线营销效果。
[转载请事先声明并得到许可，版权归作者www.chinawebanalytics.cn所有]
　　这当然是一个值得我们我们思考的数字。另外，还有一些其他因素可以帮助解释中国的高的&#34;离谱&#34;的Bounce Rate。

中国的很多网民还很难从网上已经提供的相关信息中分辨出哪些内容是他们感兴趣的。
登陆页（Landing Page）可能已经包含了所有访问者感兴趣的信息，因此他/她不再需要继续点击了。
有时来自访问者的访问只是点击一个下载链接，而这个点击没有被计数，因此被算成了一个Bounce。

　　对于每一个广告主而言，理解Bounce Rate本身，理解它与营销目标的达成有何种关联，以及与竞争对手的Bounce Rate又有何种关联，都是非常关键的。因此，现在对亲爱的读者，有一个问题，你的网络营销的Bounce Rate是多少，你又如何去减小它？
]]></description>
			<content:encoded><![CDATA[<p align="left">From <a href="http://longmarch.chinalytics.com/" target="_blank">Longmarch.chinalytics.com</a>, by Florian Pihs</p>
<p align="left">　　这个博客最常提到的一些主题，会聚焦在一些对于任何在线营销（网络营销）和网站主都会非常在意的一些度量之上，并且会解释它们如何和在线营销相联系，尤其是在中国。可能在后面的博客中，不会有一个安排的非常特殊的顺序，但我打算覆盖那些最重要，尤其是在中国尤为重要的那些度量。</p>
<p style="text-align: center;"><span style="text-decoration: underline;">[转载请事先声明并得到许可，版权归<a href="http://www.chinawebanalytics.cn/?author=1" target="_blank"><span style="color: rgb(85, 119, 153);">作者</span></a><a href="http://www.chinawebanalytics.cn/">www.chinawebanalytics.cn</a>所有]</span></p>
<p align="left">　　第一个纳入我视野的是&quot;<a href="http://www.chinawebanalytics.cn/?p=45" target="_blank">Bounce Rate</a>&quot;（蹦失率）。网站分析协会（<a href="http://www.webanalyticsassociation.org/">Web Analytics Association</a>）定义（<a href="http://www.webanalyticsassociation.org/attachments/committees/5/WAA-Standards-Analytics-Definitions-Volume-I-20070816.pdf">defines</a>）Bounce Rate = Single Page Visits / Entry Pages（单<a href="http://www.chinawebanalytics.cn/?p=43" target="_blank">PV</a>的<a href="http://www.chinawebanalytics.cn/?p=9" target="_blank">Visits</a> / 进入页面）。即，测量有多少个Visits进入网站的第一个页面（即进入页面，Entry Page）后，不再进入其他的页面，即单一页面的访问数量（Single Page Visits）。或者用网络营销的语言：你的Landing Page对用户而言，是否足够有趣到吸引他们采取一些行动（即，点击页面上的链接）。【点击标题阅读全文】<span id="more-48"></span></p>
<p align="left">　　现在，为什么Bounce Rate对于在线营销如此重要呢？在传统的媒体广告中，我们分析电视排行、媒体传播和其他一些评测方法来分析有多少人接触到我们的广告。然后，我们用调查的方式去了解广告有没有突破各种媒体的噪音，有没有有效的影响到受众。更多的时候，这也正是我们在中国做在线营销时所用的方法。我们先是测量广告页面被显示的次数（Impressions），接着测量广告条或者搜索引擎关键词的点击数（Click）和点击通过率（Click Through Rates），再接着我们对受众进行有关于品牌偏好的调研&#8230;&#8230;。经常（在中国则是&quot;大多数时候&quot;）被完全忽略的是，究竟用户在点击横幅广告（Banner）后做了些什么！既然这正是使网络广告区别于传统广告之处，也是与传统广告相比，最独一无二之处，因此不研究它真是一个完完全全的浪费！</p>
<p style="text-align: center;"><span style="text-decoration: underline;">[转载请事先声明并得到许可，版权归<a href="http://www.chinawebanalytics.cn/?author=1" target="_blank"><span style="color: rgb(85, 119, 153);">作者</span></a><a href="http://www.chinawebanalytics.cn/">www.chinawebanalytics.cn</a>所有]</span></p>
<p align="left">　　一旦一个访问者（<a href="http://www.chinawebanalytics.cn/?p=10" target="_blank">Visitor</a>）点击了我们的广告，我们知道他对我们传达的信息是感兴趣的。更好的是，他在点击之后，会进入到一个我们能够100%控制的环境中。这是一个我们能够真正把品牌概念影响到访问者/用户/潜在客户的地方。这个环境能够增加他们的品牌认知、品牌偏好，甚至让他们直接购买我们的产品或是服务。</p>
<p align="left">　　Bounce Rate告诉你，你对于上面的这个优势利用的如何，而不仅仅只是将网络广告作为一个漂亮的新的信息渠道。答案是，在中国，在这个时期，很遗憾，我们做的非常非常差。我在与我的客户、朋友和行业专家的讨论中，他们都告诉我中国的在线营销的Bounce Rate介于90%~99%之间。好的营销活动能够接近90%，但很少有低于90%的。但在美国，平均的Bounce Rate接近于60%。这表明，2007年中国60亿到70亿元人民币的网络广告营销费用，有至少55亿元打了水漂。换句话说，如果我们能够接近美国的数字，我们就能够至少300%的提高我们的在线营销效果。</p>
<p style="text-align: center;"><span style="text-decoration: underline;">[转载请事先声明并得到许可，版权归<a href="http://www.chinawebanalytics.cn/?author=1" target="_blank"><span style="color: rgb(85, 119, 153);">作者</span></a><a href="http://www.chinawebanalytics.cn/">www.chinawebanalytics.cn</a>所有]</span></p>
<p align="left">　　这当然是一个值得我们我们思考的数字。另外，还有一些其他因素可以帮助解释中国的高的&quot;离谱&quot;的Bounce Rate。</p>
<ul type="disc">
<li>中国的很多网民还很难从网上已经提供的相关信息中分辨出哪些内容是他们感兴趣的。</li>
<li>登陆页（Landing Page）可能已经包含了所有访问者感兴趣的信息，因此他/她不再需要继续点击了。</li>
<li>有时来自访问者的访问只是点击一个下载链接，而这个点击没有被计数，因此被算成了一个Bounce。</li>
</ul>
<p align="left">　　对于每一个广告主而言，理解Bounce Rate本身，理解它与营销目标的达成有何种关联，以及与竞争对手的Bounce Rate又有何种关联，都是非常关键的。因此，现在对亲爱的读者，有一个问题，你的网络营销的Bounce Rate是多少，你又如何去减小它？</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/%e4%b8%ba%e4%bb%80%e4%b9%88bounce-rate-%e6%98%af%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e4%b8%ad%e6%9c%80%e5%85%b3%e9%94%ae%e7%9a%84%e4%b8%80%e4%b8%aa%e5%ba%a6%e9%87%8f/feed/</wfw:commentRss>
		<slash:comments>15</slash:comments>
		</item>
		<item>
		<title>网站分析的最基本度量（5）——Bounce Rate</title>
		<link>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e6%9c%80%e5%9f%ba%e6%9c%ac%e6%a6%82%e5%bf%b5%ef%bc%885%ef%bc%89%e2%80%94%e2%80%94bounce-rate/</link>
		<comments>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e6%9c%80%e5%9f%ba%e6%9c%ac%e6%a6%82%e5%bf%b5%ef%bc%885%ef%bc%89%e2%80%94%e2%80%94bounce-rate/#comments</comments>
		<pubDate>Mon, 21 Jan 2008 14:44:53 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[基础知识]]></category>
		<category><![CDATA[Bounce Rate]]></category>
		<category><![CDATA[Metric]]></category>
		<category><![CDATA[基本概念]]></category>
		<category><![CDATA[度量]]></category>
		<category><![CDATA[蹦失率]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=45</guid>
		<description><![CDATA[　　引言：&#8220;Bounce Rate = 只浏览了一个页面的Visits / 全部的Visits；
　　换成英语是：Bounce Rate = Single Page Visits / Total Visits。&#8221;
　　前面我们知道了一些最最基本的概念，现在要进入更重要的一些网站分析KPI了。怎么样？准备好了吗？【点击标题阅读全文】
　　Bounce Rate，这个词很像NBA的某个跟篮板有关的名词哦，不过在网站分析里，它是什么意思呢？了解它之前，请回忆我们之前讲过的PV吧！
[转载请事先声明并得到许可，版权归作者所有。]
　　在你点击某一个网站（假定它叫网站A）网页（假定它叫A.htm）上的链接（Link，可以是一段文字的Link，叫Text Link，或是一个图片Link，叫Banner或Pic，或是一个Flash等等）后，客户端会向网络服务器发送一个Request，以请求发送这个链接对应的页面，我们暂且将这个页面叫做&#8220;B.htm&#8221;，且B.htm是属于另外一个网站的，我们给这个网站起名叫B。那么，对于网站B而言，B.htm是该访问者访问B网站的&#8220;进入页面&#8221;（英语叫Entry Page，也就是你访问某个网站时的第一个页面）。这个时候，如果一切顺利，B.htm会逐渐打开了。
　　为什么是逐渐呢？因为，传送数据需要时间，而且越是复杂的页面，需要传送的信息量越多，也就约需要花费时间，因此大多数的Web页面都是逐渐打开的。这个你一定会同意，不然我们也不用抱怨网络这么慢了。
　　如果这个页面B.htm在逐渐打开的过程中，隐约露出了一些信息，你一看，这网站讲的是什么东西嘛，一点儿都没意思，看来我点错了。于是你啪的一下关了它，甚至它还没有来得及完全传送到你的浏览器上呢。这种情况，对于网站B而言，它就多了一次Loss。对于任何一个网站而言，Loss如果很多的话，那就说明它对Visitor的吸引力实在是很差很差哦！当然，Loss多也有另外一种情况，那就是很多误点击进入该站&#8212;&#8212;现在很多广告banner做的像Windows的窗口，就是吸引你误点击的，我觉得这种banner其实根本一点儿用也没有。

　　换一种情况，如果你并没有在B.htm还没有完全下载完之前关闭它，（真拗口，意思就是你让B.htm全部下载了，显示在你的浏览器中），这个时候B网站应该庆幸了，因为它没有从你这里获得一次Loss，不用伤心了。不过B网站悬着的心还不能放下来，什么呢？就是我们在一开始提到的Bounce！
　　Bounce是指，你在下载完B.htm进入B网站后，却没有用鼠标点击B.htm上面的任何链接（Link），就关闭了它。这对B网站而言就是一个Bounce。简单说，如果你成功进入一个网站，却没有点击它其上的任何链接，那么就为这个网站创造了一个Bounce。
[转载请事先声明并得到许可，版权归作者www.chinawebanalytics.cn所有]
　　那么Bounce Rate是指对某个网站的访问中，&#8220;Bounce掉&#8221;的访问占总访问数量的百分比。计算的方法一般使用Visit来计算。即：
　　Bounce Rate = 只浏览了一个页面的Visits / 全部的Visits；
　　换成英语是：Bounce Rate = Single Page Visits / Total Visits。这也是Omniture等工具计算Bounce Rate的方法。
　　这里要澄清另外一个Bounce Rate的计算方法：即 Bounce Rate = Single PV Visits / Total Visits，这是Google Analytics等工具的计算方法。
　　与前者的差异在于，这个是单一PV的访问，而前者则是单一页面的访问。有什么区别呢？可以想一想，如果用户访问一个页面，没有点击这个页面上的任何一个链接，但是却用鼠标点击了浏览器的&#8220;Refresh&#8221;按钮，即刷新（Reload，或者Refresh）了当前页面，这个时候，这个visit对这个页面的PV就不再是1，而是2。这时对于Bounce Rate = Single PV Visits / Total Visits的计算方法而言，这个visit就不再是Single PV Visit了，也就不再算作一个Bounce。Google Analytics就是这样计算的。但是对于Bounce = Single Page Visits / Total Visits的计算方法而言，用户仍然没有链接到其他页面，因此仍然还是一个Single Page Visits，此时仍然会算作一个Bounce，Omniture则是这样计算的。
　　因此，这说明Bounce Rate有两种理解（Single Page的理解和Single PV的理解）。我倾向于前者，也就是Omniture的计算方法，因为刷新页面对于网站所有者或者广告主而言，意义并不大。
　　Bounce Rate是非常重要的，它显示了某个网站对于Visitor而言，到底有没有兴趣，或者有没有起到预计的效果。如果Visitor只是看到了你的网站，但是你所希望他们点击的链接都落空了，这就说明你的网站出了问题！真可怕，不是吗？
　　Bounce Rate对于网络营销而言，是一个重要的指标（指针），它告诉你，即使你把Audience（网络营销的受众）都招来到了你宣传产品或品牌的网站上，也未必能获得你预期的效果，如果Visitor都Bounce掉了的话。
　　后面马上就会有一个文章专门探讨Bounce Rate，题目是&#8220;为什么Bounce Rate是网络营销里的最重要指标&#8221;（中文版 English Version），如果有兴趣，你可以看看这篇文章，当然，内容是比较advanced（高级）的哦！
　　哦，对了，还没有给Bounce Rate起一个中国名字，说实话，它还没有标准的中国名字呢！这倒是给了我机会，让我们叫它&#8220;蹦失率&#8221;吧！好像音和义都很恰切哦。:-)
　　轮到你了，亲爱的朋友，写点什么给我吧！
]]></description>
			<content:encoded><![CDATA[<p><em>　　引言：&ldquo;<strong>Bounce Rate = 只浏览了一个页面的Visits / 全部的Visits；</strong></em></p>
<p><em>　　<strong>换成英语是：Bounce Rate = Single Page Visits / Total Visits。&rdquo;</strong></em></p>
<p>　　前面我们知道了一些最最基本的概念，现在要进入更重要的一些网站分析KPI了。怎么样？准备好了吗？【点击标题阅读全文】<span id="more-45"></span></p>
<p>　　Bounce Rate，这个词很像NBA的某个跟篮板有关的名词哦，不过在网站分析里，它是什么意思呢？了解它之前，请回忆我们之前讲过的<a href="http://www.chinawebanalytics.cn/wp-admin/post.php?action=edit&amp;post=43" target="_blank">PV</a>吧！</p>
<p style="text-align: center;"><span style="text-decoration: underline;">[转载请事先声明并得到许可，版权归<a href="http://www.chinawebanalytics.cn/?author=1" target="_blank"><span style="color: rgb(85, 119, 153);">作者</span></a>所有。]</span></p>
<p>　　在你点击某一个网站（假定它叫网站A）网页（假定它叫A.htm）上的链接（Link，可以是一段文字的Link，叫Text Link，或是一个图片Link，叫Banner或Pic，或是一个Flash等等）后，客户端会向网络服务器发送一个Request，以请求发送这个链接对应的页面，我们暂且将这个页面叫做&ldquo;B.htm&rdquo;，且B.htm是属于另外一个网站的，我们给这个网站起名叫B。那么，对于网站B而言，B.htm是该访问者访问B网站的&ldquo;进入页面&rdquo;（英语叫<span style="color: rgb(255, 0, 0);"><strong>Entry Page</strong></span>，也就是你访问某个网站时的第一个页面）。这个时候，如果一切顺利，B.htm会<strong><span style="color: rgb(255, 0, 0);">逐渐</span></strong>打开了。</p>
<p>　　为什么是逐渐呢？因为，传送数据需要时间，而且越是复杂的页面，需要传送的信息量越多，也就约需要花费时间，因此大多数的Web页面都是逐渐打开的。这个你一定会同意，不然我们也不用抱怨网络这么慢了。</p>
<p>　　如果这个页面B.htm在逐渐打开的过程中，隐约露出了一些信息，你一看，这网站讲的是什么东西嘛，一点儿都没意思，看来我点错了。于是你啪的一下关了它，甚至它还没有来得及完全传送到你的浏览器上呢。这种情况，对于网站B而言，它就多了一次<strong><span style="color: rgb(255, 0, 0);">Loss</span></strong>。对于任何一个网站而言，Loss如果很多的话，那就说明它对Visitor的吸引力实在是很差很差哦！当然，Loss多也有另外一种情况，那就是很多误点击进入该站&mdash;&mdash;现在很多广告banner做的像Windows的窗口，就是吸引你误点击的，我觉得这种banner其实根本一点儿用也没有。</p>
<p style="text-align: center;"><img alt="Loss意味着有效访问的不断流失" class="alignleft" height="256" src="http://www.chinawebanalytics.cn/wp-content/uploads/2008/04/drop.jpg" style="float: left; margin-left: 10px; margin-right: 10px;" width="208" /></p>
<p>　　换一种情况，如果你并没有在B.htm还没有完全下载完之前关闭它，（真拗口，意思就是你让B.htm全部下载了，显示在你的浏览器中），这个时候B网站应该庆幸了，因为它没有从你这里获得一次Loss，不用伤心了。不过B网站悬着的心还不能放下来，什么呢？就是我们在一开始提到的<strong><span style="color: rgb(255, 0, 0);">Bounce</span></strong>！</p>
<p>　　Bounce是指，你在下载完B.htm进入B网站后，却没有用鼠标点击B.htm上面的任何链接（Link），就关闭了它。这对B网站而言就是一个Bounce。简单说，如果你成功进入一个网站，却没有点击它其上的任何链接，那么就为这个网站创造了一个Bounce。</p>
<p style="text-align: center;"><span style="text-decoration: underline;">[转载请事先声明并得到许可，版权归<a href="http://www.chinawebanalytics.cn/?author=1" target="_blank"><span style="color: rgb(85, 119, 153);">作者</span></a><a href="http://www.chinawebanalytics.cn">www.chinawebanalytics.cn</a>所有]</span></p>
<p>　　那么Bounce Rate是指对某个网站的访问中，&ldquo;Bounce掉&rdquo;的访问占总访问数量的百分比。计算的方法一般使用Visit来计算。即：</p>
<p><strong>　　Bounce Rate = 只浏览了一个页面的Visits / 全部的Visits；</strong></p>
<p><strong>　　换成英语是：Bounce Rate = Single Page Visits / Total Visits。这也是Omniture等工具计算Bounce Rate的方法。</strong></p>
<p>　<span style="color: rgb(255, 0, 0);">　这里要澄清另外一个Bounce Rate的计算方法</span>：即 Bounce Rate = Single <span style="color: rgb(255, 0, 0);">PV</span> Visits / Total Visits，这是Google Analytics等工具的计算方法。</p>
<p>　　与前者的差异在于，这个是单一<span style="color: rgb(255, 0, 0);"><strong>PV</strong></span>的访问，而前者则是单一<strong><span style="color: rgb(255, 0, 0);">页面</span></strong>的访问。有什么区别呢？可以想一想，如果用户访问一个页面，没有点击这个页面上的任何一个链接，但是却用鼠标点击了浏览器的&ldquo;Refresh&rdquo;按钮，即刷新（Reload，或者Refresh）了当前页面，这个时候，这个visit对这个页面的PV就不再是1，而是2。这时对于Bounce Rate = Single <span style="color: rgb(255, 0, 0);">PV</span> Visits / Total Visits的计算方法而言，这个visit就不再是Single PV Visit了，也就不再算作一个Bounce。Google Analytics就是这样计算的。但是对于Bounce = Single Page Visits / Total Visits的计算方法而言，用户仍然没有链接到其他页面，因此仍然还是一个Single Page Visits，此时仍然会算作一个Bounce，Omniture则是这样计算的。</p>
<p><strong>　　因此，这说明Bounce Rate有两种理解（Single Page的理解和Single PV的理解）</strong>。我倾向于前者，也就是Omniture的计算方法，因为刷新页面对于网站所有者或者广告主而言，意义并不大。</p>
<p>　　Bounce Rate是非常重要的，它显示了某个网站对于<a href="http://www.chinawebanalytics.cn/wp-admin/post.php?action=edit&amp;post=10" target="_blank"><span style="font-size: x-small; color: rgb(136, 136, 136);">Visitor</span></a>而言，到底有没有兴趣，或者有没有起到预计的效果。如果Visitor只是看到了你的网站，但是你所希望他们点击的链接都落空了，这就说明你的网站出了问题！真可怕，不是吗？</p>
<p>　　Bounce Rate对于网络营销而言，是一个重要的指标（指针），它告诉你，即使你把Audience（网络营销的受众）都招来到了你宣传产品或品牌的网站上，也未必能获得你预期的效果，如果Visitor都Bounce掉了的话。</p>
<p>　　后面马上就会有一个文章专门探讨Bounce Rate，题目是&ldquo;为什么Bounce Rate是网络营销里的最重要指标&rdquo;（<a href="http://www.chinawebanalytics.cn/?p=48">中文版</a> <a href="http://webanalytics.blog.sohu.com/77086793.html" target="_blank"><span style="font-size: x-small; color: rgb(136, 136, 136);">English Version</span></a>），如果有兴趣，你可以看看这篇文章，当然，内容是比较advanced（高级）的哦！</p>
<p>　　哦，对了，还没有给Bounce Rate起一个中国名字，说实话，它还没有标准的中国名字呢！这倒是给了我机会，让我们叫它&ldquo;蹦失率&rdquo;吧！好像音和义都很恰切哦。:-)</p>
<p>　　轮到你了，亲爱的朋友，写点什么给我吧！</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e6%9c%80%e5%9f%ba%e6%9c%ac%e6%a6%82%e5%bf%b5%ef%bc%885%ef%bc%89%e2%80%94%e2%80%94bounce-rate/feed/</wfw:commentRss>
		<slash:comments>43</slash:comments>
		</item>
		<item>
		<title>网站分析的最基本度量（4）——PV (Page View)</title>
		<link>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e6%9c%80%e5%9f%ba%e6%9c%ac%e6%a6%82%e5%bf%b5%ef%bc%884%ef%bc%89%e2%80%94%e2%80%94pv-page-view/</link>
		<comments>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e6%9c%80%e5%9f%ba%e6%9c%ac%e6%a6%82%e5%bf%b5%ef%bc%884%ef%bc%89%e2%80%94%e2%80%94pv-page-view/#comments</comments>
		<pubDate>Sun, 20 Jan 2008 15:07:53 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[基础知识]]></category>
		<category><![CDATA[Metric]]></category>
		<category><![CDATA[PV]]></category>
		<category><![CDATA[基本概念]]></category>
		<category><![CDATA[度量]]></category>
		<category><![CDATA[网站分析]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=43</guid>
		<description><![CDATA[ 　　PV，嗯，看起来和UV有点儿像，而且只差一个字母。后面一个V一定都是指Visitor吧！
　　No！PV的意思是Page View，V是View的首字母，而不是指Visitor或Visit。【点击标题阅读全文】
　　PV的汉语翻译过来是页面浏览，是可以被量化的（前面我们知道Visit和UV都是可以量化的，PV也一样）。1个PV是指从浏览器发出一个对网络服务器的Request（什么，不知道Request是什么？请看前面的文章吧！），网络服务器接到Request之后，会开始把该Request对应的一个Page（Page就是一个网页啦）发送到客户端的浏览器上，恭喜，这就是一个Page View了。是不是非常简单？
　　用严格的语言怎么描述呢？是这样的：A page view (PV) or page impression is a request to load a single page of an Internet site. 意思是，一个PV指的是一次从网站下载一个页面的请求。因此只要是发出了一个请求，无论你是否完全打开（下载）了这个页面，都计入一次PV。
[转载请事先声明并得到许可，版权归作者所有。]
　　还有一点差点忘了提，可能从上面的那句英语句子中你已经看到了，Page View还有一个说法Page Impression，呵呵，都一样哦！Page Impression还有一个简化说法，就是Impression，用的也是非常非常的多，看到它了不要装作不认识哦！
　　PV实际上很容易理解，不过，与PV有关的还有一些概念。他们同样非常非常非常重要，是网站分析的重要KPI。分别是：Bounce Rate（蹦失率），Exit Rate（离开率），以及Loss（丢失），尤其是Bounce Rate，我们几乎每天都要跟它打交道。
　　后面的内容会慢慢讲到的！
　　给我问题吧！
]]></description>
			<content:encoded><![CDATA[<p><img alt="PV: Page view，表示客户端对一个页面的完整下载" class="alignleft" height="258" src="http://www.chinawebanalytics.cn/wp-content/uploads/2008/04/medium.jpg" style="float: left; margin-left: 10px; margin-right: 10px;" width="200" /> 　　<strong>PV</strong>，嗯，看起来和<a href="http://www.chinawebanalytics.cn/?p=10" target="_blank">UV</a>有点儿像，而且只差一个字母。后面一个V一定都是指Visitor吧！</p>
<p>　　No！PV的意思是Page View，V是View的首字母，而不是指Visitor或<a href="http://www.chinawebanalytics.cn/?p=9" target="_blank">Visit</a>。【点击标题阅读全文】<span id="more-43"></span></p>
<p>　　PV的汉语翻译过来是页面浏览，是可以被量化的（前面我们知道Visit和UV都是可以量化的，PV也一样）。1个PV是指从浏览器发出一个对网络服务器的Request（什么，不知道Request是什么？<a href="http://www.chinawebanalytics.cn/?p=41" target="_blank">请看前面的文章吧！</a>），网络服务器接到Request之后，会开始把该Request对应的一个Page（Page就是一个网页啦）发送到客户端的浏览器上，恭喜，这就是一个Page View了。是不是非常简单？</p>
<p>　　用严格的语言怎么描述呢？是这样的：<a href="http://en.wikipedia.org/wiki/Page_view" target="_blank">A page view (PV) or page impression is a request to load a single page of an Internet site.</a> 意思是，一个PV指的是一次从网站下载一个页面的请求。因此只要是发出了一个请求，无论你是否完全打开（下载）了这个页面，都计入一次PV。</p>
<p style="text-align: center;"><span style="text-decoration: underline;">[转载请事先声明并得到许可，版权归<a href="http://www.chinawebanalytics.cn/?author=1" target="_blank"><span style="color: rgb(85, 119, 153);">作者</span></a>所有。]</span></p>
<p>　　还有一点差点忘了提，可能从上面的那句英语句子中你已经看到了，Page View还有一个说法Page Impression，呵呵，都一样哦！Page Impression还有一个简化说法，就是Impression，用的也是非常非常的多，看到它了不要装作不认识哦！</p>
<p>　　PV实际上很容易理解，不过，与PV有关的还有一些概念。他们同样非常非常非常重要，是网站分析的重要KPI。分别是：<a href="http://en.wikipedia.org/wiki/Page_view" target="_blankA &lt;strong&gt;page view&lt;/strong&gt; (PV) or &lt;strong&gt;page impression&lt;/strong&gt; is a request to load a single page of an Internet site.&lt;/a&gt; 意思是，一个PV指的是一次从网站下载一个页面的请求。因此只要是发出了一个请求，无论你是否完全打开（下载）了这个页面，都计入一次PV。&lt;/p&gt; &lt;p&gt;　　还有一点差点忘了提，可能从上面的那句英语句子中你已经看到了，Page View还有一个说法Page Impression，呵呵，都一样哦！Page Impression还有一个简化说法，就是Impression，用的也是非常非常的多，看到它了不要装作不认识哦！&lt;/p&gt; &lt;p&gt;　　PV实际上很容易理解，不过，与PV有关的还有一些概念。他们同样非常非常非常重要，是网站分析的重要KPI。分别是：&lt;a href=">Bounce Rate</a>（蹦失率），Exit Rate（离开率），以及Loss（丢失），尤其是Bounce Rate，我们几乎每天都要跟它打交道。</p>
<p>　　后面的内容会慢慢讲到的！</p>
<p>　　给我问题吧！</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e6%9c%80%e5%9f%ba%e6%9c%ac%e6%a6%82%e5%bf%b5%ef%bc%884%ef%bc%89%e2%80%94%e2%80%94pv-page-view/feed/</wfw:commentRss>
		<slash:comments>29</slash:comments>
		</item>
	</channel>
</rss>

