<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>网站分析在中国——从基础到前沿 &#187; 网站分析工具</title>
	<atom:link href="http://www.chinawebanalytics.cn/category/tools/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.chinawebanalytics.cn</link>
	<description></description>
	<lastBuildDate>Mon, 23 Jan 2012 13:23:05 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.2</generator>
		<item>
		<title>ISPT模型——提高在线营销的投资回报率（2）</title>
		<link>http://www.chinawebanalytics.cn/ispt2/</link>
		<comments>http://www.chinawebanalytics.cn/ispt2/#comments</comments>
		<pubDate>Mon, 11 Apr 2011 10:00:54 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[Featured]]></category>
		<category><![CDATA[电子商务]]></category>
		<category><![CDATA[网站分析工具]]></category>
		<category><![CDATA[网站分析经验分享]]></category>
		<category><![CDATA[CWA]]></category>
		<category><![CDATA[Google Analytics]]></category>
		<category><![CDATA[Omniture]]></category>
		<category><![CDATA[基本概念]]></category>
		<category><![CDATA[工具]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=3499</guid>
		<description><![CDATA[【通知】

　　通知一：请大家在加入CWA的QQ群（CWA三个新的QQ群：87963666, 82922176, 47686693）的时候，注意一定要填写加入理由为CWA爱好者。因为有很多垃圾号码加入，所以没有填入理由的都被拒绝了。我估计会误伤一些朋友，所以特此通知。
　　通知二：一个重要的招聘启示在CWA的招聘博客上，请点击这里。一个相当不错的机会，要独当一面，有挑战，但绝对有收获。请想致力于在真是商业环境中进行网站分析实战的朋友猛击。
　　通知三：我现在在深圳，可能会待一段时间，我想在深圳或者广州组织一次CWA的活动，请大家响应。晚一些我会通知大家具体我的计划，目前看，广州活动的可能性很大。
【前言】
　　接着上回书，我们接着说这个模型的第二部分，ISPT中的S。S不是大S也不是小S，也不是刚结婚的我的偶像Stephanie，而是我时时提到的Segmentation（细分）。偏激点儿讲，分析的本质就是Segmentation。我在很多博文和场合都提到了细分的重要性，这篇文章则对细分做一个&#8220;细分&#8221;。
【正文】
　　ISPT模型本质上是互联网营销分析的必使的几种武器。我觉得S是这些武器中最牛逼的。这种牛逼不是说它是原子弹，丢下来搞定一片，而是如同AK47一样，无论是kongbu份子还是CS玩家直到2011年的今天都还极为钟爱，并且其改装改制的型号至今还在我们这个世界人口最多的国家服役。这就叫牛逼，叫范儿！
　　Segmentation就有这种范儿。如果你做好了细分分析，网站分析你至少成功了一半。我特别钟爱细分，这也是我为什么觉得Google Analytics虽然有诸多不好但仍然是最棒的免费网站分析软件的原因&#8212;&#8212;它对于细分有着近乎于偏执的重视。
　　上一回我们提到了ISPT中的&#8220;I&#8221;&#8212;&#8212;整合，即Integration。介绍I的目的，是因为在I的前提下，我们可以实现&#8220;S&#8221;。如果你自信自己的&#8220;I&#8221;做的足够好，而且数据的粒度足够低（即细节度足够高），那么你可以着手进行细分。但在你动手前，你应该看看下面的内容。
细分不是目的！
　　细分虽然重要，但细分不是目的。所以，不要为做细分而做细分！很多朋友问我，&#8220;Sidney，请告诉我应该怎么做细分？&#8221;，或者&#8220;我这么细分你觉得可以吗？&#8221;之类的问题，我肯定会一时语塞，因为在我了解到你要做细分的目的之前，我也不知道你应该如何做细分，我真的不知道。
　　在做细分之前，你不应该把问题聚焦在我该如何做细分上，而应该放在我为什么应该做细分上。也就是说，你得要首先厘清细分背后的分析需求（或者说细分要解决的问题）是什么。
　　没有比这个更重要的了（当然，数据挖掘又是另外一个故事，暂时不在这个逻辑考虑之列）。
　　现在有一个问题：

我想知道为什么我的网站总是留不住用户？

　　我们可以做细分，把用户细分分为新访问者和老访问者。留不住用户，可能是新访问者这里出了问题，所以值得重点查看新访问者的行为和兴趣。也可以把用户按照来源进行细分，来观察是不是某些比较大的流量源不够踏实。当然，你还可以按照注册用户和非注册用户的方法来进行细分。解决这个开放问题，细分的方法有很多，但目的很明确。
　　但反过来，如果没有上面的问题，你只是漫无目的地直接进行新老访问者的细分，也许的确能发现点儿什么，也许不能，总体看这种方式并不一定完全没有收获，但的确是一种效率低下的方法。当你有很多时间，那么就碰碰运气吧，如果你没有那么多时间（毕竟时间是现代人真正的奢侈品），你应该做更有针对性的细分分析，即按照解决问题导向的细分分析。
　　细分不是目的，只是手段。无论做何种细分，都不要忘记了自己是为了什么商业分析需求而做。
细分要解决的常见商业问题
　　既然细分不是目的，商业问题才是目的，那通过细分要解决的常见商业问题有哪些呢？
　　这是一个开放式的问题，回答的难度不低，商业需求是千变万化的，因此商业问题毫无疑问也无穷无尽。但总体而言，我们想要把握规律，想要知道细分适合于解决哪些常见的商业需求的类别。以B2C电子商务网站为例，这些问题例如如下类型。
类型一：与网站用户体验相关的问题
1. 网站哪些页面受欢迎，哪些不受欢迎？
2. 页面上哪些内容受欢迎，哪些不受欢迎？
3. 哪些流程受欢迎，哪些不受？
4. 哪些表单填写用户更乐意填写，哪些不愿意？
5. 导航&#8212;&#8212;什么样的导航靠谱？
6. &#8230;&#8230;
类型二：与流量数量和质量相关的问题
1. 哪里来的流量数量大，质量高？
2. 哪里来的流量性价比（ROI）高？
3. 哪里来的流量能够满足网站的一些特殊需求？
4. PPC流量应该如何优化？
5. 什么流量让人又爱又恨（食之无味、弃之可惜）？
6. &#8230;&#8230;
类型三：商品品类相关的问题
1. 哪些商品用户更关注；
2. 哪些商品用户更乐于购买；
3. 哪些商品更&#8230;&#8230;还记得我的商品品类分析的四象限模型吗？
4. &#8230;&#8230;
类型四：用户行为相关的问题
1. 购买商品的用户体现出什么样的趋同行为？
2. 哪些用户用户将商品放入购物车却没有购买？
3. 注册用户展现出什么样的特征？
4. 在网站上停留了15分钟却没有将商品添加到购物车的访问者都干了些什么？
5. 从我的博客（www.chinawebanalytics.cn）到www.xiu.com的访问者，对这个网站感兴趣吗？
6. 哪些访问者更有忠诚度，哪些则更似冲动型购物者？
7. &#8230;&#8230;
类型五：跟客户端相关的问题
1. 网站应该支持什么浏览器，应该放弃什么浏览器？
2. 网站的页面应该多长为好？
3. 用JavaScript会不会造成一部分用户体验不佳？
4. &#8230;&#8230;
类型六：上面五种类型的再综合
1. 什么用户偏爱什么样的商品？
2. 什么来源的用户喜欢看哪一类型的页面？
3. 什么流量渠道带来了喜欢注册为用户的人群？
4. &#8230;&#8230;
　　这些问题，不做细分是无法解决的。而这些问题，似乎已经是网站分析需要解决的问题的全部。对于我自己而言，几乎所有的商业问题都需要用细分来解决。即使是为什么今天流量突然增高了这样常常都要面对的问题，也自然而然通过细分来解决。网站分析的艺术似乎就是细分的艺术。
细分的艺术在于制定规则
　　如果说网站分析的艺术是细分的艺术，那么细分的艺术在于建立规则。事实上，规则的建立体现了对于商业问题的快捷解答。因此，规则的定义必须针对网站本身的特点。
　　例如，在细分访问者参与程度的时候，对于你的网站而言，什么样的访问者才算是深度访问者呢？
　　我喜欢把访问者定义为轻度、中度和深度访问者。对于不同的网站，这一定义肯定是不同的。通常而言，访问者在网站上停留的时间是一个好的标准，例如停留时间少于5分钟的，可以算作轻度访问者，5~10分钟的，中度；10分钟以上，深度。但是，这个标准往往过于一刀切，我们还可以增加一些额外的规定，例如访问十分钟以上并且访问页面数至少达到3个且访问了至少1个产品详情页面的访问者才算深度访问者，因此这个规则变为：
　　深度访问者=time on site &#62; 600 &#38; PV/V &#62; 3 &#38; 1个或以上产品详情页面PV。
　　如何选取定义的标准，完全依赖于你的网站的特性，没有统一的标准。但我有一个喜欢利用的方法，即倒推法。
　　比如，我想知道在网站上停留时间超过多久的人，更有可能购买我们的商品。我们可以做一个细分，计算所有发生商品购买visit的平均time on site。也许是11.5分钟。我们可以认为，超过11.5分钟（690秒）停留的visit，更有可能发生购买。
　　我们还可以做另外一种细分，即最短网站停留时间为多少时，visit带来的order数量等于10%的总order数量。例如，我们发现停留时间小于140秒的visit带来的order数量约为总order数量的10%。因此我们可以认为用户完成一次购买行为最起码需要140秒钟。
　　了解了这两个时间，对于你区隔用户，就有很大的帮助。而这两个时间，在不同的电子商务网站上是非常不同的。我对这两个时间的定义是：平均购物时间和最短购物时间。
　　然后，你再利用最短购物时间和平均购物时间反求一段时间内的visit的数量，你可以发现这个波动趋势。如果流量没有发生明显变化，而最短购物时间的visit在减少，那说明人们越来越不倾向于&#8220;冲动购物&#8221;；如果平均购物时间之上的visit在增加，则说明人们进行购买决策所需要的时间也在增加，你应该考虑进行更好的说服，或是更多的促销。另外，比较各个时间段的visit所占的比例变化，也能说明类似的问题。
　　规则没有必要非常复杂狭窄，选取合理的粒度是重要的。研究在网站上PV/V刚好为131的访问者其实没有太大的意义，你可以把细分人群定义为PV/V&#62;10的部分。如果你在利用工具做细分的时候，发现某个规则下的visit或者visitor比你预期的小很多，那么这个细分规则的制定可能存在问题。这是判断细分是否合理的一个很重要的线索，也是Google Analytcis的&#8220;细分群体&#8221;中有一个&#8220;测试&#8221;按钮的重要原因。记住，确定你的细分是否有效只能通过测试！在Omniture SiteCatalyst中，我们也进行测试，但没有Google Analytics的测试那么简单。方法是建立1天的细分规则，拿到数据没有问题后，再延展这个细分到更长的时间，原因在于1天的数据在SiteCatalyst中反馈很快，1个月的数据就需要一些时间抽取了。这即是我们内部所称的对于某一种解决方案而言的best practices。
真正有效的细分，不仅仅只是维度细分
　　细分规则作为细分艺术体现的另外一个原因，在于细分不是任意制定的，逻辑上成立的细分，实际上未必能够在工具上实现。真正有效的细分，必须依赖于有效地系统间数据整合。
　　举一个例子，我们知道Google Analytics能够很方便地通过UTM标签标识网站的流量来源，因此我们可以快速且较准确地得到不同来源的流量数量，但是GA的电子商务统计功能却不能非常准确地统计到这些流量实际带来的订单（order）和收入（GMV），而必须依赖电子商务企业内部的销售统计系统或ERP系统。但后者又未必能够按照GA的流量标识方法来统计数据。如何解决这个问题？我会在之后的文章中详细解答。

　　因此，如同我们在这个系列中的第一篇所讲到的，我们需要整合，没有整合，真正有效的细分无法实现。
　　事实上，刚才讲的问题，涉及到了细分的另一个操作要点，即细分不仅仅只是对于维度的细分，而且也是对于度量（metrics）的细分。显然，由于分析的需要，不同的维度往往会对应不同的度量。我在工作中，最常见的问题是，那些不能直接带来ROI的流量，我们是应该购买，还是不应该购买？很显然，虽然都是流量，但作用不同。对于部分流量，利用ROI来相关度量来衡量是有意义的，而对另外一些，则要采用其他的度量来剖析它们的非ROI价值。但所谓非ROI价值，当然最终还是能够转化为ROI的，只是相对间接，所以我们需要有不同的metrics来衡量。
细分对于工具的依赖
　　前面已经讲了，逻辑上成立的，工具未必能实现。所以细分对于工具非常依赖。Google Analytics的新的版本，在细分上似乎又有加强（我需要使用一段时间感受下），而Omniture的SiteCatalyst本身的细分比较复杂，需要用它的一个专门的细分工具Discover来实现，这个工具的细分和数据交叉的能力非常强。Google Analytics的高级细分功能我极为喜爱，这个工具因为受到Avinash的影响，对于细分非常重视。
　　不过，受制于工具的算法和服务器响应能力，全数据的实时细分对任何工具都是极大的挑战。相对而言，如果能够实现全数据的细分，这个工具一般难以实时；而实时细分，又只能选取抽样数据。所以工具对于细分的能力并非十全十美。
　　Google Analytics的细分工具实际上包括&#8220;高级细分&#8221;和&#8220;自定义报告&#8221;，高级细分是亮点。
　　Omniture SiteCatalyst的细分工具包括ASI Slot，Data Warehouse和VISTA。这些工具属于全数据细分，但实时性相对较弱。
　　Omniture Discover本身是一个细分工具，数据来源于SiteCatalyst，能够抽取一定时间段的全数据实现实时细分，但不能实现全部历史数据的实时细分。不过足够用了。

图：Omniture Discover的界面
常用的细分规则
　　最后，大家需要常用的细分规则吗？给我留言吧！并且，请留下你常用的细分规则！很久没有发新的文章，现在发这篇文章，有点儿紧张。希望大家能喜欢！谢谢！
]]></description>
			<content:encoded><![CDATA[<p>【通知】</p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2011/04/image.png"><img alt="image" border="0" height="40" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/04/image_thumb.png" style="background-image: none; border-bottom: 0px; border-left: 0px; margin: 0px 10px 0px 0px; padding-left: 0px; padding-right: 0px; display: inline; border-top: 0px; border-right: 0px; padding-top: 0px" title="image" width="240" /></a></p>
<p><strong>　　通知一：</strong>请大家在加入<a href="http://www.chinawebanalytics.cn/about/" target="_blank">CWA的QQ群</a>（CWA三个新的QQ群：87963666, 82922176, 47686693）的时候，注意一定要填写加入理由为<strong>CWA爱好者</strong>。因为有很多垃圾号码加入，所以没有填入理由的都被拒绝了。我估计会误伤一些朋友，所以特此通知。</p>
<p><strong>　　通知二：</strong>一个重要的招聘启示在CWA的招聘博客上，<a href="http://www.chinawa.org/?p=407" target="_blank">请点击这里</a>。一个相当不错的机会，要独当一面，有挑战，但绝对有收获。请想致力于在真是商业环境中进行网站分析实战的朋友猛击。<span id="more-3499"></span></p>
<p><strong>　　通知三：</strong>我现在在深圳，可能会待一段时间，我想在深圳或者广州组织一次CWA的活动，请大家响应。晚一些我会通知大家具体我的计划，目前看，广州活动的可能性很大。</p>
<p>【前言】</p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2011/04/Segmentation_Orange.jpg"><img align="left" alt="Segmentation_Orange" border="0" height="160" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/04/Segmentation_Orange_thumb.jpg" style="background-image: none; border-bottom: 0px; border-left: 0px; margin: 0px 10px 5px 0px; padding-left: 0px; padding-right: 0px; display: inline; float: left; border-top: 0px; border-right: 0px; padding-top: 0px" title="Segmentation_Orange" width="240" /></a>　　接着上回书，我们接着说这个模型的第二部分，ISPT中的S。S不是大S也不是小S，也不是刚结婚的我的偶像Stephanie，而是我时时提到的Segmentation（细分）。偏激点儿讲，分析的本质就是Segmentation。我在很多博文和场合都提到了细分的重要性，这篇文章则对细分做一个&ldquo;细分&rdquo;。</p>
<p>【正文】</p>
<p>　　ISPT模型本质上是互联网营销分析的必使的几种武器。我觉得S是这些武器中最牛逼的。这种牛逼不是说它是原子弹，丢下来搞定一片，而是如同AK47一样，无论是kongbu份子还是CS玩家直到2011年的今天都还极为钟爱，并且其改装改制的型号至今还在我们这个世界人口最多的国家服役。这就叫牛逼，叫范儿！</p>
<p>　　Segmentation就有这种范儿。如果你做好了细分分析，网站分析你至少成功了一半。我特别钟爱细分，这也是我为什么觉得<a href="http://analytics.google.com/" target="_blank">Google Analytics</a>虽然有诸多不好但仍然是最棒的免费网站分析软件的原因&mdash;&mdash;<a href="http://www.chinawebanalytics.cn/google-analytics-pros-and-cons/" target="_blank">它对于细分有着近乎于偏执的重视</a>。<a href="http://www.chinawebanalytics.cn/wp-content/uploads/2011/04/AK47-Segmentation.jpg"><img align="right" alt="AK47-Segmentation" border="0" height="152" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/04/AK47-Segmentation_thumb.jpg" style="background-image: none; border-bottom: 0px; border-left: 0px; margin: 5px 0px 5px 20px; padding-left: 0px; padding-right: 0px; display: inline; float: right; border-top: 0px; border-right: 0px; padding-top: 0px" title="AK47-Segmentation" width="282" /></a></p>
<p>　　<a href="http://www.chinawebanalytics.cn/ispt1/" target="_blank">上一回</a>我们提到了ISPT中的&ldquo;I&rdquo;&mdash;&mdash;整合，即Integration。介绍I的目的，是因为在I的前提下，我们可以实现&ldquo;S&rdquo;。如果你自信自己的&ldquo;I&rdquo;做的足够好，而且数据的粒度足够低（即细节度足够高），那么你可以着手进行细分。但在你动手前，你应该看看下面的内容。<img alt="眨眼" class="wlEmoticon wlEmoticon-winkingsmile" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/04/wlEmoticon-winkingsmile.png" style="border-bottom-style: none; border-right-style: none; border-top-style: none; border-left-style: none" /></p>
<h3>细分不是目的！</h3>
<p>　　细分虽然重要，但细分不是目的。所以，<strong>不要</strong>为做细分而做细分！很多朋友问我，&ldquo;Sidney，请告诉我应该怎么做细分？&rdquo;，或者&ldquo;我这么细分你觉得可以吗？&rdquo;之类的问题，我肯定会一时语塞，因为在我了解到你要做细分的目的之前，我也不知道你应该如何做细分，我真的不知道。<img alt="微笑" class="wlEmoticon wlEmoticon-smile" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/04/wlEmoticon-smile.png" style="border-bottom-style: none; border-right-style: none; border-top-style: none; border-left-style: none" /></p>
<p>　　在做细分之前，你不应该把问题聚焦在我该如何做细分上，而应该放在我为什么应该做细分上。也就是说，你得要首先厘清细分背后的分析需求（或者说细分要解决的问题）是什么。</p>
<p>　　没有比这个更重要的了（当然，数据挖掘又是另外一个故事，暂时不在这个逻辑考虑之列）。</p>
<p>　　现在有一个问题：</p>
<blockquote>
<p><em>我想知道为什么我的网站总是留不住用户？</em></p>
</blockquote>
<p>　　我们可以做细分，把用户细分分为新访问者和老访问者。留不住用户，可能是新访问者这里出了问题，所以值得重点查看新访问者的行为和兴趣。也可以把用户按照来源进行细分，来观察是不是某些比较大的流量源不够踏实。当然，你还可以按照注册用户和非注册用户的方法来进行细分。解决这个开放问题，细分的方法有很多，但目的很明确。</p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2011/04/purpose.png"><img align="left" alt="purpose" border="0" height="163" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/04/purpose_thumb.jpg" style="background-image: none; border-bottom: 0px; border-left: 0px; margin: 0px 20px 5px 0px; padding-left: 0px; padding-right: 0px; display: inline; float: left; border-top: 0px; border-right: 0px; padding-top: 0px" title="purpose" width="244" /></a>　　但反过来，如果没有上面的问题，你只是漫无目的地直接进行新老访问者的细分，也许的确能发现点儿什么，也许不能，总体看这种方式并不一定完全没有收获，但的确是一种效率低下的方法。当你有很多时间，那么就碰碰运气吧，如果你没有那么多时间（毕竟时间是现代人真正的奢侈品），你应该做更有针对性的细分分析，即按照解决问题导向的细分分析。</p>
<p>　　细分不是目的，只是手段。无论做何种细分，都不要忘记了自己是为了什么商业分析需求而做。</p>
<h3>细分要解决的常见商业问题</h3>
<p>　　既然细分不是目的，商业问题才是目的，那通过细分要解决的常见商业问题有哪些呢？</p>
<p>　　这是一个开放式的问题，回答的难度不低，商业需求是千变万化的，因此商业问题毫无疑问也无穷无尽。但总体而言，我们想要把握规律，想要知道细分适合于解决哪些常见的商业需求的类别。以B2C电子商务网站为例，这些问题例如如下类型。</p>
<p><strong>类型一：与网站用户体验相关的问题</strong></p>
<p>1. 网站哪些页面受欢迎，哪些不受欢迎？</p>
<p>2. 页面上哪些内容受欢迎，哪些不受欢迎？</p>
<p>3. 哪些流程受欢迎，哪些不受？</p>
<p>4. 哪些表单填写用户更乐意填写，哪些不愿意？</p>
<p>5. 导航&mdash;&mdash;什么样的导航靠谱？</p>
<p>6. &hellip;&hellip;</p>
<p><strong>类型二：与流量数量和质量相关的问题<a href="http://www.chinawebanalytics.cn/wp-content/uploads/2011/04/i-want-to-know.jpg"><img align="right" alt="i-want-to-know" border="0" height="238" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/04/i-want-to-know_thumb.jpg" style="background-image: none; border-bottom: 0px; border-left: 0px; margin: 0px 0px 5px; padding-left: 0px; padding-right: 0px; display: inline; float: right; border-top: 0px; border-right: 0px; padding-top: 0px" title="i-want-to-know" width="275" /></a></strong></p>
<p>1. 哪里来的流量数量大，质量高？</p>
<p>2. 哪里来的流量性价比（ROI）高？</p>
<p>3. 哪里来的流量能够满足网站的一些特殊需求？</p>
<p>4. PPC流量应该如何优化？</p>
<p>5. 什么流量让人又爱又恨（食之无味、弃之可惜）？</p>
<p>6. &hellip;&hellip;</p>
<p><strong>类型三：商品品类相关的问题</strong></p>
<p>1. 哪些商品用户更关注；</p>
<p>2. 哪些商品用户更乐于购买；</p>
<p>3. 哪些商品更&hellip;&hellip;<a href="http://www.chinawebanalytics.cn/%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90%E7%9A%84%E9%87%8D%E5%A4%A7%E6%84%8F%E4%B9%89%E2%80%94%E2%80%94%E7%AD%94%E7%82%B9%E7%9F%B3%E5%A4%A7%E4%BC%9A%E5%90%AC%E4%BC%97%E6%8F%90%E9%97%AE%EF%BC%88%E4%B8%8A/">还记得我的商品品类分析的四象限模型吗</a>？</p>
<p>4. &hellip;&hellip;</p>
<p><strong>类型四：用户行为相关的问题</strong></p>
<p>1. 购买商品的用户体现出什么样的趋同行为？</p>
<p>2. 哪些用户用户将商品放入购物车却没有购买？</p>
<p>3. 注册用户展现出什么样的特征？</p>
<p>4. 在网站上停留了15分钟却没有将商品添加到购物车的访问者都干了些什么？</p>
<p>5. 从<a href="http://www.chinawebanalytics.cn">我的博客</a>（<a href="http://www.chinawebanalytics.cn">www.chinawebanalytics.cn</a>）到<a href="http://www.xiu.com">www.xiu.com</a>的访问者，对这个网站感兴趣吗？</p>
<p>6. 哪些访问者更有忠诚度，哪些则更似冲动型购物者？</p>
<p>7. &hellip;&hellip;</p>
<p><strong>类型五：跟客户端相关的问题</strong></p>
<p>1. 网站应该支持什么浏览器，应该放弃什么浏览器？</p>
<p>2. 网站的页面应该多长为好？</p>
<p>3. 用JavaScript会不会造成一部分用户体验不佳？</p>
<p>4. &hellip;&hellip;</p>
<p><strong>类型六：上面五种类型的再综合</strong></p>
<p>1. 什么用户偏爱什么样的商品？</p>
<p>2. 什么来源的用户喜欢看哪一类型的页面？</p>
<p>3. 什么流量渠道带来了喜欢注册为用户的人群？</p>
<p>4. &hellip;&hellip;</p>
<p>　　这些问题，不做细分是无法解决的。而这些问题，似乎已经是网站分析需要解决的问题的全部。对于我自己而言，几乎所有的商业问题都需要用细分来解决。即使是为什么今天流量突然增高了这样常常都要面对的问题，也自然而然通过细分来解决。网站分析的艺术似乎就是细分的艺术。</p>
<h3>细分的艺术在于制定规则</h3>
<p>　　如果说网站分析的艺术是细分的艺术，那么细分的艺术在于建立规则。事实上，规则的建立体现了对于商业问题的快捷解答。因此，<strong>规则的定义必须针对网站本身的特点。</strong></p>
<p>　　例如，在细分访问者参与程度的时候，对于你的网站而言，什么样的访问者才算是深度访问者呢？</p>
<p>　　我喜欢把访问者定义为轻度、中度和深度访问者。对于不同的网站，这一定义肯定是不同的。通常而言，访问者在网站上停留的时间是一个好的标准，例如停留时间少于5分钟的，可以算作轻度访问者，5~10分钟的，中度；10分钟以上，深度。但是，这个标准往往过于一刀切，我们还可以增加一些额外的规定，例如访问十分钟以上并且访问页面数至少达到3个且访问了至少1个产品详情页面的访问者才算深度访问者，因此这个规则变为：</p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2011/04/visit-length.png"><img align="left" alt="visit length" border="0" height="172" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/04/visit-length_thumb.png" style="background-image: none; border-bottom: 0px; border-left: 0px; margin: 0px 20px 5px 0px; padding-left: 0px; padding-right: 0px; display: inline; float: left; border-top: 0px; border-right: 0px; padding-top: 0px" title="visit length" width="240" /></a>　　深度访问者=time on site &gt; 600 &amp; PV/V &gt; 3 &amp; 1个或以上产品详情页面PV。</p>
<p>　　如何选取定义的标准，完全依赖于你的网站的特性，没有统一的标准。但我有一个喜欢利用的方法，即<strong>倒推法</strong>。</p>
<p>　　比如，我想知道在网站上停留时间超过多久的人，更有可能购买我们的商品。我们可以做一个细分，计算所有发生商品购买visit的平均time on site。也许是11.5分钟。我们可以认为，超过11.5分钟（690秒）停留的visit，更有可能发生购买。</p>
<p>　　我们还可以做另外一种细分，即最短网站停留时间为多少时，visit带来的order数量等于10%的总order数量。例如，我们发现停留时间小于140秒的visit带来的order数量约为总order数量的10%。因此我们可以认为用户完成一次购买行为最起码需要140秒钟。</p>
<p>　　了解了这两个时间，对于你区隔用户，就有很大的帮助。而这两个时间，在不同的电子商务网站上是非常不同的。我对这两个时间的定义是：<strong>平均购物时间和<strong>最短购物时间</strong></strong>。</p>
<p>　　然后，你再利用最短购物时间和平均购物时间反求一段时间内的visit的数量，你可以发现这个波动趋势。如果流量没有发生明显变化，而最短购物时间的visit在减少，那说明人们越来越不倾向于&ldquo;冲动购物&rdquo;；如果平均购物时间之上的visit在增加，则说明人们进行购买决策所需要的时间也在增加，你应该考虑进行更好的说服，或是更多的促销。另外，比较各个时间段的visit所占的比例变化，也能说明类似的问题。</p>
<p><strong>　　规则没有必要非常复杂狭窄，选取合理的粒度是重要的。</strong>研究在网站上PV/V刚好为131的访问者其实没有太大的意义，你可以把细分人群定义为PV/V&gt;10的部分。<a href="http://www.chinawebanalytics.cn/wp-content/uploads/2011/04/granularity.jpg"><img align="right" alt="granularity" height="170" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/04/granularity_thumb.jpg" style="margin: 0px 0px 5px 20px; display: inline; float: right" title="granularity" width="240" /></a>如果你在利用工具做细分的时候，发现某个规则下的visit或者visitor比你预期的小很多，那么这个细分规则的制定可能存在问题。这是判断细分是否合理的一个很重要的线索，也是Google Analytcis的&ldquo;细分群体&rdquo;中有一个&ldquo;测试&rdquo;按钮的重要原因。<strong>记住，确定你的细分是否有效只能通过测试！</strong>在Omniture SiteCatalyst中，我们也进行测试，但没有Google Analytics的测试那么简单。方法是建立1天的细分规则，拿到数据没有问题后，再延展这个细分到更长的时间，原因在于1天的数据在SiteCatalyst中反馈很快，1个月的数据就需要一些时间抽取了。这即是我们内部所称的对于某一种解决方案而言的best practices。</p>
<h3>真正有效的细分，不仅仅只是维度细分</h3>
<p>　　细分规则作为细分艺术体现的另外一个原因，在于细分不是任意制定的，逻辑上成立的细分，实际上未必能够在工具上实现。真正有效的细分，必须依赖于有效地系统间数据整合。</p>
<p>　　举一个例子，我们知道<a href="http://www.chinawebanalytics.cn/%e7%94%a8google-analytics%e7%9a%84link-tag%e6%b7%b1%e5%85%a5%e4%ba%86%e8%a7%a3%e6%b5%81%e9%87%8f%e6%9d%a5%e6%ba%90%ef%bc%88%e5%b9%bf%e5%91%8a%ef%bc%89%e7%9a%84%e8%b4%a8%e9%87%8f/">Google Analytics能够很方便地通过UTM标签标识网站的流量来源</a>，因此我们可以快速且较准确地得到不同来源的流量数量，但是GA的电子商务统计功能却不能非常准确地统计到这些流量实际带来的订单（order）和收入（GMV），而必须依赖电子商务企业内部的销售统计系统或ERP系统。但后者又未必能够按照GA的流量标识方法来统计数据。如何解决这个问题？我会在之后的文章中详细解答。</p>
<p><a href="http://www.chinawebanalytics.cn/online-campaign-influence-offline-part-i/"><img alt="Omniture_Marketing_Channels_Sample" height="263" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/04/Omniture_Marketing_Channels_Sample.jpg" style="margin: 0px auto 5px; display: block; float: none" title="Omniture_Marketing_Channels_Sample" width="430" /></a></p>
<p>　　因此，如同我们在<a href="http://www.chinawebanalytics.cn/ispt1/">这个系列中的第一篇</a>所讲到的，我们需要整合，没有整合，真正有效的细分无法实现。</p>
<p>　　事实上，刚才讲的问题，涉及到了细分的另一个操作要点，即<strong>细分不仅仅只是对于维度的细分，而且也是对于度量（metrics）的细分</strong>。显然，由于分析的需要，不同的维度往往会对应不同的度量。我在工作中，最常见的问题是，那些不能直接带来ROI的流量，我们是应该购买，还是不应该购买？很显然，虽然都是流量，但作用不同。对于部分流量，利用ROI来相关度量来衡量是有意义的，而对另外一些，则要采用其他的度量来剖析它们的非ROI价值。但<a href="http://www.chinawebanalytics.cn/online-campaign-influence-offline-part-i/">所谓非ROI价值，当然最终还是能够转化为ROI的，只是相对间接，所以我们需要有不同的metrics来衡量</a>。</p>
<h3>细分对于工具的依赖</h3>
<p>　　前面已经讲了，逻辑上成立的，工具未必能实现。所以细分对于工具非常依赖。Google Analytics的新的版本，在细分上似乎又有加强（我需要使用一段时间感受下），而Omniture的SiteCatalyst本身的细分比较复杂，需要用它的一个专门的细分工具Discover来实现，这个工具的细分和数据交叉的能力非常强。Google Analytics的高级细分功能我极为喜爱，这个工具因为受到Avinash的影响，对于细分非常重视。</p>
<p>　　不过，受制于工具的算法和服务器响应能力，全数据的实时细分对任何工具都是极大的挑战。相对而言，如果能够实现全数据的细分，这个工具一般难以实时；而实时细分，又只能选取抽样数据。所以工具对于细分的能力并非十全十美。</p>
<p>　　Google Analytics的细分工具实际上包括&ldquo;高级细分&rdquo;和&ldquo;自定义报告&rdquo;，高级细分是亮点。</p>
<p>　　Omniture SiteCatalyst的细分工具包括ASI Slot，Data Warehouse和VISTA。这些工具属于全数据细分，但实时性相对较弱。</p>
<p>　　Omniture Discover本身是一个细分工具，数据来源于SiteCatalyst，能够抽取一定时间段的全数据实现实时细分，但不能实现全部历史数据的实时细分。不过足够用了。</p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2011/04/Omniture_Discover.jpg"><img alt="Omniture_Discover" height="319" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/04/Omniture_Discover_thumb.jpg" style="margin: 0px auto 5px; display: block; float: none" title="Omniture_Discover" width="514" /></a></p>
<p align="center">图：Omniture Discover的界面</p>
<h3>常用的细分规则</h3>
<p>　　最后，大家需要常用的细分规则吗？给我留言吧！并且，请留下你常用的细分规则！很久没有发新的文章，现在发这篇文章，有点儿紧张。希望大家能喜欢！谢谢！</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/ispt2/feed/</wfw:commentRss>
		<slash:comments>22</slash:comments>
		</item>
		<item>
		<title>网站分析，我需要什么样的工具？（2）</title>
		<link>http://www.chinawebanalytics.cn/how-to-choose-web-analytics-tools-2/</link>
		<comments>http://www.chinawebanalytics.cn/how-to-choose-web-analytics-tools-2/#comments</comments>
		<pubDate>Sun, 09 Jan 2011 14:59:34 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[Featured]]></category>
		<category><![CDATA[监测工具]]></category>
		<category><![CDATA[网站分析工具]]></category>
		<category><![CDATA[网站分析经验分享]]></category>
		<category><![CDATA[CWA]]></category>
		<category><![CDATA[Google Analytics]]></category>
		<category><![CDATA[Omniture]]></category>
		<category><![CDATA[SiteCatalyst]]></category>
		<category><![CDATA[电子商务]]></category>
		<category><![CDATA[网站优化]]></category>
		<category><![CDATA[网站分析]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=3305</guid>
		<description><![CDATA[【前言】 
	　　工具是网站分析不可缺少的元素。但是如何选择一个称心如意的工具，就不是那么简单了。如何根据自己不同网站的需求选择合适的工具？这成为很多朋友们关心的问题。在这个话题的第一篇中，我们讨论了小型电子商务网站对于工具的选择，在第二篇，我们看看中型和大型电子商务网站如何选择网站分析工具。
需求和工具的对应（续1）
类型二：大中型电子商务网站
　　我觉得，大中型电子商务网站的网站分析需求分为两类。一类是：不不不类（很有趣我刚看了Tenly给我转来的老罗的演讲，我就立即联想到了这个分类）；另外一类是：我一切都要类。

　　不不不类的电子商务网站要么不需要网站分析，要么不需要额外的工具来做网站分析。我常常听到：&#8220;网站分析是什么？我不需要。我最需要的是流量流量流量！&#8221;确实，这些网站自己有log file可供分析，但是总体上讲，进行网站分析对这些网站而言并不迫切。即使网站并不完美，但是它已经照这样运行了很多年，也没看出它的表现有什么不好。而且修改网站会影响我SEO的效果，各个执行部门的人也会很不happy增加了工作量和多了一些衡量他们的条条框框。
　　对于这种理念我很难置评，毕竟电子商务在中国还是正处于一个粗放竞争的年代。电子商务是微利甚至是负利的，但是没关系，我有规模就好了，有规模就有投资，有投资就能继续扩大规模，这使电子商务在中国的玩儿法变得不需要那么精耕细作，抢资源才是硬道理。除了电子商务网站，团购网站更强烈地显现出这种特征。我绝对不敢嘲笑这种做法，什么样的商业环境就有什么样的商业规则，什么样的商业规则就会产生什么样的商业策略，在中国这片神奇的土地上，不这么做才显得不正常。
　　但我坚信到了某一个时点，这一切都会快速地发生改变。
　　另外一种流派是我一切都要类，就是希望网站分析能够解决所有的网站优化问题。这种希望并不是很具体，但能够传达出明确的我要网站得到优化的欲求。这种想法不能说不对，但网站分析不是万能油，不解决网站所有的问题。网站分析的落脚点在于用户行为，如果这个网站没有什么用户，而且用户也不活跃，那么这个网站可以施展网站分析的领域就不多。同样，如果希望网站的SEO排名能够依靠网站分析而得到迅速提升，这也是没有用对工具。
　　好了，闲话就不多说了。对于大中型电子商务网站而言，网站分析施展本领的真正领域如下：


定位购物转化过程中网站结构和页面的问题；提供可能的优化方案；测试并固话优化方案。
流量的定位、细分和分析；提供细分基础上的流量效果比较。
除了直接从端到端的ROI（投资收益）角度分析流量效果之外，还能够提供Engagement（即流量参与网站各种行为和程度）角度的效果分析；或者换句话说，就是不仅能看到流量的输入和输出，还能看到流量输入输出之间在网站上的点点滴滴的过程。能看到过程，才能有机会优化。
商品品类分析：哪些品类有好的转化，哪些没有，可能的原因是什么。
商品分析：哪些商品有好的转化，需要新增哪些商品（消费者有需求却没有提供的商品）。
访客分析：细分访客，例如按照网站访问次数的多少细分为新访客、重复访客和忠诚访客，或者按照客户购买商品的情况细分（如，新顾客，回头客和忠诚顾客）；或者按照地域细分以及其他规则细分访客并对它们表现出的不同行为和转化模式进行细分等等。

　　上面所列出这些需求都是通常一个大中型电子商务网站进行网站分析时肯定要做的事情，在之前的两篇文章中，从更广义的角度较为系统地阐述了电子商务网站分析的需求：电子商务网站分析要关注些什么（上）；电子商务网站分析要关注些什么（下）。建议大家可以参考。
　　大家可以看到，上面的这些分析和优化内容，单单靠免费的网站分析工具已经勉为其难了。上篇文章中朋友们提到的CNZZ等工具，在流量的监测上没有什么问题，但是到了与业务结合的细分层面，就无法提供解决方案了。毕竟是免费流量工具，不能要求太多。所以，有朋友留言说得好&#8220;网站分析&#160; 注意不仅仅是 流量分析&#8221;，的确是这样。这是需求的不同，如果只是看看流量的变化，不做更深入分析的话，那么CNZZ和51la是足够了，用更复杂的工具是浪费。但是做网站分析，尤其是做大中型电子商务网站的分析，好的工具就很重要了。
大中型电子商务网站需要什么样的网站分析工具？
　　前面说了，工具不存在好坏，满足需求的工具就好。大中型电子商务网站选择网站分析工具的时候，需要问工具提供商如下的功能需求：

流量定位和监测

　　这个功能Omniture SiteCatalyst最早实现，即通过SAINT Classification的方法，可以实现对流量来源的无限标记。这种方法后来被Google Analytics简化为UTM的外链形式，流量的细分属性被限制为不超过6个，但也够用。关于这个功能，大家参考这篇文章：用Google Analytics的Link Tag深入了解流量来源（广告）的质量。这个功能对于细分流量来源非常强大。

全路径和自定路径

　　在Google Analytics的能与不能提到过，Google Analytics其实没有全路径分析和后自定义路径分析功能，只有预定义路径和转化分析，相对而言对于路径和转化分析很复杂的大中型电子商务网站而言，就很不给力了。Omniture SiteCatalyst在这个地方很强大，路径分析是它的看家本领。其他商用工具在这块应该也不赖。

灵活的细分能力

　　灵活的细分指预定义的细分和自定义的细分都要强大。Google Analytics的预定义细分很牛，是我见过的工具中最好的，没有之一。自定义方面，Omniture SiteCatalyst可以实现无限制自定义细分，但需要在实施工具前就想好，然后在工具部署的时候定义进去。如果漏掉希望细分的地方，也可以未来随时升级工具补上。所以，我常常跟朋友说，Omniture的工具不定制直接用绝对是浪费。虽然预先的定制需要策略性思考和实施工作量，但未来这工具就是针对你的业务专用的，的确值得。不过，目前能够通过默认预定义功能就能实现所有分析需求的工具还不存在。我想，由于每个业务自身的独特性，这样的工具可能永远也不会存在，除非&#8212;&#8212;一种能够监听和解读网页上所有变量，并把这些变量的启动和数据变化全部记录下来并按逻辑进行分隔的工具出现（够拗口的，够复杂的，我想这种工具是难以出来了）。

与业务动态结合

　　这个，比较难，但商用工具应该做得到，否则你有理由不选择它。所谓与业务动态结合，指网站分析工具不仅是从流量的角度监测数据（流量过程监测），而且从流量在网站内流动过程中所引发的业务流动的角度来提供数据的监测（业务过程监测）。比较抽象，举个例子。例如，你在京东商城选购商品的时候，你在各个页面的访问都被网站分析记录下来，这是流量的流动过程，是以页面为载体的。如果你完成了一个商品的购买，这个流动的过程又可以被记录为：&#8220;查看商品信息&#8221;-&#62;&#8220;添加到购物车&#8221;-&#62;&#8220;填入收货信息&#8221;-&#62;&#8220;确定购买&#8221;-&#62;&#8220;支付&#8221;-&#62;&#8220;支付成功&#8221;，这是一个动态的业务流程（如下图所示）。商用工具不仅仅从流量角度描述这个过程，也从业务的角度描述这个过程。流量过程和业务过程的区别是，流量过程是以页面为载体，由于不同商品页面的URL或者页面名称的不同，因此用流量过程描述整体的业务的过程过于复杂。而直接定义业务过程，则能够很便利地实现业务流分析。免费的工具都是流量过程监测，付费的商用工具有些具有业务过程监测。这也是为什么Omniture SiteCatalyst要区分Traffic props和conversion evars+successful events的原因，因为前者是流量过程，后者则描述业务过程（关于这点，没有用过Omniture的朋友们无需深究）。


商品标记、细分和转化跟踪

　　商品本身的属性很复杂，品名，类型，SKU，价格，库存状态&#8230;&#8230;，有些电子商务网站的商品属性多达30种。免费工具太难记录这些东西了。无法较好的记录，也就无法较好的细分。另外，商品的转化跟踪属于业务过程，而不仅仅只是流量过程。

顾客细分

　　免费工具一般只提供新旧访问者的细分，商用工具从业务过程的角度考虑，把访问者中的顾客（已经购买商品的访问者）抽取出来，并且按照新顾客（只够买一次商品的），回头客（购买两次商品的）以及忠诚顾客（三次或者以上购买次数的）区分开来。另外，对于访问者的一些其他属性，例如是否注册客户，是否银卡、金卡、钻石卡客户，以及客户注册或者购物时所填写的个人属性，利用这个网站分析工具，都应该通过增加监测变量实现监测。国内好像还很少有通过网站分析工具做这么细致做顾客角度的网站分析的，但是用网站分析工具，把顾客细分后按照流量过程和业务过程结合起来分析，对顾客的分析和挖掘绝对给力。其他对顾客细分如地域细分、浏览器版本、操作系统版本，javascript支持等等，这些基本的就不用说了。
　　这些是服务于大中型电子商务网站的网站分析工具所必需的一些功能。
　　此外，即使某些工具能够实现上面的功能，你也要注意一些其他的（可能让你未来蛋疼的）地方。
注意避免未来会让你蛋疼的地方
　　由于商用工具必需照顾业务流程，因此它要么是具有很强的可定制化能力，要么就是提供针对某一个领域的细分定制方案（比如我们之前提到的小艾统计）。后者我们就不多看了，并不是针对大中型电子商务网站的解决方案。而对于前者，定制化能力可能是一把双刃剑。
　　毫不夸张的说，好的定制需要花费心血。一方面，对自己网站的业务和过程要非常了解。另一方面，对自己网站结果，URL结构，SEO结构要极为清晰了解。除此之外的另另一方面，还要对自己的监测期望有极为极为清晰地了解。三者缺一不可。
　　如果你不想花费这个心血，而让外人越俎代庖，最后绝对会把强大的工具应用地不伦不类。这种杯具其实是常见的。
　　我认为，网站分析工具的选择，功能只是一个方面。功能强大，而分析团队没有或者十分孱弱，那么工具越强大，事情反而可能越糟糕，还不如免费工具来得快活。我有这样的经验，用我的Pentax单反相机能照出相当不错的照片，但是交给一个女孩子，出的东西反而不如她手上的卡片好。这不是歧视女生，这是强大的工具需要强大的能力去匹配，所谓好马配好鞍。
　　不扯远了，天色已晚。如果开始不注意，未来会让你蛋疼的地方包括：

页面的定义太随意，例如忘记对一个品类的所有页面做一个统一的标识，或者忘记为页面过程附加业务过程。
细分需求定义不全&#8212;&#8212;需要工具提供的一些重要细分数据需求忘记提交，后面的分析肯定打折扣。
初期实施追求监测的大而全，结果造成实施的困难重重。未来拿到的数据报告过多，极大增加分析难度。&#8212;&#8212;这一点和上一点说明，掌握初期需求和细分的度是非常必要的。
流量标识和商品标识不认真做，结果最后分析的时候不得不重头来，或者没有得到数据。

　　一旦使用了商用工具，大家如果怕未来难受，可以跟我先聊聊，我这里有不少曾经让人非常郁闷的经验，但若注意到了别人的失败，自己至少就能够少走点弯路。
　　即使是使用Google Analytics这样的工具，如果开始没做好，未来也难免蛋疼。看看这两篇文章，说不定就能帮到您：警惕网站分析监测实施的陷阱（上）；警惕网站分析监测实施的陷阱（下）。
服务
　　大中型电子商务网站分析如果使用了付费工具，那么肯定是要特别看重服务的。因为这些工具用起来都不是那么容易。我建议先工具厂商购买或者索取三类服务。
　　第一类：使用帮助。不一定需要人在场，但是搞不定的时候一定要有官方的人帮忙。
　　第二类：让官方的人帮助一起做一次分析，并且把分析结果所使用的具体工具、方法再现出来。这是一个非常快的掌握工具的好办法。
　　第三类：完整的知识库。大半夜的时候实在搞不定了，还能看看文章自己摸索下。
　　没有任何服务的工具不要选，原因就不说了。
本篇总结
　　由于大中型电子商务网站太复杂，所以这篇文章一下子又说多了。很可能有些部分朋友们觉得有些难理解，请给我留言询问。大中型电子商务网站选型网站分析工具要注意几点：1) 定制能力；2) 转化和路径能力；3) 业务过程监测; 4) 服务能力。至于说这个工具有没有什么成功案例，我觉得甚至不是什么重要的。很多工具案例不成功，完全不是工具的错，客户也有责任，毕竟中国的商业环境下应用这些工具的案例都还谈不上成功与否&#8212;&#8212;太新了。
　　最后，祝大家好运。有什么问题给我留言，如果你开始用了商用的工具出现了问题，也跟我联系吧！新的一周开始了，祝大家度过愉快的新一周。
]]></description>
			<content:encoded><![CDATA[<p>【前言】 <br />
	　　工具是网站分析不可缺少的元素。但是如何选择一个称心如意的工具，就不是那么简单了。如何根据自己不同网站的需求选择合适的工具？这成为很多朋友们关心的问题。在<a href="http://www.chinawebanalytics.cn/how-to-choose-web-analytics-tools-1/" target="_blank">这个话题的第一篇</a>中，我们讨论了小型电子商务网站对于工具的选择，在第二篇，我们看看中型和大型电子商务网站如何选择网站分析工具。</p>
<h3>需求和工具的对应（续1）</h3>
<h3><u><strong>类型二：大中型电子商务网站</strong></u></h3>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image5.png"><img align="left" alt="image" border="0" height="134" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image_thumb5.png" style="background-image: none; border-bottom: 0px; border-left: 0px; margin: 10px 10px 0px; padding-left: 0px; padding-right: 0px; display: inline; float: left; border-top: 0px; border-right: 0px; padding-top: 0px" title="image" width="182" /></a>　　我觉得，大中型电子商务网站的网站分析需求分为两类。一类是：不不不类（很有趣我刚看了Tenly给我转来的<a href="http://v.youku.com/v_show/id_XMjI2MjU3MDMy.html" target="_blank">老罗的演讲</a>，我就立即联想到了这个分类）；另外一类是：我一切都要类。</p>
<p><span id="more-3305"></span></p>
<p>　　不不不类的电子商务网站要么不需要网站分析，要么不需要额外的工具来做网站分析。我常常听到：&ldquo;网站分析是什么？我不需要。我最需要的是流量流量流量！&rdquo;确实，这些网站自己有log file可供分析，但是总体上讲，进行网站分析对这些网站而言并不迫切。即使网站并不完美，但是它已经照这样运行了很多年，也没看出它的表现有什么不好。而且修改网站会影响我SEO的效果，各个执行部门的人也会很不happy增加了工作量和多了一些衡量他们的条条框框。</p>
<p>　　对于这种理念我很难置评，毕竟电子商务在中国还是正处于一个粗放竞争的年代。电子商务是微利甚至是负利的，但是没关系，我有规模就好了，有规模就有投资，有投资就能继续扩大规模，这使电子商务在中国的玩儿法变得不需要那么精耕细作，抢资源才是硬道理。除了电子商务网站，团购网站更强烈地显现出这种特征。我绝对不敢嘲笑这种做法，什么样的商业环境就有什么样的商业规则，什么样的商业规则就会产生什么样的商业策略，在中国这片神奇的土地上，不这么做才显得不正常。</p>
<p>　　但我坚信到了某一个时点，这一切都会快速地发生改变。</p>
<p>　　另外一种流派是我一切都要类，就是希望网站分析能够解决所有的网站优化问题。这种希望并不是很具体，但能够传达出明确的我要网站得到优化的欲求。这种想法不能说不对，但网站分析不是万能油，不解决网站所有的问题。网站分析的落脚点在于用户行为，如果这个网站没有什么用户，而且用户也不活跃，那么这个网站可以施展网站分析的领域就不多。同样，如果希望网站的SEO排名能够依靠网站分析而得到迅速提升，这也是没有用对工具。</p>
<p>　　好了，闲话就不多说了。对于大中型电子商务网站而言，网站分析施展本领的真正领域如下：</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image6.png"><img alt="image" border="0" height="328" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image_thumb6.png" style="background-image: none; border-bottom: 0px; border-left: 0px; margin: 5px 10px 0px 0px; padding-left: 0px; padding-right: 0px; display: inline; border-top: 0px; border-right: 0px; padding-top: 0px" title="image" width="528" /></a></p>
<ol>
<li>定位购物转化过程中网站结构和页面的问题；提供可能的优化方案；测试并固话优化方案。</li>
<li>流量的定位、细分和分析；提供细分基础上的流量效果比较。</li>
<li>除了直接从端到端的ROI（投资收益）角度分析流量效果之外，还能够提供Engagement（即流量参与网站各种行为和程度）角度的效果分析；或者换句话说，就是不仅能看到流量的输入和输出，还能看到流量输入输出之间在网站上的点点滴滴的过程。能看到过程，才能有机会优化。</li>
<li>商品品类分析：哪些品类有好的转化，哪些没有，可能的原因是什么。</li>
<li>商品分析：哪些商品有好的转化，需要新增哪些商品（消费者有需求却没有提供的商品）。</li>
<li>访客分析：细分访客，例如按照网站访问次数的多少细分为新访客、重复访客和忠诚访客，或者按照客户购买商品的情况细分（如，新顾客，回头客和忠诚顾客）；或者按照地域细分以及其他规则细分访客并对它们表现出的不同行为和转化模式进行细分等等。</li>
</ol>
<p>　　上面所列出这些需求都是通常一个大中型电子商务网站进行网站分析时肯定要做的事情，在之前的两篇文章中，从更广义的角度较为系统地阐述了电子商务网站分析的需求：<a href="http://www.chinawebanalytics.cn/%e7%94%b5%e5%ad%90%e5%95%86%e5%8a%a1%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e8%a6%81%e5%85%b3%e6%b3%a8%e4%ba%9b%e4%bb%80%e4%b9%88%ef%bc%88%e4%b8%8a%ef%bc%89/">电子商务网站分析要关注些什么（上）</a>；<a href="http://www.chinawebanalytics.cn/%e7%94%b5%e5%ad%90%e5%95%86%e5%8a%a1%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e8%a6%81%e5%85%b3%e6%b3%a8%e4%ba%9b%e4%bb%80%e4%b9%88%ef%bc%88%e4%b8%8b%ef%bc%89/">电子商务网站分析要关注些什么（下）</a>。建议大家可以参考。<a href="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image7.png"><img align="right" alt="image" border="0" height="173" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image_thumb7.png" style="background-image: none; border-bottom: 0px; border-left: 0px; margin: 0px 0px 0px 20px; padding-left: 0px; padding-right: 0px; display: inline; float: right; border-top: 0px; border-right: 0px; padding-top: 0px" title="image" width="240" /></a></p>
<p>　　大家可以看到，上面的这些分析和优化内容，单单靠免费的网站分析工具已经勉为其难了。上篇文章中朋友们提到的CNZZ等工具，在流量的监测上没有什么问题，但是到了与业务结合的细分层面，就无法提供解决方案了。毕竟是免费流量工具，不能要求太多。所以，有朋友留言说得好&ldquo;网站分析&nbsp; 注意不仅仅是 流量分析&rdquo;，的确是这样。这是需求的不同，如果只是看看流量的变化，不做更深入分析的话，那么CNZZ和51la是足够了，用更复杂的工具是浪费。但是做网站分析，尤其是做大中型电子商务网站的分析，好的工具就很重要了。</p>
<h3><strong>大中型电子商务网站需要什么样的网站分析工具？</strong></h3>
<p>　　前面说了，工具不存在好坏，满足需求的工具就好。大中型电子商务网站选择网站分析工具的时候，需要问工具提供商如下的功能需求：</p>
<ul>
<li><strong>流量定位和监测</strong></li>
</ul>
<p>　　这个功能<a href="http://www.omniture.com" target="_blank">Omniture SiteCatalyst</a>最早实现，即通过SAINT Classification的方法，可以实现对流量来源的无限标记。这种方法后来被<a href="http://analytics.google.com" target="_blank">Google Analytics</a>简化为UTM的外链形式，流量的细分属性被限制为不超过6个，但也够用。关于这个功能，大家参考这篇文章：<a href="http://www.chinawebanalytics.cn/%e7%94%a8google-analytics%e7%9a%84link-tag%e6%b7%b1%e5%85%a5%e4%ba%86%e8%a7%a3%e6%b5%81%e9%87%8f%e6%9d%a5%e6%ba%90%ef%bc%88%e5%b9%bf%e5%91%8a%ef%bc%89%e7%9a%84%e8%b4%a8%e9%87%8f/">用Google Analytics的Link Tag深入了解流量来源（广告）的质量</a>。<a href="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image8.png"><img align="left" alt="image" height="139" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image_thumb8.png" style="margin: 0px 20px 10px 0px; display: inline; float: left" title="image" width="240" /></a>这个功能对于细分流量来源非常强大。</p>
<ul>
<li><strong>全路径和自定路径</strong></li>
</ul>
<p>　　在<a href="http://www.chinawebanalytics.cn/google-analytics-pros-and-cons/">Google Analytics的能与不能</a>提到过，Google Analytics其实没有全路径分析和后自定义路径分析功能，只有预定义路径和转化分析，相对而言对于路径和转化分析很复杂的大中型电子商务网站而言，就很不给力了。Omniture SiteCatalyst在这个地方很强大，路径分析是它的看家本领。其他商用工具在这块应该也不赖。</p>
<ul>
<li><strong>灵活的细分能力</strong></li>
</ul>
<p>　　灵活的细分指预定义的细分和自定义的细分都要强大。Google Analytics的预定义细分很牛，是我见过的工具中最好的，没有之一。自定义方面，Omniture SiteCatalyst可以实现无限制自定义细分，但需要在实施工具前就想好，然后在工具部署的时候定义进去。如果漏掉希望细分的地方，也可以未来随时升级工具补上。所以，我常常跟朋友说，Omniture的工具不定制直接用绝对是浪费。虽然预先的定制需要策略性思考和实施工作量，但未来这工具就是针对你的业务专用的，的确值得。<a href="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image9.png"><img align="right" alt="image" height="133" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image_thumb9.png" style="margin: 0px 0px 20px 20px; display: inline; float: right" title="image" width="240" /></a>不过，目前能够通过默认预定义功能就能实现所有分析需求的工具还不存在。我想，由于每个业务自身的独特性，这样的工具可能永远也不会存在，除非&mdash;&mdash;一种能够监听和解读网页上所有变量，并把这些变量的启动和数据变化全部记录下来并按逻辑进行分隔的工具出现（够拗口的，够复杂的，我想这种工具是难以出来了<img alt="微笑" class="wlEmoticon wlEmoticon-smile" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/wlEmoticon-smile1.png" style="border-bottom-style: none; border-right-style: none; border-top-style: none; border-left-style: none" />）。</p>
<ul>
<li><strong>与业务动态结合</strong></li>
</ul>
<p>　　这个，比较难，但商用工具应该做得到，否则你有理由不选择它。所谓与业务动态结合，指网站分析工具不仅是从流量的角度监测数据（<strong>流量过程监测</strong>），而且从流量在网站内流动过程中所引发的业务流动的角度来提供数据的监测（<strong>业务过程监测</strong>）。比较抽象，举个例子。例如，你在<a href="http://www.360buy.com" target="_blank">京东商城</a>选购商品的时候，你在各个页面的访问都被网站分析记录下来，这是流量的流动过程，是以页面为载体的。如果你完成了一个商品的购买，这个流动的过程又可以被记录为：&ldquo;查看商品信息&rdquo;-&gt;&ldquo;添加到购物车&rdquo;-&gt;&ldquo;填入收货信息&rdquo;-&gt;&ldquo;确定购买&rdquo;-&gt;&ldquo;支付&rdquo;-&gt;&ldquo;支付成功&rdquo;，这是一个动态的业务流程（如下图所示）。商用工具不仅仅从流量角度描述这个过程，也从业务的角度描述这个过程。流量过程和业务过程的区别是，流量过程是以页面为载体，由于不同商品页面的URL或者页面名称的不同，因此用流量过程描述整体的业务的过程过于复杂。而直接定义业务过程，则能够很便利地实现业务流分析。免费的工具都是流量过程监测，付费的商用工具有些具有业务过程监测。这也是为什么Omniture SiteCatalyst要区分Traffic props和conversion evars+successful events的原因，因为前者是流量过程，后者则描述业务过程（关于这点，没有用过Omniture的朋友们无需深究）。</p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image10.png"><img alt="image" border="0" height="182" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image_thumb10.png" style="background-image: none; border-bottom: 0px; border-left: 0px; margin: 5px 10px 0px 0px; padding-left: 0px; padding-right: 0px; display: inline; border-top: 0px; border-right: 0px; padding-top: 0px" title="image" width="590" /></a></p>
<ul>
<li><strong>商品标记、细分和转化跟踪</strong></li>
</ul>
<p>　　商品本身的属性很复杂，品名，类型，SKU，价格，库存状态&hellip;&hellip;，有些电子商务网站的商品属性多达30种。免费工具太难记录这些东西了。无法较好的记录，也就无法较好的细分。另外，商品的转化跟踪属于业务过程，而不仅仅只是流量过程。</p>
<ul>
<li><strong>顾客细分</strong></li>
</ul>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image11.png"><img align="left" alt="image" border="0" height="153" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image_thumb11.png" style="background-image: none; border-bottom: 0px; border-left: 0px; margin: 0px 20px 20px 0px; padding-left: 0px; padding-right: 0px; display: inline; float: left; border-top: 0px; border-right: 0px; padding-top: 0px" title="image" width="223" /></a>　　免费工具一般只提供新旧访问者的细分，商用工具从业务过程的角度考虑，把访问者中的顾客（已经购买商品的访问者）抽取出来，并且按照新顾客（只够买一次商品的），回头客（购买两次商品的）以及忠诚顾客（三次或者以上购买次数的）区分开来。另外，对于访问者的一些其他属性，例如是否注册客户，是否银卡、金卡、钻石卡客户，以及客户注册或者购物时所填写的个人属性，利用这个网站分析工具，都应该通过增加监测变量实现监测。国内好像还很少有通过网站分析工具做这么细致做顾客角度的网站分析的，但是用网站分析工具，把顾客细分后按照流量过程和业务过程结合起来分析，对顾客的分析和挖掘绝对给力。其他对顾客细分如地域细分、浏览器版本、操作系统版本，javascript支持等等，这些基本的就不用说了。</p>
<p>　　这些是服务于大中型电子商务网站的网站分析工具所必需的一些功能。</p>
<p>　　此外，即使某些工具能够实现上面的功能，你也要注意一些其他的（可能让你未来蛋疼的）地方。</p>
<h3><strong>注意避免未来会让你蛋疼的地方</strong></h3>
<p>　　由于商用工具必需照顾业务流程，因此它要么是具有很强的可定制化能力，要么就是提供针对某一个领域的细分定制方案（比如我们之前提到的<a href="http://www.chinawebanalytics.cn/%e2%80%9c%e4%ba%91%e2%80%9d%e7%9b%91%e6%b5%8b%ef%bc%9a%e5%9e%82%e7%9b%b4%e5%9e%8b%e7%9a%84%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90/" target="_blank">小艾统计</a>）。后者我们就不多看了，并不是针对大中型电子商务网站的解决方案。而对于前者，定制化能力可能是一把双刃剑。</p>
<p>　　毫不夸张的说，好的定制需要花费心血。一方面，对自己网站的业务和过程要非常了解。另一方面，对自己网站结果，URL结构，SEO结构要极为清晰了解。除此之外的另另一方面，还要对自己的监测期望有极为极为清晰地了解。三者缺一不可。</p>
<p>　　如果你不想花费这个心血，而让外人越俎代庖，最后绝对会把强大的工具应用地不伦不类。这种杯具其实是常见的。<a href="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image12.png"><img align="right" alt="image" border="0" height="244" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image_thumb12.png" style="background-image: none; border-bottom: 0px; border-left: 0px; padding-left: 0px; padding-right: 0px; display: inline; float: right; border-top: 0px; border-right: 0px; padding-top: 0px" title="image" width="167" /></a></p>
<p>　　我认为，网站分析工具的选择，功能只是一个方面。功能强大，而分析团队没有或者十分孱弱，那么工具越强大，事情反而可能越糟糕，还不如免费工具来得快活。我有这样的经验，用我的Pentax单反相机能照出相当不错的照片，但是交给一个女孩子，出的东西反而不如她手上的卡片好。这不是歧视女生，这是强大的工具需要强大的能力去匹配，所谓好马配好鞍。</p>
<p>　　不扯远了，天色已晚。如果开始不注意，未来会让你蛋疼的地方包括：</p>
<ol>
<li>页面的定义太随意，例如忘记对一个品类的所有页面做一个统一的标识，或者忘记为页面过程附加业务过程。</li>
<li>细分需求定义不全&mdash;&mdash;需要工具提供的一些重要细分数据需求忘记提交，后面的分析肯定打折扣。</li>
<li>初期实施追求监测的大而全，结果造成实施的困难重重。未来拿到的数据报告过多，极大增加分析难度。&mdash;&mdash;这一点和上一点说明，掌握初期需求和细分的度是非常必要的。</li>
<li>流量标识和商品标识不认真做，结果最后分析的时候不得不重头来，或者没有得到数据。</li>
</ol>
<p>　　一旦使用了商用工具，大家如果怕未来难受，可以跟我先聊聊，我这里有不少曾经让人非常郁闷的经验，但若注意到了别人的失败，自己至少就能够少走点弯路。</p>
<p>　　即使是使用Google Analytics这样的工具，如果开始没做好，未来也难免蛋疼。看看这两篇文章，说不定就能帮到您：<a href="http://www.chinawebanalytics.cn/wa-implementation-trap-1/">警惕网站分析监测实施的陷阱（上）</a>；<a href="http://www.chinawebanalytics.cn/wa-implementation-trap-2/">警惕网站分析监测实施的陷阱（下）</a>。</p>
<h3><font style="font-weight: bold">服务</font></h3>
<p>　　大中型电子商务网站分析如果使用了付费工具，那么肯定是要特别看重服务的。因为这些工具用起来都不是那么容易。我建议先工具厂商购买或者索取三类服务。</p>
<p>　　第一类：使用帮助。不一定需要人在场，但是搞不定的时候一定要有官方的人帮忙。</p>
<p>　　第二类：让官方的人帮助一起做一次分析，并且把分析结果所使用的具体工具、方法再现出来。这是一个非常快的掌握工具的好办法。</p>
<p>　　第三类：完整的知识库。大半夜的时候实在搞不定了，还能看看文章自己摸索下。</p>
<p>　　没有任何服务的工具不要选，原因就不说了。</p>
<h3><font style="font-weight: bold">本篇总结</font></h3>
<p>　　由于大中型电子商务网站太复杂，所以这篇文章一下子又说多了。很可能有些部分朋友们觉得有些难理解，请给我留言询问。大中型电子商务网站选型网站分析工具要注意几点：1) 定制能力；2) 转化和路径能力；3) 业务过程监测; 4) 服务能力。至于说这个工具有没有什么成功案例，我觉得甚至不是什么重要的。很多工具案例不成功，完全不是工具的错，客户也有责任，毕竟中国的商业环境下应用这些工具的案例都还谈不上成功与否&mdash;&mdash;太新了。</p>
<p>　　最后，祝大家好运。有什么问题给我留言，如果你开始用了商用的工具出现了问题，也跟我联系吧！新的一周开始了，祝大家度过愉快的新一周。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/how-to-choose-web-analytics-tools-2/feed/</wfw:commentRss>
		<slash:comments>12</slash:comments>
		</item>
		<item>
		<title>网站分析，我需要什么样的工具？（1）</title>
		<link>http://www.chinawebanalytics.cn/how-to-choose-web-analytics-tools-1/</link>
		<comments>http://www.chinawebanalytics.cn/how-to-choose-web-analytics-tools-1/#comments</comments>
		<pubDate>Mon, 03 Jan 2011 16:53:46 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[Featured]]></category>
		<category><![CDATA[监测工具]]></category>
		<category><![CDATA[网站分析工具]]></category>
		<category><![CDATA[CWA]]></category>
		<category><![CDATA[Google Analytics]]></category>
		<category><![CDATA[Omniture]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=3274</guid>
		<description><![CDATA[【前言】
　　工具是网站分析不可缺少的元素。但是如何选择一个称心如意的工具，就不是那么简单了。坦率说，对于工具的选择方面的话题，我并不是最好的建议者，毕竟我所使用过的和我所了解过的工具是有限的。而网站分析的工具则太多太多，我来说这个话题，一定会有失偏颇。但是，朋友们对我不断提出的殷切的期望，又让我不能不紧张地谈谈这个话题。
　　是的，网站分析工具太多了，我不能够帮助大家选择所有的工具，因此这篇文章中的工具都是主流的网站分析工具，而一些特定性的或者是专门性的工具，我可能会提及，但不会作为重点。我们这里所指的工具，是一个完整而成熟的网站分析解决方案，而绝不仅仅只是一个软件那么单纯。
　　如果有任何问题和想要分享的，请在留言区给我留言。谢谢大家！
【鸣谢】
　　亲爱的朋友们，我不知道大家是不是在等待我新的文章，也不知道大家是不是有更多的问题，但我知道，我答应了很多朋友的各种需求，却爽约了太久。容我慢慢还吧。2010年已然过去，这一年发生很多让我难忘的经历。特别感谢Qunar的Karen（你一直以来的关注、支持和启发，谢谢！同时，请大家帮助她解决一个我也不能很好回答的问题）、姜文涛先生（谢谢宝贵经验的无私分享，我也想复制你的成功，找时间再喝酒(和果汁)）、中海互动的艾颂（在我需要的时候，你总是那么给力的鼎力相助，谢谢！）、Angela（谢谢你的安排，让我能够有愉快的分享）、SEO大神小帅（南奇）和Robin和少炜、神通一击屠夫、宫鑫先生、大牛Mars、百度的天放和涛哥、艾瑞的云飞兄弟、Frost&#38;Sullivan的王煜全先生、创新工场的Luffy小姐（你现在语速真的快了！）、AdMaster的Vincent和Tenly（你的才华我从来不质疑，现在你爆发的机会来了！）、我在澳洲的同事Catherine和Gary夫妇（你们对我太好了，我在悉尼觉得有家人的温暖）、Cellbikes的Peter（春节后澳洲见！）、IBM的朋友Frank（祝你早日找到更棒的工作）、Intel的客户凯男（什么时候切磋星际啊）、国航的小蔡、联想的客户宗辉和成浩、欧莱雅的文武宝贝、OMG美国的Elin（你答应了我的请求哦，希望能在芝加哥再见到你）、好兄弟大尤、优米网点点、小艾统计的武凯和千鸟、两位David（David Chen和David Wu）&#8230;&#8230;以及和我朝夕相处的网站分析领域的超好的同事们（Vyse, Lillian, Karen, Michael, Darryl, John, Louis, Suraj, Oliver, Kobe, Ling, Ann&#8230;&#8230;）和所有给我各种帮助的朋友们（抱歉我无法提及你们所有的名字，一下子回忆一年真的很难，但真的很感谢你们！）。当然，最最要感谢的是各位读者朋友们，你们的支持让我的博客能够安然走到现在。2010年对我不是很容易的一年，我在不断变化中生存，跟抑郁做严肃地斗争，失去一些生命中引以为傲的东西，且不断在努力辛苦中寻求一些生活的答案，一个人也旅行了很多。但终于我坚信我能让自己变得越来越快乐，而且极端充实，这一年中我甚至没有哪一分钟挥霍过自己的生命，所以到了年末能够带着微笑。这种感觉真的很好。2011年还有很多希望和目标，继续努力，继续努力。
【正文】
　　之前我答应参与案例分析的朋友们的文章和文件还没有发出，春节前一定会做好发出。2011年的开山之作再回来讲一讲网站分析的工具，有一位在QQ群中叫竺筱的在ShopEx工作的朋友很执着地问了我很多关于这个方面的问题，我相信你的问题代表了很多朋友们的疑惑。现在容我慢慢回答。
　　有朋友反映过我的文章太长。我决定从新年开始，所有的文章都变短。长文拆成更短的文章，分更多期发布。大家看着不那么累，我也能悠着点儿写了。:)
从需求开始
　　是的，网站分析工具太多了，我应该用什么样的工具呢？
　　如果你这样问我，我也会一下子哑口无言，因为使用什么样的工具取决于你有什么需求。网站分析的需求通常是很细分的，也许有那么一个特别重要的需求是你特别在意的，而正好又只有某一种网站分析工具能够做到实现这个需求，那么你就该选择这个工具。如果你想让我为你挑选工具（坦率说我不太乐意干这个事情  ），那么你就该说说你的需求，说说你网站的情况，而不能直接问我：你认为哪个工具好？
　　这世界上的工具，能够做出来，且有一定的用户基础的，都不会是&#8220;不好&#8221;的工具，如果觉得它不好用，八成不是它本身不够好，而是一开始就把它的定位给弄错了。
　　没有清楚自己的需求，不要问工具好坏。
需求和工具的对应
　　现在大家的问题可能是，如果我清楚了我的需求，我该如何选择网站分析工具？别急，让我慢慢来。由于需求的复杂性，我这里将帮助大家梳理几种常见的网站和其需求，然后看看对应什么样的网站分析工具。
类型一：小型电子商务网站
　　我认为，从网站分析的角度看，小型电子商务网站的定义不应该按照营业额的大小，而应该按照商品品类的数量。相对而言，品类越多，网站分析的复杂程度也就越高。超不过50个品类的电子商务网站，应该算小型电子商务网站。
　　可是，如果一个小型电子商务网站问我，我应该用什么网站分析工具。我仍然会说，其实跟大型电子商务网站该用的工具不应该有区别，即，如果有可能，应该用商用付费的网站分析工具。
　　电子商务网站强调几种关键需求：转化路径分析，营销效果分析（其中也包括大家熟悉的来路分析），关键页面分析，商品品类分析，交叉销售分析以及客户细分。在测试阶段则强调A/B测试。这些都不是免费的工具能够做到的。
　　不过，你会说，毕竟我的网站规模还小，我们可以入门慢慢来。我赞同，如果完全没有网站分析经验，小型电子商务网站使用基本的免费分析工具开始其实也不妨。网站分析的基本逻辑是，先把最低垂的果子摘下来。如果要摘那些容易摘取的果实，并不一定要非常牛X的网站分析工具。所谓那些最低垂的果实，既是指那些最明显的问题，比如糟糕的landing page，低劣的端到端转化（暂时不考虑过程），销售和访问不成比例的商品等。我觉得其中有些甚至不需要网站分析工具就可以做出。网站分析的另一个基本逻辑是，千万不要只见树木不见森林。从端到端开始，从大画面开始&#8212;&#8212;这些不需要太牛X的工具就行，然后再细分到细节&#8212;&#8212;这才需要更牛的工具。
　　小型电子商务网站选择网站分析工具应该先问自己几个问题。

我对网站分析一窍不通吗？如果是，而且你也没有空来学，那么别选免费工具了，找懂的人来做，找工具供应商的服务人员给你做讲解。
我有专门的网站分析人员吗？如果有，且他熟悉商用工具，那么试试商用工具没问题。否则，如果要用商用工具，一定要找一个给力的顾问&#8212;&#8212;让他帮你分析一个正在运行的活案例，然后告诉你他是如何使用这个工具完成分析的。这种方法是最快能学会网站分析的捷径。
我对网站和网络营销的流量目前存在的问题有清晰的认识吗？如果没有这个认识，先用好的免费工具吧发现网站的问题吧。毫无疑问，我推荐Google Analytics。
免费分析工具不能获得的数据可以通过其他方法获得吗？例如商品销售量和金额，例如添加到购物车最后并没有完成销售的数量等。这些数据用Google Analytics之类的网站分析工具的确很难获得，但是毕竟网站是你的，如果你能有办法弄到这些数据，那么实际上就延伸了Google Analytics的效果。
是否存在这样的状态？&#8212;&#8212;我已经知道了存在问题，例如我知道填入购物信息的表单页面肯定有问题，但我不知道具体问题在哪里。这个时候，你可能需要更深入的分析（细分），这种情况下，免费的工具可能就不行了，你应该用付费的商业工具，而且还要跟他们具体说明你的问题所在，让他们提供技术方案解决这个确定的问题。

　　我的感觉是，小型电子商务网站不要试图一口吃个大胖子。掌握阶段和节奏很重要。什么都不知道的时候，从免费工具入门，了解一些网站分析的基本常识，了解对流量的定义和分类；接着，利用免费工具发现一些网站明显存在的问题，定义一些跟业绩相关的关键指标；然后，开始发现越来越多的问题，并到了需要深度挖掘才能发现真相，才能更细致解决这些问题的时候，再上付费工具。如果，觉得免费工具发现的问题已经很明确，或者发现的问题根本已经超出了当前资源能够去解决的可能性，那么，暂时还是用免费工具吧。
　　我推荐的小型电子商务网站网站分析工具有两个（严格意义上是三个）：Google Analytics（网站分析入门的不二之选，免费工具）和Adobe SiteCatalyst+Discover（电子商务网站分析的解决方案较全面且灵活，付费工具）。我怕我有偏见，其他工具如果大家觉着用得好，也请提出来。
　　关于电子商务网站网站的哪些关键分析需求，各种工具是否能够满足，满足的程度如何，我将在后面关于大型电子商务网站的工具分析中为大家详解。
　　好了，第一集先写到这里，后面会继续各种网站的分析需求和对应的工具。另外也会探讨与工具相关的资源配置和价格结构，以及对选择工具上的一些误区。这个文章准备来个至少4、5集啦！有什么问题，欢迎讨论！
]]></description>
			<content:encoded><![CDATA[<p>【前言】</p>
<p>　　工具是网站分析不可缺少的元素。但是如何选择一个称心如意的工具，就不是那么简单了。坦率说，对于工具的选择方面的话题，我并不是最好的建议者，毕竟我所使用过的和我所了解过的工具是有限的。而网站分析的工具则太多太多，我来说这个话题，一定会有失偏颇。但是，朋友们对我不断提出的殷切的期望，又让我不能不紧张地谈谈这个话题。</p>
<p>　　是的，网站分析工具太多了，我不能够帮助大家选择所有的工具，因此这篇文章中的工具都是主流的网站分析工具，而一些特定性的或者是专门性的工具，我可能会提及，但不会作为重点。<span id="more-3274"></span>我们这里所指的工具，是一个完整而成熟的网站分析解决方案，而绝不仅仅只是一个软件那么单纯。</p>
<p>　　如果有任何问题和想要分享的，请在留言区给我留言。谢谢大家！</p>
<p>【鸣谢】</p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image1.png"><img align="left" alt="image" height="164" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image_thumb1.png" style="margin: 5px 20px 0px 0px; display: inline; float: left" title="image" width="240" /></a>　　亲爱的朋友们，我不知道大家是不是在等待我新的文章，也不知道大家是不是有更多的问题，但我知道，我答应了很多朋友的各种需求，却爽约了太久。容我慢慢还吧。2010年已然过去，这一年发生很多让我难忘的经历。特别感谢Qunar的Karen（你一直以来的关注、支持和启发，谢谢！<img alt="微笑" class="wlEmoticon wlEmoticon-smile" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/wlEmoticon-smile.png" style="border-bottom-style: none; border-right-style: none; border-top-style: none; border-left-style: none" />同时，请大家帮助她解决一个<a href="http://www.chinawebanalytics.cn/kpi-help/">我也不能很好回答的问题</a>）、姜文涛先生（谢谢宝贵经验的无私分享，我也想复制你的成功，找时间再喝酒(和果汁)<img alt="吐舌笑脸" class="wlEmoticon wlEmoticon-smilewithtongueout" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/wlEmoticon-smilewithtongueout.png" style="border-bottom-style: none; border-right-style: none; border-top-style: none; border-left-style: none" />）、中海互动的艾颂（在我需要的时候，你总是那么给力的鼎力相助，谢谢！）、Angela（谢谢你的安排，让我能够有愉快的分享）、SEO大神小帅（南奇）和Robin和少炜、神通一击屠夫、宫鑫先生、大牛Mars、百度的天放和涛哥、艾瑞的云飞兄弟、Frost&amp;Sullivan的王煜全先生、创新工场的Luffy小姐（你现在语速真的快了！<img alt="吐舌笑脸" class="wlEmoticon wlEmoticon-smilewithtongueout" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/wlEmoticon-smilewithtongueout.png" style="border-bottom-style: none; border-right-style: none; border-top-style: none; border-left-style: none" />）、AdMaster的Vincent和Tenly（你的才华我从来不质疑，现在你爆发的机会来了！）、我在澳洲的同事Catherine和Gary夫妇（你们对我太好了，我在悉尼觉得有家人的温暖）、Cellbikes的Peter（春节后澳洲见！）、IBM的朋友Frank（祝你早日找到更棒的工作）、Intel的客户凯男（什么时候切磋星际啊）、国航的小蔡、联想的客户宗辉和成浩、欧莱雅的文武宝贝、OMG美国的Elin（你答应了我的请求哦<img alt="吐舌笑脸" class="wlEmoticon wlEmoticon-smilewithtongueout" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/wlEmoticon-smilewithtongueout.png" style="border-bottom-style: none; border-right-style: none; border-top-style: none; border-left-style: none" />，希望能在芝加哥再见到你）、好兄弟大尤、优米网点点、小艾统计的武凯和千鸟、两位David（David Chen和David Wu）&hellip;&hellip;以及和我朝夕相处的网站分析领域的超好的同事们（Vyse, Lillian, Karen, Michael, Darryl, John, Louis, Suraj, Oliver, Kobe, Ling, Ann&hellip;&hellip;）和所有给我各种帮助的朋友们（抱歉我无法提及你们所有的名字，一下子回忆一年真的很难，但真的很感谢你们！）。<strong>当然，最最要感谢的是各位读者朋友们，你们的支持让我的博客能够安然走到现在</strong>。2010年对我不是很容易的一年，我在不断变化中生存，跟抑郁做严肃地斗争，失去一些生命中引以为傲的东西，且不断在努力辛苦中寻求一些生活的答案，一个人也旅行了很多。但终于我坚信我能让自己变得越来越快乐，而且极端充实，这一年中我甚至没有哪一分钟挥霍过自己的生命，所以到了年末能够带着微笑。这种感觉真的很好。2011年还有很多希望和目标，继续努力，继续努力。</p>
<p>【正文】</p>
<p>　　之前我答应参与案例分析的朋友们的文章和文件还没有发出，春节前一定会做好发出。2011年的开山之作再回来讲一讲网站分析的工具，有一位在QQ群中叫竺筱的在ShopEx工作的朋友很执着地问了我很多关于这个方面的问题，我相信你的问题代表了很多朋友们的疑惑。现在容我慢慢回答。</p>
<p>　　有朋友反映过我的文章太长。我决定从新年开始，所有的文章都变短。长文拆成更短的文章，分更多期发布。大家看着不那么累，我也能悠着点儿写了。:)</p>
<h3><strong>从需求开始</strong></h3>
<p><strong>　　是的，网站分析工具太多了，我应该用什么样的工具呢？</strong></p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image2.png"><img align="right" alt="image" height="244" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image_thumb2.png" style="margin: 5px 10px 0px 20px; display: inline; float: right" title="image" width="240" /></a>　　如果你这样问我，我也会一下子哑口无言，因为使用什么样的工具取决于你有什么需求。网站分析的需求通常是很细分的，也许有那么一个特别重要的需求是你特别在意的，而正好又只有某一种网站分析工具能够做到实现这个需求，那么你就该选择这个工具。如果你想让我为你挑选工具（坦率说我不太乐意干这个事情 <img src='http://www.chinawebanalytics.cn/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> ），那么你就该说说你的需求，说说你网站的情况，而不能直接问我：你认为哪个工具好？</p>
<p>　　这世界上的工具，能够做出来，且有一定的用户基础的，都不会是&ldquo;不好&rdquo;的工具，如果觉得它不好用，八成不是它本身不够好，而是一开始就把它的定位给弄错了。</p>
<p>　　没有清楚自己的需求，不要问工具好坏。</p>
<h3>需求和工具的对应</h3>
<p>　　现在大家的问题可能是，如果我清楚了我的需求，我该如何选择网站分析工具？别急，让我慢慢来。由于需求的复杂性，我这里将帮助大家梳理几种常见的网站和其需求，然后看看对应什么样的网站分析工具。</p>
<p><strong>类型一：小型电子商务网站</strong></p>
<p>　　我认为，从网站分析的角度看，小型电子商务网站的定义不应该按照营业额的大小，而应该按照商品品类的数量。相对而言，品类越多，网站分析的复杂程度也就越高。超不过50个品类的电子商务网站，应该算小型电子商务网站。</p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image3.png"><img align="left" alt="image" border="0" height="183" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image_thumb3.png" style="background-image: none; border-bottom: 0px; border-left: 0px; margin: 0px 20px 0px 0px; padding-left: 0px; padding-right: 0px; display: inline; float: left; border-top: 0px; border-right: 0px; padding-top: 0px" title="image" width="183" /></a>　　可是，如果一个小型电子商务网站问我，我应该用什么网站分析工具。我<strong>仍然</strong>会说，其实跟大型电子商务网站该用的工具不应该有区别，即，如果有可能，应该用商用付费的网站分析工具。</p>
<p><strong>　　电子商务网站强调几种关键需求</strong>：转化路径分析，营销效果分析（其中也包括大家熟悉的来路分析），关键页面分析，商品品类分析，交叉销售分析以及客户细分。在测试阶段则强调A/B测试。这些都不是免费的工具能够做到的。</p>
<p><strong>　　不过</strong>，你会说，毕竟我的网站规模还小，我们可以入门慢慢来。我赞同，如果完全没有网站分析经验，小型电子商务网站使用基本的免费分析工具开始其实也不妨。<strong>网站分析的基本逻辑是，先把最低垂的果子摘下来</strong>。如果要摘那些容易摘取的果实，并不一定要非常牛X的网站分析工具。所谓那些最低垂的果实，既是指那些最明显的问题，比如糟糕的landing page，低劣的端到端转化（暂时不考虑过程），销售和访问不成比例的商品等。我觉得其中有些甚至不需要网站分析工具就可以做出。<strong>网站分析的另一个基本逻辑是，千万不要只见树木不见森林</strong>。从端到端开始，从大画面开始&mdash;&mdash;这些不需要太牛X的工具就行，然后再细分到细节&mdash;&mdash;这才需要更牛的工具。</p>
<p>　　小型电子商务网站选择网站分析工具应该先问自己几个问题。</p>
<ol>
<li>我对网站分析一窍不通吗？如果是，而且你也没有空来学，那么别选免费工具了，找懂的人来做，找工具供应商的服务人员给你做讲解。</li>
<li>我有专门的网站分析人员吗？如果有，且他熟悉商用工具，那么试试商用工具没问题。否则，如果要用商用工具，一定要找一个给力的顾问&mdash;&mdash;让他帮你分析一个正在运行的活案例，然后告诉你他是如何使用这个工具完成分析的。这种方法是最快能学会网站分析的捷径。</li>
<li>我对网站和网络营销的流量目前存在的问题有清晰的认识吗？如果没有这个认识，先用好的免费工具吧发现网站的问题吧。毫无疑问，我推荐Google Analytics。</li>
<li>免费分析工具不能获得的数据可以通过其他方法获得吗？例如商品销售量和金额，例如添加到购物车最后并没有完成销售的数量等。这些数据用Google Analytics之类的网站分析工具的确很难获得，但是毕竟网站是你的，如果你能有办法弄到这些数据，那么实际上就延伸了Google Analytics的效果。</li>
<li>是否存在这样的状态？&mdash;&mdash;我已经知道了存在问题，例如我知道填入购物信息的表单页面肯定有问题，但我不知道具体问题在哪里。这个时候，你可能需要更深入的分析（细分），这种情况下，免费的工具可能就不行了，你应该用付费的商业工具，而且还要跟他们具体说明你的问题所在，让他们提供技术方案解决这个确定的问题。</li>
</ol>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image4.png"><img align="right" alt="image" border="0" height="246" src="http://www.chinawebanalytics.cn/wp-content/uploads/2011/01/image_thumb4.png" style="background-image: none; border-bottom: 0px; border-left: 0px; margin: 0px 0px 0px 20px; padding-left: 0px; padding-right: 0px; display: inline; float: right; border-top: 0px; border-right: 0px; padding-top: 0px" title="image" width="165" /></a>　　我的感觉是，小型电子商务网站不要试图一口吃个大胖子。掌握阶段和节奏很重要。什么都不知道的时候，从免费工具入门，了解一些网站分析的基本常识，了解对流量的定义和分类；接着，利用免费工具发现一些网站明显存在的问题，定义一些跟业绩相关的关键指标；然后，开始发现越来越多的问题，并到了需要深度挖掘才能发现真相，才能更细致解决这些问题的时候，再上付费工具。<strong>如果</strong>，觉得免费工具发现的问题已经很明确，或者发现的问题根本已经超出了当前资源能够去解决的可能性，那么，暂时还是用免费工具吧。</p>
<p>　　我推荐的小型电子商务网站网站分析工具有两个（严格意义上是三个）：Google Analytics（网站分析入门的不二之选，免费工具）和Adobe SiteCatalyst+Discover（电子商务网站分析的解决方案较全面且灵活，付费工具）。我怕我有偏见，其他工具如果大家觉着用得好，也请提出来。</p>
<p>　　关于电子商务网站网站的哪些关键分析需求，各种工具是否能够满足，满足的程度如何，我将在后面关于大型电子商务网站的工具分析中为大家详解。</p>
<p>　　好了，第一集先写到这里，后面会继续各种网站的分析需求和对应的工具。另外也会探讨与工具相关的资源配置和价格结构，以及对选择工具上的一些误区。这个文章准备来个至少4、5集啦！有什么问题，欢迎讨论！</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/how-to-choose-web-analytics-tools-1/feed/</wfw:commentRss>
		<slash:comments>26</slash:comments>
		</item>
		<item>
		<title>网站分析度量、意义以及不为人所知的（2）</title>
		<link>http://www.chinawebanalytics.cn/metrics-and-its-back-story-2/</link>
		<comments>http://www.chinawebanalytics.cn/metrics-and-its-back-story-2/#comments</comments>
		<pubDate>Tue, 23 Nov 2010 21:28:31 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[Featured]]></category>
		<category><![CDATA[网站分析工具]]></category>
		<category><![CDATA[网站分析的基本度量]]></category>
		<category><![CDATA[网站分析经验分享]]></category>
		<category><![CDATA[Cookie]]></category>
		<category><![CDATA[CWA]]></category>
		<category><![CDATA[Google Analytics]]></category>
		<category><![CDATA[Omniture]]></category>
		<category><![CDATA[SiteCatalyst]]></category>
		<category><![CDATA[工具]]></category>
		<category><![CDATA[度量]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=3216</guid>
		<description><![CDATA[　　感谢大家在上篇文章中的踊跃参与！集体智慧太强大了！我准备整理大家的发言，也加上我的发言，汇集成一个单独的文章。
　　近期又在出差，前几天跟同事学习了一些关于Adobe Omniture Discover的特点，一时激动，在微薄上发了一个帖子，说这是个超级工具，结果受到了大家的普遍兴趣。也许有些言重，但很久没有这么激动的感觉了，若有言语不妥，请朋友们海涵。
　　今天继续度量这个话题，对Visitor和Visit进行更深入一点儿的挖掘。这个话题本来是不存在的，但是看到大家对这个系列第一集中关于visitor和visit的一些小疑惑，发现还是值得拿出来再说一说。仍然说它的原因，并不在于让大家死记住这两个度量本身的相关规定，而是这两个度量涉及了原理、方法和工具，这些是更有价值的知识。
为什么Visitor和Visit容易让我们疑惑？
　　Visitor让我们疑惑的，值得澄清的地方在于如下几点：

Visitor的含义是指访问的人数，但visitor并不可能等同于真正的访问你的网站的自然人的数量。
Visitor与visit和page view这两个度量不同的是，visitor跟时间的粒度（granularity）有关：即使相同的时间长度，时间粒度取的不同，visitor的数量也会不同。
相对而言，利用log file（日志法）对visitor的计数有先天不足，因此visitor这个概念对日志法较少使用。（关于什么是日志法，什么是标记法请看我的这个文章：服务器日志法网站分析的原理及优缺点）

　　对于上面三点稍作一点儿解释。第一点，visitor的含义是网站的访问人数，是具体的人。可是，并不可能真正知道到底有多少人访问了你的网站。为什么呢？假如你和你的朋友公用一台电脑，而且都用同一个浏览器访问我的博客（www.chinawebanalytics.cn, www.cwachina.com)，这个时候用技术的方法来精确分辨出是两个访问者非常困难&#8212;&#8212;总不能在你的电脑上装上一个摄像头窥视吧！因此，无论技术发展到何种程度，我认为100%准确记录访问网站的人数都是不太可能的，不仅是网站分析的工具难以做到，其他不同方法和不同工具也做不到（关于网站分析计数准确性的研究，请大家看这篇文章：网站分析&#8212;&#8212;我们的数据准确吗？）。 因此，人们采用了一些变通的方法来解决识别visitor数量的问题，我后面会重点讲到。
　　第二点，visitor跟时间的粒度有关。所谓粒度，就是我们所说的截取的时间范围。举个例子，2010年11月14日到11月20日这一周的七天，你在每天都访问了CWA网站一次（感谢这么忠诚的读者。:) ），那么如不同的时间粒度下visitor的计数不同。Weekly visitor是1，而daily visitor则是7。值得注意的是，对于所有的网站分析工具，weekly、monthly或者quarterly、yearly这样的时间粒度都是指日历上的自然周、月或者季度和年。因此，虽然11月24日到11月30日也是七天，而且你分别在这期间的11月25日和11月29日访问了我的CWA网站，weekly visitor仍然会被记录为2。
　　第三点，日志法对于记录visitor的数量是采用分辨IP的方法的。因此，在日志法中，我们常常提到的一个概念是独立IP的数量，并借此指代实际的访问者数量。但是，今天的IP地址已经不可能再跟计算机一一对应了，更不用说跟使用计算机的人一一对应。因此，用这个方法统计visitor的数量存在很大误差，逐渐被人们抛弃掉。
　　相对而言，visit的麻烦其实更多一点：

为什么要存在visit？
Visit和session是什么关系？
关闭浏览器窗口对visit的计数有没有影响？
关闭浏览器标签（Tab）对visit的计数有没有影响？
从不同来源访问网站，一定会使这个网站visit的计数增加吗？
Visit和unique page view是什么关系？

　　这些问题普遍反映了大家对visit和（标记法）网站分析的疑惑，但实际上，如果我们深入领会了visit的本质，解答这些问题其实很容易。
　　首先，为什么要存在visit？我们说过，网站分析不是分析孤立的数据（这是跟过去网站简单的流量统计有本质的区别的地方），而是分析网站访问者的行为。page view本身是一个个的孤立数据，不能解答网站访问过程中，网页之间的相互关系。例如，我说首页的page view是19,807，网站分析工具频道首页的page view是2,303次，这不能说明首页就一定更受欢迎。而visit，是指访问者来到网站的一系列打开页面的访问过程，是行为，是联系page view和visitor的桥梁。Visit这个度量的重要性就在于，它几乎是其他所有网站分析度量的基石，或者直接影响到了其他所有的网站分析度量。

　　其次，visit和session是什么关系呢？session和visit肯定不完全是一回事，但是你可以认为这二者是一样的名词。因为这涉及到一些历史。session是计算机原理课中的一个名词，即一个&#8220;会话&#8221;，如果你学过网络的七层结构模型，你就一定还记得其中有一个session layer&#8212;&#8212;会话层，就是指它。在日志法网站分析中，人们用session来表示一个连结的建立和解除，以用之描述visit。不过，由于标记法网站分析的出现，visit直接采用了别的更好的方法表述（马上也会重点讲到），这样就使session这个名词实际上弃用了，而直接使用visit来表示一次访问行为。当然，session作为技术上的一个名词，是不会被丢掉的，但在网站分析上，人们采用了更符合自然语言的表达。
　　剩下还有几个问题，关于visit的计数，以及visit和unique page view的关系，我会在下面首先跟朋友们解答visit和visitor的计数原理，然后在这个系列的下一篇中说明visit和unique page view的区别和联系，因为这一点将要引发出来的课题非常重要。为了弄清楚网站分析工具对于visit和visitor的计数，我们先要搞清楚怎样查看网站分析是否记录到了网站访问者的行为数据。
怎样查看网站分析工具是否捕捉到了数据
　　回答这个问题，我们不能靠猜测了，我们要用几种HTTP Sniffer（HTTP数据包嗅探器）工具（其实一般一种就够了，但不妨我们多了解几种）来探测，如同用雷达探测天上的飞机。首先，我推荐一个我最喜欢的工具：
 HttpWatch
　　HttpWatch（http://www.httpwatch.com/）肯定不是最强大的，但我觉得是最容易上手的，能够跟IE和火狐很好的整合，并且很稳定。
其他工具
　　然后其他工具大家也可以试试。Charles（www.charlesproxy.com/），是最强大的工具。firebug，主要用来查看cookie，这是个免费工具。另外还有WASP（http://webanalyticssolutionprofiler.com/），专门用来查验各种网站分析工具的软件。还有httpfox，也是免费的，从firefox的插件库中可以找到，功能也基本上齐全了。
　　如果不想付费，建议装上httpfox（或者基本版的HttpWatch），firebug和WASP（试用版）就足够了。
怎样查看网站分析工具是否捕捉到了数据
　　下面我以HTTPWatch为例，介绍如何查看网站分析工具是否捕获到了数据。对这个部分熟知的朋友直接跳过。
　　1. 在Firefox浏览器空白页中，打开（快键Shift+F2）打开HTTPWatch。
　　2. 启动HTTPWatch的记录模式，即点击下图中的红色框中的红button。

　　3. 在地址栏中输入你要检查的网页URL，打开网页。这个步骤可不需要拘泥于在地址栏中输入URL，你一样可以通过点击外部链接来到这个页面，HTTPWatch仍然会忠实的记录页面打开过程中的HTTP数据包。这时，你可以看到一条条的浏览器传输的数据记录产生了。
&#160;　　请千万不要把这些记录当做是网站服务器的Log记录，这是两回事。
　　4. 上面的数据很多，怎么能看到网站分析工具捕获的数据呢？利用过滤功能就好了。利用快捷键Ctrl+F9，调出过滤器，然后勾选Enabling Filtering，再勾选URL Contains，其下输入&#8220;-analytics&#8221;，再点OK之后就过滤出页面中GATC（Google Analytics Tracking Codes）发送的信息，如图所示的两条。如果你的页面上加有多个GA profile ID，那么这个数据也可能是多条。如果过滤之后没有数据了，说明网页没有正常运行GATC，或者没有加入GATC，那当然就是不能完成正常监测啦。

　　对于Omniture SiteCatalyst，在过滤器中输入&#8220;2o7&#8221;，就能把只是Omniture Tracking Code发出的监测数据过滤出来。
　　现在，你有了这个好武器，它的用途可不只是让你看看监测代码正常工作了没有。我们下面要用它来检查网站分析工具是如何计数visit和visitor的。
Visitor和visit如何计数？
　　你可能会问，上面过滤之后的这两条信息是什么东西？想要搞清楚这个问题，我们得打开另外一个话题，即网站分析工具获取数据的原理。如果大家感兴趣，我会另开一篇帖子，如果没兴趣就算了，反正也不太影响大家直接进行网站分析的实践，在我未来计划（现在还只是计划，实在是忙的对不起大家）的书中会再专门提及。下面我们还是聚焦在网站分析工具如何计数这个问题上。
　　你可以先阅读这个帖子&#8212;&#8212;网站分析工具如何辨别UV，然后再继续往下看，一定会有新的收获。在标记法的网站分析中，除了page view之外，visitor和visit以及一切我们分析报告中显现的度量和计数其实都是通过cookie实现的，只有在没有cookie的情况下，才通过其他的方法实现，因此，如果想要搞清楚visitor或者visit到底是如何被网站分析工具记录的，最好的办法是直接看看cookie是怎么记录的。
　　不同网站分析工具cookie记录的方法有所不同，但核心思想是一致的。因此，这里先说说Google Analytics的cookie设置，未来有机会再聊Omniture SiteCatalyst的，因为后者的架构相对更加复杂。
Google Analytics的cookie设置
　　利用HttpWatch，我们点入第二条信息，然后选择&#8220;Query String&#8221;标签，在下方的检视窗口中出现了更多的信息。

　　先不管其他信息，我们直接看utmcc，这条记录是GA跟visit和visitor相关的cookie信息。如下：

utmcc&#160;&#160;&#160; __utma=148702437.1696395432.1289879776.1290424992.1290508917.6;+__utmz=148702437. 
		1289882757.1.6.utmcsr=google&#124;utmccn=(organic)&#124;utmcmd=organic&#124;utmctr=%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90;

　　现在，我们一条条的看这些数据到底是什么意思。

utma

　　记录visitor的信息，utma后面的信息，包括域的hash值，visitor的ID、访问时间相关信息和访问次数。utma对应的信息，除非人为删除，否则它在两年后才失效。为了免去我自己作图的痛苦，我直接利用了Google转化大学中的图，因此下图中的数字信息跟上面的不一样，但相应信息的含义是完全一样的。

本图的来源为http://services.google.com/analytics/breeze/en/ga_cookies/index.html 
	版权归Google所有
　　第一个蓝色的字段是域名的哈希串，对于一个确定的域名来说，这个值是不会改变的。
　　第二个字段（绿色字段）是识别visitor的ID，就是这个绿色字段，标识了不同的访问者，不同的值就意味着不同的访问者。这就是GA能够辨别不同访问者的原因。这个值如果不发生人为地删除cookie的情况的话，两年后才会被替换为一个新的值。
　　第三个字段（紫色字段）是这个visitor第一次访问网站的时间，如果不删除cookie，两年内这个值也不会变。这个时间是UNIX时间，0000000001代表着1970年1月1日0点0分1秒，之后每过一秒，数字加一。实际上UNIX时间是有点小错误的，但是已经不会再对使用产生影响。这里同学们需要注意了。这里以及cookie中其他的UNIX时间记录，构成了GA的整个时间度量系统。时间是这么创造的！
　　第四个字段（浅蓝色字段）是这个visitor前一个visit开始的时间。
　　第五个字段（浅紫色字段）是这个visitor这一次visit开始的时间。
　　第六个字段（最后那个独立数字）太重要了，是记录这个visitor访问网站的次数。
　　现在，再回头看看前面的我的网站（CWA，China Web Analytics，http://www.chinawebanalytics.cn）的utma，大家会发现这个visitor（就是我）已经有6次访问了。
　　通过第六个字段值的增加与否，就能判断GA是否记录某一次访问行为为一次新的visit。

utmz

　　utmz的功能是用来记录网站访问者的来源（即Traffic Source或者Campaign），如下：


　　这里各个字段的含义除了Campaign Number之外就不多解释了，大家肯定能看懂。Campaign Number是指这个访问者通过不同来源（除了直接来源）访问网站的来源数。如果通过了一个新的来源访问了网站，即使是在一个visit之内，campaign number也会加一，但visit并不会增加。
　　Campaign number的作用我并不是很明确，很希望知道的朋友告诉我。我知道的是，如果在一个visit之内，访问者通过多个来源访问了网站，那么GA默认把最后的那个来源归为这个visit的主人。如果你用utm_nooverride=1配置，那么GA则会把第一个来源记录为这个visit的主人。

utmb和utmc

　　utmb和utmc是另外两个重要的cookie信息，在免费版本的HttpWatch中看不到，不过没关系，大家用firebug就能看到。
　　简单讲，utmb和utmc都是记录visit的cookie。两个cookie的区别是，utmb在30分钟后过期，如果utmb过期刷新，那么visit也被刷新。utmc是浏览器关闭则随浏览器一起关闭（失效），再打开浏览器访问那个网站，visit也被刷新。这就是为什么GA的visit在不活动30分钟后结束，以及关闭浏览器结束的原因。

　　好了，讲到这里，可能很多朋友会有恍然大悟的感觉。我希望你们能有这样的感觉，否则我真的应该隐退了。如果您有这样的感觉，一定在留言框中写点儿什么&#8212;&#8212;心得、意见、问题，或者其他什么都可以。
　　出差很忙很累，所以博客发晚了些，请大家原谅。后面是否写写网站分析工具获取数据的原理，看朋友们的反馈咯！
　　11月底了，悉尼已经可以看到圣诞节的气氛，到处都能看到圣诞树，可是这里的圣诞在夏天，感觉实在是太怪了。北京的圣诞节，时有下雪，感觉自然完全不同。预祝朋友们圣诞愉快！
]]></description>
			<content:encoded><![CDATA[<p>　　感谢大家在<a href="http://www.chinawebanalytics.cn/wa-case-study-interaction-1-revenue-target/" target="_blank">上篇文章</a>中的踊跃参与！集体智慧太强大了！我准备整理大家的发言，也加上我的发言，汇集成一个单独的文章。</p>
<p>　　近期又在出差，前几天跟同事学习了一些关于Adobe Omniture Discover的特点，一时激动，在微薄上发了一个帖子，说这是个超级工具，结果受到了大家的普遍兴趣。也许有些言重，但很久没有这么激动的感觉了，若有言语不妥，请朋友们海涵。</p>
<p>　　今天继续度量这个话题，对<a href="http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e6%9c%80%e5%9f%ba%e6%9c%ac%e6%a6%82%e5%bf%b5%ef%bc%882%ef%bc%89%e2%80%94%e2%80%94uv/" target="_blank">Visitor</a>和<a href="http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e6%9c%80%e5%9f%ba%e6%9c%ac%e6%a6%82%e5%bf%b5%ef%bc%881%ef%bc%89%e2%80%94%e2%80%94visit/" target="_blank">Visit</a>进行更深入一点儿的挖掘。这个话题本来是不存在的，但是看到大家对这个系列第一集中关于visitor和visit的一些小疑惑，发现还是值得拿出来再说一说。仍然说它的原因，并不在于让大家死记住这两个度量本身的相关规定，<strong>而是这两个度量涉及了原理、方法和工具，</strong>这些是更有价值的知识。<span id="more-3216"></span></p>
<h3>为什么Visitor和Visit容易让我们疑惑？</h3>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/confusion.jpg"><img align="left" alt="confusion" height="244" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/confusion_thumb.jpg" style="margin: 10px 25px 5px 0px; display: inline" title="confusion" width="192" /></a>　　Visitor让我们疑惑的，值得澄清的地方在于如下几点：</p>
<ul>
<li>Visitor的含义是指访问的人数，但visitor并不可能等同于真正的访问你的网站的自然人的数量。</li>
<li>Visitor与visit和page view这两个度量不同的是，visitor跟时间的粒度（granularity）有关：即使相同的时间长度，时间粒度取的不同，visitor的数量也会不同。</li>
<li>相对而言，利用log file（日志法）对visitor的计数有先天不足，因此visitor这个概念对日志法较少使用。（关于什么是日志法，什么是标记法请看我的这个文章：<a href="http://www.chinawebanalytics.cn/wa-server-logfile-basic-pros-and-cons/">服务器日志法网站分析的原理及优缺点</a>）</li>
</ul>
<p>　　对于上面三点稍作一点儿解释。第一点，visitor的含义是网站的访问人数，是具体的人。可是，并不可能真正知道到底有多少人访问了你的网站。为什么呢？假如你和你的朋友公用一台电脑，而且都用同一个浏览器访问我的博客（<a href="http://www.chinawebanalytics.cn">www.chinawebanalytics.cn</a>, <a href="http://www.cwachina.com">www.cwachina.com</a>)，这个时候用技术的方法来精确分辨出是两个访问者非常困难&mdash;&mdash;总不能在你的电脑上装上一个摄像头窥视吧！因此，无论技术发展到何种程度，我认为<strong>100%准确记录访问网站的人数都是不太可能的，不仅是网站分析的工具难以做到，其他不同方法和不同工具也做不到</strong>（关于网站分析计数准确性的研究，请大家看这篇文章：<a href="http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e6%88%91%e4%bb%ac%e7%9a%84%e6%95%b0%e6%8d%ae%e5%87%86%e7%a1%ae%e5%90%97%ef%bc%9f/">网站分析&mdash;&mdash;我们的数据准确吗？</a>）。<a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/publiccom.jpg"><img align="right" alt="publiccom" height="209" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/publiccom_thumb.jpg" style="margin: 5px 0px 5px 25px; display: inline" title="publiccom" width="248" /></a> 因此，人们采用了一些变通的方法来解决识别visitor数量的问题，我后面会重点讲到。</p>
<p>　　第二点，visitor跟时间的粒度有关。所谓粒度，就是我们所说的截取的时间范围。举个例子，2010年11月14日到11月20日这一周的七天，你在每天都访问了<a href="http://www.chinawebanalytics.cn/" target="_blank">CWA网站</a>一次（感谢这么忠诚的读者。:) ），那么如不同的时间粒度下visitor的计数不同。Weekly visitor是1，而daily visitor则是7。值得注意的是，对于所有的网站分析工具，weekly、monthly或者quarterly、yearly这样的时间粒度都是指日历上的自然周、月或者季度和年。因此，虽然11月24日到11月30日也是七天，而且你分别在这期间的11月25日和11月29日访问了我的<a href="http://www.chinawebanalytics.cn/" target="_blank">CWA网站</a>，weekly visitor仍然会被记录为2。</p>
<p>　　第三点，日志法对于记录visitor的数量是采用分辨IP的方法的。因此，在日志法中，我们常常提到的一个概念是独立IP的数量，并借此指代实际的访问者数量。但是，今天的IP地址已经不可能再跟计算机一一对应了，更不用说跟使用计算机的人一一对应。因此，用这个方法统计visitor的数量存在很大误差，逐渐被人们抛弃掉。</p>
<p>　　相对而言，visit的麻烦其实更多一点：</p>
<ul>
<li>为什么要存在visit？</li>
<li>Visit和session是什么关系？</li>
<li>关闭浏览器窗口对visit的计数有没有影响？</li>
<li>关闭浏览器标签（Tab）对visit的计数有没有影响？</li>
<li>从不同来源访问网站，一定会使这个网站visit的计数增加吗？</li>
<li>Visit和unique page view是什么关系？</li>
</ul>
<p>　　这些问题普遍反映了大家对visit和（标记法）网站分析的疑惑，但实际上，如果我们深入领会了visit的本质，解答这些问题其实很容易。</p>
<p>　　首先，为什么要存在visit？我们说过，网站分析不是分析孤立的数据（这是跟过去网站简单的流量统计有本质的区别的地方），而是分析网站访问者的行为。page view本身是一个个的孤立数据，不能解答网站访问过程中，网页之间的相互关系。例如，我说首页的page view是19,807，网站分析工具频道首页的page view是2,303次，这不能说明首页就一定更受欢迎。<strong>而visit，是指访问者来到网站的一系列打开页面的访问过程，是行为，是联系page view和visitor的桥梁</strong>。Visit这个度量的重要性就在于，它几乎是其他所有网站分析度量的基石，或者直接影响到了其他所有的网站分析度量。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/osilayer.jpg"><img alt="osi-layer" border="0" height="309" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/osilayer_thumb.jpg" style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="osi-layer" width="545" /></a></p>
<p>　　其次，visit和session是什么关系呢？session和visit肯定不完全是一回事，但是你可以认为这二者是一样的名词。因为这涉及到一些历史。session是计算机原理课中的一个名词，即一个&ldquo;会话&rdquo;，如果你学过网络的七层结构模型，你就一定还记得其中有一个session layer&mdash;&mdash;会话层，就是指它。在日志法网站分析中，人们用session来表示一个连结的建立和解除，以用之描述visit。不过，由于标记法网站分析的出现，visit直接采用了别的更好的方法表述（马上也会重点讲到），这样就使session这个名词实际上弃用了，而直接使用visit来表示一次访问行为。当然，session作为技术上的一个名词，是不会被丢掉的，但在网站分析上，人们采用了更符合自然语言的表达。</p>
<p>　　剩下还有几个问题，关于visit的计数，以及visit和unique page view的关系，我会在下面首先跟朋友们解答visit和visitor的计数原理，然后在这个系列的<strong>下一篇</strong>中说明visit和unique page view的区别和联系，因为这一点将要引发出来的课题非常重要。为了弄清楚网站分析工具对于visit和visitor的计数，我们先要搞清楚怎样查看网站分析是否记录到了网站访问者的行为数据。</p>
<h3>怎样查看网站分析工具是否捕捉到了数据</h3>
<p>　　回答这个问题，我们不能靠猜测了，我们要用几种HTTP Sniffer（HTTP数据包嗅探器）工具（其实一般一种就够了，但不妨我们多了解几种）来探测，如同用雷达探测天上的飞机。首先，我推荐一个我最喜欢的工具：</p>
<p><a href="http://httpwatch.com"><img align="left" alt="image" border="0" height="92" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image3.png" style="border-right-width: 0px; margin: 5px 10px 5px 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="image" width="260" /></a> <strong>HttpWatch</strong></p>
<p>　　HttpWatch（<a href="http://www.httpwatch.com/">http://www.httpwatch.com/</a>）肯定不是最强大的，但我觉得是最容易上手的，能够跟IE和火狐很好的整合，并且很稳定。</p>
<p><strong>其他工具</strong></p>
<p>　　然后其他工具大家也可以试试。Charles（<a href="http://www.charlesproxy.com/">www.<b>charles</b>proxy.com/</a>），是最强大的工具。firebug，主要用来查看cookie，这是个免费工具。另外还有WASP（<a href="http://webanalyticssolutionprofiler.com/" title="http://webanalyticssolutionprofiler.com/">http://webanalyticssolutionprofiler.com/</a>），专门用来查验各种网站分析工具的软件。还有httpfox，也是免费的，从firefox的插件库中可以找到，功能也基本上齐全了。</p>
<p>　　如果不想付费，建议装上httpfox（或者基本版的HttpWatch），firebug和WASP（试用版）就足够了。</p>
<p><strong>怎样查看网站分析工具是否捕捉到了数据</strong></p>
<p>　　下面我以HTTPWatch为例，介绍如何查看网站分析工具是否捕获到了数据。对这个部分熟知的朋友直接跳过。</p>
<p>　　1. 在Firefox浏览器空白页中，打开（快键Shift+F2）打开HTTPWatch。</p>
<p>　　2. 启动HTTPWatch的记录模式，即点击下图中的红色框中的红button。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image4.png"><img alt="image" height="260" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image_thumb3.png" style="display: inline" title="image" width="547" /></a></p>
<p>　　3. 在地址栏中输入你要检查的网页URL，打开网页。这个步骤可不需要拘泥于在地址栏中输入URL，你一样可以通过点击外部链接来到这个页面，HTTPWatch仍然会忠实的记录页面打开过程中的HTTP数据包。这时，你可以看到一条条的浏览器传输的数据记录产生了。</p>
<p>&nbsp;<a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image5.png"><img alt="image" height="313" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image_thumb4.png" style="display: block; float: none; margin-left: auto; margin-right: auto" title="image" width="550" /></a>　　请千万不要把这些记录当做是网站服务器的Log记录，这是两回事。</p>
<p>　　4. 上面的数据很多，怎么能看到网站分析工具捕获的数据呢？利用过滤功能就好了。利用快捷键Ctrl+F9，调出过滤器，然后勾选Enabling Filtering，再勾选URL Contains，其下输入&ldquo;-analytics&rdquo;，再点OK之后就过滤出页面中GATC（Google Analytics Tracking Codes）发送的信息，如图所示的两条。如果你的页面上加有多个GA profile ID，那么这个数据也可能是多条。如果过滤之后没有数据了，说明网页没有正常运行GATC，或者没有加入GATC，那当然就是不能完成正常监测啦。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image6.png"><img alt="image" height="353" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image_thumb5.png" style="display: inline" title="image" width="558" /></a></p>
<p><strong>　　对于Omniture SiteCatalyst，在过滤器中输入&ldquo;2o7&rdquo;，就能把只是Omniture Tracking Code发出的监测数据过滤出来。</strong></p>
<p>　　现在，你有了这个好武器，它的用途可不只是让你看看监测代码正常工作了没有。我们下面要用它来检查网站分析工具是如何计数visit和visitor的。</p>
<h3>Visitor和visit如何计数？</h3>
<p>　　你可能会问，上面过滤之后的这两条信息是什么东西？想要搞清楚这个问题，我们得打开另外一个话题，即网站分析工具获取数据的原理。如果大家感兴趣，我会另开一篇帖子，如果没兴趣就算了，反正也不太影响大家直接进行网站分析的实践，在我未来计划（现在还只是计划，实在是忙的对不起大家）的书中会再专门提及。下面我们还是聚焦在网站分析工具如何计数这个问题上。</p>
<p>　　你可以先阅读这个帖子&mdash;&mdash;<span class="Apple-style-span" style="font-family: Arial, Helvetica; line-height: 21px; "><a href="http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e6%9c%80%e5%9f%ba%e6%9c%ac%e6%a6%82%e5%bf%b5%ef%bc%883%ef%bc%89%e2%80%94%e2%80%94%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e5%b7%a5%e5%85%b7%e5%a6%82%e4%bd%95/" style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; padding-top: 0px; padding-right: 0px; padding-bottom: 0px; padding-left: 0px; color: rgb(60, 120, 167); text-decoration: none; ">网站分析工具如何辨别UV</a></span>，然后再继续往下看，一定会有新的收获。<strong>在标记法的网站分析中，除了page view之外，visitor和visit以及一切我们分析报告中显现的度量和计数其实都是通过</strong><a href="http://www.chinawebanalytics.cn/%e6%8d%8d%e5%8d%abcookie%e2%80%94%e2%80%94%e6%b2%a1%e6%9c%89cookie%ef%bc%8c%e6%88%91%e4%bb%ac%e4%bb%80%e4%b9%88%e9%83%bd%e6%b2%a1%e6%9c%89%e4%ba%86/" target="_blank"><strong>cookie</strong></a><strong>实现的</strong>，只有在没有cookie的情况下，才通过其他的方法实现，因此，如果想要搞清楚visitor或者visit到底是如何被网站分析工具记录的，最好的办法是直接看看cookie是怎么记录的。</p>
<p>　　不同网站分析工具cookie记录的方法有所不同，但核心思想是一致的。因此，这里先说说Google Analytics的cookie设置，未来有机会再聊Omniture SiteCatalyst的，因为后者的架构相对更加复杂。</p>
<p><strong>Google Analytics的cookie设置</strong></p>
<p>　　利用HttpWatch，我们点入第二条信息，然后选择&ldquo;Query String&rdquo;标签，在下方的检视窗口中出现了更多的信息。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image7.png"><img alt="image" height="364" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image_thumb6.png" style="display: inline" title="image" width="573" /></a></p>
<p>　　先不管其他信息，我们直接看utmcc，这条记录是GA跟visit和visitor相关的cookie信息。如下：</p>
<blockquote>
<p>utmcc&nbsp;&nbsp;&nbsp; __utma=148702437.1696395432.1289879776.1290424992.1290508917.6;+__utmz=148702437. <br />
		1289882757.1.6.utmcsr=google|utmccn=(organic)|utmcmd=organic|utmctr=%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90;</p>
</blockquote>
<p>　　现在，我们一条条的看这些数据到底是什么意思。</p>
<ul>
<li><strong>utma</strong></li>
</ul>
<p>　　记录visitor的信息，utma后面的信息，包括域的hash值，visitor的ID、访问时间相关信息和访问次数。utma对应的信息，除非人为删除，否则它在两年后才失效。为了免去我自己作图的痛苦，我直接利用了<a href="http://services.google.com/analytics/breeze/en/ga_cookies/index.html" target="_blank">Google转化大学</a>中的图，因此下图中的数字信息跟上面的不一样，但相应信息的含义是完全一样的。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image8.png"><img alt="image" border="0" height="354" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image_thumb7.png" style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="image" width="575" /></a></p>
<p align="center">本图的来源为<a href="http://services.google.com/analytics/breeze/en/ga_cookies/index.html">http://services.google.com/analytics/breeze/en/ga_cookies/index.html</a> <br />
	版权归Google所有</p>
<p align="left">　　第一个蓝色的字段是域名的哈希串，对于一个确定的域名来说，这个值是不会改变的。</p>
<p align="left">　　第二个字段（绿色字段）是识别visitor的ID，就是这个绿色字段，标识了不同的访问者，<strong>不同的值就意味着不同的访问者。这就是GA能够辨别不同访问者的原因。</strong>这个值如果不发生人为地删除cookie的情况的话，两年后才会被替换为一个新的值。</p>
<p align="left">　　第三个字段（紫色字段）是这个visitor第一次访问网站的时间，如果不删除cookie，两年内这个值也不会变。这个时间是UNIX时间，0000000001代表着1970年1月1日0点0分1秒，之后每过一秒，数字加一。实际上UNIX时间是有点小错误的，但是已经不会再对使用产生影响。这里同学们需要注意了。<strong>这里以及cookie中其他的UNIX时间记录，构成了GA的整个时间度量系统</strong>。时间是这么创造的！</p>
<p align="left">　　第四个字段（浅蓝色字段）是这个visitor前一个visit开始的时间。</p>
<p align="left">　　第五个字段（浅紫色字段）是这个visitor这一次visit开始的时间。</p>
<p>　　第六个字段（最后那个独立数字）太重要了，是记录这个visitor访问网站的次数。</p>
<p>　　现在，再回头看看前面的我的网站（CWA，China Web Analytics，<a href="http://www.chinawebanalytics.cn">http://www.chinawebanalytics.cn</a>）的utma，大家会发现这个visitor（就是我）已经有6次访问了。</p>
<p><strong>　　通过第六个字段值的增加与否，就能判断GA是否记录某一次访问行为为一次新的visit。</strong></p>
<ul>
<li><strong>utmz</strong></li>
</ul>
<p>　　utmz的功能是用来记录网站访问者的来源（即Traffic Source或者Campaign），如下：</p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image9.png"><img alt="image" border="0" height="147" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image_thumb8.png" style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="image" width="561" /></a></p>
<p align="right"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image10.png"><img alt="image" border="0" height="122" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image_thumb9.png" style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="image" width="319" /></a></p>
<p>　　这里各个字段的含义除了Campaign Number之外就不多解释了，大家肯定能看懂。Campaign Number是指这个访问者通过不同来源（除了直接来源）访问网站的来源数。如果通过了一个新的来源访问了网站，即使是在一个visit之内，campaign number也会加一，但visit并不会增加。</p>
<p>　　Campaign number的作用我并不是很明确，很希望知道的朋友告诉我。我知道的是，如果在一个visit之内，访问者通过多个来源访问了网站，那么GA默认把最后的那个来源归为这个visit的主人。如果你用utm_nooverride=1配置，那么GA则会把第一个来源记录为这个visit的主人。</p>
<ul>
<li><strong>utmb和utmc</strong></li>
</ul>
<p>　　utmb和utmc是另外两个重要的cookie信息，在免费版本的HttpWatch中看不到，不过没关系，大家用firebug就能看到。</p>
<p>　　简单讲，utmb和utmc都是记录visit的cookie。两个cookie的区别是，utmb在30分钟后过期，如果utmb过期刷新，那么visit也被刷新。utmc是浏览器关闭则随浏览器一起关闭（失效），再打开浏览器访问那个网站，visit也被刷新。这就是为什么GA的visit在不活动30分钟后结束，以及关闭浏览器结束的原因。</p>
<p style="text-align: center; "><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image11.png"><img alt="image" border="0" height="438" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/11/image_thumb10.png" style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="image" width="569" /></a></p>
<p><strong>　　好了，讲到这里，可能很多朋友会有恍然大悟的感觉。我希望你们能有这样的感觉，否则我真的应该隐退了。如果您有这样的感觉，一定在留言框中写点儿什么&mdash;&mdash;心得、意见、问题，或者其他什么都可以。</strong></p>
<p>　　出差很忙很累，所以博客发晚了些，请大家原谅。后面是否写写网站分析工具获取数据的原理，看朋友们的反馈咯！</p>
<p>　　11月底了，悉尼已经可以看到圣诞节的气氛，到处都能看到圣诞树，可是这里的圣诞在夏天，感觉实在是太怪了。北京的圣诞节，时有下雪，感觉自然完全不同。预祝朋友们圣诞愉快！</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/metrics-and-its-back-story-2/feed/</wfw:commentRss>
		<slash:comments>28</slash:comments>
		</item>
		<item>
		<title>线上营销对线下行动效果的监测（下）</title>
		<link>http://www.chinawebanalytics.cn/online-campaign-influence-offline-part-ii/</link>
		<comments>http://www.chinawebanalytics.cn/online-campaign-influence-offline-part-ii/#comments</comments>
		<pubDate>Mon, 25 Oct 2010 04:31:19 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[Featured]]></category>
		<category><![CDATA[网站分析工具]]></category>
		<category><![CDATA[网站分析经验分享]]></category>
		<category><![CDATA[CWA]]></category>
		<category><![CDATA[IWOM]]></category>
		<category><![CDATA[口碑监测]]></category>
		<category><![CDATA[线下效果监测]]></category>
		<category><![CDATA[调研]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=3119</guid>
		<description><![CDATA[【前言】这个问题是我们的QQ群上被最常问起的问题之一，事实上也是我的客户经常问起的问题之一。这是个非常复杂的问题，不在于提出问题本身，而在于解决问题的可行性一直困扰着从业者。这篇文章，将讨论线上营销对线下行动影响的几种类型和目前的解决方法及仍然存在的困扰。这是这个主题的下篇，上篇请见：线上营销对线下行动效果的监测（上）。
【正文】
　　上回文我们说到了线上营销对线下行动效果影响中的两类：awareness和preference，本回我们继续另外两类：Leads和Purchase。监测这两类比起awareness和preference的难度就要大许多了。下面写的，都是我所知的。但我所知有限，也许业界还有更好的解决方法，所以希望朋友们在文后不吝赐教。
追踪购买意向（Leads）
　　追踪购买意向一般有两种方法，一种是线上追踪，即让受众在你的网上直接提交对产品的咨询或购买意愿；另外一种则是线下追踪，即留下电话号码让潜在顾客致电给你。前一种的监测属于典型的网站分析的内容，而不是对线下行动效果的监测，因此本文不再赘述。而后一种在本文中则显得更为重要，不仅仅是因为它是通过线下的方式实现leads的追踪，也是因为它是人与人之间（而不是人与机器之间）的对话，因此它存在作弊的可能性要更小（当然不排除作弊，在这个世界上一切皆有可能），在国内被更为广泛的应用。
如何追踪？
　　线上campaign而使潜在客户致电给你的路径通常如下：
潜在客户 &#8212;&#62; 看到广告/网站上留下的电话&#160;&#8212;&#62;&#160;拨打电话&#160;&#8212;&#62;&#160;产品咨询、提供购买意向或联系方式
　　因此，如果我们能够追踪到受众看到电话号码的源头（是看到哪一个广告或者网站而打来的电话），以及因此带来的效果（产品咨询和购买），那么无疑能够帮我们非常好的评估这些广告或者campaign网站的价值。
　　可是，线下的电话和线上的广告/网站是两个不同的系统，如何做才能让它们产生关联？
　　还记得我之前的文章吗：Direct Traffic真的是直接流量吗？如何辨识真正流量来源？在这个文章中我们提到：



利用多个首页或多个域名


　　在某些情况下，你的网站不是靠网站推广，而是靠线下推广，或者是靠互联网自发的引用和朋友推荐等。这时你已经不再可能为每个源头都做好标记，我们该怎么辨别那些自发的流量？
　　一个好的方法是利用多个首页或者域名来标识。例如，如果我要做我的网站的线下推广，我会呼吁那些看到我线下广告的朋友通过域名&#8220;www.wac.cn&#8221;来访问我的网站(www.chinawebanalytics.cn)，你会发现这两个URL是不同的。如果我有多个线下推广的渠道，比如电视，杂志以及楼宇广告，我会分别给他们不同的域名：&#8220;www.wac.cn/1; www.wac.cn/2; www.wac.cn/3&#8221;来招呼他们&#8212;&#8212;这样尽管我在网站分析工具中的traffic source报告中不能细分他们，但我可以通过top landing page报告来细分他们，尽管不一定是100%纯净，但是已经能够做到相当精确的细分了。这种方法，不但能够帮我们打开Direct Traffic的黑盒子，也是帮助我们间接衡量线下推广的一个好方法。

　　下面这个笑话让我们知道这种方法其实还有很多好用处：

一个追信息泄漏的方法
　　刚看到的一个追信息泄漏的方法，适合广泛推广：注册网站我有个习惯，要求写真名的时候，注册Sina我就填袁新浪，注册Yahoo我就叫袁雅虎，注册Baidu我就写袁百度，注册Google我就改袁谷歌，报税就叫袁穗收。今天接到个电话，问：是袁建设小姐吗？我知道，建行把我的个人资料卖掉了&#8230;&#8230;

　　同样的，如果我们能够给不同的广告和网站上刊登的电话分配不同的号码，那么，我们就能够知道这个电话是顾客看到哪个广告而带来的。但是问题是 ，我们可能要为一次campaign设置非常多的号码！！能做到吗？
　　国内有一个提供相关服务的公司，称为&#8220;离线通&#8221;，完全遵循这一思想。
离线通
　　离线通是一个目前填补线上广告和线下电话联动空白的产品，是一个非常理想的追踪由在线campaign带来销售leads的工具。
　　这个工具利用了电信部门提供的中继线，每条中继线能够支持1,000个电话，因此理论上能够为客户的一次campaign活动提供数千个不同的电话号码，每个电话号码可以分配到每一个campaign的广告或者不同的网页上，以使每个广告都能和一个唯一的电话号码一一对应。这使监测不同广告究竟带来了多少电话，以及带来的这些电话的质量成为可能。
　　在这个思路基础之上，这个产品主要实现了两个功能：其一是能够全面监测到客户电话打入的数量，并由此带来的leads和purchase；其二，则是监测电话的来源，并据此评估营销活动的效率（ROI）和效果（转化，conversion）。因此可以定位它为一个线上线下联动的网络营销监测工具。
　　我提交了试用，得到下图这个工具的dashboard：

　　界面本身模仿了Google的方式，能够显示电话呼叫数据的趋势和平均时长等，与call center能够提供的数据相仿。
　　呼叫来源报告则是更有意义的报告，它显示了电话都是从哪些渠道而来的。我认为，这是这个工具的亮点，似乎更适合放在离线通的dashboard中直接显示出来。


　　搜索营销似乎也支持，但是我没有进行尝试，所以所有的呼叫数据都是&#8220;0&#8221;。但这个功能本身对于进行搜索营销的广告主相当具有意义。

　　另外，这个工具也提供了ROI分析，即投入的广告和最终的产出。这个工具似能支持在线营销本身的成本，例如对搜索营销CPC的记录（但没有了解具体是什么原理，不知道是否要做专门的上传），而通过自己的设定，也能够定义每个电话的价值几何，这个功能与Google Analytics中自己设定达成每个goal所代表的货币价值是类似的。虽然不能够直接捕捉到每个电话带来的purchase的价值，但是自定义的方式仍然有意义，原因在于通过估算后的每个电话的平均价值回报，能够近似代表它们带来的实际收入，毕竟生意是你自己的，你一定能够清楚每个电话背后意味着多少钱。下图是ROI数据界面。

　　下图这个界面是对每个电话价值的自定义。

　　我认为这个工具最大的意义在于解决了呼叫来源的问题，这也是线上营销对线下行动效果监测的核心障碍所在。
其他购买意向的监测
　　除了电话询问，购买意向也可能表现为在线下的门店进行询问，或是邮寄购买意向表等。这些提交leads的方式在信息化的今天，慢慢走向边缘，但仍然没有绝迹。
　　对于这些购买意向的监测，并不是没有办法，最常用的方法是提供网络的优惠码（coupon code），并根据不同的coupon code来定位在线营销的真正来源。不过，信息在线上和线下的转化过程中，会出现模糊和丢失。因此，这个方法可用，但不准确。
　　关于leads的监测，我已知的方法就是上面这些，欢迎朋友们提供更好的方法。
购买（purchase）追踪
　　最后，终于到了我们营销活动最希望看到的结果&#8212;&#8212;购买。做了无数的营销，最后产品没人买，绝对是杯具。不要告诉我最大的茶几是960万平方公里，我相信只要有购买，你的生意天天都是洗具。但，如何追踪purchase是真正来源你做在线营销的结果，而不是因为顾客受到了其他因素的影响呢？
　　这是最根本的问题，也是整个环节中最困难的议题。有3个可用方法。

利用coupon code
利用购买后调查（survey）
利用第三方追踪


Coupon Code
　　Coupon Code的作用与上面的电话追踪的方法非常类似，你可以为你的不同的campaign/广告/网站提供不同的coupon code，而顾客拿这个code去线下购买，能够得到优惠。这样，就能够知道哪些在线来源更能够促进销售。
　　但是问题在于，消费者并不都会记录coupon code（这毕竟是一个麻烦）；另外提供优惠也许是一项代价不菲的成本。
Survey
　　请销售终端帮你统计访问者是通过什么渠道发现你的商品并最终购买是一个常用方法，但效果只能说差强人意。毕竟人们购买完商品之后，还有别的事情，他们一般没有耐心，因此最好你还是能够提供一定的优惠或者折扣。而且，销售终端的执行能力也参差不齐难以管理。你需要有强有力的执行保障。但，这的确是一个常被采用的方法。
　　另外一种survey就是在购买后给客户发送email或者电话的方式survey。对于大宗商品合适，对于小件商品，既是成本，也是对顾客的打扰。
　　两种survey要克服的最后一个敌人是样本量不足。你很难收到数以万计的回复，因此对于问卷的设计更需要精心。
第三方追踪
　　第三方追踪是我最感惊讶的方法，但的确有这个方法，并且据说就在北京有公司能提供服务！思想是，在你进行一次网络营销（campaign）前，就事先抽取大概50~200个合作受众（partner audience），事先不告诉他们任何关于你的背景和产品的信息。然后第三方公司会在你做campaign的过程和之后的一段时间内跟踪这些合作受众的消费行为。
　　这个方法实在是&#8212;&#8212;太强大了！我所说的强大，是指他们真的需要有很好的执行、合作以及记录（监测），这真的是一个大工程！这个方法能做到什么程度？达到了什么效果？我不知道。如果有了解这个方法及这个公司的朋友，请一定要跟我联系，我的email是sxwuda##gmail.com（改##为@）。
方法总结
　　最后，我们总结一下线上营销对线下行动效果监测的方法，如下：

　　好了，这个系列写到这里就告结束了。我希望大家能多提提自己看到的，或者只是思路。因为这个博客，我有分享，所以也得到了很多朋友的分享和指正。比如，之前有朋友指正说control group不是&#8220;控制组&#8221;，而应该翻译成&#8220;对照组&#8221;；还有朋友指出我在统计学上&#8220;一塌糊涂&#8221;，我完全接受，而且正在努力弥补   ；还有朋友告诉我SAS工具实际上也提供网站分析的模型和功能。我都受益匪浅！希望大家知无不言言无不尽，感谢大家！
　　最后一个通知：我们所有的QQ群都已经满了。我会在一周内逐渐清理僵尸用户和不活跃用户，请朋友们稍后再试。谢谢！
]]></description>
			<content:encoded><![CDATA[<p>【前言】这个问题是我们的QQ群上被最常问起的问题之一，事实上也是我的客户经常问起的问题之一。这是个非常复杂的问题，不在于提出问题本身，而在于解决问题的可行性一直困扰着从业者。这篇文章，将讨论线上营销对线下行动影响的几种类型和目前的解决方法及仍然存在的困扰。这是这个主题的下篇，上篇请见：<a href="http://www.chinawebanalytics.cn/online-campaign-influence-offline-part-i/">线上营销对线下行动效果的监测（上）</a>。</p>
<p>【正文】</p>
<p>　　上回文我们说到了线上营销对线下行动效果影响中的两类：awareness和preference，本回我们继续另外两类：Leads和Purchase。<span id="more-3119"></span>监测这两类比起awareness和preference的难度就要大许多了。下面写的，都是我所知的。但我所知有限，也许业界还有更好的解决方法，所以希望朋友们在文后不吝赐教。</p>
<h3>追踪购买意向（Leads）</h3>
<p>　　追踪购买意向一般有两种方法，一种是线上追踪，即让受众在你的网上直接提交对产品的咨询或购买意愿；另外一种则是线下追踪，即留下电话号码让潜在顾客致电给你。前一种的监测属于典型的网站分析的内容，而不是对线下行动效果的监测，因此本文不再赘述。而后一种在本文中则显得更为重要，不仅仅是因为它是通过线下的方式实现leads的追踪，也是因为它是人与人之间（而不是人与机器之间）的对话，因此它存在作弊的可能性要更小（当然不排除作弊，在这个世界上一切皆有可能），在国内被更为广泛的应用。</p>
<p><strong>如何追踪？</strong></p>
<p>　　线上campaign而使潜在客户致电给你的路径通常如下：</p>
<p align="center"><strong>潜在客户 &mdash;&gt; 看到广告/网站上留下的电话&nbsp;</strong><strong>&mdash;&gt;</strong><strong>&nbsp;拨打电话&nbsp;</strong><strong>&mdash;&gt;</strong><strong>&nbsp;产品咨询、提供购买意向或联系方式</strong></p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/image6.png"><img align="left" alt="image" border="0" height="246" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/image_thumb6.png" style="border-bottom: 0px; border-left: 0px; margin: 5px 30px 0px 0px; display: inline; border-top: 0px; border-right: 0px" title="image" width="170" /></a>　　因此，如果我们能够追踪到受众看到电话号码的源头（是看到哪一个广告或者网站而打来的电话），以及因此带来的效果（产品咨询和购买），那么无疑能够帮我们非常好的评估这些广告或者campaign网站的价值。</p>
<p>　　可是，线下的电话和线上的广告/网站是两个不同的系统，如何做才能让它们产生关联？</p>
<p>　　还记得我之前的文章吗：<a href="http://www.chinawebanalytics.cn/direct-traffic%e7%9c%9f%e7%9a%84%e6%98%af%e7%9b%b4%e6%8e%a5%e6%b5%81%e9%87%8f%e5%90%97%ef%bc%9f%e5%a6%82%e4%bd%95%e8%be%a8%e8%af%86%e7%9c%9f%e6%ad%a3%e6%b5%81%e9%87%8f%e6%9d%a5%e6%ba%90%ef%bc%9f/">Direct Traffic真的是直接流量吗？如何辨识真正流量来源？</a>在这个文章中我们提到：</p>
<blockquote>
<ul>
<li>
<h4>利用多个首页或多个域名</h4>
</li>
</ul>
<p>　　在某些情况下，你的网站不是靠网站推广，而是靠线下推广，或者是靠互联网自发的引用和朋友推荐等。这时你已经不再可能为每个源头都做好标记，我们该怎么辨别那些自发的流量？</p>
<p>　　一个好的方法是利用多个首页或者域名来标识。例如，如果我要做我的网站的线下推广，我会呼吁那些看到我线下广告的朋友通过域名&ldquo;www.wac.cn&rdquo;来访问我的网站(<a href="http://www.chinawebanalytics.cn/">www.chinawebanalytics.cn</a>)，你会发现这两个URL是不同的。如果我有多个线下推广的渠道，比如电视，杂志以及楼宇广告，我会分别给他们不同的域名：&ldquo;www.wac.cn/1; www.wac.cn/2; www.wac.cn/3&rdquo;来招呼他们&mdash;&mdash;这样尽管我在网站分析工具中的traffic source报告中不能细分他们，但我可以通过top landing page报告来细分他们，尽管不一定是100%纯净，但是已经能够做到相当精确的细分了。这种方法，不但能够帮我们打开Direct Traffic的黑盒子，也是帮助我们间接衡量线下推广的一个好方法。</p>
</blockquote>
<p>　　下面这个笑话让我们知道这种方法其实还有很多好用处：</p>
<blockquote>
<p align="center"><strong>一个追信息泄漏的方法</strong></p>
<p>　　刚看到的一个追信息泄漏的方法，适合广泛推广：注册网站我有个习惯，要求写真名的时候，注册Sina我就填袁新浪，注册Yahoo我就叫袁雅虎，注册Baidu我就写袁百度，注册Google我就改袁谷歌，报税就叫袁穗收。今天接到个电话，问：是袁建设小姐吗？我知道，建行把我的个人资料卖掉了&hellip;&hellip;</p>
</blockquote>
<p>　　同样的，如果我们能够给不同的广告和网站上刊登的电话分配不同的号码，那么，我们就能够知道这个电话是顾客看到哪个广告而带来的。但是问题是 ，我们可能要为一次campaign设置非常多的号码！！能做到吗？</p>
<p>　　国内有一个提供相关服务的公司，称为<a href="http://www.lixiantong.com/landing/?txsemgid=2" target="_blank">&ldquo;离线通&rdquo;</a>，完全遵循这一思想。</p>
<p><strong>离线通</strong></p>
<p><img align="left" alt="离线通" src="http://www.lixiantong.com/wp-content/uploads/2010/08/lixiantong_logo.png" style="margin: 0px 10px 0px 0px; display: inline" />　　离线通是一个目前填补线上广告和线下电话联动空白的产品，是一个非常理想的追踪由在线campaign带来销售leads的工具。</p>
<p>　　这个工具利用了电信部门提供的中继线，每条中继线能够支持1,000个电话，因此理论上能够为客户的一次campaign活动提供数千个不同的电话号码，每个电话号码可以分配到每一个campaign的广告或者不同的网页上，以使每个广告都能和一个唯一的电话号码一一对应。这使监测不同广告究竟带来了多少电话，以及带来的这些电话的质量成为可能。</p>
<p>　　在这个思路基础之上，这个产品主要实现了两个功能：其一是能够全面监测到客户电话打入的数量，并由此带来的leads和purchase；其二，则是监测电话的来源，并据此评估营销活动的效率（ROI）和效果（转化，conversion）。因此可以定位它为一个线上线下联动的网络营销监测工具。</p>
<p>　　我提交了试用，得到下图这个工具的dashboard：</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/clip_image001.jpg"><img alt="clip_image001" height="555" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/clip_image001_thumb.jpg" style="display: inline" title="clip_image001" width="468" /></a></p>
<p>　　界面本身模仿了Google的方式，能够显示电话呼叫数据的趋势和平均时长等，与call center能够提供的数据相仿。</p>
<p>　　呼叫来源报告则是更有意义的报告，它显示了电话都是从哪些渠道而来的。我认为，这是这个工具的亮点，似乎更适合放在离线通的dashboard中直接显示出来。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/clip_image0017.jpg"><img alt="clip_image001[7]" height="259" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/clip_image0017_thumb.jpg" style="display: inline" title="clip_image001[7]" width="468" /></a></p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/clip_image0019.jpg"><img alt="clip_image001[9]" height="151" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/clip_image0019_thumb.jpg" style="display: inline" title="clip_image001[9]" width="468" /></a></p>
<p>　　搜索营销似乎也支持，但是我没有进行尝试，所以所有的呼叫数据都是&ldquo;0&rdquo;。但这个功能本身对于进行搜索营销的广告主相当具有意义。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/clip_image00111.jpg"><img alt="clip_image001[11]" height="134" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/clip_image00111_thumb.jpg" style="display: inline" title="clip_image001[11]" width="468" /></a></p>
<p>　　另外，这个工具也提供了ROI分析，即投入的广告和最终的产出。这个工具似能支持在线营销本身的成本，例如对搜索营销CPC的记录（但没有了解具体是什么原理，不知道是否要做专门的上传），而通过自己的设定，也能够定义每个电话的价值几何，这个功能与Google Analytics中自己设定达成每个goal所代表的货币价值是类似的。虽然不能够直接捕捉到每个电话带来的purchase的价值，但是自定义的方式仍然有意义，原因在于通过估算后的每个电话的平均价值回报，能够近似代表它们带来的实际收入，毕竟生意是你自己的，你一定能够清楚每个电话背后意味着多少钱。下图是ROI数据界面。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/clip_image00113.jpg"><img alt="clip_image001[13]" height="262" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/clip_image00113_thumb.jpg" style="display: inline" title="clip_image001[13]" width="468" /></a></p>
<p>　　下图这个界面是对每个电话价值的自定义。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/clip_image00115.jpg"><img alt="clip_image001[15]" height="240" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/clip_image00115_thumb.jpg" style="display: inline" title="clip_image001[15]" width="468" /></a></p>
<p>　　我认为这个工具最大的意义在于解决了呼叫来源的问题，这也是线上营销对线下行动效果监测的核心障碍所在。</p>
<p><strong>其他购买意向的监测</strong></p>
<p>　　除了电话询问，购买意向也可能表现为在线下的门店进行询问，或是邮寄购买意向表等。这些提交leads的方式在信息化的今天，慢慢走向边缘，但仍然没有绝迹。</p>
<p>　　对于这些购买意向的监测，并不是没有办法，最常用的方法是提供网络的优惠码（coupon code），并根据不同的coupon code来定位在线营销的真正来源。不过，信息在线上和线下的转化过程中，会出现模糊和丢失。因此，这个方法可用，但不准确。</p>
<p>　　关于leads的监测，我已知的方法就是上面这些，欢迎朋友们提供更好的方法。</p>
<h3>购买（purchase）追踪</h3>
<p>　　最后，终于到了我们营销活动最希望看到的结果&mdash;&mdash;购买。做了无数的营销，最后产品没人买，绝对是杯具。不要告诉我最大的茶几是960万平方公里，我相信只要有购买，你的生意天天都是洗具。但，如何追踪purchase是真正来源你做在线营销的结果，而不是因为顾客受到了其他因素的影响呢？</p>
<p>　　这是最根本的问题，也是整个环节中最困难的议题。有3个可用方法。</p>
<ul>
<li>利用coupon code</li>
<li>利用购买后调查（survey）</li>
<li>利用第三方追踪</li>
</ul>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/image7.png"><img align="right" alt="image" border="0" height="219" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/image_thumb7.png" style="border-bottom: 0px; border-left: 0px; margin: 5px 0px 0px 20px; display: inline; border-top: 0px; border-right: 0px" title="image" width="248" /></a></p>
<p><strong>Coupon Code</strong></p>
<p>　　Coupon Code的作用与上面的电话追踪的方法非常类似，你可以为你的不同的campaign/广告/网站提供不同的coupon code，而顾客拿这个code去线下购买，能够得到优惠。这样，就能够知道哪些在线来源更能够促进销售。</p>
<p>　　但是问题在于，消费者并不都会记录coupon code（这毕竟是一个麻烦）；另外提供优惠也许是一项代价不菲的成本。</p>
<p><strong>Survey</strong></p>
<p>　　请销售终端帮你统计访问者是通过什么渠道发现你的商品并最终购买是一个常用方法，但效果只能说差强人意。毕竟人们购买完商品之后，还有别的事情，他们一般没有耐心，因此最好你还是能够提供一定的优惠或者折扣。而且，销售终端的执行能力也参差不齐难以管理。你需要有强有力的执行保障。但，这的确是一个常被采用的方法。</p>
<p>　　另外一种survey就是在购买后给客户发送email或者电话的方式survey。对于大宗商品合适，对于小件商品，既是成本，也是对顾客的打扰。</p>
<p>　　两种survey要克服的最后一个敌人是样本量不足。你很难收到数以万计的回复，因此对于问卷的设计更需要精心。</p>
<p><strong>第三方追踪</strong></p>
<p>　　第三方追踪是我最感惊讶的方法，但的确有这个方法，并且据说就在北京有公司能提供服务！思想是，在你进行一次网络营销（campaign）前，就事先抽取大概50~200个合作受众（partner audience），事先不告诉他们任何关于你的背景和产品的信息。然后第三方公司会在你做campaign的过程和之后的一段时间内跟踪这些合作受众的消费行为。</p>
<p>　　这个方法实在是&mdash;&mdash;太强大了！我所说的强大，是指他们真的需要有很好的执行、合作以及记录（监测），这真的是一个大工程！这个方法能做到什么程度？达到了什么效果？我不知道。如果有了解这个方法及这个公司的朋友，请一定要跟我联系，我的email是sxwuda##gmail.com（改##为@）。</p>
<h3>方法总结</h3>
<p>　　最后，我们总结一下线上营销对线下行动效果监测的方法，如下：</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/image8.png"><img alt="image" border="0" height="448" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/image_thumb8.png" style="border-bottom: 0px; border-left: 0px; display: inline; border-top: 0px; border-right: 0px" title="image" width="581" /></a></p>
<p><strong>　　好了，这个系列写到这里就告结束了。我希望大家能多提提自己看到的，或者只是思路。因为这个博客，我有分享，所以也得到了很多朋友的分享和指正。比如，之前有朋友指正说control group不是&ldquo;控制组&rdquo;，而应该翻译成&ldquo;对照组&rdquo;；还有朋友指出我在统计学上&ldquo;一塌糊涂&rdquo;，我完全接受，而且正在努力弥补 <img src='http://www.chinawebanalytics.cn/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' />  ；还有朋友告诉我SAS工具实际上也提供网站分析的模型和功能。我都受益匪浅！希望大家知无不言言无不尽，感谢大家！</strong></p>
<p><strong>　　最后一个通知：我们所有的QQ群都已经满了。我会在一周内逐渐清理僵尸用户和不活跃用户，请朋友们稍后再试。谢谢！</strong></p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/online-campaign-influence-offline-part-ii/feed/</wfw:commentRss>
		<slash:comments>30</slash:comments>
		</item>
		<item>
		<title>Sidney的百度统计使用感受</title>
		<link>http://www.chinawebanalytics.cn/baidu-tongji-user-experience/</link>
		<comments>http://www.chinawebanalytics.cn/baidu-tongji-user-experience/#comments</comments>
		<pubDate>Sat, 19 Jun 2010 13:31:17 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[Featured]]></category>
		<category><![CDATA[产业动态]]></category>
		<category><![CDATA[网站分析工具]]></category>
		<category><![CDATA[Google Analytics]]></category>
		<category><![CDATA[百度统计]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=2639</guid>
		<description><![CDATA[　　百度统计终于与大家友好的见面，不再是犹抱琵琶半遮面，也不再只属于百度推广的用户，这是非常有远见的。毕竟CPC广告效果的好坏并不只是搜索引擎自己决定的，网站的优化才是王道。没有转化的网站，每天就是有百万流量又有何用呢？想当年，Google收购Urchin推出Google Analytics也是为此，如今Google Analytics已经成为了世界上最受欢迎的免费网站分析工具。
　　今天，我不得不写写百度统计，一来是在百度工作的Tenly催促我应该关注这个工具；二来，而且是更主要的是，我的博客的百度收录的页数自打百度统计开放以来就从800页左右降到了现在400多页。我想，这是不是给我的一个通牒，警告我不要再只关注国外的那些家伙们了！

　　于是，今天我战战兢兢，诚惶诚恐地谈一谈对于这个工具我的主观感受。请各位看官注意，这是我个人的主观感受，而且我要保持中立，且把我深深的恐惧和怯懦暂藏在脑回沟的深处吧。如果任何表述对百度公司或者百度的朋友带来了不适，我在这里首先道歉，然后企盼不要对我的小站做任何惩罚。
1. 界面风格
　　界面是百度自己的风格，没有看到什么模仿，值得称道。不过，用惯了Google Analytics的朋友可能会有些不适应。主要的感受是在视觉上还有一些杂乱。我认为主要的原因一部分在于汉语本身宋体字本身给人一种杂乱感（运用雅黑之类的优化过的黑体字会有整洁感，现在很多朋友都摒弃了在自己的ppt中使用宋体字）；另外一部分原因在于图形格式、渐变的铺色以及一些小的细节表现上，这些细节其实也造成了视觉的干扰；最后一部分在于报告页面的区块划分不够清晰。例如下面的这个图表的坐标线非常密，但我们在为客户做报告的时候，强调在必要的地方标注数据的实际值，但建议把过分密集的坐标线都去掉，因为这些密线会干扰视觉。

图1：【百度统计】很密的坐标线实际上会让人产生杂乱感

图１：【谷歌分析】同样的趋势线，GA的设计应该是经过了慎重的考虑的
　　对于功能button的应用，百度统计为了突出能点击的性能，使用了渐变色的铺陈，突出可以点击的效果，但其实也对视觉有所干扰。例如下图：

图2：【百度统计】渐变色和文字表现
　　渐变色的采用实际上不符合我的习惯，当然可能大家见仁见智。不过，上图中文字的排列有换行，实际上也影响了视觉感受的一致性。对于文字长短问题，GA实际上很注意，如果文字很长，他们采用了用省略号的方法，但没有换行：

图3：【谷歌分析】超过长度的文字没有换行，而是用省略号代替
　　GA没有让文字换行可能还有一个原因&#8212;&#8212;Google Analytics是浏览器宽度自适应的。调整浏览器的宽度，GA会尽量让你不需要拉动滚动条就观察到所有的报告。这个界面能力非常令人赞赏。
 图4：【谷歌分析】 浏览器宽度自适应&#8212;&#8212;可以很宽

图5：【谷歌分析】 浏览器宽度自适应&#8212;&#8212;也可以很窄，但报告仍然是完整的
　　但百度统计目前没有这个能力，页面不自适应浏览器的宽度，少许情况下对使用有一些影响。
　　报告内子数据区块的划分对用户的使用体验也有直接作用。从报告区块的划分看，Google Analytics显得严禁，任何一个报告都用色块标明明确的区域，而且将加重色块及粗大字体用于子报告的标题，这样能够引导视线更快速的检索。

图6：【谷歌分析】在报告的区块划分上下了功夫
　　而百度统计的报告稍许一筹，例如下图。这并非大的问题，但实际上仍然值得改进。

图7：【百度统计】报告的分块不清晰，视觉引导不明确
　　百度统计的界面肯定还处在完善之中，还有一些小的瑕疵，例如在我的Chrome中（其他浏览器我没有测试），有些功能区域的显示不太正常：

图8：【百度统计】Chrome浏览器中，功能项目出现了错行和换行的情况
　　另外，有些图表的数据显示的反应速度比较慢。我觉得奇怪的是，在&#8220;网站概况&#8221;中，数据显示的反应迅速，但在&#8220;趋势分析&#8221;报告中就很缓慢。是不是用了不同的&#8220;3G图形加速引擎&#8221;所致？:)

图9：【百度统计】这个图表中的数据在鼠标移入后很久才能响应
　　对于人机界面的交互设计，我不是专家，不敢多说，只是谈谈作为一个专业用户的感受。
2. 易用性
　　易用性当然属于人机界面设计的一部分，但是对于网站分析工具而言，易用性则更加重要，所以我决定把它单列出来谈。
　　百度统计给人的第一感觉的确非常简单，当然这个简单跟功能还有待完善有关系（这个后面再谈）。有趣的是，百度统计的网址是http://tongji.baidu.com，比Google Analytics的网址http://analytics.google.com显然更容易被人记住；当然，我的这个博客的网址http://chinawebanalytics.cn也饱受诟病，原因就在analytics这个单词上，不好写，也不好读&#8212;&#8212;大家多担待了。
　　使用百度统计不长时间后的感受是开发团队的确认真在易用性上下功夫。
　　菜单方面，菜单的标题并没有一味模仿Google Analytics，而是采用了更口语化更容易理解的名词。例如，Dashboard这个词被&#8220;网站概况&#8221;代替，这是一个很不错的替代词。其他的例子还如&#8220;升降榜&#8221;、&#8220;回头客&#8221;、&#8220;推介网站&#8221;、&#8220;子目录&#8221;、&#8220;页面上下游&#8221;等（如左图所示）。
　　在一些子报告的标题上，同样使用了自然语言，例如：&#8220;访客用了哪些搜索词&#8221;、&#8220;访客浏览了哪些页面&#8221;，为的也是让用户一目了然。
　　为了不让初用工具的用户糊涂，在&#8220;网站概况&#8221;报告中，访问数（visit）并没有作为默认显示的度量，而是把PV，UV和IP作为默认度量。这样的用意估计是认为Visit可能会让初学者糊涂。
　　在使用提示上也下了功夫，很多地方的提示不错，例如选取时间范围的提示，在GA中如果你选择了添加代码之前的时间，仍然能够让你选择，只不过报告没有任何数据。而百度统计则告诉你在此之前您还没有开通统计功能：

图10：【百度统计】日历提示
　　各子报告中很多地方也有操作提示，这一点很值得称道，不过提示的表现方式似乎不太一致，不知是不是有意为之。

图11：【百度统计】粉色的框内的提示

图12：【百度统计】蓝色的hyperlink文字也是提示，跟上面的提示方式不一致
　　搜索引擎流量来源上的两个按钮（&#8220;收&#8221;和&#8220;趋势&#8221;）让我觉得惊艳，点击搜索引擎的名称进入搜索关键词的子报告后，还能出现新的&#8220;百度指数&#8221;和&#8220;查看搜索来路&#8221;的按钮，看来百度尽量考虑到了整合更多的功能来提升用户效率，不错。
 
图13：【百度统计】搜索引擎报告部分提供了一些快捷的功能
　　Flash的图形界面上，也有亮点，例如图形和数据表格的相互呼应，看得出来用了心。当鼠标放在下图中饼状图的某一个扇区的时候，相应的表格中对应的数据会被高光（highlight）。

图14：【百度统计】鼠标放在&#8220;浙江&#8221;的扇区上，相应浙江的数据会被高光显示
　　这些细节的改进，体现了百度统计的风格，这使我感觉到百度统计的开发团队应该是一群年轻有朝气，愿意尝试创新，且希望创造高质量&#8220;作品&#8221;的同事所作，而且开发团队一定有女生，一定。:)
　　不过（我想这个转折很重要），易用性除了在细节上的下功夫之外，强调整体风格和引导用户固定操作习惯也非常重要，甚至更加重要，因为这决定了用户的使用效率。这些方面百度统计做的怎么样呢？
　　我的感觉是，总体尚佳，但存在一些不一致现象，可能会让用户产生困扰。
　　例如，在我点击&#8220;搜索词&#8221;报告的时候，默认的数据展现的是两天数据的对比表格。可是当我再次点击&#8220;今天&#8221;或者再点击了其他报告之后再回头看&#8220;搜索词&#8221;报告的时候，默认出现的数据展现竟然拿又变了，两天的对比数据不见了，就变成了当天的数据。

图15：【百度统计】点击报告项目后，默认的报告不一致，似乎是随机出现。上图为随机出现的两天对比数据

图16：【百度统计】点击报告项目后，默认的报告不一致，似乎是随机出现。上图为随机出现的&#8220;今天&#8221;的数据，而两天对比的数据不见了
　　不一致的默认数据报告着实让我疑惑，是不是百度的同事有意为之？由于这种情况，用户可能会问这个问题：我如何能够自由切换两种方式，或问：我如何能够轻松地做到昨天和今天的对比？
　　此外，图15中显示了另外一种不易用的情况&#8212;&#8212;由于不能自适应浏览器宽度，因此报告的数据列需要拉动滚动条才能完全显示，显得不够专业。
　　一致性不足还表现在&#8220;网站概况&#8221;数据报告上，这个报告的一部分子报告并不随着你改变时间范围选择而发生相应的改变。也就是说，无论你点击下图中的&#8220;今天&#8221;、&#8220;昨天&#8221;、&#8220;最近7天&#8221;还是&#8220;最近30天&#8221;，下面饼状图的数据都始终保持是&#8220;昨日数据&#8221;，这一点令我费解，但似乎也是有意为之。但是这样的话，Dashboard的意义就大打折扣了。
　　百度统计给出的解决之道似乎是增加一个左下角&#8220;查看完整报告&#8221;按钮，但当你查看细节的时候，想通过&#8220;网站概况&#8221;对网站的整体把握的预期就无法实现了。

图17：【百度统计】&#8220;网站概况&#8221;报告的数据在时间上没能保持一致
　　不一致会影响易用性，并不是严重问题，但还需要改进。
3. 基本功能
　　功能是我最关注的，没好功能，工具包装的再好也没用。百度统计的功能如何？我不能违心说它是强大的，但是我必须说它是有针对性。下面我们具体看看它的功能情况。
基本流量功能：较好
　　最基础的流量监测功能很完善，而且采取了&#8220;中外结合&#8221;的策略。除了国外普遍采用的visit，UV，PV等度量外，也引入了具有中国特色的IP作为一个计算流量的单位。在时间上，可以自由选定时间范围，也可以根据预置的粒度（Granularity），按照以日、周和月进行细分。

　　流量的基本功能没有什么可多说的，各大网站分析工具都做的不错。值得一提的是，百度统计和GA的流量数据非常接近。因为我的百度统计的代码在GA之下，所以数据相对略少&#8212;&#8212;处于非常正常的状态。
搜索流量来源统计功能：较好
　　我说过百度统计是有特点的，这个特点来自于对于网站流量来源的统计上，或者更确切的说是来自于对于搜索流量的统计上&#8212;&#8212;百度对于自己的家伙事儿，的确没有含糊。
　　在搜索引擎流量上，百度的创造在于：


集合了被监测网站的&#8220;站点收录情况&#8221;链接；


集合了关键词的&#8220;百度指数&#8221;链接；


直接在系统中集成了&#8220;提示相关关键词&#8221;的功能；


集合了查看来路URL功能，上面有关键词在搜索结果的第几页的提示；


直接按照搜索词为维度细分各搜索引擎的贡献；


 
　　由于集成了百度自己的一些其他的主打产品，因此搜索流量来源统计功能对于进行SEO会有不错的帮助。
　　但是，必须要指出的不足是，没有看到类似于AdWords集成到GA中的功能，因此看不到关键词的花费，这使直接进行ROI分析变的不可能。相信百度统计未来一定会集成这个功能，毕竟这是百度安身立命的关键，如果没有这个功能，系统存在的意义就会大打折扣。
　　可以说，搜索流量来源统计功能是百度统计中间亮点最多的，而且似乎也是这个系统的最核心部分。
其他来源分析功能：中规中矩
　　对于非搜索引擎流量来源的数据分析，百度统计的表现中规中矩。由于没有像GA一样默认把各流量来源的新访问者流量所占整体流量的比例集合进去，因此相比GA的功能还是略弱。百度统计也开发了类似GA的UTM link tag的流量来源标记监测功能，这个功能非常实用。

图18：【百度统计】 流量来源标签制作工具
　　从监测到的数值来看，对我的博客（http://www.chinawebanalytics.cn）在百度统计中Direct Traffic（直接流量）所占总体的比例比Google Analytics统计到的要更多（大约多了20个百分点），这可能意味着百度统计没有抓取到部分流量的实际来源。
 
图19：百度统计统计到的直接流量大约比GA统计到的多20个百分点
页面分析：不佳
　　页面分析这个功能我认为还需要很多的调整和完善。
　　首先让我觉得遗憾的是，对于页面的上下游功能不能自动实现，还需要额外的添加代码，这让我觉得非常意外。
 图20：【百度统计】页面上下游功能很遗憾不能自动实现
　　而&#8220;最常访问&#8221;和&#8220;入口页面&#8221;两个报告似乎没有区别。我想百度统计专门列出&#8220;入口页面&#8221;这一项的原因其实是把&#8220;最常访问&#8221;的页面中不属于入口页面的那些页面去掉。但事实上，我认为两种页面的分析侧重点是不同的，入口页面更强调的是bounce rate，而非exit rate。这里，如果我们回头看看GA的设置，就会明白GA为什么为entry page这个报告安排了完全不同于top content报告的度量。所以，我认为这个地方可能是百度统计没有很好的领会landing page的实际意义和分析侧重。
 图：21：【百度统计】入口页面仍然用exit rate（退出率）作为metric令人意外
　　另外，百度统计好像没有提供类似于GA的site overlay的热图功能。不过这个功能在GA上也完全属于鸡肋。用好这个功能最终还是需要自己DIY。
路径分析：极弱
　　由于百度统计需要额外增加监测代码才能实现上下游分析，而且最多只能实现20个页面的分析，因此页面之间的路径分析是非常疲弱的。

图22：【百度统计】 只能统计最多20个页面之间的上下游？这个功能有些形同虚设了
　　路径分析需要有很好的服务器支持，百度这一块应该不是问题，那么问题是不是出在算法的优化上？因为路径分析的数据分析量随着页面数量的增加是呈指数级增加的。
转化分析：较弱
　　转化分析这块，因为百度统计是完全模仿Google Analytics的，而Google Analytics作为一个免费软件，在路径和转化的分析上实际上已经相当孱弱，因此这个领域也肯定不是百度统计的强项。功能实现上百度统计和GA几乎一样，如下图：
 图23：【百度统计】自己可以设置转化目标和步骤，每个目标之前可以支持9个步骤
电子商务分析：无此功能
　　电子商务分析的功能没有，无法置评。
用户分析：中
　　最后看看用户分析。用户客户端的技术情况比较容易获得，这部分中规中矩。比较弱的是对用户新旧度和忠诚度（loyalty，即回访次数，以及recency）的监测，只能看当天回头客，且不提供新旧访问者的比例。这部分监测仍然属于基本监测范围，但是同页面的路径分析一样，需要更强大的算法进行优化才能获得更准确和更完整的数据，也才不会拖垮服务器。我想可能是因为这个原因，目前这部分还无法很好的提供。

图24：【百度统计】这个报告的默认页面直接被推到了在升级中的&#8220;访问频次&#8221;，结果造成这个报告看起来像是无法提供数据，但实际上点击其他的&#8220;访问特征&#8221;，你能够看到报告数据。另外&#8220;访问页数&#8221;和&#8220;访问深度&#8221;之间的差异是什么？为何需要严格区分？
　　总体这部分功能还处于需要进一步完善的状态之中。我认为，能够任意截取时间长度分析loyalty和新旧访客之间的比例是需要增加的基础功能。
　　值得一提的是&#8220;趋势分析&#8221;中有一个&#8220;最新访客&#8221;报告（我认为它应该归属到&#8220;访客分析&#8221;这个区隔去），这个报告是GA中找不到的。

图25：【百度统计】相当有意思的&#8220;最新访客&#8221;报告
　　这个报告统计了每一个最近访问者的相关信息，以及他们进行的行动，很有意思。但是，可能是我学识尚浅，没有想好这个功能有什么用。网站分析极少进行微观数据的分析，更强调从大量用户行为中归类出普遍的或者是代表性的行为模式，类似于数理统计中的&#8220;聚类分析&#8221;。我之前也看到了不少追踪个体用户鼠标轨迹的网站分析工具。相对而言，这些工具因为提供了个体，而无整体，所以分析的难度极大。这也是我一直认为热图比鼠标轨迹图更有意义的原因。在这一点上，很希望听到朋友们的看法。你们将会如何发挥这个报告的价值？
4. 自定义能力
　　由于目前的功能还比较基础，百度统计还谈不上自定义功能。自定义报告和自定义度量功能均没有。唯一出现自定义的地方是&#8220;自定义指标&#8221;。但是，实际上这并非自定义，只能称得上&#8220;自选取&#8221;。

　　不过，对于国内的大部分用户来说，自定义报告和自定义报告这两个功能可能也意义不大。百度统计只要能满足大量普通站长的需求就已经足够了。
5. 其他
　　最后还想简单谈一下百度统计中的数据展现方式。百度统计在数据图形的自定义上功能尚弱，报告的图形是固定的。
　　在不同时间的数据对比的展现上，还不够让人觉得清爽，而且默认按小时细分，这个默认设定值得商榷。GA方面，它运用了差异着色的方式解决这个问题，看起来稍微舒服一些。

图26：【百度统计】数据展示方式有改进余地
&#160;
总结
　　第一次详细写一个国内的网站分析工具，还是很费力的。最近身体又跟我闹别扭了，而且，而且心情似也不佳。总之，又写了这么长的文章不易，如果有任何不妥的地方，no offense to anyone，还请百度和各位朋友海涵。
　　关于百度统计，这一次完全开放，给我的感觉整体不能说惊艳，但是确实能体会到团队的认真和辛劳。网站分析工具过去是流量监控工具，其实开发起来相对容易，但是随着网站分析的发展，越来越从流量监测转化为行为监测，这就使网站分析工具的开发难度大大加大了。
　　百度统计的特点很明显，在于对于搜索引擎流量来源地监测和数据提供上，整合了自家的优势资源，所以理所应当的会获得相当部分SEM和SEO用户的认可。而在其他方面，例如对于电子商务网站比较强调的路径和转化，的确还差强人意，有待强化。另外ROI功能没有实现也是一个遗憾，但相信不久之后就能弥补。自定义功能还需要补充进来，以实现更多维度的细分分析，毕竟细分是网站分析中重要的一个内容。
　　最后，一句话的感觉是，有了一个不错的开头，后面还有很多细化的工作要做。加油！
&#160;
题后：如有任何问题或者任何表述不当的地方，敬请告知。任何朋友有任何自己的感受，也欢迎留言！
]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image7.png"><img align="left" alt="image" border="0" height="74" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb6.png" style="border-bottom: 0px; border-left: 0px; margin: 0px 10px 5px 0px; display: inline; border-top: 0px; border-right: 0px" title="image" width="165" /></a>　　百度统计终于与大家友好的见面，不再是犹抱琵琶半遮面，也不再只属于百度推广的用户，这是非常有远见的。毕竟CPC广告效果的好坏并不只是搜索引擎自己决定的，网站的优化才是王道。没有转化的网站，每天就是有百万流量又有何用呢？想当年，Google收购Urchin推出Google Analytics也是为此，如今Google Analytics已经成为了世界上最受欢迎的免费网站分析工具。</p>
<p>　　今天，我不得不写写百度统计，一来是在百度工作的Tenly催促我应该关注这个工具；二来，而且是更主要的是，我的博客的百度收录的页数自打百度统计开放以来就从800页左右降到了现在400多页。我想，这是不是给我的一个通牒，警告我不要再只关注国外的那些家伙们了！</p>
<p><span id="more-2639"></span></p>
<p>　　于是，今天我战战兢兢，诚惶诚恐地谈一谈对于这个工具我的主观感受。请各位看官注意，这是我个人的主观感受，而且我要保持中立，且把我深深的恐惧和怯懦暂藏在脑回沟的深处吧。如果任何表述对百度公司或者百度的朋友带来了不适，我在这里首先道歉，然后企盼不要对我的小站做任何惩罚。</p>
<h3>1. 界面风格</h3>
<p>　　界面是百度自己的风格，没有看到什么模仿，值得称道。不过，用惯了Google Analytics的朋友可能会有些不适应。主要的感受是在视觉上还有一些杂乱。我认为主要的原因一部分在于汉语本身宋体字本身给人一种杂乱感（运用雅黑之类的优化过的黑体字会有整洁感，现在很多朋友都摒弃了在自己的ppt中使用宋体字）；另外一部分原因在于图形格式、渐变的铺色以及一些小的细节表现上，这些细节其实也造成了视觉的干扰；最后一部分在于报告页面的区块划分不够清晰。例如下面的这个图表的坐标线非常密，但我们在为客户做报告的时候，强调在必要的地方标注数据的实际值，但建议把过分密集的坐标线都去掉，因为这些密线会干扰视觉。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image8.png"><img alt="image" border="0" height="140" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb7.png" style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="image" width="504" /></a></p>
<p align="center">图1：【百度统计】很密的坐标线实际上会让人产生杂乱感</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image9.png"><img alt="image" border="0" height="111" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb8.png" style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="image" width="508" /></a></p>
<p align="center">图１：【谷歌分析】同样的趋势线，GA的设计应该是经过了慎重的考虑的</p>
<p align="left">　　对于功能button的应用，百度统计为了突出能点击的性能，使用了渐变色的铺陈，突出可以点击的效果，但其实也对视觉有所干扰。例如下图：</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image10.png"><img alt="image" border="0" height="73" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb9.png" style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="image" width="535" /></a></p>
<p align="center">图2：【百度统计】渐变色和文字表现</p>
<p align="left">　　渐变色的采用实际上不符合我的习惯，当然可能大家见仁见智。不过，上图中文字的排列有换行，实际上也影响了视觉感受的一致性。对于文字长短问题，GA实际上很注意，如果文字很长，他们采用了用省略号的方法，但没有换行：</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image11.png"><img alt="image" border="0" height="54" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb10.png" style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="image" width="425" /></a></p>
<p align="center">图3：【谷歌分析】超过长度的文字没有换行，而是用省略号代替</p>
<p align="left">　　GA没有让文字换行可能还有一个原因&mdash;&mdash;Google Analytics是浏览器宽度自适应的。调整浏览器的宽度，GA会尽量让你不需要拉动滚动条就观察到所有的报告。这个界面能力非常令人赞赏。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image12.png"><img alt="image" height="314" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb11.png" style="display: block; float: none; margin-left: auto; margin-right: auto" title="image" width="564" /></a> 图4：【谷歌分析】 浏览器宽度自适应&mdash;&mdash;可以很宽</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image13.png"><img alt="image" height="320" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb12.png" style="display: inline" title="image" width="295" /></a></p>
<p align="center">图5：【谷歌分析】 浏览器宽度自适应&mdash;&mdash;也可以很窄，但报告仍然是完整的</p>
<p align="left">　　但百度统计目前没有这个能力，页面不自适应浏览器的宽度，少许情况下对使用有一些影响。</p>
<p align="left">　　报告内子数据区块的划分对用户的使用体验也有直接作用。从报告区块的划分看，Google Analytics显得严禁，任何一个报告都用色块标明明确的区域，而且将加重色块及粗大字体用于子报告的标题，这样能够引导视线更快速的检索。</p>
<p align="center"><img alt="image" height="357" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image14.png" style="display: inline" title="image" width="343" /></p>
<p align="center">图6：【谷歌分析】在报告的区块划分上下了功夫</p>
<p align="left">　　而百度统计的报告稍许一筹，例如下图。这并非大的问题，但实际上仍然值得改进。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image15.png"><img alt="image" height="346" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb13.png" style="display: inline" title="image" width="345" /></a></p>
<p align="center">图7：【百度统计】报告的分块不清晰，视觉引导不明确</p>
<p align="left">　　百度统计的界面肯定还处在完善之中，还有一些小的瑕疵，例如在我的Chrome中（其他浏览器我没有测试），有些功能区域的显示不太正常：</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image16.png"><img alt="image" height="96" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb14.png" style="display: inline" title="image" width="582" /></a></p>
<p align="center">图8：【百度统计】Chrome浏览器中，功能项目出现了错行和换行的情况</p>
<p align="left">　　另外，有些图表的数据显示的反应速度比较慢。我觉得奇怪的是，在&ldquo;网站概况&rdquo;中，数据显示的反应迅速，但在&ldquo;趋势分析&rdquo;报告中就很缓慢。是不是用了不同的&ldquo;3G图形加速引擎&rdquo;所致？:)</p>
<p align="left"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image17.png"><img alt="image" height="150" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb15.png" style="display: block; float: none; margin-left: auto; margin-right: auto" title="image" width="448" /></a></p>
<p align="center">图9：【百度统计】这个图表中的数据在鼠标移入后很久才能响应</p>
<p align="left">　　对于人机界面的交互设计，我不是专家，不敢多说，只是谈谈作为一个专业用户的感受。</p>
<h3>2. 易用性</h3>
<p>　　易用性当然属于人机界面设计的一部分，但是对于网站分析工具而言，易用性则更加重要，所以我决定把它单列出来谈。</p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image18.png"><img align="left" alt="image" height="465" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb16.png" style="margin: 0px 10px 5px 0px; display: inline" title="image" width="111" /></a>　　百度统计给人的第一感觉的确非常简单，当然这个简单跟功能还有待完善有关系（这个后面再谈）。有趣的是，百度统计的网址是<a href="http://tongji.baidu.com">http://tongji.baidu.com</a>，比Google Analytics的网址<a href="http://analytics.google.com">http://analytics.google.com</a>显然更容易被人记住；当然，我的这个博客的网址<a href="http://chinawebanalytics.cn">http://chinawebanalytics.cn</a>也饱受诟病，原因就在analytics这个单词上，不好写，也不好读&mdash;&mdash;大家多担待了。</p>
<p>　　使用百度统计不长时间后的感受是开发团队的确认真在易用性上下功夫。</p>
<p>　　菜单方面，菜单的标题并没有一味模仿Google Analytics，而是采用了更口语化更容易理解的名词。例如，Dashboard这个词被&ldquo;网站概况&rdquo;代替，这是一个很不错的替代词。其他的例子还如&ldquo;升降榜&rdquo;、&ldquo;回头客&rdquo;、&ldquo;推介网站&rdquo;、&ldquo;子目录&rdquo;、&ldquo;页面上下游&rdquo;等（如左图所示）。</p>
<p>　　在一些子报告的标题上，同样使用了自然语言，例如：&ldquo;访客用了哪些搜索词&rdquo;、&ldquo;访客浏览了哪些页面&rdquo;，为的也是让用户一目了然。</p>
<p>　　为了不让初用工具的用户糊涂，在&ldquo;网站概况&rdquo;报告中，访问数（visit）并没有作为默认显示的度量，而是把PV，UV和IP作为默认度量。这样的用意估计是认为Visit可能会让初学者糊涂。</p>
<p>　　在使用提示上也下了功夫，很多地方的提示不错，例如选取时间范围的提示，在GA中如果你选择了添加代码之前的时间，仍然能够让你选择，只不过报告没有任何数据。而百度统计则告诉你在此之前您还没有开通统计功能：</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image19.png"><img alt="image" height="198" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb17.png" style="display: inline" title="image" width="406" /></a></p>
<p align="center">图10：【百度统计】日历提示</p>
<p>　　各子报告中很多地方也有操作提示，这一点很值得称道，不过提示的表现方式似乎不太一致，不知是不是有意为之。</p>
<p align="center"><img alt="image" height="108" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image20.png" style="display: inline" title="image" width="463" /></p>
<p align="center">图11：【百度统计】粉色的框内的提示</p>
<p align="center"><img alt="image" height="48" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image21.png" style="display: inline" title="image" width="494" /></p>
<p align="center">图12：【百度统计】蓝色的hyperlink文字也是提示，跟上面的提示方式不一致</p>
<p align="left">　　搜索引擎流量来源上的两个按钮（&ldquo;收&rdquo;和&ldquo;趋势&rdquo;）让我觉得惊艳，点击搜索引擎的名称进入搜索关键词的子报告后，还能出现新的&ldquo;百度指数&rdquo;和&ldquo;查看搜索来路&rdquo;的按钮，看来百度尽量考虑到了整合更多的功能来提升用户效率，不错。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image22.png"><img alt="image" height="244" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb18.png" style="display: inline" title="image" width="187" /></a> <a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image23.png"><img alt="image" height="243" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb19.png" style="display: inline" title="image" width="283" /></a></p>
<p align="center">图13：【百度统计】搜索引擎报告部分提供了一些快捷的功能</p>
<p align="left">　　Flash的图形界面上，也有亮点，例如图形和数据表格的相互呼应，看得出来用了心。当鼠标放在下图中饼状图的某一个扇区的时候，相应的表格中对应的数据会被高光（highlight）。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image24.png"><img alt="image" height="238" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb20.png" style="display: inline" title="image" width="244" /></a></p>
<p align="center">图14：【百度统计】鼠标放在&ldquo;浙江&rdquo;的扇区上，相应浙江的数据会被高光显示</p>
<p align="left">　　这些细节的改进，体现了百度统计的风格，这使我感觉到百度统计的开发团队应该是一群年轻有朝气，愿意尝试创新，且希望创造高质量&ldquo;作品&rdquo;的同事所作，而且开发团队一定有女生，一定。:)</p>
<p align="left">　　不过（我想这个转折很重要），易用性除了在细节上的下功夫之外，强调整体风格和引导用户固定操作习惯也非常重要，甚至更加重要，因为这决定了用户的使用效率。这些方面百度统计做的怎么样呢？</p>
<p align="left">　　我的感觉是，总体尚佳，但存在一些不一致现象，可能会让用户产生困扰。</p>
<p align="left">　　例如，在我点击&ldquo;搜索词&rdquo;报告的时候，默认的数据展现的是两天数据的对比表格。可是当我再次点击&ldquo;今天&rdquo;或者再点击了其他报告之后再回头看&ldquo;搜索词&rdquo;报告的时候，默认出现的数据展现竟然拿又变了，两天的对比数据不见了，就变成了当天的数据。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image25.png"><img alt="image" height="362" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb21.png" style="display: inline" title="image" width="460" /></a></p>
<p align="center">图15：【百度统计】点击报告项目后，默认的报告不一致，似乎是随机出现。上图为随机出现的两天对比数据</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image26.png"><img alt="image" height="283" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb22.png" style="display: inline" title="image" width="464" /></a></p>
<p align="center">图16：【百度统计】点击报告项目后，默认的报告不一致，似乎是随机出现。上图为随机出现的&ldquo;今天&rdquo;的数据，而两天对比的数据不见了</p>
<p align="left">　　不一致的默认数据报告着实让我疑惑，是不是百度的同事有意为之？由于这种情况，用户可能会问这个问题：我如何能够自由切换两种方式，或问：我如何能够轻松地做到昨天和今天的对比？</p>
<p align="left">　　此外，图15中显示了另外一种不易用的情况&mdash;&mdash;由于不能自适应浏览器宽度，因此报告的数据列需要拉动滚动条才能完全显示，显得不够专业。</p>
<p align="left">　　一致性不足还表现在&ldquo;网站概况&rdquo;数据报告上，这个报告的一部分子报告并不随着你改变时间范围选择而发生相应的改变。也就是说，无论你点击下图中的&ldquo;今天&rdquo;、&ldquo;昨天&rdquo;、&ldquo;最近7天&rdquo;还是&ldquo;最近30天&rdquo;，下面饼状图的数据都始终保持是&ldquo;昨日数据&rdquo;，这一点令我费解，但似乎也是有意为之。但是这样的话，Dashboard的意义就大打折扣了。</p>
<p align="left">　　百度统计给出的解决之道似乎是增加一个左下角&ldquo;查看完整报告&rdquo;按钮，但当你查看细节的时候，想通过&ldquo;网站概况&rdquo;对网站的整体把握的预期就无法实现了。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image27.png"><img alt="image" height="457" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb23.png" style="display: inline" title="image" width="480" /></a></p>
<p align="center">图17：【百度统计】&ldquo;网站概况&rdquo;报告的数据在时间上没能保持一致</p>
<p align="left">　　不一致会影响易用性，并不是严重问题，但还需要改进。</p>
<h3>3. 基本功能</h3>
<p align="left">　　功能是我最关注的，没好功能，工具包装的再好也没用。百度统计的功能如何？我不能违心说它是强大的，但是我必须说它是有针对性。下面我们具体看看它的功能情况。</p>
<p align="left"><span style="color:#800080;"><strong>基本流量功能：较好</strong></span></p>
<p align="left">　　最基础的流量监测功能很完善，而且采取了&ldquo;中外结合&rdquo;的策略。除了国外普遍采用的visit，UV，PV等度量外，也引入了具有中国特色的IP作为一个计算流量的单位。在时间上，可以自由选定时间范围，也可以根据预置的粒度（Granularity），按照以日、周和月进行细分。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image28.png"><img alt="image" border="0" height="25" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb24.png" style="border-bottom: 0px; border-left: 0px; display: inline; border-top: 0px; border-right: 0px" title="image" width="296" /></a></p>
<p align="left">　　流量的基本功能没有什么可多说的，各大网站分析工具都做的不错。值得一提的是，百度统计和GA的流量数据非常接近。因为我的百度统计的代码在GA之下，所以数据相对略少&mdash;&mdash;处于非常正常的状态。</p>
<p align="left"><span style="color:#800080;"><strong>搜索流量来源统计功能：较好</strong></span></p>
<p align="left">　　我说过百度统计是有特点的，这个特点来自于对于网站流量来源的统计上，或者更确切的说是来自于对于搜索流量的统计上&mdash;&mdash;百度对于自己的家伙事儿，的确没有含糊。</p>
<p align="left">　　在搜索引擎流量上，百度的创造在于：</p>
<ol>
<li>
<div align="left">集合了被监测网站的&ldquo;站点收录情况&rdquo;链接；</div>
</li>
<li>
<div align="left">集合了关键词的&ldquo;百度指数&rdquo;链接；</div>
</li>
<li>
<div align="left">直接在系统中集成了&ldquo;提示相关关键词&rdquo;的功能；</div>
</li>
<li>
<div align="left">集合了查看来路URL功能，上面有关键词在搜索结果的第几页的提示；</div>
</li>
<li>
<div align="left">直接按照搜索词为维度细分各搜索引擎的贡献；</div>
</li>
</ol>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image29.png"><img alt="image" border="0" height="25" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb25.png" style="border-bottom: 0px; border-left: 0px; display: inline; border-top: 0px; border-right: 0px" title="image" width="244" /></a> <a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image30.png"><img alt="image" border="0" height="25" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb26.png" style="border-bottom: 0px; border-left: 0px; display: inline; border-top: 0px; border-right: 0px" title="image" width="179" /></a></p>
<p align="left">　　由于集成了百度自己的一些其他的主打产品，因此搜索流量来源统计功能对于进行SEO会有不错的帮助。</p>
<p align="left">　　但是，必须要指出的不足是，没有看到类似于AdWords集成到GA中的功能，因此看不到关键词的花费，这使直接进行ROI分析变的不可能。相信百度统计未来一定会集成这个功能，毕竟这是百度安身立命的关键，如果没有这个功能，系统存在的意义就会大打折扣。</p>
<p align="left"><strong>　　可以说，搜索流量来源统计功能是百度统计中间亮点最多的，而且似乎也是这个系统的最核心部分。</strong></p>
<p align="left"><span style="color:#800080;"><strong>其他来源分析功能：中规中矩</strong></span></p>
<p align="left">　　对于非搜索引擎流量来源的数据分析，百度统计的表现中规中矩。由于没有像GA一样默认把各流量来源的新访问者流量所占整体流量的比例集合进去，因此相比GA的功能还是略弱。百度统计也开发了类似GA的UTM link tag的流量来源标记监测功能，这个功能非常实用。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image31.png"><img alt="image" border="0" height="484" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb27.png" style="border-bottom: 0px; border-left: 0px; display: inline; border-top: 0px; border-right: 0px" title="image" width="573" /></a></p>
<p align="center">图18：【百度统计】 流量来源标签制作工具</p>
<p align="left">　　从监测到的数值来看，对我的博客（<a href="http://www.chinawebanalytics.cn">http://www.chinawebanalytics.cn</a>）在百度统计中Direct Traffic（直接流量）所占总体的比例比Google Analytics统计到的要更多（大约多了20个百分点），这可能意味着<strong>百度统计没有抓取到部分流量的实际来源</strong>。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image32.png"><img alt="image" border="0" height="157" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb28.png" style="border-bottom: 0px; border-left: 0px; display: inline; border-top: 0px; border-right: 0px" title="image" width="259" /></a> <a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image33.png"><img alt="image" border="0" height="160" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb29.png" style="border-bottom: 0px; border-left: 0px; display: inline; border-top: 0px; border-right: 0px" title="image" width="237" /></a></p>
<p align="center">图19：百度统计统计到的直接流量大约比GA统计到的多20个百分点</p>
<p align="left"><span style="color:#800080;"><strong>页面分析：不佳</strong></span></p>
<p align="left">　　页面分析这个功能我认为还需要很多的调整和完善。</p>
<p align="left">　　首先让我觉得遗憾的是，对于页面的上下游功能不能自动实现，还需要额外的添加代码，这让我觉得非常意外。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image34.png"><img alt="image" height="247" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb30.png" style="display: block; float: none; margin-left: auto; margin-right: auto" title="image" width="590" /></a> 图20：【百度统计】页面上下游功能很遗憾不能自动实现</p>
<p align="left">　　而&ldquo;最常访问&rdquo;和&ldquo;入口页面&rdquo;两个报告似乎没有区别。我想百度统计专门列出&ldquo;入口页面&rdquo;这一项的原因其实是把&ldquo;最常访问&rdquo;的页面中不属于入口页面的那些页面去掉。但事实上，我认为两种页面的分析侧重点是不同的，入口页面更强调的是bounce rate，而非exit rate。这里，如果我们回头看看GA的设置，就会明白GA为什么为entry page这个报告安排了完全不同于top content报告的度量。所以，我认为这个地方可能是百度统计没有很好的领会landing page的实际意义和分析侧重。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image35.png"><img alt="image" height="359" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb31.png" style="display: block; float: none; margin-left: auto; margin-right: auto" title="image" width="586" /></a> 图：21：【百度统计】入口页面仍然用exit rate（退出率）作为metric令人意外</p>
<p align="left">　　另外，百度统计好像没有提供类似于GA的site overlay的热图功能。不过这个功能在GA上也完全属于鸡肋。用好这个功能最终还是需要自己DIY。</p>
<p align="left"><span style="color:#800080;"><strong>路径分析：极弱</strong></span></p>
<p align="left">　　由于百度统计需要额外增加监测代码才能实现上下游分析，而且最多只能实现20个页面的分析，因此页面之间的路径分析是非常疲弱的。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image36.png"><img alt="image" border="0" height="106" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb32.png" style="border-bottom: 0px; border-left: 0px; display: inline; border-top: 0px; border-right: 0px" title="image" width="513" /></a></p>
<p align="center">图22：【百度统计】 只能统计最多20个页面之间的上下游？这个功能有些形同虚设了</p>
<p align="left">　　路径分析需要有很好的服务器支持，百度这一块应该不是问题，那么问题是不是出在算法的优化上？因为路径分析的数据分析量随着页面数量的增加是呈指数级增加的。</p>
<p align="left"><span style="color:#800080;"><strong>转化分析：较弱</strong></span></p>
<p align="left">　　转化分析这块，因为百度统计是完全模仿Google Analytics的，而Google Analytics作为一个免费软件，在路径和转化的分析上实际上已经相当孱弱，因此这个领域也肯定不是百度统计的强项。功能实现上百度统计和GA几乎一样，如下图：</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image37.png"><img alt="image" height="389" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb33.png" style="display: block; float: none; margin-left: auto; margin-right: auto" title="image" width="402" /></a> 图23：【百度统计】自己可以设置转化目标和步骤，每个目标之前可以支持9个步骤</p>
<p align="left"><span style="color:#800080;"><strong>电子商务分析：无此功能</strong></span></p>
<p align="left">　　电子商务分析的功能没有，无法置评。</p>
<p align="left"><span style="color:#800080;"><strong>用户分析：中</strong></span></p>
<p align="left">　　最后看看用户分析。用户客户端的技术情况比较容易获得，这部分中规中矩。比较弱的是对用户新旧度和忠诚度（loyalty，即回访次数，以及recency）的监测，只能看当天回头客，且不提供新旧访问者的比例。这部分监测仍然属于基本监测范围，但是同页面的路径分析一样，需要更强大的算法进行优化才能获得更准确和更完整的数据，也才不会拖垮服务器。我想可能是因为这个原因，目前这部分还无法很好的提供。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image38.png"><img alt="image" height="305" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb34.png" style="display: inline" title="image" width="488" /></a></p>
<p align="center">图24：【百度统计】这个报告的默认页面直接被推到了在升级中的&ldquo;访问频次&rdquo;，结果造成这个报告看起来像是无法提供数据，但实际上点击其他的&ldquo;访问特征&rdquo;，你能够看到报告数据。另外&ldquo;访问页数&rdquo;和&ldquo;访问深度&rdquo;之间的差异是什么？为何需要严格区分？</p>
<p align="left">　　总体这部分功能还处于需要进一步完善的状态之中。我认为，能够任意截取时间长度分析loyalty和新旧访客之间的比例是需要增加的基础功能。</p>
<p align="left">　　值得一提的是&ldquo;趋势分析&rdquo;中有一个&ldquo;最新访客&rdquo;报告（我认为它应该归属到&ldquo;访客分析&rdquo;这个区隔去），这个报告是GA中找不到的。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image39.png"><img alt="image" height="426" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb35.png" style="display: inline" title="image" width="482" /></a></p>
<p align="center">图25：【百度统计】相当有意思的&ldquo;最新访客&rdquo;报告</p>
<p align="left">　　这个报告统计了每一个最近访问者的相关信息，以及他们进行的行动，很有意思。但是，可能是我学识尚浅，没有想好这个功能有什么用。网站分析极少进行微观数据的分析，更强调从大量用户行为中归类出普遍的或者是代表性的行为模式，类似于数理统计中的&ldquo;聚类分析&rdquo;。我之前也看到了不少追踪个体用户鼠标轨迹的网站分析工具。相对而言，这些工具因为提供了个体，而无整体，所以分析的难度极大。这也是我一直认为热图比鼠标轨迹图更有意义的原因。<strong>在这一点上，很希望听到朋友们的看法。你们将会如何发挥这个报告的价值？</strong></p>
<h3>4. 自定义能力</h3>
<p align="left">　　由于目前的功能还比较基础，百度统计还谈不上自定义功能。自定义报告和自定义度量功能均没有。唯一出现自定义的地方是&ldquo;自定义指标&rdquo;。但是，实际上这并非自定义，只能称得上&ldquo;自选取&rdquo;。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image40.png"><img alt="image" height="145" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb36.png" style="display: inline" title="image" width="427" /></a></p>
<p align="left">　　不过，对于国内的大部分用户来说，自定义报告和自定义报告这两个功能可能也意义不大。百度统计只要能满足大量普通站长的需求就已经足够了。</p>
<h3>5. 其他</h3>
<p align="left">　　最后还想简单谈一下百度统计中的数据展现方式。百度统计在数据图形的自定义上功能尚弱，报告的图形是固定的。</p>
<p align="left">　　在不同时间的数据对比的展现上，还不够让人觉得清爽，而且默认按小时细分，这个默认设定值得商榷。GA方面，它运用了差异着色的方式解决这个问题，看起来稍微舒服一些。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image41.png"><img alt="image" height="474" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/image_thumb37.png" style="display: inline" title="image" width="504" /></a></p>
<p align="center">图26：【百度统计】数据展示方式有改进余地</p>
<p>&nbsp;</p>
<h3>总结</h3>
<p>　　第一次详细写一个国内的网站分析工具，还是很费力的。最近身体又跟我闹别扭了，而且，而且心情似也不佳。总之，又写了这么长的文章不易，如果有任何不妥的地方，no offense to anyone，还请百度和各位朋友海涵。</p>
<p>　　关于百度统计，这一次完全开放，给我的感觉整体不能说惊艳，但是确实能体会到团队的认真和辛劳。网站分析工具过去是流量监控工具，其实开发起来相对容易，但是随着网站分析的发展，越来越从流量监测转化为行为监测，这就使网站分析工具的开发难度大大加大了。</p>
<p>　　百度统计的特点很明显，在于对于搜索引擎流量来源地监测和数据提供上，整合了自家的优势资源，所以理所应当的会获得相当部分SEM和SEO用户的认可。而在其他方面，例如对于电子商务网站比较强调的路径和转化，的确还差强人意，有待强化。另外ROI功能没有实现也是一个遗憾，但相信不久之后就能弥补。自定义功能还需要补充进来，以实现更多维度的细分分析，毕竟细分是网站分析中重要的一个内容。</p>
<p>　　最后，一句话的感觉是，有了一个不错的开头，后面还有很多细化的工作要做。加油！</p>
<p>&nbsp;</p>
<p><strong>题后：如有任何问题或者任何表述不当的地方，敬请告知。任何朋友有任何自己的感受，也欢迎留言！</strong></p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/baidu-tongji-user-experience/feed/</wfw:commentRss>
		<slash:comments>68</slash:comments>
		</item>
		<item>
		<title>Google Analytics的Navigation Summary报告存在Bug</title>
		<link>http://www.chinawebanalytics.cn/bug-in-gas-navigationsummaryreport/</link>
		<comments>http://www.chinawebanalytics.cn/bug-in-gas-navigationsummaryreport/#comments</comments>
		<pubDate>Mon, 03 May 2010 13:00:46 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[疑问求解]]></category>
		<category><![CDATA[网站分析工具]]></category>
		<category><![CDATA[Google Analytics]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=2258</guid>
		<description><![CDATA[　　几个月来，有不少朋友问Navigation Summary报告到底是怎么了。我自己也觉得很疑惑。见下图：

　　这是我的博客的首页的Navigation Summary，奇怪的是Exit Rate是0.00%。但实际上我的博客首页的bounce rate大概有50%左右，因此Exit Rate绝对不可能是0了。比较一下一年前的数据，完全不一样对吗？

　　我认为是GA出现了Bug，但是不知道是不是每个朋友都有这样的情况。
　　我在Google上随便搜索了一下，国外也有一些朋友遇到了相关的问题：http://www.google.com/support/forum/p/Google+Analytics/thread?tid=167b14330fbb5606&#38;hl=en，有一个貌似是GA内部的人站出来承认说是有bug。
　　GA的官方没有解释，但我想，Navigation Summary暂时恐怕只能用Entrance Paths报告凑合下用了。
　　大家的情况如何？
]]></description>
			<content:encoded><![CDATA[<p>　　几个月来，有不少朋友问Navigation Summary报告到底是怎么了。我自己也觉得很疑惑。见下图：</p>
<p style="text-align: center;"><img alt="" height="227" hspace="5" src="http://www.chinawebanalytics.cn/wp-content/uploads/NavGatr 01.jpg" vspace="5" width="550" /></p>
<p>　　这是我的博客的首页的Navigation Summary，奇怪的是Exit Rate是0.00%。但实际上我的博客首页的bounce rate大概有50%左右，因此Exit Rate绝对不可能是0了。比较一下一年前的数据，完全不一样对吗？</p>
<p style="text-align: center;"><img alt="" height="233" hspace="5" src="http://www.chinawebanalytics.cn/wp-content/uploads/NavGatr 02.jpg" vspace="5" width="550" /></p>
<p>　　我认为是GA出现了Bug，但是不知道是不是每个朋友都有这样的情况。</p>
<p>　　我在Google上随便搜索了一下，国外也有一些朋友遇到了相关的问题：<a href="http://www.google.com/support/forum/p/Google+Analytics/thread?tid=167b14330fbb5606&amp;hl=en">http://www.google.com/support/forum/p/Google+Analytics/thread?tid=167b14330fbb5606&amp;hl=en</a>，有一个貌似是GA内部的人站出来承认说是有bug。</p>
<p>　　GA的官方没有解释，但我想，Navigation Summary暂时恐怕只能用Entrance Paths报告凑合下用了。</p>
<p>　　大家的情况如何？</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/bug-in-gas-navigationsummaryreport/feed/</wfw:commentRss>
		<slash:comments>11</slash:comments>
		</item>
		<item>
		<title>Advanced Segments 快速诊断电子商务网站</title>
		<link>http://www.chinawebanalytics.cn/advanced-segments-ec/</link>
		<comments>http://www.chinawebanalytics.cn/advanced-segments-ec/#comments</comments>
		<pubDate>Sat, 17 Apr 2010 12:07:48 +0000</pubDate>
		<dc:creator>Tenly</dc:creator>
				<category><![CDATA[Featured]]></category>
		<category><![CDATA[电子商务]]></category>
		<category><![CDATA[网站分析工具]]></category>
		<category><![CDATA[GA]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[产品页]]></category>
		<category><![CDATA[优化]]></category>
		<category><![CDATA[网店]]></category>
		<category><![CDATA[网站分析]]></category>
		<category><![CDATA[订单]]></category>
		<category><![CDATA[转化]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/advanced-segments-%e5%bf%ab%e9%80%9f%e8%af%8a%e6%96%ad%e7%94%b5%e5%ad%90%e5%95%86%e5%8a%a1%e7%bd%91%e7%ab%99/</guid>
		<description><![CDATA[前言：寒冷的北京的春，Tenly 周末宅在家独守空房思考，有点想法令我豁然开朗。于是撰文记之，又开始拿 Google Analytics 此工具开始说事了。好久没来宋星这来逛了。
理论：
对于一个需求不太专业的电子商务网站客户来说，他们关注的东西并不多，但是&#8220;转化&#8221;倒是一个重要内容。
面对这种转换分析，常用的方法是使用&#8220;目标&#8221;。以 Google Analytics 为例，即设置特定的页面为目标（Goals），从而知道转换的变化与好坏。对于封闭的，单一的转换，这种方法是完全没有问题的，但是对于非封闭的，而且是动态的页面，方法论就会有一些瑕疵。
网站主问我：&#8220;我的访问者，有多少人会去我的商品页？&#8221;；&#8220;我的访问者，有多少人会去下单？&#8221;

于是使用定义&#8220;目标&#8221;方法的话，需要定义所有的商品页为 Goal 1，购物车页为 Goal 2，&#8230;&#8230;

Goals 的定义是以Page Views为单位的。也就是举例说：

2次 Visits，其中1次，从促销页去查看了3个产品页，另外一次从页面去看了2个产品页，共实现了5个 Goals，转化率为 5 / 2 = 2.5。
2次 Visits，其中1次，从促销页去查看了6个产品页，另外一次直接从首页跳出（Bounce）。这样共有6个 Goals，转化率为 6 / 2 = 3。
结论是后者的转换率高？可是前者2个访问者皆实现了到产品页的转化哦！如果数据放大，这种疑问就值得沉思了。

所以我就觉得有点奇怪，用 Page Views 作分子，Visits 作分母，它们的比值似乎不太对劲。因为个别狂热的的访问，会造成多次的目标实现，就会拉高整站的转换率。
于是我们调整算法，抛弃 Goals 的设定方法：

2次 Visits，其中1次，从促销页去查看了3个产品页，另外一次从页面去看了2个产品页。2次 Visits 都成功转化到了产品页，转化率为 2 / 2 = 100%。
2次 Visits，其中1次，从促销页去查看了6个产品页，另外一次直接从首页跳出（Bounce）。2次 Visits 只有1次转化到了产品页，转化率为 1 / 2 = 50%。
这样看起来是否更合乎逻辑了。因为是 Visits 与 Visits 之间的比，而且分子除以分母的比值永远小于100%。

实践：
基于前面的结论，我们需要知道数据：

1、有多少次访问来到了我们的网站 
		2、其中有多少的访问造成了转化去了我们的任意产品页 
		3、再其中有多少的访问会进去购物车 
		4、然后是下单 &#8211; 物流 &#8211; 支付&#8230;&#8230;

这样才是一个完全的 Funnel 漏斗，而且这个 Funnel 的确是越来越小。
首先，查看我们网站的 Visits，这样可以知道有多少次访问来到了我们的网站。
然后，定义多个 Advanced Segements：


Segement 1（去看过产品页的Visits） 的条件是：Page Contain &#8220;ProductID=&#8221;；
Segement 2（去购物车的Visits）的条件是：Page Contain &#8220;Flow.php&#8221;；
Segement 3 （去下单的Visits）的条件是：Page &#8230;&#8230;（忽略掉请自由发挥）。


不同的电子商务网站的产品页的共性不同，你只需要找出共性，找到他们即可。有的是&#8220;/goods.php?id=888&#8221;，有的是&#8220;/Product/3333.html&#8221;，有的是&#8220;/StyleDetail_9384/&#8221;&#8230;&#8230;

最后，我们开始跑报告，把定义好的 Segements 都应用到报告中去：

结论：
于是得到按周来看，这三个 Segements 的数据（声明：演示数据，数字已人工调整）。

从下面的图表，我们就很容易回答刚才的问题：

本电子商务网站会有 61% 的访问会转化到产品页，从上线第一周开始，随着网站的优化，以及各种促销活动的开展，这个转换率一直在提升。特别是在11周，由于季末大甩卖的促销的有力推动，转化率一度拔高到 67% 的历史最高水平。
从产品到下单的的转化率平均为 3%，低于行业平均水平（行业平均水平为 XX%）。令人关注的是，最近的产品到下单的转化率一路下滑。
尽管有较高比例的用户会访问产品页，但下单的用户转化率偏低，可能存在的问题有：

价格优势不够明显。
页面购买下单的按钮都不明显。
页面设计不够合理。
&#8230;&#8230;&#8230;&#8230;&#8230;&#8230;说一大堆。




]]></description>
			<content:encoded><![CDATA[<p><strong>前言：</strong><font color="#808080">寒冷的北京的春，Tenly 周末宅在家独守空房思考，有点想法令我豁然开朗。于是撰文记之，又开始拿 Google Analytics 此工具开始说事了。好久没来宋星这来逛了。</font></p>
<h3><strong>理论：</strong></h3>
<p>对于一个需求不太专业的电子商务网站客户来说，他们关注的东西并不多，但是&ldquo;转化&rdquo;倒是一个重要内容。</p>
<p>面对这种转换分析，常用的方法是使用&ldquo;目标&rdquo;。以 Google Analytics 为例，即设置特定的页面为目标（Goals），从而知道转换的变化与好坏。对于封闭的，单一的转换，这种方法是完全没有问题的，但是对于非封闭的，而且是动态的页面，方法论就会有一些瑕疵。</p>
<p align="center"><strong>网站主问我：&ldquo;我的访问者，有多少人会去我的商品页？&rdquo;；&ldquo;我的访问者，有多少人会去下单？&rdquo;</strong></p>
<p><span id="more-2180"></span></p>
<p>于是使用定义&ldquo;目标&rdquo;方法的话，需要定义所有的商品页为 Goal 1，购物车页为 Goal 2，&hellip;&hellip;</p>
<p><img alt="E-Commerce Site Simple Structure" border="0" height="362" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/04/image14.png" style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="E-Commerce Site Simple Structure" width="356" /></p>
<p>Goals 的定义是以Page Views为单位的。也就是举例说：</p>
<ul>
<li>2次 Visits，其中1次，从促销页去查看了3个产品页，另外一次从页面去看了2个产品页，共实现了5个 Goals，转化率为 <strong><font color="#ff0000">5 / 2 = 2.5</font></strong>。</li>
<li>2次 Visits，其中1次，从促销页去查看了6个产品页，另外一次直接从首页跳出（Bounce）。这样共有6个 Goals，转化率为 <font color="#ff0000"><strong>6 / 2 = 3</strong></font>。</li>
<li>结论是后者的转换率高？可是前者2个访问者皆实现了到产品页的转化哦！如果数据放大，这种疑问就值得沉思了。</li>
</ul>
<p>所以我就觉得有点奇怪，用 Page Views 作分子，Visits 作分母，它们的比值似乎不太对劲。因为个别狂热的的访问，会造成多次的目标实现，就会拉高整站的转换率。</p>
<p>于是我们调整算法，抛弃 Goals 的设定方法：</p>
<ul>
<li>2次 Visits，其中1次，从促销页去查看了3个产品页，另外一次从页面去看了2个产品页。2次 Visits 都成功转化到了产品页，转化率为 <strong><font color="#ff0000">2 / 2 = 100%</font></strong>。</li>
<li>2次 Visits，其中1次，从促销页去查看了6个产品页，另外一次直接从首页跳出（Bounce）。2次 Visits 只有1次转化到了产品页，转化率为 <strong><font color="#ff0000">1 / 2 = 50%</font></strong>。</li>
<li>这样看起来是否更合乎逻辑了。因为是 Visits 与 Visits 之间的比，而且分子除以分母的比值永远小于100%。</li>
</ul>
<h3>实践：</h3>
<p>基于前面的结论，我们需要知道数据：</p>
<blockquote>
<p>1、有多少次访问来到了我们的网站 <br />
		2、其中有多少的访问造成了转化去了我们的任意产品页 <br />
		3、再其中有多少的访问会进去购物车 <br />
		4、然后是下单 &#8211; 物流 &#8211; 支付&hellip;&hellip;</p>
</blockquote>
<p>这样才是一个完全的 Funnel 漏斗，而且这个 Funnel 的确是越来越小。</p>
<p>首先，查看我们网站的 Visits，这样可以知道有多少次访问来到了我们的网站。</p>
<p>然后，定义多个 Advanced Segements：</p>
<p><img alt="Create Segements in Google Analytics" border="0" height="217" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/04/image15.png" style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="Create Segements in Google Analytics" width="488" /></p>
<ul>
<li>Segement 1（去看过产品页的Visits） 的条件是：<strong>Page</strong> Contain &ldquo;ProductID=&rdquo;；</li>
<li>Segement 2（去购物车的Visits）的条件是：Page Contain &ldquo;Flow.php&rdquo;；</li>
<li>Segement 3 （去下单的Visits）的条件是：Page &hellip;&hellip;（忽略掉请自由发挥）。</li>
</ul>
<blockquote>
<p>不同的电子商务网站的产品页的共性不同，你只需要找出共性，找到他们即可。有的是&ldquo;/goods.php?id=888&rdquo;，有的是&ldquo;/Product/3333.html&rdquo;，有的是&ldquo;/StyleDetail_9384/&rdquo;&hellip;&hellip;</p>
</blockquote>
<p>最后，我们开始跑报告，把定义好的 Segements 都应用到报告中去：</p>
<p><img alt="Apply Segements into Report" border="0" height="280" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/04/image16.png" style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="Apply Segements into Report" width="471" /></p>
<h3>结论：</h3>
<p>于是得到按周来看，这三个 Segements 的数据（声明：演示数据，数字已人工调整）。</p>
<p><img alt="Raw Data" border="0" height="257" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/04/image17.png" style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="Raw Data" width="493" /></p>
<p>从下面的图表，我们就很容易回答刚才的问题：</p>
<ol>
<li>本电子商务网站会有 <strong>61%</strong> 的访问会转化到产品页，从上线第一周开始，随着网站的优化，以及各种促销活动的开展，这个转换率一直在提升。特别是在11周，由于季末大甩卖的促销的有力推动，转化率一度拔高到 <strong>67%</strong> 的历史最高水平。</li>
<li>从产品到下单的的转化率平均为 3%，低于行业平均水平（行业平均水平为 XX%）。令人关注的是，最近的产品到下单的转化率一路下滑。</li>
<li>尽管有较高比例的用户会访问产品页，但下单的用户转化率偏低，可能存在的问题有：
<ul>
<li>价格优势不够明显。</li>
<li>页面购买下单的按钮都不明显。</li>
<li>页面设计不够合理。</li>
<li>&hellip;&hellip;&hellip;&hellip;&hellip;&hellip;说一大堆。</li>
</ul>
</li>
</ol>
<p><img alt="Analytics Chart For Conversion Rates" border="0" height="293" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/04/image18.png" style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="Analytics Chart For Conversion Rates" width="506" /></p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/advanced-segments-ec/feed/</wfw:commentRss>
		<slash:comments>20</slash:comments>
		</item>
		<item>
		<title>网站分析——我们的数据准确吗？</title>
		<link>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e6%88%91%e4%bb%ac%e7%9a%84%e6%95%b0%e6%8d%ae%e5%87%86%e7%a1%ae%e5%90%97%ef%bc%9f/</link>
		<comments>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e6%88%91%e4%bb%ac%e7%9a%84%e6%95%b0%e6%8d%ae%e5%87%86%e7%a1%ae%e5%90%97%ef%bc%9f/#comments</comments>
		<pubDate>Mon, 23 Nov 2009 14:54:03 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[Featured]]></category>
		<category><![CDATA[网站分析工具]]></category>
		<category><![CDATA[网站分析经验分享]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=1345</guid>
		<description><![CDATA[【导言】在做网站分析的漫长历程中，被问到最多的问题就是&#8220;你的数据精确吗？&#8221;网站分析的数据究竟准确与否，如何看待网站分析数据可能存在的偏差，本文将会给出答案。
【正文】
　　准确和精确在汉语里面是近义词，我们在口语中是可以混用的，英语中也如此，accurate和precise人们也是随性而用，脱口而出。可是，既然有两个词存在，而没有在文字演化的长河中消亡其中一个，就说明它们还是有微妙的不同。事实上，准确和精确绝对不是同一个概念，它们在工程学、统计学以及其他许许多多的科学中都被严格的区分，对于网站分析这么新兴的学科而言，也完全如此。
	
　　我们先看看准确和精确到底有什么不同，然后再看看网站分析工具能够做到准确还是精确，或是二者皆备。
&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;我是快乐的分页符（点击文章标题看全文）&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;

何为准确，何为精确
　　维基百科上有关于准确和精确的极佳的解释，堪称经典词条。这里我用汉语向它致敬：准确是指现象或者测量值相对事实之间的离散程度小，也就是我们口语的&#8220;接近事实、符合事实&#8221;等；精确是指在条件不变的情况下，现象或者测量值能够低离散程度的反复再现，也就是我们口语说的&#8220;次次如此、回回一样&#8221;等。下面这两个图特别经典，从维基百科引用而来：

图1：这是指相对较高的准确度，但相对较低的精确度

图2：这是指相对较高的精确度，但相对较低的准确度
　　上面的两个图中红色的圆心代表着事实。可以看到，在图1中，测量值围绕着圆心，虽然分布离散，但可以看出它们的平均分布位置肯定在圆心中（或者说，多次测量值的平均值是符合事实的），所以可以称为准确，但因结果离散而不能称为精确。在图2中，测量值明显偏离圆心（测量值的平均值也不可能在圆心上），所以不能称为准确，但可以称为精确，因为测量值的复现离散度很低。这是对准确和精确的极好解释。
[版权归作者Sidney Song（宋星）所有，欢迎转载，但请事先告知作者并注明出处]
　　如果我们把准确和精确作为两个不同的维度建立矩阵，可以得到下面的图：

图3：准确和精确矩阵（图片来源：www.wellesley.edu）
　　左上象限是我们最喜欢的，既准确，且精确&#8212;&#8212;对物理学和绝大多数理工科的要求就是如此；右下角是最糟糕的情况，不仅不精确，而且不准确&#8212;&#8212;这是生活中最常见的，我们的社会生活其实很离散也很混沌。
　　那么，自然而然的你会问，网站分析属于哪个象限呢？一定是左上角的象限对吗？
网站分析是准确的吗？
　　首先，这个问题没有固定的答案，因为网站分析的准确度很大程度上取决于你的期望和所采用的监测方法和所使用的工具。不过，就我们最常使用的网站分析方法而言，网站分析绝对不属于图3中左边的两个象限（即不属于既准确又精确的象限，也不属于准确但不精确的象限），更简单说，就是网站分析的数据不会准确。
　　这可能会让你失望，但相信并不出乎你的意料。你肯定已经发现，如果我们使用不同的网站分析工具衡量同一个网站的时候，各工具的结果之间有令人费解的差异（我们在为什么两个监测工具报告中的数据不同有探讨个中原因），而且我们也无法知道哪个工具是更准确的还原了事实上的数据。
　　所以，如果GA显示你的网站在一个月内有36,954个Unique Visitor，你的网站的真实访问者（一个个活生生的网友！）肯定不是36,954个！
　　事实上，我们几乎找不出来任何一个能够准确被统计的度量，即使是最基本最简单的度量&#8212;&#8212;Page View也是如此！
　　因此，如果你的老板想要100%没有误差地知道网站到底有多少个人访问过，这个想要本身已经没有意义。
[版权归作者Sidney Song（宋星）所有，欢迎转载，但请事先告知作者并注明出处]
为什么网站分析数据无法准确
　　你可能会吃惊，因为我们的物理学实际上也是不可能100%准确的，原因是我们都听说过的&#8220;测不准原理&#8221;。同样，网站分析也因为一个最基本的事实而无法准确，即：网站分析的监测媒介是浏览器和服务器，而不是真实的人，这注定了我们不可能寻求到准确的结果。
　　具体而言，就目前我们通常使用的两种监测方法&#8212;&#8212;Server Log和Page Tag都不可能准确对网站分析的一些最基本度量进行计数。
Server Log的误差（Bias）： 

Unique Visitor的误差：

　　如果用Server Log的方法监测数据，那么很显然，获取真实的访问者数量是不可能的任务。本身Server Log对于访问者的估算只能依据误差巨大IP，而网络爬虫/机器人的访问又使这种误差进一步扩大。

Page View的误差：

　　本来Server Log是可以很准确的记录Page View的，但是可惜Cache的出现让这成为历史。Cache极有可能会屏蔽服务器端的响应，这样Server Log可能不会留下任何关于某次Page View记录。

时间记录的误差：

　　在没有Cache干扰的情况下，服务器能准确探知访问开始的时间，但是访问结束的时间无法了解。因为访问结束往往是随关闭浏览器而一同结束的。关闭浏览器本身不能激发一条新的Server Log记录。

Flash站点误差：

　　如果一个网站主要构成部分是包含多个页面的一个Flash文件，或多个此类Flash文件的组合，那么Server Log不会记录Flash内部的操作，监测会几乎失效。
Page Tag的误差：


Page Tag失效：

　　Page Tag失效是会发生的。首先，一部分浏览器（例如手机上的一些浏览器）不支持JavaScript或者被设置为JavaScript禁止。其次，Page Tag可能会因为它之前的JavaScript出错而无法运行。再次，我们也看到过因为变量名冲突而发生Page Tag和页面上其他JavaScript冲突而无法运行的案例。最后，受网络速度的影响，页面上的Page Tag没有完全下载，浏览器就可能被人为关闭或者直接链向一个新的页面。
　　显然，如果Page Tag失效，那么网站分析工具就会失去部分或者全部数据。
[版权归作者Sidney Song（宋星）所有，欢迎转载，但请事先告知作者并注明出处]

Page Tag的位置：

　　Page Tag在页面中的位置会影响网站分析工具的计数。如果Page Tag在页面的上端，那么它会更快的被执行，受到其他因素（例如Page Tag之前其他JavaScript失效或者网速问题）干扰的情况就越小，计数也就会因此增大。Stone Temple Consulting的统计表明，代码在上的情况下，Visitor计数比在页面下的多4.3%。

Unique Visitor的误差：

　　一个计算机可能被多人使用；一个计算机可能有多个浏览器（造成访问同一个网站有多个Cookie）；人们会删除Cookie（2007年comScore的统计表明，一个月内有30%的美国用户会删除浏览器的Cookie）；Cookie被禁用（尽管WA工具一般都使用第一方Cookie，但仍有约10%不到的第一方Cookie会被用户设为禁止）。

Page View的误差：主要由Page Tag失效引起。
时间记录的误差：同Server Log一样，Page Tag能够准确记录访问开始的时间，但是结束时间无法了解，因为一般情况下访问的结束并不会触发Page Tag的执行。

　　由于诸如Page View，访问者和访问时间之类的基本的度量实际上是无法准确记录的，因此其他一些更高级的度量，例如我们常用的复合度量（Bounce Rate，Avg. Time on Site）就更不可能准确了。不过，知道了这些误差产生的原因，有助于我们进一步修正误差。有些监测工具（例如DoubleClick，一个广告监测工具）具有自修正功能，就是利用了这个原理。
其他监测方法的误差：
　　网站分析的其他获取数据的方式&#8212;&#8212;比如通过客户端的软件搜集数据（Alexa，iResearch等），以及Sniffer（包嗅探）&#8212;&#8212;则因其本身的监测方式所限，会有更大的误差。例如，通过客户端来搜集数据，很显然存在样本量的偏差；而Sniffer本质上是Server Log方式的翻版，但却增加了包丢失以及数据记录有限的问题。它们不可能比我们前面的两种方法更准确。
[版权归作者Sidney Song（宋星）所有，欢迎转载，但请事先告知作者并注明出处]
网站分析工具精确吗？
　　现在，你知道了网站分析工具并不能准确计数。那么，网站分析工具精确吗？
　　我要说，精确是网站分析工具的必备特征，网站分析工具做不到准确，但必须精确。如果某个网站分析工具不精确，那么它就与垃圾无异。
　　网站分析工具必须精确的原因很简单，因为我们需要数据具有高度的一致性。如图4（下图）所示，如果网站分析工具的精确度存在-20%到+20%的误差，那么假设11月4日的网站准确流量是50个UV，网站分析工具所报告的数值可能是40和60之间的任何一个数。同样，我们假设次日（11月5日）的网站准确流量是51个UV，那么网站分析工具所报告的数值可能是41到61之间的任何数。那么，因为存在不精确，那么11月4日的数据有可能最终呈现40，而11月5日的数据则完全可能被最终呈现为61，这样网站分析工具会误报出一个令人满意的增长&#8212;&#8212;但事实上这个增长并不存在。反过来，如果11月4日的数据被报为60，而次日被报为41，那么更糟糕，这与实际情况是完全相反的。

图4：如果网站分析工具不精确会产生严重后果
　　因此网站分析工具必须精确，如果它与事实有-20%的误差，那么不论是哪一天哪一刻，它都必须比准确值小20%。否则我们就会得到错误的结论。当然，100%的精确也是不存在的，一般而言，允许+/-5%左右的系统偏差，这一来一去其实已经有最大10%的分离度，实际上已经是非常宽的标准了。
　　网站分析工具不能做到100%精确的原因其实也是受跟上一节的那些因素一样的影响，另外还有一些网站访问者所处环境的变化造成的未知异常，例如网络带宽的变化或是数据传输过程中的异常丢失等。
　　那么，我们实际使用的网站分析工具精确度如何？如果5颗星是满分最精确的话，那么：
　　Google Analytics，精确度3颗半星，可以及格。但是我们的朋友Ben（曾海银）和我都发现Google Analytics并不完全精确，这可能与数据的再处理有关系。Ben的案例中出现了+/-20%的情况，但极为罕见。其他的朋友有发现吗？
　　Omniture，精确度4颗星，较好。当然，我没有办法去验证，只是因为他们家的数据比较少给我惹麻烦，也比较少有无法解释的时候。但是Omniture的问题在于，定义的度量太多，且相同度量的定义在不同场合给出的数值有微小差异（尽管没有实质影响）&#8212;&#8212;实在是一个太庞大的数据系统了。
[版权归作者Sidney Song（宋星）所有，欢迎转载，但请事先告知作者并注明出处]
　　WebTrends，4颗星。评分较高的原因在于WebTrends是实施在网站服务器端，或者是被网站所有者所拥有的，所以被外界环境干扰的情况相对较少。
如何面对网站分析工具的不准确但精确的特性？
　　网站分析工具不准确但精确的特性不妨碍我们获得真正的insight（见解）。我们需要遵循三个网站分析的基本原则（简直是我压箱子底的宝贝了）：
原则一：趋势。
　　看趋势而不是看孤立数据是网站分析最重要的原则。你不可能因为网站今天的流量是500个而狂喜，但是如果上个月的平均流量是300，而这个月的平均流量是500，那么我会恭喜你，你也值得高兴一番。我们在以前的文章中对这个有讨论哦。
　　由于网站分析工具是精确的，因此虽然不能准确反映数据，却能够准确反映趋势。这也是我们所有的网站分析师会认为趋势是最重要的方法论的原因。
原则二：细分。
　　因为网站分析工具的精确性，如果整体值比实际准确值偏小20%的话，那么构成整体的各部分也会同比比各自的准确值偏小20%。因此，比较所需要的细分仍然能够满足分析的需要。
原则三：转化。
　　与细分类似，精确性能够保证转化是同比放大或缩小，因此转化本身的比例是准确的。
　　如此看来，我们最后要得出的结论是：真正帮助我们进行网站分析的关键方法所需要的数据是准确的。因此，当我们理解并且学会运用网站分析的三原则之后，我们会把网站分析工具所在的象限转移到左上角的象限&#8212;&#8212;即既准确且精确。真的，网站分析工具最终准确与否，在于你是否用好了它，这是唯心的结论，但确实是真正的真相。
　　祝大家好运。
[版权归作者Sidney Song（宋星）所有，欢迎转载，但请事先告知作者并注明出处]
　　有什么看法和建议吗？非常欢迎大家留言。看到大家的留言是最快乐的，也是最终自我满足的回报。:)
]]></description>
			<content:encoded><![CDATA[<p>【导言】在做网站分析的漫长历程中，被问到最多的问题就是&ldquo;你的数据精确吗？&rdquo;网站分析的数据究竟准确与否，如何看待网站分析数据可能存在的偏差，本文将会给出答案。</p>
<p>【正文】</p>
<p>　　准确和精确在汉语里面是近义词，我们在口语中是可以混用的，英语中也如此，accurate和precise人们也是随性而用，脱口而出。可是，既然有两个词存在，而没有在文字演化的长河中消亡其中一个，就说明它们还是有微妙的不同。事实上，准确和精确绝对不是同一个概念，它们在工程学、统计学以及其他许许多多的科学中都被严格的区分，对于网站分析这么新兴的学科而言，也完全如此。<font color="#b1b1b1"><br />
	</font></p>
<p>　　我们先看看准确和精确到底有什么不同，然后再看看网站分析工具能够做到准确还是精确，或是二者皆备。</p>
<p align="center">&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;我是快乐的分页符（点击文章标题看全文）&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;</p>
<p><span id="more-1345"></span></p>
<h2><strong>何为准确，何为精确</strong></h2>
<p>　　维基百科上有关于准确和精确的<a href="http://en.wikipedia.org/wiki/Accuracy_and_precision" target="_blank">极佳的解释</a>，堪称经典词条。这里我用汉语向它致敬：准确是指现象或者测量值相对事实之间的离散程度小，也就是我们口语的&ldquo;接近事实、符合事实&rdquo;等；精确是指在条件不变的情况下，现象或者测量值能够低离散程度的反复再现，也就是我们口语说的&ldquo;次次如此、回回一样&rdquo;等。下面这两个图特别经典，从维基百科引用而来：</p>
<p align="center"><a href="http://upload.wikimedia.org/wikipedia/commons/1/10/High_accuracy_Low_precision.svg"><img alt="File:High accuracy Low precision.svg" height="163" src="http://upload.wikimedia.org/wikipedia/commons/thumb/1/10/High_accuracy_Low_precision.svg/300px-High_accuracy_Low_precision.svg.png" width="160" /></a></p>
<p align="center">图1：这是指相对较高的准确度，但相对较低的精确度</p>
<p align="center"><a href="http://upload.wikimedia.org/wikipedia/commons/3/3a/High_precision_Low_accuracy.svg"><img alt="File:High precision Low accuracy.svg" height="163" src="http://upload.wikimedia.org/wikipedia/commons/thumb/3/3a/High_precision_Low_accuracy.svg/300px-High_precision_Low_accuracy.svg.png" width="160" /></a></p>
<p align="center">图2：这是指相对较高的精确度，但相对较低的准确度</p>
<p>　　上面的两个图中红色的圆心代表着事实。可以看到，在图1中，测量值围绕着圆心，虽然分布离散，但可以看出它们的平均分布位置肯定在圆心中（或者说，多次测量值的平均值是符合事实的），所以可以称为准确，但因结果离散而不能称为精确。在图2中，测量值明显偏离圆心（测量值的平均值也不可能在圆心上），所以不能称为准确，但可以称为精确，因为测量值的复现离散度很低。这是对准确和精确的极好解释。</p>
<p align="center"><font color="#b1b1b1">[版权归作者</font><a href="http://www.chinawebanalytics.cn/?author=1"><font color="#b1b1b1">Sidney Song</font></a><font color="#b1b1b1">（宋星）所有，欢迎转载，但请事先告知作者并注明出处]</font></p>
<p>　　如果我们把准确和精确作为两个不同的维度建立矩阵，可以得到下面的图：</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2009/11/AccuracyPrecision.gif"><img alt="AccuracyPrecision" border="0" height="380" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/11/AccuracyPrecision_thumb.gif" style="border-width: 0px; display: inline;" title="AccuracyPrecision" width="503" /></a></p>
<p align="center">图3：准确和精确矩阵（图片来源：<a href="http://www.wellesley.edu">www.wellesley.edu</a>）</p>
<p>　　左上象限是我们最喜欢的，既准确，且精确&mdash;&mdash;对物理学和绝大多数理工科的要求就是如此；右下角是最糟糕的情况，不仅不精确，而且不准确&mdash;&mdash;这是生活中最常见的，我们的社会生活其实很离散也很混沌。</p>
<p>　　那么，自然而然的你会问，网站分析属于哪个象限呢？一定是左上角的象限对吗？</p>
<h2><strong>网站分析是准确的吗？</strong></h2>
<p>　　首先，这个问题没有固定的答案，因为网站分析的准确度很大程度上取决于你的期望和所采用的监测方法和所使用的工具。不过，就我们最常使用的网站分析方法而言，网站分析绝对不属于图3中左边的两个象限（即不属于既准确又精确的象限，也不属于准确但不精确的象限），更简单说，就是网站分析的数据不会准确。</p>
<p>　　这可能会让你失望，但相信并不出乎你的意料。你肯定已经发现，如果我们使用不同的网站分析工具衡量同一个网站的时候，各工具的结果之间有令人费解的差异（我们在<a href="http://www.chinawebanalytics.cn/?p=884" target="_blank">为什么两个监测工具报告中的数据不同</a>有探讨个中原因），而且我们也无法知道哪个工具是更准确的还原了事实上的数据。</p>
<p>　　所以，如果GA显示你的网站在一个月内有36,954个<a href="http://www.chinawebanalytics.cn/?p=10" target="_blank">Unique Visitor</a>，你的网站的真实访问者（一个个活生生的网友！）肯定<strong>不</strong>是36,954个！</p>
<p>　　事实上，我们几乎找不出来任何一个能够准确被统计的度量，即使是最基本最简单的度量&mdash;&mdash;<a href="http://www.chinawebanalytics.cn/?p=43" target="_blank">Page View</a>也是如此！</p>
<p>　　因此，如果你的老板想要100%没有误差地知道网站到底有多少个人访问过，这个想要本身已经没有意义。</p>
<p align="center"><font color="#b1b1b1">[版权归作者</font><a href="http://www.chinawebanalytics.cn/?author=1"><font color="#b1b1b1">Sidney Song</font></a><font color="#b1b1b1">（宋星）所有，欢迎转载，但请事先告知作者并注明出处]</font></p>
<h2><strong>为什么网站分析数据无法准确</strong></h2>
<p>　　你可能会吃惊，因为我们的物理学实际上也是不可能100%准确的，原因是我们都听说过的&ldquo;<a href="http://baike.baidu.com/view/51569.htm" target="_blank">测不准原理</a>&rdquo;。同样，网站分析也因为一个最基本的事实而无法准确，即：网站分析的监测媒介是浏览器和服务器，而不是真实的人，这注定了我们不可能寻求到准确的结果。</p>
<p>　　具体而言，就目前我们通常使用的两种监测方法&mdash;&mdash;Server Log和Page Tag都不可能准确对网站分析的一些最基本度量进行计数。</p>
<p><strong><font color="#800080">Server Log的误差（Bias）：<a href="http://www.chinawebanalytics.cn/wp-content/uploads/2009/11/image3.png"><img align="right" alt="image" border="0" height="188" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/11/image_thumb3.png" style="border-width: 0px; margin: 0px 5px; display: inline;" title="image" width="242" /></a> </font></strong></p>
<ul>
<li>Unique Visitor的误差：</li>
</ul>
<p>　　如果用Server Log的方法监测数据，那么很显然，获取真实的访问者数量是不可能的任务。本身Server Log对于访问者的估算只能依据误差巨大IP，而网络爬虫/机器人的访问又使这种误差进一步扩大。</p>
<ul>
<li>Page View的误差：</li>
</ul>
<p>　　本来Server Log是可以很准确的记录Page View的，但是可惜Cache的出现让这成为历史。Cache极有可能会屏蔽服务器端的响应，这样Server Log可能不会留下任何关于某次Page View记录。</p>
<ul>
<li>时间记录的误差：</li>
</ul>
<p>　　在没有Cache干扰的情况下，服务器能准确探知访问开始的时间，但是访问结束的时间无法了解。因为访问结束往往是随关闭浏览器而一同结束的。关闭浏览器本身不能激发一条新的Server Log记录。</p>
<ul>
<li>Flash站点误差：</li>
</ul>
<p>　　如果一个网站主要构成部分是包含多个页面的一个Flash文件，或多个此类Flash文件的组合，那么Server Log不会记录Flash内部的操作，监测会几乎失效。</p>
<p><strong><font color="#800080">Page Tag的误差：</font></strong></p>
<p><img alt="image" border="0" height="174" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/11/image_thumb4.png" style="border-width: 0px; margin: 5px auto; display: block; float: none;" title="image" width="497" /></p>
<ul>
<li>Page Tag失效：</li>
</ul>
<p>　　Page Tag失效是会发生的。首先，一部分浏览器（例如手机上的一些浏览器）不支持JavaScript或者被设置为JavaScript禁止。其次，Page Tag可能会因为它之前的JavaScript出错而无法运行。再次，我们也看到过因为变量名冲突而发生Page Tag和页面上其他JavaScript冲突而无法运行的案例。最后，受网络速度的影响，页面上的Page Tag没有完全下载，浏览器就可能被人为关闭或者直接链向一个新的页面。</p>
<p>　　显然，如果Page Tag失效，那么网站分析工具就会失去部分或者全部数据。</p>
<p align="center"><font color="#b1b1b1">[版权归作者</font><a href="http://www.chinawebanalytics.cn/?author=1"><font color="#b1b1b1">Sidney Song</font></a><font color="#b1b1b1">（宋星）所有，欢迎转载，但请事先告知作者并注明出处]</font></p>
<ul>
<li>Page Tag的位置：</li>
</ul>
<p>　　Page Tag在页面中的位置会影响网站分析工具的计数。如果Page Tag在页面的上端，那么它会更快的被执行，受到其他因素（例如Page Tag之前其他JavaScript失效或者网速问题）干扰的情况就越小，计数也就会因此增大。<a href="http://www.stonetemple.com/articles/analytics-report-august-2007-part2.shtml">Stone Temple Consulting</a>的统计表明，代码在上的情况下，Visitor计数比在页面下的多4.3%。</p>
<ul>
<li>Unique Visitor的误差：</li>
</ul>
<p>　　一个计算机可能被多人使用；一个计算机可能有多个浏览器（造成访问同一个网站有多个<a href="http://www.chinawebanalytics.cn/?p=333" target="_blank">Cookie</a>）；人们会删除Cookie（2007年comScore的统计表明，一个月内有30%的美国用户会删除浏览器的Cookie）；Cookie被禁用（尽管WA工具一般都使用第一方Cookie，但仍有约10%不到的第一方Cookie会被用户设为禁止）。</p>
<ul>
<li>Page View的误差：主要由Page Tag失效引起。</li>
<li>时间记录的误差：同Server Log一样，Page Tag能够准确记录访问开始的时间，但是结束时间无法了解，因为一般情况下访问的结束并不会触发Page Tag的执行。</li>
</ul>
<p>　　由于诸如Page View，访问者和访问时间之类的基本的度量实际上是无法准确记录的，因此其他一些更高级的度量，例如我们常用的复合度量（<a href="http://www.chinawebanalytics.cn/?p=45" target="_blank">Bounce Rate</a>，<a href="http://www.chinawebanalytics.cn/?p=158" target="_blank">Avg. Time on Site</a>）就更不可能准确了。不过，知道了这些误差产生的原因，有助于我们进一步修正误差。有些监测工具（例如DoubleClick，一个广告监测工具）具有自修正功能，就是利用了这个原理。</p>
<p><strong><font color="#800080">其他监测方法的误差：</font></strong></p>
<p>　　网站分析的其他获取数据的方式&mdash;&mdash;比如通过客户端的软件搜集数据（Alexa，iResearch等），以及Sniffer（包嗅探）&mdash;&mdash;则因其本身的监测方式所限，会有更大的误差。例如，通过客户端来搜集数据，很显然存在样本量的偏差；而Sniffer本质上是Server Log方式的翻版，但却增加了包丢失以及数据记录有限的问题。它们不可能比我们前面的两种方法更准确。</p>
<p align="center"><font color="#b1b1b1">[版权归作者</font><a href="http://www.chinawebanalytics.cn/?author=1"><font color="#b1b1b1">Sidney Song</font></a><font color="#b1b1b1">（宋星）所有，欢迎转载，但请事先告知作者并注明出处]</font></p>
<h2><strong>网站分析工具精确吗？</strong></h2>
<p>　　现在，你知道了网站分析工具并不能准确计数。那么，网站分析工具精确吗？</p>
<p>　　我要说，<strong>精确是网站分析工具的必备特征</strong>，网站分析工具做不到准确，但必须精确。如果某个网站分析工具不精确，那么它就与垃圾无异。</p>
<p>　　网站分析工具必须精确的原因很简单，因为我们需要数据具有高度的一致性。如图4（下图）所示，如果网站分析工具的精确度存在-20%到+20%的误差，那么假设11月4日的网站准确流量是50个UV，网站分析工具所报告的数值可能是40和60之间的任何一个数。同样，我们假设次日（11月5日）的网站准确流量是51个UV，那么网站分析工具所报告的数值可能是41到61之间的任何数。那么，因为存在不精确，那么11月4日的数据有可能最终呈现40，而11月5日的数据则完全可能被最终呈现为61，这样网站分析工具会误报出一个令人满意的增长&mdash;&mdash;但事实上这个增长并不存在。反过来，如果11月4日的数据被报为60，而次日被报为41，那么更糟糕，这与实际情况是完全相反的。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2009/11/image4.png"><img alt="image" border="0" height="298" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/11/image_thumb5.png" style="border-width: 0px; display: inline;" title="image" width="427" /></a></p>
<p align="center">图4：如果网站分析工具不精确会产生严重后果</p>
<p>　　因此网站分析工具必须精确，如果它与事实有-20%的误差，那么不论是哪一天哪一刻，它都必须比准确值小20%。否则我们就会得到错误的结论。当然，100%的精确也是不存在的，一般而言，允许+/-5%左右的系统偏差，这一来一去其实已经有最大10%的分离度，实际上已经是非常宽的标准了。</p>
<p>　　网站分析工具不能做到100%精确的原因其实也是受跟上一节的那些因素一样的影响，另外还有一些网站访问者所处环境的变化造成的未知异常，例如网络带宽的变化或是数据传输过程中的异常丢失等。</p>
<p>　　那么，我们实际使用的网站分析工具精确度如何？如果5颗星是满分最精确的话，那么：</p>
<p>　　<strong>Google Analytics</strong>，精确度3颗半星，可以及格。但是我们的朋友Ben（曾海银）和我都发现Google Analytics并不完全精确，这可能与数据的再处理有关系。Ben的案例中出现了+/-20%的情况，但极为罕见。其他的朋友有发现吗？</p>
<p>　　<strong>Omniture</strong>，精确度4颗星，较好。当然，我没有办法去验证，只是因为他们家的数据比较少给我惹麻烦，也比较少有无法解释的时候。但是Omniture的问题在于，定义的度量太多，且相同度量的定义在不同场合给出的数值有微小差异（尽管没有实质影响）&mdash;&mdash;实在是一个太庞大的数据系统了。</p>
<p align="center"><font color="#b1b1b1">[版权归作者</font><a href="http://www.chinawebanalytics.cn/?author=1"><font color="#b1b1b1">Sidney Song</font></a><font color="#b1b1b1">（宋星）所有，欢迎转载，但请事先告知作者并注明出处]</font></p>
<p>　　<strong>WebTrends</strong>，4颗星。评分较高的原因在于WebTrends是实施在网站服务器端，或者是被网站所有者所拥有的，所以被外界环境干扰的情况相对较少。</p>
<h2><strong>如何面对网站分析工具的不准确但精确的特性？</strong></h2>
<p>　　网站分析工具不准确但精确的特性不妨碍我们获得真正的insight（见解）。我们需要遵循三个网站分析的基本原则（简直是我压箱子底的宝贝了）：</p>
<p><strong><font color="#008000">原则一：趋势。</font></strong></p>
<p>　　看趋势而不是看孤立数据是网站分析最重要的原则。你不可能因为网站今天的流量是500个而狂喜，但是如果上个月的平均流量是300，而这个月的平均流量是500，那么我会恭喜你，你也值得高兴一番。我们在<a href="http://www.chinawebanalytics.cn/?p=695" target="_blank">以前的文章</a>中对这个有讨论哦。</p>
<p>　　由于网站分析工具是精确的，因此虽然不能准确反映数据，却能够准确反映趋势。这也是我们所有的网站分析师会认为趋势是最重要的方法论的原因。</p>
<p><strong><font color="#008000">原则二：细分。</font></strong></p>
<p>　　因为网站分析工具的精确性，如果整体值比实际准确值偏小20%的话，那么构成整体的各部分也会同比比各自的准确值偏小20%。因此，比较所需要的细分仍然能够满足分析的需要。</p>
<p><strong><font color="#008000">原则三：转化。</font></strong></p>
<p>　　与细分类似，精确性能够保证转化是同比放大或缩小，因此转化本身的比例是准确的。</p>
<p>　　如此看来，我们最后要得出的结论是：真正帮助我们进行网站分析的关键方法所需要的数据是<strong>准确的</strong>。因此，当我们理解并且学会运用网站分析的三原则之后，我们会把网站分析工具所在的象限转移到左上角的象限&mdash;&mdash;即既准确且精确。真的，网站分析工具最终准确与否，在于你是否用好了它，这是唯心的结论，但确实是真正的真相。</p>
<p>　　祝大家好运。</p>
<p align="center"><font color="#b1b1b1">[版权归作者</font><a href="http://www.chinawebanalytics.cn/?author=1"><font color="#b1b1b1">Sidney Song</font></a><font color="#b1b1b1">（宋星）所有，欢迎转载，但请事先告知作者并注明出处]</font></p>
<p>　　有什么看法和建议吗？非常欢迎大家留言。看到大家的留言是最快乐的，也是最终自我满足的回报。:)</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e6%88%91%e4%bb%ac%e7%9a%84%e6%95%b0%e6%8d%ae%e5%87%86%e7%a1%ae%e5%90%97%ef%bc%9f/feed/</wfw:commentRss>
		<slash:comments>31</slash:comments>
		</item>
		<item>
		<title>Dear Sidney——我们期待解答！（之GA篇）</title>
		<link>http://www.chinawebanalytics.cn/dear-sidney%e2%80%94%e2%80%94%e6%88%91%e4%bb%ac%e6%9c%9f%e5%be%85%e8%a7%a3%e7%ad%94%ef%bc%81%ef%bc%88%e4%b9%8bga%e7%af%87%ef%bc%89/</link>
		<comments>http://www.chinawebanalytics.cn/dear-sidney%e2%80%94%e2%80%94%e6%88%91%e4%bb%ac%e6%9c%9f%e5%be%85%e8%a7%a3%e7%ad%94%ef%bc%81%ef%bc%88%e4%b9%8bga%e7%af%87%ef%bc%89/#comments</comments>
		<pubDate>Wed, 09 Sep 2009 16:31:02 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[基础知识]]></category>
		<category><![CDATA[疑问求解]]></category>
		<category><![CDATA[网站分析工具]]></category>
		<category><![CDATA[网站分析经验分享]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=952</guid>
		<description><![CDATA[【导语】有很多朋友给我来信，提出了很多非常有价值的问题。但是，限于工作关系，我没有及时给你们回复。现在，我想把其中我觉得最具有代表性的问题跟大家分享。[版权归作者Sidney Song所有，欢迎转载，但请事先告知作者并注明出处]


读者JonnyNG：如何保留访问者第一次访问我网站的Referral？


　　Dear Sidey，问一个跟GA有关的问题。我为我的网站投放了一些百度CPC，而且也用utm代码（也就是Link Tag）做了监测。但是我有一个问题，假如一个人先点击了某一个关键词来到我的网站，然后又点击了另一个关键词广告再来到我的网站，GA是否会记录两条？但我认为我的网站的访问其实是第一个关键词带来的，有办法知道哪些关键词是访问者第一次点击的关键词吗？
　　好问题！而且本来我想写一个帖子说这个问题的。看来不用专门开了。
　　首先，要明白一个问题，GA是如何记录流量来源的。请大家记住一个原理，GA记录流量来源依靠Cookie，如果Cookie刷新了，流量来源也会更新，否则不会。直观讲，有两种情况：

如果一个访问者先从新浪网点击了一个链接到了你的网站，那么不出意外，这个visit的流量来源会记为新浪网。然后，第二天，同样访问者又从百度搜索关键词进入你的网站，那么，这个新的visit的流量来源会被记为这个搜索引擎。因为，第二次访问刷新了Cookie。大家做一个实验，用Httpwatch看看自己的网站是不是这样。注意查询字串是&#34;utmr&#34;。我的查询结果很清楚的显示：&#8221;utmr&#160;&#160;&#160; http://www.baidu.com/s?wd=%CD%F8%D5%BE%B7%D6%CE%F6&#8220;
如果一个访问者先从新浪网点击了一个链接到了你的网站，然后收藏了你的网址，第二天通过收藏夹访问了你的网站，那么第二次访问的流量来源是哪里呢？如果你告诉我仍然是&#8220;新浪&#8221;，那么恭喜你，你的基本功很棒。流量来源仍然是新浪的原因是，通过收藏夹、输入地址栏，以及在Email中打开你的网址的行为都不会更新Cookie中记录的流量来源。

　　这样，Dear Mr. NG先生，你的第一个问题就很容易回答，GA会记为两个流量来源，因为第二次访问会导致Cookie中流量来源记录的刷新。
[版权归作者Sidney Song所有，欢迎转载，但请事先告知作者并注明出处]
　　那么，第二个问题怎么办？我们如何可以把所有其他关键词的访问都归为第一个关键词的贡献呢？
　　这实际上是要解答：如果一个访问者从A关键词访问到你的网站，以后无论他从B关键词还是从C关键词，还是从其他来源进入你的网站，都会在traffic source中记为A关键词的流量。其实实现这一点，Google Analytics完全有办法。这个办法是nooverride=1参数。

如果你的流量来源是Adwords，那么在gclid参数后，加上nooverride参数即可。例如：http://www.chinawebanalytics.cn/?gclid=123dfsa342IADF9&#38;utm_nooverride=1，之后同一访问者所有的其他关键词的visit都会记为从这个关键词贡献，而不再记为之后其他关键词或者流量来源的visit。
如果你用了GA的utm标签来监测流量来源，nooverride仍然可用，例如：http://www.chinawebanalytics.cn/?utm_campaign=wainchina&#38;utm_medium=homepagepip&#38;utm_source=waa&#38;utm_nooverride=1。
当然，如果你既没有自动的Adwords标记，也没有utm的link tag标记，你仍然可以用。例如在你的博客上写一条链接：http://www.chinawebanalytics.cn/?utm_nooverride=1，你在点击这个链接后，无论再通过任何其他入口进入我的博客，我的GAtraffic source报告中的referral domain都会记为你的博客的domain。

　　关于nooverride这个参数，有一个国外的博文很好，供参考：http://www.roirevolution.com/blog/2007/07/using_utm_nooverride_part_1_of_3_branding.html
[版权归作者Sidney Song所有，欢迎转载，但请事先告知作者并注明出处]


读者曾亮、Susan：如何在GA中合并同一页面大小写造成数据分别统计？


　　Dear Sidney，我通过GA的content_drilldown发现GA对我的网站目录进行了大小写识别，例如 www.mysite.com/ABC www.mysite.com/abc 对我的网站来说是一个路径文件夹，作用，功能都是一样的，但是被GA认为是不一样的路径，因此识别成了两处，我不知道有什么办法能让它合并到一起。还请你不吝赐教！谢谢！
　　这是一个很典型的问题了，而且很多朋友好像都问过。其实大小写合并对于GA而言很容易，就是利用filter的功能。如下图所示：

　　对于你的问题，直接在Filter Field中选择Request URI就好了，然后GA会把所有大写的URI都转为小写的，这样在报告中就自动能够合并了。当然，Filter Type中选择Uppercase也行，这样所有的URI会变成大写的字母。
　　就这么简单。
　　多说一句，Google Analytics的Filter具有非常强大的功能，不仅仅只是简单的过滤。大家如果有兴趣请参看Justin Cutroni所著的Google Analytics O&#8217;reilly Short Cuts一书（请花钱支持正版），里面对GA的过滤功能有很详细的介绍。或者大家也可以参考Google Analytics Conversion University。


读者chinarundreisen2008：如何设置GA的Funnel？


　　Dear Sidney: 我有一个页面：http://www.mysite.com/yantse/。但是实际上/yantse/这个目录并不存在，该页面的真实文件是\yantzecruise\index.asp，然后url重写映射成/yantse/的，然后我在ga目标设置的定义渠道（应该是转换funnel）那里步骤1设成了/yantse/，请问我这样设置步骤1有什么问题吗 ？
　　重定向问题是GA面临的一个比较麻烦的问题之一。我在上一个博文：Google Analytics的愁：跳转页面的监测和嵌套页面的监测中已经有所涉及。chinarundreisen2008的问题又是一个非常好的问题，因为这个问题涉及到如何设置Funnel的问题，而这个领域是在我的博客中尚未涉及的。
　　其实设置Funnel有一个诀窍，那就是把Top Content报告中的对应页面的URI抄过来，这样肯定不会出错了。比如，不管你的/yantse/是从定向为了\yantzecruise\index.asp，还是没有重定向，它的最终被GA记录下来URI只有一个。你把这个URI抄到你的Funnel设置的对应Step或者Goal中就行了。具体到你的情况，我认为GA会记录你的页面的URI为&#8220;\yantzecruise\index.asp&#8221;而不是&#8220;/yantse/&#8221;，因此你的设置应该是存在问题的。
　　试一试吧，成功与否，把结果告诉我？
[版权归作者Sidney Song所有，欢迎转载，但请事先告知作者并注明出处]


&#160;读者Jonny：Entries是怎么计算的？


Dear Sidney，您好，
看了您的blog感觉收获很多，我想知道entry page visits这个数据是怎么收集的呢？比如一个visitor进入网站的一个网页，停留了30分钟，然后刷新了一下页面，是算两次entry page visits还是算一次呢？再者，如果一个visitor进入网站的一个网页A之后，通过网页A又进入另一个网页B，在网页B停留30分钟，然后继续通过网页B进入网页C，那么在这个过程中，该访客所带来的entry page visits是1次还是2次呢？如果在计算Bounce Rate时可不可以用single page visits/entry page visits来计算得出呢？
　　又是一个非常认真的同学，赞一个先。这个问题依据不同的监测工具，可能略有不同。我们以大家最常用的GA为例。
　　Visit这个度量是依靠session cookie来工作的。Session Cookie在GA中的有效时间是30分钟。如果访问者两次产生新的pageview之间的时间是30分钟，或更短，那么算一个session，也就是只算一个visit。如果访问者两次点击网站上链接的时间超过30分钟，第二次点击被记为一个新的session，也就是一个新的visit。
　　就你的问题，如果都是刚好停留了29分59秒（不超过30分钟），那么算1次visit。如果超过了30分钟，算两次。这样看来，你的从B页面到C页面的过程，如果间隔超过30分钟的话，visits应该算2次。
　　在网站级别上，entry page visits和visits是一个概念。在GA中，你会发现，visits和Top Landing Page报告中的Entries是完全相等的。计算网站级别的bounce rate用single page visits/entry page vists就等于single access/entries，没问题。而计算某个页面的bounce rate，则应该是这个页面entry visits中的单页面访问的visits除以这个页面作为landing page时的全部visits，即该page的entry visits。有点儿拗口，但很准确了。
　　请注意，很多度量是区分网站级还是页面级的。Bounce Rate是其中之一。
[版权归作者Sidney Song所有，欢迎转载，但请事先告知作者并注明出处]


读者吴海燕：GA忠诚度是什么意思？


　　Dear Sidney，GA上的Visitor大目录下的Visitor Loyalty子报告中的Loyalty（忠诚度）的定义语焉不详，应该怎样理解？是指绝对唯一访问者的访问次数的人数，还是应该是绝对唯一访问者的访问次数的次数。比如在下面这个图中，2times对应的是650人，是指650个人访问了两次，还是一共有650次访问2次的行为？

　　哇，相当拗口啊。其实你的理解都不对。Loyalty是一个很有意思的度量，它用来衡量你的访问者是否会&#8212;&#8212;回头再来。这里GA没有给大家一个清晰的时间概念，因此很容易理解错误。首先，我们看第一列，也就是&#8220;Count of visits from this visitor including current&#8221;这一列。每一个times当然指的是访问次数，而这个次数是多长时间内的访问次数呢？&#8212;&#8212;是从加入代码开始用GA统计之日起到报告截止时间的次数。比如，图中的2 times，指的是从GA开始统计这个站点起，到你截取报告时间的截止日止，访问了两次的访问者。而我们的第二列，也就是&#8220;Visits that were the visitor&#8217;s nth visit&#8221;，指的是在我们选定的时间区间内，对应访问次数的访问者所访问的总visit。
　　因此，2 times对应的650是指：从我们用GA统计之日开始，到报告截取日期的截止日，一共访问了我们网站2次的访问者，在我们选定的时间区间内一共贡献了650次访问。而，最忠诚的那部分人（也就是201次访问以上的，我想恐怕是吴女士您自己:) ），在选定报告时间区间内一共访问了29次。
[版权归作者Sidney Song所有，欢迎转载，但请事先告知作者并注明出处]
　　搞清楚两个时间概念：times对应的是全部时间，而第二列visit对应的是报告选定时间，就容易理解Loyalty了。当然，Loyalty本身的作用是用来衡量你的网站最忠诚的那部分访问者&#8212;&#8212;他们到底有多么忠诚的。这里罗嗦一句，你可以逐周/月记录最忠诚者的访问次数（比如高于15次的访问者的visit），然后做一个趋势图，来看看你的网站的读者是否变得越来越忠诚，或者越来越不忠诚。这样，能够帮你发现现象进而找到insight哦！
　　好了，轮到读者您了，有什么想法吗？赞成吗？或者有异议？欢迎在评论框中提出，或者给我写信。谢谢！
]]></description>
			<content:encoded><![CDATA[<p><img width="210" vspace="5" hspace="5" height="169" align="left" alt="" src="http://www.chinawebanalytics.cn/wp-content/uploads/help.jpg" />【导语】有很多朋友给我来信，提出了很多非常有价值的问题。但是，限于工作关系，我没有及时给你们回复。现在，我想把其中我觉得最具有代表性的问题跟大家分享。<span style="margin: 0px; padding: 0px; text-decoration: underline;">[版权归作者<a target="_blank" style="border-bottom: 1px dotted rgb(204, 153, 102); margin: 0px; padding: 0px; color: rgb(85, 119, 153); text-decoration: none;" href="../../../../../?author=1"><span style="margin: 0px; padding: 0px; color: rgb(85, 119, 153);">Sidney Song</span></a>所有，欢迎转载，但请事先告知作者并注明出处]</span></p>
<ul>
<li>
<h2><strong>读者JonnyNG：如何保留访问者第一次访问我网站的Referral？</strong></h2>
</li>
</ul>
<p><span style="color: rgb(128, 0, 128);">　　Dear Sidey，问一个跟GA有关的问题。我为我的网站投放了一些百度CPC，而且也用utm代码（也就是<a target="_blank" href="http://www.chinawebanalytics.cn/?p=149">Link Tag</a>）做了监测。但是我有一个问题，假如一个人先点击了某一个关键词来到我的网站，然后又点击了另一个关键词广告再来到我的网站，GA是否会记录两条？但我认为我的网站的访问其实是第一个关键词带来的，有办法知道哪些关键词是访问者<strong>第一次点击</strong>的关键词吗？</span></p>
<p>　　好问题！而且本来我想写一个帖子说这个问题的。看来不用专门开了。</p>
<p>　　首先，要明白一个问题，GA是如何记录流量来源的。请大家记住一个原理，GA记录流量来源依靠Cookie，如果Cookie刷新了，流量来源也会更新，否则不会。直观讲，有两种情况：</p>
<ul>
<li>如果一个访问者先从新浪网点击了一个链接到了你的网站，那么不出意外，这个visit的流量来源会记为新浪网。然后，第二天，同样访问者又从百度搜索关键词进入你的网站，那么，这个新的visit的流量来源会被记为这个搜索引擎。因为，第二次访问刷新了Cookie。大家做一个实验，用Httpwatch看看自己的网站是不是这样。注意查询字串是&quot;utmr&quot;。我的查询结果很清楚的显示：&rdquo;utmr&nbsp;&nbsp;&nbsp; http://www.baidu.com/s?wd=%CD%F8%D5%BE%B7%D6%CE%F6&ldquo;</li>
<li>如果一个访问者先从新浪网点击了一个链接到了你的网站，然后收藏了你的网址，第二天通过收藏夹访问了你的网站，那么第二次访问的流量来源是哪里呢？如果你告诉我仍然是&ldquo;新浪&rdquo;，那么恭喜你，你的基本功很棒。流量来源仍然是新浪的原因是，通过收藏夹、输入地址栏，以及在Email中打开你的网址的行为都不会更新Cookie中记录的流量来源。</li>
</ul>
<p>　　这样，Dear Mr. NG先生，你的第一个问题就很容易回答，GA会记为两个流量来源，因为第二次访问会导致Cookie中流量来源记录的刷新。</p>
<p style="text-align: center;"><span style="margin: 0px; padding: 0px; text-decoration: underline;">[版权归作者<a target="_blank" style="border-bottom: 1px dotted rgb(204, 153, 102); margin: 0px; padding: 0px; color: rgb(85, 119, 153); text-decoration: none;" href="../../../../../?author=1"><span style="margin: 0px; padding: 0px; color: rgb(85, 119, 153);">Sidney Song</span></a>所有，欢迎转载，但请事先告知作者并注明出处]</span></p>
<p>　　那么，第二个问题怎么办？我们如何可以把所有其他关键词的访问都归为第一个关键词的贡献呢？</p>
<p>　　这实际上是要解答：如果一个访问者从A关键词访问到你的网站，以后无论他从B关键词还是从C关键词，还是从其他来源进入你的网站，都会在traffic source中记为A关键词的流量。其实实现这一点，Google Analytics完全有办法。这个办法是nooverride=1参数。<img width="250" vspace="10" hspace="10" height="127" align="right" alt="" src="http://www.chinawebanalytics.cn/wp-content/uploads/override.jpg" /></p>
<ul>
<li>如果你的流量来源是Adwords，那么在gclid参数后，加上nooverride参数即可。例如：http://www.chinawebanalytics.cn/?gclid=123dfsa342IADF9<strong>&amp;utm_nooverride=1</strong>，之后同一访问者所有的其他关键词的visit都会记为从这个关键词贡献，而不再记为之后其他关键词或者流量来源的visit。</li>
<li>如果你用了<a target="_blank" href="http://www.chinawebanalytics.cn/?p=149">GA的utm标签</a>来监测流量来源，nooverride仍然可用，例如：http://www.chinawebanalytics.cn/?utm_campaign=wainchina&amp;utm_medium=homepagepip&amp;utm_source=waa&amp;utm_nooverride=1。</li>
<li>当然，如果你既没有自动的Adwords标记，也没有utm的link tag标记，你仍然可以用。例如在你的博客上写一条链接：http://www.chinawebanalytics.cn/?utm_nooverride=1，你在点击这个链接后，无论再通过任何其他入口进入我的博客，我的GAtraffic source报告中的referral domain都会记为你的博客的domain。</li>
</ul>
<p>　　关于nooverride这个参数，有一个国外的博文很好，供参考：<a href="http://www.roirevolution.com/blog/2007/07/using_utm_nooverride_part_1_of_3_branding.html">http://www.roirevolution.com/blog/2007/07/using_utm_nooverride_part_1_of_3_branding.html</a></p>
<p style="text-align: center;"><span style="margin: 0px; padding: 0px; text-decoration: underline;">[版权归作者<a target="_blank" style="border-bottom: 1px dotted rgb(204, 153, 102); margin: 0px; padding: 0px; color: rgb(85, 119, 153); text-decoration: none;" href="../../../../../?author=1"><span style="margin: 0px; padding: 0px; color: rgb(85, 119, 153);">Sidney Song</span></a>所有，欢迎转载，但请事先告知作者并注明出处]</span></p>
<ul>
<li>
<h2><strong>读者曾亮、Susan：如何在GA中合并同一页面大小写造成数据分别统计？</strong></h2>
</li>
</ul>
<p><span style="color: rgb(128, 0, 128);">　　Dear Sidney，我通过GA的content_drilldown发现GA对我的网站目录进行了大小写识别，例如 www.mysite.com/ABC www.mysite.com/abc 对我的网站来说是一个路径文件夹，作用，功能都是一样的，但是被GA认为是不一样的路径，因此识别成了两处，我不知道有什么办法能让它合并到一起。还请你不吝赐教！谢谢！</span></p>
<p>　　这是一个很典型的问题了，而且很多朋友好像都问过。其实大小写合并对于GA而言很容易，就是利用filter的功能。如下图所示：</p>
<p style="text-align: center;"><img width="400" vspace="5" hspace="5" height="293" alt="" src="http://www.chinawebanalytics.cn/wp-content/uploads/lowercase.gif" /></p>
<p>　　对于你的问题，直接在Filter Field中选择Request URI就好了，然后GA会把所有大写的URI都转为小写的，这样在报告中就自动能够合并了。当然，Filter Type中选择Uppercase也行，这样所有的URI会变成大写的字母。</p>
<p>　　就这么简单。</p>
<p>　　多说一句，Google Analytics的Filter具有非常强大的功能，不仅仅只是简单的过滤。大家如果有兴趣请参看Justin Cutroni所著的Google Analytics O&#8217;reilly Short Cuts一书（请花钱支持正版），里面对GA的过滤功能有很详细的介绍。或者大家也可以参考<a target="_blank" href="http://www.google.com/support/conversionuniversity/?hl=en">Google Analytics Conversion University</a>。</p>
<ul>
<li>
<h2><strong>读者chinarundreisen2008：如何设置GA的Funnel？</strong></h2>
</li>
</ul>
<p><span style="color: rgb(128, 0, 128);">　　Dear Sidney: 我有一个页面：http://www.mysite.com/yantse/。但是实际上/yantse/这个目录并不存在，该页面的真实文件是\yantzecruise\index.asp，然后url重写映射成/yantse/的，然后我在ga目标设置的定义渠道（应该是转换funnel）那里步骤1设成了/yantse/，请问我这样设置步骤1有什么问题吗 ？<img width="200" vspace="10" hspace="10" height="209" align="right" alt="" src="http://www.chinawebanalytics.cn/wp-content/uploads/funnel.jpg" /></span></p>
<p>　　重定向问题是GA面临的一个比较麻烦的问题之一。我在上一个博文：<a target="_blank" href="http://www.chinawebanalytics.cn/?p=794">Google Analytics的愁：跳转页面的监测和嵌套页面的监测</a>中已经有所涉及。chinarundreisen2008的问题又是一个非常好的问题，因为这个问题涉及到如何设置Funnel的问题，而这个领域是在我的博客中尚未涉及的。</p>
<p>　　其实设置Funnel有一个诀窍，<strong>那就是把Top Content报告中的对应页面的URI抄过来</strong>，这样肯定不会出错了。比如，不管你的<span>/yantse/是从定向为了</span><span>\yantzecruise\index.asp，还是没有重定向，它的最终被GA记录下来URI只有一个。你把这个URI抄到你的Funnel设置的对应Step或者Goal中就行了。具体到你的情况，我认为GA会记录你的页面的URI为&ldquo;</span><span>\yantzecruise\index.asp</span><span>&rdquo;而不是&ldquo;</span><span>/yantse/&rdquo;，因此你的设置应该是存在问题的。</span></p>
<p><span>　　试一试吧，成功与否，把结果告诉我？</span></p>
<p style="text-align: center;"><span style="margin: 0px; padding: 0px; text-decoration: underline;">[版权归作者<a target="_blank" style="border-bottom: 1px dotted rgb(204, 153, 102); margin: 0px; padding: 0px; color: rgb(85, 119, 153); text-decoration: none;" href="../../../../../?author=1"><span style="margin: 0px; padding: 0px; color: rgb(85, 119, 153);">Sidney Song</span></a>所有，欢迎转载，但请事先告知作者并注明出处]</span></p>
<ul>
<li>
<h2>&nbsp;<strong>读者Jonny：Entries是怎么计算的？</strong></h2>
</li>
</ul>
<p><span style="color: rgb(128, 0, 128);">Dear Sidney，您好，<br />
看了您的blog感觉收获很多，我想知道entry page visits这个数据是怎么收集的呢？比如一个visitor进入网站的一个网页，停留了30分钟，然后刷新了一下页面，是算两次entry page visits还是算一次呢？再者，如果一个visitor进入网站的一个网页A之后，通过网页A又进入另一个网页B，在网页B停留30分钟，然后继续通过网页B进入网页C，那么在这个过程中，该访客所带来的entry page visits是1次还是2次呢？如果在计算Bounce Rate时可不可以用single page visits/entry page visits来计算得出呢？</span></p>
<p>　　又是一个非常认真的同学，赞一个先。这个问题依据不同的监测工具，可能略有不同。我们以大家最常用的GA为例。</p>
<p>　　Visit这个度量是依靠session cookie来工作的。Session Cookie在GA中的有效时间是30分钟。如果访问者两次产生新的pageview之间的时间是30分钟，或更短，那么算一个session，也就是只算一个visit。如果访问者两次点击网站上链接的时间超过30分钟，第二次点击被记为一个新的session，也就是一个新的visit。</p>
<p>　　就你的问题，如果都是刚好停留了29分59秒（不超过30分钟），那么算1次visit。如果超过了30分钟，算两次。这样看来，你的从B页面到C页面的过程，如果间隔超过30分钟的话，visits应该算2次。</p>
<p>　　在网站级别上，entry page visits和visits是一个概念。在GA中，你会发现，visits和Top Landing Page报告中的Entries是完全相等的。计算网站级别的bounce rate用single page visits/entry page vists就等于single access/entries，没问题。而计算某个页面的bounce rate，则应该是<u>这个页面<strong>entry visits</strong>中的单页面访问的visits除以这个页面作为landing page时的全部visits，即该page的entry visits</u>。有点儿拗口，但很准确了。</p>
<p>　　请注意，很多度量是区分网站级还是页面级的。Bounce Rate是其中之一。</p>
<p style="text-align: center;"><span style="margin: 0px; padding: 0px; text-decoration: underline;">[版权归作者<a target="_blank" style="border-bottom: 1px dotted rgb(204, 153, 102); margin: 0px; padding: 0px; color: rgb(85, 119, 153); text-decoration: none;" href="../../../../../?author=1"><span style="margin: 0px; padding: 0px; color: rgb(85, 119, 153);">Sidney Song</span></a>所有，欢迎转载，但请事先告知作者并注明出处]</span></p>
<ul>
<li>
<h2><strong>读者吴海燕：GA忠诚度是什么意思？</strong></h2>
</li>
</ul>
<p><span style="color: rgb(128, 0, 128);">　　Dear Sidney，GA上的Visitor大目录下的Visitor Loyalty子报告中的Loyalty（忠诚度）的定义语焉不详，应该怎样理解？是指绝对唯一访问者的访问次数的人数，还是应该是绝对唯一访问者的访问次数的次数。比如在下面这个图中，2times对应的是650人，是指650个人访问了两次，还是一共有650次访问2次的行为？</span></p>
<p><img width="736" vspace="5" hspace="5" height="488" alt="" src="http://www.chinawebanalytics.cn/wp-content/uploads/loyalty.gif" /></p>
<p>　　哇，相当拗口啊。其实你的理解都不对。Loyalty是一个很有意思的度量，它用来衡量你的访问者是否会&mdash;&mdash;回头再来。这里GA没有给大家一个清晰的时间概念，因此很容易理解错误。首先，我们看第一列，也就是&ldquo;Count of visits from this visitor including current&rdquo;这一列。每一个times当然指的是访问次数，而这个次数是多长时间内的访问次数呢？&mdash;&mdash;是从加入代码开始用GA统计之日起到报告截止时间的次数。<strong>比如，图中的2 times，指的是从GA开始统计这个站点起，到你截取报告时间的截止日止，访问了两次的访问者。</strong>而我们的第二列，也就是&ldquo;Visits that were the visitor&#8217;s nth visit&rdquo;，指的是在我们选定的时间区间内，对应访问次数的访问者所访问的总visit。</p>
<p>　　因此，2 times对应的650是指：从我们用GA统计之日开始，到报告截取日期的截止日，一共访问了我们网站2次的访问者，在我们选定的时间区间内一共贡献了650次访问。而，最忠诚的那部分人（也就是201次访问以上的，我想恐怕是吴女士您自己:) ），在选定报告时间区间内一共访问了29次。</p>
<p style="text-align: center;"><span style="margin: 0px; padding: 0px; text-decoration: underline;">[版权归作者<a target="_blank" style="border-bottom: 1px dotted rgb(204, 153, 102); margin: 0px; padding: 0px; color: rgb(85, 119, 153); text-decoration: none;" href="../../../../../?author=1"><span style="margin: 0px; padding: 0px; color: rgb(85, 119, 153);">Sidney Song</span></a>所有，欢迎转载，但请事先告知作者并注明出处]</span></p>
<p>　　搞清楚两个时间概念：times对应的是全部时间，而第二列visit对应的是报告选定时间，就容易理解Loyalty了。当然，Loyalty本身的作用是用来衡量你的网站最忠诚的那部分访问者&mdash;&mdash;他们到底有多么忠诚的。这里罗嗦一句，你可以逐周/月记录最忠诚者的访问次数（比如高于15次的访问者的visit），然后做一个趋势图，来看看你的网站的读者是否变得越来越忠诚，或者越来越不忠诚。这样，能够帮你<a target="_blank" href="http://www.chinawebanalytics.cn/?p=695">发现现象进而找到insight哦</a>！</p>
<p>　　好了，轮到读者您了，有什么想法吗？赞成吗？或者有异议？欢迎在评论框中提出，或者给我写信<img alt="" src="http://www.chinawebanalytics.cn/wp-content/uploads/2008/08/emailpic.png" />。谢谢！</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/dear-sidney%e2%80%94%e2%80%94%e6%88%91%e4%bb%ac%e6%9c%9f%e5%be%85%e8%a7%a3%e7%ad%94%ef%bc%81%ef%bc%88%e4%b9%8bga%e7%af%87%ef%bc%89/feed/</wfw:commentRss>
		<slash:comments>25</slash:comments>
		</item>
	</channel>
</rss>

