<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>网站分析在中国——从基础到前沿 &#187; Tenly</title>
	<atom:link href="http://www.chinawebanalytics.cn/author/tenly/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.chinawebanalytics.cn</link>
	<description></description>
	<lastBuildDate>Mon, 23 Jan 2012 13:23:05 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.2</generator>
		<item>
		<title>Advanced Segments 快速诊断电子商务网站</title>
		<link>http://www.chinawebanalytics.cn/advanced-segments-ec/</link>
		<comments>http://www.chinawebanalytics.cn/advanced-segments-ec/#comments</comments>
		<pubDate>Sat, 17 Apr 2010 12:07:48 +0000</pubDate>
		<dc:creator>Tenly</dc:creator>
				<category><![CDATA[Featured]]></category>
		<category><![CDATA[电子商务]]></category>
		<category><![CDATA[网站分析工具]]></category>
		<category><![CDATA[GA]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[产品页]]></category>
		<category><![CDATA[优化]]></category>
		<category><![CDATA[网店]]></category>
		<category><![CDATA[网站分析]]></category>
		<category><![CDATA[订单]]></category>
		<category><![CDATA[转化]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/advanced-segments-%e5%bf%ab%e9%80%9f%e8%af%8a%e6%96%ad%e7%94%b5%e5%ad%90%e5%95%86%e5%8a%a1%e7%bd%91%e7%ab%99/</guid>
		<description><![CDATA[前言：寒冷的北京的春，Tenly 周末宅在家独守空房思考，有点想法令我豁然开朗。于是撰文记之，又开始拿 Google Analytics 此工具开始说事了。好久没来宋星这来逛了。
理论：
对于一个需求不太专业的电子商务网站客户来说，他们关注的东西并不多，但是&#8220;转化&#8221;倒是一个重要内容。
面对这种转换分析，常用的方法是使用&#8220;目标&#8221;。以 Google Analytics 为例，即设置特定的页面为目标（Goals），从而知道转换的变化与好坏。对于封闭的，单一的转换，这种方法是完全没有问题的，但是对于非封闭的，而且是动态的页面，方法论就会有一些瑕疵。
网站主问我：&#8220;我的访问者，有多少人会去我的商品页？&#8221;；&#8220;我的访问者，有多少人会去下单？&#8221;

于是使用定义&#8220;目标&#8221;方法的话，需要定义所有的商品页为 Goal 1，购物车页为 Goal 2，&#8230;&#8230;

Goals 的定义是以Page Views为单位的。也就是举例说：

2次 Visits，其中1次，从促销页去查看了3个产品页，另外一次从页面去看了2个产品页，共实现了5个 Goals，转化率为 5 / 2 = 2.5。
2次 Visits，其中1次，从促销页去查看了6个产品页，另外一次直接从首页跳出（Bounce）。这样共有6个 Goals，转化率为 6 / 2 = 3。
结论是后者的转换率高？可是前者2个访问者皆实现了到产品页的转化哦！如果数据放大，这种疑问就值得沉思了。

所以我就觉得有点奇怪，用 Page Views 作分子，Visits 作分母，它们的比值似乎不太对劲。因为个别狂热的的访问，会造成多次的目标实现，就会拉高整站的转换率。
于是我们调整算法，抛弃 Goals 的设定方法：

2次 Visits，其中1次，从促销页去查看了3个产品页，另外一次从页面去看了2个产品页。2次 Visits 都成功转化到了产品页，转化率为 2 / 2 = 100%。
2次 Visits，其中1次，从促销页去查看了6个产品页，另外一次直接从首页跳出（Bounce）。2次 Visits 只有1次转化到了产品页，转化率为 1 / 2 = 50%。
这样看起来是否更合乎逻辑了。因为是 Visits 与 Visits 之间的比，而且分子除以分母的比值永远小于100%。

实践：
基于前面的结论，我们需要知道数据：

1、有多少次访问来到了我们的网站 
		2、其中有多少的访问造成了转化去了我们的任意产品页 
		3、再其中有多少的访问会进去购物车 
		4、然后是下单 &#8211; 物流 &#8211; 支付&#8230;&#8230;

这样才是一个完全的 Funnel 漏斗，而且这个 Funnel 的确是越来越小。
首先，查看我们网站的 Visits，这样可以知道有多少次访问来到了我们的网站。
然后，定义多个 Advanced Segements：


Segement 1（去看过产品页的Visits） 的条件是：Page Contain &#8220;ProductID=&#8221;；
Segement 2（去购物车的Visits）的条件是：Page Contain &#8220;Flow.php&#8221;；
Segement 3 （去下单的Visits）的条件是：Page &#8230;&#8230;（忽略掉请自由发挥）。


不同的电子商务网站的产品页的共性不同，你只需要找出共性，找到他们即可。有的是&#8220;/goods.php?id=888&#8221;，有的是&#8220;/Product/3333.html&#8221;，有的是&#8220;/StyleDetail_9384/&#8221;&#8230;&#8230;

最后，我们开始跑报告，把定义好的 Segements 都应用到报告中去：

结论：
于是得到按周来看，这三个 Segements 的数据（声明：演示数据，数字已人工调整）。

从下面的图表，我们就很容易回答刚才的问题：

本电子商务网站会有 61% 的访问会转化到产品页，从上线第一周开始，随着网站的优化，以及各种促销活动的开展，这个转换率一直在提升。特别是在11周，由于季末大甩卖的促销的有力推动，转化率一度拔高到 67% 的历史最高水平。
从产品到下单的的转化率平均为 3%，低于行业平均水平（行业平均水平为 XX%）。令人关注的是，最近的产品到下单的转化率一路下滑。
尽管有较高比例的用户会访问产品页，但下单的用户转化率偏低，可能存在的问题有：

价格优势不够明显。
页面购买下单的按钮都不明显。
页面设计不够合理。
&#8230;&#8230;&#8230;&#8230;&#8230;&#8230;说一大堆。




]]></description>
			<content:encoded><![CDATA[<p><strong>前言：</strong><font color="#808080">寒冷的北京的春，Tenly 周末宅在家独守空房思考，有点想法令我豁然开朗。于是撰文记之，又开始拿 Google Analytics 此工具开始说事了。好久没来宋星这来逛了。</font></p>
<h3><strong>理论：</strong></h3>
<p>对于一个需求不太专业的电子商务网站客户来说，他们关注的东西并不多，但是&ldquo;转化&rdquo;倒是一个重要内容。</p>
<p>面对这种转换分析，常用的方法是使用&ldquo;目标&rdquo;。以 Google Analytics 为例，即设置特定的页面为目标（Goals），从而知道转换的变化与好坏。对于封闭的，单一的转换，这种方法是完全没有问题的，但是对于非封闭的，而且是动态的页面，方法论就会有一些瑕疵。</p>
<p align="center"><strong>网站主问我：&ldquo;我的访问者，有多少人会去我的商品页？&rdquo;；&ldquo;我的访问者，有多少人会去下单？&rdquo;</strong></p>
<p><span id="more-2180"></span></p>
<p>于是使用定义&ldquo;目标&rdquo;方法的话，需要定义所有的商品页为 Goal 1，购物车页为 Goal 2，&hellip;&hellip;</p>
<p><img alt="E-Commerce Site Simple Structure" border="0" height="362" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/04/image14.png" style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="E-Commerce Site Simple Structure" width="356" /></p>
<p>Goals 的定义是以Page Views为单位的。也就是举例说：</p>
<ul>
<li>2次 Visits，其中1次，从促销页去查看了3个产品页，另外一次从页面去看了2个产品页，共实现了5个 Goals，转化率为 <strong><font color="#ff0000">5 / 2 = 2.5</font></strong>。</li>
<li>2次 Visits，其中1次，从促销页去查看了6个产品页，另外一次直接从首页跳出（Bounce）。这样共有6个 Goals，转化率为 <font color="#ff0000"><strong>6 / 2 = 3</strong></font>。</li>
<li>结论是后者的转换率高？可是前者2个访问者皆实现了到产品页的转化哦！如果数据放大，这种疑问就值得沉思了。</li>
</ul>
<p>所以我就觉得有点奇怪，用 Page Views 作分子，Visits 作分母，它们的比值似乎不太对劲。因为个别狂热的的访问，会造成多次的目标实现，就会拉高整站的转换率。</p>
<p>于是我们调整算法，抛弃 Goals 的设定方法：</p>
<ul>
<li>2次 Visits，其中1次，从促销页去查看了3个产品页，另外一次从页面去看了2个产品页。2次 Visits 都成功转化到了产品页，转化率为 <strong><font color="#ff0000">2 / 2 = 100%</font></strong>。</li>
<li>2次 Visits，其中1次，从促销页去查看了6个产品页，另外一次直接从首页跳出（Bounce）。2次 Visits 只有1次转化到了产品页，转化率为 <strong><font color="#ff0000">1 / 2 = 50%</font></strong>。</li>
<li>这样看起来是否更合乎逻辑了。因为是 Visits 与 Visits 之间的比，而且分子除以分母的比值永远小于100%。</li>
</ul>
<h3>实践：</h3>
<p>基于前面的结论，我们需要知道数据：</p>
<blockquote>
<p>1、有多少次访问来到了我们的网站 <br />
		2、其中有多少的访问造成了转化去了我们的任意产品页 <br />
		3、再其中有多少的访问会进去购物车 <br />
		4、然后是下单 &#8211; 物流 &#8211; 支付&hellip;&hellip;</p>
</blockquote>
<p>这样才是一个完全的 Funnel 漏斗，而且这个 Funnel 的确是越来越小。</p>
<p>首先，查看我们网站的 Visits，这样可以知道有多少次访问来到了我们的网站。</p>
<p>然后，定义多个 Advanced Segements：</p>
<p><img alt="Create Segements in Google Analytics" border="0" height="217" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/04/image15.png" style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="Create Segements in Google Analytics" width="488" /></p>
<ul>
<li>Segement 1（去看过产品页的Visits） 的条件是：<strong>Page</strong> Contain &ldquo;ProductID=&rdquo;；</li>
<li>Segement 2（去购物车的Visits）的条件是：Page Contain &ldquo;Flow.php&rdquo;；</li>
<li>Segement 3 （去下单的Visits）的条件是：Page &hellip;&hellip;（忽略掉请自由发挥）。</li>
</ul>
<blockquote>
<p>不同的电子商务网站的产品页的共性不同，你只需要找出共性，找到他们即可。有的是&ldquo;/goods.php?id=888&rdquo;，有的是&ldquo;/Product/3333.html&rdquo;，有的是&ldquo;/StyleDetail_9384/&rdquo;&hellip;&hellip;</p>
</blockquote>
<p>最后，我们开始跑报告，把定义好的 Segements 都应用到报告中去：</p>
<p><img alt="Apply Segements into Report" border="0" height="280" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/04/image16.png" style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="Apply Segements into Report" width="471" /></p>
<h3>结论：</h3>
<p>于是得到按周来看，这三个 Segements 的数据（声明：演示数据，数字已人工调整）。</p>
<p><img alt="Raw Data" border="0" height="257" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/04/image17.png" style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="Raw Data" width="493" /></p>
<p>从下面的图表，我们就很容易回答刚才的问题：</p>
<ol>
<li>本电子商务网站会有 <strong>61%</strong> 的访问会转化到产品页，从上线第一周开始，随着网站的优化，以及各种促销活动的开展，这个转换率一直在提升。特别是在11周，由于季末大甩卖的促销的有力推动，转化率一度拔高到 <strong>67%</strong> 的历史最高水平。</li>
<li>从产品到下单的的转化率平均为 3%，低于行业平均水平（行业平均水平为 XX%）。令人关注的是，最近的产品到下单的转化率一路下滑。</li>
<li>尽管有较高比例的用户会访问产品页，但下单的用户转化率偏低，可能存在的问题有：
<ul>
<li>价格优势不够明显。</li>
<li>页面购买下单的按钮都不明显。</li>
<li>页面设计不够合理。</li>
<li>&hellip;&hellip;&hellip;&hellip;&hellip;&hellip;说一大堆。</li>
</ul>
</li>
</ol>
<p><img alt="Analytics Chart For Conversion Rates" border="0" height="293" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/04/image18.png" style="border-right-width: 0px; display: block; float: none; border-top-width: 0px; border-bottom-width: 0px; margin-left: auto; border-left-width: 0px; margin-right: auto" title="Analytics Chart For Conversion Rates" width="506" /></p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/advanced-segments-ec/feed/</wfw:commentRss>
		<slash:comments>20</slash:comments>
		</item>
		<item>
		<title>新度量&#8211;深度互动时间</title>
		<link>http://www.chinawebanalytics.cn/%e6%96%b0%e5%ba%a6%e9%87%8f-%e6%b7%b1%e5%ba%a6%e4%ba%92%e5%8a%a8%e6%97%b6%e9%97%b4/</link>
		<comments>http://www.chinawebanalytics.cn/%e6%96%b0%e5%ba%a6%e9%87%8f-%e6%b7%b1%e5%ba%a6%e4%ba%92%e5%8a%a8%e6%97%b6%e9%97%b4/#comments</comments>
		<pubDate>Sun, 20 Dec 2009 11:13:55 +0000</pubDate>
		<dc:creator>Tenly</dc:creator>
				<category><![CDATA[Featured]]></category>
		<category><![CDATA[网站分析的基本度量]]></category>
		<category><![CDATA[网站分析经验分享]]></category>
		<category><![CDATA[GA]]></category>
		<category><![CDATA[工具]]></category>
		<category><![CDATA[度量]]></category>
		<category><![CDATA[理论]]></category>
		<category><![CDATA[研究]]></category>
		<category><![CDATA[虚假互动]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=1399</guid>
		<description><![CDATA[　　在前面的文章提到，仅仅关注 Bounce Rate 是不够的。因为 Bounce Rate 也会被虚假互动所影响。

　　市面上有很多流量购买源，可以导入降低 Bounce Rate 的流量。

　　如果你运营的网站是商业性质的，会购买广告媒介来进行市场和销售的推广与促进，那么你就不得不关注这些看似高质量的流量，并能进行有效的甄别。否则，营销效果是好是坏？如何评估？将无法解答。像句俗话：“被人骗了还帮别人数钱”。

　　如何甄别虚假互动呢？网站分析师或者网站管理人员，需要有效的方法论来指导工作。此文将详细讲述另一种流量质量评估的新度量——深度互动时间（Time Spend on Deep Content）。

下面将按照以下逻辑进行叙述：1.发现虚假互动。2.研究虚假互动的特性。3.分析建立模型来进行甄别。4.实证研究，看看模型的效果。]]></description>
			<content:encoded><![CDATA[<p><img align="left" alt="深度互动--很深很深" border="1" class="alignleft size-full wp-image-1443" height="123" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/12/20e083abd2142ce76df4efbfc817253f.jpg" title="深度互动--很深很深" width="111" />　　在<a href="http://www.chinawebanalytics.cn/?p=1400" target="_blank">前面的文章</a>提到，仅仅关注 Bounce Rate 是不够的。因为 Bounce Rate 也会被虚假互动所影响。</p>
<p>　　市面上有很多流量购买源，可以导入降低 Bounce Rate 的流量。搜索&ldquo;流量购买&rdquo;即可查到。</p>
<p>　　如果你运营的网站是商业性质的，会购买广告媒介来进行市场和销售的推广与促进，那么你就不得不关注这些看似高质量的流量，并能进行有效的甄别。否则，营销效果是好是坏？如何评估？将无法解答。像句俗话：&ldquo;被人骗了还帮别人数钱&rdquo;。</p>
<p>　　如何甄别虚假互动呢？网站分析师或者网站管理人员，需要有效的方法论来指导工作。此文将详细讲述另一种流量质量评估的新度量&mdash;&mdash;深度互动时间（Time Spend on Deep Content）。</p>
<p>下面将按照以下逻辑进行叙述：1.发现虚假互动。2.研究虚假互动的特性。3.分析建立模型来进行甄别。4.实证研究，看看模型的效果。</p>
<p style="text-align: center;"><span class="Apple-style-span" style="color: rgb(51, 51, 51); font-family: Arial,Helvetica; line-height: 21px;">[&nbsp;<a href="http://www.chinawebanalytics.cn/?author=3" style="margin: 0px; padding: 0px; color: rgb(60, 120, 167); text-decoration: none;" target="_blank" title="点击查看更多Tenly的文章">Tenly Wu</a>&nbsp;版权所有欢迎转载，但请事先在下方评论知会作者，并注明出处] &nbsp;</span></p>
<h2>1、发现问题：</h2>
<p>　　在前面的文章提到：网站的Bounce Rate很正常，或者很好，可网站的互动行为却非常的不正常。</p>
<p>　　这样的后果是：如果使用不全面、不科学的的分析方法，分析研究结论会被误导为&ldquo;获得良好的效果&rdquo;。</p>
<h2>2、研究问题：</h2>
<p>　　研究发现，停留时间是甄别虚假互动的突破口。因为虚假互动可以伪造点击，但是深度的停留时间很难伪装，仔细研究现象就会露马脚。</p>
<p>　　以Google Analytics为例，在时间上有很多度量（之前有一篇文章《<a href="http://www.chinawebanalytics.cn/?p=1053" target="_blank">Google Analytics时间观</a>》）。下面我们以一个图说明&ldquo;时间上&rdquo;的问题：</p>
<p>　　图中有四种情况，黄色的为Time on Page，蓝色的Time on Site。如果页面的访问深度是1，那么就会有Bounce。访问深度是大于等于2，就不会Bounce。如图中第二种情况，当深度 = 2 时，Landing Page Time on Page = Landing Page Time on Site。注意到第三和四种情况，深度大于 2 后，Landing Page 的 Time on Site 的时间比 Time on Page 更多。原因是访问者通过Landing Page到达后，会进行一系列的互动，在其它页面的互动时间会算在该页面的 Time on Site 这个度量上。</p>
<p><span style="color: rgb(0, 0, 255);"><strong>Landing Page Time on Site =&nbsp;<br />
	Landing Page Time on Page + Deep Content A Time on Page + Deep Content B Time on Page + &#8230;</strong></span></p>
<p style="text-align: center;"><img align="middle" alt="时间研究" border="1" height="240" src="http://pic.yupoo.com/tenlywu/040758916732/aojwvvky.jpg" width="600" /></p>
<p>　　互动的更深（访问页面多）更久（各页面停留更久），反映了访问者对内容感兴趣，推广效果、网站运营效果良好。</p>
<p>　　现阶段虚假互动能够操作影响到的都是在第一个页面上， 即来到&ldquo;Landing Page&#8211;&gt;停留-&gt;点击链接&rdquo;，我们只需要通过一个度量将这些元素所造成的影响剔除，才可以研究真正的互动程度。</p>
<p style="text-align: center;"><span class="Apple-style-span" style="color: rgb(51, 51, 51); font-family: Arial,Helvetica; line-height: 21px;">[&nbsp;<a href="http://www.chinawebanalytics.cn/?author=3" style="margin: 0px; padding: 0px; color: rgb(60, 120, 167); text-decoration: none;" target="_blank" title="点击查看更多Tenly的文章">Tenly Wu</a>&nbsp;版权所有欢迎转载，但请事先在下方评论知会作者，并注明出处] &nbsp;</span></p>
<h2>3、建立解决模型：</h2>
<p><strong><span style="color: rgb(0, 0, 255);">Average Time Spend on Deep Content = <br />
	( Landing Page Time on Site &#8211; Landing Page Time on Page ) / Landing Page Pageview</span></strong></p>
<p><strong>公式简单说明：</strong>登陆页的全站停留时间，除去登陆页的页面停留的时间。余下的时间就是访问者在页面其它深度页面的停留时间。然后除以这个登陆页的浏览量，则可以求得一个平均的深度互动时间。这个值反映了平均每个访问者，点击登陆页内容后，除掉在登陆页的时间外，在网站上其它页面花的时间长短。有效的剔除了容易被&ldquo;虚假流量&rdquo;影响的登陆页停留时间这个度量。</p>
<h2>4、实证模型：</h2>
<p>举例：建立自定义报告（可以自行定义，但保证Entrance是第一个度量，这样可以保证主要的 Landing Page 显示在前面，也要保证 Time on Page、Time on Site 和 Pageview 这三个度量选中，以便新度量的计算。</p>
<p>下面是我建立的自定义报告共享连接：</p>
<p><a href="http://www.google.com/analytics/reporting/edit_custom_report?share=P01MqyUBAAA.5cmZVfTgv7FSDQaf3SApcOxsrvVFOMhXTyWae26xzB8D2OsZLRP6CRorB5cbkn53KnEyuJAzLj-2rfM18IeuWw.-djiSrTR40xr_JrPt1z4Ow" title="http://www.google.com/analytics/reporting/edit_custom_report?share=P01MqyUBAAA.5cmZVfTgv7FSDQaf3SApcOxsrvVFOMhXTyWae26xzB8D2OsZLRP6CRorB5cbkn53KnEyuJAzLj-2rfM18IeuWw.-djiSrTR40xr_JrPt1z4Ow">http://www.google.com/analytics/reporting/edit_custom_report?share=P01MqyUBAAA.5cmZVfTgv7FSDQaf3SApcOxsrvVFOMhXTyWae26xzB8D2OsZLRP6CRorB5cbkn53KnEyuJAzLj-2rfM18IeuWw.-djiSrTR40xr_JrPt1z4Ow</a></p>
<p style="text-align: center;"><img align="middle" alt="使用新度量后，虚假互动就原形毕露" border="1" height="319" src="http://pic.yupoo.com/tenlywu/824348916734/ptagu07f.jpg" width="360" /></p>
<p>　　套用了新度量进行不同的媒体的评估就显得很清晰了。原来左边第一个 Bounce Rate 特别的好，可是在 Average Time Spend on Deep Content 这个度量上，显得特别的低，开始矛盾了。这说明，最左边的流量中含有大量的虚假互动。</p>
<p>　　那么这个度量值在多少属于差？多少属于好呢？</p>
<p style="text-align: center;"><span class="Apple-style-span" style="color: rgb(51, 51, 51); font-family: Arial,Helvetica; line-height: 21px;">[&nbsp;<a href="http://www.chinawebanalytics.cn/?author=3" style="margin: 0px; padding: 0px; color: rgb(60, 120, 167); text-decoration: none;" target="_blank" title="点击查看更多Tenly的文章">Tenly Wu</a>&nbsp;版权所有欢迎转载，但请事先在下方评论知会作者，并注明出处] &nbsp;</span></p>
<p>　　下面是我们的经验值：对于一些有广告推广的网站而言，低于 1 秒就是很差了，说明推广的效果非常差。5 秒以上就是很不错了。</p>
<p>　　你知道<a href="http://www.chinawebanalytics.cn">宋星</a>的这个博客：Chinawebanalytics.cn的深度互动时间么？123秒。<span style="color: rgb(255, 0, 0);"><strong>也欢迎大家把你的博客的深度互动时间与大家分享。</strong></span></p>
<p>　　没错，这个度量很好的扩大了真流量与虚假流量的差距，这种杠杆方法常用在统计学研究中当中。</p>
<p>　　俗话说：偏之毫厘，差之千里。那么一点点的具有虚假互动性质的流量，都会对这个度量有明显的影响。</p>
<p>　　像老虎的猫，终究是猫。所以流量的质量是客观的，好与不好，换个方法照样能把它甄别出来。</p>
<p>　　由于时间仓促，文章只将概要的思路与大家分享，欢迎大家拍砖或提问，我一一为你解答。或者不足的地方还请大家留言帮助我完善。实在留言解答不了的问题，可以 Gtalk 联系我。谢谢！</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/%e6%96%b0%e5%ba%a6%e9%87%8f-%e6%b7%b1%e5%ba%a6%e4%ba%92%e5%8a%a8%e6%97%b6%e9%97%b4/feed/</wfw:commentRss>
		<slash:comments>23</slash:comments>
		</item>
		<item>
		<title>案例分析——仅关注Bounce Rate是不够的</title>
		<link>http://www.chinawebanalytics.cn/bounce-rate-not/</link>
		<comments>http://www.chinawebanalytics.cn/bounce-rate-not/#comments</comments>
		<pubDate>Sat, 12 Dec 2009 07:41:25 +0000</pubDate>
		<dc:creator>Tenly</dc:creator>
				<category><![CDATA[Featured]]></category>
		<category><![CDATA[网站分析经验分享]]></category>
		<category><![CDATA[Bounce Rate]]></category>
		<category><![CDATA[Click Fraud]]></category>
		<category><![CDATA[Engagement]]></category>
		<category><![CDATA[Google Analytics]]></category>
		<category><![CDATA[网站优化]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=1400</guid>
		<description><![CDATA[Bounce Rate 是很容易被操纵的，我称之为“被管理”。通过虚假互动的作用，可以让它很高，也可以让它很低。
如果“设置”导入的流量不做任何行为，就可以让 Bounce Rate 升高；
如果“设置”导入的流量具有点击行为，就可以让 Bounce Rate 降低。
　　让我们看看两个页面的案例，来了解 Bounce Rate 在虚假互动影响下的“腐败”：]]></description>
			<content:encoded><![CDATA[<p>　　<a href="http://www.chinawebanalytics.cn/?tag=bounce-rate" target="_blank">Bounce Rate</a> <font color="#808080">（中文：跳出率【GA叫法】、蹦失率【宋星娱乐叫法】、1 &#8211; 二跳率【国内普遍叫法】、单页面访问率【百度统计叫法】）</font>一直是本站搜索引擎来源的重要关键词之一。</p>
<p>　　从事网站分析的朋友们都清楚该度量在网站分析过程中的重要作用：了解用户在 Landing Page (登陆页) 的参与度，帮助网站优化页面，帮助优化流量来源。然而，如果 Bounce Rate 不值得信赖怎么办？</p>
<p>　　作为网站优化过程中的重要度量 Bounce Rate，一般是可靠的。但如果有问题的流量过来的话， Bounce Rate 就会受到污染，而失去可靠性。早在2007年10月，<a href="http://www.doyj.com/" target="_blank">扫地老僧</a>就撰文写过题为《<a href="http://www.doyj.com/2007/10/09/%E8%B4%AD%E4%B9%B0%E6%B5%81%E9%87%8F%E6%80%BB%E7%BB%93/" target="_blank">购买流量总结</a>》的文章，描述了问题流量对 Bounce Rate 的影响。</p>
<p>　　我简单的总结该文章内容：在不同时期从两个流量出售网站上购买流量后，一股流量使 Landing Page 的 Bounce Rate 达到 99.73%，一股流量使 Landing Page 的 Bounce Rate 达到 46.28%。作者深入分析结果是两股流量都没有价值，前者对页面的点击互动极少，后者对页面的点击互动不合乎常理。</p>
<p>　　这说明 Bounce Rate 是很容易被操纵的，我称之为&ldquo;被管理&rdquo;。通过虚假互动的作用，可以让它很高，也可以让它很低。</p>
<blockquote>
<p>如果&ldquo;设置&rdquo;导入的流量不做任何行为，就可以让 Bounce Rate 升高；<br />
		如果&ldquo;设置&rdquo;导入的流量具有点击行为，就可以让 Bounce Rate 降低。</p>
</blockquote>
<p>　　让我们看看两个页面的案例，来了解 Bounce Rate 在虚假互动影响下的&ldquo;腐败&rdquo;：【未完，请点击上面文章标题阅读全文】<span id="more-1400"></span></p>
<p align="center">[ <a href="http://www.chinawebanalytics.cn/?author=3" target="_blank" title="点击查看更多Tenly的文章">Tenly Wu</a> 版权所有欢迎转载，但请事先在下方评论知会作者，并注明出处]</p>
<h3>案例一：</h3>
<p align="center"><img alt="Good Bounce Rate" border="0" height="251" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/12/BounceRateA2.png" title="Good Bounce Rate" width="570" /></p>
<p>　　在某年的4月至5月期间，某站的 Bounce Rate 只有66.92%，这是一个&ldquo;非常好&rdquo;的网站。这么好质量的网站，用户都关注了什么内容呢？我把 Top 10 Content 的数据导出来（考虑到隐私，我把页面URI进行了适当的省略）：</p>
<table align="center" border="1" cellpadding="6" cellspacing="0" width="550">
<tbody>
<tr>
<td>网页</td>
<td>综合浏览量</td>
<td>唯一身份综合浏览量</td>
</tr>
<tr>
<td>/200904/family/holiday.html</td>
<td>90387</td>
<td>90318</td>
</tr>
<tr>
<td>/200904/family/index.html</td>
<td>55107</td>
<td>53032</td>
</tr>
<tr>
<td>20081225039201_shtml</td>
<td>2541</td>
<td>2510</td>
</tr>
<tr>
<td>20081218035601_shtml</td>
<td>2494</td>
<td>2446</td>
</tr>
<tr>
<td>20090422045701_shtml</td>
<td>2459</td>
<td>2458</td>
</tr>
<tr>
<td><strong><u><font color="#ff0000">bottomfile_hzhb_shtml</font></u></strong></td>
<td><strong><u><font color="#ff0000">2194</font></u></strong></td>
<td><strong><u><font color="#ff0000">2172</font></u></strong></td>
</tr>
<tr>
<td><strong><u><font color="#ff0000">bottomfile_gyhc_shtml</font></u></strong></td>
<td><strong><u><font color="#ff0000">2109</font></u></strong></td>
<td><strong><u><font color="#ff0000">2088</font></u></strong></td>
</tr>
<tr>
<td><strong><u><font color="#ff0000">bottomfile_tgzn_shtml</font></u></strong></td>
<td><strong><u><font color="#ff0000">2074</font></u></strong></td>
<td><strong><u><font color="#ff0000">2056</font></u></strong></td>
</tr>
<tr>
<td><strong><u><font color="#ff0000">bottomfile_ggfw_shtml</font></u></strong></td>
<td><strong><u><font color="#ff0000">2068</font></u></strong></td>
<td><strong><u><font color="#ff0000">2046</font></u></strong></td>
</tr>
<tr>
<td><strong><u><font color="#ff0000">bottomfile_sytk_shtml</font></u></strong></td>
<td><strong><u><font color="#ff0000">2061</font></u></strong></td>
<td><strong><u><font color="#ff0000">2034</font></u></strong></td>
</tr>
</tbody>
</table>
<p>　　这些红色字体的内容是什么呢？经查验，大量的互动行为都点击在页面底部的：合作伙伴(hzhb)、投稿指南(tgzn)、广告服务(ggfw)、使用条款(sytk) &hellip;&hellip;</p>
<p><strong>　　所以一切都非常逻辑清晰了：绝大部分流量都是没有价值的、作弊的！尽管有大量的互动点击行为，Bounce Rate &ldquo;被&rdquo;降低，可是这些互动行为都不合常理地点击页面的底部。</strong></p>
<p align="center">[ <a href="http://www.chinawebanalytics.cn/?author=3" target="_blank" title="点击查看更多Tenly的文章">Tenly Wu</a> 版权所有欢迎转载，但请事先在下方评论知会作者，并注明出处]</p>
<h3><strong>案例二</strong></h3>
<p>　　在案例一中，虚假互动行为全部集中在页面的底部。我们知道页面&ldquo;头部Header&rdquo;与&ldquo;底部Footer&rdquo;往往是一个网站共用的。这样虚假的流量通过&ldquo;设置&rdquo;后，无论登陆该站哪个指定页面都能进行统一的&ldquo;一套虚假互动&rdquo;，从而使整个大站下的所有 Landing Page 页面 Bounce Rate 得到&ldquo;被优化&rdquo;。</p>
<p>　　案例二将描述更高明的虚假互动。按照常理，一个页面最受欢迎且最容易被点击的内容都在第一二屏。所以作为 Landing Page ，页面中的大部分点击行为都会集中在页面的中上部。下边是我引用的Google的标准点击热图(Heat Map)。</p>
<p align="center"><img alt="Tenly 文章用图" border="0" height="297" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/12/image.png" title="Tenly 文章用图" width="277" /><br />
	<img alt="Bounce-Rate A3" border="0" height="200" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/12/BounceRateA3.png" title="Bounce-Rate A3" width="570" /></p>
<p>　　与案例一不同，这个案例的 Bounce Rate 一点也不出众。打开GA，查看其 Bounce Rate 有87.88%，而且一直非常的稳定，这是不容易引起人们注意的。然而，最危险的欺骗，往往是在最平凡的外表下的。起初没有发现这页面的问题所在，可是当对 Landing Page 进行 Heat Map 分析的时候，问题出现了：</p>
<p>　　用<img align="right" alt="Tenly文章图片" height="482" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/12/Engagement.jpg" width="261" />户在点击推广广告，来到 Landing Page 后的互动行为中最受欢迎的10大点击链接如下表，分散地点击在不同的位置上。</p>
<table border="0" cellpadding="0" cellspacing="0" width="189">
<tbody>
<tr>
<td style="text-align: center;" width="21">&nbsp;</td>
<td style="text-align: center;" width="123">Top 10 Content</td>
<td style="text-align: center;" width="43">Hits</td>
</tr>
<tr>
<td style="text-align: center;" width="21">1</td>
<td style="text-align: center;" width="123">XXX</td>
<td style="text-align: center;" width="43">587</td>
</tr>
<tr>
<td style="text-align: center;" width="21">2</td>
<td style="text-align: center;" width="123">XXXX</td>
<td style="text-align: center;" width="43">523</td>
</tr>
<tr>
<td style="text-align: center;" width="21">3</td>
<td style="text-align: center;" width="123">XXXXX</td>
<td style="text-align: center;" width="43">387</td>
</tr>
<tr>
<td style="text-align: center;" width="21">4</td>
<td style="text-align: center;" width="123">Xxxxxxxx</td>
<td style="text-align: center;" width="43">328</td>
</tr>
<tr>
<td style="text-align: center;" width="21">5</td>
<td style="text-align: center;" width="123">Xxxxxxxxx</td>
<td style="text-align: center;" width="43">323</td>
</tr>
<tr>
<td style="text-align: center;" width="21">6</td>
<td style="text-align: center;" width="123">Xxxxxxxxxx</td>
<td style="text-align: center;" width="43">320</td>
</tr>
<tr>
<td style="text-align: center;" width="21">7</td>
<td style="text-align: center;" width="123">Xxxxxxxxxxx</td>
<td style="text-align: center;" width="43">313</td>
</tr>
<tr>
<td style="text-align: center;" width="21">8</td>
<td style="text-align: center;" width="123">Xxxxxxxxxxxxx</td>
<td style="text-align: center;" width="43">308</td>
</tr>
<tr>
<td style="text-align: center;" width="21">9</td>
<td style="text-align: center;" width="123">Xxxxxxxxxxxxxx</td>
<td style="text-align: center;" width="43">308</td>
</tr>
<tr>
<td style="text-align: center;" width="21">10</td>
<td style="text-align: center;" width="123">xxxxxxxxxxxxxxx</td>
<td style="text-align: center;" width="43">269</td>
</tr>
</tbody>
</table>
<p>　　于是，我把这10大点击内容标注在页面上。结果发现，这些内容都是在页面中第三屏以下的内容。令人惊讶的是，排名第一的链接居然是页面的底部偏上。后来再仔细研究，第一屏与第二屏众多链接内容，居然没有一个能排进前20名。</p>
<p><strong>　　所以逻辑已经清晰：虚假互动行为是可以&ldquo;被管理&rdquo;的，可以分散地&ldquo;被点击&rdquo;页面中的多个内容，Bounce Rate 也将会&ldquo;被&rdquo;降低。也就是说，实际的这个页面真正 Bounce Rate 至少有99%以上，之所有能够到87.88%，完全是虚假互动行为所致。</strong></p>
<p align="center">[ <a href="http://www.chinawebanalytics.cn/?author=3" target="_blank" title="点击查看更多Tenly的文章">Tenly Wu</a> 版权所有欢迎转载，但请事先在下方评论知会作者，并注明出处] &nbsp;</p>
<p>　　有人问：也许第一二屏的内容的确就不吸引人，下面的内容就足够的吸引人。事实上，在实际案例背后，分析师还有项目的更多佐证信息帮助研究判断，在此有限篇幅就不作冗余说明。主要的思想是为了说明：虚假互动行为是能够&ldquo;被管理&rdquo;的。</p>
<p>　　聪明的你也许会想到，如果虚假互动行为&ldquo;管理&rdquo;得好，全部集中在第一二屏的话，Heatmap 研究估计就没有作用了。那还有没有一种有效的办法可以快速识别虚假互动呢？</p>
<p>　　有方法的！在我被&ldquo;虚假互动&rdquo;持续困扰一年后，通过Google Analytics工具，找到一个不错的方法。敬请关注下周文章：《<strong><a href="http://www.chinawebanalytics.cn/?p=1399">新度量&mdash;&mdash;深度互动时间</a>》</strong></p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/bounce-rate-not/feed/</wfw:commentRss>
		<slash:comments>25</slash:comments>
		</item>
		<item>
		<title>Google Analytics的时间观与自定义报告</title>
		<link>http://www.chinawebanalytics.cn/google-analytics%e7%9a%84%e6%97%b6%e9%97%b4%e8%a7%82%e4%b8%8e%e8%87%aa%e5%ae%9a%e4%b9%89%e6%8a%a5%e5%91%8a/</link>
		<comments>http://www.chinawebanalytics.cn/google-analytics%e7%9a%84%e6%97%b6%e9%97%b4%e8%a7%82%e4%b8%8e%e8%87%aa%e5%ae%9a%e4%b9%89%e6%8a%a5%e5%91%8a/#comments</comments>
		<pubDate>Fri, 25 Sep 2009 00:48:53 +0000</pubDate>
		<dc:creator>Tenly</dc:creator>
				<category><![CDATA[监测工具]]></category>
		<category><![CDATA[Google Analytics]]></category>
		<category><![CDATA[度量]]></category>
		<category><![CDATA[时间]]></category>
		<category><![CDATA[自定义报告]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=1053</guid>
		<description><![CDATA[前言
在Google Analytics中，有很多个时间度量：
Time on Page，&#8721; Time on Page，Avg. Time on Page；      
Time on Site，&#8721; Time on Site，Avg. Time on Site。(Avg.是Average的缩写）
在WA的过程中，基本度量非常重要，原理一定需要百分之百清楚。我以前想当然地以为自己理解了，但事实并不是这样。下面就严谨地详细地与大家分享一 下（有些枯燥）：
说明与定义：

为标准化度量名称，本文相关度量均用英文表示；
文中的&#8220;本站&#8221;，指添加了同一UA ID Google Analytics监测代码的所有页面集合；
&#8220;站外&#8221;，指未添加Google Analytics监测代码或&#8220;本站&#8221;UA ID不一致的页面集合。
&#8220;站外&#8221;与&#8220;本站&#8221;的关系：本站 &#8745; 站外 = 0，本站 &#8746; 站外 = &#8734;（即整个互联网）。
监测部署是以标准的Google Analytics监测代码为准，不考虑使用虚拟 Pageview Tracker 或 Event Tracker 等定制化监测情况。


基于页面的时间度量
Time on Page and &#8721; Time on Page：
访问者停留在某个页面的时间，所有访问者在一批页面的停留时间总和。对于跳出到站外的访问， Google Analytics将无法统计最后一个访问页面的停留时间。英文详细标准定义如下：

This field indicates how long a visitor spent on a particular page or set of pages. It is calculated by subtracting the initial view time for a particular page from the initial view time for a subsequent ...]]></description>
			<content:encoded><![CDATA[<h3><strong>前言</strong></h3>
<p>在Google Analytics中，有很多个时间度量：</p>
<p><strong>Time on Page，<strong>&sum;</strong> Time on Page，</strong><strong>Avg. Time on Page；      <br />
Time on Site，<strong>&sum; Time on Site</strong>，<strong>Avg. Time on Site。</strong>(Avg.是Average的缩写）</strong></p>
<p>在WA的过程中，基本度量非常重要，原理一定需要百分之百清楚。我以前想当然地以为自己理解了，但事实并不是这样。下面就严谨地详细地与大家分享一 下（有些枯燥）：</p>
<h3><strong>说明与定义：</strong></h3>
<ul>
<li>为标准化度量名称，本文相关度量均用英文表示；</li>
<li>文中的&ldquo;本站&rdquo;，指添加了同一UA ID Google Analytics监测代码的所有页面集合；</li>
<li>&ldquo;站外&rdquo;，指未添加Google Analytics监测代码或&ldquo;本站&rdquo;UA ID不一致的页面集合。</li>
<li>&ldquo;站外&rdquo;与&ldquo;本站&rdquo;的关系：本站 &cap; 站外 = 0，本站 &cup; 站外 = &infin;（即整个互联网）。</li>
<li>监测部署是以标准的Google Analytics监测代码为准，不考虑使用虚拟 Pageview Tracker 或 Event Tracker 等定制化监测情况。</li>
</ul>
<p><span id="more-1053"></span></p>
<h3><strong>基于页面的时间度量</strong></h3>
<p><strong><u>Time on Page and <strong>&sum; Time on Page</strong></u></strong>：</p>
<p>访问者停留在某个页面的时间，所有访问者在一批页面的停留时间总和。对于跳出到站外的访问， Google Analytics将无法统计最后一个访问页面的停留时间。英文详细标准定义如下：</p>
<blockquote>
<p><em>This field indicates how long a visitor spent on a particular page or set of pages. It is calculated by subtracting the initial view time for a particular page from the initial view time for a subsequent page. Thus, this metric does not apply to exit pages for your site.</em></p>
</blockquote>
<p><strong><u>Avg. Time on Page</u></strong>：</p>
<p>一个特定页面的平均停留时间 等于 所有访问者在该页面的停留时间之和，除以该页面的 Pageview 与 Exit（或Entrance）之差。</p>
<blockquote>
<p>公式：Avg. Time on Page = &sum; Time on Page / (Pageviews&ndash; Exits)</p>
</blockquote>
<p>需要说明的是：如果访问者只访问该页面一次，且这该页面是离开本站前的最后一个页面，那么他的停留在该页面时间为零。</p>
<h3>基于网站（页面的集合）的时间度量</h3>
<p><img width="500" height="200" border="0" src="http://pic.yupoo.com/tenlywu/2122081f1f07/medium.jpg" alt="Time-on-site" /></p>
<p><strong><u>Time on Site</u></strong>：一个访问者在本站所停留的时间，即停留在本站所有页面的时间之和。如上图一个访问者，Time on Site = Time on Page A + Time on Page B + <strong>Time on Page C</strong> = 2:25。尽管 Time on Page C = 0，但它也会参与到Time on Site的求和计算过程中。下方是官方英文标准定义：</p>
<blockquote>
<p><em>The time a visitor spends on your site.</em></p>
</blockquote>
<p><strong><u>&sum; Time on Site</u></strong>：一类访问者在本站所停留的时间之和。</p>
<p><strong><u>Avg. Time on Site</u></strong>：访问者在本站平均停留时间。公式为：</p>
<blockquote>
<p>Avg. Time on Site = &sum; Time on Site / Visits</p>
</blockquote>
<p>对于本站而言，Visits 的值等于所有的登陆页的 Entrances 之和。    <br />
这里的除数是包括了Bounce部分，意味着，有些Entrance并未造成停留时间增加。因为一个 Visit Entrance到登陆页，什么都没干 Bounce 走了，虽然 Entrance + 1，Pageview + 1，Visit + 1，但这个访问 Time 为 0 。而他们要在公式中与其它 Visits 分享 Time on Site。</p>
<h3><strong>利用自定义报告理解度量间关系</strong></h3>
<p>在Google Analytics的自定义报告中，左边有许多的 Dimensions 和 Metrics 供你选择，大家不妨拖拽着玩玩，了解主体与度量之间的关系。比如说：</p>
<ul>
<li>当你选择 Dimensions 为 Landing Page， Exit Page 的时候，Time on Site 与 Avg. Time on Site 就会变灰（无法选择）。因为作为特定的功能页主体，是无法具有 Time on Site 这种属性度量的。</li>
<li>但是当你选择 Dimensions 为 Source， City 的时候， Time on Site 与 Avg. Time on Site 就能选择。因访问者类型作为主体时，就能使用 Time on Site 这种属性度量。</li>
<li>更奇怪的是，当你选择 Dimensions 为 Page 的时候， Time on Site 与 Unique Pageviews 两种分别为 Site Usage 和 Content 类的度量只能二选一。</li>
</ul>
<p>最后，跑一个Dimensions 为 Landing Page 的自定义报告，大家可研究一下度量间的关系，结论公式如下：</p>
<blockquote>
<p><strong>Time on Page / Avg. Time on Page + Entrances or Exits = Pageviews</strong></p>
</blockquote>
<p><img width="760" height="240" border="0" src="http://pic.yupoo.com/tenlywu/2505381f10d1/faxl2ku5.jpg" alt="Table" /></p>
<h3><strong>思考题</strong></h3>
<p>最后留一个问题让大家思考，帮助大家自己研究体会，欢迎大家留言交流解答（正确答案将在国庆节公布）：</p>
<p>如果再跑一个Dimensions 为 Page 的自定义报告，大家会发现，同样的 Page 01，02 的各个页面，Time on Page、Avg. Time on Page、 Exits、Pageviews、 Unique Pageviews 度量的数据都不同了。为什么呢？</p>
<p><a href="http://pic.yupoo.com/tenlywu/2218881f2898/kp9jwzps.jpg" title="放大查看"><img width="760" height="155" border="0" src="http://pic.yupoo.com/tenlywu/2218881f2898/kp9jwzps.jpg" alt="Table2" /></a></p>
<p>期待您的回答。。。</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/google-analytics%e7%9a%84%e6%97%b6%e9%97%b4%e8%a7%82%e4%b8%8e%e8%87%aa%e5%ae%9a%e4%b9%89%e6%8a%a5%e5%91%8a/feed/</wfw:commentRss>
		<slash:comments>33</slash:comments>
		</item>
		<item>
		<title>网站分析从业者的职业习惯</title>
		<link>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e4%bb%8e%e4%b8%9a%e8%80%85%e7%9a%84%e8%81%8c%e4%b8%9a%e4%b9%a0%e6%83%af/</link>
		<comments>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e4%bb%8e%e4%b8%9a%e8%80%85%e7%9a%84%e8%81%8c%e4%b8%9a%e4%b9%a0%e6%83%af/#comments</comments>
		<pubDate>Mon, 07 Sep 2009 06:43:10 +0000</pubDate>
		<dc:creator>Tenly</dc:creator>
				<category><![CDATA[网站分析经验分享]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=959</guid>
		<description><![CDATA[我喜欢浏览网页时多个心眼。这个心眼需要观察许多元素，每个元素都能提供信息。孤立的一个元素不重要，但是多个元素组成的信息，往往能获得有价值的判断。那么从这些元素说起：
&#160;
永远不忽略URL
URL是一个重要的信息，职业敏感让分析师绝对不会忽略URL地址的特点。URL反映出网站的蛛丝马迹，直接以例子说话:
$ URL地址所在的域名
很多人在网上被骗，很大原因就是从来不关注URL所在的域名。

比如：http://www.taobao.ipx32.com/about.html，看似弱智的骗术却让很多网友误以为是淘宝的网站而落入圈套。这是ipx32域的网站，而不是taobao的网站。       
    在浏览的过程中，时刻关注页面的URL域名，可以知道点击链接是否离开本站，而关注新到的站点域名有何特征。在许多大客户的营销过程中，跨域的链接是很常见的，不同的域意味着站长或广告主的监测工具与策略也会有所不同。
比如：在IT门户中常有Intel，华硕，HP等硬件厂商的专题页面（可能会添加Google Analytics或Nielsen的监测代码），这些页面中会有链接将访问者导入新的域名，如intel.com.cn，或者hp.com.cn（可能会添加Omniture、HBX或Webtrends的监测代码）。这种跨域的URL是显而易见的。


$ URL地址所包含的参数
URL中包含参数是再常见不过了，但每个参数都有含义，关注它们能够全面掌握网站的功能特点。比如：

http://www.chinawebanalytics.cn/?p=917 这是Sidney的新博客的地址，可以分析这个博客运营了挺长的一段时间了，ID号都排到917了。
http://adsclick.qq.com/adsclick?oid=1112901&#38;loc=QQ_SX_JY_Test6&#38;url=http://www.52-abc.com/ 这是QQ首页的右侧广告链接，里面丰富的参数告诉了我们对这些广告位的名称定义，以及跳转的目标地址。
http://www.soso.com/q?sp=S&#38;sc=web&#38;cid=w.q.in.sb.web&#38;ty=1&#38;bn=&#38;op=entry&#38;kw=&#38;w=WA 这是腾讯搜搜的&#8220;WA&#8221;结果页，告诉我们搜索关键词参数是用W变量。还有一些别的参数，也许一下子看不懂，如果有需要可再多次试验研究，就可以确定。

总之，对URL的参数关注是分析师的基本功。
$ URL地址所指向的文件类型
URL中会包括文件类型的信息。

HTML/HTM：这说明这种网站的页面是经过静态化处理的，以方便搜索引擎抓取。现在大部分门户与CMS系统都会有静态化处理功能。再有一些简单的个人网页也会使用html文件名。
JSP/PHP/ASPX/ASP：这说明这是一种动态页面，网页源文件是存在服务器端，这些文件的特性可自行搜索了解。
无类型：有些地址，http://www.ectend.com，这是属于服务器自定义了主页，效果其实是http://www.ectend.com/index.php
.do：http://www.ems.com.cn/qcgzOutQueryAction.do?reqCode=gotoSearch 这种情况是jsp开发的网站。其实不需要完全知道，能辅助即可。这种网站一般有一定的技术含量，但技术实力不强，不够先进，常见于一些国资背景企业的功能型网页，或者网站的后台。因为时下好的网站，在前端页面都能将URL隐藏得很好，不会出现.do这种情况。
另外：还有一些开源项目的网站URL地址比较特别，如Wordpress：http://www.ectend.com/index.php/excellent-analytics/；或 Wikipedia：http://zh.wikipedia.org/wiki/Wikipedia:首页。

$ URL地址命名的特征
从URL的命名也能发现蹊跷或有趣的事，比如：

淘宝的URL特征就很有意思，是通过base 64编码的。（感谢money的指点，修正原来错误，很有收获，再次说明URL里有乾坤），很多&#8220;-&#8221;。我推测&#8220;&#8211;&#8221;之间代表着变量，如果中间没有值，就代表这个变量没有定义。      
    http://list.taobao.com/browse/50018957-50018960/n-1-1---------------------0---------yes---------------------2-------b--40--commend-0-all-50018960.htm?ssid=r18?ad_id=&#38;am_id=&#38;cm_id=&#38;pm_id=
凡客诚品的URL也很有特色：        
    http://www.vancl.com/Product_1E10000/RuanNiuPiXiDaiXiuXianXie+HeiSe.html，产品拼音+颜色。
另外还能找出他们员工粗心之处：我们知道中文括号（）与英文括号()不同，URL地址中只能出现英文括号，中文括号会翻译成编码。可见Vancl的员工在产品录入时没有统一标准：      
    http://www.vancl.com/CategoryList-1440-1--1/GaoJiMianTangQuanMianChenShan%EF%BC%88ZunGuiKuan%EF%BC%89.html       
    http://www.vancl.com/CategoryList-1324-1--1/ShangWuXiuXianKu(BiaoZhunKuan).html 

网页源文件
对于好奇的网页，一定要查看网页源文件。通过源文件的快速浏览能够确定网站的技术实力、设计人员的素质，监测工具与监测方法的部署情况。一般关注以下四点：

代码是否干净还是冗烦
部署了哪些监测工具
监测工具的代码部署的位置与顺序
是否加入了可疑代码

]]></description>
			<content:encoded><![CDATA[<p><img border="0" align="right" src="http://www.ectend.com/wp-content/uploads/habbit.gif" alt="职业习惯" title="职业习惯" style="margin: 0px 0px 0px 15px;" />我喜欢浏览网页时多个心眼。这个心眼需要观察许多元素，每个元素都能提供信息。孤立的一个元素不重要，但是多个元素组成的信息，往往能获得有价值的判断。那么从这些元素说起：</p>
<p>&nbsp;</p>
<h2>永远不忽略URL</h2>
<p>URL是一个重要的信息，职业敏感让分析师绝对不会忽略URL地址的特点。URL反映出网站的蛛丝马迹，直接以例子说话:</p>
<h3>$ URL地址所在的域名</h3>
<p>很多人在网上被骗，很大原因就是从来不关注URL所在的域名。</p>
<ul>
<li>比如：<code>http://www.taobao.ipx32.com/about.html</code>，看似弱智的骗术却让很多网友误以为是淘宝的网站而落入圈套。这是ipx32域的网站，而不是taobao的网站。       <br />
    在浏览的过程中，时刻关注页面的URL域名，可以知道点击链接是否离开本站，而关注新到的站点域名有何特征。在许多大客户的营销过程中，跨域的链接是很常见的，不同的域意味着站长或广告主的监测工具与策略也会有所不同。</li>
<li>比如：在IT门户中常有Intel，华硕，HP等硬件厂商的专题页面（可能会添加Google Analytics或Nielsen的监测代码），这些页面中会有链接将访问者导入新的域名，如intel.com.cn，或者hp.com.cn（可能会添加Omniture、HBX或Webtrends的监测代码）。这种跨域的URL是显而易见的。</li>
</ul>
<p><span id="more-959"></span></p>
<h3>$ URL地址所包含的参数</h3>
<p>URL中包含参数是再常见不过了，但每个参数都有含义，关注它们能够全面掌握网站的功能特点。比如：</p>
<ul>
<li><code>http://www.chinawebanalytics.cn/?p=917</code> 这是Sidney的新博客的地址，可以分析这个博客运营了挺长的一段时间了，ID号都排到917了。</li>
<li><code>http://adsclick.qq.com/adsclick?oid=1112901&amp;loc=QQ_SX_JY_Test6&amp;url=http://www.52-abc.com/</code> 这是QQ首页的右侧广告链接，里面丰富的参数告诉了我们对这些广告位的名称定义，以及跳转的目标地址。</li>
<li><code>http://www.soso.com/q?sp=S&amp;sc=web&amp;cid=w.q.in.sb.web&amp;ty=1&amp;bn=&amp;op=entry&amp;kw=&amp;w=WA</code> 这是腾讯搜搜的&ldquo;WA&rdquo;结果页，告诉我们搜索关键词参数是用W变量。还有一些别的参数，也许一下子看不懂，如果有需要可再多次试验研究，就可以确定。</li>
</ul>
<p>总之，对URL的参数关注是分析师的基本功。</p>
<h3>$ URL地址所指向的文件类型</h3>
<p>URL中会包括文件类型的信息。</p>
<ul>
<li><strong>HTML/HTM</strong>：这说明这种网站的页面是经过静态化处理的，以方便搜索引擎抓取。现在大部分门户与CMS系统都会有静态化处理功能。再有一些简单的个人网页也会使用html文件名。</li>
<li><strong>JSP/PHP/ASPX/ASP：</strong>这说明这是一种动态页面，网页源文件是存在服务器端，这些文件的特性可自行搜索了解。</li>
<li><strong>无类型</strong>：有些地址，<code>http://www.ectend.com</code>，这是属于服务器自定义了主页，效果其实是<code>http://www.ectend.com/index.php</code></li>
<li><strong>.do</strong>：<code>http://www.ems.com.cn/qcgzOutQueryAction.do?reqCode=gotoSearch</code> 这种情况是jsp开发的网站。其实不需要完全知道，能辅助即可。这种网站一般有一定的技术含量，但技术实力不强，不够先进，常见于一些国资背景企业的功能型网页，或者网站的后台。因为时下好的网站，在前端页面都能将URL隐藏得很好，不会出现.do这种情况。</li>
<li><strong>另外</strong>：还有一些开源项目的网站URL地址比较特别，如Wordpress：<code>http://www.ectend.com/index.php/excellent-analytics/</code>；或 Wikipedia：<code>http://zh.wikipedia.org/wiki/Wikipedia:首页</code>。</li>
</ul>
<h3>$ URL地址命名的特征</h3>
<p>从URL的命名也能发现蹊跷或有趣的事，比如：</p>
<ul>
<li>淘宝的URL特征就很有意思，是通过base 64编码的。（感谢money的指点，修正原来错误，很有收获，再次说明URL里有乾坤），<strike>很多&ldquo;-&rdquo;。我推测&ldquo;&#8211;&rdquo;之间代表着变量，如果中间没有值，就代表这个变量没有定义</strike>。      <br />
    <code>http://list.taobao.com/browse/50018957-50018960/n-1-1---------------------0---------yes---------------------2-------b--40--commend-0-all-50018960.htm?ssid=r18?ad_id=&amp;am_id=&amp;cm_id=&amp;pm_id=</code></li>
<li>凡客诚品的URL也很有特色<font color="#333333">：        <br />
    </font><code>http://www.vancl.com/Product_1E10000/RuanNiuPiXiDaiXiuXianXie+HeiSe.html</code>，产品拼音+颜色。</li>
<li>另外还能找出他们员工粗心之处：我们知道中文括号（）与英文括号()不同，URL地址中只能出现英文括号，中文括号会翻译成编码。可见Vancl的员工在产品录入时没有统一标准：      <br />
    <code>http://www.vancl.com/CategoryList-1440-1--1/GaoJiMianTangQuanMianChenShan<strong>%EF%BC%88</strong>ZunGuiKuan<strong>%EF%BC%89</strong>.html</code>       <br />
    <code>http://www.vancl.com/CategoryList-1324-1--1/ShangWuXiuXianKu(BiaoZhunKuan).html </code></li>
</ul>
<h2>网页源文件</h2>
<p>对于好奇的网页，一定要查看网页源文件。通过源文件的快速浏览能够确定网站的技术实力、设计人员的素质，监测工具与监测方法的部署情况。一般关注以下四点：</p>
<ul>
<li>代码是否干净还是冗烦</li>
<li>部署了哪些监测工具</li>
<li>监测工具的代码部署的位置与顺序</li>
<li>是否加入了可疑代码</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e4%bb%8e%e4%b8%9a%e8%80%85%e7%9a%84%e8%81%8c%e4%b8%9a%e4%b9%a0%e6%83%af/feed/</wfw:commentRss>
		<slash:comments>9</slash:comments>
		</item>
		<item>
		<title>为什么两个监测工具报告中的数据不同</title>
		<link>http://www.chinawebanalytics.cn/%e4%b8%ba%e4%bb%80%e4%b9%88%e4%b8%a4%e4%b8%aa%e7%9b%91%e6%b5%8b%e5%b7%a5%e5%85%b7%e6%8a%a5%e5%91%8a%e4%b8%ad%e7%9a%84%e6%95%b0%e6%8d%ae%e4%b8%8d%e5%90%8c/</link>
		<comments>http://www.chinawebanalytics.cn/%e4%b8%ba%e4%bb%80%e4%b9%88%e4%b8%a4%e4%b8%aa%e7%9b%91%e6%b5%8b%e5%b7%a5%e5%85%b7%e6%8a%a5%e5%91%8a%e4%b8%ad%e7%9a%84%e6%95%b0%e6%8d%ae%e4%b8%8d%e5%90%8c/#comments</comments>
		<pubDate>Fri, 28 Aug 2009 18:29:35 +0000</pubDate>
		<dc:creator>Tenly</dc:creator>
				<category><![CDATA[网站分析工具]]></category>
		<category><![CDATA[网站分析经验分享]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=884</guid>
		<description><![CDATA[　　经常有客户对数据特别较真，总要问分析师这种问题：
同样的时间区间，为什么两种监测工具报告中的数据不同？
　　这个问题我从来不会回避，因为认真地回答这个问题不仅可以体现分析师的专业性，而且能巩固监测工具在客户心目中的&#8220;公正客观&#8221;的地位。
　　但话说回来，这却是一个很难回答的问题，要回答得全面而且通俗并不容易。

因为技术日新月异，影响数据差异的因素会越来越多，使得无法全面。
因为有些因素需要详细的技术说明，使得很难说得通俗。

　　本文，希望用全面而通俗的文字回答这个问题，希望成为网站分析领域回答这个问题的标准范本。（媒介监测领域也有该问题，在此文不作说明）



监测工具原理(Tracking Tools Methodology)不同。


数据获取方式不同。
　　服务器日志分析工具，是通过解析服务器日志进行网站访问数据获取。如AWStats，扫地老僧做的Nihuo；
        代码嵌入分析工具，是通过在网页中加入Javascript代码，运行后向监测工具服务器发送带请求，服务器从而获取访问数据。如Google Analytics，Omniture。
        后者现在业界更为常见，两者的数据获取方式不同会造成统计数据的差异。比如：
　　访问者输入www.g.cn发送访问请求，会经过一系列步骤：
        ①DNS解析 &#8211;&#62;② 获得服务器IP&#160;&#8211;&#62;③ 向服务器发送请求 &#8211;&#62;&#160;④服务器返回认证 &#8211;&#62; ⑤开始下载页面数据 &#8211;&#62; ⑤下载中和浏览器解析中 &#8211;&#62; ⑤数据下载结束。
　　服务器在获得&#8220;③用户发送请求&#8221;后，就会生成一条日志，日志分析工具就是对海量的日志记录进行分析。不同的服务器系统日志格式不同。常见的IIS记录，形如：
2009-04-17 02:04:52 W3SVC9218140 61.191.191.183 GET /default.asp &#8211; 80 &#8211; 203.208.60.19 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) 200 0 0 
　　后者监测工具是直到&#8220;⑤下载中和浏览器解析中&#8221;阶段才开始生效。Javascript程序运行后会向服务器发送请求。有的是请求1&#215;1象素Gif图片，如Google Analytics；有的是请求htm页面，如国产老牌统计软件CNZZ是请求http://219.232.241.164/stat.htm。共同之处是，请求都带有了访问者的各种参数，监测服务器通过截取参数获取数据。形如：
 http://www.google-analytics.com/__utm.gif?utmwv=1&#38;utmn=970846480
        &#38;utmcs=utf-8&#38;utmsr=1680&#215;1050&#38;utmsc=32-bit&#38;utmul=en-us&#38;utmje=1
        &#38;utmfl=9.0&#38;utmcn=1&#38;utmhn=www.gmodules.com&#38;utmr=http://ectend.com/
        &#38;utmp=/translate_my_page_gadget&#38;utmac=UA-10000-1&#38;utmcc=__utma
        %3D123692957.37202895.1245037832.1251034440.1251471692.21%3B%2B
     ...]]></description>
			<content:encoded><![CDATA[<p><img width="150" vspace="5" hspace="5" height="149" align="left" src="http://www.chinawebanalytics.cn/wp-content/uploads/Difference_article.jpg" alt="" />　　经常有客户对数据特别较真，总要问分析师这种问题：</p>
<p style="text-align: center;"><span style="font-size: large;"><span style="color: rgb(255, 0, 0);"><span><strong>同样的时间区间，为什么两种监测工具报告中的数据不同？</strong></span></span></span></p>
<p>　　这个问题我从来不会回避，因为认真地回答这个问题不仅可以体现分析师的专业性，而且能巩固监测工具在客户心目中的&ldquo;公正客观&rdquo;的地位。</p>
<p>　　但话说回来，这却是一个很难回答的问题，要回答得全面而且通俗并不容易。</p>
<ul>
<li>因为技术日新月异，影响数据差异的因素会越来越多，使得无法全面。</li>
<li>因为有些因素需要详细的技术说明，使得很难说得通俗。</li>
</ul>
<p>　　本文，希望用全面而通俗的文字回答这个问题，希望成为网站分析领域回答这个问题的标准范本。（媒介监测领域也有该问题，在此文不作说明）</p>
<p><span id="more-884"></span></p>
<ol>
<li>
<h2>监测工具原理(Tracking Tools Methodology)不同。</h2>
<ul>
<li>
<h3>数据获取方式不同。</h3>
<p><img vspace="5" hspace="5" border="1" align="left" src="http://pic.yupoo.com/tenlywu/225807fb9c7e/kc8cqyrp.jpg" alt="" />　　服务器日志分析工具，是通过解析服务器日志进行网站访问数据获取。如<a href="http://awstats.sourceforge.net" target="_blank">AWStats</a>，<a href="http://www.doyj.com" target="_blank">扫地老僧</a>做的<a href="http://www.loganalyzer.net/cn/" target="_blank">Nihuo</a>；<br />
        代码嵌入分析工具，是通过在网页中加入Javascript代码，运行后向监测工具服务器发送带请求，服务器从而获取访问数据。如Google Analytics，Omniture。<br />
        后者现在业界更为常见，两者的数据获取方式不同会造成统计数据的差异。比如：</p>
<p>　　访问者输入www.g.cn发送访问请求，会经过一系列步骤：<br />
        ①DNS解析 &#8211;&gt;② 获得服务器IP&nbsp;&#8211;&gt;③ 向服务器发送请求 &#8211;&gt;&nbsp;④服务器返回认证 &#8211;&gt; ⑤开始下载页面数据 &#8211;&gt; ⑤下载中和浏览器解析中 &#8211;&gt; ⑤数据下载结束。</p>
<p>　　服务器在获得&ldquo;③用户发送请求&rdquo;后，就会生成一条日志，日志分析工具就是对海量的日志记录进行分析。不同的服务器系统日志格式不同。常见的IIS记录，形如：</p>
<blockquote><p>2009-04-17 02:04:52 W3SVC9218140 61.191.191.183 GET /default.asp &#8211; 80 &#8211; 203.208.60.19 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) 200 0 0 </p></blockquote>
<p>　　后者监测工具是直到&ldquo;⑤下载中和浏览器解析中&rdquo;阶段才开始生效。Javascript程序运行后会向服务器发送请求。有的是请求1&#215;1象素Gif图片，如Google Analytics；有的是请求htm页面，如国产老牌统计软件CNZZ是请求http://219.232.241.164/stat.htm。共同之处是，请求都带有了访问者的各种参数，监测服务器通过截取参数获取数据。形如：</p>
<blockquote><p> http://www.google-analytics.com/__utm.gif?<u>utmwv=1&amp;utmn=970846480<br />
        &amp;utmcs=utf-8&amp;utmsr=1680&#215;1050&amp;utmsc=32-bit&amp;utmul=en-us&amp;utmje=1<br />
        &amp;utmfl=9.0&amp;utmcn=1&amp;utmhn=www.gmodules.com&amp;utmr=http://ectend.com/<br />
        &amp;utmp=/translate_my_page_gadget&amp;utmac=UA-10000-1&amp;utmcc=__utma<br />
        %3D123692957.37202895.1245037832.1251034440.1251471692.21%3B%2B<br />
        __utmb%3D123692957%3B%2B__utmc%3D123692957%3B%2B__utmz<br />
        %3D123692957.1251471692.21.21.utmccn%3D(referral)%7Cutmcs<br />
        r%3Dectend.com%7Cutmcct%3D%2F%7Cutmcmd%3Dreferral%3B%2B</u></p></blockquote>
<p>　　即使同样是代码嵌入分析工具，也会有很多因素造成数据差异，下面还有更多说明。</p>
</li>
<li>
<h3><img vspace="5" hspace="5" border="1" align="right" src="http://pic.yupoo.com/tenlywu/932807fb9fcf/small.jpg" alt="" />用户端缓存机制不同。</h3>
<p>　　某个访问是新访还是回访？这需要将用户的信息&ldquo;唯一化&rdquo;地写入Cookie文件中，缓存在用户端浏览器指定目录。<br />
        这里存在有<strong>第一方Cookie</strong>与<strong>第三方Cookie</strong>之分。虽然市面上绝大部分监测工作都是使用第一方Cookie，但不排除仍有些小型公司产品使用第三方Cookie。 第三方Cookie容易被用户浏览器屏蔽，获取的数据不够准确，且保密性差。<br />
        有人会好奇地问，Cookie里到底写了什么？那我就贴个内容简单的第一方Cookie示例，满足你的好奇心。这是百度统计的Cookie内容，文件名administrator@hm.baidu（不要问我内容代表什么，我也不知道，要看百度开发人员对ID号的定义）：</p>
<blockquote><p>HMACCOUNT<br />
        D3020343DB851C59<br />
        hm.baidu.com/<br />
        2147484672<br />
        2350186496<br />
        32111674<br />
        1314491424<br />
        30025681<br />
        *
        </p></blockquote>
</li>
<li>
<h3>监测工具分析方式不同</h3>
<p>　　监测工具获取了大量访问的行为数据后，就开始一系列的统计分析。</p>
<ul>
<li>度量定义不同
<p>　　在网站分析领域中涉及到很多度量，如Unique Visitor，Visit，Pageview，Time on Site，Bounce Rate等等。由于行业暂时还不是非常成熟，有些度量虽然有<a href="http://www.webanalyticsassociation.org" target="_blank">Web Analytics Association(WAA)</a>、IAB等专业机构的定义，但仍未被标准化地广泛使用。在国内还涉及一些中文翻译标准化的问题，有造成对度量定义混淆的情况。<br />
            从我个人的经验，迄今为止，国内外最无定义分歧的度量就是Pageview(PV)。至于Visit（Session，或访问，或访问数），是有分歧的：有的认为Visit的有效期为30分钟，有的认为1小时。更别提复杂的度量Bounce Rate的定义之争呢。</p>
</li>
<li>IP校验数据库不同
<p>　　访问者的IP是被监测工具获取了，但IP对应的实际地理位置数据库却不是全球通用的。IP地址数据库是时刻变化的，无权威发布机构，所以不同工具的统计报告中，地理区域划分数据也会有一定的差异。</p>
</li>
<li>过滤与限制功能
<p>　　我们知道Google Analytics有丰富的过滤功能，如过滤某个IP段，过滤操作系统为Linux的访问。不同的监测工具也有类似的功能。这些功能一旦开启，设置的不同也会造成数据的差异。</p>
</li>
</ul>
</li>
</ul>
</li>
<li>
<h2>监测代码部署(Tracking Code Implementation)方式不同。</h2>
<ul>
<li>
<h3>监测代码部署的位置。</h3>
<table width="200" cellspacing="0" cellpadding="00" border="1">
<tbody>
<tr>
<td align="right">
<p>1<br />
                    2<br />
                    3<br />
                    4<br />
                    5<br />
                    6<br />
                    7<br />
                    8<br />
                    9<br />
                    10<br />
                    11<br />
                    12<br />
                    13<br />
                    14</p>
</td>
<td>&lt;html&gt;<br />
                    &lt;head&gt;<br />
                    -<br />
                    Infomation For this page<br />
                    -<br />
                    &lt;/head&gt;<br />
                    &lt;body&gt;<br />
                    -<br />
                    Content of This Page<br />
                    -<br />
                    Hello<br />
                    -<br />
                    &lt;/body&gt;<br />
                    &lt;/html&gt;</td>
</tr>
</tbody>
</table>
<p>　　上面示例了一个页面的结构，监测代码可以部署在第3-12行之间的任何位置。但是放置的越前，监测代码越早被运行，监测的数据越多；放置的越后，监测的数据越少，有时甚至还会因为页面中的JavaScript出错，而导致监测代码失效。</p>
</li>
<li>
<h3>监测代码的冲突。</h3>
<p>　　有时由于同一页面中两种监测代码间，或者监测代码与页面本身的JavaScript之间，有函数名、变量名等的冲突，会造成监测代码的失效，或者监测不准。</p>
</li>
<li>
<h3>监测代码的正确性与完整性。</h3>
<p>　　专业的网站分析过程中对监测代码进行定制是必不可少的，代码的定制会造成统计结果的个性化，但同时也会有定制出错的风险。这些情况的发生，会造成监测数据的差异。</p>
</li>
</ul>
</li>
<li>
<h2>用户端设置(Client &#8211; End Settings)不同。</h2>
<ul>
<li>
<h3>浏览器功能设置</h3>
<p>　　浏览器种类很多，功能也不尽相同。但都具有基本的Cookie屏蔽功能，有的还支持图片、Flash、JavaScript的屏蔽功能，甚至还有的能对网页代码的关键字进行屏蔽。这些屏蔽技术的应用，会造成监测数据的差异。比如，屏蔽网页代码中的关键字&ldquo;ga.js&rdquo;，那么就会造成对Google Analytics的屏蔽。又比如，某浏览器禁止运行网页中的JavaScript，那么代码嵌入式监测工具将会全部失效。</p>
</li>
<li>
<h3>网络访问类型</h3>
<p>　　现在上网方式多样化，除了电脑上网外，用户还可以用Wii上网，可以用手机或其它手持终端上网。这些访问形式多种多样，可能是基于WAP的，可能是不支持Cookie的浏览器&hellip;&hellip;不同的监测工具，对这些多种多样访问形式的支持是不尽相同。现阶段，个人观点认为Omniture在这方面最为先进，支持的访问形式最多。</p>
<p>　　另外，搜索引擎的蜘蛛，或者一些特别网站发起的请求也会造成对页面的访问。一般的监测工具都会忽略掉这一块的流量。</p>
</li>
<li>
<h3>网络传输影响</h3>
<p>　　最后，我能想到的另外一种可能是网络传输过程中的差错，如网络丢包。还有一种情况，URL太长导致参数被截断的情况也并不少见。微软的权威解释，IE的url最大长度是2083个字节，可以用于GET传递数据的长度是2048个字节。</p>
</li>
</ul>
</li>
</ol>
<p>　　有我没有考虑的情况么？我写错或理解错误了哪个地方么？欢迎留言，或者邮件给我讨论完善此文：tenlywu邮标gmail.com。</p>
<p>　　另外发个广告，我又重操旧业，写写博客了<a href="http://www.ectend.com/">www.ectend.com</a>。由于宋星的博客有专业定位，文章主题统一，且读者对技术层面的讨论相对较少，非网站分析主题的文章和网站分析偏技术研究的文章就只在自己的博客上发表了（因为网站分析只是我染指的其中一个领域）。毕竟自己的博客写起来比较随意，给宋星写博客对文章质量要求特别高，很累的。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/%e4%b8%ba%e4%bb%80%e4%b9%88%e4%b8%a4%e4%b8%aa%e7%9b%91%e6%b5%8b%e5%b7%a5%e5%85%b7%e6%8a%a5%e5%91%8a%e4%b8%ad%e7%9a%84%e6%95%b0%e6%8d%ae%e4%b8%8d%e5%90%8c/feed/</wfw:commentRss>
		<slash:comments>20</slash:comments>
		</item>
		<item>
		<title>Google Analytics代码DIY-进阶篇</title>
		<link>http://www.chinawebanalytics.cn/google-analytics%e4%bb%a3%e7%a0%81diy-%e8%bf%9b%e9%98%b6%e7%af%87/</link>
		<comments>http://www.chinawebanalytics.cn/google-analytics%e4%bb%a3%e7%a0%81diy-%e8%bf%9b%e9%98%b6%e7%af%87/#comments</comments>
		<pubDate>Thu, 09 Jul 2009 06:51:27 +0000</pubDate>
		<dc:creator>Tenly</dc:creator>
				<category><![CDATA[基础知识]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=603</guid>
		<description><![CDATA[ 　　我是Tenly。感受到了最近GA代码级别的研究开始升温。比如owen同学的旧文倍受关注：浅析豆瓣的Google Analytics 应用。当然之前四月我也写的过关于GA的代码的简单介绍：Google Analytics代码DIY，也有挺多回复的。
　　今天再次推出代码研究进阶版，与大家一起研究讨论分享。总觉得这套代码可能会有一些考虑不周的地方，还请大家给予建议。再次强列声明，我不懂代码，纯粹研究。
　　互联网流量真真假假太多，需要有针对性的进行研究分析。这套代码虽然是我东拼西凑写的，但已经可以稳定运行，实现三大功能：

记录所有页面的刷新。所有的浏览器层级的刷新都会被以action/+url形式记录在GA的content报告中。
标记页面刷新的次数。所有的刷新都会被统计数据，最终会以action/+url+刷新次数形式记录在GA的content报告中。
监控页面的所有外链。所有的外链都会以out/+url记录在content报告中。

[poll=id]

&#160;﻿&#60;script type=&#34;text/javascript&#34;&#62;
var&#160;url=location.href;
var&#160;pslt=url.lastIndexOf(&#34;/&#34;);
var&#160;keyurl=url.substring(0,pslt);
var&#160;a=document.getElementsByTagName(&#34;A&#34;);
var&#160;str=str1=out=&#34;&#34;;
//定义一些变量，用于下面的tenly函数
function&#160;tenly()&#160;{
&#160;//下面会通过对window.name的操作，识别刷新，通过window.name＋＋的方式记录刷新的次数。该方法论是通过Google 搜索别人博客获得。

if(window.name!=&#8221;)&#160;{

window.name=eval(window.name)+1;
str=&#8217;/action/&#8216;+url+window.name;
pageTracker._trackPageview(str);
&#160;} else&#160;{


window.name=&#34;0&#34;;
&#160;}
//下面会监测页面中的所有&#60;a&#62;标记，这是html语言中的链接标记。通过判断URL的根目录关系，确定页面是否外链。

for(var&#160;i=0;
i&#60;a.length;
i++)&#160;{

a[i].onclick=function&#160;()&#160;{

&#160;if(this.href.indexOf(keyurl)==-1)&#160;{

str1=&#8217;/out/&#8216;+this.href;
pageTracker._trackPageview(str1);
&#160;}

&#160;}

&#160;}

&#160;}
//最基本的IE与Firefox侦听器的写法，使代码能够在不同浏览器正常侦听。

if(window.addEventListener)&#160;{

window.addEventListener(&#34;load&#34;,tenly,false);
&#160;} else&#160;if(window.attachEvent)&#160;{


&#160;window.attachEvent(&#34;onload&#34;,tenly);
&#160;}

&#60;/script&#62;
//调整后的GA代码，适用于https与http页面，只有页面第一次打开才会记录PV运行。
&#60;script type=&#34;text/javascript&#34;&#62;
var&#160;gaJsHost=((&#34;https:&#34;==document.location.protocol)?&#34;https://ssl.&#34;:&#34;http://www.&#34;);
document.write(unescape(&#34;%3Cscript&#160;src=&#8217;&#34;+gaJsHost+&#34;google-analytics.com/ga.js&#8217;&#160;type=&#8217;text/javascript&#8217;%3E%3C/script%3E&#34;));
&#160;&#60;/script&#62;
&#60;script type=&#34;text/javascript&#34;&#62;
try{

var&#160;pageTracker=_gat._getTracker(&#34;UA-5431245-5&#34;);
if(window.name==&#34;&#34;)&#160;{

pageTracker._trackPageview();&#160;

}&#160;

} catch(err)&#160;{}
&#60;/script&#62;

&#160;
]]></description>
			<content:encoded><![CDATA[<p><a title="Tenly是谁" target="_blank" href="http://www.chinawebanalytics.cn/?author=3"><img class="photoBorder" id="current" alt="谁是Tenly？" align="left" border="0" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/07/Tenly-Avatar.jpg" /></a> 　　我是Tenly。感受到了最近GA代码级别的研究开始升温。比如owen同学的旧文倍受关注：<a class="l" onmousedown="return clk(this.href,'','','res','1','')" href="http://fairyfish.net/2009/06/30/google-analytics-in-douban/"><font size="3"><font color="#cc0033">浅析豆瓣</font><font color="#551a8b">的Google Analytics 应用</font></font></a>。当然之前四月我也写的过关于GA的代码的简单介绍：<a rel="bookmark" href="http://www.chinawebanalytics.cn/?p=288"><font color="#557799">Google Analytics代码DIY</font></a>，也有挺多回复的。<img alt="" src="http://www.chinawebanalytics.cn/wp-content/plugins/fckeditor-for-wordpress-plugin/smiles/msn/embaressed_smile.gif" /></p>
<p>　　今天再次推出代码研究进阶版，与大家一起研究讨论分享。总觉得这套代码可能会有一些考虑不周的地方，还请大家给予建议。<strong>再次强列声明，我不懂代码，纯粹研究。</strong></p>
<p><strong>　　</strong>互联网流量真真假假太多，需要有针对性的进行研究分析。这套代码虽然是我东拼西凑写的，但已经可以稳定运行，实现三大功能：</p>
<ol>
<li>记录所有页面的刷新。所有的浏览器层级的刷新都会被以action/+url形式记录在GA的content报告中。</li>
<li>标记页面刷新的次数。所有的刷新都会被统计数据，最终会以action/+url+刷新次数形式记录在GA的content报告中。</li>
<li>监控页面的所有外链。所有的外链都会以out/+url记录在content报告中。</li>
</ol>
<div style="float: right; width: 270px; background-color: #fff; text-align: right">[poll=id]</div>
<blockquote style="background: #eee">
<p>&nbsp;﻿&lt;script type=&quot;<span class="quote"><font color="#999999">text/javascript</font></span>&quot;&gt;</p>
<p><font color="#0000ff">var</font>&nbsp;url=<font color="#ff8000">location</font>.href;<br />
<font color="#0000ff">var</font>&nbsp;pslt=url.<font color="#ff8000">lastIndexOf</font>(&quot;<span class="quote"><font color="#999999">/</font></span>&quot;);<br />
v<font color="#0000ff">ar</font>&nbsp;keyurl=url.<font color="#ff8000">substring</font>(0,pslt);<br />
<font color="#0000ff">var</font>&nbsp;a=<font color="#ff8000">document</font>.getElementsByTagName(&quot;<span class="quote"><font color="#999999">A</font></span>&quot;);<br />
<font color="#0000ff">var</font>&nbsp;str=str1=out=&quot;&quot;;</p>
<p style="text-align: right"><strong><u><span style="color: #ff0000">//定义一些变量，用于下面的tenly函数</span></u></strong></p>
<p><font color="#0000ff">function</font>&nbsp;tenly()&nbsp;{</p>
<p style="text-align: right"><span style="color: #ff0000"><u>&nbsp;</u><strong><u>//下面会通过对window.name的操作，识别刷新，通过window.name＋＋的方式记录刷新的次数。该方法论是通过Google 搜索别人博客获得。</u></strong></span></p>
<div class="indent">
<p><font color="#0000ff">if</font>(<font color="#ff8000">window</font>.<font color="#ff8000">name</font>!=&#8221;)&nbsp;{</p>
<div class="indent">
<p><font color="#ff8000">window</font>.<font color="#ff8000">name</font>=<font color="#ff8000">eval</font>(<font color="#ff8000">window</font>.<font color="#ff8000">name</font>)+1;</p>
<p>str=&#8217;<span class="quote"><font color="#999999">/action/</font></span>&#8216;+url+<font color="#ff8000">window</font>.name;</p>
<p>pageTracker._trackPageview(str);</p>
<p>&nbsp;} <font color="#0000ff">else</font>&nbsp;{</p>
</div>
<div class="indent">
<p><font color="#ff8000">window</font>.<font color="#ff8000">name</font>=&quot;<span class="quote"><font color="#999999">0</font></span>&quot;;</p>
<p>&nbsp;}</p>
<p style="text-align: right"><span style="color: #ff0000"><strong>//下面会监测页面中的所有&lt;a&gt;标记，这是html语言中的链接标记。通过判断URL的根目录关系，确定页面是否外链。</strong></span></p>
</div>
<p><font color="#0000ff">for</font>(<font color="#0000ff">var</font>&nbsp;i=0;</p>
<p>i&lt;a.length;</p>
<p>i++)&nbsp;{</p>
<div class="indent">
<p>a[i].<font color="#ff8000">onclick</font>=<font color="#0000ff">function</font>&nbsp;()&nbsp;{</p>
<div class="indent">
<p>&nbsp;<font color="#0000ff">if</font>(<font color="#0000ff">this</font>.<font color="#ff8000">href</font>.<font color="#ff8000">indexOf</font>(keyurl)==-1)&nbsp;{</p>
<div class="indent">
<p>str1=&#8217;<span class="quote"><font color="#999999">/out/</font></span>&#8216;+<font color="#0000ff">this</font>.href;</p>
<p>pageTracker._trackPageview(str1);</p>
<p>&nbsp;}</p>
</div>
<p>&nbsp;}</p>
</div>
<p>&nbsp;}</p>
</div>
<p>&nbsp;}</p>
<p style="text-align: right"><span style="color: #ff0000"><u><strong>//最基本的IE与Firefox侦听器的写法，使代码能够在不同浏览器正常侦听。</strong></u></span></p>
</div>
<p><font color="#0000ff">if</font>(<font color="#ff8000">window</font>.addEventListener)&nbsp;{</p>
<div class="indent">
<p><font color="#ff8000">window</font>.addEventListener(&quot;<span class="quote"><font color="#999999">load</font></span>&quot;,tenly,<font color="#0000ff">false</font>);</p>
<p>&nbsp;} <font color="#0000ff">else</font>&nbsp;<font color="#0000ff">if</font>(<font color="#ff8000">window</font>.attachEvent)&nbsp;{</p>
</div>
<div class="indent">
<p>&nbsp;<font color="#ff8000">window</font>.attachEvent(&quot;<span class="quote"><font color="#999999">onload</font></span>&quot;,tenly);</p>
<p>&nbsp;}</p>
</div>
<p>&lt;/script&gt;</p>
<p style="text-align: right"><span style="color: #ff0000"><strong>//调整后的GA代码，适用于https与http页面，只有页面第一次打开才会记录PV运行。</strong></span></p>
<p>&lt;script type=&quot;<span class="quote"><font color="#999999">text/javascript</font></span>&quot;&gt;</p>
<p><font color="#0000ff">var</font>&nbsp;gaJsHost=((&quot;<span class="quote"><font color="#999999">https:</font></span>&quot;==<font color="#ff8000">document</font>.<font color="#ff8000">location</font>.<font color="#ff8000">protocol</font>)?&quot;<span class="quote"><font color="#999999">https://ssl.</font></span>&quot;:&quot;<span class="quote"><font color="#999999">http://www.</font></span>&quot;);</p>
<p><font color="#ff8000">document</font>.<font color="#ff8000">write</font>(<font color="#ff8000">unescape</font>(&quot;<span class="quote"><font color="#999999">%3Cscript&nbsp;src=&#8217;</font></span>&quot;+gaJsHost+&quot;<span class="quote"><font color="#999999">google-analytics.com/ga.js&#8217;&nbsp;type=&#8217;text/javascript&#8217;%3E%3C/script%3E</font></span>&quot;));</p>
<p>&nbsp;&lt;/script&gt;</p>
<p>&lt;script type=&quot;<span class="quote"><font color="#999999">text/javascript</font></span>&quot;&gt;</p>
<p>try{</p>
<div class="indent">
<p><font color="#0000ff">var</font>&nbsp;pageTracker=_gat._getTracker(&quot;<span class="quote"><font color="#999999">UA-5431245-5</font></span>&quot;);</p>
<p><font color="#0000ff">if</font>(<font color="#ff8000">window</font>.<font color="#ff8000">name</font>==&quot;&quot;)&nbsp;{</p>
<div class="indent">
<p>pageTracker._trackPageview();&nbsp;</p>
</div>
<p>}&nbsp;</p>
</div>
<p>} <font color="#0000ff">catch</font>(err)&nbsp;{}</p>
<p>&lt;/script&gt;</p>
</blockquote>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/google-analytics%e4%bb%a3%e7%a0%81diy-%e8%bf%9b%e9%98%b6%e7%af%87/feed/</wfw:commentRss>
		<slash:comments>10</slash:comments>
		</item>
		<item>
		<title>Google Analytics代码DIY</title>
		<link>http://www.chinawebanalytics.cn/google-analytics%e4%bb%a3%e7%a0%81diy/</link>
		<comments>http://www.chinawebanalytics.cn/google-analytics%e4%bb%a3%e7%a0%81diy/#comments</comments>
		<pubDate>Sun, 12 Apr 2009 15:57:02 +0000</pubDate>
		<dc:creator>Tenly</dc:creator>
				<category><![CDATA[监测工具]]></category>
		<category><![CDATA[Google Analytics]]></category>
		<category><![CDATA[JS]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=288</guid>
		<description><![CDATA[　　大家好，我是Tenly，平时比较少发文章，主要是原博客后台版本过旧，发文章不顺心。今天在宋星的允许下帮他更新了wordpress，并装了些插件，样貌大换新，一切令人兴奋。
　　这篇博客就讲点简单的技术问题吧，技术专家（如车东这样的人）可以直接忽略此文。感谢一楼评论的建议与更正。
以下GA代表Google Analytics。

&#60;script type=&#34;text/javascript&#34;&#62;
var gaJsHost = ((&#34;https:&#34; == document.location.protocol) ? &#34;https://ssl.&#34; : &#34;http://www.&#34;); document.write(unescape(&#34;%3Cscript src=&#8217;&#34; + gaJsHost + &#34;google-analytics.com/ga.js&#8217; type=&#8217;text/javascript&#8217;%3E%3C/script%3E&#34;)); &#60;/script&#62;
&#60;script type=&#34;text/javascript&#34;&#62;
try { var pageTracker = _gat._getTracker(&#34;UA-4130899-1&#34;);
pageTracker._trackPageview(); } 
catch(err) {}
&#60;/script&#62;

　　上面是最基本的GA代码，分为两个部分。
第一部分(加粗部分)：

通过一条(正则表达式)JavaScript三元运算符，定义了gaJsHost&#160;变量。我们不需要非常了解正则表达式的原理，但看得出来这一行是在让GA自动辨认代码所在页面的URL地址是哪种前缀，如https等等，了解即可。
通过最常用的(JS内置函数)DOM对象函数 document.write，把一串html代码写入到所在页面。（unescape 函数的用途就不细说了。）这串html代码的目的是让页面去GA的服务器下载一个叫ga.js的统计功能文件，用来进行实现GA的统计。上面的gaJsHost&#160;变量，决定了ga.js文件的URL地址的细微不同。

　　第一部分的代码就实现了两个目的。但是我们可以看出有很多可以DIY的地方：


ga.js文件可以放在本地，如把ga.js放在http://www.chinawebanalytics.cn/ga.js。那么第一部分的代码可简化为：
&#60;script src=&#34;ga.js&#34; type=&#34;text/javascript&#34;&#62;&#160;&#60;/script&#62;
    或者是
    &#60;script src=&#34;http://www.chinawebanalytics.cn/ga.js&#34; type=&#34;text/javascript&#34;&#62;&#60;/script&#62; 
举这个例子主要是为了解析代码作用。
    实现上这样做的唯一好处是能让ga.js的加载速度＝本站速度。随着GA的连接速度越来越好，这种作法也大可不必了。另外，ga.js会不定期被GA不通知的情况更新，所以如果下载了ga.js，也许没过多久就不是最新版本了。

简化GA的监测代码。如果你的网站很清楚就是http://开头的，而不是https://开头。那么第一部分可以直接这样写，四行变一行：（PS.我有电脑洁癖症）。后方有Cloudream同学的更精简方法。
&#60;script src=&#34;http://www.google-analytics.com/ga.js&#34; type=&#34;text/javascript&#34;&#62;&#60;/script&#62;


第二部分(未加粗部分)：

try catch语句的作用是，在与GA服务器通信的过程中，防止意外错误造成页面停止Loading。
定义&#160;pageTracker&#160;实例对象，并根据你的帐户ID关联上。pageTracker&#160;类下面有很多函数，希望以后的文章里与讲几个函数的作用。
pageTracker._trackPageview()&#160;函数是指记录一个PV，并把该页面的地址返回给GA服务器。

　　第二部分的代码就实现了两个目的，关联你的帐户ID，并记录页面的PV与相应的URL地址。同样，这里的DIY更是无穷无尽了：


定义第一次打开该页面，才记作一次PV，如果不是，则不记。通过判断window.name是否为空值，来确定这个页面窗口在浏览器中是否第一次打开。结合地写一些其它相辅助的代码，可以实现对垃圾流量的过滤。
try {
    var pageTracker = _gat._getTracker(&#34;UA-4130899-1&#34;);
    if(!window.name){
    pageTracker._trackPageview();}
    } catch(err) {}
    


一个PV两处记。你可以建立与两个ID的联系，让访问数据同时记入两个ID的统计数据库。
&#60;script type=&#34;text/javascript&#34;&#62;
    try {
    var pageTracker = _gat._getTracker(&#34;UA-4130899-1&#34;);
 ...]]></description>
			<content:encoded><![CDATA[<p>　　大家好，我是Tenly，平时比较少发文章，主要是原博客后台版本过旧，发文章不顺心。今天在宋星的允许下帮他更新了wordpress，并装了些插件，样貌大换新，一切令人兴奋。</p>
<p>　　这篇博客就讲点简单的技术问题吧，技术专家（如车东这样的人）可以直接忽略此文。感谢一楼评论的建议与更正。<br />
以下GA代表Google Analytics。</p>
<blockquote style="background: #eee">
<p><strong>&lt;script type=&quot;text/javascript&quot;&gt;<br />
var gaJsHost = ((&quot;https:&quot; == document.location.protocol) ? &quot;https://ssl.&quot; : &quot;http://www.&quot;); document.write(unescape(&quot;%3Cscript src=&#8217;&quot; + gaJsHost + &quot;google-analytics.com/ga.js&#8217; type=&#8217;text/javascript&#8217;%3E%3C/script%3E&quot;)); &lt;/script&gt;</strong></p>
<p>&lt;script type=&quot;text/javascript&quot;&gt;<br />
try { var pageTracker = _gat._getTracker(&quot;UA-4130899-1&quot;);<br />
pageTracker._trackPageview(); } <br />
catch(err) {}<br />
&lt;/script&gt;</p>
</blockquote>
<p>　　上面是最基本的GA代码，分为两个部分。</p>
<h3 style="color: red">第一部分(加粗部分)：</h3>
<ol>
<li>通过一条(<a target="_blank" href="http://unibetter.com/deerchao/zhengzhe-biaodashi-jiaocheng-se.htm"><strike>正则表达式</strike></a>)JavaScript三元运算符，定义了<strong><em>gaJsHost&nbsp;</em></strong>变量。我们不需要非常了解正则表达式的原理，但看得出来这一行是在让GA自动辨认代码所在页面的URL地址是哪种前缀，如https等等，了解即可。</li>
<li>通过最常用的(<strike>JS内置函数)</strike>DOM对象函数 <strong>document.write</strong>，把一串html代码写入到所在页面。（<a target="_blank" href="http://www.yesky.com/imagesnew/software/javascript/html/jsmthunescape.htm"><em><strong>unescape</strong></em></a> 函数的用途就不细说了。）这串html代码的目的是让页面去GA的服务器下载一个叫ga.js的统计功能文件，用来进行实现GA的统计。上面的<strong><em>gaJsHost&nbsp;</em></strong>变量，决定了ga.js文件的URL地址的细微不同。</li>
</ol>
<p>　　第一部分的代码就实现了两个目的。但是我们可以看出有很多可以DIY的地方：</p>
<ol>
<li>
<p>ga.js文件可以放在本地，如把ga.js放在http://www.chinawebanalytics.cn/ga.js。那么第一部分的代码可简化为：</p>
<blockquote style="background: #eee"><p>&lt;script src=&quot;ga.js&quot; type=&quot;text/javascript&quot;&gt;&nbsp;&lt;/script&gt;<br />
    或者是<br />
    &lt;script src=&quot;http://www.chinawebanalytics.cn/ga.js&quot; type=&quot;text/javascript&quot;&gt;&lt;/script&gt; </p></blockquote>
<p>举这个例子主要是为了解析代码作用。</p>
<p>    <span id="more-288"></span>实现上这样做的唯一好处是能让ga.js的加载速度＝本站速度。随着GA的连接速度越来越好，这种作法也大可不必了。另外，ga.js会不定期被GA不通知的情况更新，所以如果下载了ga.js，也许没过多久就不是最新版本了。</li>
<li>
<p>简化GA的监测代码。如果你的网站很清楚就是http://开头的，而不是https://开头。那么第一部分可以直接这样写，四行变一行：（PS.我有电脑洁癖症）。后方有<a class="url" rel="external nofollow" href="http://www.5iya.com/blog/"><strong><font color="#557799">Cloudream</font></strong></a>同学的更精简方法。</p>
<blockquote style="background-color: rgb(238,238,238); -webkit-background-clip: initial; -webkit-background-origin: initial"><p>&lt;script src=&quot;http://www.google-analytics.com/ga.js&quot; type=&quot;text/javascript&quot;&gt;&lt;/script&gt;</p></blockquote>
</li>
</ol>
<h3 style="color: red">第二部分(未加粗部分)：</h3>
<ol>
<li><strong>try catch</strong>语句的作用是，在与GA服务器通信的过程中，防止意外错误造成页面停止Loading。</li>
<li>定义&nbsp;<em><strong>pageTracker&nbsp;</strong></em>实例对象，并根据你的帐户ID关联上。<em><strong>pageTracker&nbsp;</strong></em>类下面有<a target="_blank" href="http://code.google.com/intl/zh-CN/apis/analytics/docs/gaJS/gaJSApi.html">很多函数</a>，希望以后的文章里与讲几个函数的作用。</li>
<li><em><strong>pageTracker._trackPageview()&nbsp;</strong></em>函数是指记录一个PV，并把该页面的地址返回给GA服务器。</li>
</ol>
<p>　　第二部分的代码就实现了两个目的，关联你的帐户ID，并记录页面的PV与相应的URL地址。同样，这里的DIY更是无穷无尽了：</p>
<ol>
<li>
<p>定义第一次打开该页面，才记作一次PV，如果不是，则不记。通过判断window.name是否为空值，来确定这个页面窗口在浏览器中是否第一次打开。结合地写一些其它相辅助的代码，可以实现对垃圾流量的过滤。</p>
<blockquote style="background: #eee"><p>try {<br />
    var pageTracker = _gat._getTracker(&quot;UA-4130899-1&quot;);<br />
    <span style="color: rgb(255,0,0)">if(!window.name){<br />
    pageTracker._trackPageview();}</span><br />
    } catch(err) {}
    </p></blockquote>
</li>
<li>
<p>一个PV两处记。你可以建立与两个ID的联系，让访问数据同时记入两个ID的统计数据库。</p>
<blockquote style="background-color: rgb(238,238,238); -webkit-background-clip: initial; -webkit-background-origin: initial"><p>&lt;script type=&quot;text/javascript&quot;&gt;<br />
    try {<br />
    var pageTracker = _gat._getTracker(&quot;UA-4130899-1&quot;);<br />
    var pageTracker1 = _gat._getTracker(&quot;UA-8888888-1&quot;);<br />
    pageTracker._trackPageview();<br />
    pageTracker1._trackPageview();} <br />
    catch(err) {}<br />
    &lt;/script&gt;</p></blockquote>
</li>
</ol>
<p>　　抛砖引玉的内容就到此了，今晚要早睡，明天还要上班了。欢迎&ldquo;流&rdquo;言。PS，强烈声明，<a target="_blank" href="http://www.chinawebanalytics.cn/?author=3">本人</a>不是做技术的，完全不懂编程，只是瞎研究了一下。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/google-analytics%e4%bb%a3%e7%a0%81diy/feed/</wfw:commentRss>
		<slash:comments>13</slash:comments>
		</item>
		<item>
		<title>从头到尾说网站分析过程中的度量(中)</title>
		<link>http://www.chinawebanalytics.cn/%e4%bb%8e%e5%a4%b4%e5%88%b0%e5%b0%be%e8%af%b4%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e8%bf%87%e7%a8%8b%e4%b8%ad%e7%9a%84%e5%ba%a6%e9%87%8f%e4%b8%ad/</link>
		<comments>http://www.chinawebanalytics.cn/%e4%bb%8e%e5%a4%b4%e5%88%b0%e5%b0%be%e8%af%b4%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e8%bf%87%e7%a8%8b%e4%b8%ad%e7%9a%84%e5%ba%a6%e9%87%8f%e4%b8%ad/#comments</comments>
		<pubDate>Thu, 01 Jan 2009 07:50:22 +0000</pubDate>
		<dc:creator>Tenly</dc:creator>
				<category><![CDATA[基础知识]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=216</guid>
		<description><![CDATA[我是Tenly。2009年，献上第一篇博客。祝大家元旦新年快乐。争取在2009年里为大家奉献更多日志。
这篇日志晚了几个月，有兴趣的可以访问从头到尾说网站分析过程中的度量(上) 回顾一下。
第二篇 合作网站（Online Coop Minisites）
　　在合作网站建立专题页面（网站）是有中国特色的线上推广方法，例如在IT门户经常会建立软硬件厂商的产品介绍活动专区。在与来自美国的Adam交流过程中，得知国外广告主极少采用合作网站的方式进行推广，而是将所有的广告指向自身官方网站。
　　在中国，为什么要经常建立合作专题页面（网站）进行推广呢？原因有很多，主要原因有三点：

网站经常会给大广告主大量免费推介资源，而这些资源是不允许外链到非本站的地方。当然这也是控制网站流量不外流的手段。
合作专题页（站）的建设更容易，更低成本，甚至可以通过购买广告免费赠送。对于大的广告主，更新自己的官方网站是一个比较高成本的工作。
访问忠实度的心理因素。如果一个网民在一个门户上阅读，他希望所有相关的信息都在一个网站上获取完，不希望被“卖猪仔”一般被链接跳转来跳转去。

　　合作网站的的监控可以多种多样，但是唯一不能采用的监控方法是“网站日志分析法”，因为网站是绝对不可能提供日志供你分析的。所以最常采用的就是JS代码监控，如Google Analytics，CNZZ等代码监控。
需要经常使用的度量就是：

PageView：
Visits and Unique Visits：
Time on Site(Page)
Bounce Rate
P/V

这些度量在之前的文章中都有详细地说明，网站分析的最基本度量系列文章
第三篇 本地网站
　　入口与合作网站的流量最终可能会导入到本地网站。本地网站的监测方式与度量是与合作网站是类似的。不同的是，本地网站可以使用日志方式进行网站监测，对网站的监测控制度与深入度更大。
　　为了最直接地了解本地网站与前两篇的关系。下面以一个例子，描述：入口、合作网站、本地网站的层次关系：

　　A公司的一次线上广告项目。总共有A1、A2、A3、B1、B2、C1、XXblog等多间媒体。这些媒体的入口有些直接把点击访问者导入到A公司的官方网站上（图中的B２），有的会把他们导入到不同的合作网站上（图中的A1、A2等）。有些的合作网站是博客的形式，有些是专题站的形式，有的可以监测，有的不能监测。
　　这是一个比较简单的项目，简单的三个层次反映了中国互联网市场营销的多样性。多样性，是指监测的工具很多，可供选择的媒体很多，营销的合作方式也很多。
　　但是如何评估这个项目的成功与否呢？这正是分析师的我们所需要做的，这也是以后可能会深入与大家分享的话题。我们每天周旋在数十个网站之中，采用不同的度量，平衡不同的计算方法，建立统一的评估模型，所以说网站分析其实并不简单……
]]></description>
			<content:encoded><![CDATA[<p>我是Tenly。2009年，献上第一篇博客。祝大家元旦新年快乐。争取在2009年里为大家奉献更多日志。</p>
<p>这篇日志晚了几个月，有兴趣的可以访问<a href="http://www.chinawebanalytics.cn/?p=214" target="_blank">从头到尾说网站分析过程中的度量(上) </a>回顾一下。</p>
<h2>第二篇 合作网站（Online Coop Minisites）</h2>
<p>　　在合作网站建立专题页面（网站）是有中国特色的线上推广方法，例如在IT门户经常会建立软硬件厂商的产品介绍活动专区。在与来自美国的Adam交流过程中，得知国外广告主极少采用合作网站的方式进行推广，而是将所有的广告指向自身官方网站。</p>
<p>　　在中国，为什么要经常建立合作专题页面（网站）进行推广呢？原因有很多，主要原因有三点：</p>
<ol>
<li>网站经常会给大广告主大量免费推介资源，而这些资源是不允许外链到非本站的地方。当然这也是控制网站流量不外流的手段。</li>
<li>合作专题页（站）的建设更容易，更低成本，甚至可以通过购买广告免费赠送。对于大的广告主，更新自己的官方网站是一个比较高成本的工作。</li>
<li>访问忠实度的心理因素。如果一个网民在一个门户上阅读，他希望所有相关的信息都在一个网站上获取完，不希望被“卖猪仔”一般被链接跳转来跳转去。</li>
</ol>
<p>　　合作网站的的监控可以多种多样，但是唯一不能采用的监控方法是“网站日志分析法”，因为网站是绝对不可能提供日志供你分析的。所以最常采用的就是JS代码监控，如Google Analytics，CNZZ等代码监控。</p>
<p>需要经常使用的度量就是：</p>
<ul>
<li>PageView：</li>
<li>Visits and Unique Visits：</li>
<li>Time on Site(Page)</li>
<li>Bounce Rate</li>
<li>P/V</li>
</ul>
<p>这些度量在之前的文章中都有详细地说明，<a href="http://www.chinawebanalytics.cn/?s=%E6%9C%80%E5%9F%BA%E6%9C%AC%E5%BA%A6%E9%87%8F" target="_blank">网站分析的最基本度量系列文章</a></p>
<h2>第三篇 本地网站</h2>
<p>　　入口与合作网站的流量最终可能会导入到本地网站。本地网站的监测方式与度量是与合作网站是类似的。不同的是，本地网站可以使用日志方式进行网站监测，对网站的监测控制度与深入度更大。</p>
<p>　　为了最直接地了解本地网站与前两篇的关系。下面以一个例子，描述：入口、合作网站、本地网站的层次关系：</p>
<p><img style="vertical-align: middle;" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/01/structure.gif" alt="例子" width="617" height="400" /></p>
<p>　　A公司的一次线上广告项目。总共有A1、A2、A3、B1、B2、C1、XXblog等多间媒体。这些媒体的入口有些直接把点击访问者导入到A公司的官方网站上（图中的B２），有的会把他们导入到不同的合作网站上（图中的A1、A2等）。有些的合作网站是博客的形式，有些是专题站的形式，有的可以监测，有的不能监测。</p>
<p>　　这是一个比较简单的项目，简单的三个层次反映了中国互联网市场营销的多样性。多样性，是指监测的工具很多，可供选择的媒体很多，营销的合作方式也很多。</p>
<p>　　但是如何评估这个项目的成功与否呢？这正是分析师的我们所需要做的，这也是以后可能会深入与大家分享的话题。我们每天周旋在数十个网站之中，采用不同的度量，平衡不同的计算方法，建立统一的评估模型，所以说网站分析其实并不简单……</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/%e4%bb%8e%e5%a4%b4%e5%88%b0%e5%b0%be%e8%af%b4%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e8%bf%87%e7%a8%8b%e4%b8%ad%e7%9a%84%e5%ba%a6%e9%87%8f%e4%b8%ad/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>Google Analytics支持Event监测</title>
		<link>http://www.chinawebanalytics.cn/google-analytics%e6%94%af%e6%8c%81event%e7%9b%91%e6%b5%8b/</link>
		<comments>http://www.chinawebanalytics.cn/google-analytics%e6%94%af%e6%8c%81event%e7%9b%91%e6%b5%8b/#comments</comments>
		<pubDate>Sun, 02 Nov 2008 10:42:43 +0000</pubDate>
		<dc:creator>Tenly</dc:creator>
				<category><![CDATA[产业动态]]></category>
		<category><![CDATA[event]]></category>
		<category><![CDATA[GA]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[tracking]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=227</guid>
		<description><![CDATA[　　前几天收到GA的来信，今天才认真地阅读了一下。来信说，已经向个别的用户开放Event监测功能了。
　　Event的监测能实现什么呢？信中的原话：Event Tracking allows you to track interactions with Web 2.0 style content such as Flash, AJAX, Adobe Air, Silverlight, social networking apps, etc. It essentially allows you to track interactions beyond just pageviews.
　　这对于我来说是一个无比欣喜的功能，因为随着用户行为的多样化，网站设计的飞速发展，这样的监测功能可以更深入地了解访问者的Engage过程。举个例子：
　　以前，当在校内、开心这样的SNS网站，点击一个删除消息的按钮，页面并不会刷新或者新开，这意味着，用户在这个页面的这部分互动行为是不被监测的。但现在，通过Event监控功能的开放，GA都会一一记录，而且会在Content下面专门出现一个&#8221;Event Tracking&#8221;的报告项。
　　这是一个较为中级的网页开发的技术问题，涉及到网页代码的编写知识。基于我的代码水平还是中低级，我还需要更实际运用一番才能详细地与大家分享。
　　或者如果你也懂技术，我们一起去研究研究吧：http://code.google.com/apis/analytics/docs/gaJSApiEventTracking.html
　　赶快查看你的邮箱吧，估计你也收到了！我想，收到这样的信的前提是，你GA帐户下管理的网站有Web2.0元素丰富的网站，如Gmail,Tudou,Xiaonei等使用Flash/AjaX/Adobe Air/Sliverlight等技术较多的网站。最后附GA的官方博客说明地址：
http://analytics.blogspot.com/2007/10/exciting-announcements-at-emetrics.html
]]></description>
			<content:encoded><![CDATA[<p>　　前几天收到GA的来信，今天才认真地阅读了一下。来信说，已经向个别的用户开放Event监测功能了。</p>
<p>　　Event的监测能实现什么呢？信中的原话：<strong>Event Tracking allows you to track interactions with Web 2.0 style content such as Flash, AJAX, Adobe Air, Silverlight, social networking apps, etc. It essentially allows you to track interactions beyond just pageviews.</strong></p>
<p>　　这对于我来说是一个无比欣喜的功能，因为随着用户行为的多样化，网站设计的飞速发展，这样的监测功能可以更深入地了解访问者的Engage过程。举个例子：</p>
<p>　　以前，当在校内、开心这样的SNS网站，点击一个删除消息的按钮，页面并不会刷新或者新开，这意味着，用户在这个页面的这部分互动行为是不被监测的。但现在，通过Event监控功能的开放，GA都会一一记录，而且会在Content下面专门出现一个&#8221;Event Tracking&#8221;的报告项。</p>
<p>　　这是一个较为中级的网页开发的技术问题，涉及到网页代码的编写知识。基于我的代码水平还是中低级，我还需要更实际运用一番才能详细地与大家分享。</p>
<p>　　或者如果你也懂技术，我们一起去研究研究吧：<a href="http://code.google.com/apis/analytics/docs/gaJSApiEventTracking.html">http://code.google.com/apis/analytics/docs/gaJSApiEventTracking.html</a></p>
<p>　　赶快查看你的邮箱吧，估计你也收到了！我想，收到这样的信的前提是，你GA帐户下管理的网站有Web2.0元素丰富的网站，如Gmail,Tudou,Xiaonei等使用Flash/AjaX/Adobe Air/Sliverlight等技术较多的网站。最后附GA的官方博客说明地址：</p>
<p><a href="http://analytics.blogspot.com/2007/10/exciting-announcements-at-emetrics.html">http://analytics.blogspot.com/2007/10/exciting-announcements-at-emetrics.html</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/google-analytics%e6%94%af%e6%8c%81event%e7%9b%91%e6%b5%8b/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
	</channel>
</rss>

