<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>网站分析在中国——从基础到前沿 &#187; Headline</title>
	<atom:link href="http://www.chinawebanalytics.cn/category/headline/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.chinawebanalytics.cn</link>
	<description></description>
	<lastBuildDate>Mon, 23 Jan 2012 13:23:05 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.2</generator>
		<item>
		<title>数据驱动的电子商务组织架构的迷局和反思</title>
		<link>http://www.chinawebanalytics.cn/data-driven-org-thinkings/</link>
		<comments>http://www.chinawebanalytics.cn/data-driven-org-thinkings/#comments</comments>
		<pubDate>Sat, 21 Jan 2012 03:54:43 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[Headline]]></category>
		<category><![CDATA[网站分析经验分享]]></category>
		<category><![CDATA[WAW]]></category>
		<category><![CDATA[数据驱动]]></category>
		<category><![CDATA[文化]]></category>
		<category><![CDATA[电子商务]]></category>
		<category><![CDATA[组织结构]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=3714</guid>
		<description><![CDATA[【每期一句】It&#8217;s a beautiful day, and I can&#8217;t see it.
【前言】
　　莫道我不迷惘，我比任何时候都更迷惘。上次说到游泳的例子，我得承认，在游泳的时候，各种&#8220;怪异的姿势&#8221;，往往不仅仅是因为冰冷的河水，更是因为水中难保没有漩涡湍流，水草拽脚，以及一群混乱游动的人群的相互制肘。或许这些人是推着一条往前行驶的船，但可惜，力气未必是朝同样的方向的。
　　这就是组织的困境。组织越大，力量反而未必越大。数据在这个组织中扮演什么样的角色呢？数据驱动的实现，需要什么样的组织结构，甚至，不仅仅是组织结构本身能够解决的？
　　希望我能和大家一起找到答案。

【正文】
　　人人都渴望数据，但这可能隐藏着陷阱。
　　拥有数据意味着什么？&#8212;&#8212;Nothing。数据不等于信息，更不等于真相。数据在大多数情况下，要么是没有得到利用，要么就干脆是纯粹的误导！
　　人人都渴望数据，可没人尊重数据。矛盾吗？不，其实这幕天天上演。
　　我们怎么样才能真正建立起称得上&#8220;数据驱动&#8221;四个金字的电子商务组织？为什么数据驱动的组织那么困难？这个问题困扰了我很久，我几次演讲，有被听众问到这个问题，我都觉得没有给出很好的回答。今天，2011年12月31日，岁末，我想这个问题我不能再带到新的一年才去解决了。（文章开始于12月31日，但完成于1月21日，作者后注）
迷局1：决定数据驱动型组织形成的关键是什么？
　　数据驱动，这四个字中的&#8220;驱动&#8221;二字本质上直刺企业的核心。所谓驱动，即发号施令。没有发号施令，还驱动什么？因此数据驱动本质上，就是用数据来发号施令。
　　但发号施令的决策通常来自于三个不同的方式：感觉（guts），经验（experience）和认知（insights）。相对而言，由于感觉和经验虽然模糊却得来容易，因此决策者常常不由自主的利用这两种方式作出判断，从而很迅速地作出决定，发号施令。
　　显然，感觉和经验并非数据，虽然有时候人们也通过数据来形成感觉和经验，但更多时候人们倾向于选择那些与感觉和经验一致的数据进行研究和推导，而不愿相信那些与感觉和经验不相符合的数据。因此，感觉和经验，实际上是形成所谓数据驱动组织的最大障碍。
 　　不过，请读者朋友们注意，我丝毫没有贬薄感觉和经验的意思。那些具有卓越感知和经验的操盘手，例如人人景仰的乔布斯，他们的感知和经验甚至可以凌驾一切之上，更何况在不太尊重数据的中国古代，还是涌现出相当多智勇双全，决策英明的英雄。而中国今天的商业智慧中绝对多的部分也是感觉和经验，绝非数据，这说明感觉和经验甚至是决定成败的。只是，我们今天的命题是数据驱动的组织，因此，我必须重申，如果一个组织确实依赖于感觉和经验，那么，数据驱动本身就并非一个重要的命题，在这个情况下，数据驱动与否根本就不会影响这个组织作出明智的决策。
　　另一个困难的地方在于，从组织架构的角度讲，数据并不是只拿给CEO看的。所以，有朋友问，CEO或者管理层的态度对推进数据驱动组织的形成，是否具有关键性的作用？我认为，如果CEO或者董事会，不认可数据驱动型的组织，数据驱动当然就无从谈起。但是，CEO或者管理层支持数据驱动型组织的建立，这一组织也未必能够真正建立起来。
　　我这么说可能并不会让你太吃惊。管理层可能有很多想做的事情，未必能够真正实现，或者未必能够按照原先的设想实现。数据的意义不在于仅仅提供给CEO一个报告或者参考，数据如果不渗透每一个执行层面，其意义会大打折扣。我认为，数据驱动的组织一定是宏观和微观的结合，即宏观层面上，要提供供管理层使用的策略型数据，不至让这个组织进退失措；微观层面上必须指导业务执行者的行动，让他们能够进行准确的选择，不用通过不断地&#8220;试错&#8221;才能知晓真正有用的下一步什么。宏观的确重要，但微观则更加致命，尤其是对电子商务组织而言。
　　电子商务组织需要快速的反应和高度强大的执行力，管理层发起的那些至上而下的推动，在真正推动起来的时候，往往已经错过了时机。电子商务组织的时机很多时候并非是管理层发现的，而来自执行层面的敏感的嗅觉，这些嗅觉在一些场合下甚至直接影响公司的成败；另一方面，无论管理层多么强悍的推动，所有最终的实现都必须依靠&#8220;下面的人&#8221;，因此，&#8220;下面的人&#8221;&#8212;&#8212;他们是否能够实现管理层的想法，才真正决定这个组织的成败。
　　所以，回到我们上面的问题&#8212;&#8212;就算CEO和管理层特别支持数据驱动型的组织，如果下面的执行者没有真正数据驱动的意识和需求，那么数据驱动型的组织也毫无实现的可能。
　　我的观点是&#8212;&#8212;数据驱动型的组织能否实现，要看需求方。真正的需求方是执行团队。执行团队是依赖于感觉和经验，还是依赖于数据，这才是数据驱动型组织能否实现的关键。如果执行团队渴望数据，利用数据，依赖数据，这个组织的数据驱动文化就很容易实现，而跟CEO和管理层其实关系没那么大。CEO和管理层要做的，是建立这样的执行团队，而不是生硬地自上而下的推动所谓某种以前并不存在的数据驱动的文化。
　　从这个角度看，我们的电子商务企业中，大部分执行团队都或多或少需要数据，依赖的程度高低，便是这个企业数据化驱动程度的高低。不过，我想很多国内电子商务企业，执行团队应该都还是靠着感觉和经验吧！这便是数据驱动组织并非那么容易实现的根本原因。
　　因此，数据驱动型的电子商务组织，基础性的第一步，是要建立真正的来自执行层面对数据的旺盛需求。这个需求不是CEO或者管理团队有一天忽然觉得数据无比重要而风风火火要求下来的政令，而是发自自然的，如同人们食色性也的需求。没有这样的需求，无论电子商务组织，还是任何其他组织，都不存在真正的所谓数据驱动。
迷局2：使能（enable）的误区
　　现在，假设我们的电子商务组织的执行团队是一群真正欣赏数据的人，数据驱动型的组织是否就实现了？
　　仍然很难。
　　在封闭系统内，有需求未必就会有供给。你欣赏iPhone5，但你没这个能力自己做一个；你渴求数据，但未必你能通过自己的力量获得。
　　所以，希望建立数据驱动文化的组织，一开始都把视线集中在建立能力上（当然，你要记住，如同我在迷局1中所写，首先是建立需求，而非建立能力）。
　　构建能力被称为&#8220;使能（enable）&#8221;，让这个组织能提供数据，有多种办法，但最常见的想法，是我们下面的这个图所展示的解决方式：

图1：经典数据组织架构&#8212;&#8212;hub模式&#160;
　　数据部门是个hub，这群人解决一个组织大部分的数据需求。当业务部门需要数据的时候，他们提交需求给数据部门，然后数据部门开始抽取、运算和分析，把数据和结果返回给业务部门。
　　唉，说实话，这真是一种笨办法，这使我想起了过去无所不包无所不揽的计划经济。我相信这个方法的初衷是好的，这么建立数据能力有如下几个动因：

显然，这个方法能够让CEO或者管理层非常牢固的控制数据。数据比较安全&#8212;&#8212;至少看上去是那样。
数据部门可以集中起来工作，这似乎对做数据的同事是不错的一点。
节省人力，组织看起来规划清晰。不用在各处安插做数据做分析的人，确实省下一大笔人力和管理成本。
相对简单的数据系统。因为数据部门管理数据，诸如权限之类的系统设计，可能就不是那么重要了，反正人来提供数据报表即可。该给哪些部门，不给哪些部门，人工去每次划分确定就好了。数据的模型&#8212;&#8212;也没那么重要，人去分析就行了，不需要太高的自动化，也不需要太强大的BI。


引申阅读：网站流量数据无秘密
　　将数据部门作为hub的一个重要原因，是因为希望数据能够被放在一个&#8220;保险箱内&#8221;从而&#8220;确保&#8221;了数据的安全。
　　但这个想法多少有一点&#8220;一厢情愿&#8221;，我一直相信，网站流量其实无秘密。
　　例如，想要知道一个网站的流量并不复杂，有太多的工具，免费的，付费的，还可以用我之前说的对比法：《如何获知陌生网站的流量？》。
　　如果足够细心，甚至也能参透一个电子商务网站大致的销量和销售额。
　　毕竟，电子商务网站本身就有很多信息可以透露给你。例如，商品消费的数量是可以查到的，而如果参考购买者做出评论的时间（在各个时间段发出评论数量的比例），则几乎可以确定一段时间内某个商品或者全部商品的销售量。
　　销售量和客单价之间简单的关系&#8212;&#8212;做出销售额不算困难。
　　有销售量，又有流量，你能把转化率也估计出来。
　　还有，流量渠道也不困难。很多工具都能告诉你一个网站的主要流量来源是什么，例如Hitwise。
　　不仅如此，每一个电商网站都因为要与各种市场营销第三方企业合作，而被布上了各种代码。这些代码无时无刻不在透露着这个网站相关的流量和销售信息。对他们而言，一个网站就像被X光反复扫描一样。除非你不跟他们做任何合作，否则这些数据总还是要被第三方知道，而且签署所谓的NDA协议，也不过是&#8220;防君子不防小人&#8221;。
　　其实，我认为，电子商务网站真正的数据秘密，是那些运营的细节。当然，还包括财务数据、商品的进货价格等等。但流量无秘密，用不着太紧张。

　　但前面说过，这是一种笨办法，如果这样规划数据部门，可能会产生一些意想不到的结果。最可能产生的结局是：数据部门会&#8212;&#8212;疯掉？
　　这不是耸人听闻，如果数据部门要负责所有业务部门的数据，得需要多少人呢？肯定超出你的想象。此外，业务部门肯定不会仅仅只是满足于数据被提供出来，他们希望数据快些，更快些，他们希望实时数据。手工作业，实时太难，追求速度就意味着大量的人力和脑力的消耗。
　　好吧，就算数据部门能够提供实时数据，又能怎么样呢？数据不是策略，数据总得再经过分析和处理。数据部门不了解业务，他们能分析好吗？如果不去做这些分析，那么业务部门还得自己去分析，实时性不仅得不到保证，数据部门的价值发挥也大打折扣。
　　这种组织方式下，数据部门的价值和定位都很容易被质疑，而且他们还会苦逼地干得没日没夜。
　　如果确实是这样一种组织方式，那么对数据部门的工作定义确实要非常谨慎。数据部门应该承担提供基础数据的工作，但他们没有职责，也不应该为业务层面提供战术性的分析，他们忙不过来，也必然缺乏业务概念。但这绝对不是任何一个真正&#8220;数据驱动组织&#8221;所应该具有的定义，这是&#8220;暴殄天物&#8221;的定义。
　　因为这些不完美，有一种更先进一点的方式去解决上面的一些问题，并且开始被大家注意，且有被神话的趋势。
　　这个方式，就是BI系统。
　　BI系统的本质是用来取代人手和人脑。这是一个好方法。把人从机械的工作中解放出来，提供给业务部门自动化的报表，而且还能承担一定的思考的工作，BI系统是一个伟大的发明。

图2：BI驱动的数据组织架构
　　这也是为什么，一个真正具有数据驱动文化的公司，必须要有一个确实好用的BI系统。或者，较浅浅层次的，得有一个自动化的报表系统。但是，据我所知，很多电子商务公司这个系统要么缺失，要么非常难以使用。

引申阅读：被神话的BI系统
　　BI被神话不奇怪。凡是人们不那么了解却又外表光鲜的事情，都容易被神话。:) （网站分析多少也被这么神话着。这并不是好事情。）
　　BI被神化的另一个原因，在于人们确实对友好聪明的数据系统抱有太多的期望。
　　在Gartner的一次调查中，超过80%的美国电子商务公司期待更好的BI系统。
　　但BI最大的问题是&#8212;&#8212;机器终究是机器。
　　BI可以解决一些机械的工作，能够建立数据模型帮助人们快速得出一些结论。但跟业务相关的细节分析，BI能够帮你发现现象，但无法告诉你原因。（我觉得，网站分析工具，其实就是BI工具的一种，它一样能够非常sharp的帮你发现现象，但同样无法告诉你原因）
　　所有的答案，都需要人去寻找，去解答。
　　此外，BI系统的效用，本身也极大的依赖于人。
　　首先，BI系统的设计，必须与一个公司自身的业务相契合。人才能完成这个让BI与业务需求相契合和匹配的工作。
　　其次，BI系统的建模和规则，全部是人来完成的。
　　最后，前面说了，BI不可能给你答案，唯有人才能做到。
　　所以，BI被神化的地方在于，认为一个BI系统就解决问题是不可能的。或者说，一个BI系统，不是狭义的硬件软件系统，而是IT系统+BI团队的结合。人，占90%，或者，占99%。
　　尽管有被神话的趋势，但BI的意义重大，作为不可或缺的基础设施，若没有BI系统，或者连一个自动化的报表系统都没有，这个组织的数据驱动的文化很难建立。原因无他，若有需求而无供给，只会引发严重的饥荒。

迷局3：数据误读，比没有数据更可怕
　　无论是按照图1所示的hub模式，还是图2所示的有BI系统参与的hub模式。业务部门都面临着很大的风险。一方面，前面我们说了，hub本身存在资源和响应的矛盾。另一方面，数据误读比没有数据更可怕。
　　电子商务业务部门更强调业务能力，因此在数据的分析和解读上，能力相对较弱。与传统零售行业不同，传统零售的BI系统和分析团队往往经过了超过10年的进化，因此早已形成体系和一套具体的方法。电子商务虽然也属于零售业，但很显然，这些公司要年轻太多，让业务部门拿到数据后，自己去做分析和评估，是困难的。我最大的担忧，在于数据分析事实上容易变成一个粗暴简单并不断被&#8220;自以为是&#8221;的经验所干扰的工作。即使在做了很多的案例之后，我仍然认为，我没有哪一次没有被主观的感觉影响过判断，直到有更多的数据充实上下文才可能避免不客观的分析。而业务部门在拿到数据后，因为时间的压力和数据分析经验的缺乏，他们容易在短时间内得到结论，但误读数据，并进而造成这个结论背离事实的情况是时有发生的。而且，业务部门背负业绩压力，他们可能在一开始就主观上倾向于让自己不那么客观。
　　我曾在心里默念，对于数据应该常常怀着敬畏的心，因为简单粗暴适用于网络营销，但绝对不适用于营销分析。数据误读，我记得派代上有一位专家专门写了一个帖子探讨，我不能同意更多，甚至也有完全相似的例子。如果你只是那么一点点粗心，或延续了&#8220;简单粗暴&#8221;的办法，那些数据中给你揭示的细微的差别，你可能会忽略，而这些差别可能会让你得出完全不一样甚至是相反的结论。
　　例如下面的这个例子：
　　对于下面两个图的数据实际上是完全一样的，可是，两个图给你的心理上的感觉却是完全不同的。

图3：利润趋势（1）

图4：利润趋势（2）
　　尽管数据一样，但图3和图4用了不同的数据显示区间（Scaling）。由图3得出的结论，是利润在近期剧烈的波动，而图4的结论则是利润在近期平稳维持在低位。这两个结论并不能简单说明它们正确与否，取决于实际的商业环境。例如，如果你的生意平常一天是1000以上的利润，那么显然图4给你的结论更有参考意义，你应该探求为什么最近的生意几乎停滞了。
　　但是，如果你的生意一天的确最多不超过100的利润，那么图3更有价值。而且你可能会觉得，利润数据还不错，这几天还有明显的上涨的趋势。不过，或许你还是不能高兴的太早。下面这个图（图5）和图3在利润上的数值是完全一样的，不过增加了另一个数据项：收入（蓝色点）。

图5：利润和收入趋势
　　你可以看到尽管利润上升了，收入上升的趋势更为显著。这意味着，我们的利润增长并没有收入增长的快。或者换句话说，我们的投资回报率（ROI）下降了。因此利润虽然上涨，但完全不值得我们高兴。我们反而应该检讨，为什么效率降低了。
　　数据的误读很多时候并非是故意的，而是跟经验有关。这些经验在于两点，第一点，对于数据的运算和把握。例如，合理建模，合理的数据可视化（Data Visualization），以及对工具合理的应用。第二点，在于对于业务的准确把握&#8212;&#8212;做到看数说话，与实际业务几无偏差。第二点是建立在第一点的基础上的。如果第一点出现了一些问题，或是没有技能，或是没有经验，第二点便会遭殃，即使对于业务有很好的感觉和清晰敏捷的头脑，也会为数据所累。
　　来看另一个真实的例子。
　　我的朋友Johnny，他在为在美国销售某一个商品而投放Google AdWords的广告。这个商品的利润额在2011年每个月的表现如下图所示：

图6：Johnny全年每月SEM投放利润情况
　　很显然这个商品的生意出了什么问题，有必要找出原因。
　　利润下降，要么是收入减少，要么是支出增加，要么是二者同时发生了。从支出上看，每个月的支出变化不大，而且实际上，当利润降低的那些月份，支出反而也是略有降低的。那么很明显，收入下降是造成利润下降的主要原因。收入为什么下降呢？
　　很快，他们找到了一个相当有说服力的数据关系：当SEM关键词的平均排名下降了之后，销售收入也非常明显的下滑。如图7所示。

图7：销售收入和关键词平均排名的关系
　　现在，假设一个情景：有一个非常非常缺乏经验的初级SEM专员，他很可能给出的结论是：利润降低，是因为收入降低，而收入降低，是因为关键词排名降低，因此我们需要提升关键词排名，以获得更多收入提升利润。
　　你当然相信这个结论是简单粗暴，并非反映事实。事实是，关键词排名升高，当然会获得更多的点击从而获得更多的销售额，但成本同时也会提高。所以，这个结论并不一定是正确的。于是，更有经验一些的SEM专员，会继续坐下来寻找下一个关系，如下图8所示。

图8：利润和关键词平均排名的关系
　　这个图简直是上一个图（图7）的翻版，只是一个是收入，一个是利润，数据的比例尺不同而已。看起来，利润和关键词平均排名的关系和收入与关键词排名的关系也非常一致。现在，我们可以放心大胆的得出结论&#8212;&#8212;我们应该提升排名，以获得更多的利润！
　　于是他们提高了出价，提升了排名，并且在2012年1月份的这几天，得到了结果&#8212;&#8212;利润不仅没有升高，反而更加下降了&#8212;&#8212;甚至某些天是负的，尽管关键词的排名又重新回到了3位左右。
　　之前数据反映了某种似乎确定无疑的关系，但按照这种关系行事，并没有带来预期的结果。
　　我们必须承认，SEM投放是一个复杂的策略过程，并且因为瞬息万变的外部环境（竞争对手的出价），而造成最优化的出价方式总是动态的。
　　上面的例子，Johnny认为原因很简单，这个商品的关键词投放可能已经遇到了瓶颈，因为外部的环境发生了变化。Johnny查看了其他的数据（我们当然不能忽略其他数据的关系），例如，CPC（Cost Per Click）数据，Johnny发现在这12个月中，CPC的变化并不大。CPC没有明显变化，而排名在逐渐降低，说明竞争对手在不断增加出价，这样，相同的投入情况下，排名降低，收入减少，利润减少。如图9。

图9：CPC（出价）没有太大变化，但排名却一落千丈
　　可是，增加出价后，我们解决了一个问题，却带来了另外一个问题&#8212;&#8212;出价增加，收入增加，同时成本也上升了。由于竞争环境的影响，要达到以前的排名，所出的价格甚至是之前价格的3、4倍。因此，虽然收入增加，但成本上升的更可怕，利润空间被压缩的非常厉害。
　　由于这个商品60%的销售都是由一个最主要的词（大词）带来（这是我之前没有揭示的一个线索），也许我们可以因此得出另一个结论：大词的ROI表现日益下滑，因此或许应该拓展其他的词，例如长尾词，从其他的竞争不大的词上找机会。
　　不过，从目前的情况看，这个商品的长尾词并没有多少流量，它仍然依赖于大词的表现。所以，我们认为，这个商品本身的市场环境已经发生了变化，高ROI的好日子过去了。现在的策略，是在微利的情况下生存，尽量更精细化更实时的优化，保证不亏损，并着手开发新的商品。
　　或许这个SEM的例子并不是一个非常典型的例子，因为SEM的分析仍然是相对结构化和流程化的。我们通过BI的建模完全可以自动化，但如果没有好的BI系统（事实上因为百度的原因，国内的SEM是很难真正的BI化的），那么这些工作需要人来完成，需要有经验的、相当数量的人来完成。SEM是数据分析的较为特殊的类别，相对而言，其他的运营分析，则更不具有预先的结构化和流程化，例如对EDM营销（或数据库营销）的研究，需要大量的测试；对一次campaign或是promotion的销售预测，需要很有经验的分析师；或是对于商品生命周期的研究，需要精通零售的数据挖掘专家。这些都不是运营简单粗暴能够实现的。
　　所以，人们渴求数据，尤其是运营部门。但人们却很容易面对数据变得焦虑和不信任。我常常会听到这样的反馈：&#8220;数据是错的！&#8221;&#8212;&#8212;我相信永远没有他所希望的正确的数据。无论是数据误读，还是根本数据就是数据，从来没有转化成有价值的信息，都意味着反面的效果，甚至，还远不如根本就没有数据。
　　因此，数据驱动的企业文化的要件，除了对数据有渴求，除了对数据有&#8220;使能&#8221;，还需要对数据正确的解读。
　　我们需要从组织结构上保证数据能够被正确解读，或者至少是尽可能的被正确地解读。
反思：数据民主化和数据驱动型组织的架构
　　一个组织的自下而上都有数据驱动的需求（上面的需求部分），而且也有决心投入资源建立数据部门（上面的使能部分），那么剩下的就是如何正确的利用数据，准确的获得信息，并以最快的速度利用在运营和执行策略上。
　　在我们上面的&#8220;迷局2&#8221;和&#8220;迷局3&#8221;中，我提出了对于&#8220;集中化&#8221;数据组织的疑问。我相信这种数据组织是蕴含风险的，无论这种集中是人力资源的集中，还是数据自动化系统的集中。如果我们需要一种健康的数据驱动的企业组织，那么我们需要&#8220;数据民主化（Data Democratization）&#8221;。这个想法，来自于我之前工作的Adobe Omniture，也来自于凯文&#183;凯利的《失控》，这些思想告诉我们，上帝创立世界，从没有让世界按照&#8220;中央控制&#8221;模式运行。自大爆炸以来（如果我们不考虑&#8220;虚时间&#8221;，那么我们可以认为大爆炸理论是合理的，当然，今天这个理论被进一步进化以帮助人们探求大爆炸之前有什么），上帝就只是给出了规则，而让万事自我发展，他并不插手。我也记得，当按照中央计划的生产和消费活动被举国执行时，只能在某些极端情况下暂时的运转良好，但当市场成为经济的核心构建的时候，一切变得自主而民主化，事情反而在混沌中有了自我秩序。
　　人体是最大的&#8220;民主化系统&#8221;。大脑的思维并不会指挥消化系统的工作，心跳的速度提升和变缓也是它自发完成的。心理学家告诉我们，大脑的主动意识甚至仅仅支配了人的行为的不到10%，潜意识却无时无刻不决定我们的行为。有些生物，例如蜜蜂，这些几乎连大脑都没有的生物却展现出高级群体特征，并通过特定手段传递相当复杂的信息（这些信息连人类都要进行复杂的描述才能实现），这些都不可能来源于一个集中化的&#8220;中央控制系统&#8221;的主动指令。
　　一个组织的数据驱动类似于人的神经系统。大脑负责核心的运转（关键执行）和高级的思维（战略），各系统（消化系统、循环系统&#8230;&#8230;，各经营部门）根据机体的内在和外在环境变化自主运行，形成一个反应灵敏，步调协调的统一组织。因此，数据驱动组织，不仅仅依赖于中央思考部门（数据和策略部门），同样依赖于各运营部门自身的神经单位。
　　按照这样的思想，理想的数据驱动的组织分为三个层次：中央控制的战略层、拥有自己&#8220;神经&#8221;的运营层，以及实现这一切的基础设施层。

　　与这种模式相对的模式，则是集中化的模式&#8212;&#8212;高层（例如一个集中的数据部门）拥有数据，然后指挥运营层的执行。这种模式难度太高。

　　可是我们在&#8220;迷局3&#8221;中说了，数据民主化之后，中层（运营层）如果没有数据正确解读的能力，可能比数据误读更可怕。因此，为实现数据驱动组织结构，数据民主化不仅仅只是让&#8220;数据本身&#8221;民主，也是让数据能力变得更加民主，即数据资源和数据分析资源的共同民主。
　　让数据分析师回归业务部门，而不是龟缩在数据部门中。
　　数据属于业务，数据分析师当然也属于业务。这是对他们最好的，也是对这个组织最好的。除此之外，还能有什么方式能够让他们发挥更大的效力呢？如下图所示，我们拆散数据部门的集中结构，让数据分析师分布到各个业务部门去。他们帮助业务部门运用数据系统、获取数据、处理数据，并与业务人员一起（结合实际业务）更直接更快捷地解读数据，并将结果直接应用于业务。这样，数据部门则只负责两块，即上面三角形结构中的最高层（竞争环境研究、全局性跨部门的策略研究、战略研究以及绩效跟踪）和最底层（数据仓库、报表和BI，以及对它们的维护）。中间的运营层面，应该是数据分析师和业务部门共同完成的。

　　这或许是最类似于人体组织的&#8220;民主化形式&#8221;&#8212;&#8212;我们的大脑不是神经系统系统中唯一的器官，而能够进行&#8220;思考&#8221;的器官，也绝不仅仅只是大脑。
结论
　　我有些偏执的相信，数据驱动型的组织一定不是人们主观期望它实现就能实现的。这个组织需要自下而上的需求，尤其是那些真正干活的人，他们对于数据的需求，决定了这个组织数据文化的根基。如果他们确实有需求，那么我们应该确保这个公司有数据的输出和处理，以及确保对于数据的处理（解读）是正确的，且能够最快速度的直接应用于业务的需求。
　　我相信，自上而下并非数据驱动组织形成的要件。或者，更偏激点，数据驱动组织不是CEO或者董事会希望它能够实现就能够实现的。这其中一定包含历史原因、政治阻力以及人本身的情况。而人本身的情况，才是数据文化的核心，哦，不，应该说，是一切文化的核心。
题外
　　在圣诞季以及过年期间，我关闭了博客的评论系统，因为每天有数以百计甚至千计的垃圾回复。今天我重新打开这个功能。希望大家畅所欲言。最后，祝大家龙年大吉！身体健康，合家幸福！
]]></description>
			<content:encoded><![CDATA[<p>【每期一句】It&rsquo;s a beautiful day, and I can&rsquo;t see it.</p>
<p>【前言】</p>
<p>　　莫道我不迷惘，我比任何时候都更迷惘。<a href="http://www.chinawebanalytics.cn/kpi_optimization_part1/" target="_blank">上次说到游泳的例子</a>，我得承认，在游泳的时候，各种&ldquo;怪异的姿势&rdquo;，往往不仅仅是因为冰冷的河水，更是因为水中难保没有漩涡湍流，水草拽脚，以及一群混乱游动的人群的相互制肘。或许这些人是推着一条往前行驶的船，但可惜，力气未必是朝同样的方向的。</p>
<p>　　这就是组织的困境。组织越大，力量反而未必越大。数据在这个组织中扮演什么样的角色呢？数据驱动的实现，需要什么样的组织结构，甚至，不仅仅是组织结构本身能够解决的？</p>
<p>　　希望我能和大家一起找到答案。</p>
<p><span id="more-3714"></span></p>
<p>【正文】</p>
<p>　　人人都渴望数据，但这可能隐藏着陷阱。</p>
<p>　　拥有数据意味着什么？&mdash;&mdash;Nothing。数据不等于信息，更不等于真相。数据在大多数情况下，要么是没有得到利用，要么就干脆是纯粹的误导！</p>
<p>　　人人都渴望数据，可没人尊重数据。矛盾吗？不，其实这幕天天上演。</p>
<p>　　我们怎么样才能真正建立起称得上&ldquo;数据驱动&rdquo;四个金字的电子商务组织？为什么数据驱动的组织那么困难？这个问题困扰了我很久，我几次演讲，有被听众问到这个问题，我都觉得没有给出很好的回答。今天，2011年12月31日，岁末，我想这个问题我不能再带到新的一年才去解决了。（文章开始于12月31日，但完成于1月21日，作者后注）</p>
<h3>迷局1：决定数据驱动型组织形成的关键是什么？</h3>
<p>　　数据驱动，这四个字中的&ldquo;驱动&rdquo;二字本质上直刺企业的核心。所谓驱动，即发号施令。没有发号施令，还驱动什么？因此数据驱动本质上，就是用数据来发号施令。</p>
<p>　　但发号施令的决策通常来自于三个不同的方式：感觉（guts），经验（experience）和认知（insights）。相对而言，由于感觉和经验虽然模糊却得来容易，因此决策者常常不由自主的利用这两种方式作出判断，从而很迅速地作出决定，发号施令。</p>
<p>　　显然，感觉和经验并非数据，虽然有时候人们也通过数据来形成感觉和经验，但更多时候人们倾向于选择那些与感觉和经验一致的数据进行研究和推导，而不愿相信那些与感觉和经验不相符合的数据。<strong>因此，感觉和经验，实际上是形成所谓数据驱动组织的最大障碍。</strong></p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image.png"><img align="left" alt="image" border="0" height="256" src="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image_thumb.png" style="border-width: 0px; margin: 5px 10px 5px 0px; display: inline;" title="image" width="327" /></a> 　　不过，请读者朋友们注意，我丝毫没有贬薄感觉和经验的意思。那些具有卓越感知和经验的操盘手，例如人人景仰的乔布斯，他们的感知和经验甚至可以凌驾一切之上，更何况在不太尊重数据的中国古代，还是涌现出相当多智勇双全，决策英明的英雄。而中国今天的商业智慧中绝对多的部分也是感觉和经验，绝非数据，这说明感觉和经验甚至是决定成败的。只是，我们今天的命题是数据驱动的组织，因此，我必须重申，如果一个组织确实依赖于感觉和经验，那么，数据驱动本身就并非一个重要的命题，在这个情况下，数据驱动与否根本就不会影响这个组织作出明智的决策。</p>
<p>　　另一个困难的地方在于，从组织架构的角度讲，数据并不是只拿给CEO看的。所以，有朋友问，CEO或者管理层的态度对推进数据驱动组织的形成，是否具有关键性的作用？我认为，如果CEO或者董事会，不认可数据驱动型的组织，数据驱动当然就无从谈起。但是，CEO或者管理层支持数据驱动型组织的建立，这一组织也<strong>未必</strong>能够真正建立起来。</p>
<p>　　我这么说可能并不会让你太吃惊。<strong>管理层可能有很多想做的事情，未必能够真正实现，或者未必能够按照原先的设想实现。</strong>数据的意义不在于仅仅提供<a href="http://www.chinawebanalytics.cn/%e2%80%9c%e5%8f%af%e6%89%a7%e8%a1%8c%e7%9a%84%e6%8a%a5%e5%91%8a%e7%b2%be%e8%a6%81%e2%80%9d%e2%80%94%e2%80%94%e8%b7%9f%e7%b3%9f%e7%b3%95%e7%9a%84%e7%ae%80%e8%a6%81%e6%8a%a5%e5%91%8a%e8%af%b4%e5%86%8d/" target="_blank">给CEO一个报告或者参考</a>，数据如果不渗透每一个执行层面，其意义会大打折扣。我认为，数据驱动的组织一定是宏观和微观的结合，即宏观层面上，要提供供管理层使用的策略型数据，不至让这个组织进退失措；微观层面上必须指导业务执行者的行动，让他们能够进行准确的选择，不用通过不断地&ldquo;试错&rdquo;才能知晓真正有用的下一步什么。宏观的确重要，但微观则更加致命，尤其是对电子商务组织而言。</p>
<p>　　电子商务组织需要快速的反应和高度强大的执行力，管理层发起的那些至上而下的推动，在真正推动起来的时候，往往已经错过了时机。电子商务组织的时机很多时候并非是管理层发现的，而来自执行层面的敏感的嗅觉，这些嗅觉在一些场合下甚至直接影响公司的成败；另一方面，无论管理层多么强悍的推动，所有最终的实现都必须依靠&ldquo;下面的人&rdquo;，因此，&ldquo;下面的人&rdquo;&mdash;&mdash;他们是否能够实现管理层的想法，才真正决定这个组织的成败。</p>
<p>　　所以，回到我们上面的问题&mdash;&mdash;就算CEO和管理层特别支持数据驱动型的组织，如果下面的执行者没有真正数据驱动的意识和需求，那么数据驱动型的组织也毫无实现的可能。</p>
<p>　　我的观点是&mdash;&mdash;数据驱动型的组织能否实现，要看需求方。真正的需求方是执行团队。<strong>执行团队是依赖于感觉和经验，还是依赖于数据，这才是数据驱动型组织能否实现的关键。</strong>如果执行团队渴望数据，利用数据，依赖数据，这个组织的数据驱动文化就很容易实现，而跟CEO和管理层其实关系没那么大。CEO和管理层要做的，是建立这样的执行团队，而不是生硬地自上而下的推动所谓某种以前并不存在的数据驱动的文化。</p>
<p>　　从这个角度看，我们的电子商务企业中，大部分执行团队都或多或少需要数据，依赖的程度高低，便是这个企业数据化驱动程度的高低。不过，我想很多国内电子商务企业，执行团队应该都还是靠着感觉和经验吧！这便是数据驱动组织并非那么容易实现的根本原因。</p>
<p>　　因此，数据驱动型的电子商务组织，基础性的第一步，是要建立真正的来自执行层面对数据的旺盛需求。这个需求不是CEO或者管理团队有一天忽然觉得数据无比重要而风风火火要求下来的政令，而是发自自然的，如同人们食色性也的需求。没有这样的需求，无论电子商务组织，还是任何其他组织，都不存在真正的所谓数据驱动。</p>
<h3>迷局2：使能（enable）的误区</h3>
<p>　　现在，假设我们的电子商务组织的执行团队是一群真正欣赏数据的人，数据驱动型的组织是否就实现了？</p>
<p>　　仍然很难。</p>
<p>　　在封闭系统内，有需求未必就会有供给。你欣赏iPhone5，但你没这个能力自己做一个；你渴求数据，但未必你能通过自己的力量获得。</p>
<p>　　所以，希望建立数据驱动文化的组织，一开始都把视线集中在建立能力上（当然，你要记住，如同我在迷局1中所写，首先是建立需求，而非建立能力）。</p>
<p>　　构建能力被称为&ldquo;使能（enable）&rdquo;，让这个组织能提供数据，有多种办法，但最常见的想法，是我们下面的这个图所展示的解决方式：</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image1.png"><img alt="image" border="0" height="349" src="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image_thumb1.png" style="border-width: 0px; display: inline;" title="image" width="395" /></a></p>
<p align="center">图1：经典数据组织架构&mdash;&mdash;hub模式&nbsp;</p>
<p>　　数据部门是个hub，这群人解决一个组织大部分的数据需求。当业务部门需要数据的时候，他们提交需求给数据部门，然后数据部门开始抽取、运算和分析，把数据和结果返回给业务部门。</p>
<p>　　唉，说实话，这真是一种笨办法，这使我想起了过去无所不包无所不揽的计划经济。我相信这个方法的初衷是好的，这么建立数据能力有如下几个动因：</p>
<ol>
<li>显然，这个方法能够让CEO或者管理层非常牢固的控制数据。数据比较安全&mdash;&mdash;至少看上去是那样。</li>
<li>数据部门可以集中起来工作，这似乎对做数据的同事是不错的一点。</li>
<li>节省人力，组织看起来规划清晰。不用在各处安插做数据做分析的人，确实省下一大笔人力和管理成本。</li>
<li>相对简单的数据系统。因为数据部门管理数据，诸如权限之类的系统设计，可能就不是那么重要了，反正人来提供数据报表即可。该给哪些部门，不给哪些部门，人工去每次划分确定就好了。数据的模型&mdash;&mdash;也没那么重要，人去分析就行了，不需要太高的自动化，也不需要太强大的BI。</li>
</ol>
<blockquote>
<p><strong>引申阅读：网站流量数据无秘密</strong></p>
<p>　　将数据部门作为hub的一个重要原因，是因为希望数据能够被放在一个&ldquo;保险箱内&rdquo;从而&ldquo;确保&rdquo;了数据的安全。</p>
<p>　　但这个想法多少有一点&ldquo;一厢情愿&rdquo;，我一直相信，网站流量其实无秘密。</p>
<p>　　例如，想要知道一个网站的流量并不复杂，有太多的工具，免费的，付费的，还可以用我之前说的对比法：《<a href="http://www.chinawebanalytics.cn/%e5%a6%82%e4%bd%95%e5%88%86%e6%9e%90%e9%99%8c%e7%94%9f%e7%bd%91%e7%ab%99%e7%9a%84%e6%b5%81%e9%87%8f%ef%bc%9f/">如何获知陌生网站的流量？</a>》。</p>
<p>　　如果足够细心，甚至也能参透一个电子商务网站大致的销量和销售额。</p>
<p>　　毕竟，电子商务网站本身就有很多信息可以透露给你。例如，商品消费的数量是可以查到的，而如果参考购买者做出评论的时间（在各个时间段发出评论数量的比例），则几乎可以确定一段时间内某个商品或者全部商品的销售量。</p>
<p>　　销售量和客单价之间简单的关系&mdash;&mdash;做出销售额不算困难。</p>
<p>　　有销售量，又有流量，你能把转化率也估计出来。</p>
<p>　　还有，流量渠道也不困难。很多工具都能告诉你一个网站的主要流量来源是什么，例如Hitwise。</p>
<p>　　不仅如此，每一个电商网站都因为要与各种市场营销第三方企业合作，而被布上了各种代码。这些代码无时无刻不在透露着这个网站相关的流量和销售信息。对他们而言，一个网站就像被X光反复扫描一样。除非你不跟他们做任何合作，否则这些数据总还是要被第三方知道，而且签署所谓的NDA协议，也不过是&ldquo;防君子不防小人&rdquo;。</p>
<p>　　其实，我认为，电子商务网站真正的数据秘密，是那些运营的细节。当然，还包括财务数据、商品的进货价格等等。但流量无秘密，用不着太紧张。</p>
</blockquote>
<p>　　但前面说过，这是一种笨办法，如果这样规划数据部门，可能会产生一些意想不到的结果。最可能产生的结局是：数据部门会&mdash;&mdash;疯掉？</p>
<p>　　这不是耸人听闻，如果数据部门要负责所有业务部门的数据，得需要多少人呢？肯定超出你的想象。此外，业务部门肯定不会仅仅只是满足于数据被提供出来，他们希望数据快些，更快些，他们希望实时数据。手工作业，实时太难，追求速度就意味着大量的人力和脑力的消耗。</p>
<p>　　好吧，就算数据部门能够提供实时数据，又能怎么样呢？数据不是策略，数据总得再经过分析和处理。数据部门不了解业务，他们能分析好吗？如果不去做这些分析，那么业务部门还得自己去分析，实时性不仅得不到保证，数据部门的价值发挥也大打折扣。</p>
<p>　　这种组织方式下，数据部门的价值和定位都很容易被质疑，而且他们还会苦逼地干得没日没夜。</p>
<p><strong>　　如果确实是这样一种组织方式，那么对数据部门的工作定义确实要非常谨慎</strong>。数据部门应该承担提供基础数据的工作，但他们没有职责，也不应该为业务层面提供战术性的分析，他们忙不过来，也必然缺乏业务概念。但这<strong>绝对不是</strong>任何一个真正&ldquo;数据驱动组织&rdquo;所应该具有的定义，这是&ldquo;暴殄天物&rdquo;的定义。</p>
<p>　　因为这些不完美，有一种更先进一点的方式去解决上面的一些问题，并且开始被大家注意，且有被神话的趋势。</p>
<p>　　这个方式，就是BI系统。</p>
<p>　　BI系统的本质是用来取代人手和人脑。这是一个好方法。把人从机械的工作中解放出来，提供给业务部门自动化的报表，而且还能承担一定的思考的工作，BI系统是一个伟大的发明。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image2.png"><img alt="image" border="0" height="377" src="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image_thumb2.png" style="border-width: 0px; display: inline;" title="image" width="409" /></a></p>
<p align="center">图2：BI驱动的数据组织架构</p>
<p>　　这也是为什么，一个真正具有数据驱动文化的公司，必须要有一个确实好用的BI系统。或者，较浅浅层次的，得有一个自动化的报表系统。但是，据我所知，很多电子商务公司这个系统要么缺失，要么非常难以使用。</p>
<blockquote>
<p><strong>引申阅读：被神话的BI系统</strong></p>
<p>　　BI被神话不奇怪。凡是人们不那么了解却又外表光鲜的事情，都容易被神话。:) （网站分析多少也被这么神话着。这并不是好事情。）</p>
<p>　　BI被神化的另一个原因，在于人们确实对友好聪明的数据系统抱有太多的期望。</p>
<p>　　在Gartner的一次调查中，超过80%的美国电子商务公司期待更好的BI系统。</p>
<p>　　但BI最大的问题是&mdash;&mdash;机器终究是机器。</p>
<p>　　BI可以解决一些机械的工作，能够建立数据模型帮助人们快速得出一些结论。但跟业务相关的细节分析，BI能够帮你发现现象，但无法告诉你原因。（我觉得，网站分析工具，其实就是BI工具的一种，它一样能够非常sharp的帮你发现现象，但同样无法告诉你原因）</p>
<p>　　所有的答案，都需要人去寻找，去解答。</p>
<p>　　此外，BI系统的效用，本身也极大的依赖于人。</p>
<p>　　首先，BI系统的设计，必须与一个公司自身的业务相契合。人才能完成这个让BI与业务需求相契合和匹配的工作。</p>
<p>　　其次，BI系统的建模和规则，全部是人来完成的。</p>
<p>　　最后，前面说了，BI不可能给你答案，唯有人才能做到。</p>
<p>　　所以，BI被神化的地方在于，认为一个BI系统就解决问题是不可能的。或者说，一个BI系统，不是狭义的硬件软件系统，而是IT系统+BI团队的结合。人，占90%，或者，占99%。</p>
<p>　　尽管有被神话的趋势，但BI的意义重大，作为不可或缺的基础设施，若没有BI系统，或者连一个自动化的报表系统都没有，这个组织的数据驱动的文化很难建立。原因无他，若有需求而无供给，只会引发严重的饥荒。</p>
</blockquote>
<h3>迷局3：数据误读，比没有数据更可怕</h3>
<p>　　无论是按照图1所示的hub模式，还是图2所示的有BI系统参与的hub模式。业务部门都面临着很大的风险。一方面，前面我们说了，hub本身存在资源和响应的矛盾。另一方面，数据误读比没有数据更可怕。</p>
<p>　　电子商务业务部门更强调业务能力，因此在数据的分析和解读上，能力相对较弱。与传统零售行业不同，传统零售的BI系统和分析团队往往经过了超过10年的进化，因此早已形成体系和一套具体的方法。电子商务虽然也属于零售业，但很显然，这些公司要年轻太多，让业务部门拿到数据后，自己去做分析和评估，是困难的。我最大的担忧，在于数据分析事实上容易变成一个粗暴简单并不断被&ldquo;自以为是&rdquo;的经验所干扰的工作。即使在做了很多的案例之后，我仍然认为，我没有哪一次没有被主观的感觉影响过判断，直到有更多的数据充实上下文才可能避免不客观的分析。而业务部门在拿到数据后，因为时间的压力和数据分析经验的缺乏，他们容易在短时间内得到结论，但误读数据，并进而造成这个结论背离事实的情况是时有发生的。而且，业务部门背负业绩压力，他们可能在一开始就主观上倾向于让自己不那么客观。</p>
<p>　　我曾在心里默念，对于数据应该常常怀着敬畏的心，因为简单粗暴适用于网络营销，但绝对不适用于营销分析。数据误读，我记得派代上有一位专家专门写了一个帖子探讨，我不能同意更多，甚至也有完全相似的例子。如果你只是那么一点点粗心，或延续了&ldquo;简单粗暴&rdquo;的办法，那些数据中给你揭示的细微的差别，你可能会忽略，而这些差别可能会让你得出完全不一样甚至是相反的结论。</p>
<p>　　例如下面的这个例子：</p>
<p>　　对于下面两个图的数据实际上是完全一样的，可是，两个图给你的心理上的感觉却是完全不同的。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image3.png"><img alt="image" border="0" height="284" src="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image_thumb3.png" style="border-width: 0px; margin: 0px 10px 5px 0px; padding-top: 0px; padding-right: 0px; padding-left: 0px; display: inline; background-image: none;" title="image" width="460" /></a></p>
<p align="center">图3：利润趋势（1）</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image4.png"><img alt="image" border="0" height="284" src="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image_thumb4.png" style="border-width: 0px; margin: 0px 10px 5px 0px; padding-top: 0px; padding-right: 0px; padding-left: 0px; display: inline; background-image: none;" title="image" width="460" /></a></p>
<p align="center">图4：利润趋势（2）</p>
<p>　　尽管数据一样，但图3和图4用了不同的数据显示区间（Scaling）。由图3得出的结论，是利润在近期剧烈的波动，而图4的结论则是利润在近期平稳维持在低位。这两个结论并不能简单说明它们正确与否，取决于实际的商业环境。例如，如果你的生意平常一天是1000以上的利润，那么显然图4给你的结论更有参考意义，你应该探求为什么最近的生意几乎停滞了。</p>
<p>　　但是，如果你的生意一天的确最多不超过100的利润，那么图3更有价值。而且你可能会觉得，利润数据还不错，这几天还有明显的上涨的趋势。不过，或许你还是不能高兴的太早。下面这个图（图5）和图3在利润上的数值是完全一样的，不过增加了另一个数据项：收入（蓝色点）。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image5.png"><img alt="image" border="0" height="284" src="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image_thumb5.png" style="border-width: 0px; margin: 0px 10px 5px 0px; padding-top: 0px; padding-right: 0px; padding-left: 0px; display: inline; background-image: none;" title="image" width="460" /></a></p>
<p align="center">图5：利润和收入趋势</p>
<p>　　你可以看到尽管利润上升了，收入上升的趋势更为显著。这意味着，我们的利润增长并没有收入增长的快。或者换句话说，我们的投资回报率（ROI）下降了。因此利润虽然上涨，但完全不值得我们高兴。我们反而应该检讨，为什么效率降低了。</p>
<p>　　数据的误读很多时候并非是故意的，而是跟经验有关。这些经验在于两点，第一点，对于数据的运算和把握。例如，合理建模，合理的数据可视化（Data Visualization），以及对工具合理的应用。第二点，在于对于业务的准确把握&mdash;&mdash;做到看数说话，与实际业务几无偏差。第二点是建立在第一点的基础上的。如果第一点出现了一些问题，或是没有技能，或是没有经验，第二点便会遭殃，即使对于业务有很好的感觉和清晰敏捷的头脑，也会为数据所累。</p>
<p>　　来看另一个真实的例子。</p>
<p>　　我的朋友Johnny，他在为在美国销售某一个商品而投放Google AdWords的广告。这个商品的利润额在2011年每个月的表现如下图所示：</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image6.png"><img alt="image" border="0" height="284" src="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image_thumb6.png" style="border-width: 0px; padding-top: 0px; padding-right: 0px; padding-left: 0px; display: inline; background-image: none;" title="image" width="460" /></a></p>
<p align="center">图6：Johnny全年每月SEM投放利润情况</p>
<p align="left">　　很显然这个商品的生意出了什么问题，有必要找出原因。</p>
<p align="left">　　利润下降，要么是收入减少，要么是支出增加，要么是二者同时发生了。从支出上看，每个月的支出变化不大，而且实际上，当利润降低的那些月份，支出反而也是略有降低的。那么很明显，收入下降是造成利润下降的主要原因。收入为什么下降呢？</p>
<p align="left">　　很快，他们找到了一个相当有说服力的数据关系：当SEM关键词的平均排名下降了之后，销售收入也非常明显的下滑。如图7所示。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image7.png"><img alt="image" border="0" height="284" src="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image_thumb7.png" style="border-width: 0px; padding-top: 0px; padding-right: 0px; padding-left: 0px; display: inline; background-image: none;" title="image" width="460" /></a></p>
<p align="center">图7：销售收入和关键词平均排名的关系</p>
<p align="left">　　现在，假设一个情景：有一个非常非常缺乏经验的初级SEM专员，他很可能给出的结论是：利润降低，是因为收入降低，而收入降低，是因为关键词排名降低，因此我们需要提升关键词排名，以获得更多收入提升利润。</p>
<p align="left">　　你当然相信这个结论是简单粗暴，并非反映事实。事实是，关键词排名升高，当然会获得更多的点击从而获得更多的销售额，但成本同时也会提高。所以，这个结论并不一定是正确的。于是，更有经验一些的SEM专员，会继续坐下来寻找下一个关系，如下图8所示。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image8.png"><img alt="image" border="0" height="284" src="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image_thumb8.png" style="border-width: 0px; margin: 5px 10px 0px 0px; padding-top: 0px; padding-right: 0px; padding-left: 0px; display: inline; background-image: none;" title="image" width="460" /></a></p>
<p align="center">图8：利润和关键词平均排名的关系</p>
<p align="left">　　这个图简直是上一个图（图7）的翻版，只是一个是收入，一个是利润，数据的比例尺不同而已。看起来，利润和关键词平均排名的关系和收入与关键词排名的关系也非常一致。现在，我们可以放心大胆的得出结论&mdash;&mdash;我们应该提升排名，以获得更多的利润！</p>
<p align="left">　　于是他们提高了出价，提升了排名，并且在2012年1月份的这几天，得到了结果&mdash;&mdash;利润不仅没有升高，反而更加下降了&mdash;&mdash;甚至某些天是负的，尽管关键词的排名又重新回到了3位左右。</p>
<p align="left">　　之前数据反映了某种似乎确定无疑的关系，但按照这种关系行事，并没有带来预期的结果。</p>
<p align="left">　　我们必须承认，SEM投放是一个复杂的策略过程，并且因为瞬息万变的外部环境（竞争对手的出价），而造成最优化的出价方式总是动态的。</p>
<p align="left">　　上面的例子，Johnny认为原因很简单，这个商品的关键词投放可能已经遇到了瓶颈，因为外部的环境发生了变化。Johnny查看了其他的数据（我们当然不能忽略其他数据的关系），例如，CPC（Cost Per Click）数据，Johnny发现在这12个月中，CPC的变化并不大。CPC没有明显变化，而排名在逐渐降低，说明竞争对手在不断增加出价，这样，相同的投入情况下，排名降低，收入减少，利润减少。如图9。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image9.png"><img alt="image" border="0" height="250" src="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image_thumb9.png" style="border: 0px currentcolor; padding-top: 0px; padding-right: 0px; padding-left: 0px; display: inline; background-image: none;" title="image" width="500" /></a></p>
<p align="center">图9：CPC（出价）没有太大变化，但排名却一落千丈</p>
<p align="left">　　可是，增加出价后，我们解决了一个问题，却带来了另外一个问题&mdash;&mdash;出价增加，收入增加，同时成本也上升了。由于竞争环境的影响，要达到以前的排名，所出的价格甚至是之前价格的3、4倍。因此，虽然收入增加，但成本上升的更可怕，利润空间被压缩的非常厉害。</p>
<p align="left">　　由于这个商品60%的销售都是由一个最主要的词（大词）带来（这是我之前没有揭示的一个线索），也许我们可以因此得出另一个结论：大词的ROI表现日益下滑，因此或许应该拓展其他的词，例如长尾词，从其他的竞争不大的词上找机会。</p>
<p align="left">　　不过，从目前的情况看，这个商品的长尾词并没有多少流量，它仍然依赖于大词的表现。所以，我们认为，这个商品本身的市场环境已经发生了变化，高ROI的好日子过去了。现在的策略，是在微利的情况下生存，尽量更精细化更实时的优化，保证不亏损，并着手开发新的商品。</p>
<p align="left">　　或许这个SEM的例子并不是一个非常典型的例子，因为SEM的分析仍然是相对结构化和流程化的。我们通过BI的建模完全可以自动化，但如果没有好的BI系统（事实上因为百度的原因，国内的SEM是很难真正的BI化的），那么这些工作需要人来完成，需要有经验的、相当数量的人来完成。SEM是数据分析的较为特殊的类别，相对而言，其他的运营分析，则更不具有预先的结构化和流程化，例如对EDM营销（或数据库营销）的研究，需要大量的测试；对一次campaign或是promotion的销售预测，需要很有经验的分析师；或是对于商品生命周期的研究，需要精通零售的数据挖掘专家。这些都不是运营简单粗暴能够实现的。</p>
<p align="left">　　所以，人们渴求数据，尤其是运营部门。但人们却很容易面对数据变得焦虑和不信任。我常常会听到这样的反馈：&ldquo;数据是错的！&rdquo;&mdash;&mdash;我相信永远没有他所希望的正确的数据。无论是数据误读，还是根本数据就是数据，从来没有转化成有价值的信息，都意味着反面的效果，甚至，还远不如根本就没有数据。</p>
<p align="left">　　因此，数据驱动的企业文化的要件，除了对数据有渴求，除了对数据有&ldquo;使能&rdquo;，还需要对数据正确的解读。</p>
<p align="left">　　我们需要从组织结构上保证数据能够被正确解读，或者至少是尽可能的被正确地解读。</p>
<h3 align="left">反思：数据民主化和数据驱动型组织的架构</h3>
<p align="left">　　一个组织的自下而上都有数据驱动的需求（上面的需求部分），而且也有决心投入资源建立数据部门（上面的使能部分），那么剩下的就是如何正确的利用数据，准确的获得信息，并以最快的速度利用在运营和执行策略上。</p>
<p align="left">　　在我们上面的&ldquo;迷局2&rdquo;和&ldquo;迷局3&rdquo;中，我提出了对于&ldquo;集中化&rdquo;数据组织的疑问。我相信这种数据组织是蕴含风险的，无论这种集中是人力资源的集中，还是数据自动化系统的集中。如果我们需要一种健康的数据驱动的企业组织，那么我们需要&ldquo;数据民主化（Data Democratization）&rdquo;。这个想法，来自于我之前工作的Adobe Omniture，也来自于凯文&middot;凯利的《失控》，这些思想告诉我们，上帝创立世界，从没有让世界按照&ldquo;中央控制&rdquo;模式运行。自大爆炸以来（如果我们不考虑&ldquo;虚时间&rdquo;，那么我们可以认为大爆炸理论是合理的，当然，今天这个理论被进一步进化以帮助人们探求大爆炸之前有什么），上帝就只是给出了规则，而让万事自我发展，他并不插手。我也记得，当按照中央计划的生产和消费活动被举国执行时，只能在某些极端情况下暂时的运转良好，但当市场成为经济的核心构建的时候，一切变得自主而民主化，事情反而在混沌中有了自我秩序。<a href="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image10.png"><img align="right" alt="image" border="0" height="221" src="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image_thumb10.png" style="border-width: 0px; margin: 5px 10px 0px 20px; padding-top: 0px; padding-right: 0px; padding-left: 0px; float: right; display: inline; background-image: none;" title="image" width="240" /></a></p>
<p align="left">　　人体是最大的&ldquo;民主化系统&rdquo;。大脑的思维并不会指挥消化系统的工作，心跳的速度提升和变缓也是它自发完成的。心理学家告诉我们，大脑的主动意识甚至仅仅支配了人的行为的不到10%，潜意识却无时无刻不决定我们的行为。有些生物，例如蜜蜂，这些几乎连大脑都没有的生物却展现出高级群体特征，并通过特定手段传递相当复杂的信息（这些信息连人类都要进行复杂的描述才能实现），这些都不可能来源于一个集中化的&ldquo;中央控制系统&rdquo;的主动指令。</p>
<p align="left">　　一个组织的数据驱动类似于人的神经系统。大脑负责核心的运转（关键执行）和高级的思维（战略），各系统（消化系统、循环系统&hellip;&hellip;，各经营部门）根据机体的内在和外在环境变化自主运行，形成一个反应灵敏，步调协调的统一组织。因此，数据驱动组织，不仅仅依赖于中央思考部门（数据和策略部门），同样依赖于各运营部门自身的神经单位。</p>
<p align="left">　　按照这样的思想，理想的数据驱动的组织分为三个层次：中央控制的战略层、拥有自己&ldquo;神经&rdquo;的运营层，以及实现这一切的基础设施层。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image11.png"><img alt="image" border="0" height="172" src="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image_thumb11.png" style="margin: 5px 10px 0px 0px; border: 0px currentcolor; padding-top: 0px; padding-right: 0px; padding-left: 0px; display: inline; background-image: none;" title="image" width="407" /></a></p>
<p align="left">　　与这种模式相对的模式，则是集中化的模式&mdash;&mdash;高层（例如一个集中的数据部门）拥有数据，然后指挥运营层的执行。这种模式难度太高。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image12.png"><img alt="image" border="0" height="223" src="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/image_thumb12.png" style="margin: 5px 10px 0px 0px; border: 0px currentcolor; padding-top: 0px; padding-right: 0px; padding-left: 0px; display: inline; background-image: none;" title="image" width="273" /></a></p>
<p align="left">　　可是我们在&ldquo;迷局3&rdquo;中说了，数据民主化之后，中层（运营层）如果没有数据正确解读的能力，可能比数据误读更可怕。因此，为实现数据驱动组织结构，数据民主化不仅仅只是让&ldquo;数据本身&rdquo;民主，也是让数据能力变得更加民主，即数据资源和数据分析资源的共同民主。</p>
<p align="left">　　让数据分析师回归业务部门，而不是龟缩在数据部门中。</p>
<p align="left">　　数据属于业务，数据分析师当然也属于业务。这是对他们最好的，也是对这个组织最好的。除此之外，还能有什么方式能够让他们发挥更大的效力呢？如下图所示，我们拆散数据部门的集中结构，让数据分析师分布到各个业务部门去。他们帮助业务部门运用数据系统、获取数据、处理数据，并与业务人员一起（结合实际业务）更直接更快捷地解读数据，并将结果直接应用于业务。这样，数据部门则只负责两块，即上面三角形结构中的最高层（竞争环境研究、全局性跨部门的策略研究、战略研究以及绩效跟踪）和最底层（数据仓库、报表和BI，以及对它们的维护）。中间的运营层面，应该是数据分析师和业务部门共同完成的。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/Data-Driven-Org.gif"><img alt="Data-Driven-Org" border="0" height="340" src="http://www.chinawebanalytics.cn/wp-content/uploads/2012/01/Data-Driven-Org_thumb.gif" style="margin: 5px 10px 0px 0px; border: 0px currentcolor; padding-top: 0px; padding-right: 0px; padding-left: 0px; display: inline; background-image: none;" title="Data-Driven-Org" width="443" /></a></p>
<p align="left">　　这或许是最类似于人体组织的&ldquo;民主化形式&rdquo;&mdash;&mdash;我们的大脑不是神经系统系统中唯一的器官，而能够进行&ldquo;思考&rdquo;的器官，也绝不仅仅只是大脑。</p>
<h3 align="left">结论</h3>
<p align="left">　　我有些偏执的相信，数据驱动型的组织一定不是人们主观期望它实现就能实现的。这个组织需要自下而上的需求，尤其是那些真正干活的人，他们对于数据的需求，决定了这个组织数据文化的根基。如果他们确实有需求，那么我们应该确保这个公司有数据的输出和处理，以及确保对于数据的处理（解读）是正确的，且能够最快速度的直接应用于业务的需求。</p>
<p align="left">　　我相信，自上而下并非数据驱动组织形成的要件。或者，更偏激点，数据驱动组织不是CEO或者董事会希望它能够实现就能够实现的。这其中一定包含历史原因、政治阻力以及人本身的情况。而人本身的情况，才是数据文化的核心，哦，不，应该说，是一切文化的核心。</p>
<h3>题外</h3>
<p align="left">　　在圣诞季以及过年期间，我关闭了博客的评论系统，因为每天有数以百计甚至千计的垃圾回复。今天我重新打开这个功能。希望大家畅所欲言。最后，祝大家龙年大吉！身体健康，合家幸福！</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/data-driven-org-thinkings/feed/</wfw:commentRss>
		<slash:comments>19</slash:comments>
		</item>
		<item>
		<title>策略与数据——分析和优化的阴阳太极</title>
		<link>http://www.chinawebanalytics.cn/%e7%ad%96%e7%95%a5%e4%b8%8e%e6%95%b0%e6%8d%ae%e2%80%94%e2%80%94%e5%88%86%e6%9e%90%e5%92%8c%e4%bc%98%e5%8c%96%e7%9a%84%e9%98%b4%e9%98%b3%e5%a4%aa%e6%9e%81/</link>
		<comments>http://www.chinawebanalytics.cn/%e7%ad%96%e7%95%a5%e4%b8%8e%e6%95%b0%e6%8d%ae%e2%80%94%e2%80%94%e5%88%86%e6%9e%90%e5%92%8c%e4%bc%98%e5%8c%96%e7%9a%84%e9%98%b4%e9%98%b3%e5%a4%aa%e6%9e%81/#comments</comments>
		<pubDate>Sun, 16 Jan 2011 15:37:37 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[Headline]]></category>
		<category><![CDATA[网站分析经验分享]]></category>
		<category><![CDATA[CWA]]></category>
		<category><![CDATA[Omniture]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=3336</guid>
		<description><![CDATA[&#160;
【版权声明】本文系Adobe Omniture资深分析总监Brent Dykes所作，原文名为：Strategy and Data &#8211; the Yin and Yang of Analytics and Optimization。中文译文系Sidney Song（宋星）翻译。Adobe及作者拥有版权，译文版权归译者及CWA（China Web Analytics,&#160;www.chinawebanalytics.cn）所有。
【前言】
　　这是2010年12月15日圣诞节前前辈Brent Dykes的一篇文章，探讨数据和策略之间的关系。原文请见：http://blogs.omniture.com/2010/12/15/strategy-and-data-%E2%80%93-the-yin-and-yang-of-analytics-and-optimization/。

　　在我的前一篇文章中，我介绍了&#8220;价值路径&#8221;的理念（见下图），显示了实现网站分析投资的不同的关键步骤。这个过程中的第一个&#8220;多米诺骨牌&#8221;是数据。最初，我认为大家都很好地理解了自身的业务目标决定了自己的数据收集方式，但进一步的反馈表明我还是需要明确说明这个过程中&#8220;策略&#8221;的重要性。
　　我的第一个想法是在数据&#8220;多米诺牌&#8221;前加上另一个骨牌。然而，再度考虑之后，我觉得相对于把策略置于这个流程的第一步，把它作为这个数据驱动价值路径中所有步骤的基础更为恰当，因为策略是贯穿始终的，而且比这个过程中的每个单一步骤都更有影响力而且能够真正影响到每一个&#8220;骨牌&#8221;。

　　为了显示策略如何作为上面所有数据驱动活动的基础，我将描述5个关键区域，并说明策略是如何以不同的方式为其中的每个区域带来不同影响的。
1. 数据
　　为了让网站数据有用、相关而且完整，需要紧随在线营销的策略和组织的目标。如同上面提到的，一个网站监测策略确保网站分析和优化工具的实施或是配置与业务的关键目标相一致。没有任何组织想要不好的数据。相关性差以及不完整的数据和不精确的数据一样糟糕。
2. 报告
　　如果不理解一个公司的策略和业务目标，那么就很难建立有意义的报告和dashboard（精要报告，所谓dashboard的的解释请见我的博客www.chinawebanalytics.cn的文章：网站分析报告101：计划、实施策略和Dashboard）。最好的报告和dashboard一定很好地为衡量业务的绩效表现而做了恰当的调整。如果你不是那么小心，超期报告就会跟不上当前的在线营销策略和业务目标。
　　时间一长，网站分析团队可能会被要求不断定期做出各种报告，做这些报告也许只是成为了连贯性的行为。在日夜劳作前，有些人会按下暂停键并问&#8220;为什么这个报告会存在？&#8221;或者&#8220;这个报告还跟业务有关吗？&#8221;因此，与其复制那些为过时的业务目标设定的历史报告，还不如决定是否这些报告应该被更具相关性、更有意义且与当前业务目标联系更紧密的报告所替代。
3. 分析
　　分析工具例如SiteCatalyst，Discover以及Insight都提供极为丰富的网站数据供公司进行分析。在很多情况下，你所拥有的数据比你想要知道的还要多。此外，你的分析师团队每天或每周都会接到来自各个业务部门的堆积如山的分析需求。当分析师对于线上策略和关键业务目标有一个清晰理解的时候，他们就能自主为需要进行的分析排好优先级&#8212;&#8212;哪些需要早些完成，哪些可以延迟，哪些可以忽略。由于大多数公司的分析资源都是有限的，因此对于业务策略的理解对于高效分配资源和时间是至关重要的。当分析的优先级是基于对当前业务最为重要的事情排序的，那么就很容易推回那些暂时不重要的事情。分析师的精力也就能集中于那些能够带来最大回报的工作上。
4. 行动
　　没有之后的执行（行动），分析再多也没有价值。一旦企业掌握了有价值的分析和洞见，就会形成策略并影响之后的行动。类似于对于分析的优先级排序的影响，策略也能帮助对于提出优化建议的优先级进行更好地排序，例如哪些被提出来的建议更值得通过Test&#38;Target（Adobe Omniture的一款功能强大的测试和定向工具）进行实际的测试。策略也能够潜移默化地灌输给团队对于建议被采纳优先级别的更好感觉。如果市场营销部门以及IT部门能够对关键业务目标有共同的认识，那么这两个团队就能够围绕更加重要更有优先级的策略目标更好地配合工作。
5. 业务价值
　　策略决定了一个公司可能能够通过数据驱动实现的最大化的潜在价值。一个差劲的策略将会限制潜在的整体价值。即使所有其他的业务领域（例如做出极好的实施，很有洞察力的报告，有技能的分析师，执行力很强的团队等）都被你夯实，但是你的业务价值却受限于积弱的策略而不能够有所质变。另一方面，一个合理的策略能够提供给一个组织无尽的价值。数据、汇报、分析以及执行等具体活动为价值带来的贡献其实都被策略的优劣所牢牢限定。
阴阳
　　当一个公司的策略影响到前面价值路径中的所有领域之后，一个有趣的事情就会发生。起初，数据会开始引导并优化业务的战术执行层面。然后，你将看到数据在不断形成或影响你的业务策略，并且能从中得到很多洞见。数据和策略就如同中国的阴阳太极。两个领域互相平衡，互相影响，互相转化又互相滋养。
　　例如，无论监测实施的多快多顺利，如果不能与业务策略紧密结合都会使数据变得无甚意义。没有预先清晰定义的线上策略，数据、汇报、分析和行动都将无法带来预期的价值。如同Peter Drucker（彼得&#183;德鲁克）所嘲讽的：&#8220;做不需要去做的事情，即使再高效，也屁用没有。&#8221;分析师的资源和时间都是有限的，有一个清晰地策略对于数据驱动的成功至关重要。这会确保你的公司正在衡量和测试正确的事情，假以时日，这些衡量和测试的数据就会为你源源不断带来洞见，并帮助你不断提纯和提升你的在线策略。
　　策略催生数据，数据催生策略，正如同阴阳太极，相克相生。【全文完】
]]></description>
			<content:encoded><![CDATA[<h4>&nbsp;</h4>
<h4 style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; padding-top: 0px; padding-right: 0px; padding-bottom: 0px; padding-left: 0px; font: normal normal normal 1em/normal Arial; "><span class="Apple-style-span" style="color: rgb(51, 51, 51); font-family: Arial, Helvetica; font-weight: normal; line-height: 21px; ">【版权声明】本文系Adobe Omniture资深分析总监Brent Dykes所作，原文名为：<a href="http://blogs.omniture.com/2010/12/15/strategy-and-data-%E2%80%93-the-yin-and-yang-of-analytics-and-optimization/" target="_blank">Strategy and Data &ndash; the Yin and Yang of Analytics and Optimization</a>。中文译文系Sidney Song（宋星）翻译。Adobe及作者拥有版权，译文版权归译者及CWA（China Web Analytics,&nbsp;<a href="http://www.chinawebanalytics.cn/" style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; padding-top: 0px; padding-right: 0px; padding-bottom: 0px; padding-left: 0px; color: rgb(60, 120, 167); text-decoration: none; ">www.chinawebanalytics.cn</a>）所有。</span></h4>
<p>【前言】</p>
<p>　　这是2010年12月15日圣诞节前前辈<a href="http://blogs.omniture.com/author/bdykes/">Brent Dykes</a>的一篇文章，探讨数据和策略之间的关系。<span id="more-3336"></span>原文请见：<a href="http://blogs.omniture.com/2010/12/15/strategy-and-data-%E2%80%93-the-yin-and-yang-of-analytics-and-optimization/">http://blogs.omniture.com/2010/12/15/strategy-and-data-%E2%80%93-the-yin-and-yang-of-analytics-and-optimization/</a>。</p>
<p><img align="left" alt="" height="210" src="http://assets.omniture.com/en/images/blogs/taichi.jpg" style="margin: 0px 20px 0px 0px; display: inline; float: left" width="186" /></p>
<p>　　在我的<a href="http://www.chinawebanalytics.cn/reporting-vs-analysis/">前一篇文章</a>中，我介绍了&ldquo;价值路径&rdquo;的理念（见下图），显示了实现网站分析投资的不同的关键步骤。这个过程中的第一个&ldquo;多米诺骨牌&rdquo;是数据。最初，我认为大家都很好地理解了自身的业务目标决定了自己的数据收集方式，但进一步的反馈表明我还是需要明确说明这个过程中&ldquo;策略&rdquo;的重要性。</p>
<p>　　我的第一个想法是在数据&ldquo;多米诺牌&rdquo;前加上另一个骨牌。然而，再度考虑之后，我觉得相对于把策略置于这个流程的第一步，把它作为这个数据驱动价值路径中所有步骤的基础更为恰当，因为策略是贯穿始终的，而且比这个过程中的每个单一步骤都更有影响力而且能够真正影响到每一个&ldquo;骨牌&rdquo;。</p>
<p align="center"><img alt="" border="0" height="288" src="http://assets.omniture.com/en/images/blogs/dominoes_strategy.jpg" style="background-image: none; border-right-width: 0px; padding-left: 0px; padding-right: 0px; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px; padding-top: 0px" width="450" /></p>
<p>　　为了显示策略如何作为上面所有数据驱动活动的基础，我将描述5个关键区域，并说明策略是如何以不同的方式为其中的每个区域带来不同影响的。</p>
<p><strong>1. 数据</strong></p>
<p>　　为了让网站数据有用、相关而且完整，需要紧随在线营销的策略和组织的目标。如同上面提到的，一个<a href="http://blogs.omniture.com/2009/08/31/the-elusive-web-measurement-strategy/">网站监测策略</a>确保网站分析和优化工具的实施或是配置与业务的关键目标相一致。没有任何组织想要不好的数据。相关性差以及不完整的数据和不精确的数据一样糟糕。</p>
<p><strong>2. 报告</strong></p>
<p><img align="right" alt="" height="336" src="http://assets.omniture.com/en/images/blogs/reporting_burden.jpg" style="display: inline; float: right" width="250" />　　如果不理解一个公司的策略和业务目标，那么就很难建立有意义的报告和dashboard（精要报告，所谓dashboard的的解释请见我的博客<a href="http://www.chinawebanalytics.cn">www.chinawebanalytics.cn</a>的文章：<a href="http://www.chinawebanalytics.cn/wa-report-101-1/">网站分析报告101：计划、实施策略和Dashboard</a>）。最好的报告和dashboard一定很好地为衡量业务的绩效表现而做了恰当的调整。如果你不是那么小心，超期报告就会跟不上当前的在线营销策略和业务目标。</p>
<p>　　时间一长，网站分析团队可能会被要求不断定期做出各种报告，做这些报告也许只是成为了连贯性的行为。在日夜劳作前，有些人会按下暂停键并问&ldquo;为什么这个报告会存在？&rdquo;或者&ldquo;这个报告还跟业务有关吗？&rdquo;因此，与其复制那些为过时的业务目标设定的历史报告，还不如决定是否这些报告应该被更具相关性、更有意义且与当前业务目标联系更紧密的报告所替代。</p>
<p><strong>3. 分析</strong></p>
<p>　　分析工具例如SiteCatalyst，Discover以及Insight都提供极为丰富的网站数据供公司进行分析。在很多情况下，你所拥有的数据比你想要知道的还要多。此外，你的分析师团队每天或每周都会接到来自各个业务部门的堆积如山的分析需求。当分析师对于线上策略和关键业务目标有一个清晰理解的时候，他们就能自主为需要进行的分析排好优先级&mdash;&mdash;哪些需要早些完成，哪些可以延迟，哪些可以忽略。由于大多数公司的分析资源都是有限的，因此对于业务策略的理解对于高效分配资源和时间是至关重要的。当分析的优先级是基于对当前业务最为重要的事情排序的，那么就很容易推回那些暂时不重要的事情。分析师的精力也就能集中于那些能够带来最大回报的工作上。</p>
<p><strong>4. 行动</strong></p>
<p><strong><img align="left" alt="" height="202" src="http://assets.omniture.com/en/images/blogs/showme_money.jpg" style="margin: 0px 20px 0px 0px; display: inline; float: left" width="202" /></strong>　　没有之后的执行（行动），分析再多也没有价值。一旦企业掌握了有价值的分析和洞见，就会形成策略并影响之后的行动。类似于对于分析的优先级排序的影响，策略也能帮助对于提出优化建议的优先级进行更好地排序，例如哪些被提出来的建议更值得通过Test&amp;Target（Adobe Omniture的一款功能强大的测试和定向工具）进行实际的测试。策略也能够潜移默化地灌输给团队对于建议被采纳优先级别的更好感觉。如果市场营销部门以及IT部门能够对关键业务目标有共同的认识，那么这两个团队就能够围绕更加重要更有优先级的策略目标更好地配合工作。</p>
<p><strong>5. 业务价值</strong></p>
<p>　　策略决定了一个公司可能能够通过数据驱动实现的最大化的潜在价值。一个差劲的策略将会限制潜在的整体价值。即使所有其他的业务领域（例如做出极好的实施，很有洞察力的报告，有技能的分析师，执行力很强的团队等）都被你夯实，但是你的业务价值却受限于积弱的策略而不能够有所质变。另一方面，一个合理的策略能够提供给一个组织无尽的价值。数据、汇报、分析以及执行等具体活动为价值带来的贡献其实都被策略的优劣所牢牢限定。</p>
<p><strong>阴阳</strong></p>
<p><img align="right" alt="" height="232" src="http://assets.omniture.com/en/images/blogs/yin_yang.jpg" style="display: inline; float: right" width="250" />　　当一个公司的策略影响到前面价值路径中的所有领域之后，一个有趣的事情就会发生。起初，<strong>数据会开始引导并优化业务的战术执行层面</strong>。然后，你将看到<strong>数据在不断形成或影响你的业务策略，并且能从中得到很多洞见</strong>。数据和策略就如同中国的<strong>阴阳太极</strong>。两个领域互相平衡，互相影响，互相转化又互相滋养。</p>
<p>　　例如，无论监测实施的多快多顺利，如果不能与业务策略紧密结合都会使数据变得无甚意义。没有预先清晰定义的线上策略，数据、汇报、分析和行动都将无法带来预期的价值。如同Peter Drucker（彼得&middot;德鲁克）所嘲讽的：&ldquo;<strong>做不需要去做的事情</strong>，即使再高效，也屁用没有。&rdquo;分析师的资源和时间都是有限的，有一个清晰地策略对于数据驱动的成功至关重要。这会确保你的公司正在衡量和测试正确的事情，假以时日，这些衡量和测试的数据就会为你源源不断带来洞见，并帮助你不断提纯和提升你的在线策略。</p>
<p>　　策略催生数据，数据催生策略，正如同阴阳太极，相克相生。【全文完】</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/%e7%ad%96%e7%95%a5%e4%b8%8e%e6%95%b0%e6%8d%ae%e2%80%94%e2%80%94%e5%88%86%e6%9e%90%e5%92%8c%e4%bc%98%e5%8c%96%e7%9a%84%e9%98%b4%e9%98%b3%e5%a4%aa%e6%9e%81/feed/</wfw:commentRss>
		<slash:comments>9</slash:comments>
		</item>
		<item>
		<title>线上营销对线下行动效果的监测（上）</title>
		<link>http://www.chinawebanalytics.cn/online-campaign-influence-offline-part-i/</link>
		<comments>http://www.chinawebanalytics.cn/online-campaign-influence-offline-part-i/#comments</comments>
		<pubDate>Sun, 24 Oct 2010 14:57:48 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[Featured]]></category>
		<category><![CDATA[Headline]]></category>
		<category><![CDATA[网站分析经验分享]]></category>
		<category><![CDATA[IWOM]]></category>
		<category><![CDATA[口碑监测]]></category>
		<category><![CDATA[线下效果监测]]></category>
		<category><![CDATA[调研]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=3088</guid>
		<description><![CDATA[【前言】这个问题是我们的QQ群上被最常问起的问题之一，事实上也是我的客户经常问起的问题之一。这是个非常复杂的问题，不在于提出问题本身，而在于解决问题的可行性一直困扰着从业者。这篇文章，将讨论线上营销对线下行动影响的几种类型和目前的解决方法及仍然存在的困扰。这是这个主题的上篇，下篇请见：线上营销对线下行动效果的监测（下）。
【正文】
　　今天的这个话题是一个新的挑战，坦率说，在这个领域我所知有限，且一直抱有畏惧，但这是一个无法回避的话题，如果你要做网络营销，你的老板就必会问你最终带来了什么样的效果。这个效果，对于很多非直接在线交易的商业模式而言，实际上意味着受众受到网络营销影响而在线下所采取的行动。这，不是单靠网站分析工具可以监测到的了。因此，网络营销界的实践者们，尝试了各种方法来试图解决这个问题，并将在未来的数年持续探索下去。
　　这篇文章无法总结他们的探索，而与之前的文章类似，只是谈谈我的理解和实践，希望引发大家的思考和讨论。
线上营销对线下行动产生影响效果的分类
　　线上营销对线下行动产生的效果分为多种类型，按照从比较初级的影响到非常强烈的影响，可以分为四个层次，如下所示：

对产品留下印象（Awareness）
对产品产生好感/潜在购买可能性（Preferences）
提交购买意向、试用，或拨打咨询/询盘电话（Leads）
产生实际线下的购买行为（Purchase）


　　一般而言，线上营销（Digital Campaign）的最终目的一定是实现Purchase，但Purchase的实现有时需要较长周期，而且从Awareness到Purchase的整个环节中整个损耗很大，因此，Campaign如果能够实现Leads或者Preferences，或者仅仅只是对消费者留下了印象（Awareness）也是不错的。这样，人们对Digital Campaign效果的评价也就不仅仅限于查看最终的实际购买，而同样关注从Awareness到Preference到Leads最终到Purchase的全过程。
Awareness的效果监测
　　Awareness是指受众对广告所宣传品牌/商品的认知。根据我以前在Agency负责监控digital campaign效果的经验，Awareness的监测主要是依靠广告曝光数据（Impression）。但是，Impression是一个非常弱的度量（在国内，我已经很多次表示了对这个度量的&#8220;鄙视&#8221;了 :），很难带来什么有价值的insight，因此，我们需要一些更好的办法。
　　这里，我要特别感谢我以前的客户，凯男和许飞，他们在这个领域提出了非常好的解决方法，也要特别感谢Tenly（邬剑）同学，他在扩展这些方法上提出了非常好的见解。所以，我这里总结这些方法如下：


广告Impression/Click数


广告推向网站的Visitor数量


软文总被阅读数（软文PV）/评价数/回复数


产品或者品牌关键词搜索量的增长幅度


产品或者品牌关键词的搜索引擎结果的增长幅度


Social Media的分享/转发数量


调研问卷直接统计


口碑监测


　　这些方法有些容易，有些略难，但的确都是目前能够实际实施的Awareness评价方法。其中，广告推向网站的visitor数量我一直比较重视，但是，由于疯狂的作弊的存在，这个数值现在受到了严峻挑战。但是，网络营销效果分析师不能因此而被难倒，去伪存真不就是我们的工作吗。因此，我们应该把这个visitor的数量改为Qualified Visitor（靠谱的visitor）的数量。Qualified Visitor = Campaign Overall Visitor &#215; (1-Bounce%) &#215; Stay longer than 30sec % &#215; Other criteria。
　　软文总被阅读数是另一个常用的评价方法，软文对于很多广告主而言，都是性价比比较高的方法。总被阅读数是指除了软文发布媒体上的软文page view数量之外，以及其他所有的转载的总的page view的数量。不过，有意思的是，我却建议用另外一个数量&#8212;&#8212;软文有效阅读数 = 软文总被阅读数－软文在原发布平台上的阅读数量。为什么用这个数量呢，咳，因为媒介本身的那个数据实在是不能尽信啊，干脆不信了。软文总被阅读数怎么统计呢？我自己用精确和模糊两种方法。精确方法，首先用百度搜索全部文章，然后点击进入手工记录各个转载文章提供的统计数据（一般都提供）。这个方法麻烦，但是能够尽量做到精确。模糊方法，就是在软文中设置一个Google Analytics（或者DoubleClick等工具） 的1&#215;1像素的透明图片，然后祈祷其他媒介在转载的时候把这个图片也一同转过去（但是几率比较小），然后根据总的文章转载数量对统计到的转载数量进行按比例放大。基本上，这个方法能够告诉你个大概，但肯定不精确。如何添加这个透明图片的方法请见这个文章的前几段。
　　产品或者品牌关键词搜索量的增长幅度，这个是我青睐的方法。使用方法简单，用Google Insight或者Google Trends即可。Google官方告诉我们，Google Insights和Google Trends使用相同的数据来源，但Google Insights拥有更多更全面更高级功能。

　　这个工具特别适宜于那些新出现的商品/品牌，例如Intel的Core i5，但是对于那些无法跟竞品区分搜索关键词的就不适用了，例如&#8220;无痛人流&#8221;。所以，建议一个新的digital campaign，值得喊出一个响亮好记的新名称。
　　产品或者品牌关键词的搜索引擎结果的增长幅度，直接在搜索引擎中加引号搜索即可。这个增长幅度同样代表着人们对产品/品牌awareness的增加。
　　Social Media的分享/转发数量，这个度量对进行social media marketing的digital campaign非常重要，但如何获得这个值其实比较困难。对于Twitter或者Facebook，其实有API开放，所以第三方统计软件多如牛毛，而更高级的合作&#8212;&#8212;例如2009年5月Omniture和Facebook的合作&#8212;&#8212;则可以让数据统计更深入更强大。但在我们国家这些就成了问题，一方面，Facebook进不来，进来也是&#8220;非死不可&#8221;，Twitter就不用说了，大家致哀。另一方面，国内最成功的新浪微博也还没有做出什么好的用于数据统计的API，人人网开心网也没有。你可以手工统计，但我更愿意静待将来。
　　调研问卷统计，这绝对是万能方法，但也是最耗时，自由度最低的方法。不仅仅对于awareness，对于Preference，也同样适用，所以放到后面讲。
　　口碑监测，与调研问卷统计类似，也放到后面讲。
Preference的监测
　　Preference比Awareness要更难评估，我甚至认为，它是最难评估的。因为它反映的是人的内心的活动。人内心的活动可以外化为行为，但却不可反推。譬如说，我觉得难过，我不一定哭泣，即使我因为难过而哭泣，却不可以说我哭泣一定是因为难过（或许是因为激动），所以用&#8220;哭泣&#8221;来反推&#8220;难过&#8221;有误差。同样，Preference的评估虽然可以有一些间接通过行为（例如推荐给朋友，收藏等）来衡量的方法，但误差很明显。
　　评价Preference的相对可靠的方法，是直接发问，问受众的内心感受，这就是调研。也正是因为调研可以直接询问受众的内心感受，因此调研方法也同样用于研究受众的Awareness。
在线调研
　　调研的基本方法是将调研受众（样本）分为两组，一组是Control Group（对照组），另外一组是Exposure Group（或者称为Test Group，测试组），Control Group被通过技术方法控制不能暴露在广告下，而Exposure Group则被肯定地暴露在广告之下。
　　例如，AdIndex给我们介绍了最常用的在线调研的方法：
图：这是在线调研的基本方法 （版权属于Millward Brown公司）
　　上图是在线调研的基本方法，A组被确定暴露在Campaign广告的创意之下，而B组，则被控制肯定没有看到广告（控制方法是什么？其实很简单，例如在campaign发布前就进行一次调研，那么对照组的受众肯定不可能看到广告）。
　　如果要评价一个Campaign网站对访问者preference的影响，同样可以利用这个方法，只是保证对照组的受众在对答卷前没有访问这个网站即可。

　　对于上面Campaign网站的问卷，你可以自己通过设定网站的程序来实现一部分访问者在访问你的网站之前就填写问卷（对照组），而另外一部分则在离开网站的时候再填写问卷（曝光组）。如果你不愿意自己编写程序，国内也有第三方服务提供类似功能，例如MillwardBrown，或者精硕科技的AdMaster。你也可以利用免费的4Q问卷，它也提供自定义的问卷（虽然题目数量有限）。
　　对于利用问卷调研preference的方法，有两个地方是需要特别关注的。其一，问卷内容的设计；其二，回收有效问卷答案的数量以及由此影响的统计学意义。这里不敢多说，因为，我在这两个领域都还是一个完全的newbie  。
　　最后，为大家展示一个问卷调研答卷统计的实际例子：

　　这个问卷是对网络游戏玩家的一个调研，其统计结论分为几个主要的部分，包括awareness、motivation（购买动机）、relevance（相关性）以及preference。可以看到，曝光组在大部分环节都表现不错，说明campaign对其产生了一定作用。但比较让人遗憾的是，sample size略少，是否能够代表普遍受众的情况存疑。
　　Preference的另外一个监测方法是利用口碑监测，这个绝对是目前前沿领域，而且也是一道挺难解的题目，尤其对咱们汉语。
口碑监测
　　口碑监测不如问卷调研直接，但是口碑同样反映了受众（主要是网友们）对品牌的awareness和preference的感受。口碑的重要性在于，如果一个网友直接在网络空间中反映了对你的品牌/商品的关注/喜爱/憎恶，那么他不仅可能代表相当一部分网友的意见，也可以迅猛地影响其他人的意见。我自己的消费大量通过网络完成，而且负面口碑对我的消费影响更为重要，我相信大部分消费者都是如此。
　　在&#8220;Sidney的IWOM监测与分析：理解和实践&#8221;一文中，我谈及了IWOM监测的实现方法，但是实际上对于分析的所言有限，因此，会准备再开一个帖子谈我对IWOM分析的理解。这里我想提及一点，即IWOM分析中的一个关键度量&#8212;&#8212;调性比（sentiment ratio）。
　　调性比是指在关于某次Campaign的口碑中，正面口碑和负面口碑之间的比例以及正面口碑、中性口碑和负面口碑各自所占总体口碑数量的比例。例如正面口碑有10,000条，而负面有1,000条，那么sentiment ratio=10:1。这个值意味着普遍受众对你campaign商品/品牌的总体preference情况。
　　下图是在2008年下半年的时候我做的关于主流Laptop品牌的sentiment ratio情况，Neg.表示Negative（负面）的数量，Neu.表示Neutral（中性）的数量，Pos.表示Positive（正面）的数量。在那时，令我惊异的是，Lenovo竟然获得了最高的调性比，而HP的表现则相当不佳。一年多之后，HP的&#8220;蟑螂门&#8221;事件爆发让它浑身是口亦不能辩，让我觉得，当时的调性监测还是很有道理。:)

　　好了，上集先写到这里。欢迎大家多讨论。
]]></description>
			<content:encoded><![CDATA[<p>【前言】这个问题是我们的QQ群上被最常问起的问题之一，事实上也是我的客户经常问起的问题之一。这是个非常复杂的问题，不在于提出问题本身，而在于解决问题的可行性一直困扰着从业者。这篇文章，将讨论线上营销对线下行动影响的几种类型和目前的解决方法及仍然存在的困扰。这是这个主题的上篇，下篇请见：<a href="http://www.chinawebanalytics.cn/online-campaign-influence-offline-part-ii/">线上营销对线下行动效果的监测（下）</a>。</p>
<p>【正文】</p>
<p>　　今天的这个话题是一个新的挑战，坦率说，在这个领域我所知有限，且一直抱有畏惧，但这是一个无法回避的话题，如果你要做网络营销，你的老板就必会问你最终带来了什么样的效果。<span id="more-3088"></span>这个效果，对于很多非直接在线交易的商业模式而言，实际上意味着受众受到网络营销影响而在线下所采取的行动。这，不是单靠网站分析工具可以监测到的了。因此，网络营销界的实践者们，尝试了各种方法来试图解决这个问题，并将在未来的数年持续探索下去。</p>
<p>　　这篇文章无法总结他们的探索，而与<a href="http://www.chinawebanalytics.cn/sidney%e7%9a%84iwom%e7%9b%91%e6%b5%8b%e4%b8%8e%e5%88%86%e6%9e%90%ef%bc%9a%e7%90%86%e8%a7%a3%e5%92%8c%e5%ae%9e%e8%b7%b5/" target="_blank">之前的文章</a>类似，只是谈谈我的理解和实践，希望引发大家的思考和讨论。</p>
<h3>线上营销对线下行动产生影响效果的分类</h3>
<p>　　线上营销对线下行动产生的效果分为多种类型，按照从比较初级的影响到非常强烈的影响，可以分为四个层次，如下所示：</p>
<ul>
<li>对产品留下印象（Awareness）</li>
<li>对产品产生好感/潜在购买可能性（Preferences）</li>
<li>提交购买意向、试用，或拨打咨询/询盘电话（Leads）</li>
<li>产生实际线下的购买行为（Purchase）</li>
</ul>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/image.png"><img alt="image" border="0" height="345" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/image_thumb.png" style="border-right-width: 0px; display: inline; border-top-width: 0px; border-bottom-width: 0px; border-left-width: 0px" title="image" width="494" /></a></p>
<p align="left">　　一般而言，线上营销（Digital Campaign）的最终目的一定是实现Purchase，但Purchase的实现有时需要较长周期，而且从Awareness到Purchase的整个环节中整个损耗很大，因此，Campaign如果能够实现Leads或者Preferences，或者仅仅只是对消费者留下了印象（Awareness）也是不错的。这样，人们对Digital Campaign效果的评价也就不仅仅限于查看最终的实际购买，而同样关注从Awareness到Preference到Leads最终到Purchase的全过程。</p>
<h3>Awareness的效果监测</h3>
<p align="left">　　Awareness是指受众对广告所宣传品牌/商品的认知。根据我以前在Agency负责监控digital campaign效果的经验，Awareness的监测主要是依靠广告曝光数据（Impression）。但是，Impression是一个非常弱的度量（<a href="http://www.chinawebanalytics.cn/%E5%93%81%E7%89%8C%E5%B9%BF%E5%91%8A%E4%B8%BB%E7%B3%BB%E5%88%97%E4%B9%8B%E4%BA%92%E8%81%94%E7%BD%91%E5%B9%BF%E5%91%8A%E8%90%A5%E9%94%80%E7%9B%91%E6%B5%8B%E5%92%8C%E5%88%86%E6%9E%90%E6%80%BB%E7%BB%93/2/" target="_blank">在国内，我已经很多次表示了对这个度量的&ldquo;鄙视&rdquo;了</a> :），很难带来什么有价值的insight，因此，我们需要一些更好的办法。</p>
<p align="left">　　这里，<strong>我要特别感谢我以前的客户，凯男和许飞</strong>，他们在这个领域提出了非常好的解决方法，<strong>也要特别感谢Tenly（邬剑）同学</strong>，他在扩展这些方法上提出了非常好的见解。所以，我这里总结这些方法如下：</p>
<ul>
<li>
<div align="left">广告Impression/Click数</div>
</li>
<li>
<div align="left">广告推向网站的Visitor数量</div>
</li>
<li>
<div align="left">软文总被阅读数（软文PV）/评价数/回复数</div>
</li>
<li>
<div align="left">产品或者品牌关键词搜索量的增长幅度</div>
</li>
<li>
<div align="left">产品或者品牌关键词的搜索引擎结果的增长幅度</div>
</li>
<li>
<div align="left">Social Media的分享/转发数量</div>
</li>
<li>
<div align="left">调研问卷直接统计</div>
</li>
<li>
<div align="left">口碑监测</div>
</li>
</ul>
<p>　　这些方法有些容易，有些略难，但的确都是目前能够实际实施的Awareness评价方法。其中，<strong>广告推向网站的visitor数量</strong>我一直比较重视，但是，<a href="http://www.chinawebanalytics.cn/%e9%82%a3%e4%ba%9b%e8%99%9a%e6%97%a0%e7%9a%84%e7%bd%91%e4%ba%8b%e2%80%94%e2%80%94%e4%ba%ba%e5%b7%a5%e6%b5%81%e9%87%8f%e4%b8%8e%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90/" target="_blank">由于疯狂的作弊的存在</a>，这个数值现在受到了严峻挑战。但是，网络营销效果分析师不能因此而被难倒，去伪存真不就是我们的工作吗。因此，我们应该把这个visitor的数量改为Qualified Visitor（靠谱的visitor）的数量。Qualified Visitor = Campaign Overall Visitor &times; (1-Bounce%) &times; Stay longer than 30sec % &times; Other criteria。</p>
<p align="left"><strong>　　软文总被阅读数</strong>是另一个常用的评价方法，软文对于很多广告主而言，都是性价比比较高的方法。总被阅读数是指除了软文发布媒体上的软文page view数量之外，以及其他所有的转载的总的page view的数量。不过，有意思的是，我却建议用另外一个数量&mdash;&mdash;<strong>软文有效阅读数 = 软文总被阅读数－软文在原发布平台上的阅读数量</strong>。为什么用这个数量呢，咳，因为媒介本身的那个数据实在是不能尽信啊，干脆不信了。软文总被阅读数怎么统计呢？我自己用精确和模糊两种方法。精确方法，首先用百度搜索全部文章，然后点击进入手工记录各个转载文章提供的统计数据（一般都提供）。这个方法麻烦，但是能够尽量做到精确。模糊方法，就是在软文中设置一个Google Analytics（或者DoubleClick等工具） 的1&#215;1像素的透明图片，然后祈祷其他媒介在转载的时候把这个图片也一同转过去（但是几率比较小），然后根据总的文章转载数量对统计到的转载数量进行按比例放大。基本上，这个方法能够告诉你个大概，但肯定不精确。<a href="http://www.chinawebanalytics.cn/%E2%80%9C%E4%BA%91%E2%80%9D%E7%9B%91%E6%B5%8B%EF%BC%9A%E5%9E%82%E7%9B%B4%E5%9E%8B%E7%9A%84%E7%BD%91%E7%AB%99%E5%88%86%E6%9E%90/" target="_blank">如何添加这个透明图片的方法请见这个文章的前几段</a>。</p>
<p align="left"><strong>　　产品或者品牌关键词搜索量的增长幅度</strong>，这个是我青睐的方法。使用方法简单，用Google Insight或者Google Trends即可。Google官方告诉我们，Google Insights和Google Trends使用相同的数据来源，但Google Insights拥有更多更全面更高级功能。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/image1.png"><img alt="image" height="356" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/image_thumb1.png" style="display: inline" title="image" width="365" /></a></p>
<p align="left">　　这个工具特别适宜于那些新出现的商品/品牌，例如Intel的Core i5，但是对于那些无法跟竞品区分搜索关键词的就不适用了，例如&ldquo;无痛人流&rdquo;。所以，建议一个新的digital campaign，值得喊出一个响亮好记的新名称。</p>
<p align="left"><strong>　　产品或者品牌关键词的搜索引擎结果的增长幅度</strong>，直接在搜索引擎中加引号搜索即可。这个增长幅度同样代表着人们对产品/品牌awareness的增加。</p>
<p align="left"><strong>　　Social</strong> <strong>Media的分享/转发数量</strong>，这个度量对进行social media marketing的digital campaign非常重要，但如何获得这个值其实比较困难。对于Twitter或者Facebook，其实有API开放，所以第三方统计软件多如牛毛，而更高级的合作&mdash;&mdash;例如2009年5月Omniture和Facebook的合作&mdash;&mdash;则可以让数据统计更深入更强大。但在我们国家这些就成了问题，一方面，Facebook进不来，进来也是&ldquo;非死不可&rdquo;，Twitter就不用说了，大家致哀。另一方面，国内最成功的<a href="http://t.sina.com.cn" target="_blank">新浪微博</a>也还没有做出什么好的用于数据统计的API，人人网开心网也没有。你可以手工统计，但我更愿意静待将来。</p>
<p><strong>　　调研问卷统计</strong>，这绝对是万能方法，但也是最耗时，自由度最低的方法。不仅仅对于awareness，对于Preference，也同样适用，所以放到后面讲。</p>
<p><strong>　　口碑监测</strong>，与调研问卷统计类似，也放到后面讲。</p>
<h3>Preference的监测</h3>
<p>　　Preference比Awareness要更难评估，我甚至认为，它是最难评估的。因为它反映的是人的内心的活动。人内心的活动可以外化为行为，但却不可反推。譬如说，我觉得难过，我不一定哭泣，即使我因为难过而哭泣，却不可以说我哭泣一定是因为难过（或许是因为激动），所以用&ldquo;哭泣&rdquo;来反推&ldquo;难过&rdquo;有误差。同样，Preference的评估虽然可以有一些间接通过行为（例如推荐给朋友，收藏等）来衡量的方法，但误差很明显。</p>
<p>　　评价Preference的相对可靠的方法，是直接发问，问受众的内心感受，这就是调研。也正是因为调研可以直接询问受众的内心感受，因此调研方法也同样用于研究受众的Awareness。</p>
<p><strong>在线调研</strong></p>
<p>　　调研的基本方法是将调研受众（样本）分为两组，一组是Control Group（对照组），另外一组是Exposure Group（或者称为Test Group，测试组），Control Group被通过技术方法控制不能暴露在广告下，而Exposure Group则被肯定地暴露在广告之下。</p>
<p>　　例如，<a href="http://www.dynamiclogic.com/" target="_blank">AdIndex</a>给我们介绍了最常用的在线调研的方法：</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/image2.png"><img alt="image" height="313" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/image_thumb2.png" style="display: block; float: none; margin-left: auto; margin-right: auto" title="image" width="589" /></a>图：这是在线调研的基本方法 （<a href="http://www.dynamiclogic.com/na/research/whitepapers/docs/AdIndex_Methodology_Jun2008.pdf" target="_blank">版权属于Millward Brown公司</a>）</p>
<p align="left">　　上图是在线调研的基本方法，A组被确定暴露在Campaign广告的创意之下，而B组，则被控制肯定没有看到广告（控制方法是什么？其实很简单，例如在campaign发布前就进行一次调研，那么对照组的受众肯定不可能看到广告）。</p>
<p align="left">　　如果要评价一个Campaign网站对访问者preference的影响，同样可以利用这个方法，只是保证对照组的受众在对答卷前没有访问这个网站即可。</p>
<p align="left"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/image3.png"><img alt="image" height="302" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/image_thumb3.png" style="display: block; float: none; margin-left: auto; margin-right: auto" title="image" width="590" /></a></p>
<p>　　对于上面Campaign网站的问卷，你可以自己通过设定网站的程序来实现一部分访问者在访问你的网站之前就填写问卷（对照组），而另外一部分则在离开网站的时候再填写问卷（曝光组）。如果你不愿意自己编写程序，国内也有第三方服务提供类似功能，例如MillwardBrown，或者精硕科技的<a href="http://www.admaster.com.cn/cn/index.html" target="_blank">AdMaster</a>。你也可以利用免费的<a href="http://www.4qsurvey.com/" target="_blank">4Q</a>问卷，<a href="http://www.chinawebanalytics.cn/%e8%a1%8c%e5%8a%a8%e8%b5%b7%e6%9d%a5%ef%bc%8c%e5%8f%82%e5%8a%a0%e6%9c%ac%e7%ab%99%e7%9a%844q%e8%b0%83%e6%9f%a5/" target="_blank">它也提供自定义的问卷（虽然题目数量有限）</a>。</p>
<p>　　对于利用问卷调研preference的方法，有两个地方是需要特别关注的。其一，问卷内容的设计；其二，回收有效问卷答案的数量以及由此影响的统计学意义。这里不敢多说，因为，我在这两个领域都还是一个完全的newbie <img src='http://www.chinawebanalytics.cn/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> 。</p>
<p>　　最后，为大家展示一个问卷调研答卷统计的实际例子：</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/image4.png"><img alt="image" height="319" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/image_thumb4.png" style="display: inline" title="image" width="551" /></a></p>
<p>　　这个问卷是对网络游戏玩家的一个调研，其统计结论分为几个主要的部分，包括awareness、motivation（购买动机）、relevance（相关性）以及preference。可以看到，曝光组在大部分环节都表现不错，说明campaign对其产生了一定作用。但比较让人遗憾的是，sample size略少，是否能够代表普遍受众的情况存疑。</p>
<p>　　Preference的另外一个监测方法是利用口碑监测，这个绝对是目前前沿领域，而且也是一道挺难解的题目，尤其对咱们汉语。</p>
<p><strong>口碑监测</strong></p>
<p>　　口碑监测不如问卷调研直接，但是口碑同样反映了受众（主要是网友们）对品牌的awareness和preference的感受。口碑的重要性在于，如果一个网友直接在网络空间中反映了对你的品牌/商品的关注/喜爱/憎恶，那么他不仅可能代表相当一部分网友的意见，也可以迅猛地影响其他人的意见。我自己的消费大量通过网络完成，而且负面口碑对我的消费影响更为重要，我相信大部分消费者都是如此。</p>
<p>　　在&ldquo;<a href="http://www.chinawebanalytics.cn/sidney%e7%9a%84iwom%e7%9b%91%e6%b5%8b%e4%b8%8e%e5%88%86%e6%9e%90%ef%bc%9a%e7%90%86%e8%a7%a3%e5%92%8c%e5%ae%9e%e8%b7%b5/">Sidney的IWOM监测与分析：理解和实践</a>&rdquo;一文中，我谈及了IWOM监测的实现方法，但是实际上对于分析的所言有限，因此，会准备再开一个帖子谈我对IWOM分析的理解。这里我想提及一点，即IWOM分析中的一个关键度量&mdash;&mdash;<strong>调性比（sentiment ratio）</strong>。</p>
<p>　　调性比是指在关于某次Campaign的口碑中，正面口碑和负面口碑之间的比例以及正面口碑、中性口碑和负面口碑各自所占总体口碑数量的比例。例如正面口碑有10,000条，而负面有1,000条，那么sentiment ratio=10:1。这个值意味着普遍受众对你campaign商品/品牌的总体preference情况。</p>
<p>　　下图是在2008年下半年的时候我做的关于主流Laptop品牌的sentiment ratio情况，Neg.表示Negative（负面）的数量，Neu.表示Neutral（中性）的数量，Pos.表示Positive（正面）的数量。在那时，令我惊异的是，Lenovo竟然获得了最高的调性比，而HP的表现则相当不佳。一年多之后，<a href="http://www.cnbeta.com/articles/106286.htm" target="_blank">HP的&ldquo;蟑螂门&rdquo;事件</a>爆发让它浑身是口亦不能辩，让我觉得，当时的调性监测还是很有道理。:)</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/image5.png"><img alt="image" height="327" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/10/image_thumb5.png" style="display: inline" title="image" width="360" /></a></p>
<p>　　好了，上集先写到这里。欢迎大家多讨论。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/online-campaign-influence-offline-part-i/feed/</wfw:commentRss>
		<slash:comments>22</slash:comments>
		</item>
		<item>
		<title>服务器日志法网站分析的原理及优缺点</title>
		<link>http://www.chinawebanalytics.cn/wa-server-logfile-basic-pros-and-cons/</link>
		<comments>http://www.chinawebanalytics.cn/wa-server-logfile-basic-pros-and-cons/#comments</comments>
		<pubDate>Sat, 03 Jul 2010 09:19:34 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[Headline]]></category>
		<category><![CDATA[基础知识]]></category>
		<category><![CDATA[网站分析经验分享]]></category>
		<category><![CDATA[CWA]]></category>
		<category><![CDATA[服务器日志]]></category>
		<category><![CDATA[网站分析]]></category>
		<category><![CDATA[网络分析]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=2687</guid>
		<description><![CDATA[【前言】
　　应朋友们的要求，我还是写一篇关于服务器日志法进行网站分析的原理以及它的优缺点是什么。请朋友们注意，网站服务器日志法并不容易进行，初学者，以及在绝大多数情况下，进行以用户行为分析为核心的网站分析，用不到服务器日志法。不过，作为网站分析历史不可分割的一部分以及重要的基础篇章，服务器日志法仍然值得一书。下面的这篇文章也是我要撰写的书中截取的内容（我要快马加鞭快快写了，已经辜负了太多朋友的重托，抱歉抱歉！）。
【正文】
　　网站分析收集数据的方式其实有五、六种之多，我们最常见的有三种，分别是：服务器日志（Server Log）、页面标记（Page Tag）和客户端监测软件收集（Client End/Desktop）。我的CWA博客（http://www.chinawebanalytics.cn）中主要讲解的都是页面标记法，今天则跟大家讲解一下服务器日志方法的原理及优缺点。
1. 服务器日志是什么
　　真正意义上的网站分析是从服务器日志开始的，而且直到今天，分析服务器（也称为server log file，或简称log file）日志仍然是网站分析的重要方法。
　　这里的服务器指的是网站服务器（Web Server），而服务器日志跟飞机的黑匣子一样，是用来记录网站服务器的运行信息的，或者简单说，是用来记录服务器中的什么页面在什么时候被谁访问了。例如，如果你访问一次我的网站：http://www.chinawebanalytics.cn，那么一般情况下，网站服务器的日志就会记录在某时某刻来自某个IP的访问者索引了网页&#8220;/index.php&#8221;。当然，网站服务器日志还会记录其他许多内容，这些内容能够帮助我们分析网站的流量和访问者在网站上的行为。
　　下面这个图说明了网站日志是如何产生的。当用户访问一个网站的时候，事实上是访问这个网站的某一个具体的页面，我们假设这个页面叫Page 1。这时，我们的这个访问行为会请求服务器中Page 1的实际的文件，随之把这个文件下载到浏览器上。由于请求和下载行为都会引起服务器的响应和相应的行动，因此就有必要记录下服务器的这些行动。

&#160;
　　你会问，为什么需要记录服务器的行动呢？原因很简单，因为我们不想让这个服务器变成&#8220;哈尔9000&#8221;（哈尔9000是库布里克《2001太空奥德赛》里面有了自我意识的电脑，它直接威胁到了电影中的宇航员）啊！这当然只是开玩笑，不过目的并无差别，就是能够通过服务器日志，对服务器的运行历史进行记录，这样当有任何异常情况发生的时候，我们都能够通过日志探寻问题发生的原因&#8212;&#8212;跟记录飞机运行状态的黑匣子的作用十分类似。
　　原理看起来并不复杂，不过log file实际上并不简单。为了让log file具有可读性，log file并不可以按照各个网站所有者的喜好随意记录的，而是有自己的规范。W3C组织定义了server log file的通用格式（如果你有兴趣，可以在这里看看这些格式都是如何定义的：http://www.w3.org/Daemon/User/Config/Logging.html#common_logfile_format），而其他一些组织或者个人又根据自己的需要额外扩展了这个格式，使log file能够比较全面地记录网站服务器进行的各种活动。
　　一条标准的web server log记录通常包含如下信息：

l 远程主机（Remote Host）的IP地址/名字
l 登录名（Log Name）
l 登录全名（Full Name）
l 请求发生的日期（Date）
l 请求发生的时间（Time）
l 和标准格林威治时间的差值（GMT Offset）
l 请求的方法（Request Method）
l 请求的文件的地址（File）
l 请求遵守的协议（Protocol）
l 请求的状态（Status）
l 被请求文档的长度（Length）

　　下面是一条标准的log file记录：
202.71.113.38 &#8211; - [03/Jan/2010:01:56:12 +0800] &#34;GET /Chinawebanalytics/Sidney.htm HTTP/1.0&#34; 200 5122
　　从左到右，202.71.113.38就是远程主机的IP；而登录名和登录全名指的是发起这个请求的用户的名字，这个一般大家当然是不想要透露的了，所以远程主机会禁止给出这两个信息，log file当然就记录不下来了，用两个短中划线代替。然后，03/Jan/2010是请求发生的日期，01:56:12则是时间，之后的+0800是指比格林威治时间要晚8个小时，就是我们北京时间了。再之后的GET是请求的方法，另一种方法是POST，可以简单理解为GET就是索取，POST就是提交。接着：/Chinawebanalytics/Sidney.htm是被请求文件的地址，可以是绝对地址也可以是相对地址。HTTP/1.0是请求所遵守的协议，这里的协议是HTTP 1.0。整个记录的结尾是两个数字，其中200表示一种请求的状态，意思是请求一切正常。有时候这个数字会显示为404，相信大家一看到这个数字就头痛，它表示请求的文件无法找到（file not found）；又有时候，这个数字会显示为301，表示页面被重新定向到了别的地址。最后的一个数字5593，表示所请求的文档的长度为5122 bytes。
　　通用格式其实很简单，但是里面的这11类记录往往不足够帮助我们进行更深入的分析，因此其他的一些记录被加入进来，其中最重要的一些是：

l 请求来源（Referrer）：指连接到被请求资源的网站的URL。如果请求时通过点击一个链接时发生，那么这个项目就会被记录；
l 客户端（User Agent）：记录用户的浏览器或者发出请求的程序的相关信息；
l 所需时间（Time Taken）：从请求的发出到请求的资源全部传输完毕所需花费的时间；
l Cookie。关于cookie的内容请大家看我的这篇文章：捍卫Cookie&#8212;&#8212;没有Cookie，我们什么都没有了。

　　看起来，网站服务器日志所记录的内容是很有限的，比起我们动辄上万行的编程实在是九牛一毛。但是，千万别认为网站服务器日志文件会很小，对于一些大网站，每分每秒都有很多访问者对网站服务器进行请求，所以日志文件会积少成多，成为巨型的数据文件。有时候，一个小时的记录就能超过数G。什么，你网站的服务器日志一个月才1M？要加油啊，没有人气的网站可没有生命力。
　　讲到这儿，该说说历史了。网站分析就是从网站服务器日志开始的，或者更准确的说，网站服务器日志自诞生之日起，就是为网站分析所用的。最早，人们可是把所有的记录都拿出来，然后导入到数据软件中去进行分析，辛苦程度自不用说；但这个痛苦的阶段不会持续太久，哪儿有痛苦，哪儿就有生意，所以网站日志分析软件就出现了，解决了很大的问题，以至于大小互联网服务提供商（ISP）们都为租用他们空间的用户提供一款免费的网站日志分析软件。尽管如此，分析网站日志一直都是一个相当不容易的事情，所以，人们不得不寻找一些更便利的方法，这样便发明了网站分析的新的数据获取方法，这是后话了。
　　如果你问我什么情况下选择用网站服务器日志来进行网站分析，我建议你如非必须，那么还是寻找一些更容易的方法能够事半功倍。看看后面的内容，你就能知道我为什么这么说。
2. 用网站服务器日志进行网站分析的优点
　　尽管是个技术活，但是利用网站服务器日志进行网站分析还是有不少好处的。
1. 网站服务器的日志是被你完全掌控的数据。
　　所谓放在自己手心最放心，这些日志在你的服务器中，如果不是黑客入侵，数据不可能被你不希望的人获取。而且，只要你不删除，它们永远都在那里，在任何时候你都可以回溯历史数据，无论这些数据有多么久远。有朝一日，你的网站大获成功，这些日志也是一份奋斗历史的见证。
2. 能够记录机器人/自动程序对网站的访问。 
　　其次，前面讲过，网站服务器的日志是记录网站服务器行为的，因此任何服务器响应的请求都会被记录下来。这些响应可能是应答用户发出的请求，也完全可能是应答一些互联网上自动程序发出的请求。最常见的一种互联网上的自动程序是搜索引擎的机器人，例如Google的Googlebot，这意味着网站服务器日志能够用来分析搜索引擎的访问，并帮助我们优化搜索引擎对网站的访问。讲到这里，请大家注意，并不是每一种网站分析方法都能做到这一点，我们最常用的为网站页面加入标签的方法是不能获取搜索引擎流量的。
3. 终端无关
　　网站服务器的日志能够记录网站服务器全部响应行为的特点还延伸出另外一个优点，那就是无论是何种终端访问服务器，都能把相关数据记录下来。现在，能够访问网站的终端越来越多了，我无聊的时候也试着用Sony的PSP上网，用手机的GPRS也能轻松的浏览网页，这些形形色色的终端的访问，服务器日志都会忠实的记录，但页面加入标签的方法就可能完全行不通。
4. 能够探知文件是否完全下载
　　日志方法的另一个好处是能够记录文件下载的情况。如果你在网上下载一个MP3音乐，你在发出这个响应的时候，日志会记录一个状态；你在下载完全的时候，日志照样会记录一个状态；如果你没有下载完全，日志还是会记录下来。这个，我想对那些提供下载服务的网站很有用。
5. 数据获取不依赖于第三方
　　通过日志获取数据本身不需要额外的第三方的帮助。只要你的服务器在运转，日志就会源源不断的被创建、保存。不过，请注意，这里我所指的是数据的获取不需要额外的支持，但是数据的分析一般而言，还是需要第三方的帮助的。直接去用肉眼读日志文件中的数据进行分析是不可想象的。
6. 不怕防火墙
　　最后，日志方法不惧怕防火墙或客户端安全软件的屏蔽，因为数据都是从服务器端获取的。
　　看起来似乎不错，不过凡事有利有弊，日志方法也肯定有它不能克服的不足。
3. 用网站服务器日志方法进行网站分析的缺点
　　日志方法能够起到作用的前提是服务器要响应来自客户端的请求，如果客户端的请求不通过服务器就得到了响应（这其实是经常发生的），那么服务器日志法就无能为力了。
1. 害怕网页缓存（Cache）
　　为了提高网站页面的载入速度，人们发明了网页缓存（Cache）。在台湾，Cache被翻译作&#8220;快取&#8221;，似乎兼备了音义。
　　网页缓存的原理很容易理解，但却是个了不起的发明。在缓存出现之前，人们访问网站每次都需要把网页从网站的服务器传输到客户端的浏览器中，这个速度当然会有点儿慢，尤其是网络条件不好的时候。于是善动脑筋的人们发现，每次访问的网站其实有很多内容是没有更新的，如果能够把那些不经常更新的部分放在自己的电脑里面，每次打开网页的时候，首先搜索自己电脑里面已经有的内容，然后再去服务器去寻找那些被更新了的部分，这样服务器传输的数据量就会大大减少了，整个网页也会被更快地显示出来。
　　现在，我们大部分人的浏览器都设置了缓存。所以，有时候，你会发现，即使网络没有接通，你访问的网站似乎也能&#8220;正常&#8221;打开，只不过浏览器会显示&#8220;脱机&#8221;状态，告诉你，这些内容不是真正从服务器传输过来的。
　　除了客户端（浏览器）能够存放缓存的内容外，代理服务器（Proxy）也能够存放网页缓存，目的同样是为了提速。你可以把代理服务器的缓存想象成CPU的&#8220;二级缓存&#8221;&#8212;&#8212;当客户端没有存储某个网页的缓存的时候（&#8220;一级缓存&#8221;没有内容），浏览器就会寻找代理服务器缓存，看看有没有内容。如果还没有，那才会再去寻找真正存放网页内容的网站服务器。
　　有了缓存，当你点击浏览器的&#8220;回退按钮&#8221;的时候，回退的上一个页面就不需要再重新从服务器中下载一次，而是立即就呈现在你的面前。你常用的网站的打开速度也显著提升了。
　　可是，对于通过服务器日志来获取网站访问数据的方法而言，这可不是一个好事情。由于缓存的存在，本来应该请求服务器的结果不需要请求了，服务器的日志什么也不会记录下来，可是对页面的访问却又实实在在的发生了。
　　所以，缓存的存在会使日志方法低估网站的实际访问量。
2. 害怕Flash等&#8220;客户端交互&#8221;内容
　　现在，为了更具冲击力的视觉效果和更丰富的网页互动，运用Flash、加入视频、设计很多互动程序在网页上已经稀疏平常。而这些元素，它们太独立了，以至于当它们被载入到浏览器端了之后，完全可以在浏览器端运行而不再与服务器发生交互，或者只需要在必要的时候才与服务器发生交互。
　　比如，你玩儿普通网页版的Flash小游戏，一旦游戏下载完毕，你在玩儿的过程中跟网站服务器就不会有什么联系了，或者你看网页上的视频，你在播放器上进行的暂停操作，一般也不会跟服务器进行互动。还有，有一些脚本语言编写的网页程序，是在浏览器上被解释执行的，比如用JavaScript实现的网页Tab标签切换，在页面全部载完后，无论你怎么切换Tab，服务器都感觉不到了。
　　服务器感觉不到，也就不会存在什么服务器日志记录，也就不会有数据，因此用日志方法是无法准确获取&#8220;客户端交互&#8221;类型的网站访问行为的。这种情况下，必须选择其他的数据收集方法。
3. 不精确的访问者记录
　　日志方法辨别独立访问者需要依靠客户端的IP地址，也只能依靠它。不过，IP地址显然不代表真正的访问者。上班族的整个办公室的IP地址都可能是一个（使用代理服务器），而这个办公室可能坐着十多个人。这可能使访问者的数量被低估。
　　同样，在家中，如果你购买了公共网络服务，那么你的IP地址存在动态分配的问题。你今天上网的IP地址和明天的可能就会不同，这个时候日志方法只能判断为两个不同的访问者。这又可能使访问者的数量被高估。
　　此外，前面提到过日志是能够忠实记录机器（非人为）的访问活动的，但是机器不是人，它们的活动混在真实的人的访问之中，同样会使真实访问者的数量，或者访问数本身被高估。
　　在这正反两相反方向的共同作用下，结果只能一个，那就是对于访问者数量的估算是非常模糊的。当然，我们必须要承认，无论用什么方法，网站访问者的精确数量都无法获得，但相对而言，日志方法要更不准确些。
4. 较弱的实时性
　　没错，网站服务器日志是记录服务器运行的实时数据的，但是这些数据想要被取出分析，实时性就没有那么好了。常见的情况是，你必须首先把服务器日志文件（log file）从服务器中取出来，而这些文件肯定不会是服务器正在运行过程中的数据，一般都是隔天的（需要验证），然后再把这些日志文件导入到专门针对日志分析的工具中才能进行分析。这个过程的快慢依赖于你的熟练程度，但要追求实时，颇有难度。
　　有技术高超的站长或者工程师通过架设内部网络、组建专门的日志分析服务器，并且编写特定的程序来解决日志分析的实时性问题（http://www.phparticle.net/htmldata/36462/1/），但是，对于普通的中小网站，这种方法难度颇大，花费不菲，所以可行性不强。因此，实时性是绝大部分通过日志方法来分析网站数据时要面对的问题。
5. 海量的数据存储
　　服务器日志是忠实的，所以它会如实记录下来每一分每一秒发生的每一条服务器响应。对于一些流量稍大的网站，一天的网站日志记录超过数个G（Gigabytes）是非常正常的，而那些最大的网站，一个小时就可能产生数G的记录。我们没有詹姆斯&#183;卡梅隆的超级团队（他的《阿凡达》特效需要处理超过500,000G的数据），所以如果要回溯网站一个月的流量就可能变成一个相当棘手的问题，需要投入相当的时间和耐心，如果你没有相当的技术和经验，效率就会很低。
6. 日志文件获取繁琐
　　我们不能把日志文件的获取想象的太简单，毕竟这不是在自己卧室的电脑中点开一个MP3文件那么容易。有些网站有镜像服务器，有些服务器在境外，有些服务器是由处在多个不同地理位置的物理服务器逻辑组合而成。这些情况下，在进行日志分析之前需要集中所有的日志文件，这是一个很有些麻烦的事情，尤其是当日志文件的体积极为庞大的时候。另外，如果是租用的ISP服务器空间，如果没有权限获取日志数据，那么实际上连进行分析的可能性都没有了。
　　现在，你完全了解了日志方法收集网站分析数据的优缺点，那么，什么情况下你应该选择这种方法进行网站分析呢？
4. 什么情况下该用日志分析方法
　　如果你有如下的数据监测和分析的需要，你应该用日志分析方法：
1. 需要了解搜索引擎机器人或者其他非人为访问流量，并且希望据此对网站进行针对性的优化，如通过分析搜索引擎的访问行为来进行SEO；
2. 需要了解除了普通的PC客户端之外的上网设备对网站的访问情况；
3. 需要了解网站的文件资源是否被用户完整的下载索取；
4. 对网站流量信息具有极高的保密需要，不允许让任何第三方染指或帮忙；
5. 对于网站服务器的安全性和可维护性有要求，以及有非常显著的反抗黑客或其他非授权访问需求的。
　　如果有如下需求，你不应该用日志分析方法：
1. 你的网站有重要的Flash之类的&#8220;非网页类型的互动&#8221;，用户和这些内容的互动是你想要了解的内容；
2. 不喜欢麻烦，对大数据量文件的处理不擅长，对日志文件不熟悉，没有好的日志数据处理软硬件资源；
3. 需要更精确的了解网站被真正的人访问的情况，而不需要了解&#8220;非人&#8221;的机器对网站的访问并且不希望受到网页缓存的干扰；
4. 需要更好的实时性、更规律更直观的数据呈现。
　　现在，拿着这个清单，你可以做出容易的选择了。因为我的博客（http://www.chinawebanalytics.cn）的流量很多来自搜索引擎，因此分析服务器日志并了解搜索引擎爬虫的工作其实是非常必要的一个分析工作之一。
　　就我的经验而言，我们国家使用日志来分析网站仍然占有相当的比例，尤其是对于一些大型网站，他们会开发专门的软件，划拨专门的硬件资源来分析网站日志。不过，这不仅仅是从分析访问者行为的角度来考虑，更是从网站服务器的安全性和可维护性角度来考虑的。
　　不过，如果你把网站分析的重心放在对于网站真实访问者行为的追踪和分析上，那么，通过日志方法来实现相对而言难度相对比较大，操作也比较繁琐，我们可以利用另一种方法，即页面标记法（Page Tag）来实现对网站访问数据的收集。
[版权归Sidney Song（宋星）所有，欢 迎转载，但请事先告知作者并注明出处]
　　好了，介绍完了，希望大家觉得看完后还算愉快！现在是大家的时间了，请您留言，任何问题，想法，不确切之处，都非常欢迎！谢谢！
]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/07/image.png"><img align="left" alt="image" border="0" height="165" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/07/image_thumb.png" style="border-bottom: 0px; border-left: 0px; margin: 0px 10px 5px 0px; display: inline; border-top: 0px; border-right: 0px" title="image" width="244" /></a>【前言】</p>
<p>　　应朋友们的要求，我还是写一篇关于服务器日志法进行网站分析的原理以及它的优缺点是什么。请朋友们注意，网站服务器日志法并不容易进行，初学者，以及在绝大多数情况下，进行以<strong>用户行为分析为核心</strong>的网站分析，用不到服务器日志法。不过，作为网站分析历史不可分割的一部分以及重要的基础篇章，服务器日志法仍然值得一书。下面的这篇文章也是我要撰写的书中截取的内容（我要快马加鞭快快写了，已经辜负了太多朋友的重托，抱歉抱歉！）。</p>
<p>【正文】</p>
<p>　　网站分析收集数据的方式其实有五、六种之多，我们最常见的有三种，分别是：<span id="more-2687"></span>服务器日志（Server Log）、页面标记（Page Tag）和客户端监测软件收集（Client End/Desktop）。我的CWA博客（http://www.chinawebanalytics.cn）中主要讲解的都是页面标记法，今天则跟大家讲解一下服务器日志方法的原理及优缺点。</p>
<h3>1. 服务器日志是什么</h3>
<p>　　真正意义上的网站分析是从服务器日志开始的，而且直到今天，分析服务器（也称为server log file，或简称log file）日志仍然是网站分析的重要方法。</p>
<p>　　这里的服务器指的是网站服务器（Web Server），而服务器日志跟飞机的黑匣子一样，是用来记录网站服务器的运行信息的，或者简单说，是用来记录服务器中的什么页面在什么时候被谁访问了。例如，如果你访问一次我的网站：<a href="http://www.chinawebanalytics.cn">http://www.chinawebanalytics.cn</a>，那么一般情况下，网站服务器的日志就会记录在某时某刻来自某个IP的访问者索引了网页&ldquo;/index.php&rdquo;。当然，网站服务器日志还会记录其他许多内容，这些内容能够帮助我们分析网站的流量和访问者在网站上的行为。</p>
<p>　　下面这个图说明了网站日志是如何产生的。当用户访问一个网站的时候，事实上是访问这个网站的某一个具体的页面，我们假设这个页面叫Page 1。这时，我们的这个访问行为会请求服务器中Page 1的实际的文件，随之把这个文件下载到浏览器上。由于请求和下载行为都会引起服务器的响应和相应的行动，因此就有必要记录下服务器的这些行动。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/07/image1.png"><img alt="image" height="331" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/07/image_thumb1.png" style="display: inline" title="image" width="499" /></a></p>
<p>&nbsp;</p>
<p>　　你会问，为什么需要记录服务器的行动呢？原因很简单，因为我们不想让这个服务器变成&ldquo;哈尔9000&rdquo;（哈尔9000是库布里克《2001太空奥德赛》里面有了自我意识的电脑，它直接威胁到了电影中的宇航员）啊！这当然只是开玩笑，不过目的并无差别，就是能够通过服务器日志，对服务器的运行历史进行记录，这样当有任何异常情况发生的时候，我们都能够通过日志探寻问题发生的原因&mdash;&mdash;跟记录飞机运行状态的黑匣子的作用十分类似。</p>
<p>　　原理看起来并不复杂，不过log file实际上并不简单。为了让log file具有可读性，log file并不可以按照各个网站所有者的喜好随意记录的，而是有自己的规范。W3C组织定义了server log file的通用格式（如果你有兴趣，可以在这里看看这些格式都是如何定义的：<a href="http://www.w3.org/Daemon/User/Config/Logging.html#common_logfile_format">http://www.w3.org/Daemon/User/Config/Logging.html#common_logfile_format</a>），而其他一些组织或者个人又根据自己的需要额外扩展了这个格式，使log file能够比较全面地记录网站服务器进行的各种活动。</p>
<p>　　一条标准的web server log记录通常包含如下信息：</p>
<ul>
<li>l 远程主机（Remote Host）的IP地址/名字</li>
<li><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/07/image2.png"><img align="right" alt="image" height="248" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/07/image_thumb2.png" style="cursor: default; margin-top: 0px; margin-right: 0px; margin-bottom: 5px; margin-left: 10px; display: inline; " title="image" width="177" /></a>l 登录名（Log Name）</li>
<li>l 登录全名（Full Name）</li>
<li>l 请求发生的日期（Date）</li>
<li>l 请求发生的时间（Time）</li>
<li>l 和标准格林威治时间的差值（GMT Offset）</li>
<li>l 请求的方法（Request Method）</li>
<li>l 请求的文件的地址（File）</li>
<li>l 请求遵守的协议（Protocol）</li>
<li>l 请求的状态（Status）</li>
<li>l 被请求文档的长度（Length）</li>
</ul>
<p>　　下面是一条标准的log file记录：</p>
<p><span style="color:#800080;">202.71.113.38 &#8211; - [03/Jan/2010:01:56:12 +0800] &quot;GET /Chinawebanalytics/Sidney.htm HTTP/1.0&quot; 200 5122</span></p>
<p>　　从左到右，202.71.113.38就是远程主机的IP；而登录名和登录全名指的是发起这个请求的用户的名字，这个一般大家当然是不想要透露的了，所以远程主机会禁止给出这两个信息，log file当然就记录不下来了，用两个短中划线代替。然后，03/Jan/2010是请求发生的日期，01:56:12则是时间，之后的+0800是指比格林威治时间要晚8个小时，就是我们北京时间了。再之后的GET是请求的方法，另一种方法是POST，可以简单理解为GET就是索取，POST就是提交。接着：/Chinawebanalytics/Sidney.htm是被请求文件的地址，可以是绝对地址也可以是相对地址。HTTP/1.0是请求所遵守的协议，这里的协议是HTTP 1.0。整个记录的结尾是两个数字，其中200表示一种请求的状态，意思是请求一切正常。有时候这个数字会显示为404，相信大家一看到这个数字就头痛，它表示请求的文件无法找到（file not found）；又有时候，这个数字会显示为301，表示页面被重新定向到了别的地址。最后的一个数字5593，表示所请求的文档的长度为5122 bytes。</p>
<p>　　通用格式其实很简单，但是里面的这11类记录往往不足够帮助我们进行更深入的分析，因此其他的一些记录被加入进来，其中最重要的一些是：</p>
<ul>
<li>l 请求来源（Referrer）：指连接到被请求资源的网站的URL。如果请求时通过点击一个链接时发生，那么这个项目就会被记录；</li>
<li>l 客户端（User Agent）：记录用户的浏览器或者发出请求的程序的相关信息；</li>
<li>l 所需时间（Time Taken）：从请求的发出到请求的资源全部传输完毕所需花费的时间；</li>
<li>l Cookie。关于cookie的内容请大家看我的这篇文章：<a href="http://www.chinawebanalytics.cn/%e6%8d%8d%e5%8d%abcookie%e2%80%94%e2%80%94%e6%b2%a1%e6%9c%89cookie%ef%bc%8c%e6%88%91%e4%bb%ac%e4%bb%80%e4%b9%88%e9%83%bd%e6%b2%a1%e6%9c%89%e4%ba%86/">捍卫Cookie&mdash;&mdash;没有Cookie，我们什么都没有了</a>。</li>
</ul>
<p>　　看起来，网站服务器日志所记录的内容是很有限的，比起我们动辄上万行的编程实在是九牛一毛。但是，千万别认为网站服务器日志文件会很小，对于一些大网站，每分每秒都有很多访问者对网站服务器进行请求，所以日志文件会积少成多，成为巨型的数据文件。有时候，一个小时的记录就能超过数G。什么，你网站的服务器日志一个月才1M？要加油啊，没有人气的网站可没有生命力。</p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/07/image3.png"><img align="left" alt="image" height="221" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/07/image_thumb3.png" style="margin: 0px 10px 5px 0px; display: inline" title="image" width="244" /></a>　　讲到这儿，该说说历史了。网站分析就是从网站服务器日志开始的，或者更准确的说，网站服务器日志自诞生之日起，就是为网站分析所用的。最早，人们可是把所有的记录都拿出来，然后导入到数据软件中去进行分析，辛苦程度自不用说；但这个痛苦的阶段不会持续太久，哪儿有痛苦，哪儿就有生意，所以网站日志分析软件就出现了，解决了很大的问题，以至于大小互联网服务提供商（ISP）们都为租用他们空间的用户提供一款免费的网站日志分析软件。尽管如此，分析网站日志一直都是一个相当不容易的事情，所以，人们不得不寻找一些更便利的方法，这样便发明了网站分析的新的数据获取方法，这是后话了。</p>
<p>　　如果你问我什么情况下选择用网站服务器日志来进行网站分析，我建议你如非必须，那么还是寻找一些更容易的方法能够事半功倍。看看后面的内容，你就能知道我为什么这么说。</p>
<h3>2. 用网站服务器日志进行网站分析的优点</h3>
<p>　　尽管是个技术活，但是利用网站服务器日志进行网站分析还是有不少好处的。</p>
<p><b>1. </b><b>网站服务器的日志是被你完全掌控的数据。</b></p>
<p>　　所谓放在自己手心最放心，这些日志在你的服务器中，如果不是黑客入侵，数据不可能被你不希望的人获取。而且，只要你不删除，它们永远都在那里，在任何时候你都可以回溯历史数据，无论这些数据有多么久远。有朝一日，你的网站大获成功，这些日志也是一份奋斗历史的见证。</p>
<p><b>2. </b><b>能够记录机器人/</b><b>自动程序对网站的访问。<a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/07/image4.png"><img align="right" alt="image" border="0" height="161" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/07/image_thumb4.png" style="border-bottom: 0px; border-left: 0px; margin: 0px 0px 5px 10px; display: inline; border-top: 0px; border-right: 0px" title="image" width="248" /></a> </b></p>
<p>　　其次，前面讲过，网站服务器的日志是记录网站服务器行为的，因此任何服务器响应的请求都会被记录下来。这些响应可能是应答用户发出的请求，也完全可能是应答一些互联网上自动程序发出的请求。最常见的一种互联网上的自动程序是搜索引擎的机器人，例如Google的Googlebot，这意味着网站服务器日志能够用来分析搜索引擎的访问，并帮助我们优化搜索引擎对网站的访问。讲到这里，请大家注意，并不是每一种网站分析方法都能做到这一点，我们最常用的为网站页面加入标签的方法是不能获取搜索引擎流量的。</p>
<p><b>3. </b><b>终端无关</b></p>
<p>　　网站服务器的日志能够记录网站服务器全部响应行为的特点还延伸出另外一个优点，那就是无论是何种终端访问服务器，都能把相关数据记录下来。现在，能够访问网站的终端越来越多了，我无聊的时候也试着用Sony的PSP上网，用手机的GPRS也能轻松的浏览网页，这些形形色色的终端的访问，服务器日志都会忠实的记录，但页面加入标签的方法就可能完全行不通。</p>
<p><b>4. </b><b>能够探知文件是否完全下载</b></p>
<p>　　日志方法的另一个好处是能够记录文件下载的情况。如果你在网上下载一个MP3音乐，你在发出这个响应的时候，日志会记录一个状态；你在下载完全的时候，日志照样会记录一个状态；如果你没有下载完全，日志还是会记录下来。这个，我想对那些提供下载服务的网站很有用。</p>
<p><b>5. </b><b>数据获取不依赖于第三方</b></p>
<p>　　通过日志获取数据本身不需要额外的第三方的帮助。只要你的服务器在运转，日志就会源源不断的被创建、保存。不过，请注意，这里我所指的是数据的获取不需要额外的支持，但是数据的分析一般而言，还是需要第三方的帮助的。直接去用肉眼读日志文件中的数据进行分析是不可想象的。</p>
<p><b>6. </b><b>不怕防火墙</b></p>
<p>　　最后，日志方法不惧怕防火墙或客户端安全软件的屏蔽，因为数据都是从服务器端获取的。</p>
<p>　　看起来似乎不错，不过凡事有利有弊，日志方法也肯定有它不能克服的不足。</p>
<h3>3. 用网站服务器日志方法进行网站分析的缺点</h3>
<p>　　日志方法能够起到作用的前提是服务器要响应来自客户端的请求，如果客户端的请求不通过服务器就得到了响应（这其实是经常发生的），那么服务器日志法就无能为力了。</p>
<p><b>1. </b><b>害怕网页缓存（Cache</b><b>）</b></p>
<p>　　为了提高网站页面的载入速度，人们发明了网页缓存（Cache）。在台湾，Cache被翻译作&ldquo;快取&rdquo;，似乎兼备了音义。</p>
<p>　　网页缓存的原理很容易理解，但却是个了不起的发明。在缓存出现之前，人们访问网站每次都需要把网页从网站的服务器传输到客户端的浏览器中，这个速度当然会有点儿慢，尤其是网络条件不好的时候。于是善动脑筋的人们发现，每次访问的网站其实有很多内容是没有更新的，如果能够把那些不经常更新的部分放在自己的电脑里面，每次打开网页的时候，首先搜索自己电脑里面已经有的内容，然后再去服务器去寻找那些被更新了的部分，这样服务器传输的数据量就会大大减少了，整个网页也会被更快地显示出来。</p>
<p>　　现在，我们大部分人的浏览器都设置了缓存。所以，有时候，你会发现，即使网络没有接通，你访问的网站似乎也能&ldquo;正常&rdquo;打开，只不过浏览器会显示&ldquo;脱机&rdquo;状态，告诉你，这些内容不是真正从服务器传输过来的。</p>
<p>　　除了客户端（浏览器）能够存放缓存的内容外，代理服务器（Proxy）也能够存放网页缓存，目的同样是为了提速。你可以把代理服务器的缓存想象成CPU的&ldquo;二级缓存&rdquo;&mdash;&mdash;当客户端没有存储某个网页的缓存的时候（&ldquo;一级缓存&rdquo;没有内容），浏览器就会寻找代理服务器缓存，看看有没有内容。如果还没有，那才会再去寻找真正存放网页内容的网站服务器。<a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/07/image5.png"><img align="left" alt="image" border="0" height="194" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/07/image_thumb5.png" style="border-bottom: 0px; border-left: 0px; margin: 0px 10px 5px 0px; display: inline; border-top: 0px; border-right: 0px" title="image" width="194" /></a></p>
<p>　　有了缓存，当你点击浏览器的&ldquo;回退按钮&rdquo;的时候，回退的上一个页面就不需要再重新从服务器中下载一次，而是立即就呈现在你的面前。你常用的网站的打开速度也显著提升了。</p>
<p>　　可是，对于通过服务器日志来获取网站访问数据的方法而言，这可不是一个好事情。由于缓存的存在，本来应该请求服务器的结果不需要请求了，服务器的日志什么也不会记录下来，可是对页面的访问却又实实在在的发生了。</p>
<p>　　所以，缓存的存在会使日志方法低估网站的实际访问量。</p>
<p><b>2. </b><b>害怕Flash</b><b>等&ldquo;客户端交互&rdquo;内容</b></p>
<p>　　现在，为了更具冲击力的视觉效果和更丰富的网页互动，运用Flash、加入视频、设计很多互动程序在网页上已经稀疏平常。而这些元素，它们太独立了，以至于当它们被载入到浏览器端了之后，完全可以在浏览器端运行而不再与服务器发生交互，或者只需要在必要的时候才与服务器发生交互。</p>
<p>　　比如，你玩儿普通网页版的Flash小游戏，一旦游戏下载完毕，你在玩儿的过程中跟网站服务器就不会有什么联系了，或者你看网页上的视频，你在播放器上进行的暂停操作，一般也不会跟服务器进行互动。还有，有一些脚本语言编写的网页程序，是在浏览器上被解释执行的，比如用JavaScript实现的网页Tab标签切换，在页面全部载完后，无论你怎么切换Tab，服务器都感觉不到了。</p>
<p>　　服务器感觉不到，也就不会存在什么服务器日志记录，也就不会有数据，因此用日志方法是无法准确获取&ldquo;客户端交互&rdquo;类型的网站访问行为的。这种情况下，必须选择其他的数据收集方法。</p>
<p><b>3. </b><b>不精确的访问者记录</b></p>
<p>　　日志方法辨别独立访问者需要依靠客户端的IP地址，也只能依靠它。不过，IP地址显然不代表真正的访问者。上班族的整个办公室的IP地址都可能是一个（使用代理服务器），而这个办公室可能坐着十多个人。这可能使访问者的数量被低估。</p>
<p>　　同样，在家中，如果你购买了公共网络服务，那么你的IP地址存在动态分配的问题。你今天上网的IP地址和明天的可能就会不同，这个时候日志方法只能判断为两个不同的访问者。这又可能使访问者的数量被高估。</p>
<p>　　此外，前面提到过日志是能够忠实记录机器（非人为）的访问活动的，但是机器不是人，它们的活动混在真实的人的访问之中，同样会使真实访问者的数量，或者访问数本身被高估。</p>
<p>　　在这正反两相反方向的共同作用下，结果只能一个，那就是对于访问者数量的估算是非常模糊的。当然，我们必须要承认，无论用什么方法，网站访问者的精确数量都无法获得，但相对而言，日志方法要更不准确些。</p>
<p><b>4. </b><b>较弱的实时性</b></p>
<p>　　没错，网站服务器日志是记录服务器运行的实时数据的，但是这些数据想要被取出分析，实时性就没有那么好了。常见的情况是，你必须首先把服务器日志文件（log file）从服务器中取出来，而这些文件肯定不会是服务器正在运行过程中的数据，<b>一般都是隔天的（需要验证），</b>然后再把这些日志文件导入到专门针对日志分析的工具中才能进行分析。这个过程的快慢依赖于你的熟练程度，但要追求实时，颇有难度。</p>
<p>　　有技术高超的站长或者工程师通过架设内部网络、组建专门的日志分析服务器，并且编写特定的程序来解决日志分析的实时性问题<b>（</b><b>http://www.phparticle.net/htmldata/36462/1/</b><b>）</b>，但是，对于普通的中小网站，这种方法难度颇大，花费不菲，所以可行性不强。因此，实时性是绝大部分通过日志方法来分析网站数据时要面对的问题。</p>
<p><b>5. </b><b>海量的数据存储</b></p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/07/image6.png"><img align="right" alt="image" border="0" height="158" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/07/image_thumb6.png" style="border-bottom: 0px; border-left: 0px; margin: 0px 0px 5px 10px; display: inline; border-top: 0px; border-right: 0px" title="image" width="248" /></a>　　服务器日志是忠实的，所以它会如实记录下来每一分每一秒发生的每一条服务器响应。对于一些流量稍大的网站，一天的网站日志记录超过数个G（Gigabytes）是非常正常的，而那些最大的网站，一个小时就可能产生数G的记录。我们没有詹姆斯&middot;卡梅隆的超级团队（他的《阿凡达》特效需要处理超过500,000G的数据），所以如果要回溯网站一个月的流量就可能变成一个相当棘手的问题，需要投入相当的时间和耐心，如果你没有相当的技术和经验，效率就会很低。</p>
<p><b>6. </b><b>日志文件获取繁琐</b></p>
<p>　　我们不能把日志文件的获取想象的太简单，毕竟这不是在自己卧室的电脑中点开一个MP3文件那么容易。有些网站有镜像服务器，有些服务器在境外，有些服务器是由处在多个不同地理位置的物理服务器逻辑组合而成。这些情况下，在进行日志分析之前需要集中所有的日志文件，这是一个很有些麻烦的事情，尤其是当日志文件的体积极为庞大的时候。另外，如果是租用的ISP服务器空间，如果没有权限获取日志数据，那么实际上连进行分析的可能性都没有了。</p>
<p>　　现在，你完全了解了日志方法收集网站分析数据的优缺点，那么，什么情况下你应该选择这种方法进行网站分析呢？</p>
<h3>4. 什么情况下该用日志分析方法</h3>
<p><strong>　　如果你有如下的数据监测和分析的需要，你应该用日志分析方法：</strong></p>
<p>1. 需要了解搜索引擎机器人或者其他非人为访问流量，并且希望据此对网站进行针对性的优化，如通过分析搜索引擎的访问行为来进行SEO；</p>
<p>2. 需要了解除了普通的PC客户端之外的上网设备对网站的访问情况；</p>
<p>3. 需要了解网站的文件资源是否被用户完整的下载索取；</p>
<p>4. 对网站流量信息具有极高的保密需要，不允许让任何第三方染指或帮忙；</p>
<p>5. 对于网站服务器的安全性和可维护性有要求，以及有非常显著的反抗黑客或其他非授权访问需求的。</p>
<p><strong>　　如果有如下需求，你<font color="#ff0000">不</font>应该用日志分析方法：</strong></p>
<p>1. 你的网站有重要的Flash之类的&ldquo;非网页类型的互动&rdquo;，用户和这些内容的互动是你想要了解的内容；</p>
<p>2. 不喜欢麻烦，对大数据量文件的处理不擅长，对日志文件不熟悉，没有好的日志数据处理软硬件资源；</p>
<p>3. 需要更精确的了解网站被真正的人访问的情况，而不需要了解&ldquo;非人&rdquo;的机器对网站的访问并且不希望受到网页缓存的干扰；</p>
<p>4. 需要更好的实时性、更规律更直观的数据呈现。</p>
<p>　　现在，拿着这个清单，你可以做出容易的选择了。因为我的博客（<a href="http://www.chinawebanalytics.cn">http://www.chinawebanalytics.cn</a>）的流量很多来自搜索引擎，因此分析服务器日志并了解搜索引擎爬虫的工作其实是非常必要的一个分析工作之一。</p>
<p>　　就我的经验而言，我们国家使用日志来分析网站仍然占有相当的比例，尤其是对于一些大型网站，他们会开发专门的软件，划拨专门的硬件资源来分析网站日志。不过，这不仅仅是从分析访问者行为的角度来考虑，更是从网站服务器的安全性和可维护性角度来考虑的。</p>
<p>　　不过，如果你把网站分析的重心放在对于网站真实访问者行为的追踪和分析上，那么，通过日志方法来实现相对而言难度相对比较大，操作也比较繁琐，我们可以利用另一种方法，即页面标记法（Page Tag）来实现对网站访问数据的收集。</p>
<p style="text-align: center; "><span class="Apple-style-span" style="color: rgb(169, 169, 169); font-family: Arial, Helvetica; line-height: 21px; ">[版权归<a href="http://www.chinawebanalytics.cn/?author=1" style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; padding-top: 0px; padding-right: 0px; padding-bottom: 0px; padding-left: 0px; color: rgb(60, 120, 167); text-decoration: none; ">Sidney Song</a>（宋星）所有，欢 迎转载，但请事先告知作者并注明出处]</span></p>
<p>　　好了，介绍完了，希望大家觉得看完后还算愉快！现在是大家的时间了，请您留言，任何问题，想法，不确切之处，都非常欢迎！谢谢！</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/wa-server-logfile-basic-pros-and-cons/feed/</wfw:commentRss>
		<slash:comments>58</slash:comments>
		</item>
		<item>
		<title>Omniture最新免费活动，欢迎参加！</title>
		<link>http://www.chinawebanalytics.cn/omniture-free-event-june-2010/</link>
		<comments>http://www.chinawebanalytics.cn/omniture-free-event-june-2010/#comments</comments>
		<pubDate>Wed, 02 Jun 2010 07:21:30 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[Headline]]></category>
		<category><![CDATA[网站分析圈子/活动]]></category>
		<category><![CDATA[Omniture]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=2514</guid>
		<description><![CDATA[











&#160;

成功的线上营销意义何在? 
									Online Success Means What?
Omniture和艾瑞咨询集团的营销领导简报会 
									Executive Briefings with Omniture and iResearch

&#160;










&#160;

北京 星期三 6 月 9 日，中国大饭店 
									Beijing Wednesday 9th June, China World Hotel 
									上海 星期五 6 月 11 日，希尔顿酒店 
									Shanghai Friday 11th June, Hilton Hotel 
									
从各渠道提高投资回报率 
									Driving ROI From Every Channel
了解如何优化利益，访客转化率，并且从社交媒体、视频和 Omniture 在线营销套件的移动数据中推动价值增长。 
									Learn how to optimize profit, improve visitor conversion, and drive value from social media, video, and mobile data with the Omniture Online Marketing Suite.
您已进行投资，您拥有数据，不再是流量问题，而是有关从各种活动和渠道提高投资回报率。 在此为期半天的免费简报会中，我们将向您展示如何： 
									&#183; 改善客户体验 
									&#183; 通过测试改进您的目标 
									&#183; 推动转化 
									&#183; 从社交媒体、手机和视频中推动价值增长 
									You&#8217;ve made the investment, you have the data, it&#8217;s no longer about traffic and ...]]></description>
			<content:encoded><![CDATA[<table border="0" cellpadding="0" cellspacing="0">
<tbody>
<tr>
<td>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/clip_image001.gif"><img alt="clip_image001" border="0" height="81" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/clip_image001_thumb.gif" style="border-bottom: 0px; border-left: 0px; display: block; float: none; margin-left: auto; border-top: 0px; margin-right: auto; border-right: 0px" title="clip_image001" width="578" /></a></p>
</td>
</tr>
<tr>
<td>
<table border="0" cellpadding="0" cellspacing="0">
<tbody>
<tr>
<td width="37">&nbsp;</td>
<td width="732">
<p><b>成功的线上营销意义何在</b><b>? <br />
									Online Success Means What?</b></p>
<p><b>Omniture</b><b>和艾瑞咨询集团的营销领导简报会</b><b> <br />
									</b><b>Executive Briefings with Omniture and iResearch</b></p>
</td>
<td width="31">&nbsp;</td>
</tr>
</tbody>
</table>
</td>
</tr>
<tr>
<td valign="top">
<table border="0" cellpadding="0" cellspacing="0">
<tbody>
<tr>
<td width="35">&nbsp;</td>
<td valign="top" width="734">
<p><b>北京</b><b> </b><b>星期三</b><b> 6 </b><b>月</b><b> 9 </b><b>日，中国大饭店</b><b> <br />
									Beijing Wednesday 9th June, China World Hotel <br />
									</b><b>上海</b><b> </b><b>星期五</b><b> 6 </b><b>月</b><b> 11 </b><b>日，希尔顿酒店</b><b> <br />
									Shanghai Friday 11th June, Hilton Hotel <br />
									</b><b><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/clip_image0025.jpg"><img alt="clip_image002[5]" border="0" height="4" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/clip_image0025_thumb.jpg" style="border-bottom: 0px; border-left: 0px; display: inline; border-top: 0px; border-right: 0px" title="clip_image002[5]" width="244" /><span id="more-2514"></span></a></b></p>
<p><b>从各渠道提高投资回报率</b><b> <br />
									Driving ROI From Every Channel</b></p>
<p><b>了解如何优化利益，访客转化率，并且从社交媒体、视频和</b><b> Omniture </b><b>在线营销套件的移动数据中推动价值增长。</b><b> <br />
									Learn how to optimize profit, improve visitor conversion, and drive value from social media, video, and mobile data with the Omniture Online Marketing Suite.</b></p>
<p><b>您已进行投资，您拥有数据，不再是流量问题，而是有关从各种活动和渠道提高投资回报率。</b><b> </b><b>在此为期半天的免费简报会中，我们将向您展示如何：</b><b> <br />
									&middot; </b><b>改善客户体验</b><b> <br />
									&middot; </b><b>通过测试改进您的目标</b><b> <br />
									&middot; </b><b>推动转化</b><b> <br />
									&middot; </b><b>从社交媒体、手机和视频中推动价值增长</b><b> <br />
									You&rsquo;ve made the investment, you have the data, it&rsquo;s no longer about traffic and clicks it&rsquo;s about driving ROI from every campaign and every Channel. In this Free Half Day Briefing we will show you how to: <br />
									&middot; improve the customer experience <br />
									&middot; improve your targeting through testing <br />
									&middot; drive conversions <br />
									&middot; drive value from social media, mobile, and video</b></p>
<p><b>Omniture </b><b>管理人员和</b><b> Omniture </b><b>客户，安居客</b><b> </b><b>与天极网，将向您展示如何使用已有的数据显著改善绩效。</b><b> <br />
									Omniture Executives and Omniture Customers, Anjuke and Tianji, will show you how to use the data you already have to dramatically improve your results.</b></p>
</td>
<td width="31">&nbsp;</td>
</tr>
</tbody>
</table>
</td>
</tr>
<tr>
<td>
<p><a href="http://www.beijingwizard.com/adobe-omniture/admin/reg1.asp" target="_blank"><img alt="clip_image003" border="0" height="48" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/clip_image003.gif" style="border-bottom: 0px; border-left: 0px; display: inline; border-top: 0px; border-right: 0px" title="clip_image003" width="587" /></a></p>
</td>
</tr>
<tr>
<td valign="top">
<table border="0" cellpadding="0" cellspacing="0">
<tbody>
<tr>
<td width="36">&nbsp;</td>
<td width="737">
<p><b>谁将参加会议？</b><b> <br />
									Who should attend? <br />
									</b><b>电子商务部副总裁、电子渠道部副总裁、销售部副总裁、市场营销部副总裁、数字营销部副总裁、在线策略部副总裁、</b><b>SEO/</b><b>搜索营销部主管、市场营销部总监和经理、在线广告部经理、数字营销部经理和网站营销部经理</b><b> <br />
									VP eCommerce, VP Electronic Channel, VP Sales, VP Marketing , VP Digital Marketing, VP Online Strategies, Head of SEO/Search Marketing, Marketing Directors and Managers, Online Advertising, Digital Marketing, Website Marketing Managers</b></p>
</td>
<td width="27">&nbsp;</td>
</tr>
<tr>
<td>&nbsp;</td>
<td>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/clip_image004.jpg"><img alt="clip_image004" border="0" height="375" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/clip_image004_thumb.jpg" style="border-bottom: 0px; border-left: 0px; display: inline; border-top: 0px; border-right: 0px" title="clip_image004" width="569" /></a></p>
<p align="center">点击看大图</p>
</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>&nbsp;</td>
<td>
<p><b>所有演示稿同时提供英文和中文字幕。</b><b> <br />
									All presentations are delivered with simultaneous translation to English and Chinese. <br />
									</b><b>请加入我们，参加其中一个营销领导简报会。</b><b> </b><b>地点受限</b><b> </b><b>立即注册。</b><b> <br />
									Please join us for one of these Executive Briefings. Places are limited Register Now.</b></p>
</td>
<td>&nbsp;</td>
</tr>
</tbody>
</table>
</td>
</tr>
<tr>
<td>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/clip_image005.gif"><img alt="clip_image005" border="0" height="57" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/clip_image005_thumb.gif" style="border-bottom: 0px; border-left: 0px; display: inline; border-top: 0px; border-right: 0px" title="clip_image005" width="592" /></a></p>
</td>
</tr>
<tr>
<td>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/clip_image006.gif"><img alt="clip_image006" border="0" height="142" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/clip_image006_thumb.gif" style="border-bottom: 0px; border-left: 0px; display: inline; border-top: 0px; border-right: 0px" title="clip_image006" width="588" /></a></p>
</td>
</tr>
<tr>
<td>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/clip_image0074.gif"><img alt="clip_image007[4]" border="0" height="86" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/clip_image0074_thumb.gif" style="border-bottom: 0px; border-left: 0px; display: inline; border-top: 0px; border-right: 0px" title="clip_image007[4]" width="593" /></a></p>
</td>
</tr>
<tr>
<td>
<p><a href="http://www.beijingwizard.com/adobe-omniture/admin/reg1.asp" target="_blank"><img alt="clip_image008[4]" border="0" height="115" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/06/clip_image0084.gif" style="border-bottom: 0px; border-left: 0px; display: inline; border-top: 0px; border-right: 0px" title="clip_image008[4]" width="590" /></a></p>
</td>
</tr>
</tbody>
</table>
<style type="text/css">
<p>td img {display: block;}body {
	margin-left: 0px;
	margin-top: 0px;
	margin-right: 0px;
	margin-bottom: 0px;
}
.eeee {
	font-size: 12px;
	line-height: 25px;
	color: #333333;
	font-family: arial, helvetica, sans-serif;
}
.style5 {font-size: 12px; line-height: 21px; color: #666666; font-family: arial, helvetica, sans-serif; font-weight: bold; }
.eeee {
	font-family: arial, helvetica, sans-serif;
	font-size: 12px;
	line-height: 25px;
	font-weight: bold;
	color: #666666;
}
.eee {
	font-size: 14px;
	line-height: 25px;
	color: #00cc33;
}
.style6 {
	font-size: 22px;
	line-height: 25px;
	color: #83a80c;
	font-weight: bold;
	font-family: arial, helvetica, sans-serif;
}</style>
<p><!-- ImageReady Slices (注册页-01 副本) --></p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/omniture-free-event-june-2010/feed/</wfw:commentRss>
		<slash:comments>37</slash:comments>
		</item>
		<item>
		<title>2010一月答亲爱的读者提问</title>
		<link>http://www.chinawebanalytics.cn/2010%e4%b8%80%e6%9c%88%e7%ad%94%e4%ba%b2%e7%88%b1%e7%9a%84%e8%af%bb%e8%80%85%e6%8f%90%e9%97%ae/</link>
		<comments>http://www.chinawebanalytics.cn/2010%e4%b8%80%e6%9c%88%e7%ad%94%e4%ba%b2%e7%88%b1%e7%9a%84%e8%af%bb%e8%80%85%e6%8f%90%e9%97%ae/#comments</comments>
		<pubDate>Tue, 26 Jan 2010 15:11:26 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[Headline]]></category>
		<category><![CDATA[招聘动态]]></category>
		<category><![CDATA[疑问求解]]></category>
		<category><![CDATA[网站分析经验分享]]></category>
		<category><![CDATA[Google Analytics]]></category>
		<category><![CDATA[招聘]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=1675</guid>
		<description><![CDATA[ 　　感谢朋友们的一直支持。很高兴看到我的文章引发了一些争论，这完全是我所希望的。我见过了太多的一言堂，我知道知识上没有权威，而且我也不是权威，我更不可能总是正确，我只是希望引发思考，让大家回味，然后能够继续分享出更多有意义和有乐趣的东西。是的，我是互联网自由主义的坚定拥趸，在这个互联网上，如果你不能自由的发表言论，你还能够在哪里发表呢？
　　一月份，我看到博客的流量在迅速上升，有些意外。也有更多的读者朋友们跟我联系，给我提出了很多很有价值的问题。我集中起来，一一解答。
&#160;
No.1 Will Lin给我提出的一个非常好的问题：最近Google Analytics提供了新的异步跟踪模式（Asynchronous Tracking），据说速度更快，更稳定，数据更准确。考虑到现在是放在头部,很有可能数据量会更大，过去一些点击但没有来得及加载页面的用户会被统计进去，但没有实际验证过。你觉得呢?
　　异步跟踪模式的目的就是为了更好更快的执行GA的监测代码，有两个好处：
1. 更快：代码被放在&#60;body&#62;&#8230;&#60;/body&#62;中的最头部或者放在&#60;head&#62;&#8230;&#60;/head&#62;中，这意味着页面没有载入完成GA的代码就会开始执行。页面也会载入的更快，因为异步代码不会影响&#60;body&#62;后内容的载入速度。
2. 抗干扰：传统的代码放在&#60;body&#62;和&#60;/body&#62;中的最尾部，GA监测代码之前的任何其他JavaScript如果出现执行错误，GA监测就会失效。而放在头部或者&#60;head&#62;&#8230;&#60;/head&#62;中，不会有这个问题。
　　你需要做的，是把如下代码放入被监测页面的&#60;body&#62;&#8230;&#60;/body&#62;中的最头部或者&#60;head&#62;和&#60;/head&#62;中：



&#60;script type=&#34;text/javascript&#34;&#62; 
				&#160; var _gaq = _gaq &#124;&#124; []; 
				&#160; _gaq.push([&#39;_setAccount&#39;, &#39;UA-XXXXX-X&#39;]); 
				&#160; _gaq.push([&#39;_trackPageview&#39;]); 
				&#160; (function() { 
				&#160;&#160;&#160; var ga = document.createElement(&#39;script&#39;); ga.type = &#39;text/javascript&#39;; ga.async = true; 
				&#160;&#160;&#160; ga.src = (&#39;https:&#39; == document.location.protocol ? &#39;https://ssl&#39; : &#39;http://www&#39;) + &#39;.google-analytics.com/ga.js&#39;; 
				&#160;&#160;&#160; (document.getElementsByTagName(&#39;head&#39;)[0] &#124;&#124; document.getElementsByTagName(&#39;body&#39;)[0]).appendChild(ga); 
				&#160; })(); 
				&#60;/script&#62;



　　上面的代码有几点要注意的
1. 把UA-XXXXX-X换成你的profile相应的识别码；
2. Google还是建议把这个代码放在&#60;body&#62;和&#60;/body&#62;中，紧挨着&#60;body&#62;。放在&#60;head&#62;之后，部分浏览器可能会出现报错；
3. 如果你要尝试异步跟踪代码，请把你过去加入的传统GA代码和定制化代码统统移除。否则可能会引起故障。这也是我没有在我的博客尝试异步代码的原因；
4. 如果你要定制化异步代码，跟旧的代码定制的方式非常类似，具体的方法请见：Google Analytics Tracking API。
　　我没有实际验证过效果，如果新旧代码不相互干扰，我会尝试。有没有朋友做过实验？能看到多大的差异？另外大家也可以参见David Wu的文章，很有价值！
　　Will，干脆你做个实验吧！:)
&#160;
No.2 我们公司每个月都要投放十几万的百度的关键词，百度的关键词的结构大家都清楚，自上而下分成了推广计划、推广单元和关键词。我习惯于用GA分析，但是GA又和百度关键词广告没有自动的关联，所以作分析的时候很棘手。我希望能用GA分析推广计划、推广单元和关键词的效果，能够做横向比较和分析就好了。
　　坦率说，每月十几万的百度关键词投放我没有做过，一定非常有意思。十几万关键词，再加上推广计划、单元的管理结构，确实是一个费时费事的事情。
　　但是，我觉得还是可以利用GA的Link Tag （UTM Tag）来进行监测。因为Link Tag本身就可以作为层级结构的分类。具体的Link Tag的使用方法请看我的这个帖子和Google的帮助。
　　你可以设定utm_campaign=你的客户的名字；设定utm_source=你的推广计划名；设定utm_medium=你的推广单元名；设定utm_term=实际的关键词。
　　十几万个数据，对于excel来说，尽管已经不轻省，但是还是能够应付的（让你的老板给你多加些内存吧！）。用excel编制一个表格，然后用&#8220;&#38;&#8221;或者concatenate函数把他们连起来，就能做好每个关键词加了link tag的链出URL了。这个其实也不难。
　　一旦你这么做了，在GA的campaign报告中（注意不是在Search Engine报告中）就能得到你所要的了，你可以比较不同推广计划，不同推广单元的差别，非常容易。
　　不过，有一个问题现在还不能避免，那就是GA对于百度汉字的支持。百度没有用utf8，所以GA上还是会显示乱码。怎么办呢？
　　我采用的方法是，用一个小软件，把所有的汉语全部转变成拼音对应的英语，这样，不会有乱码了，而且也基本上不影响辨识。这个软件是：实用汉字转拼音V4.8 绿色版，用百度搜一下，有下的，很好用。如果你想把数据结果和实际的汉语一一对应，那么把数据从GA上导出为excel，然后用index+match函数或是vlookup就能把汉语拼音再全部&#8220;翻译&#8221;回来。

　　大家有没有更好的，关于这个问题的方法？
　　另外，感谢Ben Zeng（曾海银）给我关于这个问题提供的一些启发！
&#160;
No.3 我发现在实际操作中，当站点规模变大而且页面不太&#8220;整齐&#8221;时(快速拓展业务中经常遇到的问题)，Google Analytics的Top Landing Page(最常见目标网页)的数据无法很好地使用，因为你会发现诸如我们站点的cookie time out时间可能大于1小时，涉及到支付时页面跳转到alipay等其他域名，然后Landing Page已经不是真实的用户进入站点的入口。这种问题你见过吗？如何改善？
　　不好意思，我不太明白这里的不太&#8220;整齐&#8221;是什么意思，不过，我想这不影响这个问题。visit的cookie time out时间是可以自己修改的，在GA的代码中可以自己加函数定义。
　　这个函数是.setSessionTimeout()，在空格中填入加了双引号的数字即可，数字代表的是秒。你把visit的time out定位10小时也没有问题。但是一般大家还是约定俗成用半小时。
　　具体的方法请见：http://services.google.com/analytics/breeze/en/additional_customizations/index.html
&#160;
No.4 我们公司想要为客户提供网站开发之后的分析和优化服务，我该如何报价，我的服务又应该包括什么呢？
　　这个问题我很难回答你，尤其是在当前其实还没有很明确的市场规范的情况下。但这的确是个好问题，也是很多朋友都关心的问题。因为，如果能通过网站分析赚钱，这太好不过了！
　　对于网站分析的具体的收费模式，目前主要采用的方法有两种：
1. 按照网站的流量收费，比如10k PV收费1000元/月。对于这种收费方式，事先会约定提供服务的种类，然后你就盼着客户的网站流量不断增加吧。具体的收费怎么收，我也没有个标准值。可以参考WebTrends和Omniture的价格，或者，你按照自己所花费的人时成本估摸着收？;)
2. 按照提供的服务收费，这个相对复杂，但其实比较合理，双方较能接受。
　　我就第二点进行一下引申：
　　一般人们总觉得做网站分析，就是提供一个报告，这是非常狭隘的。而且Avinash做过一个实验，他把每周都发布给公司内其他部门的网站分析报告在进行了几个月后突然停掉，竟然在停掉的第一周没有一个人问他为什么这周没有报告。这种情况我们都经历过，大家最后都麻木了，未必会真正重视你的报告。
　　网站分析提供的服务是包含了生命周期的循环，一定要包括如下内容：

网站监测的计划和实施；
网站监测实施之后的质量检查，确保监测没有问题；
网站数据的收集和分析；
网站分析发现、结论和建议，并以报告的形式呈现；
为建议建立测试环境，并进行测试；
测试效果反馈报告，以及新的建议。

　　我觉得，报告本身还是一个工具，我已经反复强调过，最终你还是要通过报告提出建议，然后通过测试，这样才可能知道管不管用，才可能做到优化。报告本身不会产生任何优化，除非人们去执行，去测试。
　　每一项服务都是可以收费的哦！当然，你也可以最终出个打包价。
　　至于怎么收嘛，这个根据你付出的劳动和客户要求的深度，区别是很大的，当然，更你的商务拓展能力和谈判能力关系更大。总之，别让自己吃亏哦！
　　这个问题，如果大家觉得不够清楚，欢迎继续留言讨论！
&#160;
No.5 最后，关于我们公司的招聘和面试
　　目前招聘的安排非常多，我也接收到了不少朋友们的简历。首先对大家的厚爱和支持表示诚挚的感谢！目前总的职位的需求情况是：
　　高级网站分析师/分析主管：3个，一个在上海，另外两个在北京；初级/网站分析师：2个，在上海。目前上海的招聘已经进行了一轮，但第二轮尚未开始，我会在这周末或者下周初通知大家第一轮的结果。北京的高级网站分析师/分析主管职位是刚刚增加的，机会很不错，值得尝试。
　　SEM专员：2个，都在北京。目前还没有开始面试，但是已经安排了部分朋友的面试，也希望有兴趣的朋友继续申请。
　　实习生：1个，在北京。另外可能有2到3个甚至更多在上海。所以上海的还没有毕业的同学完全可以先跟我联系，到时候肯定会有机会安排面试的。
　　注意，分析师/主管有超过一半的工作是做互联网广告的监测，另有百分之三四十左右是分析互联网营销活动的效果，其中包括我们最关心的网站分析。但是网站分析不是工作的全部。我不希望误导大家。
　　再介绍一下公司的情况，Omnicom Media Group（OMG）是世界上最大的媒介集团之一。主要是为世界上最大的这些企业提供媒介（就是广告）的计划和购买服务。所以OMG不仅仅只有互联网广告业务，实际上它会做全案，当然我只负责互联网这块。OMG下面有三家公司，其中两家在中国都设有机构，是兄弟公司，有不可分割的关系。一家是OMD，一家是PHD。上海的职位是PHD招聘，北京的职位是OMD招聘，不管是OMD还是PHD其实大同小异了。
　　如果大家还有什么疑问，请给我写信吧：sidney.song(at)omd.com！
　　祝大家好运！:)
]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/01/image3.png"><img align="left" alt="image" border="0" height="264" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/01/image_thumb3.png" style="border: 0px none ; margin: 5px 10px; display: inline;" title="image" width="180" /></a> 　　感谢朋友们的一直支持。很高兴看到我的文章引发了一些争论，这完全是我所希望的。我见过了太多的一言堂，我知道知识上没有权威，而且我也不是权威，我更不可能总是正确，我只是希望引发思考，让大家回味，然后能够继续分享出更多有意义和有乐趣的东西。是的，我是互联网自由主义的坚定拥趸，在这个互联网上，如果你不能自由的发表言论，你还能够在哪里发表呢？</p>
<p>　　一月份，我看到博客的流量在迅速上升，有些意外。也有更多的读者朋友们跟我联系，给我提出了很多很有价值的问题。我集中起来，一一解答。<span id="more-1675"></span></p>
<p>&nbsp;</p>
<p><strong><font color="#800080">No.1 Will Lin给我提出的一个非常好的问题：最近Google Analytics提供了新的异步跟踪模式（Asynchronous Tracking），据说速度更快，更稳定，数据更准确。考虑到现在是放在头部,很有可能数据量会更大，过去一些点击但没有来得及加载页面的用户会被统计进去，但没有实际验证过。你觉得呢?</font></strong></p>
<p>　　异步跟踪模式的目的就是为了更好更快的执行GA的监测代码，有两个好处：</p>
<p>1. 更快：代码被放在&lt;body&gt;&#8230;&lt;/body&gt;中的最头部或者放在&lt;head&gt;&#8230;&lt;/head&gt;中，这意味着页面没有载入完成GA的代码就会开始执行。页面也会载入的更快，因为异步代码不会影响&lt;body&gt;后内容的载入速度。</p>
<p>2. 抗干扰：传统的代码放在&lt;body&gt;和&lt;/body&gt;中的最尾部，GA监测代码之前的任何其他JavaScript如果出现执行错误，GA监测就会失效。而放在头部或者&lt;head&gt;&#8230;&lt;/head&gt;中，不会有这个问题。</p>
<p>　　你需要做的，是把如下代码放入被监测页面的&lt;body&gt;&#8230;&lt;/body&gt;中的最头部或者&lt;head&gt;和&lt;/head&gt;中：</p>
<table border="0" cellpadding="2" cellspacing="0" width="603">
<tbody>
<tr>
<td valign="top" width="601">&lt;script type=&quot;text/javascript&quot;&gt; </p>
<p>				&nbsp; var _gaq = _gaq || []; <br />
				&nbsp; _gaq.push([&#39;_setAccount&#39;, &#39;UA-XXXXX-X&#39;]); <br />
				&nbsp; _gaq.push([&#39;_trackPageview&#39;]); </p>
<p>				&nbsp; (function() { <br />
				&nbsp;&nbsp;&nbsp; var ga = document.createElement(&#39;script&#39;); ga.type = &#39;text/javascript&#39;; ga.async = true; <br />
				&nbsp;&nbsp;&nbsp; ga.src = (&#39;https:&#39; == document.location.protocol ? &#39;https://ssl&#39; : &#39;http://www&#39;) + &#39;.google-analytics.com/ga.js&#39;; <br />
				&nbsp;&nbsp;&nbsp; (document.getElementsByTagName(&#39;head&#39;)[0] || document.getElementsByTagName(&#39;body&#39;)[0]).appendChild(ga); <br />
				&nbsp; })(); </p>
<p>				&lt;/script&gt;</td>
</tr>
</tbody>
</table>
<p>　　上面的代码有几点要注意的</p>
<p>1. 把UA-XXXXX-X换成你的profile相应的识别码；</p>
<p>2. Google还是建议把这个代码放在&lt;body&gt;和&lt;/body&gt;中，紧挨着&lt;body&gt;。放在&lt;head&gt;之后，部分浏览器可能会出现报错；</p>
<p>3. 如果你要尝试异步跟踪代码，请把你过去加入的传统GA代码和定制化代码统统移除。否则可能会引起故障。这也是我没有在我的博客尝试异步代码的原因；</p>
<p>4. 如果你要定制化异步代码，跟旧的代码定制的方式非常类似，具体的方法请见：<a href="http://code.google.com/intl/zh-CN/apis/analytics/docs/gaJS/gaJSApi.html" target="_blank">Google Analytics Tracking API</a>。</p>
<p>　　我没有实际验证过效果，如果新旧代码不相互干扰，我会尝试。有没有朋友做过实验？能看到多大的差异？另外大家也可以参见<a href="http://www.adsem.cn/653" target="_blank">David Wu的文章</a>，很有价值！</p>
<p>　　Will，干脆你做个实验吧！:)</p>
<p>&nbsp;</p>
<p><strong><font color="#800080">No.2 我们公司每个月都要投放十几万的百度的关键词，百度的关键词的结构大家都清楚，自上而下分成了推广计划、推广单元和关键词。我习惯于用GA分析，但是GA又和百度关键词广告没有自动的关联，所以作分析的时候很棘手。我希望能用GA分析推广计划、推广单元和关键词的效果，能够做横向比较和分析就好了。</font></strong></p>
<p>　　坦率说，每月十几万的百度关键词投放我没有做过，一定非常有意思。十几万关键词，再加上推广计划、单元的管理结构，确实是一个费时费事的事情。</p>
<p>　　但是，我觉得还是可以利用GA的Link Tag （UTM Tag）来进行监测。因为Link Tag本身就可以作为层级结构的分类。具体的Link Tag的使用方法请看我的<a href="http://www.chinawebanalytics.cn/?p=149" target="_blank">这个帖子</a>和<a href="http://www.google.com/support/analytics/bin/answer.py?answer=55578&amp;hl=en" target="_blank">Google的帮助</a>。</p>
<p>　　你可以设定utm_campaign=你的客户的名字；设定utm_source=你的推广计划名；设定utm_medium=你的推广单元名；设定utm_term=实际的关键词。</p>
<p>　　十几万个数据，对于excel来说，尽管已经不轻省，但是还是能够应付的（让你的老板给你多加些内存吧！）。用excel编制一个表格，然后用&ldquo;&amp;&rdquo;或者concatenate函数把他们连起来，就能做好每个关键词加了link tag的链出URL了。这个其实也不难。</p>
<p>　　一旦你这么做了，在GA的campaign报告中（注意不是在Search Engine报告中）就能得到你所要的了，你可以比较不同推广计划，不同推广单元的差别，非常容易。</p>
<p>　　不过，有一个问题现在还不能避免，那就是GA对于百度汉字的支持。百度没有用utf8，所以GA上还是会显示乱码。怎么办呢？</p>
<p>　　我采用的方法是，用一个小软件，把所有的汉语全部转变成拼音对应的英语，这样，不会有乱码了，而且也基本上不影响辨识。这个软件是：<strong>实用汉字转拼音V4.8 绿色版</strong>，用百度搜一下，有下的，很好用。如果你想把数据结果和实际的汉语一一对应，那么把数据从GA上导出为excel，然后用index+match函数或是vlookup就能把汉语拼音再全部&ldquo;翻译&rdquo;回来。</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2010/01/image4.png"><img alt="image" height="335" src="http://www.chinawebanalytics.cn/wp-content/uploads/2010/01/image_thumb4.png" style="display: inline;" title="image" width="428" /></a></p>
<p>　　大家有没有更好的，关于这个问题的方法？</p>
<p>　　另外，感谢Ben Zeng（曾海银）给我关于这个问题提供的一些启发！</p>
<p>&nbsp;</p>
<p><strong><font color="#800080">No.3 我发现在实际操作中，当站点规模变大而且页面不太&ldquo;整齐&rdquo;时(快速拓展业务中经常遇到的问题)，Google Analytics的Top Landing Page(最常见目标网页)的数据无法很好地使用，因为你会发现诸如我们站点的cookie time out时间可能大于1小时，涉及到支付时页面跳转到alipay等其他域名，然后Landing Page已经不是真实的用户进入站点的入口。这种问题你见过吗？如何改善？</font></strong></p>
<p>　　不好意思，我不太明白这里的不太&ldquo;整齐&rdquo;是什么意思，不过，我想这不影响这个问题。visit的cookie time out时间是可以自己修改的，在GA的代码中可以自己加函数定义。</p>
<p>　　这个函数是.setSessionTimeout()，在空格中填入加了双引号的数字即可，数字代表的是秒。你把visit的time out定位10小时也没有问题。但是一般大家还是约定俗成用半小时。</p>
<p>　　具体的方法请见：<a href="http://services.google.com/analytics/breeze/en/additional_customizations/index.html" title="http://services.google.com/analytics/breeze/en/additional_customizations/index.html">http://services.google.com/analytics/breeze/en/additional_customizations/index.html</a></p>
<p>&nbsp;</p>
<p><strong><font color="#800080">No.4 我们公司想要为客户提供网站开发之后的分析和优化服务，我该如何报价，我的服务又应该包括什么呢？</font></strong></p>
<p>　　这个问题我很难回答你，尤其是在当前其实还没有很明确的市场规范的情况下。但这的确是个好问题，也是很多朋友都关心的问题。因为，如果能通过网站分析赚钱，这太好不过了！</p>
<p>　　对于网站分析的具体的收费模式，目前主要采用的方法有两种：</p>
<p>1. 按照网站的流量收费，比如10k PV收费1000元/月。对于这种收费方式，事先会约定提供服务的种类，然后你就盼着客户的网站流量不断增加吧。具体的收费怎么收，我也没有个标准值。可以参考WebTrends和Omniture的价格，或者，你按照自己所花费的人时成本估摸着收？;)</p>
<p>2. 按照提供的服务收费，这个相对复杂，但其实比较合理，双方较能接受。</p>
<p>　　我就第二点进行一下引申：</p>
<p>　　一般人们总觉得做网站分析，就是提供一个报告，这是非常狭隘的。而且Avinash做过一个实验，他把每周都发布给公司内其他部门的网站分析报告在进行了几个月后突然停掉，竟然在停掉的第一周没有一个人问他为什么这周没有报告。这种情况我们都经历过，大家最后都麻木了，未必会真正重视你的报告。</p>
<p>　　网站分析提供的服务是包含了生命周期的循环，一定要包括如下内容：</p>
<ul>
<li>网站监测的计划和实施；</li>
<li>网站监测实施之后的质量检查，确保监测没有问题；</li>
<li>网站数据的收集和分析；</li>
<li>网站分析发现、结论和建议，并以报告的形式呈现；</li>
<li>为建议建立测试环境，并进行测试；</li>
<li>测试效果反馈报告，以及新的建议。</li>
</ul>
<p>　　我觉得，报告本身还是一个工具，我已经反复强调过，最终你还是要通过报告提出建议，然后通过测试，这样才可能知道管不管用，才可能做到优化。报告本身不会产生任何优化，除非人们去执行，去测试。</p>
<p>　　每一项服务都是可以收费的哦！当然，你也可以最终出个打包价。</p>
<p>　　至于怎么收嘛，这个根据你付出的劳动和客户要求的深度，区别是很大的，当然，更你的商务拓展能力和谈判能力关系更大。总之，别让自己吃亏哦！</p>
<p>　　这个问题，如果大家觉得不够清楚，欢迎继续留言讨论！</p>
<p>&nbsp;</p>
<p><strong><font color="#800080">No.5 最后，关于我们公司的招聘和面试</font></strong></p>
<p>　　目前招聘的安排非常多，我也接收到了不少朋友们的简历。首先对大家的厚爱和支持表示诚挚的感谢！目前总的职位的需求情况是：</p>
<p>　　<strong>高级网站分析师/分析主管</strong>：3个，一个在上海，另外两个在北京；<strong>初级/网站分析师：</strong>2个，在上海。目前上海的招聘已经进行了一轮，但第二轮尚未开始，我会在这周末或者下周初通知大家第一轮的结果。北京的高级网站分析师/分析主管职位是刚刚增加的，机会很不错，值得尝试。</p>
<p>　　<strong>SEM专员：</strong>2个，都在北京。目前还没有开始面试，但是已经安排了部分朋友的面试，也希望有兴趣的朋友继续申请。</p>
<p>　　<strong>实习生：</strong>1个，在北京。另外可能有2到3个甚至更多在上海。所以上海的还没有毕业的同学完全可以先跟我联系，到时候肯定会有机会安排面试的。</p>
<p><strong>　　注意，分析师/主管有超过一半的工作是做互联网广告的监测，另有百分之三四十左右是分析互联网营销活动的效果，其中包括我们最关心的网站分析。但是网站分析不是工作的全部。我不希望误导大家。</strong></p>
<p>　　再介绍一下公司的情况，Omnicom Media Group（OMG）是世界上最大的媒介集团之一。主要是为世界上最大的这些企业提供媒介（就是广告）的计划和购买服务。所以OMG不仅仅只有互联网广告业务，实际上它会做全案，当然我只负责互联网这块。OMG下面有三家公司，其中两家在中国都设有机构，是兄弟公司，有不可分割的关系。一家是OMD，一家是PHD。上海的职位是PHD招聘，北京的职位是OMD招聘，不管是OMD还是PHD其实大同小异了。</p>
<p>　　如果大家还有什么疑问，请给我写信吧：sidney.song(at)omd.com！</p>
<p>　　祝大家好运！:)</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/2010%e4%b8%80%e6%9c%88%e7%ad%94%e4%ba%b2%e7%88%b1%e7%9a%84%e8%af%bb%e8%80%85%e6%8f%90%e9%97%ae/feed/</wfw:commentRss>
		<slash:comments>27</slash:comments>
		</item>
		<item>
		<title>网站分析意义重大——答点石大会朋友提问（下）</title>
		<link>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e6%84%8f%e4%b9%89%e9%87%8d%e5%a4%a7%e2%80%94%e2%80%94%e7%ad%94%e7%82%b9%e7%9f%b3%e5%a4%a7%e4%bc%9a%e6%9c%8b%e5%8f%8b%e6%8f%90%e9%97%ae%ef%bc%88%e4%b8%8b%ef%bc%89/</link>
		<comments>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e6%84%8f%e4%b9%89%e9%87%8d%e5%a4%a7%e2%80%94%e2%80%94%e7%ad%94%e7%82%b9%e7%9f%b3%e5%a4%a7%e4%bc%9a%e6%9c%8b%e5%8f%8b%e6%8f%90%e9%97%ae%ef%bc%88%e4%b8%8b%ef%bc%89/#comments</comments>
		<pubDate>Sat, 12 Dec 2009 12:45:20 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[Headline]]></category>
		<category><![CDATA[疑问求解]]></category>
		<category><![CDATA[网站分析经验分享]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=1430</guid>
		<description><![CDATA[　　上回我们讲了两个极具代表性的问题，对于上两个问题，我的总结是&#8212;&#8212;&#8220;趋势、细分和转化&#8221;是网站分析的最基本的思维方式，任何能够实现上面需求的工具都是好工具。而下面的两个问题，有如递进的序曲，把我们引向更深远的领域。

第三个问题：

　　这个问题是KK（沈维嘉）提出的。KK的公司是一家电子商务网站，这家网站在社交媒体（SNS）上做营销，用于传播自己公司的品牌和商品。通过SNS进行传播和营销活动在国内简直是一个崭新的领域，更不用说去监测效果了，应该如何监测效果呢？KK进一步问，除了SNS之外，其实很多营销活动是在网站之外的，如何衡量这些营销活动的效果呢？

　　这个问题涉及了很多前沿领域，是一个很难的题目，也是Avinash需要在《网站分析2.0》中解决的题目。这个问题本身其实已经可以专门开一个帖子仔细解读，而且非常需要朋友们一起讨论。这里我谈谈我的看法，抛砖引玉。
[版权归作者Sidney Song（宋星）所有，欢迎转载，但请事先告知作者并注明出处]
　　我们一般认为，网站分析是用来解决网站自己的事情的，实则不然。对于网站的分析，可以是自己的网站，当然也可以是自己网站之外的别人的网站。我们曾经有一个帖子&#8220;如何衡量陌生网站的流量&#8221;就是对这个领域的讨论。如果我们把网站按照&#8220;范围&#8221;和&#8220;功用&#8221;两个维度来进行区分的话，我们可以得到下面的图：

图：网站分析的监测对象
　　KK的这个问题属于上图中的左上角的范畴。这个范畴是目前中国互联网的&#8220;类星体&#8221;&#8212;&#8212;能量极为强大，运动速度极快，却最令人困惑的部分。我们应该如何衡量它呢？我觉得，这个问题取决于你利用社会化营销的思维和态度，一般而言，大家有两种态度：
1. 利用社会化营销创造/促进转化
　　在左上角的范畴中除了SNS营销外，还有Twitter营销、社区营销、博客营销、口碑营销等等&#8230;&#8230;这一类五花八门的数字营销方法纷繁芜杂，但目的并没有任何本质变化，那就是&#8212;&#8212;通过扩大传播提升ROI。这一点对于电子商务网站尤其如此。因此，对它们的监测和分析，本质上还是可以回归到对流量来源及其转化的分析上。
[版权归作者Sidney Song（宋星）所有，欢迎转载，但请事先告知作者并注明出处]
　　而分析流量来源及其转化，这根本就是网站分析自诞生起就有的能力！

　　你要做的，是把你所做的社会化营销，尽量做细分，然后分配给每一个细分营销一个独一无二的标签，这样你就能衡量它们的转化如何，而且能够做很多的横向的比较。
　　举个例子，你在新浪微博上所发起的话题上有链接能直通你的某个产品页面：（http://www.chinawebanalytics.cn/），你可以给它一个参数，如&#34;?from=sinaweibo&#34;，即把这个链接变为：http://www.chinawebanalytics.cn/?from=sinaweibo，网站分析工具就能辨识出哪些流量是来自新浪微博的了。当然如果你觉得细分的还不够，还想给你在新浪微博上每个发起的话题都加一个独一无二的参数，你也是可以做到的。具体的方法请见我之前的文章：Direct Traffic真的是直接流量吗？如何辨识真正流量来源？
　　一旦你标记了这些源头，再通过对你的网站的监测数据来研究它们的流量质量和转化，你就能发现这些营销到底好不好&#8212;&#8212;这其实是最具有操作性的做法。而且，这些标记的一个巨大的好处在于：这些话题在传播的时候，标记也会随之传播，这样你能够知道归根结底是谁在做出贡献。例如，新浪微博上的这个话题被转到了开心网上，没关系，流量仍然会算作新浪微博的（不过，有时候这又是个麻烦，如果你希望被转帖到另外一个媒体的时候参数变成对应的社会化媒体，那就只能去掉这个参数然后听天由命了。大家有没有技术解决方法？）。
　　当然，不要忘了社会化营销的滞后性，多给它一点儿耐心是靠谱的。
　　但是，你肯定要说，这不是社会化营销的全部魅力。我们&#8212;&#8212;某种程度上，其实更希望通过社会化媒体帮我们造势，帮我们宣传品牌，帮我们创造好感和口碑，而这些或许不直接能够通过它们带来的流量的转化体现出来。
　　如果你看到上面的这些描述之后提出斜体字的这个问题，我会说你真的了解互联网。当然，我相信每个朋友都会有这样的疑问，因为这就是你们对待社会化媒体的态度。这个疑问实际上可以简化为：我们如何衡量社会化营销的整体/综合效果？请继续阅读第2点。
2. 利用社会化媒体创造认知和偏好
　　很多大的企业（国外）已经在很多年前意识到社会化媒体的巨大影响力。Dell go to Hell是个好案例，最近的&#8220;美联航摔坏了我的吉他&#8221;也是个好案例。因此，社会化媒体的真正价值在于它的综合效用，即帮助品牌/产品创造更好的用户认知，乃至形成用户偏好。当然，它也能在瞬间起到反效果。
　　这是一个模糊的，难以控制的，却异常重要的领域。我们怎么衡量效果？
　　下面我将要回答这个问题的，是我的亲身经验，我认为具有参考价值，但我不认为我足够聪明，我希望你看完这个部分后提出你的见解。
[版权归作者Sidney Song（宋星）所有，欢迎转载，但请事先告知作者并注明出处]
　　我的亲身经验是分两步走：

(1)衡量社会化媒体本身：

　　衡量社会化媒体不是没有办法，同样也不是没有工具。这两个帖子（一个是我的，一个是Avinash的）一定能够帮助你，我觉得值得仔细研读：Sidney的IWOM监测与分析：理解和实践，Social Media Analytics: Twitter: Quantitative &#38; Qualitative Metrics。
　　但是，这些还不够，为了衡量效果，我们需要利用Control Group的方法。即，给社会化媒体的一部分人（曝光组）群进行营销活动，而故意不给另外一部分人（控制组）进行营销活动，然后通过对比来衡量营销活动到底有没有促进认知和偏好。
　　虽然社会化媒体的本身具有的传播性，但一般而言，由于传播的滞后性，曝光组的总体曝光量会比控制组显著的大，因此你有足够的空间衡量区别。这本质上就是我常常提起的A/B test。
　　如何分组和定向？&#8212;&#8212;太容易了，因为你面对的是社会化媒体，里面有太全面的个人资料了。

(2)衡量外部互联网：

　　这个，你会觉得很难。但是，实际上并不是那么困难。我的客户K男，他就想到了一个绝妙的办法。
　　在做社会化营销的时候，你一定有一个跟别人独一无二的品牌、产品名称（或是产品昵称）或是代号什么的，它们都是被传播的对象。而通过搜索引擎的帮助（比如Google Search Insight）就能知道它们引发人们兴趣的情况到底如何。
　　还记得我翻译的Avinash的文章吗？Avinash：互联网品牌营销的监测和分析（上），Avinash：互联网品牌营销的监测和分析（下），这个时候真的可以派上用场哦！
　　除此之外，继续用IWOM监测外部互联网在谈些什么，这个会比间接的方法更为可靠。
　　当然，还有一个我最看重的方法，那就是做调研。我们大家都倾向于技术解决问题，而不是直接面对受众。但是我必须承认，所有间接的方法都不会比直接的方法更有效。调研很多时候其实不用花太多钱。把调研也放在SNS上传播吧，说不定会给你带来意想不到的收获。
　　说了很多，但是由于这个话题本身的复杂性和包容性，因此我相信大家仍会觉得言而未尽。我希望大家也能够有更多的输入，这个领域的确太新，却太重要了。
[版权归作者Sidney Song（宋星）所有，欢迎转载，但请事先告知作者并注明出处]
&#160;

第四个问题：

　　一个做某一类很细分产品在线销售的企业主问，他很困惑要如何选择媒体投放广告&#8212;&#8212;由于他的产品的特殊性，他投放广告的媒体也是很细分的一些网站，这些网站的规模和名气都不大，而且他都不太了解这些网站，也不了解是否还有其他的网站值得投放广告。他的问题是：因为网站分析是滞后的，是事后的评判，而他很希望在事前就能选择正确的媒体投放，从而节省开支达到更好的效果。
　　这是一个典型的问题。我完全理解这一类的需求，而且我相信这一类的需求非常强烈。我们不喜欢交学费，我们希望在事情没有开始之前就能预计到结果。
　　但是这本身其实是理想化的，至少目前来看是这样。但我相信在几年之内应该会有一个好的服务商出现，满足这类要求。
　　我的同事们也遇到了跟提问的朋友类似的情况，因为他们是广告的计划者，他们需要做出优化的广告投放方案。目前他们能够用上的方法还是有一些的，关于这一点，我的这个文章能够有一部分的帮助：如何获知陌生网站的流量？（这也是我最喜欢的文章之一），他们实际上是按照我的这篇文章所提示的方法在操作。
　　除此之外，我还建议应该问问这个圈子里面的朋友，他们有没有什么推荐的好媒体。坦率说网站分析的确不是来帮忙从大海中捞针的，网站分析在这个领域的重大意义在于&#8212;&#8212;给出方向。下面这个可行的方法就是一个典型的通过网站分析指出方向的例子。
[版权归作者Sidney Song（宋星）所有，欢迎转载，但请事先告知作者并注明出处]


一个可行的方法：

　　如果你的网站运行了比较长的时间，而且你有同事可以做一些网站的分析（无论是用Google Analytics还是用Log File）的话，那么实际上你并不是两眼一抹黑的。
　　因为你可以看到来到你的网站上的流量（或至少部分流量）都是从哪里来的。如果你把流量源头做细分，然后研究他们的行为的话，那么一定能够发现有一些源头带来的流量要比另外一些更有效（比如有更好的转化，或者更多的engagement）。这个时候你就能发现一些值得投放的媒体了。
　　这不能解决全部问题，但better than nothing。

真正有意义的思维应该是什么？&#8212;&#8212;持续优化！

　　不过，我真正想谈的不是上面的这个方法，而是这个问题本身所代表的一种误解&#8212;&#8212;没有网络营销经验之前就洞悉一切，然后一击必中。理论上这也许做得到，但在实践中，所有的成功的网络营销的案例都是来自于此前所积累起来的经验，是一个不断从经验和教训中学习提升的过程，极少有人第一次网络营销就很成功，而且一直保持成功的。
　　网络营销真的是摸着石头过河呢！而且你真的需要自己亲自摸，只是，你可以找一个过过河的朋友当向导，这样你可以摸得快一点儿。
　　我觉得，如果希望做一个长期的生意的话，最初的投入即使并没有达到预期效果，也是值得的。我们真的需要一开始就毫发误差，百发百中吗？我的印象中，SEO需要不断地尝试，它的策略是一个动态的过程，SEM也是。我必须说，对网络营销，尤其是对于广告媒体的选择和对于广告推广本身的策略&#8212;&#8212;也都需要尝试、投入、从不成功中发现成功，也是动态提升的过程。而在这个动态过程中，网站分析能够极好的帮助您了。因为你的尝试之后的效果评估、比较、从看似不是机会的情况中发现机会，都能通过网站分析带来。是的，狭义上的网站分析不能在&#8220;第一次&#8221;之前就告诉你答案，但是却可以在你的第二次、第三次&#8230;&#8230;以及每一次新的尝试之前告诉你答案&#8212;&#8212;什么可行，什么不可行，什么值得做新的尝试。
　　即使是你的&#8220;第一次&#8221;，也并不是让你去瞎碰，你会有你自己的想法，也有朋友的推荐，还有一些基本的尝试在帮助你。你肯定不是没有策略的，但千万别苛求自己&#8220;不能出一点儿偏差&#8221;。在你研究选定了几家投放媒体之后，就大胆地做一次的尝试吧！此后的工作，交给网站分析吧&#8212;&#8212;她能够帮你发现这些媒体哪些是你真正需要的，哪些其实只是徒有虚名。
　　Tony Zhao（赵武阳）说过，互联网产品的一开始都是粗糙的，最后成功的都是坚持不断优化的。互联网产品如此，互联网营销亦如此。我觉得互联网经营的哲学其实只有一个&#8212;&#8212;持续优化。如果你不是想要赚快钱的（我相信做电子商务的精英们都不是想赚快钱的），那么持续优化一定能够促你成功。
　　网站分析是保证你是真的在做&#8220;优化&#8221;而不是&#8220;劣化&#8221;的武器，而且她是通过科学的方法来加快&#8220;优化&#8221;的进程。这又一次让我坚信她是如此重要的原因。
[版权归作者Sidney Song（宋星）所有，欢迎转载，但请事先告知作者并注明出处]
　　最后，附上一个网站分析的逻辑图，做为这次点石活动最后的分享。这个图说明了我为什么如此坚定的喜爱网站分析，因为她帮我们优化，更帮我们持续优化！

　　感谢点石，感谢上海的好朋友们，感谢所有来到我博客的朋友，感谢所有的互联网弄潮儿！
]]></description>
			<content:encoded><![CDATA[<p>　　上回我们讲了两个极具代表性的问题，对于上两个问题，我的总结是&mdash;&mdash;&ldquo;趋势、细分和转化&rdquo;是网站分析的最基本的思维方式，任何能够实现上面需求的工具都是好工具。而下面的两个问题，有如递进的序曲，把我们引向更深远的领域。</p>
<ul>
<li><strong>第三个问题：</strong></li>
</ul>
<p><strong><font color="#800080">　　这个问题是KK（沈维嘉）提出的。KK的公司是一家电子商务网站，这家网站在社交媒体（SNS）上做营销，用于传播自己公司的品牌和商品。通过SNS进行传播和营销活动在国内简直是一个崭新的领域，更不用说去监测效果了，应该如何监测效果呢？KK进一步问，除了SNS之外，其实很多营销活动是在网站之外的，如何衡量这些营销活动的效果呢？</font></strong></p>
<p><span id="more-1430"></span></p>
<p>　　这个问题涉及了很多前沿领域，是一个很难的题目，也是Avinash需要在<a href="http://www.chinawebanalytics.cn/?p=1327" target="_blank">《网站分析2.0》</a>中解决的题目。这个问题本身其实已经可以专门开一个帖子仔细解读，而且非常需要朋友们一起讨论。这里我谈谈我的看法，抛砖引玉。</p>
<p align="center"><font color="#828282">[版权归作者</font><a href="http://www.chinawebanalytics.cn/?author=1"><font color="#828282">Sidney Song</font></a><font color="#828282">（宋星）所有，欢迎转载，但请事先告知作者并注明出处]</font></p>
<p>　　我们一般认为，网站分析是用来解决网站自己的事情的，实则不然。对于网站的分析，可以是自己的网站，当然也可以是自己网站之外的别人的网站。我们曾经有一个帖子&ldquo;<a href="http://www.chinawebanalytics.cn/?p=542" target="_blank">如何衡量陌生网站的流量</a>&rdquo;就是对这个领域的讨论。如果我们把网站按照&ldquo;范围&rdquo;和&ldquo;功用&rdquo;两个维度来进行区分的话，我们可以得到下面的图：</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2009/12/image1.png"><img alt="image" border="0" height="313" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/12/image_thumb.png" style="border: 0px none ; margin: 10px 0px; display: inline;" title="image" width="391" /></a></p>
<p align="center">图：网站分析的监测对象</p>
<p>　　KK的这个问题属于上图中的左上角的范畴。这个范畴是目前中国互联网的&ldquo;类星体&rdquo;&mdash;&mdash;能量极为强大，运动速度极快，却最令人困惑的部分。我们应该如何衡量它呢？我觉得，这个问题取决于你利用社会化营销的思维和态度，一般而言，大家有两种态度：</p>
<p><strong><font color="#ff0000">1. 利用社会化营销创造/促进转化</font></strong></p>
<p>　　在左上角的范畴中除了SNS营销外，还有Twitter营销、社区营销、博客营销、口碑营销等等&hellip;&hellip;这一类五花八门的数字营销方法纷繁芜杂，但目的并没有任何本质变化，那就是&mdash;&mdash;<strong>通过扩大传播提升ROI</strong>。这一点对于电子商务网站尤其如此。因此，对它们的监测和分析，本质上还是可以回归到对<strong>流量来源及其转化</strong>的分析上。</p>
<p align="center"><font color="#828282">[版权归作者</font><a href="http://www.chinawebanalytics.cn/?author=1"><font color="#828282">Sidney Song</font></a><font color="#828282">（宋星）所有，欢迎转载，但请事先告知作者并注明出处]</font></p>
<p>　　而分析流量来源及其转化，这根本就是网站分析自诞生起就有的能力！</p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2009/12/image2.png"><img align="left" alt="image" border="0" height="267" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/12/image_thumb1.png" style="border: 0px none ; margin: 10px 10px 10px 0px; display: inline;" title="image" width="282" /></a></p>
<p>　　你要做的，是把你所做的社会化营销，尽量做细分，然后分配给每一个细分营销一个独一无二的标签，这样你就能衡量它们的转化如何，而且能够做很多的横向的比较。</p>
<p>　　举个例子，你在新浪微博上所发起的话题上有链接能直通你的某个产品页面：（<a href="http://www.chinawebanalytics.cn/">http://www.chinawebanalytics.cn/</a>），你可以给它一个参数，如&quot;?from=sinaweibo&quot;，即把这个链接变为：<a href="http://www.chinawebanalytics.cn/?from=sinaweibo">http://www.chinawebanalytics.cn/?from=sinaweibo</a>，网站分析工具就能辨识出哪些流量是来自新浪微博的了。当然如果你觉得细分的还不够，还想给你在新浪微博上每个发起的话题都加一个独一无二的参数，你也是可以做到的。具体的方法请见我之前的文章：<a href="http://www.chinawebanalytics.cn/?p=631">Direct Traffic真的是直接流量吗？如何辨识真正流量来源？</a></p>
<p>　　一旦你标记了这些源头，再通过对你的网站的监测数据来研究它们的流量质量和转化，你就能发现这些营销到底好不好&mdash;&mdash;这其实是最具有<strong>操作性</strong>的做法。而且，这些标记的一个巨大的好处在于：这些话题在传播的时候，标记也会随之传播，这样你能够知道归根结底是谁在做出贡献。例如，新浪微博上的这个话题被转到了开心网上，没关系，流量仍然会算作新浪微博的（不过，有时候这又是个麻烦，如果你希望被转帖到另外一个媒体的时候参数变成对应的社会化媒体，那就只能去掉这个参数然后听天由命了。大家有没有技术解决方法？）。</p>
<p>　　当然，不要忘了<strong>社会化营销的滞后性</strong>，多给它一点儿耐心是靠谱的。</p>
<p><strong><em><font color="#800080">　　但是，你肯定要说，这不是社会化营销的全部魅力。我们&mdash;&mdash;某种程度上，其实更希望通过社会化媒体帮我们造势，帮我们宣传品牌，帮我们创造好感和口碑，而这些或许不直接能够通过它们带来的流量的转化体现出来。</font></em></strong></p>
<p>　　如果你看到上面的这些描述之后提出斜体字的这个问题，我会说你真的了解互联网。当然，我相信每个朋友都会有这样的疑问，因为这就是你们对待社会化媒体的态度。这个疑问实际上可以简化为：我们如何衡量社会化营销的整体/综合效果？请继续阅读第2点。</p>
<p><strong><font color="#ff0000">2. 利用社会化媒体创造认知和偏好</font></strong></p>
<p>　　<a href="http://www.chinawebanalytics.cn/wp-content/uploads/2009/12/image3.png"><img align="right" alt="image" border="0" height="244" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/12/image_thumb2.png" style="border: 0px none ; margin: 10px 0px 10px 10px; display: inline;" title="image" width="240" /></a>很多大的企业（国外）已经在很多年前意识到社会化媒体的巨大影响力。Dell go to Hell是个好案例，最近的&ldquo;美联航摔坏了我的吉他&rdquo;也是个好案例。因此，社会化媒体的真正价值在于它的综合效用，即帮助品牌/产品创造更好的用户认知，乃至形成用户偏好。当然，它也能在瞬间起到反效果。</p>
<p>　　这是一个模糊的，难以控制的，却异常重要的领域。我们怎么衡量效果？</p>
<p>　　下面我将要回答这个问题的，是我的亲身经验，我认为具有参考价值，但我不认为我足够聪明，<strong>我希望你看完这个部分后提出你的见解</strong>。</p>
<p align="center"><font color="#828282">[版权归作者</font><a href="http://www.chinawebanalytics.cn/?author=1"><font color="#828282">Sidney Song</font></a><font color="#828282">（宋星）所有，欢迎转载，但请事先告知作者并注明出处]</font></p>
<p>　　我的亲身经验是分两步走：</p>
<ul>
<li>(1)衡量社会化媒体本身：</li>
</ul>
<p>　　衡量社会化媒体不是没有办法，同样也不是没有工具。这两个帖子（一个是我的，一个是Avinash的）一定能够帮助你，我觉得值得仔细研读：<a href="http://www.chinawebanalytics.cn/?p=177">Sidney的IWOM监测与分析：理解和实践</a>，<a href="http://www.kaushik.net/avinash/2009/11/social-media-analytics-twitter-quantitative-qualitative-analysis.html">Social Media Analytics: Twitter: Quantitative &amp; Qualitative Metrics</a>。</p>
<p>　　但是，这些还不够，为了衡量效果，我们需要利用<a href="http://en.wikipedia.org/wiki/Control_group" target="_blank">Control Group</a>的方法。即，给社会化媒体的一部分人（曝光组）群进行营销活动，而故意不给另外一部分人（控制组）进行营销活动，然后通过对比来衡量营销活动到底有没有促进认知和偏好。</p>
<p>　　虽然社会化媒体的本身具有的传播性，但一般而言，由于传播的滞后性，曝光组的总体曝光量会比控制组显著的大，因此你有足够的空间衡量区别。这本质上就是我常常提起的A/B test。</p>
<p>　　如何分组和定向？&mdash;&mdash;太容易了，因为你面对的是社会化媒体，里面有太全面的个人资料了。</p>
<ul>
<li>(2)衡量外部互联网：</li>
</ul>
<p>　　这个，你会觉得很难。但是，实际上并不是那么困难。我的客户K男，他就想到了一个绝妙的办法。</p>
<p>　　在做社会化营销的时候，你一定有一个跟别人独一无二的品牌、产品名称（或是产品昵称）或是代号什么的，它们都是被传播的对象。而通过搜索引擎的帮助（比如Google Search Insight）就能知道它们引发人们兴趣的情况到底如何。</p>
<p>　　还记得我翻译的Avinash的文章吗？<a href="http://www.chinawebanalytics.cn/?p=1227">Avinash：互联网品牌营销的监测和分析（上）</a>，<a href="http://www.chinawebanalytics.cn/?p=1319">Avinash：互联网品牌营销的监测和分析（下）</a>，这个时候真的可以派上用场哦！</p>
<p>　　除此之外，继续用IWOM监测外部互联网在谈些什么，这个会比间接的方法更为可靠。</p>
<p>　　当然，还有一个我最看重的方法，那就是做调研。我们大家都倾向于技术解决问题，而不是直接面对受众。但是我必须承认，所有间接的方法都不会比直接的方法更有效。调研很多时候其实不用花太多钱。把调研也放在SNS上传播吧，说不定会给你带来意想不到的收获。</p>
<p>　　说了很多，但是由于这个话题本身的复杂性和包容性，因此我相信大家仍会觉得言而未尽。我希望大家也能够有更多的输入，这个领域的确太新，却太重要了。</p>
<p align="center"><font color="#828282">[版权归作者</font><a href="http://www.chinawebanalytics.cn/?author=1"><font color="#828282">Sidney Song</font></a><font color="#828282">（宋星）所有，欢迎转载，但请事先告知作者并注明出处]</font></p>
<p>&nbsp;</p>
<ul>
<li><strong>第四个问题：</strong></li>
</ul>
<p><font color="#800080"><strong>　　一个做某一类很细分产品在线销售的企业主问，他很困惑要如何选择媒体投放广告&mdash;&mdash;由于他的产品的特殊性，他投放广告的媒体也是很细分的一些网站，这些网站的规模和名气都不大，而且他都不太了解这些网站，也不了解是否还有其他的网站值得投放广告。他的问题是：因为网站分析是滞后的，是事后的评判，而他很希望在事前就能选择正确的媒体投放，从而节省开支达到更好的效果。</strong></font></p>
<p>　　这是一个典型的问题。我完全理解这一类的需求，而且我相信这一类的需求非常强烈。我们不喜欢交学费，我们希望在事情没有开始之前就能预计到结果。</p>
<p>　　但是这本身其实是理想化的，至少目前来看是这样。但我相信在几年之内应该会有一个好的服务商出现，满足这类要求。</p>
<p>　　我的同事们也遇到了跟提问的朋友类似的情况，因为他们是广告的计划者，他们需要做出优化的广告投放方案。目前他们能够用上的方法还是有一些的，关于这一点，我的这个文章能够有一部分的帮助：<a href="http://www.chinawebanalytics.cn/?p=542">如何获知陌生网站的流量？</a>（这也是我最喜欢的文章之一），他们实际上是按照我的这篇文章所提示的方法在操作。</p>
<p>　　除此之外，我还建议应该问问这个圈子里面的朋友，他们有没有什么推荐的好媒体。坦率说网站分析的确不是来帮忙从大海中捞针的，网站分析在这个领域的重大意义在于&mdash;&mdash;给出方向。下面这个可行的方法就是一个典型的通过网站分析指出方向的例子。</p>
<p align="center"><font color="#828282">[版权归作者</font><a href="http://www.chinawebanalytics.cn/?author=1"><font color="#828282">Sidney Song</font></a><font color="#828282">（宋星）所有，欢迎转载，但请事先告知作者并注明出处]</font></p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2009/12/image4.png"><img align="left" alt="image" border="0" height="190" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/12/image_thumb3.png" style="border: 0px none ; margin: 10px 10px 10px 0px; display: inline;" title="image" width="260" /></a></p>
<ul>
<li><strong><font color="#ff0000">一个可行的方法：</font></strong></li>
</ul>
<p>　　如果你的网站运行了比较长的时间，而且你有同事可以做一些网站的分析（无论是用Google Analytics还是用Log File）的话，那么实际上你并不是两眼一抹黑的。</p>
<p>　　因为你可以看到来到你的网站上的流量（或至少部分流量）都是从哪里来的。如果你把流量源头做细分，然后研究他们的行为的话，那么一定能够发现有一些源头带来的流量要比另外一些更有效（比如有更好的转化，或者更多的engagement）。这个时候你就能发现一些值得投放的媒体了。</p>
<p>　　这不能解决全部问题，但better than nothing。</p>
<ul>
<li><span style="color: rgb(255, 0, 0);"><strong>真正有意义的思维应该是什么？&mdash;&mdash;持续优化！</strong></span></li>
</ul>
<p>　　不过，我真正想谈的不是上面的这个方法，而是这个问题本身所代表的一种误解&mdash;&mdash;没有网络营销经验之前就洞悉一切，然后一击必中。理论上这也许做得到，但在实践中，所有的成功的网络营销的案例都是来自于此前所积累起来的经验，是一个不断从经验和教训中学习提升的过程，极少有人第一次网络营销就很成功，而且一直保持成功的。</p>
<p>　　网络营销真的是摸着石头过河呢！而且你真的需要自己亲自摸，只是，你可以找一个过过河的朋友当向导，这样你可以摸得快一点儿。</p>
<p>　　我觉得，如果希望做一个长期的生意的话，最初的投入即使并没有达到预期效果，也是值得的。我们真的需要一开始就毫发误差，百发百中吗？我的印象中，SEO需要不断地尝试，它的策略是一个动态的过程，SEM也是。我必须说，对网络营销，尤其是对于广告媒体的选择和对于广告推广本身的策略&mdash;&mdash;也都需要尝试、投入、从不成功中发现成功，也是动态提升的过程。而在这个动态过程中，网站分析能够极好的帮助您了。因为你的尝试之后的效果评估、比较、从看似不是机会的情况中发现机会，都能通过网站分析带来。是的，狭义上的网站分析不能在&ldquo;第一次&rdquo;之前就告诉你答案，但是却可以在你的第二次、第三次&hellip;&hellip;以及每一次新的尝试之前告诉你答案&mdash;&mdash;什么可行，什么不可行，什么值得做新的尝试。</p>
<p>　　即使是你的&ldquo;第一次&rdquo;，也并不是让你去瞎碰，你会有你自己的想法，也有朋友的推荐，还有一些基本的尝试在帮助你。你肯定不是没有策略的，但千万别苛求自己&ldquo;不能出一点儿偏差&rdquo;。在你研究选定了几家投放媒体之后，就大胆地做一次的尝试吧！此后的工作，交给网站分析吧&mdash;&mdash;她能够帮你发现这些媒体哪些是你真正需要的，哪些其实只是徒有虚名。</p>
<p>　　Tony Zhao（赵武阳）说过，互联网产品的一开始都是粗糙的，最后成功的都是坚持不断优化的。互联网产品如此，互联网营销亦如此。我觉得互联网经营的哲学其实只有一个&mdash;&mdash;持续优化。如果你不是想要赚快钱的（我相信做电子商务的精英们都不是想赚快钱的），那么持续优化一定能够促你成功。</p>
<p>　　网站分析是保证你是真的在做&ldquo;优化&rdquo;而不是&ldquo;劣化&rdquo;的武器，而且她是通过科学的方法来加快&ldquo;优化&rdquo;的进程。这又一次让我坚信她是如此重要的原因。</p>
<p align="center"><font color="#828282">[版权归作者</font><a href="http://www.chinawebanalytics.cn/?author=1"><font color="#828282">Sidney Song</font></a><font color="#828282">（宋星）所有，欢迎转载，但请事先告知作者并注明出处]</font></p>
<p>　　最后，附上一个网站分析的逻辑图，做为这次点石活动最后的分享。这个图说明了我为什么如此坚定的喜爱网站分析，因为她帮我们优化，更帮我们持续优化！</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2009/12/image5.png"><img alt="image" border="0" height="334" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/12/image_thumb4.png" style="border: 0px none ; margin: 10px 0px; display: inline;" title="image" width="523" /></a></p>
<p>　　感谢点石，感谢上海的好朋友们，感谢所有来到我博客的朋友，感谢所有的互联网弄潮儿！</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e6%84%8f%e4%b9%89%e9%87%8d%e5%a4%a7%e2%80%94%e2%80%94%e7%ad%94%e7%82%b9%e7%9f%b3%e5%a4%a7%e4%bc%9a%e6%9c%8b%e5%8f%8b%e6%8f%90%e9%97%ae%ef%bc%88%e4%b8%8b%ef%bc%89/feed/</wfw:commentRss>
		<slash:comments>11</slash:comments>
		</item>
		<item>
		<title>网站分析意义重大——答点石大会朋友提问（上）</title>
		<link>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e9%87%8d%e5%a4%a7%e6%84%8f%e4%b9%89%e2%80%94%e2%80%94%e7%ad%94%e7%82%b9%e7%9f%b3%e5%a4%a7%e4%bc%9a%e5%90%ac%e4%bc%97%e6%8f%90%e9%97%ae%ef%bc%88%e4%b8%8a/</link>
		<comments>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e9%87%8d%e5%a4%a7%e6%84%8f%e4%b9%89%e2%80%94%e2%80%94%e7%ad%94%e7%82%b9%e7%9f%b3%e5%a4%a7%e4%bc%9a%e5%90%ac%e4%bc%97%e6%8f%90%e9%97%ae%ef%bc%88%e4%b8%8a/#comments</comments>
		<pubDate>Mon, 30 Nov 2009 14:11:30 +0000</pubDate>
		<dc:creator>Sidney Song</dc:creator>
				<category><![CDATA[Featured]]></category>
		<category><![CDATA[Headline]]></category>
		<category><![CDATA[网站分析经验分享]]></category>

		<guid isPermaLink="false">http://www.chinawebanalytics.cn/?p=1359</guid>
		<description><![CDATA[　　得悉11月28日的点石大会已经是11月25日，已经错过了最后报名期限好几天，但还是冒昧的询问Robin（柳焕斌）有没有机会。出乎意料的是，Robin和点石团队不仅同意了我的请求，而且邀请我作为嘉宾参会，甚至还完全负担了我的往返机票！首先要把真诚的感谢完全捧给他们。
　　会议的气氛一直很热烈，Dave（郑海平）身体不适，但是还是给大家带来了非常精彩且极有价值的演讲。在作为嘉宾的环节的网站分析部分中，我和其他的嘉宾（Heaven吴庆，Owen林和平，郭敏）一共回答了听众的四个问题。而这四个问题都非常经典，具有代表性，我迫切的要跟朋友们分享。不过，每个问题回答起来都不是那么简单，我准备分成上下两个文章连载，请亲爱的童鞋们看完这篇后耐心等候下篇。&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;我是分页符（点击文章标题查看全部内容）&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;


第一个问题：

　　一位做电子商务网站的前排朋友提出，他也常常看数据，但是数据只是数据，有没有什么方法能够从数据中发现点儿什么，以进一步能够帮助到他的生意。他进一步问，网站分析有没有一些模型和方法是可以直接使用的？
　　这个问题简直太棒了。这是很多网站所有者的共同心声&#8212;&#8212;我们需要数据，可是数据有了，我们该怎么办？而，这也是网站分析的价值和作用所在！
　　我一直坚持认为，工具很重要，但是使用工具的头脑更重要。为了让工具发挥它应有的价值，我们应该掌握一些最基本的思维方法&#8212;&#8212;方法的确是存在的。那就是右图所表示的。这个图如此简单，但却如此深刻，我甚至视之如网站分析中的阴阳太极图。没错，我们拿到数据之后要做三件永恒的事情&#8212;&#8212;查看趋势，查看细分情况，以及查看转化。然后，我们要把这三者两两结合起来，查看细分的趋势、细分的转化，以及查看转化的趋势。看起来只不过是6种情况，但实际应用中则千变万化，而且能够告诉我们很多有价值的信息。有了这个图，按照这个思维模式进行操作，网站分析真的能够帮到生意。
[版权归译者Sidney Song（宋星）所有，欢迎转载，但请事先告知作者并注明出处]
　　举个例子，电子商务最关心的是商品的销售，核心在于商品本身。那么通过网站分析，利用细分的转化方法，我们能够知道本来或许没有察觉到的商品的一些特别属性。具体的做法是，把商品按照两个维度&#8212;&#8212;商品被关注量（通过网站分析工具就能轻松获得）和商品的销售转化情况（即销量和关注量的比值，通过电子商务后台和网站分析工具能算出）进行细分。简单的计算之后，我们就可以得到一个下面的图：

　　得到这个图完全不需要复杂的数学计算，而且你只需要使用网站分析工具的一个度量&#8212;&#8212;产品页面的Page View，就能得到这个图。但是这个图给我们带来的价值却是巨大的。
　　对于右上象限&#8212;&#8212;高销售转化和高关注度的商品，当然，保持现状即可，甚至适当给它们来点儿促销，以进一步刺激销售。
　　对于右下象限&#8212;&#8212;关注度不足，但是销售转化却好的商品，显然是一些潜在的盈利增长点。有了这个情况，你可以立即着手做两件事情：1. 立即研究它们为什么能有如此好的转化，是不是因为一些没有关注到的因素起到了作用&#8212;&#8212;大家都知道这种情况是经常发生的；2. 立即给这些低关注度的商品更多的曝光机会，使他们能够升高关注度，进入明星产品（右上象限）之列。
　　对于左上象限&#8212;&#8212;关注度高但销售转化不佳的商品，显然说明存在交易促成动力不足的问题，产品经理应该立即着手研究如何促成销售的转化&#8212;&#8212;是购物车的问题，还是支付不方便，还是竞争对手的价格更具吸引力，还是促销优惠不够？等等等等。这个象限和前面那个象限（右下象限）一样，都是能大有作为的地方。
　　最后的这个左下角象限&#8212;&#8212;是大家都不喜欢的，既没有人关注，销售情况也不理想。那么，看看有没有机会增加曝光，或者来点儿促销？要么，少进点儿货吧。如果是撇脂型的商品，就让它呆哪儿也无妨。
　　是不是有点儿意思了？其实只是这么简单的两个度量&#8212;&#8212;Page View和销售量，就能告诉我们这么多策略性的东西。这就是转化和细分的力量。
　　如果我们再加上一个度量，就是图中圆饼的大小&#8212;&#8212;商品价格，那么能够告诉我们的信息就更多了。图中，最左下角的商品价格最高，那么，是不是价格是让它沉沦的重要因素？&#8212;&#8212;值得产品经理好好深挖一番。
　　同样，趋势也能够给我们很多的故事和发现。我准备留到我的第一次博友会的时候跟大家分享。敬请期待哦！
[版权归译者Sidney Song（宋星）所有，欢迎转载，但请事先告知作者并注明出处]
&#160;

第二个问题：

　　这个问题是一个做SEM推广的电子商务网站的朋友提出的。故事是这样：他的网站通过SEM吸引流量，然后网站上有400免费电话，用来接受销售意向（Leads）；但是他发现自己的SEM特别贵，而最终生成的Leads的转化又特别不理想&#8212;&#8212;花了很多钱，实际上效果不佳。他想问网站分析是否能够帮助他。
　　经典问题，我禁不住要赞扬这位仁兄！这不正是我们每天扪心自问的另一个问题吗？
　　我的回答是：网站分析太能帮助你了！
　　当然，你的问题实际上已经不是一个问题了，我们需要多种方法齐上阵。
　　首先，这个网站投放了SEM，但很贵，因此也要解决SEM投资回报（ROI）的问题。
　　其次，这个网站的根本在于转化。那么这是要解决流量转化率不佳的问题了。
　　最后，SEM的策略和最终的转化有没有关系？实际上是前两个问题的交集。
　　你看，这样一个问题，实际上是三个经典的情境，多棒啊！那么我们也一个一个的回答。
[版权归译者Sidney Song（宋星）所有，欢迎转载，但请事先告知作者并注明出处]
I.
　　很多很多网站花钱做SEM，你们怎么衡量SEM的效果？按照点击通过率（CTR）对吗？事实上，CTR很重要，但是只是若干转化的第一步而已。我们还有业界常说的二跳，三跳&#8230;&#8230;以及n跳。有了这些跳，我们可以算出每一个SEM关键词在跳的过程中的转化情况，然后衡量哪个关键词跳的足够好，而哪些跳不动。相信这个方法很多朋友都已经用了。
　　另外一个模型是，你可以通过完成关键跳转（转化）率的成本来衡量不同关键词的效果。例如，同样是跳到第三跳，A关键词3元每个，B关键词10元每个，一般而言，你知道该多投哪个关键词了。
 　　当然，SEM本身已经是一门专业，如何选择关键词，如何确定投放策略是有很多技巧和学问的。我不是这个领域的专家，大家可以请教Tony（缪晨卿）。但是，我要说，网站分析绝对能够帮你了解每个关键词背后实际的效果到底怎么样。这其实是Google为什么推出Google Analytics，以及百度为什么祭出百度统计的根本原因&#8212;&#8212;就是要让你心知肚明你花的钱到底效果怎样，让你花钱花个踏实。
　　知道了效果怎样，你就能针对性的投放，这不就是省钱了吗？这不就是提高了ROI吗？从这个角度看，网站分析可是直接帮你把钱花在刀刃上的。
II.
　　接着，你的问题是转化不佳，SEM来的流量普遍存在&#8220;跳不下去&#8221;的问题。
　　这真是经典问题啊。
　　跳不下去就是转化不佳。转化不佳通常是由下面的原因引起的（请注意，第一个原因特别值得关注）：
　　1. 关键词（或者广告创意内容）和登陆页面不匹配。
　　实在是太常见了。白鸦甚至在接下来的会议中不谋而合的直接给出了一个现实中随手拿出来的例子。
　　关键词说，&#8220;我这里有折扣商品&#8221;，可是登陆到页面之后，只是普通的商城的首页，也看不到折扣商品在哪里&#8212;&#8212;然后访问者生气失望的立即走掉。发生这种情况的原因是，购买关键词的时候，只注意到要吸引访问者来，却忽略了他们其实是会&#8220;走&#8221;的。
　　千万不要让访问者（每一个都是你的潜在客户）失望。匹配，一定要记得匹配！！
　　解决这个问题的方法很多。一种是，干嘛不把这个关键词的登陆页设置为你的促销页？这不是一举两得吗？要么，你就把关键词改改，改成你登陆页上能够吸引人的元素的内容。
　　如何发现这种不匹配的存在？有时候当然一眼就看出来（期望不匹配的情况），有时候也不是那么容易的（逻辑不匹配的情况）。我的建议是，用Bounce Rate的值衡量登陆页的用户&#8220;生气、失望&#8221;情况，然后再具体查明是不是发生了不匹配，还是其他的原因（下面马上就讲）。Bounce Rate又是一个极为简单，且几乎每种网站分析工具都会提供的度量。
[版权归译者Sidney Song（宋星）所有，欢迎转载，但请事先告知作者并注明出处]
　　2. 关键转化页面设计不合理，不清晰，不易用。
　　同样是太常见的问题了。
　　每个页面都美轮美奂？可惜，访问者不清楚下一步该做什么。最典型的例子发生在登陆页上&#8212;&#8212;没有清晰的指示，没有Call to action，没有导航&#8230;&#8230;等等等等。这也会造成Bounce Rate很高，即使你的登陆页内容和投放的关键词（或者广告）的内容是匹配的。
　　关键页面指转化过程中必经的节点页面，比如加入购物车，支付页面，订单页面等等。这些关键页面设计的好坏，对于网站的最终转化都太重要了。
　　使用网站分析工具的Pathing工具，Funnel工具或者使用Next Page Flow工具，都能够告诉我们上面所需要的页面与页面的转化信息。网站分析工具上的方法和报告都很多，目的都一样，都是为了完成我们上面说的&#8220;转化&#8221;方法。这些工具的作用在于帮助你发现什么地方出现了转化障碍，也就是我们说的leak point（露点的地方在哪里，哈哈:)），然后看看UCD China的文章，学习下应该怎么样更合理的设计页面，以弥补泄漏吧！
　　3. 网站转化逻辑不合理。
 　　每个网站设计师都对自己的每个网页爱不释手，可是真正的产品设计师却会更关注宏观的结构。
　　宏观结构不合理，每个页面再合理，又有什么用！
　　比如说，本来能够5步干成的事情，非要把每步拆分成2步，结果搞出10步来，访问者会失去耐心。本来主流程就能很好的完成任务，偏要安放一些干扰的支线流程，结果让访问者如入迷宫。逻辑上用户期待的下一步和实际的下一步不匹配，等等等等&#8212;&#8212;唉，太多了。这些情况真不该发生。
　　会上白鸦举了个例子，大家都乐了。卓越网从确定商品到最终付款，足足要20多个页面才能完成！我们做网站分析都知道，没多一个环节，就会多一些流失。20个页面才能够完成的订购任务，有这个必要吗？
　　白鸦强调&#8212;&#8212;只把最关键的流程留给最关键的任务，留住客户是第一位的，其他的妨碍统统丢掉！我想到一个词：奥卡姆的剃刀。
　　如何识别这种情况？通常我们会用可用性测试（Usability Test）来发现这些问题。网站分析当然能够帮忙&#8212;&#8212;同样是Pathing报告。如果逻辑结构不合理，访问者的Pathing会比较迷乱，泄漏点也比较分散。如果有这两种特征，那么说明网站结构本身存在问题的可能性很大。
[版权归译者Sidney Song（宋星）所有，欢迎转载，但请事先告知作者并注明出处]
　　如果你的网站是这样，该是请一个专业的产品设计师的时候了。
III.
　　最后，你的问题是SEM的策略和最终转化有没有关系。
　　当然有，前面已经回答了&#8212;&#8212;要匹配。但是，SEM的策略并不一定决定最终的转化，因为（我下面说的话极为重要）&#8212;&#8212;SEM决定了网站是否能够获得足够的目标流量，但这些目标流量能不能按照你的期望实现你的目的，决定于你的网站的力量。
　　如何让你的网站具有力量？&#8212;&#8212;你必须分析你的网站上流量的行为，通过行为判断他们的兴趣、期望、生气乃至失望；你也必须通过测试你在网站上所做的设计（或是手脚），以观看访问者有没有能够按照你的期望行事（甚至是掉入你设置的圈套）。
　　你有了网站分析，你才有了潜望镜、雷达和声纳，不然你就是一直在深海中潜伏&#8212;&#8212;反正海很大很深，我可以横冲直撞，直到触礁。或是，反过来，你能够朝着你既定的目标行驶。
　　你有了网站分析，你才知道你应该如何设计&#8212;&#8212;因为是实际的访问者在给你指导，他们在告诉你怎样做才是正确的。&#8212;&#8212;这个意义难道还不够重大吗？
　　最后，看了我的这上半部分文章你也可以总结出来&#8212;&#8212;原来网站分析前接SEM（互联网推广），后接产品设计（UCD），它的用武之地原来如此之广！
　　该是重视她的时候了。
[版权归译者Sidney Song（宋星）所有，欢迎转载，但请事先告知作者并注明出处]
【上篇完】
&#160;
　　大家有任何建议，问题，指正以及观点，请随意留言。只是一家之言，期待与大家的思维碰撞。
　　最后插播一个广告&#8212;&#8212;招聘启事：招聘SEO专业人才！
1、掌握SEO技术，对Baidu、Googl等搜索引擎的排名机制十分了解，善于对网站排名数据的跟踪总结。
2、具有一定的互联网资源。
3、对新技术有浓厚的兴趣和快速的学习能力，有良好的团队合作精神。
4、无学历要求，具备在多年以上实际操作经验，有成功案例者优先。
有意者请发email至：dengalu@gmail.com
]]></description>
			<content:encoded><![CDATA[<p>　　得悉11月28日的点石大会已经是11月25日，已经错过了最后报名期限好几天，但还是冒昧的询问Robin（柳焕斌）有没有机会。出乎意料的是，Robin和点石团队不仅同意了我的请求，而且邀请我作为嘉宾参会，甚至还完全负担了我的往返机票！首先要把真诚的感谢完全捧给他们。</p>
<p>　　会议的气氛一直很热烈，<a href="http://hi.baidu.com/hpzheng1982">Dave（郑海平）</a>身体不适，但是还是给大家带来了非常精彩且极有价值的演讲。在作为嘉宾的环节的网站分析部分中，我和其他的嘉宾（Heaven吴庆，Owen林和平，<a href="http://www.shanghaiwebanalytics.com/">郭敏</a>）一共回答了听众的四个问题。而这四个问题都非常经典，具有代表性，我迫切的要跟朋友们分享。不过，每个问题回答起来都不是那么简单，我准备分成上下两个文章连载，请亲爱的童鞋们看完这篇后耐心等候下篇。<font color="#800080"><strong>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;我是分页符（点击文章标题查看全部内容）&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;</strong></font></p>
<p><span id="more-1359"></span></p>
<ul>
<li><strong>第一个问题：</strong></li>
</ul>
<p><font color="#800080"><strong>　　一位做电子商务网站的前排朋友提出，他也常常看数据，但是数据只是数据，有没有什么方法能够从数据中发现点儿什么，以进一步能够帮助到他的生意。他进一步问，网站分析有没有一些模型和方法是可以直接使用的？</strong></font></p>
<p>　　这个问题简直太棒了。这是很多网站所有者的共同心声&mdash;&mdash;我们需要数据，可是数据有了，我们该怎么办？而，这也是网站分析的价值和作用所在！</p>
<p>　　<a href="http://www.chinawebanalytics.cn/wp-content/uploads/2009/11/image5.png"><img align="right" alt="image" border="0" height="199" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/11/image_thumb6.png" style="border: 0px none ; margin: 5px 5px 5px 10px; display: inline;" title="image" width="258" /></a>我一直坚持认为，工具很重要，但是使用工具的头脑更重要。为了让工具发挥它应有的价值，我们应该掌握一些最基本的思维方法&mdash;&mdash;方法的确是存在的。那就是右图所表示的。这个图如此简单，但却如此深刻，我甚至视之如网站分析中的阴阳太极图。没错，我们拿到数据之后要做三件永恒的事情&mdash;&mdash;<strong>查看趋势，查看细分情况，以及查看转化</strong>。然后，我们要把这三者两两结合起来，<strong>查看细分的趋势、细分的转化，以及查看转化的趋势</strong>。看起来只不过是6种情况，但实际应用中则千变万化，而且能够告诉我们很多有价值的信息。有了这个图，按照这个思维模式进行操作，网站分析真的能够帮到生意。</p>
<p align="center"><font color="#828282">[版权归译者</font><a href="http://www.chinawebanalytics.cn/?author=1"><font color="#828282">Sidney Song</font></a><font color="#828282">（宋星）所有，欢迎转载，但请事先告知作者并注明出处]</font></p>
<p>　　举个例子，电子商务最关心的是商品的销售，核心在于商品本身。那么通过网站分析，利用细分的转化方法，我们能够知道本来或许没有察觉到的商品的一些特别属性。具体的做法是，把商品按照两个维度&mdash;&mdash;商品被关注量（通过网站分析工具就能轻松获得）和商品的销售<strong>转化</strong>情况（即销量和关注量的比值，通过电子商务后台和网站分析工具能算出）进行细分。简单的计算之后，我们就可以得到一个下面的图：</p>
<p align="center"><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2009/11/image6.png"><img alt="image" border="0" height="327" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/11/image_thumb7.png" style="border: 0px none ; margin: 5px; display: inline;" title="image" width="434" /></a></p>
<p>　　得到这个图完全不需要复杂的数学计算，而且你只需要使用网站分析工具的一个度量&mdash;&mdash;产品页面的Page View，就能得到这个图。但是这个图给我们带来的价值却是巨大的。</p>
<p>　　对于右上象限&mdash;&mdash;高销售转化和高关注度的商品，当然，保持现状即可，甚至适当给它们来点儿促销，以进一步刺激销售。</p>
<p>　　对于右下象限&mdash;&mdash;关注度不足，但是销售转化却好的商品，显然是一些潜在的盈利增长点。有了这个情况，你可以立即着手做两件事情：1. 立即研究它们为什么能有如此好的转化，是不是因为一些没有关注到的因素起到了作用&mdash;&mdash;大家都知道这种情况是经常发生的；2. 立即给这些低关注度的商品更多的曝光机会，使他们能够升高关注度，进入明星产品（右上象限）之列。</p>
<p>　　对于左上象限&mdash;&mdash;关注度高但销售转化不佳的商品，显然说明存在交易促成动力不足的问题，产品经理应该立即着手研究如何促成销售的转化&mdash;&mdash;是购物车的问题，还是支付不方便，还是竞争对手的价格更具吸引力，还是促销优惠不够？等等等等。这个象限和前面那个象限（右下象限）一样，都是能大有作为的地方。</p>
<p>　　最后的这个左下角象限&mdash;&mdash;是大家都不喜欢的，既没有人关注，销售情况也不理想。那么，看看有没有机会增加曝光，或者来点儿促销？要么，少进点儿货吧。如果是撇脂型的商品，就让它呆哪儿也无妨。</p>
<p>　　是不是有点儿意思了？其实只是这么简单的两个度量&mdash;&mdash;Page View和销售量，就能告诉我们这么多策略性的东西。这就是转化和细分的力量。</p>
<p><strong>　　如果我们再加上一个度量</strong>，就是图中圆饼的大小&mdash;&mdash;商品价格，那么能够告诉我们的信息就更多了。图中，最左下角的商品价格最高，那么，是不是价格是让它沉沦的重要因素？&mdash;&mdash;值得产品经理好好深挖一番。</p>
<p>　　同样，趋势也能够给我们很多的故事和发现。我准备留到我的第一次博友会的时候跟大家分享。敬请期待哦！</p>
<p align="center"><font color="#828282">[版权归译者</font><a href="http://www.chinawebanalytics.cn/?author=1"><font color="#828282">Sidney Song</font></a><font color="#828282">（宋星）所有，欢迎转载，但请事先告知作者并注明出处]</font></p>
<p align="center">&nbsp;</p>
<ul>
<li><strong>第二个问题：</strong></li>
</ul>
<p><strong><font color="#800080">　　这个问题是一个做SEM推广的电子商务网站的朋友提出的。故事是这样：他的网站通过SEM吸引流量，然后网站上有400免费电话，用来接受销售意向（Leads）；但是他发现自己的SEM特别贵，而最终生成的Leads的转化又特别不理想&mdash;&mdash;花了很多钱，实际上效果不佳。他想问网站分析是否能够帮助他。</font></strong></p>
<p>　　经典问题，我禁不住要赞扬这位仁兄！这不正是我们每天扪心自问的另一个问题吗？</p>
<p><strong><font color="#ff0000">　　我的回答是：网站分析太能帮助你了！</font></strong></p>
<p>　　当然，你的问题实际上已经不是一个问题了，我们需要多种方法齐上阵。</p>
<p>　　首先，这个网站投放了SEM，但很贵，因此也要解决SEM投资回报（ROI）的问题。</p>
<p>　　其次，这个网站的根本在于转化。那么这是要解决流量转化率不佳的问题了。</p>
<p>　　最后，SEM的策略和最终的转化有没有关系？实际上是前两个问题的交集。</p>
<p>　　你看，这样一个问题，实际上是三个经典的情境，多棒啊！那么我们也一个一个的回答。</p>
<p align="center"><font color="#828282">[版权归译者</font><a href="http://www.chinawebanalytics.cn/?author=1"><font color="#828282">Sidney Song</font></a><font color="#828282">（宋星）所有，欢迎转载，但请事先告知作者并注明出处]</font></p>
<p><strong><font color="#ff0000">I.</font></strong></p>
<p>　　很多很多网站花钱做SEM，你们怎么衡量SEM的效果？按照点击通过率（CTR）对吗？事实上，CTR很重要，但是只是若干转化的第一步而已。我们还有业界常说的二跳，三跳&hellip;&hellip;以及n跳。有了这些跳，我们可以算出每一个SEM关键词在跳的过程中的转化情况，然后衡量哪个关键词跳的足够好，而哪些跳不动。相信这个方法很多朋友都已经用了。</p>
<p>　　另外一个模型是，你可以通过完成关键跳转（转化）率的成本来衡量不同关键词的效果。例如，同样是跳到第三跳，A关键词3元每个，B关键词10元每个，一般而言，你知道该多投哪个关键词了。</p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2009/11/searchengineoptimization.jpg"><img align="right" alt="search-engine-optimization" border="0" height="250" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/11/searchengineoptimization_thumb.jpg" style="border: 0px none ; margin: 5px 5px 5px 10px; display: inline;" title="search-engine-optimization" width="182" /></a> 　　当然，SEM本身已经是一门专业，如何选择关键词，如何确定投放策略是有很多技巧和学问的。我不是这个领域的专家，大家可以请教Tony（缪晨卿）。但是，我要说，网站分析绝对能够帮你了解每个关键词背后实际的效果到底怎么样。这其实是Google为什么推出Google Analytics，以及百度为什么祭出百度统计的根本原因&mdash;&mdash;就是要让你心知肚明你花的钱到底效果怎样，让你花钱花个踏实。</p>
<p>　　知道了效果怎样，你就能针对性的投放，这不就是省钱了吗？这不就是提高了ROI吗？从这个角度看，网站分析可是直接帮你把钱花在刀刃上的。</p>
<p><strong><font color="#ff0000">II.</font></strong></p>
<p>　　接着，你的问题是转化不佳，SEM来的流量普遍存在&ldquo;跳不下去&rdquo;的问题。</p>
<p>　　这真是经典问题啊。</p>
<p>　　跳不下去就是转化不佳。转化不佳通常是由下面的原因引起的（请注意，第一个原因特别值得关注）：</p>
<p><strong><font color="#0000ff">　　1. 关键词（或者广告创意内容）和登陆页面不匹配。</font></strong></p>
<p>　　实在是太常见了。<a href="http://uicom.net/blog/" target="_blank">白鸦</a>甚至在接下来的会议中不谋而合的直接给出了一个现实中随手拿出来的例子。</p>
<p>　　关键词说，&ldquo;我这里有折扣商品&rdquo;，可是登陆到页面之后，只是普通的商城的首页，也看不到折扣商品在哪里&mdash;&mdash;然后访问者生气失望的立即走掉。发生这种情况的原因是，购买关键词的时候，只注意到要吸引访问者来，却忽略了他们其实是会&ldquo;走&rdquo;的。</p>
<p>　　千万不要让访问者（每一个都是你的潜在客户）失望。匹配，一定要记得匹配！！</p>
<p>　　解决这个问题的方法很多。一种是，干嘛不把这个关键词的登陆页设置为你的促销页？这不是一举两得吗？要么，你就把关键词改改，改成你登陆页上能够吸引人的元素的内容。</p>
<p>　　如何发现这种不匹配的存在？有时候当然一眼就看出来（期望不匹配的情况），有时候也不是那么容易的（逻辑不匹配的情况）。<strong>我的建议是，用Bounce Rate的值衡量登陆页的用户&ldquo;生气、失望&rdquo;情况，然后再具体查明是不是发生了不匹配</strong>，还是其他的原因（下面马上就讲）。Bounce Rate又是一个极为简单，且几乎每种网站分析工具都会提供的度量。</p>
<p align="center"><font color="#828282">[版权归译者</font><a href="http://www.chinawebanalytics.cn/?author=1"><font color="#828282">Sidney Song</font></a><font color="#828282">（宋星）所有，欢迎转载，但请事先告知作者并注明出处]</font></p>
<p><strong><font color="#0000ff">　　2. 关键转化页面设计不合理，不清晰，不易用。</font></strong></p>
<p>　　同样是太常见的问题了。</p>
<p>　　每个页面都美轮美奂？可惜，访问者不清楚下一步该做什么。最典型的例子发生在登陆页上&mdash;&mdash;没有清晰的指示，没有Call to action，没有导航&hellip;&hellip;等等等等。这也会造成Bounce Rate很高，即使你的登陆页内容和投放的关键词（或者广告）的内容是匹配的。</p>
<p>　　关键页面指转化过程中必经的节点页面，比如加入购物车，支付页面，订单页面等等。这些关键页面设计的好坏，对于网站的最终转化都太重要了。</p>
<p>　　使用网站分析工具的Pathing工具，Funnel工具或者使用Next Page Flow工具，都能够告诉我们上面所需要的页面与页面的转化信息。网站分析工具上的方法和报告都很多，目的都一样，都是为了完成我们上面说的&ldquo;<strong>转化</strong>&rdquo;方法。这些工具的作用在于帮助你发现什么地方出现了转化障碍，也就是我们说的leak point（露点的地方在哪里，哈哈:)），然后看看<a href="http://ucdchina.com/" target="_blank">UCD China</a>的文章，学习下应该怎么样更合理的设计页面，以弥补泄漏吧！</p>
<p><strong><font color="#0000ff">　　3. 网站转化逻辑不合理。</font></strong></p>
<p><a href="http://www.chinawebanalytics.cn/wp-content/uploads/2009/11/ConversionRateOptimizationFunnel.jpg"><img align="left" alt="Conversion-Rate-Optimization-Funnel" border="0" height="248" src="http://www.chinawebanalytics.cn/wp-content/uploads/2009/11/ConversionRateOptimizationFunnel_thumb.jpg" style="border: 0px none ; margin: 5px 10px 5px 5px; display: inline;" title="Conversion-Rate-Optimization-Funnel" width="361" /></a> 　　每个网站设计师都对自己的每个网页爱不释手，可是真正的产品设计师却会更关注宏观的结构。</p>
<p>　　宏观结构不合理，每个页面再合理，又有什么用！</p>
<p>　　比如说，本来能够5步干成的事情，非要把每步拆分成2步，结果搞出10步来，访问者会失去耐心。本来主流程就能很好的完成任务，偏要安放一些干扰的支线流程，结果让访问者如入迷宫。逻辑上用户期待的下一步和实际的下一步不匹配，等等等等&mdash;&mdash;唉，太多了。这些情况真不该发生。</p>
<p>　　会上白鸦举了个例子，大家都乐了。卓越网从确定商品到最终付款，足足要20多个页面才能完成！我们做网站分析都知道，没多一个环节，就会多一些流失。20个页面才能够完成的订购任务，有这个必要吗？</p>
<p>　　白鸦强调&mdash;&mdash;只把最关键的流程留给最关键的任务，留住客户是第一位的，其他的妨碍统统丢掉！我想到一个词：奥卡姆的剃刀。</p>
<p>　　如何识别这种情况？通常我们会用可用性测试（Usability Test）来发现这些问题。网站分析当然能够帮忙&mdash;&mdash;同样是Pathing报告。如果逻辑结构不合理，访问者的Pathing会比较迷乱，泄漏点也比较分散。如果有这两种特征，那么说明网站结构本身存在问题的可能性很大。</p>
<p align="center"><font color="#828282">[版权归译者</font><a href="http://www.chinawebanalytics.cn/?author=1"><font color="#828282">Sidney Song</font></a><font color="#828282">（宋星）所有，欢迎转载，但请事先告知作者并注明出处]</font></p>
<p>　　如果你的网站是这样，该是请一个专业的产品设计师的时候了。</p>
<p><strong><font color="#ff0000">III.</font></strong></p>
<p>　　最后，你的问题是SEM的策略和最终转化有没有关系。</p>
<p>　　当然有，前面已经回答了&mdash;&mdash;要匹配。但是，SEM的策略并不一定决定最终的转化，因为（我下面说的话极为重要）&mdash;&mdash;SEM决定了网站是否能够获得足够的目标流量，但这些目标流量能不能按照你的期望实现你的目的，决定于你的网站的力量。</p>
<p><strong>　　如何让你的网站具有力量？&mdash;&mdash;你必须分析你的网站上流量的行为，通过行为判断他们的兴趣、期望、生气乃至失望；你也必须通过测试你在网站上所做的设计（或是手脚），以观看访问者有没有能够按照你的期望行事（甚至是掉入你设置的圈套）。</strong></p>
<p>　　你有了网站分析，你才有了潜望镜、雷达和声纳，不然你就是一直在深海中潜伏&mdash;&mdash;反正海很大很深，我可以横冲直撞，直到触礁。或是，反过来，你能够朝着你既定的目标行驶。</p>
<p>　　你有了网站分析，你才知道你应该如何设计&mdash;&mdash;因为是实际的访问者在给你指导，他们在告诉你怎样做才是正确的。&mdash;&mdash;这个意义难道还不够重大吗？</p>
<p>　　最后，看了我的这上半部分文章你也可以总结出来&mdash;&mdash;原来网站分析前接SEM（互联网推广），后接产品设计（UCD），它的用武之地原来如此之广！</p>
<p><span style="color: rgb(255, 0, 0);"><strong>　　该是重视她的时候了。</strong></span></p>
<p align="center"><font color="#828282">[版权归译者</font><a href="http://www.chinawebanalytics.cn/?author=1"><font color="#828282">Sidney Song</font></a><font color="#828282">（宋星）所有，欢迎转载，但请事先告知作者并注明出处]</font></p>
<p align="right">【上篇完】</p>
<p>&nbsp;</p>
<p>　　大家有任何建议，问题，指正以及观点，请随意留言。只是一家之言，期待与大家的思维碰撞。</p>
<p>　　最后插播一个广告&mdash;&mdash;招聘启事：<strong><span style="color: rgb(255, 0, 0);">招聘SEO专业人才！</span></strong></p>
<p>1、掌握SEO技术，对Baidu、Googl等搜索引擎的排名机制十分了解，善于对网站排名数据的跟踪总结。</p>
<p>2、具有一定的互联网资源。</p>
<p>3、对新技术有浓厚的兴趣和快速的学习能力，有良好的团队合作精神。</p>
<p>4、无学历要求，具备在多年以上实际操作经验，有成功案例者优先。</p>
<p>有意者请发email至：dengalu@gmail.com</p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinawebanalytics.cn/%e7%bd%91%e7%ab%99%e5%88%86%e6%9e%90%e7%9a%84%e9%87%8d%e5%a4%a7%e6%84%8f%e4%b9%89%e2%80%94%e2%80%94%e7%ad%94%e7%82%b9%e7%9f%b3%e5%a4%a7%e4%bc%9a%e5%90%ac%e4%bc%97%e6%8f%90%e9%97%ae%ef%bc%88%e4%b8%8a/feed/</wfw:commentRss>
		<slash:comments>40</slash:comments>
		</item>
	</channel>
</rss>

