网站分析的十大误区及候补(三)

【导读】

  网站分析仍然是新鲜事,因此,我们对她的认识可能存在种种偏差。这篇文章总结了在我的工作中发现的种种容易出现的对网站分析认识上的误区。这是第三部分,也是最后一部分。第一部分请见:网站分析的十大误区及候补(一),第二部分请见:网站分析的十大误区及候补(二)

【正文】

  写这个系列的上一篇文章时还是在5月1日,现在已经是8月1日了,时间过得真快,令人感慨。

  其实在前两集中,十大误区已经谈完了,今天要讲的只能是候补。之所以叫做候补,原因是它们都是很有争议的领域,我是一家之言,仍只敢博君一笑。不过知识没有候补之说,我希望引发讨论,甚至争论,以获得真正的见识和真理。

候补误区一:网站分析有标准的benchmark

  这是一个存在普遍误解的地方。我们经常讨论bounce rate,讨论time on site,所以有很多朋友会问:

  我的网站bounce rate是60%,好不好?或者,平均time on site是5分钟,好吗?

subheader_criteria  这些其实都是我无法回答的问题,因为网站分析对于这些关键度量并没有一个所谓标准的benchmark可以参照。我只能说,bounce rate是60%不是我见过的最糟糕的或是最好的,5分钟的time on site也是如此,不过至于到底好不好,仅凭这几个孤立数据本身是无法解答的。

  为什么网站分析没有标准的benchmark的原因,在于网站和网站之间的区别太大了。首先,网站的受众/流量来源不同;其次,网站的功用不同;再次,网站设计的内容也不一样;最后,网站新旧程度也不一样……

  所以,网站分析没有标准的benchmark!例如,不能说bounce rate低于60%就是好,高于60%就是不好。

  现在,你会问一个更好的问题:

  如果是同一个细分行业的,或是受众很重合的网站,是不是可以相互比较这些诸如bounce rate、time on site、PV/V、访问者忠诚度等基础指标?比如,新浪搜狐土豆酷6京东商城新蛋网,他们可以两两相互比较这些指标吗?

  我认为完全可以相互比较,不过,千万不要觉得自己网站的指标数值比别人差,就是自己的网站不好。假如新浪的bounce rate是10%,而搜狐的是15%,阳哥就要发飙了吗?大可不必,这未必说明搜狐就比新浪要差。还是那个原因,新浪和搜狐的页面其实很不一样,虽然他们都是门户,而且他们牟足了劲在竞争,但他们仍然有很大很大的差异。uncertainty

  同样,Nike和Adidas的网站,Intel和AMD的网站,他们都是同一个tier(类别)的,但他们其实也很不一样。这些指标的大小不能简单说明一个网站就好于或者差于另外一个网站。

  所以,我一直坚持:即使是相同类别的网站,指标简单的数值好坏也不能说明网站的好坏。

  那么,你又会问了:

  既然比较不能说明好坏,那比较还有什么意义?!

  有,当然有!如果你知道了竞争对手的数值情况,你就可以分析它咯;你知道了你的数值不如它而了解自己。所谓以人为鉴可以知得失,网站之间也是如此。

  最好,请大家不要产生另一个误解,那就是既然没有标准的benchmark,那么无论我的数值无论多少,都不说明我的网站好坏,我大可以高枕无忧。

  相信没有朋友会这么想。:)

  如果您的数值太过离谱,超出了普通的范围,那么还是很能说明问题的。例如,如果您的网站整体bounce rate高于80%甚至90%,那还是要注意下了。:) 网站分析喜欢这些异常现象,还记得这篇文章吗

  下面列举一些我经验中的一些极值(请注意,这些值只对用Google Analytics分析有效,其他WA工具因为定义和监测方式的不同,数值可能有明显区别),如果超过这些值,可能说明网站出现了较为严重的问题(但不绝对!)

image

  最后再次提醒大家,由于每个网站都是独一无二的;而且指标本身也不能孤立的解读,所以,网站分析的标准benchmark不存在。

候补误区二:利用自动BI系统进行网站分析

  是否能够利用自动BI系统进行网站分析?这是一个很聪明的问题,提出这个问题的朋友,都是很动脑筋,而且很愿意去解决问题的。但是,就我愚见,这个想法很好,但是很难实现。

  网站分析有一些固定的模型。根本上,遵循“输入->分析->输出”模型,我们希望的,是在分析这个环节利用计算机的智能运算能力帮我们进行分析,然后直接输出结果。这就好比IBM的深蓝和人下国际象棋,输入是当前的棋局,分析是它自己肚子里面的程序,输出是棋的下一步。网站分析也希望能够类似,例如,输入网站的bounce rate=65%,网站的PV/V=2.54,网站的time on site=187秒,网站产生的revenue=$332,343,conversion rate=1.34%以及其他各种指标和metrics(包括各个页面的指标)等等,然后智能程序开始运算分析,最后输出结果——网站是否健康,网站有哪些优点和弱点,以及网站在什么地方需要改进,以及建议。

BI  很美好,但是比较难实现(除了某些特殊情况,后面提)。

  问题出在什么地方呢?输入、分析、输出都有问题,都无法实现——原来现实总是这么残酷;而且,我认为,输入的问题最难解决。

  为什么输入的问题最难呢?举一个不恰当的例子,例如战争(请原谅我是和平主义者,所以这个例子并不好),假如俄罗斯和美国要打一仗,我们可以通过计算机模拟出胜率,但真正开仗了,你会相信战争的过程一定会和计算机模拟的一样吗?不可能一样,因为左右战争进程的除了武器装备等内部因素外,外部因素往往更加重要,而外部因素难以界定边界,而且有很多时候完全是混沌的。

  网站分析如此。网站的种种可以被监测的指标,是内部因素,有明确的定义和边界,但是遗憾的是,仅仅只有这些内部因素,不足以帮助我们完成分析。网站分析师分析的核心价值在于,把这些用网站分析工具监测到的内部因素,与网站所拥有的外部因素进行关联,并进一步分析挖掘,从而寻找到真正有价值的洞见(insight)。

  你会问我,网站的外部因素是指什么?——好问题!网站的外部因素是那些瞬息万变,不可能墨守成规却又无时不刻不再影响网站变现的事物,我能想到的包括如下内容:

  • 网站的设计——不仅仅是流程上的,更是视觉上的,usability上的,这些怎么输入给BI系统呢?
  • 网站受众的情况
  • 网站所处的行业和经营环境
  • 网站的竞争对手
  • 中国互联网的一些独特“怪癖”
  • 网站经历的其他外部事件等等

  这些外部事物哪怕对你的网站产生一点点影响,都会改变最终的分析结果,而它们既不格式化,也不结构化,都无法输入到BI中,所以输入上就有问题。

  由于输入上无法解决的问题,分析也就很困难了,在真正的类人神经网络计算机出现前,我们现在的计算机的分析只能按照结构化和程序化的方式来,如果输入是模拟的,甚至是模糊的,那它就无可奈何了。

  谈点儿题外话。一定有不少朋友喜欢炒股,我读过一本书,讲华尔街的金融分析师,书名叫《华尔街的肉》。其中作者提到了那些天天玩儿数学模型按照“输入·分析·输出”进行预测的分析师,往往预测的结论跟实际结果都不同,所以他对这个方法十分质疑。我现在明白其中部分原因所在,就是许多外部因素是无法准确输入到模型中的。influence

  输出也存在问题,即使分析有了结果,如何进行建议仍然是非常困难的。计算机只能给出一些大概的指导性意见,它不可能告诉你应该如何调整你的call to action元素,或者应该如何修改流程,又或者如何重新构造首页,它做不到。

  所以,我斗胆预测,10年内用BI做深入的网站分析是不可能的,还得靠伟大的人脑。

  当然,万事无绝对,BI系统在一些方面很有价值,如下:

  • 当网站的外部环境比较恒定,可以作为常量时;
  • 自动优化流量来源,如SEM的自动投放系统;
  • 做A/B测试或者多变量测试时;
  • 自动根据测试结果进行内容投放时,如Omniture的Test&Target系统;
  • 自动根据访问者行为profile的分析结果进行定制化内容feed的时候。

  就不再具体展开了。

候补误区三:分析个体行为具有重大意义

  我见到一些工具,记录每一个访问者在页面上的鼠标轨迹。这些工具各有千秋,不过都很强大。通常,这些工具是为UED(UCD)设计师准备的,但是它们对网站分析有重大意义吗?

  网站分析是一般是通过全体(即完全不抽样)或者是大样本量数据来分析网站访问者所趋同的一些行为模式,并据此优化最主要访问群体的访问体验。网站分析极少通过研究个体访问行为来进行分析。在这一点上,网站分析和网站可用性(usability)分析是大相径庭的。

  如果您读过《Don't Make Me Think》,您就知道,网站做好后,请一些从未使用过您的网站的普通人,在您的面前完成一些您规定的网络访问事情,并且记录下他们的访问行为,是一种非常重要的网站usability测试和改进的方法,但是网站分析则极少采取这种方法,即通过某一个访问者在网站上访问留下的数据情况来分析和优化网站。

individual  原因很简单,因为大量访问者的访问情况是符合正态分布的。有可能某些访问者的访问数据分布在极值地区,如果用这些数据进行分析,偏差很大。例如,A访问者在网站上停留的时间长达1个小时,访问的页面多达100页,这不代表着所有的访问者都是如此,分析单个访问者容易陷入危险。也许你会说,我可以多分析几个访问者的行为,这样会更可靠。但是,问题是,与千百万的访问者数量比起来,你能够分析的个体总是有限的,而且越多的个体分析,你就会越辛苦。

  所以,在我的实际工作中,我几乎不会用到一些非常具体的鼠标轨迹监测工具,但我希望能够有一个鼠标轨迹记录工具,记录所有的鼠标行为,并用不同的色彩表示鼠标行为的密度,这对我们会非常有用,而且会比我们目前所做的热区图(heat map)更有价值。但似乎目前没有这样的工具出现。

候补误区四:优化方案是进行分析后的必然结果

  网站分析重在分析,不错,但分析并不是网站分析的全部,分析的最主要目的是发现问题,但分析本身不足以帮助解决问题,或只能解决部分问题。

  例如,在研究转化时,我常常发现很明显的某个页面丢失了大量的访问者,但是为什么这个页面的表现会如此糟糕?有时候,根据经验,我们立即就能想到原因,并且据此提出改进意见;但有时候,我们其实并不知道为什么这个页面如此糟糕。即使根据经验我们能够想到原因,这也并非一定就是真实的(或根本的)原因所在。

  所以,有些时候(其实更准确的是大多数时候),真正可靠的优化方案,并不能从分析中直接得来,而是来自于你通过分析提出建议之后的测试。建议本身是主观的,但测试之后的结果则是客观的(只要你采用了科学的方法和流程)。网站分析的一个轮回并不结束于分析,而是结束于测试,测试才是王道。

  所以,下面的这个图虽然是老生常谈,但却是真正重要的方法论。

image

  好了,这篇文章终于结束了,这个系列也终于结束了(之后可能会有修订和增补)。感谢所有朋友们一直以来的鼓励!希望大家提出不同意见,欢迎探讨,欢迎争吵!

未经允许不得转载:版权归宋星及chinawebanalytics.cn所有宋星的数字观 » 网站分析的十大误区及候补(三)
分享到: 更多 (0)

评论 11

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
  1. #-49

    这跟做seo一样,网站分析同样是处于一个循环系统中,持续循环中的每个环节,才会使网站离我们理想中目标越来越近。

    Robbins14年前 (2010-08-05)回复
    • 的确如此!提升是一步一步的,是不断地,持续地。

      Sidney Song14年前 (2010-08-08)回复
  2. #-48

    是的,最终的结果是教我们下一步怎么去做?

    sophilin14年前 (2010-08-05)回复
  3. #-47

    又见好文!

    Han.Yin14年前 (2010-08-05)回复
  4. #-46

    网站分析的确很重要,从网站的建设之初,一直围绕着整个网站运营

    爱非鱼14年前 (2010-08-07)回复
  5. #-45

    “停留时间是网站中比较弱的指标”,这点不太赞同。不清楚为什么宋兄会这么认为?除非宋兄认为其所用的统计系统对于停留时间的统计不准确。

    举个简单的例子:一个flash的网站,正常加载需要10秒,播放需要1分钟的时间,而统计中得到的平均停留时间是10秒,点击次数很高,比如10万,这说明什么?说明很多人虽然点击了,但并没有看这个flash,如果没有停留时间这个指标,而只是看了点击次数,那么一定认为访问效果很好。所以,我觉得停留时间的重要性并不比其他指标弱。
     

    jie14年前 (2010-08-08)回复
    • 主要是工具对于网站时间的监测都受到技术限制而无法准确。时间本身是非常好的度量。

      Sidney Song14年前 (2010-08-08)回复
  6. #-44

    一路看过来,好过瘾!

    ucfinder14年前 (2010-08-08)回复