Headline »

2016-11-23 – 3:21 下午

这篇文章独家首发在:iCDO(微信公众号:互联网数据官)

  你可能没有听说过Amplitude,但你可能听说过Mixpanel(没有听说过的朋友也没关系,不久的未来我们会有一个专门的文章介绍这家同样很牛的公司),没错,Amplitude是Mixpanel的有力挑战者。在美国,很多用户因为种种原因(后面会说到),从Mixpanel转投到了Amplitude。

Read the full story »
网站分析经验分享

网站分析的逻辑模型,思维方法,实战经验和案例的分享。

网站分析圈子/活动

目前正在每月进行的活动是WAW(网站分析星期三)。此外,所有的网站分析和互联网广告和营销方面的活动也都会在这里通知。

产业动态

网站分析产业有什么新鲜事?中国的网站分析发展到什么状况了?这是这个分类要关注的内容。

网站分析工具

想了解Google Analytics, Omniture以及其他网站分析工具、网络营销监测和分析工具吗?看这里!

招聘动态

这里有招聘信息,也有求职信息。也可以直接给我写信询问更多的工作机会和人才储备。招聘专用邮箱是:sxwuda(at)163(dot)com。

主页 » 基础知识

Google Analytics中的Navigation Summary

提交 2009-05-10 – 10:54 下午 22 点评

  这个话题起源于“老菜鸟”同学给我提出的一个问题,是非常典型的问题,触发了我应该写一个帖子的想法。这个问题是关于GA中间的Next Pages和Previous Pages这两个特别容易让人糊涂的页面维度的。和“老菜鸟”一样,我曾经对它们有相当长时间的误解。但是,我也必须承认,我的工作很大程度上依赖于这两个页面维度的统计数值,以及由这两个维度引申出来Navigation Summary报告。因此,我将在这里试图把与它们相关的内容弄清楚,也希望大家能提出更多的问题或者指出任何我仍然理解错误的地方——咳,真实不容易啊!

[版权归作者Sidney Song所有,欢迎转载,但请事先告知作者并注明出处]

  • 关于GA的Navigation Summary的几个疑问

  为了跟这个帖子的内容同步,我建议大家把自己的GA语言设置为英文,因为网站分析的标准毕竟是老外们建立的,所以有些名词上微妙的区别不是为汉语准备的,使用汉语只会让我们更加糊涂。

  设置好了语言了?那好,让我们打开GA界面,进入左侧主菜单中间的”content“菜单,然后选择”Top Content“中任意选择你监测网站的某个页面,接着你再点击这个页面报告中的”Navigation Summa“(导航摘要)。会得到如下左图所示的一个简易的流量结构图:

  在这个图中,很直观的显示了有一定数量的流量进入我们的页面”/Index.php",然后又从这个页面流出。在进入这个页面的流量中,69.39%的流量是来自于我们的网站之外,而30.61%的流量则是来自于网站内。

  因此,很明显就能看出,Navigation Summary报告的作用是用来查看某个页面的转换情况的。如果Entrances的比例很高,说明这个页面是一个主要的landing page,而如果Exits的比例很高,那么这个页面就有可能有问题。

  乍一看上去,很容易理解,但是如果你想研究一些精确的计算的话,就会发现不少让人糊涂的地方。

  1. 这个报告中的流量用什么表示?我们可以看到图中有viewed times和clicks两种度量,但是都不是我们常用在WA中的流量度量;
  2. “%clicks”是什么意思?
  3. "/Index.php"这个页面的Previous和Next pages都有它自己,而且还占%clicks的最大比例——是页面刷新造成的吗?

  这几个问题是朋友们问的最多的,尤其是第三个。前两个容易回答,这里直接解释大家可能就明白了:

  1.  Navigation中流量的度量采用的是page view。所谓“was viewed xxxx times”,等价于该页面page views=xxxx。
  2. 要搞清楚“%clicks”,首先要了解为什么这里用了clicks而不是page views。因为页面之间的转换源于点击页面上的链接,点击链接后才有page view,所以在描述页面之间转换的行为时用“click”表述更为合理。但由于GA本身不能直接监测click,因此实际上%clicks的数值还是用page view来计算的。那么%clicks的数值是什么意思呢?很简单,图中所有的Previous Pages列表中的页面的%clicks的数值加起来就等于30.61%;同样,Next Pages列表中所有页面的%clicks数值加起来应该等于50.58%。

  因此,其实理解起来并不困难,但是又有一个问题出现了,我说过图中所有的Previous Pages列表中的页面的%clicks的数值加起来就等于30.61%,但是很多时候,加起来远远小于Previous Pages显示百分比的总和。——为什么呢?因为Navigation Summary只能显示Previous和Next各10个页面,超过10个,就不会显示给你了。这的确是值得改进的地方,GA的官方回答是:毕竟是免费的东西嘛,我们的服务器总是要成本的。

[版权归作者Sidney Song所有,欢迎转载,但请事先告知作者并注明出处]

  那么第三个问题,"/Index.php"这个页面的Previous和Next pages都有它自己,而且占%clicks的比例也完全一样,是什么原因?

  • 为什么Previous和Next Pages是页面自己

  这个问题引发了对我的“猛烈抨击”(见本文的相关回复),但事实证明我此前的认知是错误的——之前从GA官方专家那里获得的解答并不正确。而最终证明真理还是得来源于实验和实践,不容假设,亦不可只听信权威而不做自己的研究。所以首先要对大家诚恳致歉。

  要搞清楚这个问题,首先我们要知道Previous Pages和Next Pages是什么。Previous Pages指与报告当前页被访问前,与其直接相邻被访问的上一页。假设一个网站有A、B、C、D四个页面相互链接,而且只有你我访问了它。如果你访问页面的顺序是D->A->B->C,而我访问网站页面的顺序是C->B->A->D,那么页面B的Previous Pages就有A和C两个,这两个都会显示在B页面的Previous Pages列表中。同样,C和A也会显示在B页面的Next Pages列表中。而D页面,尽管也是在B页面被访问前就被访问了的,但由于在访问过程中不和B页面相邻,因此不会显示在B页面的Previous Pages的列表中。

  [为了证明这一点,我做了一个简单的实验。我制作了9个页面(其实不用那么多),分别是A1,A2,A3,A4,A5,A6,A7,A8,A9。这9个页面依次相邻单向链接,因此访问只能从A1到A2,A2到A3……A8到A9单向前进。第一天实验,我自己进行了点击,所有页面均依次访问,且不刷新页面。GA上显示的结果是每一个页面的Previous Pages都是它相邻的前一页,且只有前一页;之后页面也是如此。这说明GA的Previous和Next Pages一定是相邻的前一页和后一页。]

  为什么Previous和Next Pages都是某个页面自己,而且所占的比例也完全一样呢?很简单,这个现象说明了页面刷新(Reloading/Refreshing)。当一个页面刷新的时候,增加了一次网站分析工具监测代码的执行,因此网站分析工具会认为Pageviwe+1,这个时候,对于这个页面,它的之前页面是它自己,之后页面也是它自己。如果一个页面的前后页都是自己,前页增加1必然后页也增加1,那么所占的比例也当然会完全一样了。

  [为了证明这一点,同样用了上一个实验的环境。我刷新所有偶数页面,且与页面编号的次数相同,即A2刷新两次,A4四次……A8八次。GA上显示的结果是每一个偶数页面的Previous Pages都是它相邻的前一页和它自己,起它自己占比跟刷新次数是一致的。这9个页面目前都是可以访问的,第一页的地址是:http://www.chinawebnalytics.cn/A1.htm,注意A1要区分大小写]

  与GA不同,Omniture本身就有一个报告——”refresh“来衡量页面的刷新情况,而GA则需要用过Navigation Summary报告来获得。

  一般而言,你页面的首页存在一定量的刷新是不奇怪的。但是如果比例过大就值得研究了。如果首页的刷新占到了Previous和Next Pages绝大部分比例的话,那么流量作弊的嫌疑就是很大的。关于通过一些定制化GA代码的方式来研究页面刷新的办法,请参加Tenly的另外一篇帖子

图:这个看起来网站流量作弊的嫌疑非常大:很大的流量,但是只是刷新首页

[版权归作者Sidney Song所有,欢迎转载,但请事先告知作者并注明出处]

  • GA怎么对待浏览器的回退和前进按钮

  这也是老菜鸟提出的一个非常好的问题。对于IE等浏览器来说,回退和前进按钮式非常实用的功能,那么GA是怎么对待点击这些按钮的操作的呢?

  请记住一点,无论点击了浏览器的回退按钮还是前进按钮,对于GA来说,都是当前查看页面的“后续页”。尽管对于浏览器而言,你点击回退/后退按钮是回到“前一页”,但是这个“前一页”会重新发送一个request包给GA,GA会发现这个包的time stamp比当前页的要新,因此肯定会认为这是在浏览当前页之后浏览的页面,理所应当会将其归于当前页的“Next Pages”。

  因此,如果有什么一句话的原则能说明GA决定Next Pages和Previous Pages的方法的话,那么就只有一个——Time Stamp(时间戳)。

  嗯,说到这里,该结尾了。大家对于这一块有什么更好的理解吗?有问题吗?很乐意继续看到大家的评论和分享!谢谢!

Tags:

22 点评 »

  • Davies说道:

    你这个解释不对,Preview Pages 就是指前一页,比如我们网站中一个这样的导航结构:

    A -> B -> B -> A

    得到的统计结果就是

    B 49% -> B -> B 49%
    A 46% A 42%

    说明各个页面之间的调整比例为 A –92%– B –98%– B –84%– A

    如果是像你说的这样,用户在做这两个页面的访问之前和之后,肯定也访问了其它页面,而且肯定不低,为什么在这个统计报告中完全看不出来呢?

  • stephen hou说道:

    感觉没那么复杂 工具是为了让人更好的了解网站 现在成了需要人去花很多时间去理解工具 有点本末倒置了 个人观点

  • Sidney Song说道:

    回复Davies:

    感谢你的细心回复。其实我很希望是指直接的前一页,这样我就能辨识大量的页面刷新。但是因为一些实践中数据对不上,造成很多奇怪的现象。因此当Google Analytics的官方专家Stephanie Hsu告诉我并不是直接前一页/后一页的时候,我完全接受了。因为能够解释之前的一些不正常状况。

    但是也不排除专家也有弄错了的可能,你是否方便给我发一个你的A,B页面的网址?另外我会请Tenly同学跟我共同再次验证,即创建一个完全独立的于外网的、五个依次链接的页面——a,b,c,d,e,我们会顺序访问a,b,c,d,e,中间不跳转不回退也不前进。然后查看d页面的previous pages是否包含a,来查看Previous Pages和Next Pages的情况。短期内会有答案。

    再次感谢!

  • Davies说道:

    我的来源于一个实际网站的数据,

    A 是用户设置页面 /settings/, B 是用户上传页面 /settings/user_icon/,

    用户访问过程就是 A -> B-(上传)> B -(保存设置)> A

    如果一个用户的操作发生在本页面内,基本上就等于原页面刷新,比如上面的上传文件过程。

    GA 上的数据基本就是我上面给的那样,当然中间会有一点噪音。

  • Victor说道:

    我觉得这篇文章相当重要
    当初我就在那个index.php的问题上面花了好多时间
    GA的工程师真有意思,有时间在Help Forum上面回答问题,没时间把这些基本的原理更新在Help页面上面。。。

    还是要吃透Code上面的文章

  • Sidney Song说道:

    回复Davies:

    有几个问题。

    第一,B-(上传)和 B -(保存设置)是什么样的action,普通的静态link还是javascript还是其他程序实现的?按照你的页面描述的情况应该是后者(程序实现的),那么有为他们做event tracking吗?

    第二,GA对待page和我们对待page是不一样的。如果B-(上传)和 B -(保存设置)是两个不同的动作,GA会认为是两个不同页面。如果没有监测到这两个event,那么GA又不会认为是页面浏览行为有发生变化。因此“如果一个用户的操作发生在本页面内,基本上就等于原页面刷新,比如上面的上传文件过程”这个表述,能否再确认对你的页面监测是否如此?“基本上就等于原页面刷新”这里可能有问题。

  • Davies说道:

    用户上传后是在原页面刷新的,GA会统计两次(上传前和上次后),我在网站后台看到的统计数据也是这样的。

    Previous Pages 是 “该页面之前的所有页面”,显然是不成立的,否则这个功能就没什么意义了。

  • Sidney Song说道:

    谢谢Davies。不过我没有看到贵站页面的结构,也没有看到你后台的数据,也许你和我各自认为的封闭系统其实都是开放的。
    没关系,我想最简单的解决方案就是直接做一个完全封闭的实验。此前我的team确实也为GA的一些数据结论的争论做过实验。在实验结果产生并公布给大家之前,都很难轻易的下结论。
    但我更乐意看到你是对的,然后我会与GA的专家争辩,这样我也能够有更好的刷新作弊的数据能够服务我的客户。 :)

  • Davies说道:

    我说的页面是指豆瓣的更新用户头像,应该用过吧 :-)

  • dave说道:

    为楼主的细致叫好。
    很多东西都是需要很仔细的推敲的,就像marketing的attribution一样。
    按照常理理解,previous pages应该是前面的一页,不过一个网站中一个页面可能有非常多的入口,因此我们可以看到previous pages的分布并不是同一个页面。
    静待lz的试验结果。

  • thinkingit说道:

    Percent Entrances: shows how frequently the page was a landing page.

    Percent Previous Pages: shows how frequently visitors came to the page after viewing another page on the site.

    Percent Exits: shows how frequently visits ended on this page.

    Percent Next Pages: shows how frequently visitors continued on to another page on the site.

    The list of pages that were viewed immediately before the page or pages is shown in the left column.

    The list of pages that were viewed immediately after the page or pages is shown in the right column.

    so..

    Sometimes the Previous Page, the Next Page, and the page you are analyzing are all the same page. This can be caused by visitors hitting the refresh button multiple times and generating “self-referring” hits.

  • Davies说道:

    ls 解释得很清楚了,出自文档?链接呢?

  • Sidney Song说道:

    是的Davies,你是对的。关于previous pages和next pages,我刚刚做了实验。初步的结果与thinkingit所说的一样,previous pages和next pages只有相邻页,而没有其他再之前或者再之后的页面。

    我会稍后在专门的帖子里面写明我所做的实验和结果,大家有兴趣的话可以看看这个实验方法是否合理。我想实验本身就是WA乐趣的一部分。

    感谢Davies仗义执言对我所做的订正。也感谢Thinkingit所做的补充。这里因为错误的讲解而造成的误导深表歉意。我会先删除,然后再修正文中错误的部分。

    再次感谢Davies,希望继续听到更多不同的声音。

  • peterpan说道:

    关于previous pages和next pages还是有问题,如果按Davies的理解的话,A>B>C>D>E,C的previous pages是不会出现A才对,但在实际统计中却出现了A。

    注:在实际统计中出现了很多页面与统计的当前页面没有链接关系的previous pages和next pages

  • 水少爷说道:

    我认为你这个是个案。
    我自己监控的网站每日综合浏览量在50万以上,但是并没有你所述的这种现象。

  • Janny说道:

    有个问题请教下,Navigation Summa中的%Exit与Content Detail中的%Exit为什么不一致,GA的算法是怎样定义的呢,谢谢!

  • 老搜说道:

    现在看来,正文中关于previous pages和next pages的解释是正确的。可是你之前错误的理解是什么呢?看了评论反而一头雾水了。

  • vincent说道:

    Sidney  :
           非常好的博文,让我对GA   Navigation Summary 这个度量定义有了比较深入的认识;
           既然我们对于Navigation Summary 的定义有了基本的了解,接下来的事情是该考虑该度量的意义以及如何使用该度量;
            
              

发表评论!

以下,或添加您的评论 trackback 从您自己的网站. 您也可以 Comments Feed 通过 RSS

很好。保持清洁。保持主题。没有垃圾

您可以使用这些标签:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> 

这是一个Gravatar启用博客。为了得到自己的全球公认的,头像,请登记 Gravatar.