Google Analytics的新秘密——如何定义Visit

image【前言】Visit这个度量是网站分析的基石。但即使是这样基本的一个度量,Google Analytics对它的定义其实都不是完全一成不变的。为了适应新的浏览器变化和人们访问网站习惯的变化,Google Analytics在基本度量上甚至都在不断进化。哦,这或许也是Google Analytics的可怕之处,她已经达到了这样的高度,还比别人爬的快。

在本文中,你将学到什么:

  1. GA定义visit的重大改变;
  2. 特殊情况下GA如何处理visit的定义;
  3. Visit关联属性的变化(过去和现在);
  4. 为什么大部分页面的visit会远小于这些页面的访问者(visitor)数量。

【正文】

如果这个文章的标题我只是写成“Google Analytics如何定义visit”,是不是你就不会看了?Smile

但可能事情比大家想象的复杂,所以非常希望你能够继续读下去。当然,如果你不是那么明白如此重要基础的一个度量,那么建议你先阅读这篇文章:网站分析的最基本度量(1)——Visit

Google Analytics统计visit的重大变化

我们都知道visit的两句口诀——“30分钟没动静”和“浏览器千万别关闭”。意思是如果浏览一个网站的过程中有三十分钟没有打开新的页面或者没有发生某些action(这些action需要被GA的代码监测到,例如event tracking),那么之后你再在这个网站上进行访问的行为会被记录为一个新的visit。同样,如果浏览器被关闭了,然后再打开浏览器浏览这个网站,GA也会认为发生了新的visit。

本文版权归“网站分析在中国CWA”及其作者宋星,欲转载,请联系作者

  现在,大家可以不用记这两个口诀了,因为Google Analytics对visit的定义已经发生了重大改变。

image  事实上,这个口诀现在必须改为——“30分钟没动静”和“换了来源再进去”。为什么改成这两个口诀,我们先看看Google对visit新的定义是什么(如果你懂英语,而且有翻墙之术,那么你可以看这个文章:http://analytics.blogspot.com/2011/08/update-to-sessions-in-google-analytics.html):

  1. 同一个访问者的两个相邻pageviews之间的时间间隔如果超过了30分钟,会被记录为一个新的visit。
  2. 一天结束时,持续的浏览行为自动被切分为两个visit。
  3. 一个访问者更换了与原先来源不同的其他来源再次访问这个网站,也会被记为一个新的visit,即使在30分钟内更换也如此。但更换为直接流量除外

这一变化对visit统计带来何种影响?

对于第一、二种情况,这是业界约定俗成的,GA更新visit定义的前后并没有对此发生变化。第三种情况则是最为重大的改变。

这种改变对visit的计数带来了什么样的变化?请仔细读我下面的文字,也许有一些长期萦绕心头的问号能够被解开。

在旧的定义中,visit的增加与否其实与流量来源关系不大。在下面的场景中,visit的新旧定义有显著区别。

场景一:

Steven访问我的网站www.chinawebanalytics.cn往往是通过搜索引擎。这一天,他在百度上搜索“网站分析”,然后点击搜索结果进入了我的网站,在网站上浏览了一下,似乎没有找到那篇他曾经记得没有看完的文章。于是,他马上又回到百度,搜索“电子商务关键数字优化”,找到了这篇他要读的文章:http://www.chinawebanalytics.cn/kpi_optimization_part2/。这个过程都发生在30分钟内,而且浏览器没有被关闭过。请问,Steven的这一系列行为为我的网站带来了多少个visit?

image

对于这个场景,新旧visit的定义不同,对visit的计算也截然不同。

本文版权归“网站分析在中国CWA”及其作者宋星,欲转载,请联系作者

  在旧的定义中,只有浏览器关闭或者两个pageview之间的间隔超过了30分钟才算新的visit,所以在上面这个场景中,visit不会增加,仍然只有1

这个时候,产生了一个麻烦,对于流量来源的统计,有点棘手。我们在流量来源的报告中,两个搜索词(前一个是“网站分析”,后一个是“电子商务关键数字优化”)将会怎么统计呢?这个时候Google Analytics有几种选择:

  • 放弃第二个关键词的记录,把这个visit的增加值计入到前一个关键词“网站分析”上;
  • 放弃第一个关键词的记录,即第二个关键词冲掉了第一个,把这个增加的visit计到“电子商务关键数字优化”上;
  • 两个关键词都记录,且他们为网站带来的visit数量都增加1——这意味着把traffic source报告中各个流量源头的visit数字加总,总数会大于网站的总visit数;
  • 记录第一个关键词“网站分析”的visit增加1,同时也记录第二个关键词“电子商务关键数字优化”,但visit不增加,如果第二个关键词之前没有带来任何流量,那么它也会出现在报告中,只是它的visit数据是“0”。

同学们,你们认为GA怎么处理呢?答案是第四个。很有趣,这是为什么我们过去在GA的报告中可能会发现有些traffic source的visit=0。如果你曾经看到过这种报告,你一定会认为GA肯定出错了。不是GA出错,而是visit定义的机制造成的乌龙。

  但是在新的定义中,流量来源的变化会造成visit的增加。上面的这个场景,由于traffic source变化了(从一个关键词变为另外一个),因此visit会增加1。在Traffic Source报告中造成visit=0的困扰也不存在了,两个关键词各自为网站带去的visit都加一。

现在Google Analytics的报告,在任何情况下都不会再出现visit=0的traffic source。但曾经的报告,是存在的。说点题外话,这个定义的改动会改变Google Analytics中的历史数据,所以你在过去的数据中再去找visit=0,已经无处可寻了。

场景二:

现在我们看看另外一个场景中,visit的先后变化。仍然是Steven,他打开了我的网站,然后电话响了,他下意识的直接关掉了浏览器,5分钟之后,电话结束,他又打开浏览器,重新输入我的网站的网址——www.chinawebanalytics.cn在浏览器的地址栏中,然后继续浏览页面。在这个过程中,会为我的网站创造几个visit?

这个场景下,在旧的visit定义中,visit会增加1,即整个过程会有2个visit。因为关闭浏览器会让统计visit的一个临时cookie过期(所谓临时cookie,即是随着浏览器关闭而立即过期的cookie)。

但是在新的visit定义中,visit不会增加1,因为定义中并没有任何关于浏览器关闭的情况。事实上,之前的那个临时cookie仍然存在,而且仍然会随着过期,但是它的内容却不改变了。

关于Visit的详细的新的定义,请大家看Google的官方说明:Google Analytics(分析)如何计算访问次数

本文版权归“网站分析在中国CWA”及其作者宋星,欲转载,请联系作者

Visit的另一个重要新规则——也可以用来描述页面了

Visit的另一个显著改变是Google Analytics放弃了过去严守的对于某些度量的在page范畴和site范畴之间的不相关性。有点拗口,所谓的不相关性,意思是,有些度量只用来描述site这个层级,而不能用在page上。visit是典型的这样的度量,在过去,visit不会用来描述一个page,所以你不能在All Pages报告中间找到visit这个度量,即使是自定义报告也不能把它们弄到一起去。只有一个近似于visit的page层级度量——unique pageview。

这样的定义实际上非常严谨,原因在于visit用于描述一个过程,而对于一个个的单独的页面,是过程中的一个个步骤,所以用visit来描述一个页面是有问题的。但unique pageview就可以——一个visit访问了某个页面3次,那么这个页面的pageview增加3,但unique pageview只是1。下图中,一个visit访问了两个页面,A和B,其中A访问了5次,B访问了3次(因为有刷新,所以有A—>A和B—>B的访问),这个过程中unique pageview=2。

image

  但现在,这个规则部分成为历史。在新规则中,visit可以用来描述页面了。我们从GA的Custom Report(自定义报告)中已经可以发现端倪。

Visit Page

  我们在自定义报告中可以看到,Visits这个metric完全可以和Page这个Dimension关联在一起了。不过,为了避免人们一下子不能接受,在默认的page报告中,例如All Pages报告中,Visits还是没有出现。

本文版权归“网站分析在中国CWA”及其作者宋星,欲转载,请联系作者

  把Visits和page关联起来,以及前面一节的那个变化——visits的增加也受流量来源改变的影响,这两个对visit这么基础的度量的这么重大的改变,最重要的原因是让GA的Multi-Channel Report(流量渠道归因报告)能够更容易地进行归因处理(特别鸣谢好朋友Robin Li在这个地方的指正)。另一个原因是Google Analytics希望把visit这个度量更好的跟session这个事物保持一致,以避免人们的不理解。例如,上面所提到的visit=0的情况,人们会误认为GA坏了,而现在新的定义,则不再会有这样的误解发生了。

Visit为什么会小于Unique Visitor?

细心的读者会自己试一下我上面讲的内容,如果你真的实验了(我必须支持你这么做),那么当你生成上面的那个自定义报告后,你会发现一个奇怪的现象——大部分的页面的visits数量都要比它的unique visitors的数量小,而且有的小的多,有的小的少,似乎没有规律。如下图:

visits-smaller-than-uv

  是不是Google Analytics出问题了?

坦率说Google Analytics在度量上没有bug,任何一个数值都事出有因,哪怕这些数值“看上去不合理”。

为什么会出现这种情况呢?

原来,由于visit是描述一个过程,因此很多visit都会经过不同的页面。在新的定义下,visit可以和具体的页面相关联,那么,当一个visit经过了多个页面时,这些页面各自的visit是否都增加1呢?

并非如此。

原来,在visit访问多个页面的过程中,GA规定只把visit的增加赋给visit经过的第一个页面,而之后的页面不再赋给他们visit,即之后的页面visit不增加

1st-page-visit

  但是,Unique visitor这个值不一样。GA把UV的增加赋给每一个访问者访问的页面。因此,UV的数量是有重合的(如果你把各个页面的UVs数加总起来,是要远远大于网站的总UVs数的),但Visit没有重合,你把各个页面的Visits数量加总,总数刚好等于网站总的Visits。难怪出现了Visits要小于Unique visitors的情况。

现在我们再回头看看上面那个蓝色A页面和红色B页面的例子,情况确实发生了变化,如下所示:

New-visits-definition

本文版权归“网站分析在中国CWA”及其作者宋星,欲转载,请联系作者

  如果你再认真想一想,说不定你会想到,既然visit并不会平等赋值给这个visit所经过的每一个页面,那么理论上可能有页面的visit报告的visit值是0!如果你这么思考了,恭喜你,你的认真精神确保你能够成为一个出色的分析师。事实上,我想我们并不难找到那些visit=0的页面,只需要做一个visit从小到大的排序就好了。

0visits

结语

GA不是一成不变的,其功能上的变化让我们耳目一新,而在度量上的变化,这其实也不是头一次。无论如何,这些变化都在朝着让用户更好用更易理解的方向前进。不过,由于度量的定义需要非常严谨,牵一发而动全身,所以当你发现了一些异常的时候,不要惊慌,很可能只是GA处理数据规则的问题,而不是你的代码加错了,或者是GA没有把你的数据监测好。

最后,朋友们有没有问题?有没有遇到GA中其他奇怪的现象,请留言,我们以及所有的读者朋友都可以集思广益,参与讨论。谢谢!

 

未经允许不得转载:版权归宋星及chinawebanalytics.cn所有宋星的数字观 » Google Analytics的新秘密——如何定义Visit
分享到: 更多 (0)

评论 26

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
  1. #-49

    Landing page和Entry page终于合体了(- -!)

    Sylph12年前 (2012-08-21)回复
  2. #-48

    在举例AB页面中,为何是2个UV,不解,有点纠结了

    后知12年前 (2012-08-21)回复
    • 我认为是针对page来看的,对于page A来说,你浏览一次,两次都只算一个UV,同理,对于page B,你浏览三次,四次也只算是一个UV,所以即使你在A和B之间跳转着看,识别出来你也只是两个UV.如果是pageview就是5+3=8次了

      Carol8年前 (2015-11-25)回复
  3. #-47

    终于和百度统计的visit算法一致了。

    kevin12年前 (2012-08-21)回复
  4. #-46

    请问直接访问中有很多非主页url的访问,感觉无法理解,这个如何解释
    另外请问如何设置GA以统计百度的付费推广流量

    jx ma12年前 (2012-08-21)回复
  5. #-45

    文中对流量来源的变更,描述的并不完全,之前我写过的一篇http://ratwu.com/2012/07/google-analytics-visit/

    耗子吴12年前 (2012-08-21)回复
  6. #-44

    关于用visit来描述Page的方式,个人还是更接受omniture的算法。一个页面经历过一次visit就+1,很干净利落。

    Leslie12年前 (2012-08-21)回复
  7. #-43

    visits定义变化,前后兼容的问题怎么解决?是全部数据按照新定义重跑么?

    嗜睡蟲12年前 (2012-08-21)回复
  8. #-42

    宋星大哥,你好。
    有一个GA问题困扰我许久:无论查询哪个渠道数据,只要选择了次级维度后,访问次数中会出现多行一模一样的数据,是GA的Bug还是其它原因造成的?

    Smile12年前 (2012-08-21)回复
  9. #-41

    那上面的自定义报告中visit就等于Entrances?

    独眼屠夫12年前 (2012-08-21)回复
  10. #-40

    感谢宋老师的分享。有一个问题困扰了我很长时间了,希望宋老师能帮忙解答一下:在网站Engagement的报告中看到有Page Depth<1的访问,这个是什么情况?怎么产生这种数据呢?这里的小于1是不是就是等于0的意思,也就是有些访问没有产生pageviews?

    Burning12年前 (2012-08-21)回复
  11. #-39

    有图有真相,用数据说话,以后得更注重这些细节问题。

    沉在水上12年前 (2012-08-21)回复
  12. #-38

    独眼屠夫 said:
    那上面的自定义报告中visit就等于Entrances?
    ——我也觉得应该是这样。页面本来也可以有visits和uv,但不同页面不能累加,放在页面报告里会有歧义;而entrances和unique pageviews都是可累加的度量;在页面中这两个好更好理解,逻辑上可累加。
    耗子吴 said:
    文中对流量来源的变更,描述的并不完全,之前我写过的一篇http://ratwu.com/2012/07/google-analytics-visit/

    ——同意耗子吴的观点,渠道变化改变session是有一个复杂逻辑的,不是所有渠道相互覆盖的。

    段子望12年前 (2012-08-22)回复
    • 回复段子望、耗子吴:
      没有太复杂的逻辑,Google的官方解释是:“When any traffic source value for the user changes. Traffic source information includes: utm_source, utm_medium, utm_term, utm_content, utm_id, utm_campaign, and gclid.”,只要这些cookie中的任何一个或者多个发生变化,就相互覆盖了。direct流量不会改变这些参数,所以direct不覆盖别人。请参考:http://analytics.blogspot.com/2011/08/update-to-sessions-in-google-analytics.html。需要翻墙。

      Sidney Song12年前 (2012-08-22)回复
  13. #-37

    其实很简单的一个问题,都能写成一篇很长的文章,专家就是这样的。

    无线固话12年前 (2012-08-23)回复
  14. #-36

    uv是给每一个访问者访问的页面,pv每加载一次也增加1,那这样看两个应该是这样的,可报告里面值不相同,宋老师,这为何啊???

    流浪12年前 (2012-08-29)回复
  15. #-35

    但是在我的自定义报告中,visit并不等于Entrances,而求有些页面相差很大
     
    见截图:http://i.imgur.com/ntTDX.png
     
    段子望 said:
    独眼屠夫 said:
    那上面的自定义报告中visit就等于Entrances?
    ——我也觉得应该是这样。页面本来也可以有visits和uv,但不同页面不能累加,放在页面报告里会有歧义;而entrances和unique pageviews都是可累加的度量;在页面中这两个好更好理解,逻辑上可累加。
    耗子吴 said:
    文中对流量来源的变更,描述的并不完全,之前我写过的一篇http://ratwu.com/2012/07/google-analytics-visit/
    ——同意耗子吴的观点,渠道变化改变session是有一个复杂逻辑的,不是所有渠道相互覆盖的。

    独眼屠夫12年前 (2012-08-30)回复
  16. #-34

    Sidney~
    最近的文章是不是都没有整理到“网站地图”里呀?我习惯根据你的网站地图找感兴趣的文章,最近几篇都没有找到:)

    jessieanimal12年前 (2012-09-18)回复
  17. #-33

    感觉变后visits更像UV了,基本一个人进到网站,不管看了多少页,visits都是1,那什么情况才会出现visits大于uv的情况呢,有点不解。而且我也不认为新的visits适合做页面的度量,除了主要来源是搜索外网的landing page页,还是做网站的度量合适。

    bomer12年前 (2012-09-18)回复
  18. #-32

    page图上的字  是不是写错了?  访问a页面不是5次吗? 为何是4次呢,被抛弃了最后一次吗?

    miki12年前 (2012-11-05)回复
  19. #-31

    回复miki:的确是写错了!抱歉!是5次,笔误成了4次。

    Sidney Song12年前 (2012-11-05)回复
  20. #-30

    Universal Analytics 新的代码使用后,数据会比老代码少非常多,代码兼容问题? 
    按GA新的统计方法,UV统计。可现在界面上的数据还是visits。

    tony12年前 (2012-11-13)回复
  21. #-29

    同意bomer,怎么感觉变后visits更像UV了,对于上面说的1个visit,却有3个unique visitor理解不了,为什么我的报告里没见到visit小于unique visitor的?

    singing11年前 (2012-12-24)回复
  22. #-28

    能加QQ么,我经常会遇到一些GA上的问题,不知道找谁讨论,609408750

    樱樱11年前 (2013-11-08)回复
  23. #-27

    认真看完了大家所有的评论,个人觉得只要有这个Google Analytics数据概念就行,真正去实施整个站内的调整时间本身就需要时间。有这个数据观念,但是不用太深究。

    solar-led-lights10年前 (2014-04-03)回复
  24. #-26

    请问一下,那新的Visits计算方法是不是意味着:三十分钟内,关掉页面再打开,还是计为1个visits?

    Nicole9年前 (2014-11-26)回复