Headline »

2016-11-23 – 3:21 下午

这篇文章独家首发在:iCDO(微信公众号:互联网数据官)

  你可能没有听说过Amplitude,但你可能听说过Mixpanel(没有听说过的朋友也没关系,不久的未来我们会有一个专门的文章介绍这家同样很牛的公司),没错,Amplitude是Mixpanel的有力挑战者。在美国,很多用户因为种种原因(后面会说到),从Mixpanel转投到了Amplitude。

Read the full story »
网站分析经验分享

网站分析的逻辑模型,思维方法,实战经验和案例的分享。

网站分析圈子/活动

目前正在每月进行的活动是WAW(网站分析星期三)。此外,所有的网站分析和互联网广告和营销方面的活动也都会在这里通知。

产业动态

网站分析产业有什么新鲜事?中国的网站分析发展到什么状况了?这是这个分类要关注的内容。

网站分析工具

想了解Google Analytics, Omniture以及其他网站分析工具、网络营销监测和分析工具吗?看这里!

招聘动态

这里有招聘信息,也有求职信息。也可以直接给我写信询问更多的工作机会和人才储备。招聘专用邮箱是:sxwuda(at)163(dot)com。

主页 » 基础知识, 疑问求解, 网站分析工具, 网站分析经验分享

Dear Sidney——我们期待解答!(之GA篇)

提交 2009-09-10 – 12:31 上午 27 点评

【导语】有很多朋友给我来信,提出了很多非常有价值的问题。但是,限于工作关系,我没有及时给你们回复。现在,我想把其中我觉得最具有代表性的问题跟大家分享。[版权归作者Sidney Song所有,欢迎转载,但请事先告知作者并注明出处]

  • 读者JonnyNG:如何保留访问者第一次访问我网站的Referral?

  Dear Sidey,问一个跟GA有关的问题。我为我的网站投放了一些百度CPC,而且也用utm代码(也就是Link Tag)做了监测。但是我有一个问题,假如一个人先点击了某一个关键词来到我的网站,然后又点击了另一个关键词广告再来到我的网站,GA是否会记录两条?但我认为我的网站的访问其实是第一个关键词带来的,有办法知道哪些关键词是访问者第一次点击的关键词吗?

  好问题!而且本来我想写一个帖子说这个问题的。看来不用专门开了。

  首先,要明白一个问题,GA是如何记录流量来源的。请大家记住一个原理,GA记录流量来源依靠Cookie,如果Cookie刷新了,流量来源也会更新,否则不会。直观讲,有两种情况:

  • 如果一个访问者先从新浪网点击了一个链接到了你的网站,那么不出意外,这个visit的流量来源会记为新浪网。然后,第二天,同样访问者又从百度搜索关键词进入你的网站,那么,这个新的visit的流量来源会被记为这个搜索引擎。因为,第二次访问刷新了Cookie。大家做一个实验,用Httpwatch看看自己的网站是不是这样。注意查询字串是"utmr"。我的查询结果很清楚的显示:”utmr    http://www.baidu.com/s?wd=%CD%F8%D5%BE%B7%D6%CE%F6“
  • 如果一个访问者先从新浪网点击了一个链接到了你的网站,然后收藏了你的网址,第二天通过收藏夹访问了你的网站,那么第二次访问的流量来源是哪里呢?如果你告诉我仍然是“新浪”,那么恭喜你,你的基本功很棒。流量来源仍然是新浪的原因是,通过收藏夹、输入地址栏,以及在Email中打开你的网址的行为都不会更新Cookie中记录的流量来源。

  这样,Dear Mr. NG先生,你的第一个问题就很容易回答,GA会记为两个流量来源,因为第二次访问会导致Cookie中流量来源记录的刷新。

[版权归作者Sidney Song所有,欢迎转载,但请事先告知作者并注明出处]

  那么,第二个问题怎么办?我们如何可以把所有其他关键词的访问都归为第一个关键词的贡献呢?

  这实际上是要解答:如果一个访问者从A关键词访问到你的网站,以后无论他从B关键词还是从C关键词,还是从其他来源进入你的网站,都会在traffic source中记为A关键词的流量。其实实现这一点,Google Analytics完全有办法。这个办法是nooverride=1参数。

  • 如果你的流量来源是Adwords,那么在gclid参数后,加上nooverride参数即可。例如:http://www.chinawebanalytics.cn/?gclid=123dfsa342IADF9&utm_nooverride=1,之后同一访问者所有的其他关键词的visit都会记为从这个关键词贡献,而不再记为之后其他关键词或者流量来源的visit。
  • 如果你用了GA的utm标签来监测流量来源,nooverride仍然可用,例如:http://www.chinawebanalytics.cn/?utm_campaign=wainchina&utm_medium=homepagepip&utm_source=waa&utm_nooverride=1。
  • 当然,如果你既没有自动的Adwords标记,也没有utm的link tag标记,你仍然可以用。例如在你的博客上写一条链接:http://www.chinawebanalytics.cn/?utm_nooverride=1,你在点击这个链接后,无论再通过任何其他入口进入我的博客,我的GAtraffic source报告中的referral domain都会记为你的博客的domain。

  关于nooverride这个参数,有一个国外的博文很好,供参考:http://www.roirevolution.com/blog/2007/07/using_utm_nooverride_part_1_of_3_branding.html

[版权归作者Sidney Song所有,欢迎转载,但请事先告知作者并注明出处]

  • 读者曾亮、Susan:如何在GA中合并同一页面大小写造成数据分别统计?

  Dear Sidney,我通过GA的content_drilldown发现GA对我的网站目录进行了大小写识别,例如 www.mysite.com/ABC www.mysite.com/abc 对我的网站来说是一个路径文件夹,作用,功能都是一样的,但是被GA认为是不一样的路径,因此识别成了两处,我不知道有什么办法能让它合并到一起。还请你不吝赐教!谢谢!

  这是一个很典型的问题了,而且很多朋友好像都问过。其实大小写合并对于GA而言很容易,就是利用filter的功能。如下图所示:

  对于你的问题,直接在Filter Field中选择Request URI就好了,然后GA会把所有大写的URI都转为小写的,这样在报告中就自动能够合并了。当然,Filter Type中选择Uppercase也行,这样所有的URI会变成大写的字母。

  就这么简单。

  多说一句,Google Analytics的Filter具有非常强大的功能,不仅仅只是简单的过滤。大家如果有兴趣请参看Justin Cutroni所著的Google Analytics O’reilly Short Cuts一书(请花钱支持正版),里面对GA的过滤功能有很详细的介绍。或者大家也可以参考Google Analytics Conversion University

  • 读者chinarundreisen2008:如何设置GA的Funnel?

  Dear Sidney: 我有一个页面:http://www.mysite.com/yantse/。但是实际上/yantse/这个目录并不存在,该页面的真实文件是\yantzecruise\index.asp,然后url重写映射成/yantse/的,然后我在ga目标设置的定义渠道(应该是转换funnel)那里步骤1设成了/yantse/,请问我这样设置步骤1有什么问题吗 ?

  重定向问题是GA面临的一个比较麻烦的问题之一。我在上一个博文:Google Analytics的愁:跳转页面的监测和嵌套页面的监测中已经有所涉及。chinarundreisen2008的问题又是一个非常好的问题,因为这个问题涉及到如何设置Funnel的问题,而这个领域是在我的博客中尚未涉及的。

  其实设置Funnel有一个诀窍,那就是把Top Content报告中的对应页面的URI抄过来,这样肯定不会出错了。比如,不管你的/yantse/是从定向为了\yantzecruise\index.asp,还是没有重定向,它的最终被GA记录下来URI只有一个。你把这个URI抄到你的Funnel设置的对应Step或者Goal中就行了。具体到你的情况,我认为GA会记录你的页面的URI为“\yantzecruise\index.asp”而不是“/yantse/”,因此你的设置应该是存在问题的。

  试一试吧,成功与否,把结果告诉我?

[版权归作者Sidney Song所有,欢迎转载,但请事先告知作者并注明出处]

  •  读者Jonny:Entries是怎么计算的?

Dear Sidney,您好,
看了您的blog感觉收获很多,我想知道entry page visits这个数据是怎么收集的呢?比如一个visitor进入网站的一个网页,停留了30分钟,然后刷新了一下页面,是算两次entry page visits还是算一次呢?再者,如果一个visitor进入网站的一个网页A之后,通过网页A又进入另一个网页B,在网页B停留30分钟,然后继续通过网页B进入网页C,那么在这个过程中,该访客所带来的entry page visits是1次还是2次呢?如果在计算Bounce Rate时可不可以用single page visits/entry page visits来计算得出呢?

  又是一个非常认真的同学,赞一个先。这个问题依据不同的监测工具,可能略有不同。我们以大家最常用的GA为例。

  Visit这个度量是依靠session cookie来工作的。Session Cookie在GA中的有效时间是30分钟。如果访问者两次产生新的pageview之间的时间是30分钟,或更短,那么算一个session,也就是只算一个visit。如果访问者两次点击网站上链接的时间超过30分钟,第二次点击被记为一个新的session,也就是一个新的visit。

  就你的问题,如果都是刚好停留了29分59秒(不超过30分钟),那么算1次visit。如果超过了30分钟,算两次。这样看来,你的从B页面到C页面的过程,如果间隔超过30分钟的话,visits应该算2次。

  在网站级别上,entry page visits和visits是一个概念。在GA中,你会发现,visits和Top Landing Page报告中的Entries是完全相等的。计算网站级别的bounce rate用single page visits/entry page vists就等于single access/entries,没问题。而计算某个页面的bounce rate,则应该是这个页面entry visits中的单页面访问的visits除以这个页面作为landing page时的全部visits,即该page的entry visits。有点儿拗口,但很准确了。

  请注意,很多度量是区分网站级还是页面级的。Bounce Rate是其中之一。

[版权归作者Sidney Song所有,欢迎转载,但请事先告知作者并注明出处]

  • 读者吴海燕:GA忠诚度是什么意思?

  Dear Sidney,GA上的Visitor大目录下的Visitor Loyalty子报告中的Loyalty(忠诚度)的定义语焉不详,应该怎样理解?是指绝对唯一访问者的访问次数的人数,还是应该是绝对唯一访问者的访问次数的次数。比如在下面这个图中,2times对应的是650人,是指650个人访问了两次,还是一共有650次访问2次的行为?

  哇,相当拗口啊。其实你的理解都不对。Loyalty是一个很有意思的度量,它用来衡量你的访问者是否会——回头再来。这里GA没有给大家一个清晰的时间概念,因此很容易理解错误。首先,我们看第一列,也就是“Count of visits from this visitor including current”这一列。每一个times当然指的是访问次数,而这个次数是多长时间内的访问次数呢?——是从加入代码开始用GA统计之日起到报告截止时间的次数。比如,图中的2 times,指的是从GA开始统计这个站点起,到你截取报告时间的截止日止,访问了两次的访问者。而我们的第二列,也就是“Visits that were the visitor’s nth visit”,指的是在我们选定的时间区间内,对应访问次数的访问者所访问的总visit。

  因此,2 times对应的650是指:从我们用GA统计之日开始,到报告截取日期的截止日,一共访问了我们网站2次的访问者,在我们选定的时间区间内一共贡献了650次访问。而,最忠诚的那部分人(也就是201次访问以上的,我想恐怕是吴女士您自己:) ),在选定报告时间区间内一共访问了29次。

[版权归作者Sidney Song所有,欢迎转载,但请事先告知作者并注明出处]

  搞清楚两个时间概念:times对应的是全部时间,而第二列visit对应的是报告选定时间,就容易理解Loyalty了。当然,Loyalty本身的作用是用来衡量你的网站最忠诚的那部分访问者——他们到底有多么忠诚的。这里罗嗦一句,你可以逐周/月记录最忠诚者的访问次数(比如高于15次的访问者的visit),然后做一个趋势图,来看看你的网站的读者是否变得越来越忠诚,或者越来越不忠诚。这样,能够帮你发现现象进而找到insight哦

  好了,轮到读者您了,有什么想法吗?赞成吗?或者有异议?欢迎在评论框中提出,或者给我写信。谢谢!

27 点评 »

  • 鸟人说道:

    希望楼主 有时间多介绍下 omniture有GA没有的功能,或者说omniture的比较创新的东西。omniture的产品买不起,总看得起吧。让我们开下眼界也不错。

    • Sidney Song说道:

      谢谢提议!Omniture的产品线很长,我并不了解全部。我希望Omniture能够在国内增加影响力,它的功能很强大,但是几乎看不到在国内任何支持。我为客户服务时,Omniture相关的问题要找澳大利亚和韩国,而不能直接找中国。感觉很失望。

  • 会律博客说道:

    以后希望博主多介绍日常我们能接触的案例,博主的每篇文章都很受用,博主很专业很用心!

  • lg2046说道:

    确实很专业

  • Will Lin说道:

    关于GA忠诚度的讨论,有以下一些思考,因为没有专门研究过这个数字,可能有错误的地方,还请博主指出。比如对于以下的例子:

    Visitor 第1次Visit 第2次Visit 第3次Visit

    Will: 有
    Sidney: 有 有
    Haiyan: 有 有 有

    则统计就会呈现为:

    Count of visits from this visitor including current Visits that were the visitor’s nth visit
    1 times 3
    2 times 2
    3 times 1

    下面的行的记录是上面的行的子集,因而(在第二列中)下面的行的数字不会大于上面的行的数字,对于统计数目为9-14 times的这种除外,因为这是把多个有重复子集合并起来的求和。也就是说所有有过第2次Visit的Visitor也必然统计在有过第1次Visit的Visitor里了。

    这里第二列的数字可以看成是visitor的一个度量(即为人数),因为同一Visitor的不同次的Visit必然不会算在同一行内。访问总次数为n次的Vistor人数应该是第n行的数字减去第n+1行的数字。同上对于统计数目为9-14 times的那种无法如此看待和计算。

    如果这个解释成立的话,那对于201+times那一行的记录既可以是29个不同的Vistor访问了超过200次,也可以看成是1个Visitor访问了229次,因为有了这种重复计算的数目,导致相应的百分比的反映的情况可能会有不同。就是在Loyal Visitor数目其实不是很多的情况下,由于他访问的次数很多也可能造成百分比更大。比如上面例子中如果Haiyan访问了5次,而3 times变成3-5 times,则对于访问2次以上的百分比我们会看成3/(3+3+2)=37.5%,而其实访问2次以上的Visitor的百分比为1/3=33.3%.

    如果没有这种重复计算的情况下,那用n行减n+1行数字的办法我们应该能算出不同访问总次数的用户的百分比,比如

    Visitor 第1次Visit 第2次Visit 第3次Visit 第4次Visit

    Will: 有
    Sidney: 有 有
    Haiyan: 有 有 有 有

    则统计就会呈现为:

    Count of visits from this visitor including current Visits that were the visitor’s nth visit
    1 times 3
    2 times 2
    3 times 1
    4 times 1
    4+ times 0

    那就是访问总次数为1的用户为3-2=1,访问总次数为2的用户为2-1=1,访问总次数为3的用户为1-1=0,访问总次数为3的用户为1-0=1。他们的用户百分比除了访问总次数为3的都是33%。

    很感谢Sydney提供了一个这么宝贵的平台让大家交流Web Analytics的知识和经验。不少的见解也是第一次见到。希望我们大家也能通过从他身上学到更多的东西然后也贡献一点自己微薄的力量。使得我们都能一起快速地进步。

  • Clarke说道:

    一直对忠诚度的计算不是很理解,今天看了楼主这篇文章,终于明白过来。

    最开始楼上的计算让我感觉有点晕。我后来仔细想了想,用了一个比较笨的办法:将时间段设置为一天,然后记录下访问次数为1000,访问人数为800。再查看忠诚度,发现访问次数为1的有400,占40%,而访问次数为201+的有9次,为0.9%,应该楼上说的第二种情况。

    另外我觉得201+=9这个数字并不能准确的表明今天有9个独立的访问者访问了站点,也有可能一个访问者在今天多次访问了本站点。还需要结合访问人数进行分析。

    谢谢Sidney Song 的内容,我很喜欢:)

    ps:我以前一直用中文版的ga,结果看了你们的截图才发现中文的翻译和英文原文还是有出入的,如ga忠诚度的第二列为:访问者访问了 N 次的访问的次数,好绕口啊·以后用英文的是不是更容易理解些了?

  • stephen Hou说道:

    你好,我有个问题想问下 ,
    为什么清楚cookies 在firefox刷新下 网站的domains 再去查看 utmz 的名字的cookies 是显示来之google的流量 而且搜索的关键词是网站的域名呢 我很好奇 是firefox和google的合作关系嘛

  • stephen Hou说道:

    还有一个问题 一起问了吧: 观察了几个adwords的广告点击过去的装了ga的网站的cookes:

    一部分是utmcz是:
    226206277.1253693595.1.1.utmgclid=CNaTv8mkh50CFQQupAodPxtGbg|utmccn=(not%20set)|utmcmd=(not%20set)|utmctr=

    什么都没记录 只是记录一个adwords的 id号 也没记录keywords

    一部分 跟厉害:
    246208198.1253693794.2.1.utmcsr=google|utmccn=(organic)|utmcmd=organic|utmctr=%E4%B8%8A%E6%B5%B7%20%E4%B9%B0%E6%88%BF

    居然显示adords的流量是来之organic的 (难怪 在ga里看到的adords的点击少于 adwords里显示的 )这些是怎么原因照成的呢 希望等待专家讲解

    • Sidney Song说道:

      的确很奇怪,当然做监测我们已经习惯了“奇怪”。现在我无法重现你的发现,因为我没有相关的点击入口。你能有什么方法让我看一个吗?这样有助于我们解开谜团。

  • Will Lin说道:

    Hi, Stephen

    我不是很专业,目前也没有很多机会实践很多Google Analytics的功能。如果你能得到Sidney或者上海WAW(他们里面有人获得GAIQ的专业认证)。

    对于adwords被看成非付费搜索的流量可以尝试在Adwords的目标URL后面加上?utm_nooveride= 1来保证该用户cookie在以后的访问中流量来源不会被重写成直接流量,非付费搜索或者推介网站。因为GA是根据用户最后一次访问的来源来决定的。这里Sidney文章中也有提及。

    GA用的是1st party cookies, 有效期是6个月,Adwords JS用的是3rd party,有效期是30天。

    你确定你测试的Adwords帐号和你检测的GA帐号已经绑定了吗?如果绑定了试试把cookie都清除干净之后直接访问你们站点然后刷新看看相应的值,清除之后再点击Adwords的广告到你们站点,清除之后再点击organic的结果到你们站点看看有什么结果了。

    你还可以再试试把你的Adwords广告或其他来源的目标URL都用URL Builder指定好utm_source,utm_medium,utm_content,utm_campaign等信息再核对点击之后相应的值。

    utmcsr = campaign source
    utmcmd = campaign medium
    utmctr = campaign term (keyword)
    utmcct = campaign content (used for A/B testing)
    utmccn = campaign name
    utmgclid = unique identifier used when AdWords auto tagging is enabled

  • stephen Hou说道:

    多谢Will Linon 你的回复,因为我上面谈到的信息都是用firefox的 直接看到的cookies信息 发现点击不同的adwords后 有的网站(放了ga)的cookies utmz里面的写的campaign 和medium写的不正确, 所以才有疑问 来这里问的 这里我只是讨论ga的原理 因为最近对这块比较感兴趣 看的比较仔细了 是看cookies kanga是如何工作的

    ps to will Linon 如果你想多了解下 ga 可以看 一本叫 google analytics shortcut的书看完 你肯定受益匪浅的

  • stephen说道:

    补充下 utmcct = campaign content (used for A/B testing)

    对于 source是来自 referral site的 其实utmcct还有一个更重要的作用就是记录来自的这个referrlasite的具体网址的

  • GA用的确实不熟,不过比较同意Will Lin 的说法,对于第一个问题,要是想在GA中正确显示成来源是Bookmark,是不是得等到6个月后了?
    Adwords是30天,GA的Cookie有效期也太长了些吧。感觉不太可能。
     
    顺便说两句Adwords的30天:个人认为,对于一个不同的电子商务网站而言,30天的周期足以记错流量了。

  • Chauncey说道:

    Sidney你好  对于“2 times对应的650是指”这段看的有点晕了~~~
    如果说2 times是访问网站两次的访问者的话,那这列最下面的201+ times不就应该是访问网站201次以上的访问者么?  为什么说吴女士访问了29次呢? 还是不明白第二列是什么意思~~~

    • Sidney Song说道:

      是指从你建立监测之日起,到你统计的当时,有一些人访问了201次以上。
      这些人,在你选取的时间范围内,访问了29次。
      所以有两个时间。201次那个,是“有史以来”。而29次,是这些人在你选定时间内的访问次数。

  • yxl说道:

    非常感兴趣的问一句,你网站发布的文章内部插入的图片是你本人ps的吗/???

  • 美容美发说道:

    初学看着头有点晕,好好研究研究吧

  • Yeti说道:

    最近刚开始学习WA,发现博主这里真是个好地方。

    第一次冒泡,顺便问个问题,GA的Site Overlay,是不是统计不到ajax加载内容的click事件呢?有什么好办法解决吗?

  •  
    Sidney你好,我觉得大家总是被“访问者访问了N次的访问的次数”这样的忠诚度解释绕晕的主要原因是:分不清这个报表中访问者和访问次数的关系。你对times和visits两者分别对应的时间概念讲得非常清晰了,但其实大家都还没理解到区分这两者时间概念的高度上,都还在苦于如何理解visits这个数字背后代表的业务意义。
    其实大家是不是能逆向思维下,从每次访问来分析带来这次访问的幕后访问者。
    例如截取报告时间范围内一共有3次访问(3个visits):
    第一个访问(注意是第一个,不是第一次)背后的访问者是头次造访,那这次访问就贡献给了1 times;
    第二个访问背后的访问者在很久以前(截取报告时间范围之前)就访问过网站一次,那这次访问就贡献给了2 times;
    第三个访问背后的访问者也是头次造访,那这次访问又贡献给了1 times
    由上得知忠诚度(其实叫访问频度更为贴切,毕竟忠诚度是需要多角度进行综合分析才能得来的)的分析报告如下:
    1 times的visits=2
    2 times的visits=1
     
    这样是不是更容易理解些呢?
    再次感谢Sidney给为我们提供了这样宝贵的交流平台。

  • 郑东新区网说道:

    指的是从GA开始统计这个站点起,到你截取报告时间的截止日止,访问了两次的访问者

  • 谢续慧说道:

    哎,可惜google网站在国内经常打不开啊!杯具

  • crystal说道:

    关于nooverride的解释完全不对啊

  • crystal说道:

    我的理解: nooverride=1 是保证不覆盖之前的campaign记录(为空时不算),而非不被覆盖

  • 初学者说道:

    我想问下,1times 下的应该都是新访者了,但是如果选取的时间段内的新访者,访问网站两次,那么要怎么记录呢?
    1 times  1
    2 times  1?

1 包括引用 »

发表评论!

以下,或添加您的评论 trackback 从您自己的网站. 您也可以 Comments Feed 通过 RSS

很好。保持清洁。保持主题。没有垃圾

您可以使用这些标签:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> 

这是一个Gravatar启用博客。为了得到自己的全球公认的,头像,请登记 Gravatar.