Headline »

2016-11-23 – 3:21 下午

这篇文章独家首发在:iCDO(微信公众号:互联网数据官)

  你可能没有听说过Amplitude,但你可能听说过Mixpanel(没有听说过的朋友也没关系,不久的未来我们会有一个专门的文章介绍这家同样很牛的公司),没错,Amplitude是Mixpanel的有力挑战者。在美国,很多用户因为种种原因(后面会说到),从Mixpanel转投到了Amplitude。

Read the full story »
网站分析经验分享

网站分析的逻辑模型,思维方法,实战经验和案例的分享。

网站分析圈子/活动

目前正在每月进行的活动是WAW(网站分析星期三)。此外,所有的网站分析和互联网广告和营销方面的活动也都会在这里通知。

产业动态

网站分析产业有什么新鲜事?中国的网站分析发展到什么状况了?这是这个分类要关注的内容。

网站分析工具

想了解Google Analytics, Omniture以及其他网站分析工具、网络营销监测和分析工具吗?看这里!

招聘动态

这里有招聘信息,也有求职信息。也可以直接给我写信询问更多的工作机会和人才储备。招聘专用邮箱是:sxwuda(at)163(dot)com。

主页 » Featured, 网站分析的基本度量, 网站分析经验分享

新度量–深度互动时间

提交 2009-12-20 – 7:13 下午 23 点评

深度互动--很深很深  在前面的文章提到,仅仅关注 Bounce Rate 是不够的。因为 Bounce Rate 也会被虚假互动所影响。

  市面上有很多流量购买源,可以导入降低 Bounce Rate 的流量。搜索“流量购买”即可查到。

  如果你运营的网站是商业性质的,会购买广告媒介来进行市场和销售的推广与促进,那么你就不得不关注这些看似高质量的流量,并能进行有效的甄别。否则,营销效果是好是坏?如何评估?将无法解答。像句俗话:“被人骗了还帮别人数钱”。

  如何甄别虚假互动呢?网站分析师或者网站管理人员,需要有效的方法论来指导工作。此文将详细讲述另一种流量质量评估的新度量——深度互动时间(Time Spend on Deep Content)。

下面将按照以下逻辑进行叙述:1.发现虚假互动。2.研究虚假互动的特性。3.分析建立模型来进行甄别。4.实证研究,看看模型的效果。

Tenly Wu 版权所有欢迎转载,但请事先在下方评论知会作者,并注明出处]  

1、发现问题:

  在前面的文章提到:网站的Bounce Rate很正常,或者很好,可网站的互动行为却非常的不正常。

  这样的后果是:如果使用不全面、不科学的的分析方法,分析研究结论会被误导为“获得良好的效果”。

2、研究问题:

  研究发现,停留时间是甄别虚假互动的突破口。因为虚假互动可以伪造点击,但是深度的停留时间很难伪装,仔细研究现象就会露马脚。

  以Google Analytics为例,在时间上有很多度量(之前有一篇文章《Google Analytics时间观》)。下面我们以一个图说明“时间上”的问题:

  图中有四种情况,黄色的为Time on Page,蓝色的Time on Site。如果页面的访问深度是1,那么就会有Bounce。访问深度是大于等于2,就不会Bounce。如图中第二种情况,当深度 = 2 时,Landing Page Time on Page = Landing Page Time on Site。注意到第三和四种情况,深度大于 2 后,Landing Page 的 Time on Site 的时间比 Time on Page 更多。原因是访问者通过Landing Page到达后,会进行一系列的互动,在其它页面的互动时间会算在该页面的 Time on Site 这个度量上。

Landing Page Time on Site = 
Landing Page Time on Page + Deep Content A Time on Page + Deep Content B Time on Page + …

时间研究

  互动的更深(访问页面多)更久(各页面停留更久),反映了访问者对内容感兴趣,推广效果、网站运营效果良好。

  现阶段虚假互动能够操作影响到的都是在第一个页面上, 即来到“Landing Page–>停留->点击链接”,我们只需要通过一个度量将这些元素所造成的影响剔除,才可以研究真正的互动程度。

Tenly Wu 版权所有欢迎转载,但请事先在下方评论知会作者,并注明出处]  

3、建立解决模型:

Average Time Spend on Deep Content =
( Landing Page Time on Site – Landing Page Time on Page ) / Landing Page Pageview

公式简单说明:登陆页的全站停留时间,除去登陆页的页面停留的时间。余下的时间就是访问者在页面其它深度页面的停留时间。然后除以这个登陆页的浏览量,则可以求得一个平均的深度互动时间。这个值反映了平均每个访问者,点击登陆页内容后,除掉在登陆页的时间外,在网站上其它页面花的时间长短。有效的剔除了容易被“虚假流量”影响的登陆页停留时间这个度量。

4、实证模型:

举例:建立自定义报告(可以自行定义,但保证Entrance是第一个度量,这样可以保证主要的 Landing Page 显示在前面,也要保证 Time on Page、Time on Site 和 Pageview 这三个度量选中,以便新度量的计算。

下面是我建立的自定义报告共享连接:

http://www.google.com/analytics/reporting/edit_custom_report?share=P01MqyUBAAA.5cmZVfTgv7FSDQaf3SApcOxsrvVFOMhXTyWae26xzB8D2OsZLRP6CRorB5cbkn53KnEyuJAzLj-2rfM18IeuWw.-djiSrTR40xr_JrPt1z4Ow

使用新度量后,虚假互动就原形毕露

  套用了新度量进行不同的媒体的评估就显得很清晰了。原来左边第一个 Bounce Rate 特别的好,可是在 Average Time Spend on Deep Content 这个度量上,显得特别的低,开始矛盾了。这说明,最左边的流量中含有大量的虚假互动。

  那么这个度量值在多少属于差?多少属于好呢?

Tenly Wu 版权所有欢迎转载,但请事先在下方评论知会作者,并注明出处]  

  下面是我们的经验值:对于一些有广告推广的网站而言,低于 1 秒就是很差了,说明推广的效果非常差。5 秒以上就是很不错了。

  你知道宋星的这个博客:Chinawebanalytics.cn的深度互动时间么?123秒。也欢迎大家把你的博客的深度互动时间与大家分享。

  没错,这个度量很好的扩大了真流量与虚假流量的差距,这种杠杆方法常用在统计学研究中当中。

  俗话说:偏之毫厘,差之千里。那么一点点的具有虚假互动性质的流量,都会对这个度量有明显的影响。

  像老虎的猫,终究是猫。所以流量的质量是客观的,好与不好,换个方法照样能把它甄别出来。

  由于时间仓促,文章只将概要的思路与大家分享,欢迎大家拍砖或提问,我一一为你解答。或者不足的地方还请大家留言帮助我完善。实在留言解答不了的问题,可以 Gtalk 联系我。谢谢!

Tags: , , , , ,

23 点评 »

  • Sidney Song说道:

    谢谢Tenly在我休假的时候的努力分享。完全是工作中的实践创造所得,具有极高的原创性和实用性。赞一个!

    类似的方法还有热图,访问路径分析(Pathing Analysis)。但这个方法是最好用的,尤其是结合GA的自定义报告功能。

    晚一些跟大家分享我休假的照片!:)

  • alibuybuy说道:

    好文,转载到alibuybuy.com

  • ady说道:

    文中的实证模型是直接可以用GA的自定义报告来实现吗?如果是的话具体怎么设置?我自己尝试时都不知道要把哪个指标拖放到哪个地方,不知是否有稍微详细点的设置操作文档。谢谢您的分享。

    • Tenly说道:

      点击分享的自定义报告链接.我已经把度量与维度设置好了.
      你只需要保存使用.然后就能应用报告.再接着把报告导出来.进行计算.

  • 且歌说道:

    如果用户从landing page进入下一页,然后没有进入第三页就关闭浏览器了,google analytics可以统计到第二个页面的浏览时间吗?

  • butcherblow说道:

    改版帅气~可喜可贺

  • Kevin说道:

    额。。今天碰到一个网站 把google分析代码放在<head>里,开始我以为是新的功能 异步。但他是standard 的分析代码。SEOMOZ.ORG 这个站,这个是什么原因啊?

    • Tenly说道:

      GA本来的标准代码就是可以放到里面的,这是合法的,因为GA的电子商务监测方式就需要加到里面。
      有的GA甚至加在之后,虽然不标准,但也会有数据。

  • 月瑞网说道:

    有收获  多学习下

  • 育儿网说道:

    谢谢您的分享。……….

  • SEO说道:

    我自己算了一下自己博客的深度访问时间,1.3秒!
    博主的博客就是厉害,需要学习的地方太多了。
     

  • PhilHu说道:

    关于第三点建立模型。如果“然后除以这个登陆页的浏览量”,由于浏览量的本身含有虚假的流量,那么实际上你没有剔除虚假流量的影响,你只是剔除了分子(时间)的影响,没有剔除对于分母(流量)的影响。我这样理解对么?请指教。

    • Tenly说道:

      对的。因为流量无法区分真正假,所以才有这样的方法。作弊流量越多,分母越大,时间越短。真正有价值流量越多,看的内容越多,记录的时间就越多,分子越大,时间越长。

  • PhilHu说道:

    那么如果判断呢?是说这个值越小说明虚假流量越大么?但由于我们无法知道虚假流量的比例,从而我们虽然可以得到一个值,但仍然无法判断。除非你有一个经验的BENCHMARK值?

    • Tenly说道:

      文章中给了一些参考。最关键的是自己与自己趋势上比较,或者不同流量来源上进行比较。这个值与bounce rate一样,其实没有所谓的benchmark。

  • PhilHu说道:

    了解了。谢谢。

  • 肥兔说道:

    郁闷,有不少landingpage的Time on Site<Time on Page,和Landing Page Time on Site的算法不太符合,不知道如何解读。

  • 太平裂碑说道:

    为什么我用这个跑出来的报告出现了 Page Time on Site < Page Time on Page, 这样的话出来的结果就是负的了,感觉这个报告是有问题的。难道是GA的算法出了问题吗?求解答。
    如果以page作为dim的话,应该来说这种情况不会发生的吧?

  • 雷大少说道:

    宋老师,请教一下,为什么我按照你的方法做,到了第三步算出来的值才0.005,那么到第四步就没意义了。(PS:我用的是百度统计工具)

  • sonic说道:

    宋老师,你好啊,我是一个新手,我对监测网络广告虚假流量这块很感兴趣,但是这篇文章中的共享自定义报告访问不了,请问能再一次生成吗?谢谢

  • zero说道:

    请问下,“3、建立解决模型”中的“登陆页的全站停留时间 跟 登陆页的页面停留的时间 有什么区别? 我不能理解。比如,登陆页A的全站停留时间,跟登陆页A的页面停留时间,这两个概念 读起来 是一个意思啊。 而且,我看到这篇文章是在 2009年的时候发表的,现在是2016年了,在Google Analytics中,我找不到 Time on Site 这个指标。请问我该怎么做才能弄出文章中的 实证模型。 

    希望得到回复,非常感谢!

     

3 包括引用 »

发表评论!

以下,或添加您的评论 trackback 从您自己的网站. 您也可以 Comments Feed 通过 RSS

很好。保持清洁。保持主题。没有垃圾

您可以使用这些标签:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> 

这是一个Gravatar启用博客。为了得到自己的全球公认的,头像,请登记 Gravatar.