Headline »

2016-11-23 – 3:21 下午

这篇文章独家首发在:iCDO(微信公众号:互联网数据官)

  你可能没有听说过Amplitude,但你可能听说过Mixpanel(没有听说过的朋友也没关系,不久的未来我们会有一个专门的文章介绍这家同样很牛的公司),没错,Amplitude是Mixpanel的有力挑战者。在美国,很多用户因为种种原因(后面会说到),从Mixpanel转投到了Amplitude。

Read the full story »
网站分析经验分享

网站分析的逻辑模型,思维方法,实战经验和案例的分享。

网站分析圈子/活动

目前正在每月进行的活动是WAW(网站分析星期三)。此外,所有的网站分析和互联网广告和营销方面的活动也都会在这里通知。

产业动态

网站分析产业有什么新鲜事?中国的网站分析发展到什么状况了?这是这个分类要关注的内容。

网站分析工具

想了解Google Analytics, Omniture以及其他网站分析工具、网络营销监测和分析工具吗?看这里!

招聘动态

这里有招聘信息,也有求职信息。也可以直接给我写信询问更多的工作机会和人才储备。招聘专用邮箱是:sxwuda(at)163(dot)com。

主页 » 基础知识

Direct Traffic真的是直接流量吗?如何辨识真正流量来源?

提交 2009-07-20 – 9:40 下午 33 点评

   Direct Traffic(直接流量)是一种非常特殊的流量来源,我们对它又爱又恨。我们喜爱它,是因为这种流量的质量通常是很高的,它似乎属于各种流量中的贵族;我们“恨”它,是因为这是一种难以作出有效分析的流量,它无法被继续细分,我们也无法知道这些流量到底是访问者做了什么样的行为产生的。

  因为无法被继续细分,所以Direct Traffic的真面目其实被蒙蔽了,而Google Analytics对于Direct Traffic的解释又无疑加深了这种误解。我们先看看GA是怎么解释的: How do the people who clicked a bookmark to come to your site or typed your site URL into their browser compare to the "average" visitor to your site? Direct traffic can include visitors recruited via offline (i.e. print, television) campaigns.(Direct Traffic用来衡量那些通过收藏夹或者在地址栏中输入网站URL的访问(者),以及这部分访问(者)跟网站其他访问(者)之间的差异。直接流量能够包括那些通过线下营销宣传找到网站的访问者)。

  这个解释明确的告诉我们,Direct Traffic是来自“收藏夹”和“地址栏”的流量,但事实真的如此吗?

[版权归作者Sidney Song所有,欢迎转载,但请事先告知作者并注明出处]

  • Direct Traffic不仅仅是直接流量

   这么说的原因很简单,Direct Traffic的意思是,所有那些没有预先做好标记,而且网站分析工具也没有能够获得流量源头DNS服务器信息的那些流量。在浏览器的地址栏中直接输入网址或者是通过收藏夹来实现的访问当然属于这一类,但是除此之外,因为种种原因网站分析工具没能获得流量源头的信息的话,这些流量也都可能会被计入Direct Traffic。

  大家可以做一个小小的实验。这个实验感谢Actionable Analytics的Jonny(也是他启发了我写这个文章)。

  首先,打开任何一个知名的门户,比如新浪。新浪的首页上有各种广告,建议大家每一个都点击一下。然后会打开多个厂商的页面。现在,请大家在每一个页面的地址栏中输入:“javascript:alert(document.referrer)”然后按回车,大家会看到什么?

  每个网页都会弹出一个窗口,有的窗口中间有显示:http://www.sina.com.cn,有些则完全是一个白板,如左图所示。

  如果弹出窗口中间显示了URL,那就表明,新打开的页面的referrer已经被记录了下来,这样在网站分析工具中的referrer报告中,也就能够显示它的正确流量源头;可是,如果弹出窗口是一个白板的话,那就说明referrer信息没有被记录下来,网站分析工具很可能就会把次访问的来源记为Direct Traffic。

  如果你在不同的浏览器中尝试不同的网站的广告,你会发现,出现白板窗口的几率是非常大的,而且似乎没有什么规律可言。这说明,网站分析工具中的Direct Traffic可能存在很大的不确定性,而GA的定义是不准确的。

  的确,如果大家使用过Omniture的话,会发现Omniture中,并没有用Direct Traffic表示直接流量,而是用unspecified这个词替代了。也就是说,Omniture不默认这些流量一定就是Direct的,而是认为它们可能属于Direct,但更确切的应该属于那些无法辨识来源的(Unspecified)流量。如下右图所示:

  因此,如果我们认为GA中间的Direct真的完全是直接流量的话,是不准确的,而且会影响到我们对于那些真正的直接流量的研究。

  那么,如何能够保证在Google Analytics中的Direct Traffic完全是真正意义上的直接流量呢?

[版权归作者Sidney Song所有,欢迎转载,但请事先告知作者并注明出处]

  由于流量来源本身的不确定性,保证Direct Traffic 100%名副其实是非常困难的。有经验的站长都知道,总有一些流量是莫名其妙的,我们很难分析,而它们有的确客观存在。尽管如此,我认为,我们能够通过一些有效的方法来降低非直接流量混入Direct Traffic中间,或者把那些本来不是Direct Traffic的流量标识出来。这样,可以帮助我们尽量降低误差。

  那么,如何能够辨识这些非Direct Traffic真正的流量来源呢?目前我常用的方法,有三种,至于是否好用,在什么情况下使用,依据具体的条件不同,可能回答很不一样。另外,跟我以前的讨论帖一样,我的三个方法提出后,也希望大家能说出自己的好方法。

  • 1. 在流量源头上做标签(标记)

   这种方法是我们最常使用的方法。这个方法对于那些特别依赖于网络推广的网站尤其有用。如果大家使用Google Analytics,那么大家可以使用UTM标签,方法简单,操作方便,而且数据直接显示在报告中,会让你非常有成就感。嗯,具体的方法嘛,请看我的这个帖子:用Google Analytics的Link Tag深入了解流量来源(广告)的质量,内容很详细。

  除了Google Analytics,Omniture也使用了类似的方法,不过,毕竟是收费工具,标签上能够包含的信息量比Google Analytics要多了太多了,这样更有助于我们根据不同的维度来做细分研究。另外Omniture的这种标签(tag)是可以自定义的,有些朋友在使用形如"?cid="这种格式的saint tag标签,还有些朋友则在使用jumpid的标签,但是本质上是一样的。当然,我非常推崇saint tag标签。

[版权归作者Sidney Song所有,欢迎转载,但请事先告知作者并注明出处]

  有了saint tag,当你做好标记后,Omniture的报告能够显示的维度多达20多个(如下图所示),而且还能够根据你的特殊需求定制化的增加。正常需求不在话下,变态需求应该也没问题了。功能的强大、可定制以及极为细化是为什么Omniture尽管不免费,却仍然占有极高市场的原因之一。

图:Omniture可以极为细致的细分网站流量的来源

  • 2. 利用多个首页或多个域名

  在某些情况下,你的网站不是靠网站推广,而是靠线下推广,或者是靠互联网自发的引用和朋友推荐等。这时你已经不再可能为每个源头都做好标记,我们该怎么辨别那些自发的流量?

  一个好的方法是利用多个首页或者域名来标识。例如,如果我要做我的网站的线下推广,我会呼吁那些看到我线下广告的朋友通过域名“www.wac.cn”来访问我的网站(www.chinawebanalytics.cn),你会发现这两个URL是不同的。如果我有多个线下推广的渠道,比如电视,杂志以及楼宇广告,我会分别给他们不同的域名:“www.wac.cn/1; www.wac.cn/2; www.wac.cn/3”来招呼他们——这样尽管我在网站分析工具中的traffic source报告中不能细分他们,但我可以通过top landing page报告来细分他们,尽管不一定是100%纯净,但是已经能够做到相当精确的细分了。这种方法,不但能够帮我们打开Direct Traffic的黑盒子,也是帮助我们间接衡量线下推广的一个好方法。

图:线下推广用简单的URL,并且编号区别于其他的推广方式。注:图片仅是例子,请大家不要访问这个臆造的网址

  同样,即使是线上推广,这样的方法也是可以尝试的。例如,你可以设置一个小程序,在网页上生成一个收藏按钮,并且把被收藏的URL设置为一个与当前网页URL不同的另外一个(当然,前提是你得保证两个URL都能正常打开你的网页),这样就能够获知一部分direct traffic中真实的收藏了你的网站的访问者了。此外这个方法也能用在朋友推荐、文章引用以及交换链接等领域,你需要做的是给各种情况不同的landing page URL。

[版权归作者Sidney Song所有,欢迎转载,但请事先告知作者并注明出处]

  当然,这种方法并不足以精确探知Direct Traffic的构成,毕竟互联网的流量来源很混杂,而且长尾原理已经告诉我们想要搞清楚长尾里面厘米都是些什么是很困难的。但是,这个方法至少能够帮助我们相当程度的降低Direct Traffic的不可知性,并帮助我们根据数据的趋势进行优化。因此,我仍然认为这是一个好方法,如果你不怕copy多个首页或是建立多个URL的麻烦的话。

  •  3. 利用DoubleClick等工具的Post-Click Activity功能

  这个方法需要除了网站分析工具之外的广告监测工具,可能很多朋友无法尝试。但是就这个方法本身而言,是一种网络营销推广极为常用的流量监测方法,而且我认为是最为精确的。

  以DoubleClick为例,目前DoubleClick使用FloodLight(Spotlight的升级版工具)作为Post-Click Activity的监测工具。这种工具的原理是在广告点击之后的登陆页面,以及登陆页面之后的所有页面或是Flash中加上代码,然后这个代码能够和DoubleClick的广告代码协同工作,记录不同广告访问每个页面(Flash)的情况。

 

图:FloodLight工具的一个截图片段,最右边的(Expected URL)是所有能够被Track流量源头的页面

  FloodLight的代码与GA的代码添加方法比较相似,但是代码的内容更加简单,功能也很单一——就是记录广告流量进入网站之后在各个页面的穿梭情况。不过,也正是因为这种简单的代码和单一的功能,使它在监测广告流量方面非常准确。另外,与Google Analytics的Traffic Source功能相比,FloodLight的优势在于能够知道每一个页面(甚至Flash中每一个点击)的流量是从源于哪个广告或是流量源头,而且数据十分准确;但是Google Analytics则只能使用Content ->Top Content -> Entrance Sources报告来辨识具体到页面级别的流量源头,而且数据很可能只是sample值(取样值),这样准确度就大大降低了。

图:GA的取样值,Entrance Sources的准确性大大降低

[版权归作者Sidney Song所有,欢迎转载,但请事先告知作者并注明出处]

   FloodLight的另外一个无可比拟的功能,是能够直接嵌入Flash文件中,监测每一个Flash互动的流量源头。这一点Google Analytics要做到也非常困难,但是FloodLight就十分容易了。根据不同的Flash的版本,在Flash中嵌入FloodLight的相应代码,所有的flash的互动来自于什么广告/流量源都会被记录下来,这对于优化广告以及其他网络的推广是非常有帮助的。

  好了,3个方法说完了。大家有没有更好的主意?或者文章中有什么不正确的,以及你的任何其他想法,都请——给我留言吧!

Tags: , , , ,

33 点评 »

  • 网页游戏说道:

    好东西。。。先学习一下。。。

  • stephen hou说道:

    茅塞顿开 原来还可以使用javascript:alert(document.referrer) 这样的语句查看 学习了 一直觉得这个direct traffic 没那么简单 现在明白 原来还有这么多误差 多谢博主高质量的文章

  • 老菜鸟说道:

    呵呵,根据我的经验,GA的Direct Traffic的来源主要有以下几种情况:
    1、弹窗;
    2、IM、Email群发内容中的链接;
    3、站内、站外Flash、视频文件中的链接;
    4、客户端软件上广告,比如迅雷上的广告链接;
    5、直接输入网址、点击收藏夹中的链接;

    除了5,其他几项我们都可以使用UTM标签来分别标识

  • gavin说道:

    技术方法不是问题,主要是要知道有这样的情况,并且了解自己的业务的“直接进入”中有哪些并不是真正的直接进入,找出这些并打上标签。

  • chrisy说道:

    谢谢楼主的解析,确实了解数据的内容很重要。

    我现在的做法是把网站流量分成:1)外部投放2)SEO 3)带访前的外部自由链接4)“direct”
    ,如楼主所说direct其实包含了多种情况,但都无法捕捉到访前。
    只要是在外部投放的,都可以加标识区分
    sms短信和线下活动使用短地址区分
    再去除掉SEO流量和可识别访前的流量,“direct”应该也和我们通常认为的直流量差不多了

  • David.wu说道:

    如果是投入了很多离线广告,例如地铁平面广告。那么这些类型的广告也可以产生更多的直接流量,但是我们确不知道这个广告到底从哪个营销渠道过来的;通常可以采用 http://www.inidc.net/lixian
    这种方式来标记离线广告,但是确把用户输入的URL复杂化了。许多东西都是很难两全的。要兼顾用户的良好体验,又要做更精准的营销统计,在离线营销统计中,似乎只能取其一!

  • gavin说道:

    对,我也同感david的意思,通过不同的url来代表不同的离线营销,这个实在是不太可取的手段,因为用户很难记住这些没有什么含义的url,也不利于网站的品牌宣传。
    至于打标签,我个人建议大家可以采取A.B.C.D这种方式,按层级来划分会比较清晰,供大家参考哈。

  • gavin说道:

    觉得sidney这个个人博客所说到的方面非常丰富,而且都能说到点上,并非泛泛之谈,希望可以和sidney交个朋友,多多请教学习。我是在一家大型互联网公司主持网上用户行为(点击流)的分析,虽在这个领域有三四年的经验,但也只是入门级而已,另也觉得国内这方面的书籍、交流圈都非常之少,大多处于起步阶段。
    我的QQ是22878095

  • 美心说道:

    好深入的流量分析总结,虽然用GA,但也只停留在表面的应用。如果是深入的了解广告效果,还真的是不知从何入手。

  • Min Guo说道:

    线下推广的那部分讨论非常有意思。

    我记得好像看到过HSBC有个电视广告推广他们的网站的广告,他们的方法是创建了一个全新的域名,一个和广告词配合,比较容易记住的域名,不一定要很短。这个方法不好的地方在于流量都跑到一个新的域名了,也许不是很适合网站,而适合branding。

    还有一个方法是把推广的地区作为一个segment来观察,可以和历史数据对比。

  • Eric Zhao说道:

    太好了,这篇博文及其跟帖启发很大啊。我经常遇到莫名其妙的大量Direct Traffic,由于是突发的,网站内容也是不断更新调整的,所以不能用Saint tag等博主所说的3种方法解决。另外,经过实践,我再补充“老菜鸟”一条:iframe方式嵌套带来的流量,有时候也会由于失去refer从而造成direct假象。

  • xslidian说道:

    哈 Chrome 中右键选择“隐身模式打开”也是不记录 referrer 的

  • Leon说道:

    请教一个问题,如果我在链接上加了GA的Link Tag,那这个流量还会被记为Direct Traffic吗?

  • Eric Ho说道:

    Sidney,你好,刚接触网站分析不知道怎么下手,看了你的博客学到不少;公司也刚买了Omntiure软件开始进行网站分析的研究,希望你能推荐一些围绕Omniture软件进行网站分析的资料(类似于http://www.chinawebanalytics.cn/)与教程(国语的更好,O(∩_∩)O~)。。。先拜谢咯

  • 爱车易购说道:

    "javascript:alert(document.referrer)" 这个代码测试不了啊,我每次输入按回车都跳到搜索引擎上去了

  • Luhental说道:

    第二个方法如果复制首页可能会造成duplicate contents影响SEO吧?还是用不同URL比较好。

  • alanling说道:

    我试了下,直接流量是依靠HTTP请求时候的referrer来的。我使用的是chrome,发现如果是直接左键点击的话是referrer是有值的,但是如果是右键点击选择在新标签页打开,那么referrer就为空。

  • 混凝土起砂说道:

    茅舍顿开,现在公司的流量主要是SEO和线下活动,现在仅仅是通过流量进入的关键词进行区分。(用公司品牌名进入就算线下活动-业务员,广告等。的功劳)
    现在学习网络更多的推广方式,博主的方式尽快实践起来。

  • yangxiao说道:

    哈哈 ,学习了!不过方法二中,使用多个URL不晓得对SEO有什么影响,研究一下。

  • 小马说道:

    当然,这种方法并不足以精确探知Direct Traffic的构成,毕竟互联网的流量来源很混杂,而且长尾原理已经告诉我们想要搞清楚长尾里面厘米都是些什么是很困难的。

    老师:长尾里面厘米(这个厘米是多长来的字吧)

  • juju说道:

    老师,请教下:判断直接来源时,遇到了一个问题,就是referer会莫名丢失,技术上有什么办法可以降低referer丢失率吗?

  • shbqiu说道:

    你好,宋老师,想问你个问题,最近我们的直接流量掉了很多,但是直接流量这一块又不好追踪,根据您的经验能不能给出点指导看下是哪方面的问题?

  • aotyo说道:

    Sidney, 你好!

    第3个方法“以及登陆页面之后的所有页面或是Flash中加上代码”其中的所有页面是指整个网站还是所浏览的所有网页?应该是后者吧。

    “记录不同广告访问每个页面(Flash)的情况” 这个括号内的flash是仅指,还是包括啊

    初学者,见笑了。

    好网站,好博客,好Sidney,每天必顶     (*^__^*) 嘻嘻……

     

  • Direct流量着陆页问题说道:

    hi Sidney Song,不知道现在你是否还会回复留言,从你的文章中学到了很多GA方面的知识,tks.

    我对Direct流量有很多疑问,这部分流量很多时候难以分解,比如从着陆页这个维度看Direct流量,发现很多着陆页面,几乎不可能是手敲URL,从页面内容也排除收藏夹点击的可能,那么要从什么角度考虑呢?

7 包括引用 »

发表评论!

以下,或添加您的评论 trackback 从您自己的网站. 您也可以 Comments Feed 通过 RSS

很好。保持清洁。保持主题。没有垃圾

您可以使用这些标签:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> 

这是一个Gravatar启用博客。为了得到自己的全球公认的,头像,请登记 Gravatar.