Headline »

2016-11-23 – 3:21 下午

这篇文章独家首发在:iCDO(微信公众号:互联网数据官)

  你可能没有听说过Amplitude,但你可能听说过Mixpanel(没有听说过的朋友也没关系,不久的未来我们会有一个专门的文章介绍这家同样很牛的公司),没错,Amplitude是Mixpanel的有力挑战者。在美国,很多用户因为种种原因(后面会说到),从Mixpanel转投到了Amplitude。

Read the full story »
网站分析经验分享

网站分析的逻辑模型,思维方法,实战经验和案例的分享。

网站分析圈子/活动

目前正在每月进行的活动是WAW(网站分析星期三)。此外,所有的网站分析和互联网广告和营销方面的活动也都会在这里通知。

产业动态

网站分析产业有什么新鲜事?中国的网站分析发展到什么状况了?这是这个分类要关注的内容。

网站分析工具

想了解Google Analytics, Omniture以及其他网站分析工具、网络营销监测和分析工具吗?看这里!

招聘动态

这里有招聘信息,也有求职信息。也可以直接给我写信询问更多的工作机会和人才储备。招聘专用邮箱是:sxwuda(at)163(dot)com。

主页 » 基础知识

网站分析的最基本度量(3)——网站分析工具如何辨别UV

提交 2008-01-19 – 11:43 下午 17 点评

   在关于UV的上一个文章中(网站分析的最基本概念(2)——UV的概念),我们留了一个尾巴。那就是网站分析工具是如何能够知道哪些Visits是来自于同一个Unique Visitor的。现在就让我揭开这个谜底吧!

  其实,非常简单。亲爱的读者朋友,可能你已经猜到了。

  有两种方法。但在讲这两种方法之前,必须要清楚一个概念,那就是服务器和浏览器(B/S)的概念,如果你已经清楚的了解这个概念。没关系,直接跳过下面的斜体字内容吧!【点击标题阅读全文】

  我们都知道我们在浏览网页的时候,网页是要通过浏览器(Browser,简写为B)来显示的。但是网页真正的存放地址肯定不是在你自己的电脑上(废话,如果这样还要网线干什么,每月也不用给电信局交钱了),而是在某一个遥远的地方(就如同电视节目不在你自己家的电视机里,而是在遥远的电视台一样)。这个遥远的地方有一个很高级的电脑,里面存放了很多的网页内容,这个电脑叫做服务器(Server,简写为S),或者更确切说叫网站服务器(Web Server),而你自己的电脑叫做客户端。当打开一个网页的时候,需要首先打开客户端的浏览器,然后在浏览器的地址栏输入你想上的网站的地址,此后你的浏览器就会通过我们伟大的互联网(Internet)立即给相应地址的网站服务器的发一个请求(Quest),然后那个网站服务器接到这个请求后就会把它保存的相应的网页(Page)的代码(Code,主要是HTML Code)发到你的浏览器上。而浏览器有一个神奇的功能,那就是把这些Code变成可以供你阅读的文字(Text),链接(Link),图片(Graphic),音乐(Music)或者是视频(Video)。这就是为什么你能访问互联网,也能够看到我的这个博客的原因。当然,其中的过程比我这一段文字要复杂的多,而且我的解释并不是100%的实际过程的再现。不过你能理解这样一个过程就足够了。

[转载请事先声明并得到许可,版权归作者所有。]

  那么,网络分析软件有哪两种方法分辨出Unique Vistor呢?

  方法一:让网站服务器分辨

  道理很简单,网站服务器每时每刻都会接到很多的页面请求,每一个请求信息内都包含了你的(实际上是你的电脑的)一些信息。这些信息包括很多内容,比如你的IP地址(呵呵,IP地址就不用我解释了吧,不知道就当它是你的计算机在互联网上的一个门牌号码吧!)、你发出请求的时间、你的浏览器的版本、你的操作系统的版本,以及其他一些古古怪怪的信息(实际上都是有作用的哦,只是我们现在没必要弄清楚它们)。

  网站服务器可以分析这些Request,如果这些Request满足一些共同的特征,比如来自同一个IP地址,且浏览器版本相同,或者再加上发出请求的时间接近等,它就认为这一串的Request对应的一系列Visits是来自于同一个Visitor的,这个Visitor就成为这些Visits的UV了。

  当然,如何定义这些共同的特征是由网站服务器的设置决定的。一般而言,用IP地址+其他特征共同限定来定义的情况比较多,但是IP地址实际上并不准确,尤其在局域网内有共用IP地址的多台计算机的情况发生的时候。不过,聊胜于无了!

[转载请事先声明并得到许可,版权归作者所有。]

  方法二:用Cookie分辨

  另外一个方法使用Cookie的方法分辨。什么?什么是Cookie?不了解Cookie就查一下Google或者Baidu吧!我就不解释了,说起来话挺长的。

  怎么分辨呢?当客户端第一次访问某个网站服务器的时候,网站服务器会给这个客户端的电脑发一个Cookie,放到这个电脑的某个区域,一般是C盘里。这个Cookie会分配给你一个独一无二的编号,还会记录一些你访问服务器的信息,例如访问时间,访问了什么网页,以及与你这次访问有关的其他一些信息。当你下一次再访问这个服务器的时候,服务器就可以直接从你的电脑上找到上一次它放进去的这个Cookie,并且会对它进行一定的更新,但那个独一无二的编号不会改变。如果一段时间内,服务器发现两个Visits的对应的Cookie实际上是一个编号,那么,服务器就知道,尽管在这段时间内有不少次Visits,但都来自于一个客户端,那么一定就是一个Visitor了!

  这个方法比上一个要更精确些。但是存在的问题是,有些客户端为了保证更高级别的安全,关闭了Cookie的功能,或者你经常删除Cookie,这个方法就不能奏效了。

  因此,这样看来,两个方法都只能得到UV的近似值,但是不能得到精确值。什么?想要百分之百精确?那……除非进行一次100%准确的普查(这实际上也是不可能的),或者只有上帝知道了。

Tags: , , , , ,

17 点评 »

  • yorking说道:

    如何确定一个访客在网站的用户行为分析中非常重要!
    一般的,使用网站会员ID比cookieid准确,因为cookieid只是标识一台机器,并不是一个人,cookieid会被清除但只要他登录网站memberid是不会变的。
    因此,首先用会员id表示访客,其次使用cookieid标识非会员访客,这也有利于将会员和非会员区分开。
    如果用户清除cookie,可以将用户的cookie信息保留在如flash的目录中,用户登陆网站的时候从flash中取回他的cookie信息,当然这样做涉及用户隐私,这不是技术层面的问题,涉及法律和互联网的原罪。

  • jieyancai说道:

    cookie判断的问题:
    1.客户端关闭了Cookie的功能
    2.经常删除Cookie(现在的浏览器有方便的cookie清除功能和自动清除设定功能)
    3.同一个访客采用不同浏览器浏览同一个网站,cookie值是不同的,而IP是相同的,哪个更准?

    IP判断的问题:
    1.局域网内IP不同,有时候可以获取内网IP。
    2.每次拨号上网分配的IP不同。

    IP和cookie到底哪个跟适合用来判断唯一访客?无法用一个单一指标准确判断,但唯一访客的数量基本介于cookie数和IP数之间。
    基本可以这么认为:
    1.cookie相同,IP不同,同一个访客
    2.cookie不同,IP相同,可能是同一个访客,比如用了不同浏览器,或清除了cookie等情况
    3.cookie不同,IP不同,可能不是同一个访客,比如重新拨号然后又用了其它浏览器上网等情况
    4.cookie相同,IP相同,同一个访客

  • sutrong说道:

    的确不能得到精确的值

  • Jesse说道:

    同意1楼:
    利用Flash的方法,确实是一个好的技术解决方案,不过涉及的隐私问题要斟酌啊~

  • supertjq说道:

    我是新手,发现这个博客文章写的浅显易懂。非常适合我。谢谢分享。

  • cooper说道:

    你好,请教一个问题,不管是以IP还是利用cookie来记录UV,UV应该都是有一个时间概念的吧,比如24小时重新计算一次,是不是这样?多谢!

  • 蚂蚁说道:

    用网站统计工具看呢?大概差不多吧比如  cnzz

  • brunktang说道:

    楼上说的时间维度应该是你查询区间或者叫定义的时间,不存在系统自己定义时间的问题

  • 一文鱼说道:

    IP可以变化,不过IP段还是基本不变的,这个也可以作为辨别的一个参考依据。感觉确实需要结合多个元素一起进行分析。
     
    不过什么都存在一点误差,应该不必深究。

  • feiwuji说道:

    据说现在可以记录用户网卡的编号,这样似乎更精确一些,但是又会影响网吧用户的访问情况。

  • 陈玉龙说道:

    两种方法没有一个是100%准确的。要是键盘和鼠标可以识别指纹就好了,这个就百分百了。。。囧~~~~
    留下脚印下次学习。

  • Inernet新手说道:

    "当客户端第一次访问某个网站服务器的时候,网站服务器会给这个客户端的电脑发一个Cookie,放到这个电脑的某个区域,一般是C盘里。这个Cookie会分配给你一个独一无二的编号,还会记录一些你访问服务器的信息,例如访问时间,访问了什么网页,以及与你这次访问有关的其他一些信息。"
    我是新手,请问这一整段话该怎么理解?或者说具体该怎么样判断呢?可否提供关键示例代码引导?

  • 后知说道:

    流量统计工具利用cookie的还是多点吧     

  • 杨旭说道:

    您好,我想跟各位老师请教下,如果我用百度统计查看一段时间(如3个月)UV总数,那么【UV总数/天数=日均UV】这个公式是否成立?另外,日均uv这个数据有意义吗?新手提问,贻笑大方了!

  • Cookies能看到用户哪些信息?说道:

    宋老师,文章提到了cookie,我知道cookie是一串文本数据。那它到底能看到用户的哪些信息呢?像用户名、密码还有哪些?

    谢谢,盼复。
     

  • Tony-Digital Marketing说道:

    您好 宋老师 

    我想问一下首先在user-agent 相同的情况下 IP 段 1.168.111.0 和 1.168.111.1 这两个IP 段 可以认为是同一个地址吗?

1 包括引用 »

发表评论!

以下,或添加您的评论 trackback 从您自己的网站. 您也可以 Comments Feed 通过 RSS

很好。保持清洁。保持主题。没有垃圾

您可以使用这些标签:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> 

这是一个Gravatar启用博客。为了得到自己的全球公认的,头像,请登记 Gravatar.