Home » 基础知识

网站分析的最基本度量(3)——网站分析工具如何辨别UV

19 一月 2008 11 Comments

   在关于UV的上一个文章中(网站分析的最基本概念(2)——UV的概念),我们留了一个尾巴。那就是网站分析工具是如何能够知道哪些Visits是来自于同一个Unique Visitor的。现在就让我揭开这个谜底吧!

  其实,非常简单。亲爱的读者朋友,可能你已经猜到了。

  有两种方法。但在讲这两种方法之前,必须要清楚一个概念,那就是服务器和浏览器(B/S)的概念,如果你已经清楚的了解这个概念。没关系,直接跳过下面的斜体字内容吧!【点击标题阅读全文】

  我们都知道我们在浏览网页的时候,网页是要通过浏览器(Browser,简写为B)来显示的。但是网页真正的存放地址肯定不是在你自己的电脑上(废话,如果这样还要网线干什么,每月也不用给电信局交钱了),而是在某一个遥远的地方(就如同电视节目不在你自己家的电视机里,而是在遥远的电视台一样)。这个遥远的地方有一个很高级的电脑,里面存放了很多的网页内容,这个电脑叫做服务器(Server,简写为S),或者更确切说叫网站服务器(Web Server),而你自己的电脑叫做客户端。当打开一个网页的时候,需要首先打开客户端的浏览器,然后在浏览器的地址栏输入你想上的网站的地址,此后你的浏览器就会通过我们伟大的互联网(Internet)立即给相应地址的网站服务器的发一个请求(Quest),然后那个网站服务器接到这个请求后就会把它保存的相应的网页(Page)的代码(Code,主要是HTML Code)发到你的浏览器上。而浏览器有一个神奇的功能,那就是把这些Code变成可以供你阅读的文字(Text),链接(Link),图片(Graphic),音乐(Music)或者是视频(Video)。这就是为什么你能访问互联网,也能够看到我的这个博客的原因。当然,其中的过程比我这一段文字要复杂的多,而且我的解释并不是100%的实际过程的再现。不过你能理解这样一个过程就足够了。

[转载请事先声明并得到许可,版权归作者所有。]

  那么,网络分析软件有哪两种方法分辨出Unique Vistor呢?

  方法一:让网站服务器分辨

  道理很简单,网站服务器每时每刻都会接到很多的页面请求,每一个请求信息内都包含了你的(实际上是你的电脑的)一些信息。这些信息包括很多内容,比如你的IP地址(呵呵,IP地址就不用我解释了吧,不知道就当它是你的计算机在互联网上的一个门牌号码吧!)、你发出请求的时间、你的浏览器的版本、你的操作系统的版本,以及其他一些古古怪怪的信息(实际上都是有作用的哦,只是我们现在没必要弄清楚它们)。

  网站服务器可以分析这些Request,如果这些Request满足一些共同的特征,比如来自同一个IP地址,且浏览器版本相同,或者再加上发出请求的时间接近等,它就认为这一串的Request对应的一系列Visits是来自于同一个Visitor的,这个Visitor就成为这些Visits的UV了。

  当然,如何定义这些共同的特征是由网站服务器的设置决定的。一般而言,用IP地址+其他特征共同限定来定义的情况比较多,但是IP地址实际上并不准确,尤其在局域网内有共用IP地址的多台计算机的情况发生的时候。不过,聊胜于无了!

[转载请事先声明并得到许可,版权归作者所有。]

  方法二:用Cookie分辨

  另外一个方法使用Cookie的方法分辨。什么?什么是Cookie?不了解Cookie就查一下Google或者Baidu吧!我就不解释了,说起来话挺长的。

  怎么分辨呢?当客户端第一次访问某个网站服务器的时候,网站服务器会给这个客户端的电脑发一个Cookie,放到这个电脑的某个区域,一般是C盘里。这个Cookie会分配给你一个独一无二的编号,还会记录一些你访问服务器的信息,例如访问时间,访问了什么网页,以及与你这次访问有关的其他一些信息。当你下一次再访问这个服务器的时候,服务器就可以直接从你的电脑上找到上一次它放进去的这个Cookie,并且会对它进行一定的更新,但那个独一无二的编号不会改变。如果一段时间内,服务器发现两个Visits的对应的Cookie实际上是一个编号,那么,服务器就知道,尽管在这段时间内有不少次Visits,但都来自于一个客户端,那么一定就是一个Visitor了!

  这个方法比上一个要更精确些。但是存在的问题是,有些客户端为了保证更高级别的安全,关闭了Cookie的功能,或者你经常删除Cookie,这个方法就不能奏效了。

  因此,这样看来,两个方法都只能得到UV的近似值,但是不能得到精确值。什么?想要百分之百精确?那……除非进行一次100%准确的普查(这实际上也是不可能的),或者只有上帝知道了。

11 Comments »

  • yorking said:

    如何确定一个访客在网站的用户行为分析中非常重要!
    一般的,使用网站会员ID比cookieid准确,因为cookieid只是标识一台机器,并不是一个人,cookieid会被清除但只要他登录网站memberid是不会变的。
    因此,首先用会员id表示访客,其次使用cookieid标识非会员访客,这也有利于将会员和非会员区分开。
    如果用户清除cookie,可以将用户的cookie信息保留在如flash的目录中,用户登陆网站的时候从flash中取回他的cookie信息,当然这样做涉及用户隐私,这不是技术层面的问题,涉及法律和互联网的原罪。

  • jieyancai said:

    cookie判断的问题:
    1.客户端关闭了Cookie的功能
    2.经常删除Cookie(现在的浏览器有方便的cookie清除功能和自动清除设定功能)
    3.同一个访客采用不同浏览器浏览同一个网站,cookie值是不同的,而IP是相同的,哪个更准?

    IP判断的问题:
    1.局域网内IP不同,有时候可以获取内网IP。
    2.每次拨号上网分配的IP不同。

    IP和cookie到底哪个跟适合用来判断唯一访客?无法用一个单一指标准确判断,但唯一访客的数量基本介于cookie数和IP数之间。
    基本可以这么认为:
    1.cookie相同,IP不同,同一个访客
    2.cookie不同,IP相同,可能是同一个访客,比如用了不同浏览器,或清除了cookie等情况
    3.cookie不同,IP不同,可能不是同一个访客,比如重新拨号然后又用了其它浏览器上网等情况
    4.cookie相同,IP相同,同一个访客

  • sutrong said:

    的确不能得到精确的值

  • Jesse said:

    同意1楼:
    利用Flash的方法,确实是一个好的技术解决方案,不过涉及的隐私问题要斟酌啊~

  • supertjq said:

    我是新手,发现这个博客文章写的浅显易懂。非常适合我。谢谢分享。

  • cooper said:

    你好,请教一个问题,不管是以IP还是利用cookie来记录UV,UV应该都是有一个时间概念的吧,比如24小时重新计算一次,是不是这样?多谢!

  • 网站分析度量、意义以及不为人所知的(2) |转载文章 | 互联网营销策划,网站优化,数字电视运营 said:

    [...] 你可以先阅读这个帖子——网站分析工具如何辨别UV,然后再继续往下看,一定会有新的收获。在标记法的网站分析中,除了page view之外,visitor和visit以及一切我们分析报告中显现的度量和计数其实都是通过cookie实现的,只有在没有cookie的情况下,才通过其他的方法实现,因此,如果想要搞清楚visitor或者visit到底是如何被网站分析工具记录的,最好的办法是直接看看cookie是怎么记录的。 [...]

  • 蚂蚁 said:

    用网站统计工具看呢?大概差不多吧比如  cnzz

  • brunktang said:

    楼上说的时间维度应该是你查询区间或者叫定义的时间,不存在系统自己定义时间的问题

  • 一文鱼 said:

    IP可以变化,不过IP段还是基本不变的,这个也可以作为辨别的一个参考依据。感觉确实需要结合多个元素一起进行分析。
     
    不过什么都存在一点误差,应该不必深究。

  • feiwuji said:

    据说现在可以记录用户网卡的编号,这样似乎更精确一些,但是又会影响网吧用户的访问情况。

Leave your response!

Add your comment below, or trackback from your own site. You can also subscribe to these comments via RSS.

Be nice. Keep it clean. Stay on topic. No spam.

You can use these tags:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <font color="" face="" size=""> <span style="">

This is a Gravatar-enabled weblog. To get your own globally-recognized-avatar, please register at Gravatar.

备案/许可证编号为: 京ICP备09063066号

Coupons and Deals, CheaperSeeker Coupons and Deals, Sharkcoupons