数据驱动的互联网营销和运营
宋星的个人博客

生命不息,作弊不止:怎么发现自己的流量被人做了弊?

这是一个永恒不灭的话题。

技术的进步增加了广告投放的效率和效果,也带来了更加凶猛的作弊。

品牌广告的作弊一直以来被人诟病,效果类广告的虚假流量其实也很猖獗。

线上营销的成本不停升高,再加上流量掺水作假,对广告主而言,不啻为一个黑暗的考验。

到底作弊有多厉害?

AdMaster刚刚发布了2018年上半年的数字广告无效流量白皮书。数据显示,2018 上半年,上千家广告主企业(行业范围涵盖快消、母婴、汽车、餐饮、金融、互联网等各行各业),无效流量占比为 28.8%,同比 2017 年上半年无效流量的占比 29.6%和 2016 年上半年无效流量的占比 30.4%,虽逐年有小幅下降,但形势依然严峻。

接近三分之一的流量是有问题的流量。

而流量的来源上,垂直门户一直都是重灾区。再加上今天的网民行为的迁移,垂直门户的日子只会越来越难过。

媒体行业细分来看,还是品牌类广告行业的无效流量占比多。而且,女性相关媒体的流量情况触目惊心,接近50%!汽车行业媒体的流量作弊有所抬头。

与常识不同,AdMaster给出的移动端的作弊少于PC端。但并不奇怪,因为AdMaster监测数据主要覆盖的是品牌广告主,尤其是视频贴片+信息流+开屏等广告。如果包含了其他的移动端ADX以及效果类的广告,从我们投放的经验上看,移动端的作弊,尤其是安卓系统的作弊,比PC端严重太多。所以下面的这个数据,请大家注意不是移动端的所有流量的数据。

发现效果类作弊

发现效果类作弊只要牢记几点,其实并不困难。

1. 对流量的细分标记一定要做好。

你不做细分流量,怎么发现什么流量有问题呢?

细分流量一般有两种方法,最常用的是link tag的方法(见我这篇文章:用Google Analytics的Link Tag深入了解流量来源(广告)的质量),现在已经是流量行业的标配。

另外一种方法,是直接给每个不同的流量不同的落地页,不想做不同页面的话,同一个页面不同URL即可。同样可以区分出不同的流量。这种方法用得少,但是在不能给流量做link tag的时候,这个方法很解决问题。

2. 查看各个细分流量的用户行为。

这些行为已经不能只是透过简单的跳出率来查看了。原因看我这篇文章:时光流逝,互联网运营的经典指标还剩下几个?

我们需要看更加具体的用户的行为,诸如点击的分布,设备的分布,地域的分布,时间的分布,互动时间与参与状况等。显然,大部分效果类的作弊,都很难真正的模拟人的行为,所以,发现作弊其实真正无敌的方法,就是看这些流量的行为是不是“真人”。没错,利用一定的方法,你肯定能分辨出来。具体看我这篇文章:信息流投放没效果?可能不是你自己的问题!,在这篇文章中,你会看到出现严重问题的流量是怎么被发现与证实的。

3. 查看流量的行为演进过程。

作弊流量和低质量流量的共同特征,就是它们不会往交易的更深处“演进”。对于转化需要多个步骤完成的业态,这个方法尤为有用。这些流量集中在落地页,但是停留在这里,不再继续发展。这些流量背后一般不是机器,但垃圾无效流量较多。

行为演进的细分与分析,还能够帮助我们发现一些客户端的劫持。典型特征是,当流量演进到购物车或者支付环节的时候,就不再继续进行下去了。而另外一些流量则莫名其妙的以购物车或者支付环节为落地页。

不过,有一类效果作弊基本上没有办法能够被找出来,即互联网基础通信服务端发起的劫持。唉,当一个流量一出现的时候,就已经被人从头到尾改换了门庭,而且还是从互联网基础设施的角度改换的。那就真心没办法能查能堵了。正因为如此,这一类作弊,是目前效果类作弊的最严重的,屡禁不止呀(关键也没有任何强力机构会禁止这种抢钱行为)。虽然说你不能真正发现这类作弊,但还是可以“能感觉到”。比如,当你真的停掉那些ROI很差或者“毫无作为”的流量了以后,那些看起来本来很好的流量渠道也应声下降。

发现品牌类作弊

品牌类的作弊,按照AdMaster上面的数据,大约三分之一的流量有问题。

品牌类的作弊的发现,较效果类要困难。直接原因,品牌类广告的目标是影响消费者的心智,而不是直接作用于消费者的行为。

可是,直到今天,也没有什么特别有效且高效的方法去衡量消费者的心智变化。因此,品牌类广告的投放,在作弊方面天然“有优势”。

发现品牌类投放的作弊流量,主要有如下方法:

1. 查看Click和Impression的频次。

Click的点击频次应不高于1.1,而1.2以上基本上存在很大问题了。Impression的频次作为指针相对比较弱,但如果发现有局部IP普遍频次超过10,那么虚假的可能性也很大。

2. 与效果类类似,如果流量有落地(网站、app、小程序之类),那么查看流量的行为。

这一块,我经历了有很多有意思的故事。比如,早些年,某些垂直媒体贡献的流量极为巨大,但是跳出率极高。若干年后,有一些不明渠道的“运营商弹窗”流量,也是每天海量流量,但是却几乎没有任何在页面上的行为。

还有很多app的下载推广,app确实也下载了,可是从来没有见过激活。或者激活了,从来没有见过使用。这些都是典型的机器流量。

3. 利用第三方黑名单。

比如,AdMaster有这样的黑名单,在对广告进行监播的同时,会查看浏览广告或者点击广告的IP、device ID、cookie等。这种方式目前也是主流的发现品牌端作弊的方式。

至于怎么知道这些IP、device ID或者cookie后面的流量是作弊的,主要的原因在于,这些监测第三方收集的数据比广告主要多很多,因此,更容易察觉出异常的行为。

图:上图是AdMaster的一个案例,关于作弊流量的cookie与IMEI号的特征

4. 借助具有公信力的第二方DMP。

如果能够拿到广告投放之后的覆盖人群的device ID或者其他ID,那么你也可以将这些数据上传给阿里品牌数据银行或者腾讯DMP之类的第二方DMP(请注意,很多人认为他们是第三方DMP,但实际上中国基本上没有严格定义上的第三方DMP,如果大家感兴趣这个话题,欢迎到我这个课程上聊:宋星深度公开课:数据和大数据驱动的智能营销与运营(8月19日北京))。之后,你能看到这些人群的ID与第二方DMP的ID匹配率往往很低,而且就算有匹配,人群的数据也完全驴头不对马嘴。

5. 爬虫。

这个方法主要用来检查那些定向投放的视频广告是否“作弊”。简单讲,视频广告尽管一般不会提供固定的广告位保证,比如我要投放某个节目前面的前贴片,这种媒体是不会承诺的,但是媒体还是会承诺节目类型,比如投放在美剧,或者投放在社会新闻之类。不过,媒体不会提供具体的投放位置的URL。解决这个问题的方法很简单,第三方追踪广告投放环境(页面)的URL,并且分析这个URL页面具体的内容是否与承诺的节目类型的内容符合。

上图:通过爬虫爬取投放广告的页面的内容,与实际承诺的投放定向内容相比较(来自AdMaster的案例)

这种方法其实对于程序化广告的投放基本上都是比较适用的,本质上程序化投放的品牌安全性也是来自于这种方法。

6. 移动端:利用其他硬件识别信息。

这个方法也需要第三方帮助,但是道理很简单:作弊设备不会随着人到处跑,因此它们的硬件识别信息,尤其是网络环境相关信息、LBS相关信息等,基本上处于永远不变化的状态。这样能够帮助发现可疑设备。

7. 反模拟器与反肉鸡流量。

另外一些作弊用的模拟器或者肉鸡之类。模拟器和肉鸡仍然是机器,因此,它们的行为与人的行为实在有太大的差别。但由于品牌广告的投放,有时候并不看受众的行为——只是为了获取曝光,那么这种情况下,仍然需要依赖于第三方帮助识别。第三方识别这些肉鸡的方法有几种,包括利用特征库做相似性学习(有点类似于机器学习,用现有的肉鸡库或者模拟器库里面的机器行为比对被测流量的行为),做这些流量的行为特征分析(第三方能够有一定的跨域追踪这些流量的能力)等。

总体看,随着流量进入下半场,流量的价格变得更贵,作弊的情况只会变得更加复杂,而不会更加简单。流量作弊识别已经不再是仅仅查看流量访问行为本身,而不得不通过技术把它们作为一个具有更长线行为的“人”来看待,方能知道它们原本“不是人”。

未经允许不得转载:网站分析在中国——从基础到前沿 » 生命不息,作弊不止:怎么发现自己的流量被人做了弊?
分享到: 更多 (0)

评论 1

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
  1. #-49

    发现了作弊又如何屏蔽掉这种流量呢

    哈哈哈5天前回复