“我手上有1.5亿的数据,但我们广告却投不好,到底哪里出了问题?“
昨天给一个全球最大之一(可能要把之一去掉更准确)的健康医药产业集团做数据在数字营销上的应用的workshop。
气氛很热烈。数据应用确实有很多跟大家所知的情况很不一样的地方,所以大家问题很多。
其中一个问题是,宋老师,我手上有1.5亿的数据,但我们广告却投不好,到底哪里出了问题?
当我回答完这个问题之后,看到大家释然(或许也有恍然大悟)的表情,我意识到,这个问题是一个很好的问题,很重要,也很具有普遍性。
这后面究竟有什么样的故事,为什么广告效果不好,又该如何解决这个问题呢?
这篇文章,我讲讲我的观点,也欢迎朋友们在文后参与讨论。
数据,是个坑人的字眼
对于甲方,我有一个建议,当听到“数据”二字,就要立即警觉起来。数据这两个字的词,很坑人的。
简单讲,每个人理解的数据都可能不一样。而甲方理解的数据,和乙方提供的数据,常常有天渊之别。
要说清楚数据到底是什么数据,必须注意三个核心点:
- 是什么样的结构:ID + 属性字段;还是只有ID;还是只有属性。
- 颗粒度:个体级别,还是人群包,如果是人群包,多少人一包。
- 包含哪些字段。
而数据包含多少数据量,并没有被我列在核心点中。为什么,后面再讲。
现在,昨天的那个甲方,他们的1.5亿数据是什么?
- 结构:基本只有ID(Device ID),没有属性字段,或者很有限的属性字段。
- 颗粒度:个体级别。
- 包含字段只有一项:点击它的某个广告。
现在,当你手握1.5亿这样的数据,会觉得这是一个很多、很了不起的数据吗?
堪忧。
Device ID是个体级别的,这个有优势。但是这数据属性中的可用部分,只有可怜的“点击某某广告”可用。
而且,点击广告?Kidding me?品牌广告的点击,先不说可能存在的垃圾或作弊,光误点击或者好奇心点击就很多,却不是目标人群。因此,广告点击是一种表明品牌兴趣的“信号机制”,但显然不够强,数据质量也不够高。
但这还不是全部的问题。
数据量,完全不是越大越好!
这1.5亿数据存在的第二个很大的问题是,1.5亿本身。
中国有多少手机用户?大约10亿,假设平均每个人有1.5亿个手机。那么1.5亿的device ID,就基本上是10%的中国手机用户了。
给甲方提供数据服务的服务商,可能还会跟甲方说,1.5亿数据太少啦,你们要继续积累数据,最好积累到5亿、10亿……
Kidding me?
在以点击广告作为字段的情况,将数据积累到5亿,那就基本上每两个手机用户,就有一个是这个品牌的“目标人群”。这听起来,相当不符合逻辑呀。
如果人人都是你的目标人群,跟人人都不是你的目标人群有什么区别!
又不是卖可乐,开麦当劳。
所以,这1.5亿数据,听起来庞大,感觉是极尽了目标人群。但实际上,或许它太大了一点,大到已经不能从中发现真正的目标人群了。
很多甲方喜欢很大很大的数据。而且几亿数据喊出来,服务商脸上也有光,否则还有啥能说明数据的强大的?
但是,数据量,完全不是越大越好。
比如,数据量太大,真正有用的数据就会被淹没。数据量太大,处理起来会更慢,比如做look-alike,无论种子数量的巨大,还是放大的人群池里面的数据量巨大,都不一定会让效果更好,反而会让look-alike的速度变得很慢。数据量太大,为每一个个体构建准确的标签的难度也会随之加大,数据的精准度也必然会降低。
换句话说,1000万个Device ID加上每个ID都有10个较为准确的标签,和1亿个Device ID,只有一个点击广告的标签,哪个更能被应用?答案毫无疑问。
不是追求大,而是要追求有质量的大。
所以,为什么1.5亿的数据,实际上很难投出有效果的广告,是因为,实际上其实手上没啥数据。1.5亿数据和没有数据,一点儿不矛盾。
为1.5亿数据填充数据
那么,怎么“处置”这1.5亿数据?
方法一:找第三方来给我做data enrichment。
这么做没有大坑,但也没有什么用。第三方的数据,当然可以一定程度上帮你丰富数据标签,但价值在哪里?它们并不能帮你把标签精确到能够分辨这个Device ID背后的人是否对你的某个产品感兴趣,第三方数据都是很粗略的大致的人口属性描述,和大致的兴趣数据。
本来你就不知道这1.5亿数据中,有多少真正是你的目标受众。第三方数据做data enrichment之后,仍然不会让你知道谁是你真正的目标受众。
给一大群可能连你自己都不知道是不是你的目标人群的人做data enrichment,这不是浪费钱是啥。
逻辑不是这样的!既然花钱强化数据,就像打游戏升级装备,显然是要升级那些最好的装备嘛。现在的问题在于,这些数据是不是最值得“升级”的数据,甲方并不知道。
方法二:把数据上传给媒体的DMP,做data enrichment。
这个方法就更不靠谱了。媒体的DMP不会给你做数据增强,它们会给你两个出口,要么给你查看人群作为一个整体体现的画像报告,要么建议你把这些数据直接变成它们的人群包进行投放。这两个出口,对解决问题都于事无补。
方法三:分批分包投放这些数据,然后根据效果判断这些数据的质量和是否包含目标人群。
这个方法估计一般人不会去用吧,太麻烦,尽管但它背后包含一定的合理性。
方法四:别再去考虑用这1.5亿数据投放之类的问题了。如果就是为了投放广告,干脆直接用媒体的数据,比自己积累的这半吊子1.5亿不知道好哪里去了。这不算正能量方法,但绝对不是馊主意,如果只是为了投放广告的话,媒体现在的数据,以及它们的数据产品,质量都相当不错。
方法五:用来自自己的(第一方的)数据,为这1.5亿数据中真正重要的部分进行数据增强。1.5亿数据不重要,为1.5亿的device ID丰富第一方的属性更重要!
这个方法是真正值得甲方采用的方法。数据,唯有自己的数据,才是质量最有保障的。如我前面所说,点击不算是真正好的信号机制,但如果这些点击能够继续进入甲方的自有触点,在这些触点上产生更多的行为,这些才算是真正能够衡量是否真正目标消费者的信号机制。
这个过程不是一蹴而就的,要一定的时间,但每积累的一个数据,都是真正的数据资产。
否则,当这1.5亿数据,真的继续“积累”到5亿10亿了,你就会忽然发现,其实自己的手上,跟没有数据已然没有差别了。
看看你手上,是不是也有这几亿数据?你又会如何处置它们应用它们?欢迎讨论!
-加入宋星的读者群-
欢迎加入我的读者群