数据驱动的互联网营销和运营
宋星的个人博客

Sidney的IWOM监测与分析:理解和实践

  最近更新博客较少,因为实在太忙,甚至不得已请Tenly为我们写了一篇关于Crazy Egg的文章(其实他也很忙,但比我更刻苦)。但是,不能总拿忙当借口,毕竟跟朋友们聊聊心得和发现也应该是“忙”的重要部分。

  话归正题,最近为什么忙,就是因为在为客户做一个相当复杂的IWOM的监测。所谓IWOM,可能大家还有点儿陌生,是英语“Internet Word of Mouth”的简称,Word of Mouth的意思是“口碑”,因此IWOM监测听起来搞得挺玄乎,实际上就是为客户研究互联网上的口碑。【点击标题阅读全文】

  虽说说起来很简单,但如何监测这个IWOM,如何为客户提出好的建议,却是一件相当复杂的工作。互联网上的口碑载体本就很多,但更麻烦的是口碑这东西永远没有标准,而且随着老百姓语言和网友们情绪的发展不断变化着——这不是加入一个Tracking Code(监测代码)就能搞定的事情,这需要一个完整的方法论。

  我知道目前最好的IWOM研究公司是CIC(SeeISee),在与他们的高级总监交流及自己做项目的实践过程中,我逐渐形成了一些自己的理解,并放入为客户服务的实践中,现在跟朋友们进行分享,内容还远不成熟,大家自备避雷针。:)

IWOM的3A层次

  在实践中,IWOM被分为三个层次,与客户的需求紧密相连。三个层次分别是:Alert(报警),Analytics(分析)和Architecture(构建)。

  • Alert层次指帮助客户及时发现负面口碑。不要小看了那些该死的“Gossip”,负面口碑往往会演变成危机。“三株口服液”和“秦池古酒”的案例大家已经耳熟能详了,甚至写入了吴晓波的“大败局教科书”,而互联网上的反面案例则来自于DELL(HELL)以及“家乐福”。所以,你要永远相信“天有不测风云”,即使你不能防患于未然,也不能完全消除负面口碑,早点儿发现它们并且早做准备也是好的。
  • Analytics是比Alert更高一级的层次。Alert是以发现负面口碑为中心,而Analytics则是全面分析口碑内容及趋势。前者如同雷达,后者则是卫星全局扫描(糟糕,有人丢砖——你以为你是嫦娥一号?!)。简单说来,Analytics要实现的目标是:
    • 1. 分析互联网上关于品牌/产品/企业有哪些主要的口碑;
    • 2. 口碑的趋势;
    • 3. 更重要的,是发现这些口碑发生的原因。第3点可是一个称职的分析师应该做的哦!:)
  • Architecture则是最高层次。所谓构建,就是能够消除口碑对抗,营造口碑氛围,甚至控制口碑走势。哇,偶地个妈呀,这已经不是人工降雨了,这简直是控制天气!没错,这……的确是高科技啊,要做的就是要让舆论不知不觉走向有利于客户的方向,甚至是走向客户预先定位的方向。尝试用专业的语言来说则是:
    • 1. 消弭负面情绪
    • 2. 扩大正面声音
    • 3. 引导(甚至左右)舆论内容

  这3个层次都不简单,尤其是第2和第3个。口碑这东西,今天平安无事,明天就满城风雨,如何实现上面的三个目标层次呢?

1. 相信28分布,别信长尾

  大家都知道网络有非常明显的长尾特征,但是口碑这东西,却有明显的聚合性。因此我说,在进行IWOM研究的时候,一定要相信二八分布,千万不要试图把长尾都一网打尽,原因很简单——你做不到。

  我在这方面吃过亏,因为客户永远都希望什么都要,但他们其实很多时候并不清楚什么是他们最应该要的。不知道大家是否有同感——客户拿到了所有,但忽视了精华,他们拥有,但他们不消化。这常常让我回忆起《夺宝奇兵——圣杯》的最后场景。在监测IWOM的时候,我发现,在绝大多数情况(我这么说你要相信是100%的情况)下,20%(甚至是10%不到)的口碑聚合地已经聚集了80%(其实我更相信是90%)的口碑了。

  大家用双手就能数清楚各个行业的互联网口碑聚集地。另外我的认识是,在中国,BBS类网站是口碑的实际垄断者。这么说你可能会不同意,的确,Web2.0之类网站的口碑在增长,但是他们的影响是通过BBS类网站放大的——道理很简单,Web2.0是小众的集合,BBS则仍是大众。

  我这么说不是抹杀Web2.0之类小众聚合的重要性,尤其是博客,我认为对口碑的研究是相当重要的。博客常常是负面声音的发起者(虽然绝大多数情况不是由它放大的),但请你还是相信我坚持的二八分布规律,20%的blogger已经覆盖了80%的声音——鬼才相信有那么多的有价值的原创呢!

  不过,请不要误解我,长尾在很多地方是有效的,只是在这里,我们先忽略它吧!

2. 搞定IWOM的所有数据?

  在分析网站的时候,我们使用Tracking Code,或者可以通过Log file来直接获得数据。但是IWOM则不能如此。有几个难处。

  1. 没有Tracking Code可加,也没有Log file能分析。原因很简单,就不罗嗦了。
  2. 即使技术上能加,面对浩如烟海的BBS,Blog以及层出不穷的Web2.0网站,技术人员也会加的吐血。
  3. 加了Code又有什么用呢?你要分析的是内容,而不仅仅是点击量。

  所以,不需要用网站分析的方法来分析IWOM了,我们需要其他的帮助。这个帮助是网页抓取技术,或者更精确的说,是BBS(或者Blog)的页面内容抓取技术。

  这个技术并不复杂,但是想要做好却是相当困难。我没有发现哪个服务提供商能真正做好的,原因在于BBS(或者Blog)系统的多样化,虽然Discuz系统(或是Wordpress系统)已经占据相当份额,但是还是有数以千记的各种系统以及自行开发的系统存在着。所以我可以肯定的告诉大家,中国没有哪一家技术提供商能够做到抓取哪怕50%的BBS(Blog)内容(请注意,我所说的内容是包括首贴和回复的)。这一点上,我很笃定,但我希望我是错的,我希望我的读者告诉我,在这一点上我错了,有一家公司能做到!我一定会请你看奥运(附注:电视上)!

[转载请事先声明并得到许可,版权归作者www.chinawebanalytics.cn所有]

  现在大多数都只能抓取部分BBS或者BBS的部分数据。一种是能够搜索到相当多的BBS,但是很可惜只能抓取主贴,但是抓不到回复(大旗网就是如此),另外一种则是能够抓取论坛上的所有主贴和回复,但是要为每个BBS做专门的抓取定制开发,所以抓取的BBS数量是有限度的(印象中CIC是这样,但我希望我是错的,请CIC的朋友指正)。因此,这就是为什么我前面说,千万不要相信长尾的原因。能够把20%一网打尽我看已经是救民于水火了。

  在我的实践中,我们需要抓取的数据包括:

  • 定性数据
    1. 主贴的内容
    2. 回复的内容
    3. 标题
    4. 作者
    5. 发帖时间/回帖时间
    6. 所在BBS及板块的名称,以及它们的URL
    7. 以及其他数据(如是否置顶,是否加精等等)
  • 定量数据
    1. 发帖数
    2. 每个帖子的回复数
    3. 每个帖子的阅读数(点击数)

  这些数据构成了IWOM分析的基础。其中,定量数据容易获得,而定性数据则很难完全抓取(比如第7个,现在技术上面临的困难还很大),这正是IWOM分析在全球都仍然是需要攻克的难题的第一个原因,但相比第二个难题,这个简直就是小儿科。

3. 初步分析——你知道汉语有多么可怕吗?

  为什么说是初步分析呢?原因在于这一部分的分析是最基础的,本来应该由机器完成,但是现在却需要大量的人力来完成。机器程序编的越好,人力需要参与的就越少,但想要让人在旁边睡大觉是不可能的。

  相信你已经猜到初步分析的内容了:

  • 机器参与的:
    1. 排水/扫水(就别让水帖占用我们的空间了)
    2. 关键词抽取和统计(初步的主题分析)
    3. 调性分析(所谓调性,就是这个帖子是正面的还是负面的还是中性的还是扯淡的)
  • 人参与的:
    1. 主题分析(也就是说,这个帖子最主要是关于什么的,其他谈到了哪些方面)
    2. 调性分析(帖子整个主题表现出的调性,以及谈到的各个方面的调性)

  这其中,最关键的是调性分析和主题分析。调性分析能够帮我们实现本文最初所讲的第一个层次:Alert,而且更重要的是帮助我们进行进一步的分析;而主题分析则是为了深入挖掘口碑的内涵。

  本来,我们是希望机器能把这些事情都做了,很可惜,中文是世界上第一复杂的语言,不仅词汇繁多,俚语已经不少,还非要成天两头的蹦出来一些网络语言,酱紫搞得机器很不知所措,处理的结果常常“雷倒众生”。其实不是我们的技术不行,微软和Google现在也做不好自然语言的分析,仅仅一个“分词”技术就够申请数个专利的了。所以,没辙,还是要靠大脑。

  不过,就算是靠大脑,还是会有误差,因为人的背景不同,比如分析讨论电脑的帖子,没有一点儿DIY的背景很容易分析错误。不仅如此,有时候帖子的标题似乎是“负面的”,但仔细一看帖子,很可能是“正面的”,这个时候,粗心一点儿就会出错。但是人不可靠的最关键原因是,人是会疲劳的,尤其是面对这种枯燥的工作。而且,如果我问你,你愿意每天60元坐在电脑面前兼职做这个工作吗?你的答案一定是——No,并且给我一记闷棍。

[转载请事先声明并得到许可,版权归作者www.chinawebanalytics.cn所有]

  所以,汉语口碑的调性分析对于机器而言,还是一座不可逾越的大山,必须要人来完成,但人力资源是可贵的,而且服务的质量也难以保证。这是IWOM监测如此困难和痛苦的原因,也是需要攻克的最难的难题。

  初步分析的数据具有极为重要的意义,它是后面所有分析的基础,但是质量让我十分伤心。我们需要一个高质量的服务,如果谁知道,请告诉我。

4. 深入分析和提出建议——分析师的工作来了

  前三步实际上等于网站分析中利用WA工具获得的初步数据报告,可是已经让人精疲力尽了。终于轮到分析师上场了,他们需要做的事情实际上就是解答IWOM的第二个层次——Analytics。其实,也是我在这个客户项目中最主要负责的部分。

  我主要从下面的各个方面入手:

  1. Negative(负面) vs. Postive(正面)
  2. Negative分析:Negative舆论是什么,为什么,以及产品/品牌/企业的短板
  3. Positive分析,Positive舆论是什么,产品/品牌/企业的长项
  4. 分类主题分析,以细分产品/品牌/企业的不同特征,这个必须基于初步分析中的“主题分析”
  5. 竞争对手分析(内容跟上面4个一样)
  6. 产品/品牌口碑对比分析
  7. 趋势分析
  8. 总结分析的发现,并且提出建议
  9. 最恐怖的是——上面的所有分析应该基于不同细分用户群体。

  上面的这些内容就是让我在7月的半个月中没有周末,没有写博客的最主要原因。纷繁无杂,千头万绪,我希望我再不用做这个东西。不过最终当报告形成,看到拿出来的一些结果和建议,还是有点儿成就感。但是,我对初步分析的基础数据一直不满意,因此我竭尽所能,仍不能确保这是一个100%可信的报告,我也相信在中国可能还没有这样的一个报告。

5. 控制天气——仍然非常困难

  现在报告形成了,我们知道了口碑背后的原因,我们开始形成一些行动,比如,用官方的正确舆论引导,或者强烈抗议竞争对手的恶意破坏(这种行为实际上就是反面软文)。但是我不打算在这个领域写太多,我相信有很多专家,但是我相信这是一个很难解决的问题。我还在实践,我还没有结论。我希望大家的建议。

  终于,这个似乎又是突破记录的乏味长文要结束了。如果你看完了,请给我留个言,算是对自己的一个鼓励,也是对我的一个favor。我知道看这么多内容是需要耐力的。什么,你看完了?你应该参加奥运会的马拉松比赛,你能赢,真的。

  最后,把整个流程做一个图形化的总结,见下图。

  给我留言吧,需要大家的启发!谢谢!

[转载请事先声明并得到许可,版权归作者www.chinawebanalytics.cn所有]

未经允许不得转载:网站分析在中国——从基础到前沿 » Sidney的IWOM监测与分析:理解和实践
分享到: 更多 (0)

评论 79

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
  1. #1

    这文章应该付费阅读。哈哈。
    不过建议可以分上下部比较好。我相信一口气读完是比较辛苦的过程。哈哈。

    tenly10年前 (2008-08-02)回复
    • 没有付费,坚持原创,坚持分享。;)

      Sidney Song10年前 (2008-08-02)回复
  2. #2

    监控数据,实时了解信息更新如你所说是个体力活,而且耗时间,得每时每刻关注. 所以最好还是有专人来做这些,职责要求就是快与全.
    而后面的分析工作则是分析师的强项
    最后的控制…个人觉得分析师的建议为主导,实施交给有能力的公关即可.

    现在组个效率高的团队还真不容易…

    Yacca10年前 (2008-08-02)回复
    • 感谢你的仔细阅读。:)

      分析师的建议是至关重要的,其中一点就是可执行的(Actionable),并且形成可执行的计划,划分R&R(Role and Responsibility),然后由各专业团队来实施。

      实施是一个危险的过程,网友们现在明察秋毫,所以千万别用愚蠢的软文轰炸或是请人捉刀的方法。实施对策体现在一个“诚”字上,诚意的对待客观批评,诚意的倾听网民的声音,诚意的说明自己行动用意,赢得同情比虚伪逃避要好使。

      当然,面对恶意攻击一定要用严正的手段回复。

      这是目前的一点小想法。

      关于团队,我很赞同,现在具有执行能力的团队远比想方案的团队更加重要,事情需要人做嘛。:)

      Sidney Song10年前 (2008-08-02)回复
  3. #3

    hi,song,
    感谢分享如此珍贵的经验和见解!
    有一点我有点疑问,在初步分析中提到机器参与的部分第三点“调性分析(所谓调性,就是这个帖子是正面的还是负面的还是中性的还是扯淡的)”,机器程序目前能完成这项工作吗?我理解可以设置一些负面关键词来完成此工作,但就像你说的中文如此复杂,表达负面的词汇多种多样,我没有看过大旗或cic的系统,不知他们是否已解决这个问题,不过我感觉这块还是个很大的技术难题。相对来说,人工参与部分的第一点“主题分析(也就是说,这个帖子是关于什么的,谈到了哪些方面)”,我倒认为可以让机器来完成,目前这方面的技术应该算是比较成熟的。

    在调性分析方面,如果系统程序能按照一定的规则算法(权重)把帖子按重要性高低排序展现出来,就应该算是不错的系统了,毕竟能减少人力成本。

    shiwei(10v)10年前 (2008-08-03)回复
    • 感谢shiwei,你的回复对我很有帮助!

      1. 调性分析目前的确是机器的难点。CIC和大旗都是用机器进行初步调性分析的,但是误差很大,Sonia也跟我确认了这一点,她也有自己的一个IWOM的营销公司。这些系统在判断的时候,是人先设定负面语词,然后设定筛选规则来判断的,但是汉语语言习惯和语法的复杂性,造成大量的判断失效。而且,一旦出现一个文章中既有负面,又有正面的情况,机器就很困难,很痛苦了——总不能数负面和正面在一个帖子中出现的次数然后比较谁多谁少来进行判断吧!而你所说的权重算法,必须基于首先对调性判断正确的基础上,而这个基础实际上机器都还做不好,所以权重什么的,必须得靠人来判断。

      2. 关于主题分析,你说的没错,这是我错误的地方。主题的初步分析也由机器进行,然后再由人来进行纠正。因此,我会在我的原文进行修改。其实,在这里机器能做的,就是筛选出你预先设定的关键词的内容。

      因此,我的结论是,机器有用,但作用还很有限。

      有没有有实际做这方面技术的朋友?我们需要你们进一步精确的解释。先谢谢了。

      Sidney Song10年前 (2008-08-03)回复
  4. #4

    我留言是我想记录一下我读完了,其实看进去了,没有很枯燥。
    虽然我没有相关的经历,不过我之前也体会过机器分析还有分词,真是个头疼的事,可能对你没有什么帮助,我是来学习的,感谢分享:)

    目录10年前 (2008-08-04)回复
    • 感谢你读完了!看来我如何兑现我的观看奥运会的诺言成了问题。:)
      不过确实让我很振奋,因为我觉得读完这个帖子还是需要耐心的,但看来我的担心是多余的。
      欢迎常来!
      当然,更重要的是,能否分享一下你当时的经历?

      Sidney Song10年前 (2008-08-04)回复
  5. #5

    hi, 你好;看了你关于IWOM的文章,提出一些异议。
    首先是你的3A:
    1。alert; 不仅是看负面口碑,这个层次其实也会帮助寻找市场机会。
    2。analysis; 除了你所说的内容,更重要的是分析师会提出战略建议,而不仅仅是看趋势和理由。
    3。Architecture,控制天气;这一点不是很赞同,IWOM重在倾听融入而不是控制。尤其是web2.0时代的朋友们都是自发自愿的参与IWOM,如果有人试图控制IWOM,那么必然遭到抵制。有遇到过几年前的枪王,其总结过一套发枪手帖的帖士,但是他说过一句心理话,能不发还是不发吧,网民是非常敏感的。所以,在这一点上的执行和控制是非常困难的,您说是吧!
    我不知道您和CIC合作的哪个项目,看来你是需要和PD再深度沟通了,因为他们作为第三方专业的IWOM调研咨询公司,可能会有更多的insight.
    有兴趣可以一起交流 :)

    Carrie9年前 (2008-08-05)回复
    •   你的意见提出的非常好!虚心接受。不过容我辩驳几句,呵呵。

        1. Alert这一点你说的对,观看负面是不够的,如果能发现一些市场机会更好。但是在我具体进行具体项目的过程中,服务商能够在汪洋大海的buzz中辨识负面消息其实以及不易,而且还要做到尽量的实时。所以从具体实施的角度看,我们希望发现机会,但是觉得很难,而在Alert层面仅仅做报警,而没有在做更多的要求。当然,也许是我们的数据提供商还无法提供更好的服务。

        2. Analysis,完全同意,应该是我在文章中强调的不够。事实上,当做完Analysis之后的结果,是提出可行性的建议。我会修改我的文章。

        3. Architecture,重在倾听而不在于控制,这里我需要解释。事实上,倾听当然是非常必要的,我也认同,控制天气是非常非常困难的。因此,我们在为客户服务的时候,实际上明确表示,要相信网民的聪明才智和善意,因此我们并不能控制什么。但是我们不是束手无策,不是倾听之后不作为,而是可以做一些引导。我们做的其实最简单的事情,就是建立官方的倾听和回复渠道,向网民表示:(1)我们在倾听你们的声音,我们也看到了你们的pain point;(2)这是我们诚意的解释,我们在理解了你们的声音之后,会为你们做所有能做的事情。这实际上是一种引导,放低姿态,融入其中,表明态度,积极回馈,疏导不满的情绪,与消费者共同理解产品和服务。如果仅仅是做“seed”,那么在这个层次,肯定会输的一塌糊涂。

        我很想知道,其实还有很多Architeture的方法,我们能实现我在文章最前面提出的目的,我们可以进一步讨论。

        如有不妥,还请指正。

      Sidney Song9年前 (2008-08-05)回复
    • 另外,不是CIC跟我们合作,我不方便透露和我合作的公司。但我认为CIC是很专业的公司。

      Sidney Song9年前 (2008-08-05)回复
  6. #6

    把口碑这种东西数字化,并且加以分析引导确实是个复杂的工程~

    关于监控数据,让我想到了我国鼎鼎大名的金盾工程,是不是可以向公安部的高人们借鉴下经验呢~
    呵呵~玩笑~不要狙击我~

    Robert long9年前 (2008-08-06)回复
    • 公安部的监测据我猜想应该是很简单的,他们只监测关键语词。但是IWOM的监测就要复杂的多,因为关系国家安全的语词毕竟有限,但是与一个企业和它的产品相联系的语词就太多了。后者更复杂。

      仅是猜测,博君一笑。:)

      Sidney Song9年前 (2008-08-17)回复
  7. #7

    这篇文章写得非常不错.
    我觉得第二步(抓取数据)和第三步(分析数据) 是基础, 是重中之重.
    里面涉及到的 关键词抽取, 语义分析, 切词 等很多中文分析里面最恶心的部分. 相当于自己去实现百度的全套东西. (对中文的这些处理跟中文搜索引擎所做的工作真的是差不多.)
    我觉得你在这些基础数据获取上可以参考一下现有的技术.

    在第四部分(分析) 里面, 我觉得还可以考虑以下:
    1 品牌被讨论最多的方面. 为什么?
    2 在你列的所有LIST里面再加个时间轴. 如果数据积累了一定的时间长度, 可以形成一个品牌在各方面随时间的变化趋势图

    看完后随便想到的. 请指教

    Chan9年前 (2008-08-11)回复
    • 非常感谢Chan的建议。你所说的最恶心的部分,我现在又了解到有服务商这样提供解决方案了——那就是完全依靠人力分析所有的内容部分,只是在一些基础数据(比如帖子的回复数,阅读数,作者是谁等)方面用机器处理。

      我不知道这是进步还是退步。但我知道其中的无奈。:)

      你所说的时间序列分析的方法我很赞同。没有时间,很多事情都无法理解。而且我还要补充一点,有了时间,还可以纵向联系同时间发生的相关事情,这对IWOM分析很有帮助,这也是为什么在IWOM的分析中,Google的Trend工具非常常用的原因。

      Sidney Song9年前 (2008-08-17)回复
  8. #8

    看完了这篇文章,深受启发。
    身为一个接触IWOM的新人,还有几个问题想要跟您探讨。

    首先,现阶段靠机器靠程序去排查和检测的水平确实比较低,导致的直接结果就是得到的基础数据的准确程度无法把握。这可以类比于常规的调查公司通过调查问卷的数据经过分析给出客户报告,我们都知道很多调查员的工作态度,所以最后的报告能有多科学呢?这样的一个问题,您觉得可以通过技术的改进而得到改善么?

    第二,进入到Analysis这个阶段,您觉得一个好的analysist应该具备什么样的素质?更多的是技术背景?经济学、营销学的背景?实务的经验还是什么呢?其实总觉得现在大多数的公司都在Alert阶段疲于奔命,真正能够将分析做好的并不多,而这方面的人才更是非常的匮乏。

    第三,也想探讨一下关于天气控制的问题,我觉得倾听和控制应该是并重的,说句大实话,客户雇用你所要做的事情不仅仅是监测,更重要的是监测后的作为。个人觉得不同类型的网络媒体(常规媒体、BBS、Web2.0)和面对不同的受众所要做出的反应是不一样的,有一些是迅速诚恳的澄清,有一些是引导,而有一些就是要去左右控制舆论。

    网络的公关、营销是新生的一个行业,所以能够给人以启示的文章并不是随手都可以捡到,因此看了您的文章以后真的……怎么说……向您投来不计其数的感谢,嗖嗖嗖的就过来了~~~哈哈哈哈

    看到您在留言中也提到了执行团队的问题,不知道下次再有时间的时候是不是可以写一篇更加偏执行层面的“讲义”:)

    summer9年前 (2008-08-13)回复
    •   感谢summer的问题,都是很好的问题。我不敢说是专家,只是谈谈我自己的理解:

        1. 你的第一个问题。对于调查的方法和实践,实际上很多年已经是一门科学。能够用科学的方法排除低质量的问卷,典型的方法就是设置甄别问题,另外通过程序进行逻辑分析。可能还有其他的方法。这些方法能够相当程度的保证问卷的质量。但是对于IWOM而言,跟调查问卷就不同了。调查问卷是可控的研究方式,而IWOM的基础人工分析,近似于不可控(虽然也可以通过抽检来了解质量情况),而且还没有形成一套完整的科学检查方法论,因此数据依赖于人工的素质,有较大的不确定性。我相信通过技术手段能够改进,尤其是一套科学方法指导下的技术手段。可惜的是,我不专业,我无法在这方面给你更深入的解答。

        2. 你的第二个问题。关于Analyst的素质,我想首当其冲的是——他要有时间 :),他不能疲于奔命。然后,他要有分析的逻辑思维,当然这是任何分析师都要有的。对于IWOM,我认为有一点很关键,就是你所说的——务实的经验,不仅对网络口碑的生态环境(比如BBS,比如Blog)有深入的了解,而且对于服务客户的品牌和产品要有相当的了解。这一点是很难的,因为IWOM的重要部分是分析内容,只有你了解了网络口碑的生态环境和与客户有关的上下文,你才能真正理解内容,从而分析内容背后的倾向和动机。

        3.你的第三个,应该不算是问题了吧 :)。我赞同。不过我应该慎用控制——其实我们无法控制,但我们能引导,能疏通。这就如同雨季时候的洪水来临,我们不能避免水位上涨,但我们可以该疏导的疏导,该严防死守堵住的堵住,总之我们不能决堤,我们要做的是尽一切手段让水位安全下降。又如同旱季时候的引河开井,那些需要“灌溉”的地方我们不能放过——总之,是引导水,改造水,利用水。

        忽然想到一个古语:“防民之口,甚于防川”——只不过我们不光防,我们也用,一切朝着有利于客户的方向发展。

        再次感谢你的提问和精彩留言。多探讨。

      Sidney Song9年前 (2008-08-17)回复
  9. #9

    第一遍快速浏览,看到后面的回复和探讨,觉得有点意思,于是仔仔细细的看了一遍,颇有感受;
    虽然我不是做IWOM的,但是对数据挖掘还是有点感受的,而IWOM也就是一种数据挖掘,相当而言,更广义一些,目的是想在浩瀚的互联网信息中找到需要关注的“点”。

    面对众多的BBS和BLOG系统,数据采集绝对是个让人头疼的问题,但是如果可能,采集其FEED(RSS)或许会简单一些,毕竟还是有其ATOM或者RSS规范的。

    对于数据的分析和切分,就更是个数据挖掘的问题了,对采集的数据,进行挖掘,找到你关注点相关的词汇,再进一步的立场判断。

    另外,不知道你们是如何按照点在大海捞针的,如果只是设定关注的几个BBS或者BLOG的话,那么肯定是不全面的,而如果可以使用Google、baidu对其关键字查询,按照其返回的结果再进一步提取或许会更有针对性一些。另外,不知道是否用过”Google Alert“,这个东西可以根据你设定的关键词,自动把最新出现的结果发到你邮箱中,应该对你有用。

    还有一点,可以在一些比较知名的BBS自行提出一些观点,再持续关注这个观点,做再分析。

    看完后的一丝胡言乱语,想到哪里写的哪里,没啥逻辑,之前我关注过一些个人在线品牌的跟踪和分析,和你这个有些许相似,国外已经有一些产品出现,做的还是挺不错的。

    IceskYsl9年前 (2008-08-20)回复
    •   感谢你的评论。也让我颇有受益。

        我们的确是设定了BBS和Blog的范围,但是不是几个,而是上百个,也听说有服务商能提供数万个的,但是实际上Top50以及能够容纳相当部分的口碑内容了。用Google和Baidu的好处如你所说,能提供报警,但是更专业的针对BBS或者Blog的抓取,自然搜索引擎的短处还是非常明显的——它们还缺乏针对性,只能搜索内容(而且是部分内容),不能搜索数据(回帖数,发帖数等与BBS或者Blog相关的关键数据),而且另外一个弱点是实时性差。对于IWOM瞬息变化的环境而言,Google等能做到部分事后分析,但是过程中的近似实时防御则勉为其难。

        关于BBS测试的方法,这个很新颖,我们也有所尝试。事实上我们也尝试了多种Seed方案看哪一种更理想。感谢你的这个好建议!
        
        谢谢你的留言,请多关注我的博客和我们的圈子。祝你快乐!:)

      Sidney Song9年前 (2008-08-20)回复
    • 口碑研究主要还是text mining方面的,NLP技术用的比较多,CIC的技术还是很不错的。

      Lai9年前 (2008-11-02)回复
  10. #10

    一口气看完,觉得收获很大,也对我现在的工作提供了很好的经验,谢谢你的分享。
    我现在是从最初的分析(其实也不是最基本的)到总结,判断与建议都在做,真的是觉得非常的累。正如你所说的,最初的分析除了机器摘出来的以外,人来做筛选也是非常重要的,这个工作量很大,而且很费时间,但最要命的就是你不能保证这一步完全正确,因为你以后的分析完全来自与这个筛选,所以非常重要,但我也没有什么好的办法,现在是自己做第2步的筛选来确保正确性…..
    分析方面不敢在诸位高手面前说大话,我还是新手。你的分析的维度给了我很好的参考,但对于既不是负面也不是正面的是否需要作分析呢?往往很多网友的帖子不能简单的划分到正或者负的,对于这种帖子你怎么处理?
    以上是看完文章后的一些想法,再次感谢你的分享!!!
    hoho

    benson9年前 (2008-09-03)回复
  11. #11

    回复:benson

    你提的问题非常好,非常有代表性,也是客户提出的问题。
    对于判断既不是负面又不是正面,或者既有正面又有负面的问题,是用不同的处理方法。

    1. 对于既不是负面又不是正面,但谈了不少东西的帖子,在处理的时候,主要是看它谈了什么主要的话题,表达了什么意见。这种帖子很多,逐条分析太困难,一般只选取了有较多流量/回复量的帖子进行分析。我认为这一块,是薄弱环节,因为不能依赖机器,只能靠人。

    2. 对于既有正面又有负面的帖子,相对容易,因为正面和负面的评价分别会针对不同方面。这种情况下,我们不看帖子的整体调性,而是看它的细分调性。我想这么说,你应该就明白了。

    总之,这两种情况都是很麻烦的,在具体的分析的时候,得靠人,得认真,极为花费时间。

    Sidney Song9年前 (2008-09-05)回复
  12. #12

    看完了,觉得自己这5年多其实是个数据准备工程师
    不是数据分析工程师
    虽然也作些图表,也有点结论
    但是总感觉那么浅
    到底是我涉入分析太浅
    还是分析本身就那么浅呢
    我相信是前者 唉
    因为按照流程图 我一般会完成前三个图
    后面的两个不用我出 只是自己会琢磨琢磨
    即使出也是非常简短的一句话原因
    我怎么觉得自己的处境这么尴尬呢
    我应该怎么发展呢

    yezi9年前 (2008-11-12)回复
  13. #13

    我看完了,但是我认为这些搞起啦应该还是很艰难的

    洪成浩9年前 (2008-12-29)回复
    • 没错。我觉得现在还是有大量的障碍。技术是推进这个领域的关键力量。靠人力来做,难度大,成本高。

      Sidney Song9年前 (2009-04-10)回复
  14. #14

    好文章。

    最近MS Live Search好像很简单的做了一点点简化版的IWOM监控。说简化是因为它只从B2C取产品评论出来分析,而且目前只分析电子产品。做完语义分析和统计之后,再用简化图表告诉查询的人,WOM对这个产品各个指标的评价,例如有百分之多少的人认为这个产品镜头好,多少人为体积好,多少人认为成像好……

    你这个模型……看起来是个比他们的产品更浩大的工程,呵呵。不过之前看到过不少公司号称可以做到全网的WOM监控分析——可能也是用类似模型,质量恐怕没有保障。

    MarsOcean9年前 (2009-01-01)回复
    • 从一点点开始做起已经很难了。我这个模型也不敢涵盖所有的跟品牌有关的口碑。而且即使只是评论一个好,或者不好,我认为目前的语义分析也基本上很难准确。

      目前国内的公司还是以机器筛选加上人工阅读为主。没有人共阅读,什么都做不了的。另外,我觉得全网是一个陷阱,在这个领域,不能信长尾,要信二八分布。

      Sidney Song9年前 (2009-04-10)回复
  15. #15

    CIC的朋友路过

    bigbird89年前 (2009-04-09)回复
    • 谢谢路过!:)

      有时间来北京再找我哦!

      Sidney Song9年前 (2009-04-10)回复
  16. #16

    相当专业。虽然我很不想承认,但事实的确和你说的一样。几个最为重要的无法突破的技术极限都一一点出了。
    对你的理论也相当认可。我前后用了两个月左右,从最初的需求到最后的开发,我作为甲方全程参与了。所以相当认可您的结论。面对很多技术极限,我们最后不得不采取最愚蠢但最有效的方式,用人来往这几个坑里填。不过结果还是可喜的,通过扩大人力的投入和建立更复杂有效的筛选标准(这是三个月辛劳的结果),最终准确率已经达到了足够确保最终结论可信的标准了。

    OK,不要耻笑我……我只是比较信奉符合中国国情的人民战争方式。

    至于纯粹依靠几位资深分析和一个监测系统来完成,起码要等到汉语自然语义分析技术和网页爬抓技术能实实在在突破的时候,才能真正可用。

    不过说来说去,技术只是IWOM监测和分析的小门槛。最大的门槛,还是在于培养分析师。技术,仅仅能让对分析师的要求略微下降一些,让分析师更轻松一些而已。就好像倚天剑,虽然能让高人如虎添翼,可落在凡人的手里,不过是一把锋利点的剑而已。

    至于控制天气,哈哈,这是事实。的确有人可以做到。广为人知的就是立二拆四,不为人知就数不胜数了。譬如我的一位同事,已是我辈高人,论坛舆论这种东西,就像他手里的方向盘,爱往哪走就往哪儿走。

    hu9年前 (2009-05-04)回复
  17. #17

    非常受益!以后这里就是长期课堂了~

    tyratan8年前 (2009-11-17)回复
  18. #18

    不得不说这是一篇好文章,而且后面的评论也很精彩. 感谢宋先生辛勤劳动.
    我也有个东西想讨论
    在IWOM里面,甄别并且化解一场危机是非常重要的工作.但是更加重要的工作似乎是发动一场成功的IWOM活动达到商业目的.
    前者做的是防守, 为了保住自己的蛋糕. 后者是进攻, 为了做大自己的蛋糕.
    前者所获有限, 因此从需求来看, 后者肯定更加重要.

    那么有个问题就是, 怎么使用网络分析结合IWOM甚至结合公关、广告等手段去制造一次有效的推广计划。
    这问题非常复杂,但是依然想得知多少您的思路。
    谢谢。

    Lyo8年前 (2009-11-18)回复
  19. #19

    看到不少以前没见过的东西,大赞。PR方式的营销确实总是带着不少神秘的色彩
     

    tonny8年前 (2009-12-13)回复
  20. #20

    我只想说,我看完了,楼上的几位仁兄都好厉害啊。
    可以去参加马拉松了么,哈哈。

    郭健8年前 (2009-12-13)回复
  21. #21

    文章不错,把我之前公司的基本内容都提到了。cic确实抓首贴和回复。

    jy8年前 (2009-12-19)回复
    • :) 谢谢回复。内容都是实践中来的,而实践又是和CIC以及大旗等业界比较知名的vendor的合作。很有收获。

      Sidney Song8年前 (2009-12-20)回复
  22. #22

    这个帖子的内容离中国的国情有点远, 看看 http://www.firepress.cn, 你就知道了, 在中国,这种的分析得出的结果是,哪家的口碑好, 说明投入的广告多。

    steve yao8年前 (2009-12-21)回复
    • 谢谢回复。某种情况下这是对的,但是广告的投入和口碑的建立并不一定是正比的关系。这个涉及到传播学上的一些课题了。当广告投入到一定程度后,更要通过口碑的监测和分析来检测广告的投入是否有效果。我们的经验表明,五毛党和泛发帖在中国可能会有效果,也可能是非常危险的。网友们已经不再是任人摆布的,他们有自己的思想和见识,精明且精确。我服务的这些客户,在主动发贴上非常谨慎,他们更乐于以直接官方的认真和审慎的态度与网友交流,这样反而避免了一些不必要的麻烦。

      Sidney Song8年前 (2009-12-22)回复
  23. #23

    我没实践过,仔细读了两遍,感觉您的这套理论方法和实践方法真是复杂,光是看着就觉得复杂。
    我始终不太相信机器能做分析,而且有时依赖于某些套路的人工分析也不一定可信,反倒是一些凭感性的直觉得来的东西可能更及时、准确。不过怎么说呢,客户肯定是不相信这种直觉,才来找第三方公司帮忙做“科学分析”的。您觉得这是一种进步,还是退步呢?嘿嘿~
    还是非常感谢您的博文,让我受益匪浅,值得我再回头去仔细读几遍。

    dodo8年前 (2010-01-07)回复
  24. #24

    昨天开始从最早的一篇看起,今天刚看到这里,留个脚印吧

    清风月影8年前 (2010-01-09)回复
  25. #25

    很快看完了,一点儿也没觉得长,比看avinash的一篇博客要快多了,呵呵。我们做过抓贴和简单分析的工作,不过目的不是为了分析,所以难度大的部分没有做过。我也好奇你的客户要做这些分析的动机,而且我也怀疑这些客户应该是国外的大公司,因为在国内很多都会采用直接封锁负面消息,或者雇佣水军来做信息淹没等很多直接的手段。从感觉上来说,我也认为这些手段会更快更直接。
    另外,传统的口碑营销要关注传播人,传播信息和环境三个要素,包括破窗理论等。而所有这些分析相当于都是对“传播信息”的研究,而忽略了传播人和环境两个要索。不过,也可能是传统的口碑营销理论并不适合互联网。传统口碑营销和IWOM的区别到底在那儿?还希望星大师如果有更多的见解能够和我们分享一下。

    william8年前 (2010-01-13)回复
  26. #26

    大概看了一下,宋兄说的这个口碑监测分析用“危机公关”系统觉得更合适。目前很多危机公关监测系统通过抓取页面,分析内容,然后收集汇总,然后分类分析内容是正面的还是负面的。
    我接触的口碑,主要是指一些软文(比如公关公司聘请写手在论坛/博客或其它网络发布的文字、图片,等等),通过嵌入JYC统计代码然后就可以监测到该软文的点击量等等信息。

    jieyancai8年前 (2010-02-22)回复
  27. #27

    好文。
    第一次写了一堆留言,一提交,说错误email,然后前面写的都没了。很郁闷。

    不打算重写了,下次有好文再回复了。

    jaogoy8年前 (2010-03-07)回复
  28. #28

    我看完了,看不太懂,完全是新手。

    lin8年前 (2010-03-18)回复
  29. #29

    不知道song对一些做炒作的机构是怎么看待的,诸如1024营销、陈墨营销机构等。

    lin8年前 (2010-03-18)回复
  30. #30

    希望能转载一些图片和网站内容到我公司的日文站点,会注明出处与链接。请示可否。
     

    zucoco8年前 (2010-05-14)回复
  31. #31

    希望转载一些图片和内容到我公司日文网站,请示可否,谢谢

    zucoco8年前 (2010-05-14)回复
  32. #32

    回复Zucoco:没问题,请注明作者和原始URL。谢谢!

    Sidney Song8年前 (2010-05-20)回复
  33. #33

    这篇文章让我对WOM有初步的认识,然后发现做SEM相比WOM还是“有理可据”一些的:)
    谢谢作者的劳动!

    Jason8年前 (2010-05-30)回复
  34. #34

    辛苦辛苦~~强烈建议整理出书,能方便更多的读者,也能稍微犒劳下勤奋的作者~~

    元宝8年前 (2010-07-19)回复
  35. #35

    文章的内容和大家的回复,都让人受益匪浅。强烈推荐给初识IWOM或者刚开始做分析的人学习和了解。
    其实之前也有在接触和尝试这领域的一些工作,发现最大的问题,就是系统的不智能化和人工的时间成本过大,目前现有市场上的多家IWOM专业机构,似乎在系统开发上,仍然存在很多局限性,大旗重在数据,CIC强于分析,都是得到大家比较认可的。可是当我们发现在这些庞大的数据背后,要保证代表性,真实性和准确性,是非常非常难的。
    基于分析的人员,除了要对数据有敏感的触觉,还需要对行业的环境和品牌的故事有充分的认知,遇到过很多有趣的故事,就是分析师面对数据时,无法判断1000是多还是少,是坏还是好,IWOM没有一个标准,没有一个既定的规模,只能靠对这个行业这个品牌长时间的观察和研究,找到其中的规律,这一点对于品牌是否有足够的耐心,分析师是否有足够的用心,都提出了很高的要求。

    bingdou987年前 (2010-08-18)回复
  36. #36

    学习啦,对于BUZZ的调性分析是未来系统发展的重点,但汉语的复杂程度是毋庸置疑的,这还需要多方面的努力,这牵扯到语言学,IT部门等等

    clockworkbox7年前 (2010-08-18)回复
  37. #37

    我比较土,看完后,觉得理论太多,很忽悠人哈
    说白了,不就是人肉搜索,然后写报告么,没有什么复制性可言,完全是看分析师的经验和水平。
    和做公司法的律师给客户的***项目的法律尽职报告差不多。
    不能批量化,用工具更不现实,而且基本是老外用这个,国内公司没人care
     

    OB007年前 (2010-11-12)回复
  38. #38

    感谢分享,收获不少,持续关注!

    luckypig7年前 (2011-03-11)回复