误读数据等于自杀

文/宋星（网站分析专家、前Adobe Omniture 商业咨询经理）

上一期的文章《构建数据驱动型团队》，介绍了数据驱动型组织架构的模式，无论hub模式，还是有BI系统参与的hub模式；业务部门都面临着很大的风险。一方面， hub本身存在资源和响应的矛盾（上一期中已经着重分析了）；另一方面是，数据误读比没有数据更可怕。

电子商务业务部门更强调业务能力，因此在数据的分析和解读上，能力相对较弱。与传统零售行业不同，传统零售的BI系统和分析团队往往经过了超过10年的进化，因此早已形成体系和一套具体的方法。电子商务虽然也属于零售业，但很显然，这些公司要年轻太多，让业务部门拿到数据后自己去做分析和评估是困难的。

最大的隐患是，数据分析很容易变成一个粗暴简单并不断被“自以为是”的经验所干扰的工作。即使在做了很多的案例之后，我仍然认为，我没有不被主观的感觉影响过判断，直到我得到更多的数据充实上下文才可能避免不客观的分析。

业务部门背负业绩压力，他们可能在一开始就主观上倾向于让自己不那么客观。

很多业务部门在拿到数据后，会因为时间的压力和数据分析经验的缺乏，导致出现数据的误读，进而造成结论背离事实。这种情况是时有发生。

呈现方式导致的心理错觉

我曾在心里默念，对于数据应该常常怀着敬畏的心，因为简单粗暴适用于网络营销，但绝对不适用于营销分析。如果你有那么一点点粗心，或延续了“简单粗暴”的办法，那些数据中给你揭示的细微的差别，你可能会忽略，而这些差别可能会让你得出完全不一样甚至是相反的结论。

例如下面的这个例子：

下面两个图的数据实际上是完全一样的，可是，两个图给人的心理感觉却是完全不同的。

尽管数据一样，但这两个图用了不同的数据显示区间（Scaling）。由图1得出的结论是，利润在近期剧烈波动，而图2的结论则是利润在近期平稳维持在低位。这两个结论并不能简单说它们正确与否，而取决于实际的商业环境。如果你的生意平常一天是1000元以上的利润，那么显然图2给你的结论更有参考意义，你应该探求为什么最近的生意几乎停滞了。

但是，如果你的生意一天最多不超过100元的利润，那么图1更有价值。而且你可能会觉得，利润数不错，这几天还有明显的上涨趋势。不过，或许你还是不能高兴得太早。右边这个图（图3）和图2在利润上的数值是完全一样的，不过增加了另一个数据项：收入（蓝色点）。

你可以看到尽管利润上升了，但收入上升的趋势更为显著。这意味着，我们的利润增长并没有收入增长的快。或者换句话说，我们的投资回报率（ROI）下降了。因此利润虽然上涨，但完全不值得我们高兴。我们反而应该检讨，为什么效率降低了。

缺乏经验导致误读

数据的误读很多时候并非是故意的，而是跟经验有关。这些经验在于两点，第一点，对于数据的运算和把握。例如，合理建模，合理的数据可视化（Data Visualization），以及对工具的合理应用。第二点，在于对于业务的准确把握——做到看数说话，与实际业务几无偏差。第二点是建立在第一点的基础上的。如果第一点出现了一些问题，或是没有技能，或是没有经验，第二点便无法达成，即使对于业务有很好的感觉和清晰敏捷的头脑，也会为数据所累。

来看另一个真实的例子。

我的朋友Johnny，他为在美国销售某一个商品而投放Google AdWords的广告。这个商品的利润额在2011年的表现如图4所示：

很显然这个商品的销售出了问题，有必要找出原因。

利润下降，要么是收入减少，要么是支出增加，要么是二者同时发生了。从支出上看，每个月的支出变化不大，而且实际上，当利润降低的那些月份，支出反而也是略有降低的。那么很明显，收入下降是造成利润下降的主要原因。收入为什么下降呢？

很快，他们找到了一个相当有说服力的数据关系：当SEM关键词的平均排名下降了之后，销售收入也非常明显地下滑，如图5所示。

现在，假设一个情景：有一个非常缺乏经验的初级SEM专员，他很可能给出的结论是：利润降低，是因为收入降低。收入降低，是因为关键词排名降低，因此我们需要提升关键词排名，以获得更多收入，提升利润。

你当然相信这个结论是简单粗暴，并非反映事实。事实是，关键词排名升高，当然会获得更多的点击，从而获得更多的销售额，但成本同时也会提高。所以，这个结论并不一定是正确的。于是，更有经验一些的SEM专员会继续坐下来寻找下一个关系，如图6所示。

这个图简直是图5的翻版，只是一个是收入，一个是利润，数据的比例尺不同而已。看起来，利润与关键词平均排名的关系和收入与关键词排名的关系也非常一致。现在，我们可以放心大胆地得出结论：我们应该提升排名，以获得更多的利润！

于是他们提高了出价，提升了排名，并且在2012年1月份得到了结果——利润不仅没有升高，反而更加下降了，甚至某些天是负的，尽管关键词的排名又重新回到了第3位左右。

之前数据反映了某种似乎确定无疑的关系，但按照这种关系行事，并没有带来预期的结果。

我们必须承认，SEM投放是一个复杂的策略过程，并且因为瞬息万变的外部环境（竞争对手的出价），而造成最优化的出价方式总是动态的。

上面的例子，Johnny认为原因很简单，这个商品的关键词投放可能已经遇到了瓶颈，因为外部的环境发生了变化。Johnny查看了其他的数据（我们当然不能忽略其他数据的关系），例如CPC（Cost Per Click）数据。Johnny发现在这12个月中，CPC的变化并不大。CPC没有明显变化，而排名在逐渐降低，说明竞争对手在不断增加出价。这样，相同的投入情况下，排名降低，收入减少，利润减少，如图7所示。

可是增加出价后，我们解决了一个问题，却带来了另外一个问题——出价增加、收入增加，同时成本也上升了。由于竞争环境的影响，要达到以前的排名，所出的价格甚至是之前价格的三四倍。因此，虽然收入增加，但成本上升得更可怕，利润空间被压缩得非常厉害。

由于这个商品60%的销售都是由一个最主要的词（大词）带来（这是我之前没有揭示的一个线索），也许我们可以因此得出另一个结论：大词的ROI表现日益下滑，因此或许应该拓展其他的词。例如长尾词，从其他的竞争不大的词上找机会。

不过，从目前的情况看，这个商品的长尾词并没有多少流量，它仍然依赖于大词的表现。所以，我们认为，这个商品本身的市场环境已经发生了变化，高ROI的好日子过去了。现在的策略是，在微利的情况下生存，尽量更精细化、更实时优化，保证不亏损，并着手开发新的商品。

或许这个SEM的例子并不是一个非常典型的例子，因为SEM的分析仍然是相对结构化和流程化的。我们通过BI的建模完全可以自动化，但如果没有好的BI系统，那么这些工作需要人来完成，需要有经验的、相当数量的人来完成。

SEM是数据分析较为特殊的类别。相对而言，其他的运营分析更不具有预先的结构化和流程化，例如对EDM营销（或数据库营销）的研究，需要大量的测试；对一次campaign或是promotion的销售预测，需要很有经验的分析师；或是对于商品生命周期的研究，需要精通零售的数据挖掘专家。这些都不是运营简单粗暴能够实现的。

所以，人们渴求数据，尤其是运营部门。但人们却很容易在面对数据时变得焦虑和不信任。我常常会听到这样的反馈：“数据是错的！”——我相信永远没有他所希望的正确的数据。无论是数据误读，还是根本数据就是数据，从来没有转化成有价值的信息，都意味着反面的效果，甚至远不如根本就没有数据。

因此，数据驱动的企业文化的要件，除了对数据有渴求，对数据有“使能”，还需要对数据正确的解读。

我们需要从组织结构上保证数据能够被正确解读，或者至少是尽可能地被正确解读。

数据组织架构也需要民主化

一个组织的自下而上都有数据驱动的需求（上面的需求部分），而且也有决心投入资源建立数据部门（上面的使能部分），那么剩下的就是如何正确地利用数据，准确地获得信息，并以最快的速度运用在运营和执行策略上。

在上期中，我提出了对于“集中化”数据组织的疑问。我相信这种数据组织是蕴含风险的，无论这种集中是人力资源的集中，还是数据自动化系统的集中。如果我们需要一种健康的数据驱动的企业组织，那么我们就需要“数据民主化（Data Democratization）”。这个想法，来自于我之前工作的Adobe Omniture，也来自于凯文·凯利的《失控》。

人体是最大的“民主化系统”。大脑的思维并不会指挥消化系统的工作，心跳的速度提升和变缓也是自发完成的。心理学家告诉我们，大脑的主动意识甚至仅仅支配了人不到10%的行为，潜意识却无时无刻不决定我们的行为。有些生物，例如蜜蜂，这些几乎连大脑都没有的生物却展现出高级群体特征，并通过特定手段传递相当复杂的信息，这些都不可能来源于一个集中化的“中央控制系统”的主动指令。

一个组织的数据驱动类似于人的神经系统，大脑负责核心的运转（关键执行）和高级的思维（战略），各系统（消化系统、循环系统……，即各经营部门）根据机体的内在和外在环境变化自主运行，形成一个反应灵敏、步调协调的统一组织。因此，数据驱动组织，不仅仅依赖于中央思考部门（数据和策略部门），同样依赖于各运营部门自身的神经单位。

按照这样的思想，理想的数据驱动组织分为三个层次（图8）：中央控制的战略层、拥有自己“神经”的运营层，以及实现这一切的基础设施层。

与这种模式相对的模式，则是集中化的模式——高层（例如一个集中的数据部门）拥有数据，然后指挥运营层的执行。这种模式难度太高。

可是我们在之前也说过，数据民主化之后，中层（运营层）如果没有正确解读数据的能力，可能比数据误读更可怕。因此，为实现数据驱动的组织结构，数据民主化不仅仅是让“数据本身”民主，也是让数据能力变得更加民主，即数据资源和数据分析资源的共同民主。

让数据分析师回归业务部门，而不是龟缩在数据部门中。

数据属于业务，数据分析师当然也属于业务。这是对他们最好的，也是对这个组织最好的。除此之外，还有什么方式能够让他们发挥更大的效力呢？

如图9所示，我们拆散数据部门的集中结构，让数据分析师分布到各个业务部门去。他们帮助业务部门运用数据系统、获取数据、处理数据，与业务人员一起（结合实际业务）更直接更快捷地解读数据，并将结果直接应用于业务。这样，数据部门则只负责两块，即图8三角形结构中的最高层（竞争环境研究、全局性跨部门的策略研究、战略研究以及绩效跟踪）和最底层（数据仓库、报表和BI，以及对它们的维护）。中间的运营层面，应该是数据分析师和业务部门共同完成的。

这或许是最类似于人体组织的“民主化形式”——我们的大脑不是神经系统中唯一的器官，而能够进行“思考”的器官，也绝不仅仅只是大脑。

结论：

我有些偏执地相信，数据驱动型的组织一定不是人们主观期望它实现就能实现的。这个组织需要自下而上的需求，尤其是那些真正干活的人，他们对于数据的需求决定了这个组织数据文化的根基。如果他们确实有需求，那么我们应该确保这个公司有数据的输出和处理，以及确保对于数据的处理或者解读是正确的，且能够最快速度地直接应用于业务的需求。

我相信，自上而下并非数据驱动组织形成的要件。或者更偏激地说，数据驱动组织不是CEO或者董事会希望它实现就能够实现的。这其中一定包含历史原因、政治阻力以及人本身的情况。而人本身的情况，才是数据文化的核心，是一切文化的核心。

via：天下网商

菜单Menu

更多阅读：

菜单Menu

更多阅读：

分享这篇文章