反思

对上述关键,我们仍需逐一反思:

关键一:数据必须转化为信息。

数据和信息是完全不同的,就如同沙子和金子,金子含于沙中却与沙不同。你的电脑里存储了大量文件,可你过后基本不看,都是数据,这些数据从某种意义上来说,就是垃圾。企业也有大量数据,不能加以利用转为有意义的信息,就是数据垃圾,而让人纠结的是,你还舍不得丢掉。

寓意深刻的时代故事

数据挖掘是什么?开个玩笑的理解:就是数据垃圾太多,舍不得丢,人力所不能为,让程序自动去里面找金子,结果金子没找到,不小心找到了钻石,老板很开心,于是人性使然,全部垃圾翻出来,全部上数据挖掘来找钻石。对门邻居老板听说了,心想我的数据垃圾更多,也要挖掘机来找,然后就有了:挖掘机人才哪里找,到LX。

故事没完,隔了两条河的对面村子老板也听说了,可是自己数据垃圾并不多,但是万一能找到钻石呢,于是到LX花高价招了几个人(要求会xxxxx数据挖掘技术的),也回来挖掘。

你真的听懂这个故事了吗?

我们要做个时代反思,中国中小企业有几千万家,单表数据容量不超过1000W的占90%,想想看一年有1000W订单,相当于一天3W订单,这个体量已经很大了。

你在Excel里能完美驾驭1亿数据,换句话几千万企业随你去做数据挖掘,帮老板找钻石,这才是真相!

故事还没完,问题在于很多人看到钻石不认识,这是另一个更加致命的真相!

读了故事,平缓下心情,你需要把这个故事拷贝出来常常看,然后提醒自己遇到钻石能不能认识?我知道你也正想问,怎么认出钻石。来看关键二。

关键二:必须从各个维度来加以理解。

首先思考:如果你都看不出来钻石,你相信机器可以吗?

你说相信,看阿法狗战胜人类棋手了。好吧,只能呵呵以对。姑且不说阿法狗战胜人类棋手的科技本质和领域限制。所有企业是否可以普适或者与你有没有关系才是关键。

为了避免见到钻石不认识的问题,并且具有普遍的适用性,这个解决方案才是我们要的。

其方法论由Ralph Kimball3提出的维度建模(dimensional modeling),其本质就是从各个维度去理解事物。

这个方法就是在各个角度在沙中评估和查找金子或钻石的方法,他避免了片面性并且是一种普适可操作的,在我们目前可看到的未来年月中,这仍然是一种主流方式。那些愿意砸一百万下去用数据挖掘找钻石的投入毕竟不是什么企业都能做的。

从沙中找金矿,从金矿中提炼金。

把数据转为信息,将信息转为商业价值。

看个新闻吧:年薪百万的机器学习专家,为什么不产生价值?4(请先看新闻)

读到最后你会看到:

在人工智能爆发初期的时代背景下,aa网联合旗下人工智能频道AI科技评论,携手xx和yy,重磅推出【2017 AI 最佳雇主】榜单。

从“公司概况”、“创新能力”、“员工福利”三个维度切入,依据 20 多项评分标准,做到公平、公正、公开,全面评估和推动中国人工智能企业发展

标题党先不论,最后这句话,从…维度,依据20多个KPI,这是典型的维度建模,有没有?

讽刺的是机器学习不好用不说,最终还整出个维度建模的例子,为什么机器学习不能直接评出结果呢。

从此你知道三件事:

  1. 因为机器学习,数据挖掘有巨大泡沫成分,江湖骗子远远多于科学家。
  2. 老板往往愿意花100万被骗也不愿意买个Office 365正版给广大员工用。
  3. 你也许默默地为老板找到了钻石还省了他被骗的100万。

当老板给你一个机会来做述职报告的时候,请重看此白皮书,结合上述案例,去大胆地为自己的工资要价吧!相信我,更相信你自己,绝对值!然后回来打赏excel120。

关键三:在科学技术的平台上,调动人类智能(经验)以及感性处理器来最大化发挥。

从刚刚的体验中,有个细节是:“同样的数据,经过变换”。如何变换,变换成什么?具体怎么做?

在这里就是利用Excel / Power BI这种科技平台,进行数据增强(Data Blend);其结果应该被人类智力能识别,通过人类大脑的经验,感性能力,理性能力进一步处理,得到最终的价值。

可视化,为什么可视化,做商业报告的本质在哪里?在这里!因为这个过程可以利用人类智力。你应该相信上帝创造的人类智力不是那么容易就被机器取代的,甚至可以直接说无法取代。

有关可视化本质及为何机器智能无法取代人类智能限于篇幅,留待后续讲述。

因此,关键一表明了一种态度,我们要基于有潜在信息可能的数据进行工作;关键二是保证发掘信息的同时避免片面性问题,避免“盲人摸象”;关键三则是提倡用人类智能并未过时,而且普通的非技术人员具有的经验都远远比我们想象的强大。

3. http://baike.baidu.com/item/Ralph%20Kimball
4. http://t.im/1djvd

results matching ""

    No results matching ""