郑磊/文
我们生活在一个不确定的世界里,这是人类一直面对的重大挑战。随着世界变化越来越快,不确定性明显增强了,数据变得越来越多,我们不得不提升自我认知和适应能力。这两本《数据化决策》类的书籍给我们提供了有效且易用的工具,其中,《数据化决策》已经被译成4种语言出版。作者从方法论高度,重新定义了量化分析,并且用大量示例讲解了如何针对具体情况采用合适的量化方法,形成我们的常识,通过这些简单方法就可以有效减少不确定性。《数据化决策2.0》则介绍了基于网络大数据收集和分析的决策方法,相对前一本书,这本书需要更专业的分析工具,能够得出更准确细致的结果。
这两本书的主题是大数据时代的量化决策方法,属于决策科学。第一本书给出的方法需要一些创意思考,但是使用起来很方便,只需要纸笔就能完成。比如古希腊人可以通过两地距离估算地球的周长,费米用一些碎纸片大致估算了第一个原子弹试爆产生的威力。有很多有趣的窍门是非常有用的,你可能以为艰深不可高攀的理论问题,就被作者轻易化解了。再比如,作者提到了一个5人法则,就是通过统计学的简单计算完成快速量化分析的最佳例子。如果公司业务需要更多采用远程办公,我们需要考虑每个雇员每天花在通信上的平均时间有多少。如果不需要太精确的结果,我们便无需对全体员工进行调查,只要随机选择5名员工询问即可。假设得到的各是30分钟、60分钟、45分钟、80分钟和60分钟,那么可以断定所有员工用时的中位数有93.75%的可能是在30和80之间。你可以据此进行决策而不必担心有太大问题。因为极少数员工的用时会离这个中间值很远。这种方法比小样本抽样还要简单和省时,如果你想要结果更准确一些,可以再多选几个样本,但是结果的准确度提高并不大。
生活中很多时候需要这种不追求过于精确的判断的场合。通过简单的计算和分析,就能帮我们进一步确定工作方向,而我们手中的数据通常足够用来做这种分析。尽管如此,是否要进行量化分析,还是需要思考的,因为无论是构思一种巧妙的简单量化方法,还是动用大数据收集分析软件做分析,都有成本和收益方面的考量。我们之所以这样做,首先是为了减少不确定性带来的损失。作者给出了5个步骤,先定义需要决策的问题和相关的不确定因素,确定自己现在知道什么信息(数据),计算收集其他必要信息的价值和成本,然后选择将有关量化方法用于具有高附加值的量化中,做出决策并采取行动。
对于要求更高的大数据分析,现在已经有了非常好的算法软件,可以随时监测和抓取网络上留下的具有洞察价值的信息,而且这些信息是公开的,一般不存在网络爬虫抓取私人信息那样的法律或伦理冲突。目前已经有不少机构通过这种量化分析改善决策方式并获得了竞争优势。比如,纽约警局的脸书监测小组能够利用脸书中的信息,在没有任何目击者的状况下,追查帮派斗争中杀害无辜青少年的犯人并将其定罪。印度国产通信软件 Hike Messenger采用精准的社交媒体分析工具,将分析结果反馈给产品研发部门,用以开发新的功能,只用了不到 3 年的时间,用户数就超越脸书成为排在WHATSAPP之后的受欢迎的通信软件。2016 年,融文集团通过分析社交媒体信息,准确预测了英国脱欧公投的结果,以及特朗普在大选中的胜出。而传统的民意调查则获得的是相反的结果,这表明网络大数据分析能够更准确地分析这类复杂局势。
我们生活在一个被公开数据淹没的世界,但大量的数据仍然被忽视,这是一个尚未被充分关注的巨大“金矿”。网络改变了我们的生活方式,但人们使用的决策方法仍停留在过去。我们有必要结合这两本书提供的决策方法论,通过简易快速低成本方式先对问题做一个初步分析,明确重点和难点,必要时,集中算力资源,借助大数据算法软件对那些关键环节或信息进行即时收集和分析,提高决策的准确度和效率。