难以预测的非常态(刘荻)

2013-04-15
电邮
评论
分享
打印
  • 打印
  • 分享
  • 评论
  • 电邮

最近我的朋友王金波写了一篇文章《政府应对能力在常态和非常态的区别》,文中对我和安替的观点进行了评论,然而本人认为该文颇为不得要领:即使政府的应对能力在常态和非常态情况下真的有区别,要事先预测“非常态”会在什么时候出现也是十分困难的。

在今天这个“大数据”时代,我们总是希望大数据能够预测未来。介绍大数据的书籍往往会提到大数据的预测能力,但是所举的例子中有些根本就不是预测:谷歌“预测”流感的流行趋势时,流感疫情已经发生了,谷歌做的实际上并不是预测,而是在流感疫情发生之后尽快发现其流行趋势。

当然,还有另一些预测值得我们仔细研究。

一般来说,要预测一件发生概率较大的事件,通常没有多少困难:我们都能预测到明天太阳还会照常升起,没有人会因为我们能预测这个而大惊小怪。然而预测诸如“明天太阳还会照常升起”之类的事件对我们来说并无多大意义(或者说,因为我们对能够预测这些事已经习以为常,因此不认为这种预测有多大意义),我们想要预测的是另一些事件:地震会在什么时候发生?股市会在什么时候崩盘?恐怖分子会在什么时候发动袭击?或者,革命会在什么时候发生?

要预测上述“小概率事件”就不那么容易了。让我们先来看一道与概率有关的题目吧:假如有一种疾病,在人群中的感染率为千分之一;这种疾病有一种检测方法,其准确率可达百分之九十五;那么,假如某人的检测结果为阳性,该人患上此种疾病的可能性有多大?

多数人会回答百分之九十五,其实该人患上这种疾病的可能性只有百分之二而已。(对于这种题目,老师们会教你们用令人头痛的贝叶斯公式来计算,其实你只要这么想就行了:使用这种检测方法,一千个人里面会有五十个人被误诊,而实际上一千个人里面只有一个人患病,一除以五十,结果是百分之二。这种估算法并不十分精确,但也足够用了。)也就是说,当一种准确率高达百分之九十五的检测方法认为一个人可能患有一种感染率为千分之一的疾病时,误诊的可能性高达百分之九十八。

在预测诸如“什么时候会发生恐怖袭击”或者“什么时候会发生革命”之类的小概率事件(也就是非常态事件)方面,我们也会遇到同样的困难:如果某一事件发生的可能性很小(例如某时某地发生恐怖袭击的可能性或者某起意外事件对政权构成威胁的可能性),那么即使你的预测模型准确性相当高(百分之九十五的准确率已经非常高了),你收到的报警中也会绝大多数都是误报。有关部门不得不把绝大部分的时间和精力都用在处理误报上面——这也可以解释为什么他们经常对一点小事反应过度。(在这方面,你也可以想一下:豆瓣或者亚马逊给你推荐的成百上千本书中有几本是你真正会买的。)

这里本人还要补充说明一下:报警错误通常可分为两种:漏报和误报。前者包括911事件,也包括我党未能预测到刘晓波获得2010年诺贝尔和平奖;后者则包括约翰•勒卡雷的小说《巴拿马裁缝》中的情节——间谍和线人合谋捏造了一个革命团体来骗取经费,这个故事与十年前我本人的案子类似——当然大多数误报并不是有意捏造,而是不可避免的现象。

虽然有关部门遇到的主要问题是误报,然而他们显然更加担心漏报:他们担心发生像911那样的恐怖袭击,或者像阿拉伯之春那样的革命,而他们没有事先预测到,因此他们希望提高检测的敏感性。可是提高检测的敏感性只会带来更多的误报,令有关部门疲于奔命,把时间都浪费在误报上,没有精力去处理真正的非常态事件。

预测还会遇到另一个问题,那就是预测本身会对所预测的事件产生影响:如果有关部门预测到恐怖分子将在何处发动袭击,自然会在该处加强戒备,恐怖分子可能就会因此而改变计划,改在别处发动袭击,让有关部门的预测落空,而有关部门又要重新进行预测;能够预测最佳订购时间,帮你找到最低价的订票或购物程序本身就可能会对机票或商品的定价方式产生影响,而定价方式的改变可能又会反过来影响到模型的预测能力……这种相互影响可能无休无止,最终会造成哪些结果,我们所知道的还非常有限。

由此还牵扯出另一个问题:如果对政权构成威胁的革命从未实现过,有关部门又如何来检验模型的预测能力并对其进行调试呢?毕竟,可能的模型有无数种,而究竟哪种模型管用只有在事情发生之后才能知道。可是事情一旦发生……我们也就不再需要这种模型了。

还有一个与之有关的问题是:如果有关部门希望通过微博或者其他网站上网民的发言和网民之间的互动数据来预测可能发生的对政权的威胁,那就不能删贴;如果要删贴,那么根据删贴后的数据来建立的预测模型就是可疑的……总之,控制言论和从言论中获取所需的信息是两种彼此矛盾的诉求,控制言论最终只能蒙住有关部门自己的眼睛。

(文章只代表特约评论员个人的立场和观点)

完整网站