李希光败类 李希光:大数据对人类是一场噩梦
随着大数据时代的到来,"数据"这种抽象东西,在我的日常生活中越来越具体和重要。有一次去东三环燕莎附近的一家餐馆吃饭,当我回到停车场时,发现车的后备箱被人撬开,我的笔记本电脑被偷走了,虽然这台笔记本电脑价值一万多元,让我心疼的却是存在硬盘里的资料,它们的价值可能是电脑的几十倍、上百倍。这件事让我付出了惨痛的代价,也让我养成了一个好习惯,资料随时备份在移动硬盘、办公室电脑等多个终端里。
我第一次接触电脑,还是上个世纪八十年代初我在中科院理论物理所给周光召所长做外事秘书时,周先生当时花了250美元从美国带来了一台刚面世的苹果电脑,让我第一次看到了电脑视窗,第一次意识到电脑里的数据是可以看得见、看得懂,而且还可以用来玩游戏。
而在此之前的六十年代,周光召、于敏、何祚庥等科学家做核武器的理论设计,使用的还是手摇计算机。手摇计算机只能做简单的数学运算,例如加减乘除、开根号、求平方等,如果需要输入三角函数和对数,都需要查表,使用起来也十分麻烦,经常需要正摇几圈,反摇几圈,还要用纸笔记录。
研究生毕业以后,我被分配到新华社做记者,恰好赶上新华社全面采用王安电脑终端编辑英文新闻,使英文新闻的编发工作实现了电脑化。在此之前,记者要靠纸笔、打字机、传真机和电传机进行手工作业,编辑部门要把编好的稿件送到发稿部门,由报务人员按稿件先打字作电传孔条,然后再在各条线路的发送机上发出。使用终端机后,编辑记者可以在电脑上直接对稿件进行编辑修改。
我买的第一台个人电脑是中关村的组装机。那台电脑的操作系统是UCDOS,使用的是5.25英寸的软盘,容量是360K。我的第二台个人电脑的软盘已经更新成3.5寸的,容量也增加到1.44M,我的办公室现在还有上百张3.
5寸的软盘,可惜现在已经不太容易找到能够读软盘的电脑了。光驱、移动硬盘、U盘打败了软盘,成为数据存储的主流,存储介质的容量也越来越大,几年前的U盘一般都是16M的,而如今16G的U盘都嫌不够用。
我每次出国都要逛电子产品商店,看看有没有容量更大的移动硬盘或U盘。我现在使用的是两块1T的移动硬盘,分别存储不同的文件。其中一块移动硬盘里存储着foxmail邮件客户端,数据容量已经达到20G,存储着我所有的电子邮件,我用foxmail对邮件信息进行了分类,它就像我的一个私人图书馆一样,随时可以方便地查找资料。
但是,使用移动硬盘仍然不够方便和安全,因为一旦移动硬盘丢了、坏了,或者是当你急用的时候却发现它不在身边,都会带来不便。最好的方式是通过云储存,把资料备份到云端,但最大的担心是怕不安全,万一云端的服务器出了问题,或者网络出了问题,造成的损失是不可估量的,所以我现在还是靠自己储存数据。
我的办公室有一面墙的书架都是存放录音带、录像带、光盘和各类软盘的,存储着我从教书以来的所有影像、课件、资料,但是查找文件就像大海捞针一样。现在许多软件对数据分类和查找都支持得很好,如果能在一张移动硬盘上集中存储这些数据,自然要方便很多。但移动硬盘也不安全,既有被盗的风险,也担心使用中损坏。所以最终的解决方案还是要依靠云存储,所有的文件都存储在虚拟空间里,随时可以通过互联网找出来。
我对"网络数据"的直观感受就是它的增长速度像原子弹链式反应一样,至今仍在加速膨胀。我从1995年开始使用互联网,一直到2010年的15年时间,积累的数据资料也就是书架上的各类光盘、软盘、磁带,而从2010年到现在这2年的时间,就积累了2T的数据,可能与前15年数据的容量相当。
在大数据时代,人们对数据的分类检索和储存智能化要求越来越高,否则查找有用的数据就像沙里淘金一样,大数据对人们来说意味着宝藏,同时也不可避免地带来了数据垃圾。作为一名研究人员,我从事研究工作的基础是文献检索和综述,离不开数据的收集、分类、综述、摘要,这些工作在过去都是依靠纸质的报刊、图书文献,工作的方法是"剪报",我从小学三年级开始剪报,一直到读研究生还保持着这个习惯。
后来到新华社当记者,查找文献还是依靠剪报。再后来出现了电脑,的确给文献的收集和使用带来了方便,但由于太相信电脑,一旦系统崩溃了或硬盘坏了,数据就没了。
美国皮尤中心于2012年7月20日发布了一项关于大数据的民意调查报告,有53%的人乐观地认为大数据的应用能够促进社会、政治和经济的智能化发展。但同样值得注意的是,39%的人对大数据的前景表现出极大的忧虑,认为大数据会造成人类对自身预测能力的盲目自信,进而会导致很多错误的决定。
甚至有人认为大数据的崛起对于整个社会而言,无疑是一个噩梦。人类最终不是被核武器毁灭,而是被堆积如山、臭气熏天的互联网信息埋葬。
在我看来,大数据时代人类面临的更大问题是,各类互联网终端的普及,特别社交媒体的出现,人人可以成为文章的作者,人人都是学者,人人都是杂文家,人人都是摄影家,人人都是制片人,人人都是演员。在纸媒时代,作者的门槛很高,那个时候在书店里随便买一本书都有价值,今天由于信息的爆炸式增长,人们很难区分什么是有价值的信息,什么是垃圾信息,灾难就是把这两类信息都放在自己的数据库里,有价值的信息被埋没,信息的泛滥带来人类整体的平庸化和低俗化。
人生是短暂的,如果人生要在荒诞的信息中自娱自乐,一辈子就那样过去了。问题是人类意识不到自己是在高尚传播还是低俗平庸传播中。人类将来也许不是被核武器毁灭,而是被大数据所毁灭。因此,我们要研究和掌握其中的规律。媒体教育工作者要面向公众开展大数据的媒介素养教育,研究人员要开发出最好的技术,使人们能够利用适当的技术方便地获取到更多有价值、有深度的信息。
由郭晓科博士主编的《大数据》,虽然篇幅不长,但本书编译者们通过艰苦的文献研究,精心编译了最新的、有重要价值的国际研究报告、国际数据、行业最新进展等文献,从数据大爆炸、大数据应用、大数据挖掘、大数据前瞻、大数据安全等不同的角度为读者展示了一幅浩瀚的大数据景观,无论对于专业人士,还是对于普通公众,在面对汹涌来袭大数据时代,这本书无疑具有重要价值。