大数据时代

家乡区县: 上海市崇明县

我认为大数据就是把数学算法运用到海量的数据上来预测事情发生的可能性。
很多物理学家都认为世界的本质是数据,也许在以前,很可笑,但大数据时代的来临,却使我们不得不正视这一看法。一切事物都在被数据化,例如Google通过观察和剖析我们的搜索记录得知我们个人的喜好、对事物的看法、家庭......我们的一切都被数据分析透彻,毫无隐私。
在这个大数据时代中,每一条数据内部都隐藏着未被发掘的价值,我们可以运用数学算法到海量数据上来预测事情发生的可能性,比如搜狗输入法通过观察我们的输入习惯,只要打出首字母或一个字就能立即帮我们找出想要字的可能性、一封邮件被作为垃圾邮件过滤掉的可能性。相信在未来,直觉的判断将让位于精准的数据分析,我们也将越来越依赖大数据,所有复杂的任务都会被计算机完成。
FICO的首席执行官曾在他2011年的投资大会上扬言“我们知道你明天做什么”,在大数据时代确实可行,比如说动画《psycho-pass》描述的是一个人类的心理状态和性格方面倾向可以被计算数值化的世界,执行官可以根据手中的 Dominator对人们进行色相(心里良好则向白色靠近,若是有消极性的思想,色相则向黑色靠近)和犯罪指数(犯罪系数即某人可能成为犯罪者的危险系数值,是包含在PSYCHO-PASS数值中的一项指标,当这个数值超过一定数值的人类,将被判定为潜在犯罪者或正在犯罪者,这样的人类将被清除)的检查,一旦超标就会被逮捕。在这里,人们不是因为所做而受到惩罚,而是因为心理状态和即将做的,即使他们事实上并没有犯罪。大数据时代使我们看到的这种社会模式的萌芽越来越多的美国城市都开始采用“预测警务”(也就是大数据分析)来决定哪些街道、群体还是个人更需要严密监控,仅仅因为算法系统指出他们更有可能犯罪。同时美国国土安全部也正在研发一套名为未来行为检测科技(Future Attribute Screening Technology 简称FAST)的安全系统,通过检测个人的生命体征、肢体语言和其他生理模式,发现潜在的恐怖分子。美国国土安全部声称,在研究测试中,系统检测的准确度可达到70%。
也许在未来,对我们而言,危险不在是隐私的泄露,而是被预知的危险----这些能预测我们可能生病、拖欠还款和犯罪的算法会让我们无法购买保险、无法贷款、甚至在实施犯罪之前就被预先逮捕。
当然预测也不仅仅会放在犯罪上。
在2009年甲型H1N1流感爆发前几周,互联网巨头Google公司的工程师们发表了一篇引人注目的论文。文中解释了谷歌为什么能够预测冬季流感的传播。谷歌通过观察人们在网上的搜索记录来完成这个预测,谷歌保存了多年来所有的搜索记录,并且每天都会收到来自全球超过30亿条的搜索指令,如此庞大的数据资源足以支撑和帮助它完成这项工作。谷歌员工们建立一个系统用来唯一关注的就是特定检索词条的使用频率与流感在时间和空间上的传播之间的关系,并为了检测这些检索词条总共处理了4.5亿的不同的数学模型。在将得出的预测与2007年、2008年美国疾控中心记录的实际流感病例进行对比后发现,他们的软件发现了45条检索词条的组合,将它们用于一个特定的数学模型后,他们的预测与官方数据的相关性高达97%.。和疾控中心一样,他们也能判断出流感是从哪里传播出来的,而且判断非常及时,不会像疾控中心一样要在流感爆发一两周之后才可以做到。

 

L.Y(2014-12-12) 评论(0


文章内容由网友提供,不代表本站观点

如果您喜欢这篇文章,就送梧桐子“”支持吧!

已获得0个“