美国的科学哲学家汉弗莱斯对大数据进行了深刻的分类,将其分为大写的大数据(BIG DATA)和小写的大数据(big data)。小写的大数据指的是与数据科学相关的活动和方法,主要面对的是拥有海量数据的组织机构所面临的技术问题。而大写的大数据则是在小写大数据的基础上,向社会的各个领域渗透并迅速发展而来的产物。这一分化揭示了我们日常所谈论的“大数据”实际上涵盖着不同的层面和含义。
以数据为媒介,激进的汉弗莱斯学派认为数据可以客观地揭示世界的本质。他们认为只要数据量足够庞大,就不再需要模型、问题乃至相关理论。在这一理念下,数据本身就能发声,相关性的成为研究的核心。这一观点也受到了保守学派的质疑。保守派代表人物如弗洛里迪、克劳德等人承认大数据的独特价值,但对于其是否能客观反映真实世界、是否完全摆脱理论束缚等问题仍持理性怀疑态度。
在大数据的不同观点时,两个典型案例跃然纸上。
关于人类数感研究的案例揭示了大数据在科学研究中的巨大潜力。人类对物体或事件的数量有一种非言语的表征方式,心理学家称之为近似数量系统(ANS)。这一系统的研究长期以来因为难以追踪个体在整个生命周期的变化而进展缓慢。随着大数据技术的崛起,约翰霍布斯大学的哈尔伯达利用这一技术,在短时间内征集了全球各地的志愿者并参与在线测试。通过对这些数据的分析,他不仅验证了一些假设,还发现了新的规律。这一案例展示了大数据如何推动科学研究的进步。
再看谷歌流感预测的案例,这一案例体现了大数据在实际问题中的应用价值。传统的流感预测系统主要基于病毒学理论,虽然权威但常常滞后。谷歌通过收集和分析互联网搜索数据,建立了一个预测系统,其预测结果与美国疾病控制和预防中心的数据高度相关,且预测时间更为提前。这一案例展示了大数据在解决实际问题中的巨大潜力。
这两个案例恰好反映了大数据的激进派和保守派的不同观点。前者强调了大数据在科学研究中的重要性,后者则指出了大数据在实际应用中的价值。虽然两者有所区别,但随着技术的不断融合,它们之间的界限越来越模糊。无论是激进派还是保守派,都不可否认的是大数据已经成为现代社会不可或缺的一部分,它将继续推动科学和社会的发展。网络技术的高速发展催生了SDS数据的蓬勃发展,尽管其依赖的技术基础广泛,但其背后的方法和模型在很大程度上都是基于SSD研究成果的延伸与拓展。正如汉弗莱斯敏锐地洞察到的那样,小写的大数据正逐渐渗透到社会的各个领域并实现了快速发展,而这正是大写的大数据得以崭露头角的关键时刻。随着大数据领域的不断拓展和深化,我们逐渐意识到存在两类既相互区别又紧密联系的大数据实体。
这两类大数据各具特色,其研究对象和应用场景不同,因此在开展相关研究时,研究者必须对自身所聚焦的对象类型有清晰的认识。只有明确了研究对象属于哪一类大数据,研究者才能避免陷入无休止的争论漩涡中,从而更加专注于自身领域的与发展。这两类大数据虽然各有侧重,但共同推动了大数据行业的整体进步。
数据杂志上薛永红所著文章深入剖析了SDS数据与网络技术之间的关系,以及大数据领域所面临的挑战与机遇。对于想要深入了解这一领域的读者来说,这篇文章无疑具有极高的参考价值。在大数据日益成为时代宠儿的背景下,这篇文章也为我们提供了宝贵的思考视角和方法论。
随着大数据技术的不断发展与普及,我们对这一领域的认知也在不断深化。流产网作为一个提供知识和信息的平台,希望本文能对广大读者有所帮助。在大数据的道路上,我们仍需不断研究、不断创新,共同推动大数据领域的发展与进步。转载本文时请注明来源,尊重原作者的知识产权和劳动成果。