在云计算、移动互联网等发展的推动下,每年环保部门产生了海量的数据,人们将这种海量数据称之为“大数据”(Big Data)。在大数据时代,环境信息化的应用应从大数据中发现具有规律性、科学性和有价值的环境信息,建立环境数据中心,从而为环境部门的日常管理与科学研究做出贡献。
大数据能帮什么忙?
协助环保部门更好地预测未来走向 大数据分析最重要的应用领域之一就是预测性分析,从大数据中挖掘出独有特点,通过建立评估和预测预报模型,预测未来发展趋势。
大数据的虚拟化特征,还将大大降低环境管理风险,能够在管理调整尚未展开之前就给出相关答案,让管理措施做到有的放矢。
有效管理污染源企业 通过大数据技术,可以实现污染源企业的精准锁定。在污染源的生命周期过程中,每个节点所需要的每一类数据,都可以进行搜集分析,形成基于污染源管理的数据资源分布可视图。就如同“电子地图”一般,将原先只是虚拟存在的各种点,进行“点对点”的数据化、图像化展现,使得环保部门的管理者可以更直观地面对污染源企业。
提升公众服务能力 通过大数据整理计算采集来的社交信息数据、公众互动数据等,可以帮助环保部门进行公众服务的水平化设计和碎片化扩散。可以借助社交媒体中公开的海量数据,通过大数据信息交叉验证技术、分析数据内容之间的关联度等,进而面向社会化用户开展精细化服务,为公众提供更多便利,产生更大价值。
环境数据中心建设有哪些应用?
随着大数据技术的不断发展,将大数据的理念引入到环境数据中心,作为一种全新的环保行业数据解决方案,也愈发成为了可能。大数据技术在环境数据中心建设中可以采取哪些应用方式呢?大体上有以下几种:
采用“数据众包” 对于环境数据采集工作,可以借鉴数据众包思路,譬如对于污染源企业的部分监管工作,环保管理部门通过平台自助式地把各类数据采集类型任务发布给公众人群,公众利用手机参与应用,就可直接完成各类数据采集任务。也可以利用互联网进行全网监测,依据采集的内容,环境管理者可以更好地了解社会热点事件、政策实施效果监测等。
建立NoSQL数据库 传统的环境数据库一般采用的是关系型数据库来进行存储管理,但是关系型数据库有很大的局限性:难以满足对海量数据高效率存储和访问的需求,难以满足对数据库高可扩展性和高可用性的需求。因此需要研究、选择合适环境大数据管理的数据模型,建立NoSQL(Not only SQL)数据库,实现在云计算环境下对污染源数据的分布式高效处理、存储。
数据质量管理 数据质量管理是大数据在环保领域的重要应用。为保证大数据分析结果的准确性,需要将大数据中不真实的数据剔除掉,保留最准确的数据。这就需要建立有效的数据质量管理系统,分析收集到的大量复杂数据,挑选出真实有效的数据。
大数据分析 大数据,表面上看就是大量复杂的数据,这些数据本身的价值并不高,但是对这些大量复杂的数据进行分析处理后,却能从中提炼出很有价值的信息。
数据挖掘算法是大数据分析的理论核心,其本质是一组根据算法事先定义好的数学公式,将收集到的数据作为参数变量带入其中,从而能够从大量复杂的数据中提取到有价值的信息,挖掘出环境质量与污染源两者间的联系,并利用这种联系,改善环境管理。
预测性分析能力是大数据分析最重要的应用领域。从大量复杂的数据中挖掘出规律,建立起科学的事件模型,将新的数据带入模型,就可以预测事件的未来走向。环境预测性分析能力常常被应用在空质量预测、水环境质量预测等方面。
随着大数据时代的到来,人们的需求逐渐从数据存储、数据处理过渡到数据应用和数据运维服务,与此同时,传统的环保行业对于数据的处理模式已然不适应新一代数据中心的发展需要。而大数据技术也正逐渐成熟,一旦完成数据的整合和监管,大数据爆发的时代即将到来。现在要做的,就是选好方向,为迎接大数据的到来,提前做好准备。
编辑:李晓佳
版权声明:
凡注明来源为“中国水网/中国固废网/中国大气网“的所有内容,包括但不限于文字、图表、音频视频等,版权均属E20环境平台所有,如有转载,请注明来源和作者。E20环境平台保留责任追究的权利。
媒体合作请联系:李女士 010-88480317