一种基于多源数据融合的智慧城市优化管理方法和系统与流程



1.本发明涉及电数字数据处理技术领域,具体涉及一种基于多源数据融合的智慧城市优化管理方法和系统。


背景技术:



2.随着计算机技术的发展,智慧城市逐步成为现代城市发展的必经之路。智慧城市是指运用物联网、云计算、大数据、空间地理信息集成等新一代信息技术,促进城市规划、建设、管理和服务智慧化的新理念和新模式。其中空间地理信息系统为城市的日常管理提供数据资料,比如对城市内的污染源进行实时监测,但是一般环境监测数据受环境以及采集设备的影响,使得原始数据存在异常,所以在进行数据分析之前,首先需要对异常数据进行识别并剔除。
3.对于环境监测数据中异常数据的识别,一般主要根据单个监测点数据在时间序列上的分布进行异常判断,但是单个监测点的异常分析忽略不同监测点数据之间的关系,异常分析的依据不够稳定,从而导致数据异常分析不够准确,所以通过单个监测点数据时序分析以及多个监测点监测数据对应关系获得数据的异常程度,在进行单个监测点时间序列异常分析中,利用box-cox变换将监测数据转换为趋近于正态分布的数据,但是现有的box-cox变换中对应的变换参数λ的设置中,不能直接体现转换效果,使得转换效果不可控,从而导致所获得数据异常程度准确度不高,进而使得环境监测数据中异常数据的识别精度较低。


技术实现要素:



4.为了解决现有方法对环境监测数据中异常数据的识别精度较低的问题,本发明的目的在于提供一种基于多源数据融合的智慧城市优化管理方法和系统,所采用的技术方案具体如下:第一方面,本发明提供了一种基于多源数据融合的智慧城市优化管理方法,该方法包括以下步骤:获取待监测区域的不同监测点在当前时间段内各采集时刻的监测数据;对于任一监测点:基于该监测点在当前时间段内前后两个采集时刻的监测数据的差值构建初始直方图;基于box-cox变换的初始变换参数对该监测点在当前时间段内前后两个采集时刻的监测数据的差值进行转换获得第一差值直方图;基于第一差值直方图中峰值左侧的数据和峰值右侧的数据,得到第一差值直方图对应的正态分布程度;基于初始直方图中的各差值数据和第一差值直方图中的各差值数据,计算第一差值直方图转换前后数据分布特征的一致性;基于所述正态分布程度和所述一致性对初始变换参数进行调整,获得该监测点在当前时间段对应的目标直方图;根据目标直方图,得到各监测点当前时刻监测数据的偏离程度;根据各监测点当前时刻的监测数据、各监测点的预设距离内的监测点当前时刻的监测数据、各监测点的预
设距离内各监测点当前时刻监测数据的偏离程度、各监测点与其预设距离内的监测点之间的距离,计算各监测点当前时刻监测数据的异常程度;基于所述偏离程度和所述异常程度获得目标监测数据,对所述目标监测数据进行管理。
5.第二方面,本发明提供了一种基于多源数据融合的智慧城市优化管理系统,包括存储器和处理器,所述处理器执行所述存储器存储的计算机程序,以实现上述所述的一种基于多源数据融合的智慧城市优化管理方法。
6.优选的,该监测点在当前时间段内前后两个采集时刻的监测数据的差值为:后一采集时刻的监测数据减去前一采集时刻的监测数据得到的差值。
7.优选的,所述基于第一差值直方图中峰值左侧的数据和峰值右侧的数据,得到第一差值直方图对应的正态分布程度,包括:其中,为第一差值直方图对应的正态分布程度,为第一差值直方图中峰值以左的数据的个数,为第一差值直方图中峰值以右的数据的个数,为第一差值直方图中峰值左侧与峰值的距离为k的数据的个数,为第一差值直方图中峰值左侧与峰值的距离为k+1的数据的个数,为第一差值直方图中峰值右侧与峰值的距离为k的数据的个数,为第一差值直方图中峰值右侧与峰值的距离为k+1的数据的个数,为第一差值直方图中峰值左侧与峰值的距离的最大值,为第一差值直方图中峰值右侧与峰值的距离的最大值,为取最大值函数,为调节参数,为取绝对值。
8.优选的,所述基于初始直方图中的各差值数据和第一差值直方图中的各差值数据,计算第一差值直方图转换前后数据分布特征的一致性,包括:分别以初始直方图中的各差值数据为中心数据,在各差值数据的左右两侧各获取预设个数的差值数据,按照时间先后顺序,构建各差值数据对应的第一差值序列;分别以第一差值直方图中的各差值数据为中心数据,在各差值数据的左右两侧各获取预设个数的差值数据,按照时间先后顺序,构建各差值数据对应的第二差值序列;计算各差值数据对应的第一差值序列和第二差值序列的相关系数,作为对应差值数据在转换前后对应的相关系数;计算各差值数据对应的第一差值序列中数据的均值,记为第一均值;计算各差值数据对应的第二差值序列中数据的均值,记为第二均值;计算所述第一均值和所述第二均值的差异;根据各差值数据在转换前后对应的相关系数、所述第一均值和所述第二均值的差异,计算转换前后数据分布相似性;所述相关系数与转换前后数据分布相似性呈正比,所述第一均值和所述第二均值的差异与转换前后数据分布相似性呈反比;根据所述转换前后数据分布相似性、初始直方图中的各差值数据、第一差值直方图中的各差值数据、初始直方图中各差值数据与峰值的差异以及第一差值直方图中各差值数据与峰值的差异,计算第一差值直方图转换前后数据分布特征的一致性。
9.优选的,采用如下公式计算第一差值直方图转换前后数据分布特征的一致性:其中,为第一差值直方图转换前后数据分布特征的一致性,为初始直方图中与第t个差值数据的差异小于差异阈值的其他差值数据的个数,为第一差值直方图中与第t个差值数据的差异小于差异阈值的其他差值数据的个数,为初始直方图中第t个差值数据与峰值的差异,为第一差值直方图中第t个差值数据与峰值的差异,为初始直方图中差值数据的个数,为转换前后数据分布相似性,为调节参数,为取绝对值。
10.优选的,所述基于所述正态分布程度和所述一致性对初始变换参数进行调整,获得该监测点在当前时间段对应的目标直方图,包括:对于任一监测点:基于所述正态分布程度和所述一致性构建目标函数,所述正态分布程度和所述一致性均与目标函数的函数值呈正比;采用模拟退火算法,基于目标函数和差值数据获得目标函数的最大函数值,将最大函数值对应的变换参数作为box-cox的目标变换参数,利用box-cox的目标变换参数将该监测点在当前时间段内每两个相邻采集时刻的监测数据的差值进行变换,获得该监测点在当前时间段对应的目标直方图。
11.优选的,所述根据目标直方图,得到各监测点当前时刻监测数据的偏离程度,包括:对于任一监测点:计算该监测点在当前时间段对应的目标直方图中所有差值数据的平均值,记为第一平均值;计算该监测点在当前时间段对应的目标直方图中的最后一个差值与所述第一平均值的差异,对该差异进行归一化处理,将归一化结果作为该监测点当前时刻监测数据的偏离程度。
12.优选的,采用如下公式计算各监测点当前时刻监测数据的异常程度:其中,为第i个监测点当前时刻监测数据的异常程度,为第i个监测点当前时刻的监测数据,为第i个监测点的预设距离内第v个监测点当前时刻的监测数据,为第i个监测点与其预设距离内第v个监测点之间的距离,为第i个监测点的预设距离内第v个监测点当前时刻监测数据的偏离程度,为第i个监测点的预设距离内监测点的数量,为取绝对值。
13.优选的,所述基于所述偏离程度和所述异常程度获得目标监测数据,包括:对于任一监测点:对该监测点当前时刻监测数据的偏离程度进行归一化处理,得到该监测点当前时刻监测数据的归一化偏离程度;对该监测点当前时刻监测数据的异常程度进行归一化处理,得到该监测点当前时刻监测数据的归一化异常程度;计算所述归一化
偏离程度与所述归一化异常程度之和,作为该监测点当前时刻监测数据的异常指标;判断各监测点当前时刻监测数据的异常指标是否大于异常指标阈值,若大于,则判定对应监测点当前时刻的监测数据为异常数据;将异常数据进行剔除,利用插值方法在剔除后的位置进行插值获得目标监测数据。
14.本发明至少具有如下有益效果:1、本发明考虑到仅根据单个监测点数据在时间序列上的分布情况对监测数据进行异常分析时,会忽略不同监测点数据之间的关系,使得异常分析的依据不够充足,从而导致数据异常分析的结果不够准确,本发明分别通过对单个监测点的监测数据的分布关系以及多个监测点监测数据对应关系获得数据的异常程度,考虑到监测数据在时间序列上具有连续分布的特点,结合相邻监测点之间的对应关系,提高数据之间的联系,增强数据异常分析依据,从而实现异常数据的精准识别,提高了对智慧城市优化管理的可靠性。
15.2、本发明在对单个监测点的监测数据的分布关系进行分析时采用box-cox变换的方法,考虑到box-cox变换的变换参数的值直接影响着转换效果,因此首先设置了初始变换参数,然后基于box-cox变换的初始变换参数对每个监测点在当前时间段内前后两个采集时刻的监测数据的差值进行转换获得了对应的第一差值直方图,基于转换后的数据对应的正态分布程度以及转换前后数据分布特征的一致性,对转换效果进行定量分析,并对初始变换参数进行调整,使得转换效果可控,便于获得最佳的转换效果,也即获得了目标直方图,目标直方图中的数据趋近于正态分布的程度,保证了数据异常程度的可信度;转换前后数据分布特征的一致性使得转换后数据异常程度更加可靠的代替转换之前对应数据的异常程度,从而获得更加准确的异常数据,提高了智慧城市优化管理的可信度。
附图说明
16.为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
17.图1为本发明提供的一种基于多源数据融合的智慧城市优化管理方法的流程图。
具体实施方式
18.为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于多源数据融合的智慧城市优化管理方法和系统进行详细说明如下。
19.除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
20.下面结合附图具体的说明本发明所提供的一种基于多源数据融合的智慧城市优化管理方法和系统的具体方案。
21.一种基于多源数据融合的智慧城市优化管理方法实施例:本实施例提出了一种基于多源数据融合的智慧城市优化管理方法,如图1所示,本实施例的一种基于多源数据融合的智慧城市优化管理方法包括以下步骤:
步骤s1,获取待监测区域的不同监测点在当前时间段内各采集时刻的监测数据。
22.本实施例所针对的具体情景为:在城市环境监测过程中,主要依据不同位置监测数据所反映的环境参数的差异以及单个监测点所反映的环境参数的变化,单个监测点数据时间序列的差异以及多个监测点数据的对应关系同时能够反映数据的异常情况,因此本实施例分别从单个监测点的监测数据以及多个监测点的监测数据的对应关系对监测数据的异常程度进行分析,以获得监测数据中的异常数据。
23.对于城市环境的监测,首先需要获得原始的监测数据,本实施例在待监测区域的不同的监测点安装传感器,用于采集不同位置的环境数据,传感器之间的距离一般为0.2-0.5km,传感器的类型也有多种,例如:温度传感器、湿度传感器、压强传感器、烟雾浓度传感器等,在具体安装过程中,传感器的类型及安装位置实施者可根据具体情况进行设置。所有传感器由统一的监测中心控制,同时开启监测装置,采集待监测区域的各监测点的环境数据,也即所有传感器的采集时刻和采集频率相同,将采集到的环境数据传输到监测中心,作为环境监测的原始数据,后续步骤将对其进行异常分析,本实施例设置所有传感器1秒采集一次环境数据,在具体应用中,实施者可根据具体情况设置监测数据的采集频率。需要说明的是,本实施例将以当前时间段为例进行说明,其中,当前时间段为与当前时刻的时间间隔小于等于预设时间长度的历史时刻的集合,本实施例中设置预设时间长度为半小时,在具体应用中,实施者可根据具体情况进行设置。采用上述方法,能够获得待监测区域的不同监测点在当前时间段内各采集时刻的监测数据。
24.步骤s2,对于任一监测点:基于该监测点在当前时间段内前后两个采集时刻的监测数据的差值构建初始直方图;基于box-cox变换的初始变换参数对该监测点在当前时间段内前后两个采集时刻的监测数据的差值进行转换获得第一差值直方图;基于第一差值直方图中峰值左侧的数据和峰值右侧的数据,得到第一差值直方图对应的正态分布程度;基于初始直方图中的各差值数据和第一差值直方图中的各差值数据,计算第一差值直方图转换前后数据分布特征的一致性;基于所述正态分布程度和所述一致性对初始变换参数进行调整,获得该监测点在当前时间段对应的目标直方图。
25.本实施例的主要目的是识别监测数据中的异常数据,因此主要分析待监测区域不同位置不同时刻环境监测数据的差异与变化,考虑到数据异常体现监测点的数据在时间序列上的分布关系与不同监测点之间数据对应关系,因此本实施例通过对单个监测点数据时序分析以及多个监测点监测数据对应关系获得数据的异常程度,从而实现对异常数据的精准识别。
26.对于待监测区域同一监测点不同时刻的数据之间的异常主要体现在数据在时间序列上异常关系,环境监测数据在时间序列上具有连续相等或者连续变化的特点,即相邻采集时刻获得的监测数据之间的差值具有收敛的特点,基于此,根据连续采集时刻采集的监测数据的差值的大小关系判断不同采集时刻的监测数据是否出现了异常。
27.由于在时间序列上连续分布的监测数据之间的差值大小具有收敛的特点,因此监测数据大小超过一定阈值即可判断为异常数据,但是直接设置阈值往往过于片面,无法对所有数据进行准确判断,本实施例将相邻采集时刻采集的监测数据的差值转换为正态分布数据,然后进行异常判断。
28.本实施例在步骤s1中获得了待监测区域的不同监测点在当前时间段内各采集时
刻的监测数据,接下来将以待监测区域的一个监测点为例进行说明。
29.对于任一监测点:计算该监测点在当前时间段内每两个相邻采集时刻的监测数据的差值,该差值为后一采集时刻的监测数据减去前一采集时刻的监测数据得到的差值;本实施例考虑到box-cox变换的变换参数的值直接影响着转换效果,为了更准确地采用box-cox变换将该监测点在当前时间段内每两个相邻采集时刻的监测数据的差值转换为正态分布数据,本实施例将根据转换效果对变换参数进行调整,以获得最佳的转换效果。
30.首先基于该监测点在当前时间段内每两个相邻采集时刻的监测数据的差值,构建直方图,将该直方图记为初始直方图;然后设置box-cox变换时的初始变换参数为0.5,采用box-cox变换将该监测点在当前时间段内每两个相邻采集时刻的监测数据的差值进行变换,差值通过box-cox变换后的输出数据为,此时的分布趋近于正态分布的程度,直接体现在其分布直方图中,具体表现为直方图对称性以及直方图陡峭分布,将此时的直方图记为第一差值直方图,第一差值直方图对应的正态分布程度表示为:其中,为第一差值直方图对应的正态分布程度,为第一差值直方图中峰值以左的数据的个数,为第一差值直方图中峰值以右的数据的个数,为第一差值直方图中峰值左侧与峰值的距离为k的数据的个数,为第一差值直方图中峰值左侧与峰值的距离为k+1的数据的个数,为第一差值直方图中峰值右侧与峰值的距离为k的数据的个数,为第一差值直方图中峰值右侧与峰值的距离为k+1的数据的个数,为第一差值直方图中峰值左侧与峰值的距离的最大值,为第一差值直方图中峰值右侧与峰值的距离的最大值,为取最大值函数,为调节参数,为取绝对值。
31.引入调节参数是为了防止分母为0,本实施例设置调节参数的值为0.01,在具体应用中,实施者可根据具体情况进行设置。表示第一差值直方图关于峰值对称分布的差异性,越大,说明第一差值直方图中峰值左右两侧分布的数据差异越大,第一差值直方图的分布趋近于正态分布的程度越小;表征峰值左侧距离峰值为k处直方图的陡峭程度,表征峰值右侧距离峰值为k处直方图的陡峭程度,用于表征第一差值直方图关于峰值对称位置的陡峭程度的差异情况,的值越大,说明峰值左右两侧陡峭程度差异越大,第一差值直方图趋近于正态分布的程度越小。当第一差值直方图中峰值以左的数据的个数与峰值以右的数据的个数差异越小、峰值左右两侧陡峭程度差异越小时,说明第一差值直方图中差值的分布情况越接近于正态分布,即第一差值直方图对应的正态分布程度越大。
32.本实施例对数据进行转换的目的在于利用转换后数据的异常程度表示原始的差值数据的异常程度,所以在转换过程中需要保证转换前后数据具有相同的分布特征,转换
前后数据的分布特征之间的关系主要表现在数据局部稳定性与转换前后数据分布相似性上,第一差值直方图转换前后数据分布特征的一致性具体表示为:其中,为第一差值直方图转换前后数据分布特征的一致性,为初始直方图中与第t个差值数据的差异小于差异阈值的其他差值数据的个数,为第一差值直方图中与第t个差值数据的差异小于差异阈值的其他差值数据的个数,为初始直方图中第t个差值数据与峰值的差异,为第一差值直方图中第t个差值数据与峰值的差异,为初始直方图中差值数据的个数,为转换前后数据分布相似性,为调节参数,为取绝对值。需要说明的是,本实施例中的差值数据与峰值的差异指的是差值数据与对应直方图中波峰的横坐标的差异。
33.本实施例设置差异阈值为10,在具体应用中,实施者可根据具体情况进行调整;反映初始直方图中第t个差值数据与周围数据的局部特征,反映第一差值直方图中第t个差值数据与周围数据的局部特征,表示转换前后第t个差值数据局部特征的差异,能够反映转换过程中第t个差值数据所表现的局部稳定性,越大,第t个差值数据所表现的局部稳定性越小;越大、越大时,第t个差值数据异常的可能性越大,因此第t个差值数据转换过程中对最后数据异常分析的影响越大,即第t个差值数据在转换过程中局部稳定性越重要,表示所有差值数据的局部稳定性对转换前后数据分布特征的一致性的影响;转换前后数据分布相似性越大,转换前后差值数据分布越相似;当转换前后每个差值数据局部特征的差异越小、初始直方图中每个差值数据与峰值的差异越大、第一差值直方图中每个差值数据与峰值的差异越大、转换前后数据分布相似性越大时,说明第一差值直方图转换前后数据分布特征的一致性越高。
34.上述公式涉及转换前后数据分布相似性,主要表现为数据在时间序列上分布的相关性;对于初始直方图中的第t个差值数据:以该差值数据为中心数据,分别在该差值数据的左右两侧各获取q个差值数据,按照时间先后顺序,将这些差值数据构成的差值数据序列记为第t个差值数据对应的第一差值序列;对于第一差值直方图中的第t个差值数据:以该差值数据为中心数据,分别在该差值数据的左右两侧各获取q个差值数据,按照时间先后顺序,将这些差值数据构成的差值数据序列记为第t个差值数据对应的第二差值序列;利用皮尔逊相关系数公式,输入第t个差值数据对应的第一差值序列和第t个差值数据对应的第二差值序列,直接输出第t个差值数据在转换前后对应的相关系数;相关系数的获取过程为现有技术,此处不再赘述;本实施例中设置q的值为10,在具体应用中,实施者可根据具体情况进行设置;采用上述方法,能够得到每个差值数据在转换前后对应的相关系数。需要说明的是,在每个差值数据的左右两侧各获取q个差值数据时,若对应差值数据的左侧或右侧差
值数据的个数小于q个,则采用现有的插值方法获取对应的差值数据。
35.本实施例获得了每个差值数据在转换前后对应的相关系数,相关系数越大,说明对应差值数据在转换前后其周围数据的相关性越大;每个差值数据在转换前后的差异越小,说明差值数据在转换前后数据的分布情况越相似;基于此,本实施例根据每个差值数据在转换前后对应的相关系数以及每个差值数据转换前后的数据值,计算转换前后数据分布相似性,具体的,计算各差值数据对应的第一差值序列中数据的均值,记为第一均值,计算各差值数据对应的第二差值序列中数据的均值,记为第二均值,计算第一均值和第二均值的差异,根据各差值数据在转换前后对应的相关系数、第一均值和第二均值的差异,计算转换前后数据分布相似性;转换前后数据分布相似性的具体计算公式为:其中,为转换前后数据分布相似性,为第t个差值数据在转换前后对应的相关系数,为初始直方图中差值数据的个数,为第t个差值数据对应的第一差值序列中数据的均值,为第t个差值数据对应的第二差值序列中数据的均值,为调节参数,为取绝对值,表示第一均值,表示第二均值,表示第一均值和第二均值的差异。
36.引入调节参数是为了防止分母为0;越大,说明转换前后第t个差值数据在时间序列上周围数据之间的相关性越大,数据在时间序列上的分布越相似,转换前后数据分布特征的一致性越高;表征转换前后第t个差值数据的周围数据的均值的差异,越大,说明转换前后第t个差值数据与其周围数据的均值的差异越小,当前数据分布相似性相对于整体数据分布相关性的影响越大;当每个差值数据对应的第一差值序列中数据的均值与对应的第二差值序列中数据的均值的差异越小、每个差值数据在转换前后对应的相关系数越大时,说明转换前后数据分布相似性越大;当每个差值数据对应的第一差值序列中数据的均值与对应的第二差值序列中数据的均值的差异越大、每个差值数据在转换前后对应的相关系数越小时,说明转换前后数据分布相似性越小。
37.本实施例在上述步骤中获得了第一差值直方图对应的正态分布程度和第一差值直方图转换前后数据分布特征的一致性,正态分布程度和转换前后数据分布特征的一致性二者共同影响数据转换效果,因此,本实施例计算第一差值直方图对应的正态分布程度和第一差值直方图转换前后数据分布特征的一致性的乘积,并将该乘积作为第一差值直方图对应的转换效果,也即,其中,为第一差值直方图对应的转换效果;当正态分布程度的值越大、转换前后数据分布相似性的值越大时,说明第一差值直方图的转换效果越好。利用上述步骤,基于正态分布程度和转换前后数据分布特征的一致性,获得了转换效果表达式,也即获得了目标函数,对转换效果进行定量分析,便于获得最佳的转换效果。首先考虑到当前数据转换是以获得最趋近于正态分布的数据为目的,从而便于对转换后的数据进行异常分析;利用当前转换后数据的异常代替转换前对应数据的异常,考虑到转换前后对应数据分布特征的一致性,使得转换后数据异常程度更加可靠的代替转换之前对应数据的异常程度。
38.根据上述步骤,对差值数据经过box-cox变换后,获得对应的转换效果,转换效果的值越大,说明数据转换效果越好,为了获得最佳的数据转换效果,需要不断对box-cox变换的变换参数进行调整,以获得最优的数据转换效果。本实施例利用现有的模拟退火算法,在输入目标函数和原始差值数据后,设置初始转换参数的值为0.5,输出转换效果的最大值,转换效果的最大值对应的变换参数即为box-cox的最佳变换参数,利用box-cox的最佳变换参数,将该监测点在当前时间段内每两个相邻采集时刻的监测数据的差值变换,获得最佳的直方图,将此时最佳的直方图记为目标直方图,目标直方图中差值数据的分布情况接近于正态分布,后续本实施例将对目标直方图进行分析,进而获取异常数据。
39.步骤s3,根据目标直方图,得到各监测点当前时刻监测数据的偏离程度;根据各监测点当前时刻的监测数据、各监测点的预设距离内的监测点当前时刻的监测数据、各监测点的预设距离内各监测点当前时刻监测数据的偏离程度、各监测点与其预设距离内的监测点之间的距离,计算各监测点当前时刻监测数据的异常程度。
40.本实施例在步骤s2中获得了目标直方图,目标直方图中的差值数据越偏离于所有差值的平均值,说明差值数据偏离当前正态分布峰值的程度越大;基于此,对于任一监测点,本实施例根据该监测点在当前时间段对应的目标直方图中的最后一个差值与目标直方图中所有差值的均值,判断该监测点当前时刻监测数据的偏离程度,具体的,计算该监测点在当前时间段对应的目标直方图中所有差值数据的平均值,记为第一平均值;计算该监测点在当前时间段对应的目标直方图中的最后一个差值与所述第一平均值的差异,对该差异进行归一化处理,将归一化结果作为该监测点当前时刻监测数据的偏离程度;该监测点当前时刻监测数据的偏离程度的具体计算公式为:其中,为该监测点当前时刻监测数据的偏离程度,为目标直方图中所有差值的均值,为目标直方图中的最后一个差值,为目标直方图中差值的最大值,为取绝对值,表示第一平均值。
41.表示目标直方图中最后一个差值偏离当前正态分布峰值的程度,目标直方图中的差值数据越偏离于所有差值的平均值,说明对应差值数据偏离当前正态分布峰值的程度越大;用于对异常程度进行归一化处理,也即表示差值数据偏离峰值程度所反映的异常的基准。根据数据之间的对应关系,表示差值数据以及对应原始数据的偏离程度。
42.本实施例利用上述步骤,通过数据转换,利用正态分布数据的分布特点,获得原始数据的偏离程度。在数据转换过程中,通过改变变换参数获得最佳的转换效果,即转换效果可控,从而增加数据异常程度的可信度。本实施例在上述步骤中以一个监测点为例进行了说明,对该监测点当前时间段内的监测数据进行了分析,进而获得了该监测点当前时刻监测数据的偏离程度。在实际的监测中,数据本身来源于城市待监测区域不同位置的监测点,所以不同位置监测点数据在反映局部信息的同时,数据之间的关系也体现着数据本身异常
特点。因此本实施例将根据同一时刻相邻监测点之间的监测数据之间的关系进一步对数据异常程度进行判断。
43.在对待监测区域的环境监测中,同一时刻不同监测点的监测数据存在差异,所以数据监测点之间的影响具有一定范围效应,首先设置监测点之间存在影响的预设距离为2km,然后判断距离在2km内的监测点之间的数据关系所反映的数据异常程度。
44.考虑到相邻监测点数据异常主要体现在数据之间的差异,不同监测点之间的差异所反映的数据异常受监测点之间的距离以及监测点数据本身异常程度的影响;因此,对于第i个监测点,根据第i个监测点当前时刻的监测数据、第i个监测点的预设距离内各监测点当前时刻的监测数据、第i个监测点的预设距离内各监测点当前时刻监测数据的偏离程度、第i个监测点与其预设距离内各监测点之间的距离,计算第i个监测点当前时刻监测数据的异常程度,即:其中,为第i个监测点当前时刻监测数据的异常程度,为第i个监测点当前时刻的监测数据,为第i个监测点的预设距离内第v个监测点当前时刻的监测数据,为第i个监测点与其预设距离内第v个监测点之间的距离,为第i个监测点的预设距离内第v个监测点当前时刻监测数据的偏离程度,为第i个监测点的预设距离内监测点的数量,为取绝对值。
45.第i个监测点与其预设距离内第v个监测点之间的距离越近,第v个监测点的监测数据对第i个监测点的监测数据的影响程度越大;第v个监测点当前时刻监测数据的偏离程度越小,第v个监测点当前时刻的监测数据的可信度越高;表征第i个监测点与第v个监测点之间的监测数据的差异,反映相邻监测点数据之间的数值对应关系,越大,第i个监测点的监测数据与周围监测点的监测数据之间的对应关系越弱,第i个监测点当前时刻监测数据的异常程度越大;表示第i个监测点与其周围个监测点监测数据数值对应关系,即表示第i个监测点周围监测点所反映的第i个监测点的监测数据的异常程度。当第i个监测点与第v个监测点之间的监测数据的差异越大、第i个监测点与其预设距离内第v个监测点之间的距离越近、第v个监测点当前时刻监测数据的偏离程度越小时,说明第i个监测点当前时刻的监测数据越异常,即第i个监测点当前时刻监测数据的异常程度越大。
46.本实施例在上述步骤中根据相邻监测点之间监测数据的差异对监测数据的异常程度进行了判断,考虑到了监测点之间的距离对数据之间异常判断的影响,避免了城市环境局部变换导致监测点之间的差异对异常数据判断的影响,同时考虑到了不同监测点的监测数据本身的异常程度,避免单个监测点本身异常对其他监测点异常判断的影响,从而更加准确的获得数据之间对应关系所反映的数据异常程度。
47.步骤s4,基于所述偏离程度和所述异常程度获得目标监测数据,对所述目标监测数据进行管理。
48.本实施例分别从时间序列上获得每个监测点的监测数据本身的偏离程度以及从相邻监测点数据关系获得监测数据的异常程度,接下来基于偏离程度和异常程度获得不同监测点当前时刻监测数据的异常指标。具体的,对于第i个监测点:对该监测点当前时刻监测数据的偏离程度进行归一化处理,得到该监测点当前时刻监测数据的归一化偏离程度;对该监测点当前时刻监测数据的异常程度进行归一化处理,得到该监测点当前时刻监测数据的归一化异常程度;计算该监测点当前时刻监测数据的归一化偏离程度与该监测点当前时刻监测数据的归一化异常程度之和,作为该监测点当前时刻监测数据的异常指标,即:,其中,为第i个监测点当前时刻监测数据的异常指标,为第i个监测点当前时刻监测数据的归一化偏离程度,为第i个监测点当前时刻监测数据的归一化异常程度;第i个监测点当前时间段对应的目标直方图对应的归一化正态分布程度越大,的可信度越高,反映第i个监测点当前时刻监测数据的整体异常指标;当第i个监测点当前时刻监测数据的归一化偏离程度越大、第i个监测点当前时刻监测数据的归一化异常程度越大时,说明第i个监测点当前时刻的监测数据越异常,即第i个监测点当前时刻监测数据的异常指标越大。
49.采用上述方法,能够获得待监测区域内每个监测点当前时刻监测数据的异常指标,异常指标越大,说明对应监测点当前时刻的监测数据的异常程度越高;设置异常指标阈值,分别判断每个监测点当前时刻监测数据的异常指标是否大于,若大于,则判定对应监测点当前时刻的监测数据为异常数据;若小于等于,则判定对应监测点当前时刻的监测数据为正常数据;本实施例设置的值为0.8,在具体应用中,实施者可根据具体情况进行设置。
50.根据上述步骤,获得了不同监测点当前时刻监测数据中的异常数据,为了避免异常数据对环境分析的影响,首先将异常数据进行剔除,然后利用现有的插值方法,在剔除后的位置进行插值,获得最终的环境监测数据,将最终的环境监测数据记为目标监测数据。在获得异常处理后的环境监测数据后,融合遥感地图数据,将环境监测数据在地图中展示,实现环境监测数据可视化管理,优化智慧城市管理。至此,完成对智慧城市的优化管理。
51.本实施例考虑到仅根据单个监测点数据在时间序列上的分布情况对监测数据进行异常分析时,会忽略不同监测点数据之间的关系,使得异常分析的依据不够稳定,从而导致数据异常分析的结果不够准确,本实施例分别通过对单个监测点的监测数据的分布关系以及多个监测点监测数据对应关系获得数据的异常程度,考虑到监测数据在时间序列上具有连续分布的特点,结合相邻监测点之间的对应关系,提高数据之间的联系,增强数据异常分析依据,从而实现异常数据的精准识别,提高了对智慧城市优化管理的可靠性。本实施例在对单个监测点的监测数据的分布关系进行分析时采用box-cox变换的方法,考虑到box-cox变换的变换参数的值直接影响着转换效果,因此首先设置了初始变换参数,然后基于box-cox变换的初始变换参数对每个监测点在当前时间段内前后两个采集时刻的监测数据的差值进行转换获得了对应的第一差值直方图,基于转换后的数据对应的正态分布程度以及转换前后数据分布特征的一致性,对转换效果进行定量分析,并对初始变换参数进行调整,使得转换效果可控,便于获得最佳的转换效果,也即获得了目标直方图,目标直方图中
的数据趋近于正态分布的程度,保证了数据异常程度的可信度;转换前后数据分布特征的一致性使得转换后数据异常程度更加可靠的代替转换之前对应数据的异常程度,从而获得更加准确的异常数据,提高了智慧城市优化管理的可信度。
52.一种基于多源数据融合的智慧城市优化管理系统实施例:本实施例一种基于多源数据融合的智慧城市优化管理系统包括存储器和处理器,所述处理器执行所述存储器存储的计算机程序,以实现上述所述的一种基于多源数据融合的智慧城市优化管理方法。
53.由于基于多源数据融合的智慧城市优化管理方法已经在基于多源数据融合的智慧城市优化管理方法实施例中进行了说明,所以本实施例不再对基于多源数据融合的智慧城市优化管理方法进行赘述。

技术特征:


1.一种基于多源数据融合的智慧城市优化管理方法,其特征在于,该方法包括以下步骤:获取待监测区域的不同监测点在当前时间段内各采集时刻的监测数据;对于任一监测点:基于该监测点在当前时间段内前后两个采集时刻的监测数据的差值构建初始直方图;基于box-cox变换的初始变换参数对该监测点在当前时间段内前后两个采集时刻的监测数据的差值进行转换获得第一差值直方图;基于第一差值直方图中峰值左侧的数据和峰值右侧的数据,得到第一差值直方图对应的正态分布程度;基于初始直方图中的各差值数据和第一差值直方图中的各差值数据,计算第一差值直方图转换前后数据分布特征的一致性;基于所述正态分布程度和所述一致性对初始变换参数进行调整,获得该监测点在当前时间段对应的目标直方图;根据目标直方图,得到各监测点当前时刻监测数据的偏离程度;根据各监测点当前时刻的监测数据、各监测点的预设距离内的监测点当前时刻的监测数据、各监测点的预设距离内各监测点当前时刻监测数据的偏离程度、各监测点与其预设距离内的监测点之间的距离,计算各监测点当前时刻监测数据的异常程度;基于所述偏离程度和所述异常程度获得目标监测数据,对所述目标监测数据进行管理。2.根据权利要求1所述的一种基于多源数据融合的智慧城市优化管理方法,其特征在于,该监测点在当前时间段内前后两个采集时刻的监测数据的差值为:后一采集时刻的监测数据减去前一采集时刻的监测数据得到的差值。3.根据权利要求1所述的一种基于多源数据融合的智慧城市优化管理方法,其特征在于,所述基于第一差值直方图中峰值左侧的数据和峰值右侧的数据,得到第一差值直方图对应的正态分布程度,包括:其中,为第一差值直方图对应的正态分布程度,为第一差值直方图中峰值以左的数据的个数,为第一差值直方图中峰值以右的数据的个数,为第一差值直方图中峰值左侧与峰值的距离为k的数据的个数,为第一差值直方图中峰值左侧与峰值的距离为k+1的数据的个数,为第一差值直方图中峰值右侧与峰值的距离为k的数据的个数,为第一差值直方图中峰值右侧与峰值的距离为k+1的数据的个数,为第一差值直方图中峰值左侧与峰值的距离的最大值,为第一差值直方图中峰值右侧与峰值的距离的最大值,为取最大值函数,为调节参数,为取绝对值。4.根据权利要求1所述的一种基于多源数据融合的智慧城市优化管理方法,其特征在于,所述基于初始直方图中的各差值数据和第一差值直方图中的各差值数据,计算第一差值直方图转换前后数据分布特征的一致性,包括:分别以初始直方图中的各差值数据为中心数据,在各差值数据的左右两侧各获取预设个数的差值数据,按照时间先后顺序,构建各差值数据对应的第一差值序列;分别以第一差值直方图中的各差值数据为中心数据,在各差值数据的左右两侧各获取预设个数的差值数
据,按照时间先后顺序,构建各差值数据对应的第二差值序列;计算各差值数据对应的第一差值序列和第二差值序列的相关系数,作为对应差值数据在转换前后对应的相关系数;计算各差值数据对应的第一差值序列中数据的均值,记为第一均值;计算各差值数据对应的第二差值序列中数据的均值,记为第二均值;计算所述第一均值和所述第二均值的差异;根据各差值数据在转换前后对应的相关系数、所述第一均值和所述第二均值的差异,计算转换前后数据分布相似性;所述相关系数与转换前后数据分布相似性呈正比,所述第一均值和所述第二均值的差异与转换前后数据分布相似性呈反比;根据所述转换前后数据分布相似性、初始直方图中的各差值数据、第一差值直方图中的各差值数据、初始直方图中各差值数据与峰值的差异以及第一差值直方图中各差值数据与峰值的差异,计算第一差值直方图转换前后数据分布特征的一致性。5.根据权利要求4所述的一种基于多源数据融合的智慧城市优化管理方法,其特征在于,采用如下公式计算第一差值直方图转换前后数据分布特征的一致性:其中,为第一差值直方图转换前后数据分布特征的一致性,为初始直方图中与第t个差值数据的差异小于差异阈值的其他差值数据的个数,为第一差值直方图中与第t个差值数据的差异小于差异阈值的其他差值数据的个数,为初始直方图中第t个差值数据与峰值的差异,为第一差值直方图中第t个差值数据与峰值的差异,为初始直方图中差值数据的个数,为转换前后数据分布相似性,为调节参数,为取绝对值。6.根据权利要求1所述的一种基于多源数据融合的智慧城市优化管理方法,其特征在于,所述基于所述正态分布程度和所述一致性对初始变换参数进行调整,获得该监测点在当前时间段对应的目标直方图,包括:对于任一监测点:基于所述正态分布程度和所述一致性构建目标函数,所述正态分布程度和所述一致性均与目标函数的函数值呈正比;采用模拟退火算法,基于目标函数和差值数据获得目标函数的最大函数值,将最大函数值对应的变换参数作为box-cox的目标变换参数,利用box-cox的目标变换参数将该监测点在当前时间段内每两个相邻采集时刻的监测数据的差值进行变换,获得该监测点在当前时间段对应的目标直方图。7.根据权利要求1所述的一种基于多源数据融合的智慧城市优化管理方法,其特征在于,所述根据目标直方图,得到各监测点当前时刻监测数据的偏离程度,包括:对于任一监测点:计算该监测点在当前时间段对应的目标直方图中所有差值数据的平均值,记为第一平均值;计算该监测点在当前时间段对应的目标直方图中的最后一个差值与所述第一平均值的差异,对该差异进行归一化处理,将归一化结果作为该监测点当前时刻监测数据的偏离程度。8.根据权利要求1所述的一种基于多源数据融合的智慧城市优化管理方法,其特征在
于,采用如下公式计算各监测点当前时刻监测数据的异常程度:其中,为第i个监测点当前时刻监测数据的异常程度,为第i个监测点当前时刻的监测数据,为第i个监测点的预设距离内第v个监测点当前时刻的监测数据,为第i个监测点与其预设距离内第v个监测点之间的距离,为第i个监测点的预设距离内第v个监测点当前时刻监测数据的偏离程度,为第i个监测点的预设距离内监测点的数量,为取绝对值。9.根据权利要求1所述的一种基于多源数据融合的智慧城市优化管理方法,其特征在于,所述基于所述偏离程度和所述异常程度获得目标监测数据,包括:对于任一监测点:对该监测点当前时刻监测数据的偏离程度进行归一化处理,得到该监测点当前时刻监测数据的归一化偏离程度;对该监测点当前时刻监测数据的异常程度进行归一化处理,得到该监测点当前时刻监测数据的归一化异常程度;计算所述归一化偏离程度与所述归一化异常程度之和,作为该监测点当前时刻监测数据的异常指标;判断各监测点当前时刻监测数据的异常指标是否大于异常指标阈值,若大于,则判定对应监测点当前时刻的监测数据为异常数据;将异常数据进行剔除,利用插值方法在剔除后的位置进行插值获得目标监测数据。10.一种基于多源数据融合的智慧城市优化管理系统,包括存储器和处理器,其特征在于,所述处理器执行所述存储器存储的计算机程序,以实现如权利要求1-9任一项所述的一种基于多源数据融合的智慧城市优化管理方法。

技术总结


本发明涉及电数字数据处理技术领域,具体涉及一种基于多源数据融合的智慧城市优化管理方法和系统。方法包括:基于各监测点在当前时间段内前后两个采集时刻的监测数据的差值构建初始直方图;对各监测点在当前时间段内前后两个采集时刻的监测数据的差值进行转换获得第一差值直方图,计算第一差值直方图对应的正态分布程度以及转换前后数据分布特征的一致性,进而获得对应的目标直方图;根据目标直方图、各监测点当前时刻的监测数据、各监测点的预设距离内的监测点当前时刻的监测数据,计算各监测点当前时刻监测数据的异常程度,进而获得目标监测数据,对目标监测数据进行管理。本发明提高了异常数据的识别精度。本发明提高了异常数据的识别精度。本发明提高了异常数据的识别精度。


技术研发人员:

梁聪 王梓旭 王一涵 杨厚鑫 林俊杰

受保护的技术使用者:

山东优嘉环境科技有限公司

技术研发日:

2023.02.15

技术公布日:

2023/3/27

本文发布于:2024-09-22 20:21:27,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/83164.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:差值   数据   直方图   程度
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议