一种一定区域范围的点数据空间聚集度测量方法



1.本发明属于空间计量地理技术领域,具体涉及一种一定区域范围的点数据空间聚集度测量方法。


背景技术:



2.城市地理学、经济地理学和城乡规划学中,判断一个地区(或城市、或城市某一区块)的人口、设施等的空间分布情况,解读其空间分布特征及存在问题,是正确制定地区与城市发展政策、规划措施的必要路径,其中准确把握其空间集聚性是其重要领域。在我国相关学科的著作(如《城市地理学》、《经济地理学》、《计量地理学基础》、《城市规划原理》)中,均对空间集聚研究的重要性进行了说明,国内外也有较多相关的研究成果。
3.鉴于空间聚集性的重要意义,对空间聚集度的测算成为该领域研究和实践的基础,并已经有若干种的测算方法被提出和得到应用,主要包括:城镇化率、罗伦次曲线、集中化指数、核密度分析、最邻近指数、邻点数测算法、空间自相关性测算法等。这些方法以不同视角对空间聚集度进行测算,为空间聚集特征的分析提供了一定的量化分析基础,但是也各自存在一定程度的不足与缺陷,例如:
4.(1)城镇化率:描述人口在一个地区或国家的人口集中于城镇地区的比重。该指数只应用于人口层面,无法应用到设施层面;基本忽视空间上的距离,即只依据人口集中地的人口比重,而不考虑不同人口聚居区相互间的距离;各地区(国家)对“城镇”“城镇人口”等概念存在较多差异,使得城镇化率的定义和测算有着较大的不可比较性。
5.(2)罗伦次曲线与集中化指数:前者为累积频率曲线,通过比较曲线的凹凸程度来判断某要素的聚集程度;后者则是通过计算该累积频率曲线与对角线所围面积来进行定量化。这两种方法以频率(或比重)为测算基础数据,基本忽视空间上的距离;实际应用中多以地区为单位,因此也受到地区划分方法的较大影响。
6.(3)核密度分析法:通过借助gis,计算目标要素在其周围邻域中的密度,形成可视化图面。但其只能图面表达,无法定量化测算;受设定参数(搜索半径)的影响,图面结果有较大差异。
7.(4)最邻近指数:通过点与点之间的最邻近距离的平均值与假设随机分布状态下点与点的平均距离之比,来测定点的聚集程度。该方法只考虑了点与其最邻近点的距离情况,而忽视与其他点的位置关系,使得其计算结果容易出现较大误差。例如空间内所有的点,如果每两个点以同样一个最短间距d组成一组,无论这些组如何排列(只要组与组之间的距离大于d),所有点的最邻距离均为d,因而最邻近指数成为一固定值,无法衡量出不同空间分布的差异性。
8.(5)邻点数测算法:通过计算指定距离内的邻点数,再除以随机分布状态下的邻点数,得到其值。一方面存在指定距离来自主观判断的局限性,指定距离不一样,结果也将发生变化;另一方面也存在上述最邻近指数的类似局限,即仅考虑了其近邻范围内的点,而忽视其他点的分布及相互间的位置关系。
9.(6)莫兰指数(moran’s i):又称空间自相关分析,多用来量测空间事物的分布是否具有自相关性,强自相关性代表了空间现象有聚集性的存在。对于聚集程度的测定,该方法较多应用于同一事物不同时期的比较,不同事物间的比较则由于样本的差异存在较大不可比性;另外计算过程相对较为复杂,并且需构建空间权重矩阵,受操作者主观判断的一定影响。


技术实现要素:



10.本发明的目的是克服现有的不足,提供一种一定区域范围的点数据空间聚集度测量方法,技术方案如下:
11.一种一定区域范围的点数据空间聚集度测量方法,包括以下步骤:
12.s1:针对待测量区域,将区域范围内的待测量人口或者设施数据转换为点数据的位置分布信息;
13.s2:根据点数据的位置分布信息,计算待测量区域范围内的所有点数据之间的实际距离之和d;
14.s3:设定所有点数据在待测量区域范围内呈均匀分布的假定状态,计算假定状态下的所有点数据之间的距离之和d


15.s4:计算该区域范围内的人口或者设施数据的空间聚集度:
[0016][0017]
其中,a表示空间聚集度;
[0018]
s5:对步骤s4计算得到的空间聚集度进行等级划分,空间聚集度数值越小,表示聚集程度越高。
[0019]
进一步地,步骤s1中,所述的将区域范围内的待测量人口或者设施数据转换为点数据的位置分布信息,包括用于将待测量人口数据转换为点数据的位置分布信息的人口数据方法,以及将待测量设施数据转换为点数据的位置分布信息的设施数据方法;
[0020]
所述的人口数据转换方法为:
[0021]
对待测量区域按照行政区域划分为若干子区域,获取每一个子区域内的待测量人口数量;对所有不同子区域内的人口数量进行等比例折算并取整,得到每一个子区域内折算后的人口数量pi,将待测量人口数据转化为对应子区域的人口中心位置pi个点数据,各子区域内的pi个点数据位置重叠;
[0022]
将由待测量人口数据转换为点数据的位置分布信息表示为sq={q1,q2,

,qi,

,qm},qi=(ci,pi),其中,qi表示第i个子区域对应的点数据信息,m表示子区域的数量,ci表示第i个子区域的人口中心坐标,pi表示第i个子区域对应的折算后的人口数,即第i个子区域的点数据数;n表示待测量区域内的点数据总量;
[0023]
所述的设施数据转换方法为:
[0024]
获取待测量设施的实际位置信息,将每一个待测量设施视为待测量区域内的一个点数据,直接将待测量设施数据转换为该区域内的点数据的位置分布信息,表示为sf={f1,f2,

,fi,

,fn},其中,fi表示第i个设施的实际位置坐标,n表示该区域内的设施数量,即待测量区域内的点数据数量。
[0025]
进一步地,步骤s3中所述的设定所有点数据在待测量区域范围内呈均匀分布的假定状态,则在所述假定状态下,所有点数据的坐标位置被更新,更新方式为:
[0026]
将待测量区域划分为n个相同的正六边形,将n个点数据的坐标位置更新为n个正六边形的中心坐标。
[0027]
进一步地,当待测量区域的点数据数量大于100,且待测量区域的形状为正方形或者圆形时,步骤s3中所述的距离之和d

表示为:
[0028][0029][0030]
其中,表示均匀分布状态下所有点数据之间的平均距离,q表示待测量区域内所有两点间距离对的数量,l表示正方形边长,r表示圆形半径。
[0031]
本发明与现有技术相比具有的有益效果:
[0032]
(1)不同于罗伦次曲线、集中化指数等方法,本发明以空间距离为测算依据,保证了测量结果具有更强的空间性。
[0033]
(2)不同于最邻近指数只考虑最相邻点的情况,本发明考虑了所有点,针对所有点进行距离测算,使测算结果更为准确;面对特定形状的区域范围,进一步提出了简明的近似计算法,显著降低了计算量,提高了本发明的适用范围与实用性。
[0034]
(3)本发明提出以假定的点均匀分布状态作为比较数据,使得即使是不同大小、不同形状的多个区域,也能够实现相互之间的比较,通用性强。
附图说明
[0035]
图1为本发明提出的一种一定区域范围的点数据空间聚集度测量方法的流程示意图。
[0036]
图2为本发明实施例示出的某一地区由人口数据转换后的点数据的实际分布示意图。
[0037]
图3为本发明实施例示出的某一地区由人口数据转换后的点数据的假定均匀分布状态示意图。
[0038]
图4为本发明实施例示出的某一城市某四个地铁站周围由城市公共服务设施数据转换后的点数据的实际分布示意图。
具体实施方式
[0039]
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施例的限制。本发明各个实施例中的技术特征在没有相互冲突的前提下,均可进行相应组合。
[0040]
本发明以假定的点均匀分布状态作为比较数据,提出的针对一定区域范围的点数据空间聚集度测量方法如图1所示,主要包括以下步骤:
[0041]
步骤一:针对待测量区域,将区域范围内的待测量人口或者设施数据转换为点数据的位置分布信息;
[0042]
本步骤中,将实际应用中具体的研究对象转换为点数据的位置分布信息,研究对象可以是待测量人口或者具体设施,其中设施的类型依据实际需求确定,例如具体设施可以是医疗设施、文化娱乐设施、交通设施、教育设施、体育设施等其中一项或多项组合。
[0043]
例如,当测量地区人口的空间聚集度时,采用人口数据转换方法,将待测量人口数据转换为点数据的位置分布信息,转换后的点数据可以重叠;当测量某一种或多种设施时,采用设施数据转换方法,将待测量设施数据转换为点数据的位置分布信息。
[0044]
步骤二:根据点数据的位置分布信息,计算待测量区域范围内的所有点数据之间的实际距离之和d;
[0045]
本步骤中,假定一个待测量区域范围内,其面积为s,分布n个不同的点数据(点位置可重叠),则所有点数据之间的实际距离之和d的计算公式为:
[0046][0047]
其中,d为所有两点之间的空间距离之和,n为点的总数,d
ij
为第i个点到第j个点的实际距离,i≠j;
[0048]
区域空间分析基本以二维空间分析为主,在二维坐标下,空间距离d
ij
表示为:
[0049][0050]
其中,xi和yi为点i的坐标;xj和yj为点j的坐标。
[0051]
步骤三:设定所有点数据在待测量区域范围内呈均匀分布的假定状态,计算假定状态下的所有点数据之间的距离之和d


[0052]
本步骤中,由于正六边形是最稳定的多边形结构,同时由多个正六边形组成的图形中,正六边形中心与邻近其他六边形的中心均为等距离,因此可利用n个大小相等的正六边形来覆盖整个待测量区域,各正六边形中心为均匀分布的数据点,则:
[0053]
正六边形面积为:
[0054][0055]
正六边形边长为:
[0056][0057]
其中,s为待测量区域面积,n为数据点总数;
[0058]
两邻近数据点(即正六边形中心)之间的距离l

的长度为:
[0059][0060]
根据以上正六边形的边长和两中心间的距离,利用arcgis工具绘制覆盖该区域的n个正六边形。
[0061]
将待测量区域划分为n个相同的正六边形之后,将n个点数据的坐标位置更新为n个正六边形的中心坐标,采用步骤二中相同的方法即可计算假定状态下的所有点数据之间的距离之和d

,公式为:
[0062][0063]
其中,d

为假定状态下的所有点数据之间的距离之和,n为点的总数,d

ij
为假定呈均匀状态下第i个点到第j个点的距离,i≠j。
[0064]
步骤四:计算该区域范围内的人口或者设施数据的空间聚集度a:
[0065][0066]
步骤五:对步骤四计算得到的空间聚集度进行等级划分,空间聚集度数值越小,表示聚集程度越高。
[0067]
当空间聚集度越趋近于0时,表示该区域的要素越集中,等于0即为该要素仅集中于一点;当空间聚集度越趋近于1,表示该区域的要素越呈离散状;当空间聚集度大于1时,表示该区域呈外围性离散状态(如图4所示的1号线b1站)。为此,可根据研究需要对空间聚集度的等级进行划分,如表1。
[0068]
表1空间聚集度等级划分
[0069][0070][0071]
在本发明的具体实施中,当待测量区域为特定形状时,例如正方形或圆形,本实施例中提出了一种近似计算法,可显著降低计算量,提高本发明的适用范围与实用性。
[0072]
以正方形为例,正方形内所有两点(为无限点)的平均距离与正方形边长l存在正比例关系,即:
[0073][0074]
在有限点情况下,各点呈均匀分布的正方形范围内,则点的数量越多,相互间的平均距离与边长之比越接近于0.5214。例如,当n=36、100时,点数据均匀分布下该值分别为0.5281、0.5240,误差分别仅为1.2%、0.50%。
[0075]
因此,在正方形区域内,点数据较多(宜不小于100)时,假定状态下的所有点数据之间的距离之和d

的计算过程可以通过下述公式近似计算:
[0076][0077]
其中,为均匀分布状态下的平均点间距离,q为区域内所有两点间距离对的数
量,l为正方形边长,n为数据点数量。
[0078]
以圆形为例,圆形内所有两点(为无限点)的平均距离与圆形半径r存在正比例关系,即:
[0079][0080]
在有限点情况下,各点呈均匀分布的圆形范围内,则点的数量越多,相互间的平均距离与边长之比越接近于0.9045。
[0081]
因此,在圆形区域范围内,点数据较多(宜不小于100)时,假定状态下的所有点数据之间的距离之和d

的计算过程可以通过下述公式近似计算:
[0082][0083]
其中,为均匀分布状态下的平均点间距离,q为区域内所有两点间距离对的数量,r为圆形半径,n为数据点数量。
[0084]
上述近似计算方法适用于区域内数据点较多的情况,本实施例中,当待测量区域的点数据数量大于100,且待测量区域的形状为正方形或者圆形时,采用上述简明的近似计算法,可显著降低计算量。
[0085]
在本发明的一项具体实施中,所述的人口数据转换方法为:
[0086]
对待测量区域按照行政区域划分为若干子区域,获取每一个子区域内的待测量人口数量;对所有不同子区域内的人口数量进行等比例折算并取整,得到每一个子区域内折算后的人口数量pi,将待测量人口数据转化为对应子区域的人口中心位置pi个点数据,各子区域内的pi个点数据位置重叠;
[0087]
将由待测量人口数据转换为点数据的位置分布信息表示为sq={q1,q2,

,qi,

,qm},qi=(ci,pi),其中,qi表示第i个子区域对应的点数据信息,m表示子区域的数量,ci表示第i个子区域的人口中心坐标,pi表示第i个子区域对应的折算后的人口数,即第i个子区域的点数据数;n表示待测量区域内的点数据总量;
[0088]
以某地区人口空间聚集度为例,城镇化率仅测算城乡之间的人口分布差异,难以表现其在空间的集中与分散程度。依据本发明的地区人口空间聚集度测算将弥补该一缺陷,其计算过程为:
[0089]
s01,确定该地区的范围:以实际范围为准。
[0090]
s02,确定人口分布:收集人口数据,根据人口数据获得情况,尽可能以最小单元的地区进行分割,例如,假设以县为待测量的区域范围,则以行政村为单位的测算精度相对于以镇(街)为单位的测算精度更高。
[0091]
本实施例中,获取全县人口分布数据,城镇以镇区为单位,乡村以行政村为单位,得到全县人口总计201928人,数据点的实际分布如图2所示,部分数据如表2所示。
[0092]
表2某县人口数据表
[0093][0094][0095]
s03,数据点折算:由于地区人口往往众多,以个人作为一个数据点,将增加较多的工作量和计算时间。因此可统一以某一量级(如千位、百位等)对数据进行折算,简化运算。例如,假设某村人口563人,按百位量级四舍五入可简化为6,即该村有6个数据点。
[0096]
本实施例中,按百位量级四舍五入,对各镇区、行政村的人口进行数据点折算,如a1区(某县城)人口29922人,折算为299个数据点,a3村1152人,折算12个数据点,以此类推。全县7个镇区、15个集镇区和346个行政村、共折算为2022个数据点。
[0097]
将由待测量人口数据转换为点数据的位置分布信息表示为sq={q1,q2,

,q
368
},qi=(ci,pi),其中,qi表示第i个子区域对应的点数据信息,ci表示第i个子区域的人口中心坐标,pi表示第i个子区域对应的折算后的人口数,即第i个子区域的点数据数。
[0098]
s04,数据点距离计算:利用arcgis工具计算各数据点间的实际距离及其和d。
[0099]
s05,均匀状态下数据点距离计算:
[0100]
按照边长构建n个均匀分布的正六边形,计算各数据点之间距离及其和d


[0101]
本实施例中,该地区的数据点均匀分布状态图如图3所示。
[0102]
s06,计算空间聚集度并进行等级划分。
[0103]
本实施例中,计算结果如表3所示。
[0104]
表3某县人口空间聚集度测算
[0105][0106][0107]
依据表3的计算结果,某县人口的空间聚集度为0.922,属于低聚集等级,这也客观反映了该县人口分布非常分散,城镇发育较为落后,城镇规模小,亟待提升。
[0108]
在本发明的一项具体实施中,所述的设施数据转换方法为:
[0109]
获取待测量设施的实际位置信息,将每一个待测量设施视为待测量区域内的一个点数据,直接将待测量设施数据转换为该区域内的点数据的位置分布信息,表示为sf={f1,f2,

,fi,

,fn},其中,fi表示第i个设施的实际位置坐标,n表示该区域内的设施数量,即待测量区域内的点数据数量。
[0110]
以某市某地铁站点周边城市服务设施空间聚集度测算为例,其计算过程为:
[0111]
s11,确定区块范围:以各地铁站点中心为原点,以500米为半径,构建围绕站点中心的圆形区域。
[0112]
s12,数据准备:获取上述各区域范围内的城市公共服务设施(包括教育、医疗卫生、文化体育、商业服务)数据点,直接将城市公共服务设施的位置数据转换为该区域内的点数据的位置分布信息,如图4所示。
[0113]
s13,数据点距离计算:利用arcgis工具计算各数据点间的距离及其和d。
[0114]
s14,根据公式计算空间聚集度:
[0115][0116]
本实施例中,r为圆形半径,取500米;n为各站点对应的数据点数量。计算结果如表4所示。
[0117]
表4某市地铁站点公共服务设施空间聚集度测算结果表
[0118][0119]
[0120]
可以看出,通过测算,各站点的空间聚集度存在较大差异,这与实际相符。其中,2号线b4站的城市公共服务设施最为集聚,空间聚集度0.413,为高聚集;2号线b3空间聚集度0.727,为中聚集;2号线b2站和1号线b1站的空间聚集度相对较低,只有0.976和1.108,分别为低聚集和离散状态。
[0121]
上述结果,也反映了本发明的测算方法能较好地反映这些站点的实际城市公共服务设施的聚集程度,为开展该类研究提供了基础。
[0122]
根据上述两个具体实施例,充分体现了本发明提出的针对一定区域范围的点数据空间聚集度测量方法的科学性、实用性和可操作性。
[0123]
以上所述的实施例只是本发明的一种较佳的方案,然其并非用以限制本发明。有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型。因此凡采取等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。

技术特征:


1.一种一定区域范围的点数据空间聚集度测量方法,其特征在于,包括以下步骤:s1:针对待测量区域,将区域范围内的待测量人口或者设施数据转换为点数据的位置分布信息;s2:根据点数据的位置分布信息,计算待测量区域范围内的所有点数据之间的实际距离之和d;s3:设定所有点数据在待测量区域范围内呈均匀分布的假定状态,计算假定状态下的所有点数据之间的距离之和d

;s4:计算该区域范围内的人口或者设施数据的空间聚集度:其中,a表示空间聚集度;s5:对步骤s4计算得到的空间聚集度进行等级划分,空间聚集度数值越小,表示聚集程度越高。2.根据权利要求1所述的一种一定区域范围的点数据空间聚集度测量方法,其特征在于,步骤s1中,所述的将区域范围内的待测量人口或者设施数据转换为点数据的位置分布信息,包括用于将待测量人口数据转换为点数据的位置分布信息的人口数据转换方法,以及将待测量设施数据转换为点数据的位置分布信息的设施数据转换方法;所述的人口数据转换方法为:对待测量区域按照行政区域划分为若干子区域,获取每一个子区域内的待测量人口数量;对所有不同子区域内的人口数量进行等比例折算并取整,得到每一个子区域内折算后的人口数量p
i
,将待测量人口数据转化为对应子区域的人口中心位置p
i
个点数据,各子区域内的p
i
个点数据位置重叠;将由待测量人口数据转换为点数据的位置分布信息表示为s
q
={q1,q2,

,q
i
,

,q
m
},q
i
=(c
i
,p
i
),其中,q
i
表示第i个子区域对应的点数据信息,m表示子区域的数量,c
i
表示第i个子区域的人口中心坐标,p
i
表示第i个子区域对应的折算后的人口数,即第i个子区域的点数据数;n表示待测量区域内的点数据总量;所述的设施数据转换方法为:获取待测量设施的实际位置信息,将每一个待测量设施视为待测量区域内的一个点数据,直接将待测量设施数据转换为该区域内的点数据的位置分布信息,表示为s
f
={f1,f2,

,f
i
,

,f
n
},其中,f
i
表示第i个设施的实际位置坐标,n表示该区域内的设施数量,即待测量区域内的点数据数量。3.根据权利要求1所述的一种一定区域范围的点数据空间聚集度测量方法,其特征在于,步骤s3中所述的设定所有点数据在待测量区域范围内呈均匀分布的假定状态,则在所述假定状态下,所有点数据的坐标位置被更新,更新方式为:将待测量区域划分为n个相同的正六边形,将n个点数据的坐标位置更新为n个正六边形的中心坐标。4.根据权利要求3所述的一种一定区域范围的点数据空间聚集度测量方法,其特征在于,当待测量区域的点数据数量大于100,且待测量区域的形状为正方形或者圆形时,步骤s3中所述的距离之和d

表示为:
其中,表示均匀分布状态下所有点数据之间的平均距离,q表示待测量区域内所有两点间距离对的数量,l表示正方形边长,r表示圆形半径。

技术总结


本发明公开了一种一定区域范围的点数据空间聚集度测量方法,属于空间计量地理技术领域。包括:针对待测量区域,将区域范围内的待测量人口或者设施数据转换为点数据的位置分布信息;根据点数据的位置分布信息,计算待测量区域范围内的所有点数据之间的实际距离之和;设定所有点数据在待测量区域范围内呈均匀分布的假定状态,计算假定状态下的所有点数据之间的距离之和;计算该区域范围内的人口或者设施数据的空间聚集度,并进行等级划分,空间聚集度数值越小,表示聚集程度越高。本发明的测量方法以空间距离为依据,更强调空间性,适用范围广,可解释性强,准确度高。准确度高。准确度高。


技术研发人员:

饶传坤 许琼怡 金利

受保护的技术使用者:

浙江大学

技术研发日:

2022.10.09

技术公布日:

2022/12/23

本文发布于:2024-09-20 12:28:02,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/44645.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   区域   测量   人口
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议