一种室内面要素自动聚类的地图制图方法



1.本发明属于地图制图技术领域,尤其涉及一种室内面要素自动聚类的地图制图方法。


背景技术:



2.室内地图制图综合研究可以实现室内信息的多层次表达,优化室内地图的可视化效果和室内导航服务。目前制图综合的研究对象主要是室外地图,室内场景的多尺度表达以及室内地图的制图综合研究较少。室内空间尺度较小,内部要素排列紧凑,空间结构复杂且语义信息丰富,而室内地图的表达只有一种层次,如果将适合室外地图表达的比例尺直接应用到室内地图,会出现要素拥挤、表达不清的情况。
3.武芳等指出制图综合对象已经超越其最初的内涵,逐渐延伸到室内地图、虚拟现实、vgi众源地图、机器人地图等多种类型。gotlib提出室内地图表达应当考虑的问题里包括室内地图的制图综合问题。在为数不多的室内制图综合研究中,江梦颖探索了室内地图poi点要素的多尺度可视化策略。normann等结合lod技术和制图综合理论,以提高用户的读图体验为目标,探究室内空间信息的表达方式。但该研究只顾及到室内面要素的连通特征,未考虑室内其他特征,也未实现室内面要素的自动综合。室内地图中面要素占据图幅面积最大,所以面要素综合在室内制图综合中尤为关键。
4.聚类研究是面要素综合的首要步骤,其核心在于选择合适的聚类算法度量室内面要素间的相似关系。传统的聚类算法需要大量的人工计算,难以处理复杂的聚类对象。神经网络聚类方法将人工智能应用于聚类任务,一定程度上实现了自动聚类,但因为面要素本身以及聚类问题的复杂性,现有的神经网络聚类方法仍有不少改进空间。由于一般的神经网络方法无法处理矢量数据,处理图数据的图卷积网络(graph convolutional networks,gcns)便受到学者的关注。在一些与制图综合相关的研究中,张康等通过gcns自动选取道路网;于洋洋利用gcns实现居民地面状要素的形状识别与分类;令振飞等运用gcns实现建筑物模式的识别。
5.室内空间的私密性导致很多建筑物的室内地图发展都受到限制,商场便成为室内地图中应用最广的场景。本发明以商场室内地图面要素自动聚类为研究目标,构建基于gcns的编码器-解码器模型,对比分析不同gcns模型对室内面要素自动聚类研究的适用性,实现有监督学习方法和聚类问题的有效结合。


技术实现要素:



6.为克服现有技术的缺点和不足,本发明的目的在于提供一种室内面要素自动聚类的地图制图方法。
7.本发明是这样实现的,一种室内面要素自动聚类的地图制图方法,该方法包括以下步骤:
8.s1、以室内地图面要素为综合对象,将商场室内面要素的自动聚类为目标,把聚类
问题拆分为特征提取和特征聚类,由此构建编码器-解码器聚类模型;
9.s2、通过所述模型提取适合商场室内空间聚类的面要素特征,得到室内地图图结构的聚类结果。
10.优选地,在步骤s1中,编码器采用关系图卷积网络rgcn和关系图注意力网络rgat提取室内面要素的空间结构信息和属性信息。
11.优选地,所述rgcn对不同关系类型的节点分别进行聚合操作,依据边上的不同属性将图结构分为不同的子图,在划分得到的子图上聚合邻域节点,之后将每个子图聚合的结果相加,输入到下一层网络;该rgcn通用的表示方式是:
[0012][0013]
其中,表示节点i在第l+1层的特征表示;σ表示激活函数;表示在关系r∈r下的邻域节点索引;c
i,r
是标准化常数;表示邻域节点j在l层的状态;表示对节点i自身的学习;是关系r的权重矩阵。
[0014]
优选地,所述rgat将注意力机制扩展到rgcn模型,其计算公式如下:
[0015][0016]
其中,是为关系r的节点i生成的注意力系数,j是节点i的邻域节点,表示节点i在关系r下的中间特征向量表示。
[0017]
优选地,所述编码器-解码器聚类模型的构建过程包括以下步骤:
[0018]
(1)将邻接矩阵、点的特征矩阵和边的特征矩阵输入模型;其中,邻接矩阵描述节点间的连接关系,反映室内地图的空间结构信息;点的特征矩阵表示几何特征和语义特征,边的特征矩阵表示拓扑邻接关系;
[0019]
(2)对模型进行训练,具体为通过计算损失函数关于每个网络参数的导数来进行参数的学习和调整,出模型的最优参数;
[0020]
(3)建立模型聚类结果的评价指标。
[0021]
优选地,在步骤(1)中,几何特征包括室内面要素的质心坐标、最小外接矩形方向以及延展度、紧凑度属性;所述语义特征取决于室内面要素的功能属性。
[0022]
在步骤(2)中,模型的激活函数选用relu函数
[0023]
优选地,在步骤(3)中,所述评价指标的建立构成具体为:
[0024]
使用auc评估聚类模型性能;
[0025]
选用调整兰德系数对聚类结果实现定量化评价。
[0026]
优选地,在步骤s2中,所述解码器将编码器提取到的特征组成样本对,对样本对的特征向量做内积运算得到样本对之间的相似度,再通过softmax函数得到它们之间的链接概率,链接概率越高表示样本对聚成一类的可能性越大,之后设置合适的阈值对概率进行二分类,仅保留超过阈值的链接,进而实现整个室内地图图结构的划分聚类。
[0027]
优选地,由交叉熵损失函数研究提出的室内面要素聚类模型,其预测结果是某样本属于n个类别的对应概率值,两链接概率分布之间的距离为损失值,距离越小表示这两个
概率越相近;其中,该损失值表述为:
[0028][0029]
其中,yi表示第i个样本的标签,为模型的预测值,n表示样本的数量,面要素之间的链接关系作为交叉熵损失函数中的标签值y,解码器的输出结果作为预测值
[0030]
针对目前仅以室外地图点线面为制图综合对象的现状,本发明以室内地图面要素为综合对象,将商场室内面要素的自动聚类作为研究目标,把聚类问题拆分为特征提取和特征聚类,由此构建编码器-解码器聚类模型,其中编码器由图卷积网络及其变体模型组成。研究结果表明,本发明提出的模型框架能够有效地提取适合商场室内空间聚类的面要素特征,并且取得较为理想的聚类效果,尤其是以关系图卷积网络为编码器的聚类模型,无论是模型性能、时间复杂度还是聚类结果的准确度都表现为最佳,其中聚类准确度高达95%。
附图说明
[0031]
图1是南京市某区域内商场数据分布图;
[0032]
图2是四种模型的loss和auc随迭代次数的变化情况;
[0033]
图3是不同模型的预测时间;
[0034]
图4是四种模型预测结果的ari值;
[0035]
图5是ari随阈值设置的变化;
[0036]
图6是样本a的聚类结果(左图为rgcn模型结果,右图为期望结果)。
具体实施方式
[0037]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0038]
本发明以商场室内地图面要素自动聚类为研究目标,构建基于gcns的编码器-解码器模型,对比分析不同gcns模型对室内面要素自动聚类研究的适用性,实现有监督学习方法和聚类问题的有效结合。
[0039]
1、编码器-解码器聚类模型
[0040]
1.1、编码器
[0041]
室内地图面要素相似性的度量研究分为空间关系和属性特征两方面。空间关系包括空间邻近和拓扑邻接关系,属性特征包括几何特征和语义特征。传统的聚类算法难以度量室内面要素相似性,而gcns强大的学习能力能够实现图结构数据的深层次特征提取,故选择基于gcns的编码器-解码器模型用于室内地图面要素特征提取与特征聚类。针对室内面要素特有的拓扑邻接特征,编码器采用关系图卷积网络(relational graph convolutionalnetwork,rgcn)和关系图注意力网络(relational graph attentionnetwork,rgat)提取室内面要素的空间结构信息和属性信息,其核心是实现节点
特征的降维表达。gcn和图注意力网络(graph attentionnetwork,gat)作为对照组被纳入聚类实验。
[0042]
rgcn对不同关系类型的节点分别进行聚合操作,依据边上的不同属性将图结构分为不同的子图,在划分得到的子图上聚合邻域节点,之后将每个子图聚合的结果相加,输入到下一层网络。通用的表示方式是:
[0043][0044]
其中,表示节点i在第l+1层的特征表示;σ表示激活函数;表示在关系r∈r下的邻域节点索引;c
i,r
是标准化常数;表示邻域节点j在l层的状态;表示对节点i自身的学习;是关系r的权重矩阵。
[0045]
gat能够自学习节点间权重系数,它将注意力机制引入到gcn以解决gcn默认所有邻域节点影响权重相同的问题。rgat又将注意力机制扩展到rgcn模型,计算公式如下:
[0046][0047]
其中,是为关系r的节点i生成的注意力系数,j是节点i的邻域节点,表示节点i在关系r下的中间特征向量表示。
[0048]
1.2、解码器
[0049]
解码器将编码器提取到的特征组成样本对,对样本对的特征向量做内积运算得到样本对之间的相似度,再通过softmax函数得到它们之间的链接概率,链接概率越高表示样本对聚成一类的可能性越大,之后设置合适的阈值对概率进行二分类,仅保留超过阈值的链接,进而实现整个室内地图图结构的划分聚类。
[0050]
这种聚类思路采用有监督学习方法,它将特征提取过程和聚类任务联合在一起,通过最小化聚类损失的方式实现参数的调整,辅助模型学习到更适合聚类任务的特征。由于聚类的数目以及各类别的特征不具备平移不变性,很难标注有效的节点监督信息,因此聚类问题的解决方法大多是无监督学习式的。为了实现有监督学习方法和聚类问题的结合,chang等将节点的多分类问题转换为边的二分类问题,即高相似度的节点之间存在链接,可以聚为一类,低相似度的节点不存在链接,不属于同类。
[0051]
有监督学习模型的核心是选择可靠的标签信息和损失函数。标签信息就是根据样本对之间的相似度给样本对打标签,取值是0或1,1表示存在链接,0表示不存在。损失函数由样本对实际相似度和标签值的差定义,通过最小化实际相似度和标注值之间的差(即损失值)来训练模型。由于将点的聚类问题转换为边的分类问题,交叉熵损失函数更适合研究提出的室内面要素聚类模型,其预测结果是某样本属于n个类别的对应概率值。损失值描述两个概率分布之间的距离,距离越小表示这两个概率越相近。它的标准形式如下:
[0052][0053]
其中yi表示第i个样本的标签,为模型的预测值,n表示样本的数量。其中面要素
之间的链接关系作为交叉熵损失函数中的标签值y,解码器的输出结果作为预测值
[0054]
2、模型的构建
[0055]
2.1、模型的输入
[0056]
模型的输入包括邻接矩阵,点的特征矩阵和边的特征矩阵。邻接矩阵描述节点间的连接关系,反映室内地图的空间结构信息。点的特征矩阵表示几何特征和语义特征,边的特征矩阵表示拓扑邻接关系。几何特征包括室内面要素的质心坐标、最小外接矩形方向以及延展度、紧凑度等八个属性,其公式与定义如表1所示。语义特征取决于室内面要素的功能属性,本发明以商场为研究实例,将商场的面状要素大致分为三大类:用户兴趣要素(购物、餐饮、卫生间等)、交通通行要素(出入口、扶梯、电梯等)、非开放区域(用电设施、办公区域等),如表2所示。
[0057]
表1度量面要素几何特征的常用指标
[0058][0059][0060]
表2商场室内面要素语义特征分类
[0061][0062]
2.2、模型的训练与参数设计
[0063]
模型的训练就是通过计算损失函数关于每个网络参数的导数来进行参数的学习和调整,出模型的最优参数。反向传播算法常用来训练神经网络模型,该算法通过导数的链式法则对网络中每一层的权重w和偏置b计算损失函数的偏导,最后使用梯度下降
算法实现参数的更新,以减少输出层的误差,其过程通常分为三步:
[0064]
(1)输入处理后的数据和模型的初始化参数,逐层进行前馈计算,得到每一层的净输入和激活值,直到输出最后一层的链接概率值;
[0065]
(2)反向计算每一层的误差项
[0066]
对于第l层的某个神经元,其误差项等于所有与该神经元相连的第l+1层的神经元的误差项的权重和;
[0067]
(3)根据梯度下降法更新模型参数,使得误差最小
[0068]
具体过程是计算损失函数关于每一层权重w和偏置b的梯度。梯度下降法中,模型的权重参数通过下式来进行更新:
[0069][0070]
其中,η表示每次更新的步长,称为学习率。
[0071]
模型中有一部分参数无法自动学习,需要手动设计,被称为超参数。超参数的设置通常依据研究人员的经验,无法通过模型的训练实现自动更新。超参数的首次选择以及后续的调整优化是机器学习的研究重点。为了减少调参所耗时间,本发明使用随机搜索的方式调整模型中的超参数,不需要尝试所有参数值,而是基于随机策略采样固定数量的参数来实现模型的优化。对于本发明提出的聚类模型,涉及到的超参数包括激活函数、dropout率、学习率、迭代次数epoch、批量大小batch_size、阈值等。其中,模型的激活函数选用relu函数,relu函数的优势在于输入为正时其值保持不变,梯度为1,能够有效的缓解梯度消失问题。
[0072]
2.3、聚类结果的评价指标
[0073]
(1)使用auc(area under curve)评估聚类模型性能
[0074]
聚类模型的输出结果是节点之间的链接状态,存在链接属于正样本,不存在链接属于负样本。auc可以理解为随机抽出一个正样本和一个负样本时,分类模型预测得到正样本的概率大于负样本概率的概率。对于n个从小到大排序的样本,auc计算公式如下:
[0075][0076]
ranki表示排序后第i个样本的序号,取值为[1,n];d
+
为正例集合,m和n分别为正负样本数目。auc的取值范围[0,1],其值越大,表示模型的性能越好。
[0077]
(2)选用调整兰德系数(adjusted rand index,ari)对聚类结果实现定量化评价
[0078]
ari是一种面向有监督聚类的评价指数,通过对比预先标注的聚类结果和实验得出的聚类结果之间的差异性得到聚类的效果。公式如下:
[0079][0080]
其中,ai和bi分别表示标注和实验的结果中每个类别包含的面要素个数,n
i,j
表示同一类别下标注和实验的结果中面要素的重叠数量。ari的取值范围是[-1,1],值越大表示
聚类效果越好。
[0081]
3、实验与结果分析
[0082]
本发明以南京市大型商场室内地图为聚类对象,在高德地图上采集到40个商场的室内地图数据,样本数据中包含的面要素个数多达20 000个,如图1所示。
[0083]
3.1样本处理与训练
[0084]
在训练模型之前,先预处理样本数据,比如矢量化、添加字段和打标签。之后利用python将属性字段转换为对应的邻接矩阵和特征矩阵,作为模型的输入数据。具体字段处理过程包括:
[0085]
(1)根据面要素的质心坐标构建delaunay三角网,再将其转换为图的邻接矩阵;
[0086]
(2)对几何特征和语义特征进行数值化和归一化处理,生成节点的特征矩阵;
[0087]
(3)判断面要素之间的拓扑邻接关系,生成边的特征矩阵。
[0088]
本实验首先使用pytorch geometric来构建模型,它支持把数据构建为图并直接作为模型的输入。接着使用随机分层方法按8:2将样本划分为训练集和测试集。每个样本包括11维节点特征,代表面要素的11个属性字段,因此模型的输入通道数in_channel为11。实验中隐藏层的通道数是64,输出层的通道数为2,分别表示链接存在或者不存在。之后初始化模型的参数和超参数,再输入样本训练。模型训练的关键在于利用损失函数计算实际预测值和期望输出值(即标签值)之间的差,通过调整超参数的方式最小化损失值,使模型达到收敛状态,最后保存模型。
[0089]
经过反复的损失计算和参数更新,最终确定模型的dropout率为0.5,批量大小batch_size为16,迭代次数epoch为500,其他具体参数如表3所示。
[0090]
表3编码器模型参数
[0091][0092][0093]
3.2、性能评价
[0094]
研究记录了四种聚类模型训练时auc和loss随迭代次数的变化情况来评估各聚类模型的性能和训练效果。从图2可以看出,各模型的整体变化趋势大致相同:
[0095]
(1)loss呈下降趋势,迭代100次时,loss值开始稳定,其中rgat和rgcn损失下降情况相似,均低于gat和gcn;
[0096]
(2)auc呈上升趋势,迭代100次时,auc值趋于稳定。此趋势表明本发明设计的编码器-解码器聚类框架可以有效学习到适用于室内面要素聚类的面要素特征。
[0097]
此外,rgat和rgcn的聚类模型性能高于gat和gcn,这表明关系型图卷积网络更适
合室内面要素的特征学习。
[0098]
模型的预测时间反映模型预测一个样本的时间复杂度,常用来度量模型的性能,模型的时间复杂度越低越好。在本实验中,各模型的预测时间如图3所示。rgcn会根据关系类型将整个图结构分为不同子图,最后分别进行聚合,因此稍高于gcn的时间复杂度。gat采取注意力机制,在聚合之前需要给每个节点单独计算注意力系数,因此其模型设计比gcn模型复杂得多。而gat模型的时间复杂度高于rgat,是因为在区分关系类型之后,对于每个节点来说,rgat的注意力系数计算更为简单,但是gat的注意力系数值需要考虑所有邻域节点的值。
[0099]
3.3、聚类结果分析
[0100]
通过训练好的聚类模型预测室内地图样本,得到了四种模型预测结果的ari值,如图4所示,由此定量描述各模型聚类效果。对照组gcn和gat的聚类准确度明显低于实验组rgcn和rgat,ari不到0.4;实验组里rgcn的ari达到最高,接近于0.95,说明拓扑邻接关系的表达对于室内面要素聚类研究至关重要,图注意力网络预测结果不理想可能是因为模型过于复杂,不适合室内面要素特征学习。
[0101]
为了进一步探究模型的聚类能力以及阈值参数对聚类结果的影响,本发明以rgcn为例,记录ari随不同阈值设置的变化,如图5所示。结果表明,在划分聚类实验中最理想的聚类结果是以0.62为划分值,若两个节点之间的链接概率超过0.62,则其聚成一类的可能性最大。
[0102]
表4四种模型的时间复杂度和聚类准确度
[0103][0104]
结合上述分析以及表4四种模型的时间复杂度和聚类复杂度,不难发现rgcn模型无论是在训练损失、auc、时间复杂度还是聚类结果的准确度方面,均取得优异的结果。为了更直观地分析模型的聚类效果,研究使用训练好的rgcn聚类模型对不同的地图样本进行可视化展示。如图6所示,左侧是rgcn聚类模型的聚类结果,右侧是人工聚类结果,同颜的面要素表示同一类别,可以明显看出模型的整体效果较为理想。虽然样本的空间关系和几何形态比较复杂,但大部分连通在一起并且应该归为一类的面要素都实现了正确聚类,只有少部分面要素聚类失败。
[0105]
4、结论
[0106]
本发明以南京市大型商场的室内地图作为数据源,利用编码器-解码器模型框架完成室内面要素的深度聚类,将gcns应用于室内面要素自动聚类问题。不仅考虑了室内地图的空间特征和属性特征,还实现了有监督聚类。
[0107]
实验结果表明,模型具有优异的聚类能力,以rgat和rgcn为编码器的聚类模型均取得65%以上的准确度,其中rgcn高达95%。此外,可视化的聚类效果展示也说明该聚类方案可以实现室内面要素的有效聚类。
[0108]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

技术特征:


1.一种室内面要素自动聚类的地图制图方法,其特征在于,该方法包括以下步骤:s1、以室内地图面要素为综合对象,将商场室内面要素的自动聚类为目标,把聚类问题拆分为特征提取和特征聚类,由此构建编码器-解码器聚类模型;s2、通过所述模型提取适合商场室内空间聚类的面要素特征,得到室内地图的聚类结果。2.如权利要求1所述的地图制图方法,其特征在于,在步骤s1中,编码器采用关系图卷积网络rgcn和关系图注意力网络rgat提取室内面要素的空间结构信息和属性信息。3.如权利要求2所述的地图制图方法,其特征在于,所述rgcn对不同关系类型的节点分别进行聚合操作,依据边上的不同属性将图结构分为不同的子图,在划分得到的子图上聚合邻域节点,之后将每个子图聚合的结果相加,输入到下一层网络;该rgcn通用的表示方式是:其中,表示节点i在第l+1层的特征表示;σ表示激活函数;表示在关系r∈r下的邻域节点索引;c
i,r
是标准化常数;表示邻域节点j在l层的状态;表示对节点i自身的学习;是关系r的权重矩阵。4.如权利要求2所述的地图制图方法,其特征在于,所述rgat将注意力机制扩展到rgcn模型,其计算公式如下:其中,是为关系r的节点i生成的注意力系数,j是节点i的邻域节点,表示节点i在关系r下的中间特征向量表示。5.如权利要求1所述的地图制图方法,其特征在于,所述编码器-解码器聚类模型的构建过程包括以下步骤:(1)将邻接矩阵、点的特征矩阵和边的特征矩阵输入模型;其中,邻接矩阵描述节点间的连接关系,反映室内地图的空间结构信息;点的特征矩阵表示几何特征和语义特征,边的特征矩阵表示拓扑邻接关系;(2)对模型进行训练,具体为通过计算损失函数关于每个网络参数的导数来进行参数的学习和调整,出模型的最优参数;(3)建立模型聚类结果的评价指标。6.如权利要求5所述的地图制图方法,其特征在于,在步骤(1)中,几何特征包括室内面要素的质心坐标、最小外接矩形方向以及延展度、紧凑度属性;所述语义特征取决于室内面要素的功能属性。7.如权利要求5所述的地图制图方法,其特征在于,在步骤(2)中,模型的激活函数选用relu函数。8.如权利要求5所述的地图制图方法,其特征在于,在步骤(3)中,所述评价指标的建立构成具体为:
使用auc评估聚类模型性能;选用调整兰德系数对聚类结果实现定量化评价。9.如权利要求1所述的地图制图方法,其特征在于,在步骤s2中,所述解码器将编码器提取到的特征组成样本对,对样本对的特征向量做内积运算得到样本对之间的相似度,再通过softmax函数得到它们之间的链接概率,链接概率越高表示样本对聚成一类的可能性越大,之后设置合适的阈值对概率进行二分类,仅保留超过阈值的链接,进而实现整个室内地图图结构的划分聚类。10.如权利要求9所述的地图制图方法,其特征在于,由交叉熵损失函数研究提出的室内面要素聚类模型,其预测结果是某样本属于n个类别的对应概率值,两链接概率分布之间的距离为损失值,距离越小表示这两个概率越相近;其中,该损失值表述为:其中,y
i
表示第i个样本的标签,为模型的预测值,n表示样本的数量,面要素之间的链接关系作为交叉熵损失函数中的标签值y,解码器的输出结果作为预测值

技术总结


本发明公开了一种室内面要素自动聚类的地图制图方法,该方法以室内地图面要素为综合对象,将商场室内面要素的自动聚类作为研究目标,把聚类问题拆分为特征提取和特征聚类,由此构建编码器-解码器聚类模型,其中编码器由图卷积网络及其变体模型组成。本发明提出的模型框架能够有效地提取适合商场室内空间聚类的面要素特征,并且取得较为理想的聚类效果,尤其是以关系图卷积网络为编码器的聚类模型,无论是模型性能、时间复杂度还是聚类结果的准确度都表现为最佳,其中聚类准确度高达95%。其中聚类准确度高达95%。其中聚类准确度高达95%。


技术研发人员:

马劲松 郑静 高子仁 沈仪 潘慧君

受保护的技术使用者:

南京大学

技术研发日:

2022.08.09

技术公布日:

2022/11/2

本文发布于:2024-09-21 15:49:43,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/22442.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:模型   特征   要素   内面
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议