自然资源知识图谱构建方法、装置、服务器及可读存储器[发明专利]

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 202110006052.X
(22)申请日 2021.01.05
(71)申请人 上海云扣科技发展有限公司
地址 200083 上海市虹口区广纪路173号
1001-1007室161K
(72)发明人 程洋 张赛男 
(74)专利代理机构 南京经纬专利商标代理有限
公司 32200
代理人 朱小兵
(51)Int.Cl.
G06F  16/36(2019.01)
G06F  16/29(2019.01)
G06F  16/28(2019.01)
(54)发明名称
自然资源知识图谱构建方法、装置、服务器
及可读存储器
(57)摘要
本发明公开了自然资源知识图谱构建方法、
装置、服务器及可读存储器,构建方法包括:针对
自然资源领域构建数据模型,所述数据模型包括
实体、属性、实体属性值、实体之间的时间关系
空间关系及业务关系;根据数据模型采集自然资
源领域的资源数据形成三元组数据;根据三元组
数据及预设的时空关联分析算法、业务关联分析
算法构建自然资源知识图谱,解决了目前自然资
源模型中各实体节点之间关联关系单一,在国土
空间治理中无法实现对自然资源要素从多个维
度进行全周期管理的技术问题。权利要求书2页  说明书10页  附图8页CN 112612908 A 2021.04.06
C N  112612908
A
1.一种自然资源知识图谱构建方法,其特征在于,包括:
针对自然资源领域构建数据模型,所述数据模型包括实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系;
根据数据模型采集自然资源领域的资源数据形成三元组数据;
根据三元组数据及预设的时空关联分析算法、业务关联分析算法构建自然资源知识图谱。
2.根据权利要求1所述的自然资源知识图谱构建方法,其特征在于,针对自然资源领域构建数据模型,所述数据模型包括实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系,包括:
定义自然资源领域实体集合、实体属性集合、实体之间的关系集合,从而形成包括实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系的数据模型。
3.根据权利要求2所述的自然资源知识图谱构建方法,其特征在于,根据数据模型采集自然资源领域的资源数据形成三元组数据,包括:
根据数据模型采集时间数据、空间资源数据及业务资源数据,所述时间资源数据、空间资源数据及业务资源数据经过预处理后形成实体‑属性‑实体属性值、实体‑时间关系‑实体、实体‑空间关系‑实体及实体‑业务关系‑实体三元组数据。
4.根据权利要求3所述的自然资源知识图谱构建方法,其特征在于,所述时间资源数据、空间资源数据及业务资源数据经过预处理后形成实体‑属性‑实体属性值、实体‑时间关系‑实体、实体‑空间关系‑实及实体‑业务关系‑实体三元组数据,包括:
对时间资源数据、空间资源数据及业务资源数据进行数据统一化预处理后形成实体‑属性‑实体属性值、实体‑时间关系‑实体、实体‑空间关系‑实体及实体‑业务关系‑实体三元组数据。
5.根据权利要求4所述的自然资源知识图谱构建方法,其特征在于,根据三元组数据及预设的时空关联分析算法、业务关联分析算法构建自然资源知识图谱,包括:从三元组数据中抽取实体、属性、实体属性值作为自然资源知识图谱的实体节点、属性及实体节点属性值;
通过预设的时空关联分析算法确定实体节点之间的时间及空间关系:实体节点之间小于时间预设阈值的时间关系作为实体节点的时间关系、大于空间预设阈值的空间关系作为实体节点的空间关系,对于大于或者等于时间预设阈值的时间关系及小于或者等于空间预设阈值的空间关系采用数据向量化处理并预测时间及空间关系,并将预测时间及空间关系作为实体节点的时间及空间关系;
通过预设的业务关联分析算法确定实体节点之间的业务关系:实体节点之间满足采用最短路径的业务关系作为实体节点之间的业务关系;
根据所述实体节点、属性、实体节点属性值、实体节点的空间、时间及业务关系构建自然资源知识图谱。
6.根据权利要求5所述的自然资源知识图谱构建方法,其特征在于,根据三元组数据及预设的时空关联分析算法、业务关联分析算法构建自然资源知识图谱后还包括进一步修正补偿所述自然资源知识图谱,所述进一步修正补偿操作包括:
对游离在自然资源知识图谱外的实体节点进行业务关系补偿,通过逐步增加预设的业
务关联分析算法中的跳跃步长并结合最短路径将游离在自然资源知识图谱外的实体节点进行关联,所述跳跃步长依据自然资源的全业务周期中各业务阶段之间间隔映射;
对完成业务关系补偿后的自然资源知识图谱中的实体节点进行修正,采用实体节点属性值中的时间和空间数据联合判断已关联的实体节点之间的时间和空间关系的正确性来进行修正。
7.根据权利要求6所述的自然资源知识图谱构建方法,其特征在于,所述自然资源知识图谱用于终端应用,所述实体节点、属性、实体节点属性值、实体节点之间的空间、时间及业务关系和地理信息等数据
相结合以便进行时空动态展示;
所述终端还用于自然资源知识图谱中的实体节点、属性、实体节点属性值、实体节点之间的空间、时间及业务关系进行管理。
8.根据权利要求6所述的自然资源知识图谱构建方法,其特征在于,通过预设的图谱规则比对算法,将一系列问题识别的方法转译为计算机能识别的规则,从而基于图谱进行空间和属性比对,实现自然资源数据问题的自动识别;
通过预设的图谱叠加分析算法,筛选出异常的实体节点,实现自然资源要素配置。
9.一种自然资源知识图谱构建装置,其特征在于,包括:
自然资源领域模型构建模块,用于对自然资源数据建模得到数据模型,所述数据模型包括实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系;
三元组数据构建模块,用于依据数据模型采集自然资源领域的资源数据形成三元组数据;
知识图谱构建模块,用于根据三元组数据及预设的时空关联分析算法、业务关联分析算法构建自然资源知识图谱。
10.一种服务器,包括存储器及处理器,所述存储器中储存有计算机程序,其特征在于,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至8中任一项所述的自然资源知识图谱构建方法的步骤。
11.一种可读存储器,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的自然资源知识图谱构建方法的步骤。
自然资源知识图谱构建方法、装置、服务器及可读存储器
技术领域
[0001]本发明涉及大数据技术领域,具体而言,涉及自然资源知识图谱构建方法、装置、服务器及可读存储器。
背景技术
[0002]传统的自然资源数据模型,主要是基于GIS的建模理论,将数据按照不同类型分层存储在数据库中,并在应用系统中采用图层叠加的方式进行表达,这种数据建模方法很好地实现了不同时间切片的现实世界的计算机数字化,但忽略了数据中自然资源要素不同时期和业务阶段的关联关系,为了弥补这种缺陷,现阶段自然资源领域主要是在业务事项办理过程中通过编码的串联来实现相关要素之间的关联,
但这种关联属于典型的树状关联,忽略了自然资源要素对应的空间边界范围会在自然资源管理的各项业务过程中持续发生拆分合并等变化,且随着时间的推移,自然资源要素的边界、权属、状态也会发生变化,单纯的编码串联的形式难以满足国土空间治理中对自然资源要素基于时间变化和空间变化的全周期管理要求。
发明内容
[0003]为了解决目前自然资源模型中各数据之间关联关系单一,在国土空间治理中无法实现对自然资源要素从多个维度进行全周期管理的技术问题,本发明采用包含实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系的数据模型来限定自然资源领域的资源数据形成三元组数据的数据结构,结合预设的时空关联分析算法、业务关联分析算法进一步优化数据模型中的三元组数据,从而形成了自然资源知识图谱,本发明能很好弥补纯业务编码树状结构的不足,能够全面从时间、空间及业务三个维度展示自然资源中各实体节点的关联关系,实现了国土空间治理中对自然资源要素基于时间、空间及业务三个维度进行全周期管理要求。
[0004]为了实现以上目的,本发明采取的一种技术方案是:
[0005]一种自然资源知识图谱构建方法,包括:
[0006]针对自然资源领域构建数据模型,所述数据模型包括实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系;
[0007]根据数据模型采集自然资源领域的资源数据形成三元组数据;
[0008]根据三元组数据及预设的时空关联分析算法、业务关联分析算法构建自然资源知识图谱。
[0009]进一步地,针对自然资源领域构建数据模型,所述数据模型包括实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系,包括:
[0010]定义自然资源领域实体集合、实体属性集合、实体之间的关系集合,从而形成包括实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系的数据模型。[0011]进一步地,根据数据模型采集自然资源领域的资源数据形成三元组数据,包括:
[0012]根据数据模型采集时间数据、空间资源数据及业务资源数据,所述时间资源数据、空间资源数据及业务资源数据经过预处理后形成实体‑属性‑实体属性值、实体‑时间关系‑实体、实体‑空间关系‑实体及实体‑业务关系‑实体三元组数据。
[0013]进一步地,所述时间资源数据、空间资源数据及业务资源数据经过预处理后形成实体‑属性‑实体属性值、实体‑时间关系‑实体、实体‑空间关系‑实及实体‑业务关系‑实体三元组数据,包括:
[0014]对时间资源数据、空间资源数据及业务资源数据进行数据统一化预处理后形成实体‑属性‑实体属性值、实体‑时间关系‑实体、实体‑空间关系‑实体及实体‑业务关系‑实体三元组数据。
[0015]进一步地,根据三元组数据及预设的时空关联分析算法、业务关联分析算法构建自然资源知识图谱,包括:
[0016]从三元组数据中抽取实体、属性、实体属性值作为自然资源知识图谱的实体节点、属性及实体节点属性值;
[0017]通过预设的时空关联分析算法确定实体节点之间的时间及空间关系:实体节点之间小于时间预设阈值的时间关系作为实体节点的时间关系、大于空间预设阈值的空间关系作为实体节点的空间关系,对于大于或者等于时间预设阈值的时间关系及小于或者等于空间预设阈值的空间关系采用数据向量化处理并预测时间及空间关系,并将预测时间及空间关系作为实体节点的时间及空间关系;
[0018]通过预设的业务关联分析算法确定实体节点之间的业务关系:实体节点之间满足采用最短路径的业务关系作为实体节点之间的业务关系;
[0019]根据所述实体节点、属性、实体节点属性值、实体节点的空间、时间及业务关系构建自然资源知识图谱。
[0020]进一步地,根据三元组数据及预设的时空关联分析算法、业务关联分析算法构建自然资源知识图谱后还包括进一步修正补偿所述自然资源知识图谱,所述进一步修正补偿操作包括:
[0021]对游离在自然资源知识图谱外的实体节点进行业务关系补偿,通过逐步增加预设的业务关联分析算法中的跳跃步长并结合最短路径将游离在自然资源知识图谱外的实体节点进行关联,所述跳跃步长依据自然资源的全业务周期中各业务阶段之间间隔映射;[0022]对完成业务关系补偿后的自然资源知识图谱中的实体节点进行修正,采用实体节点属性值中的时间和空间数据联合判断已关联的实体节点之间的时间和空间关系的正确性来进行修正。
[0023]进一步地,所述自然资源知识图谱用于终端应用,所述实体节点、属性、实体节点属性值、实体节点之间的空间、时间及业务关系和地理信息等数据相结合以便进行时空动态展示;
[0024]所述终端还用于自然资源知识图谱中的实体节点、属性、实体节点属性值、实体节点之间的空间、时间及业务关系进行管理。
[0025]进一步地,通过预设的图谱规则比对算法,将一系列问题识别的方法转译为计算机能识别的规则,从而基于图谱进行空间和属性比对,实现自然资源数据问题的自动识别;[0026]通过预设的图谱叠加分析算法,筛选出异常的实体节点,实现自然资源要素配置。

本文发布于:2024-09-25 17:10:57,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/461422.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:实体   关系   数据   业务   空间   时间
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议