发明人:郑磊,孔祥靖,魏豪,潘建宏,张凯
申请号:CN202210228627.7
申请日:20220310
公开号:CN114491081A
公开日:
20220513
专利内容由知识产权出版社提供
摘要:本发明涉及一种基于数据血缘关系图谱的电力数据溯源方法及系统,首先采用有序分层法对所有字段进行词汇提取获得字段特征词汇总表;其次利用字段特征词汇总表统计待统计字段中的所有字段信息,同时进行归一化处理获得不同字段数据类型对应的字段特征向量;建立各个字段特征向量之间的血缘关系;然后根据各个字段特征向量之间的血缘关系构建字段级数据血缘图谱和表级数据血缘图谱;最后对已确定血缘方向性的表级数据血缘图谱和/或字段级数据血缘图谱中的每个结点进行溯源分析。本发明将抽象的数据血缘分析问题转换为操作性强的特征空间向量相似性度量问题进行求解,解决数据源字段复杂、数据维度高及维度不固定的问题,实现快速的数据溯源分析。 申请人:国网吉林省电力有限公司信息通信公司,国网吉林省电力有限公司
地址:130000 吉林省长春市人民大街10388号
国籍:CN