基于数据仓库的数据溯源方法及装置[发明专利]

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201710897207.7
(22)申请日 2017.09.28
(71)申请人 深圳市华傲数据技术有限公司
地址 518000 广东省深圳市龙华新区清祥
路清湖工业区宝能科技园7栋B座12楼
J、K单位
(72)发明人 黎仁全 唐明辉 李邱林 贾西贝 
(74)专利代理机构 北京酷爱智慧知识产权代理
有限公司 11514
代理人 安娜
(51)Int.Cl.
G06F  17/30(2006.01)
(54)发明名称
基于数据仓库的数据溯源方法及装置
(57)摘要
本发明属于数据处理技术领域,提供了一种
基于数据仓库的数据溯源方法及装置。该方法包
括:获取溯源请求,溯源请求包括待查询的用户
标识和属性。在预构建的数据仓库中,根据用户
标识或属性进行溯源,定位单元格,并获取单元
格中的信息,以及单元格所关联存储的信息来源
和更新时间。本发明基于数据仓库的数据溯源方
法及装置,能够精确、快速地进行数据溯源,精准
定位单元格数据,
为用户提供可靠的查询结果。权利要求书2页  说明书7页  附图1页CN 107609171 A 2018.01.19
C N  107609171
A
1.一种基于数据仓库的数据溯源方法,其特征在于,包括:
获取溯源请求,所述溯源请求包括待查询的用户标识和属性;
在预构建的数据仓库中,根据所述用户标识或所述属性进行溯源,定位单元格,并获取所述单元格中的信息,以及所述单元格所关联存储的信息来源和更新时间。
2.根据权利要求1所述基于数据仓库的数据溯源方法,其特征在于,
根据所述用户标识或所述属性进行溯源之前,该方法还包括:
对预获取的信息进行属性分析,获取每条信息的属性;
按照信息的属性,将每条信息独立存储至原子层的单元格;
将预获取的每条信息的信息来源和更新时间关联存储至该条信息在原子层的单元格;
对每种属性的信息进行整合,获取整合信息,并将所述整合信息存储至整合层的单元格;
将所述整合信息的信息来源和更新时间关联存储至该条信息在整合层的单元格,所述数据仓库包括所述原子层和所述整合层。
3.根据权利要求2所述基于数据仓库的数据溯源方法,其特征在于,根据所述用户标识或所述属性进行溯源,定位单元格,并获取所述单元格中的信息,具体包括:根据所述用户标识或所述属性在所述数据仓库的整合层进行溯源,定位整合层的单元格,并获取所述单元格的信息;
或根据所述用户标识或所述属性在所述数据仓库的原子层进行溯源,定位原子层的单元格,并获取所述单元格的信息。
4.根据权利要求3所述基于数据仓库的数据溯源方法,其特征在于,
获取所述溯源请求之后,根据所述用户标识或所述属性进行溯源,定位单元格之前,该方法还包括:
根据所述溯源请求的查询粒度,确定在数据仓库中待溯源的层级;
根据所述用户标识或所述属性进行溯源,定位单元格,具体包括:
若待溯源的层级为整合层,则根据所述用户标识或所述属性在所述数据仓库的整合层进行溯源,定位整合层的单元格;
若待溯源的层级为原子层,则根据所述用户标识或所述属性在所述数据仓库的原子层进行溯源,定位原子层的单元格。
5.根据权利要求1所述基于数据仓库的数据溯源方法,其特征在于,
根据所述用户标识或所述属性进行溯源,定位单元格,并获取该单元格中的信息,具体包括:
根据所述用户标识进行溯源,获取与该用户标识所关联的信息;
根据所述属性和所述用户标识所关联的信息,定位所述单元格,并获取所述单元格中的信息;
或根据所述属性进行溯源,获取该属性的信息;
根据所述用户标识和该属性的信息,定位所述单元格,并获取所述单元格中的信息。
6.根据权利要求2所述基于数据仓库的数据溯源方法,其特征在于,
对每种属性的信息进行整合,获取整合信息,具体包括:
按照预先配置的整合规则,对每种属性的信息进行整合,获取整合信息。
7.根据权利要求6所述基于数据仓库的数据溯源方法,其特征在于,
获取所述单元格中的信息之后,该方法还包括:
检验所述单元格中的信息,获取检验结果;
根据所述检验结果,修正所述整合规则。
8.一种基于数据仓库的数据溯源装置,其特征在于,包括:
请求获取模块:用于获取溯源请求,所述溯源请求包括待查询的用户标识和属性;
溯源模块:用于在预构建的数据仓库中,根据所述用户标识或所述属性进行溯源,定位单元格,并获取所述单元格中的信息,以及所述单元格所关联存储的信息来源和更新时间。
9.根据权利要求8所述基于数据仓库的数据溯源装置,其特征在于,
所述数据仓库,具体包括:
原子层:用于对预获取的信息进行属性分析,获取每条信息的属性;按照信息的属性,将每条信息独立存储至原子层的单元格;将预获取的每条信息的信息来源和更新时间关联存储至该条信息在原子层的单元格;
整合层:用于对每种属性的信息进行整合,获取整合信息,并将所述整合信息存储至整合层的单元格;将所述整合信息的信息来源和更新时间关联存储至该条信息在整合层的单元格。
10.根据权利要求9所述基于数据仓库的数据溯源装置,其特征在于,
所述溯源模块,根据所述用户标识或所述属性进行溯源,定位单元格,并获取所述单元格中的信息时,具体用于:根据所述用户标识或所述属性在所述数据仓库的整合层进行溯源,定位整合层的单元格,并获取所述单元格的信息;或根据所述用户标识或所述属性在所述数据仓库的原子层进行溯源,定位原子层的单元格,并获取所述单元格的信息。
基于数据仓库的数据溯源方法及装置
技术领域
[0001]本发明涉及数据处理技术领域,具体涉及一种基于数据仓库的数据溯源方法及装置。
背景技术
[0002]随着智慧城市建设对互联网、云计算、物联网等信息技术的要求,大量数据的收集、储存、分析、处理及其应用越来越广泛,政府的决策行为将逐渐基于数据和分析而做出。数据溯源是对数据的起源以及数据产生过程的描述信息,这些信息在很多方面发挥着重要的作用。
[0003]现有技术中,通常采用字典、配置规则、映射关系进行数据溯源,查询结果多是获取某一数据表的信息,无法精准定位到具体某一单元格的数据,甚至,采用现有的技术手段查询到的数据之间存在矛盾。
[0004]如何精确、快速地进行数据溯源,精准定位单元格数据,是本领域技术人员亟需解决的问题。
发明内容
[0005]针对现有技术中的缺陷,本发明提供基于数据仓库的数据溯源方法及装置,能够精确、快速地进行数据溯源,精准定位单元格数据。
[0006]第一方面,本发明提供一种基于数据仓库的数据溯源方法,该方法包括:获取溯源请求,溯源请求包括待查询的用户标识和属性;
[0007]在预构建的数据仓库中,根据用户标识或属性进行溯源,定位单元格,并获取单元格中的信息,以及单元格所关联存储的信息来源和更新时间。
[0008]进一步地,根据用户标识或属性进行溯源之前,该方法还包括:
[0009]对预获取的信息进行属性分析,获取每条信息的属性;
[0010]按照信息的属性,将每条信息独立存储至原子层的单元格;
[0011]将预获取的每条信息的信息来源和更新时间关联存储至该条信息在原子层的单元格;
[0012]对每种属性的信息进行整合,获取整合信息,并将整合信息存储至整合层的单元格;
[0013]将整合信息的信息来源和更新时间关联存储至该条信息在整合层的单元格,数据仓库包括原子层和整合层。
[0014]进一步地,根据用户标识或属性进行溯源,定位单元格,并获取单元格中的信息,具体包括:
[0015]根据用户标识或属性在数据仓库的整合层进行溯源,定位整合层的单元格,并获取单元格的信息;
[0016]或根据用户标识或属性在数据仓库的原子层进行溯源,定位原子层的单元格,并
获取单元格的信息。
[0017]进一步地,获取溯源请求之后,根据用户标识或属性进行溯源,定位单元格之前,该方法还包括:
[0018]根据溯源请求的查询粒度,确定在数据仓库中待溯源的层级;
[0019]根据用户标识或属性进行溯源,定位单元格,具体包括:
[0020]若待溯源的层级为整合层,则根据用户标识或属性在数据仓库的整合层进行溯源,定位整合层的单元格;
[0021]若待溯源的层级为原子层,则根据用户标识或属性在数据仓库的原子层进行溯源,定位原子层的单元格。
[0022]基于上述任意基于数据仓库的数据溯源方法实施例,进一步地,根据用户标识或属性进行溯源,定位单元格,并获取该单元格中的信息,具体包括:
[0023]根据用户标识进行溯源,获取与该用户标识所关联的信息;
[0024]根据属性和用户标识所关联的信息,定位单元格,并获取单元格中的信息;[0025]或根据属性进行溯源,获取该属性的信息;
[0026]根据用户标识和该属性的信息,定位单元格,并获取单元格中的信息。
[0027]进一步地,对每种属性的信息进行整合,获取整合信息,具体包括:
[0028]按照预先配置的整合规则,对每种属性的信息进行整合,获取整合信息。[0029]进一步地,获取单元格中的信息之后,该方法还包括:
[0030]检验单元格中的信息,获取检验结果;
[0031]根据检验结果,修正整合规则。
[0032]第二方面,本发明提供一种基于数据仓库的数据溯源装置,该装置包括请求获取模块和溯源模块,请求获取模块用于获取溯源请求,溯源请求包括待查询的用户标识和属性;溯源模块用于在预构建的数据仓库中,根据用户标识或属性进行溯源,定位单元格,并获取单元格中的信息,以及单元格所关联存储的信息来源和更新时间。
[0033]进一步地,本实施例基于数据仓库的数据溯源装置的数据仓库具体包括原子层和整合层,原子层用于对预获取的信息进行属性分析,获取每条信息的属性;按照信息的属性,将每条信息独立存储至原子层的单元格;将预获取的每条信息的信息来源和更新时间关联存储至该条信息在原子层的单元格;整合层用于对每种属性的信息进行整合,获取整合信息,并将整合信息存储至整合层的单元格;将整合信
息的信息来源和更新时间关联存储至该条信息在整合层的单元格。
[0034]进一步地,溯源模块根据用户标识或属性进行溯源,定位单元格,并获取单元格中的信息时,具体用于:根据用户标识或属性在数据仓库的整合层进行溯源,定位整合层的单元格,并获取单元格的信息;或根据用户标识或属性在数据仓库的原子层进行溯源,定位原子层的单元格,并获取单元格的信息。
[0035]由上述技术方案可知,本实施例提供的基于数据仓库的数据溯源方法及装置,在预先构建数据仓库的单元格中存储具体信息,关联存储该信息的信息来源和更新时间。在进行数据溯源时,根据待查询的用户标识和属性进行溯源,精准定位单元格,即可获取具体信息、信息来源和更新时间。
[0036]因此,本实施例基于数据仓库的数据溯源方法及装置,能够精确、快速地进行数据

本文发布于:2024-09-22 19:40:46,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/438582.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:溯源   信息   数据   进行   属性   数据仓库   获取
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议