知识库构建方法及装置[发明专利]

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201811384346.0
(22)申请日 2018.11.20
(71)申请人 北京松鼠山科技有限公司
地址 100020 北京市朝阳区利泽中园106号
楼(望京集中办公区359号)
(72)发明人 郑博 叶天生 梁栋 王宏志 
(74)专利代理机构 北京卓唐知识产权代理有限
公司 11541
代理人 唐海力 李志刚
(51)Int.Cl.
G06F  16/36(2019.01)
G06F  16/31(2019.01)
(54)发明名称知识库构建方法及装置(57)摘要本申请公开了一种知识库构建方法及装置。方法包括对所有待关联金融数据进行两两比对,以确定进行比对的待关联金融数据之间是否存在相关联的属性;将两两之间具有相关联属性的待关联金融数据进行关联,以得到关联金融数据;将关联金融数据写入知识库时,实时确定每个关联金融数据写入所述知识库的时间,以根据所述时间生成对应的时间属性;对加入所述知识库中的每个关联金融数据添加对应的所述时间属性;并得到数据更新后的知识库。从而可以确定各个待关联金融数据之间的相互关联性,从而便于对金融数据进行统计或归类。此外,还能在使关联金融数据存储进知识库之后彼此间能够
产生时间上的联系。权利要求书2页  说明书8页  附图3页CN 109614498 A 2019.04.12
C N  109614498
A
1.一种知识库构建方法,其特征在于,包括:
对所有待关联金融数据进行两两比对,以确定进行比对的待关联金融数据之间是否存在相关联的属性;其中,所述待关联金融数据包括两个或两个以上;
将两两之间具有相关联属性的待关联金融数据进行关联,以得到关联金融数据;
将关联金融数据写入知识库时,实时确定每个关联金融数据写入所述知识库的时间,以根据所述时间生成对应的时间属性;
对加入所述知识库中的每个关联金融数据添加对应的所述时间属性;并得到数据更新后的知识库。
2.根据权利要求1所述的知识库构建方法,其特征在于,所述对所有待关联金融数据进行两两比对,以确定进行比对的待关联金融数据之间是否存在相关联的属性,包括:预先设定用于判断进行比对的待关联金融数据之间是否相似的相似度阈值;
分别确定所述进行比对的待关联金融数据的属性的语义和语法;
根据所述进行比对的待关联金融数据的属性的语义和语法,确定所述进行比对的待关联金融数据之间的相似度;
当所述相似度大于或等于所述相似度阈值时,判定所述进行比对的待关联金融数据之间存在相关联的属性。
3.根据权利要求1所述的知识库构建方法,其特征在于,所述将两两之间具有相关联属性的待关联金融数据进行关联,以得到关联金融数据,包括:
利用度量学习得到的模型,对所述存在相关联的属性的待关联金融数据进行筛选;
将符合所述模型的要求的待关联金融数据确定为具有相同属性的待关联金融数据;
将具有相同属性的待关联金融数据进行关联,以得到关联金融数据。
4.根据权利要求1所述的知识库构建方法,其特征在于,还包括:
预先确定从知识库中匹配数据的匹配函数库;
在所述匹配函数库中添加时间匹配函数,用于根据时间属性匹配对应的数据;其中,所述时间匹配函数为当不同的数据中时间属性相同时才能产生相互联系的函数。
5.根据权利要求1所述的知识库构建方法,其特征在于,还包括:
接收对所述知识库中的关联金融数据的进行编辑的编辑指令;
根据所述编辑指令对所述关联金融数据的进行编辑,并更新所述关联金融数据的时间属性。
6.一种知识库构建装置,其特征在于,包括:
比对单元,用于对所有待关联金融数据进行两两比对,以确定进行比对的待关联金融数据之间是否存在相关联的属性;其中,所述待关联金融数据包括两个或两个以上;
关联单元,用于将两两之间具有相关联属性的待关联金融数据进行关联,以得到关联金融数据;
时间属性确定单元,用于将关联金融数据写入知识库时,实时确定每个关联金融数据写入知识库的时间,以根据所述时间生成对应的时间属性;
时间属性添加单元,用于对加入所述知识库中的每个关联金融数据添加对应的所述时间属性;并得到数据更新后的知识库。
7.根据权利要求6所述的知识库构建装置,其特征在于,所述比对单元,包括:
相似度阈值设定模块,用于预先设定用于判断进行比对的待关联金融数据之间是否相似的相似度阈值;
属性比对模块,用于分别确定所述进行比对的待关联金融数据的属性的语义和语法;
相似度确定模块,用于根据所述进行比对的待关联金融数据的属性的语义和语法,确定所述进行比对的待关联金融数据之间的相似度;
判定模块,用于当所述相似度大于或等于所述相似度阈值时,判定所述进行比对的待关联金融数据之间存在相关联的属性。
8.根据权利要求6所述的知识库构建装置,其特征在于,所述关联单元,包括:
筛选模块,用于利用度量学习得到的模型,对所述存在相关联的属性的待关联金融数据进行筛选;
相同属性确定模块,用于将符合所述模型的要求的待关联金融数据确定为具有相同属性的待关联金融数据;
关联金融数据获取模块,用于将具有相同属性的待关联金融数据进行关联,以得到关联金融数据。
9.根据权利要求6所述的知识库构建装置,其特征在于,还包括:匹配函数单元;所述匹配函数单元包括:
匹配函数库确定模块,用于预先确定从知识库中匹配数据的匹配函数库;
匹配函数添加模块,用于在所述匹配函数库中添加时间匹配函数,用于根据时间属性匹配对应的数据;其中,所述时间匹配函数为当不同的数据中时间属性相同时才能产生相互联系的函数。
10.根据权利要求6所述的知识库构建装置,其特征在于,还包括:编辑单元;所述编辑单元包括:
编辑指令接收模块,用于接收对所述知识库中的关联金融数据的进行编辑的编辑指令;
时间属性更新模块,用于根据所述编辑指令对所述关联金融数据的进行编辑,并更新所述关联金融数据的时间属性。
知识库构建方法及装置
技术领域
[0001]本申请涉及知识库数据处理技术领域,具体而言,涉及一种适用于金融数据的知识库构建方法及装置。
背景技术
[0002]随着金融数据模式的多样化,原本只基于文本金融数据的KBC(知识库构建)技术已经逐渐落后。
[0003]在金融领域中,需要对许多金融数据进行关联,以便对金融数据进行统计或归类,但是由于金融数据的来源不同,从而导致具有关联关系的金融数据的记录方式不同,例如,对于金融数据的名称,有些金融数据记录的是全称,有些金融数据记录的是简称,还有一些金融数据记录的是英文简写,从而导致金融数据不能进行有效关联,上述问题目前尚未提出有效的解决方法。
[0004]此外,金融数据在生成候选集的时候,候选关系的生成没有考虑时效性,有的候选关系可能随着时间的推移而不再存在,但是知识库中并没有更新。
[0005]针对相关技术中存在的问题,目前尚未提出有效的解决方案。
发明内容
[0006]本申请的主要目的在于提供一种将金融数据进行准确有效关联,且将其进行存储时有效考虑时效性的知识库构建方法及装置,以解决相关技术中存在的问题。
[0007]为了实现上述目的,根据本申请的一个方面,提供了一种知识库构建方法。[0008]根据本申请的知识库构建方法包括:
[0009]对所有待关联金融数据进行两两比对,以确定进行比对的待关联金融数据之间是否存在相关联的属性;其中,所述待关联金融数据包括两个或两个以上;
[0010]将两两之间具有相关联属性的待关联金融数据进行关联,以得到关联金融数据;[0011]将关联金融数据写入知识库时,实时确定每个关联金融数据写入所述知识库的时间,以根据所述时间生成对应的时间属性;
[0012]对加入所述知识库中的每个关联金融数据添加对应的所述时间属性;并得到数据更新后的知识库。
[0013]进一步的,如前述的知识库构建方法,所述对所有待关联金融数据进行两两比对,以确定进行比对的待关联金融数据之间是否存在相关联的属性,包括:
[0014]预先设定用于判断进行比对的待关联金融数据之间是否相似的相似度阈值;[0015]分别确定所述进行比对的待关联金融数据的属性的语义和语法;
[0016]根据所述进行比对的待关联金融数据的属性的语义和语法,确定所述进行比对的待关联金融数据之间的相似度;
[0017]当所述相似度大于或等于所述相似度阈值时,判定所述进行比对的待关联金融数据之间存在相关
联的属性。
[0018]进一步的,如前述的知识库构建方法,所述将两两之间具有相关联属性的待关联金融数据进行关联,以得到关联金融数据,包括:
[0019]利用度量学习得到的模型,对所述存在相关联的属性的待关联金融数据进行筛选;
[0020]将符合所述模型的要求的待关联金融数据确定为具有相同属性的待关联金融数据;
[0021]将具有相同属性的待关联金融数据进行关联,以得到关联金融数据。
[0022]进一步的,如前述的知识库构建方法,还包括:
[0023]预先确定从知识库中匹配数据的匹配函数库;
[0024]在所述匹配函数库中添加时间匹配函数,用于根据时间属性匹配对应的数据;其中,所述时间匹配函数为当不同的数据中时间属性相同时才能产生相互联系的函数。[0025]进一步的,如前述的知识库构建方法,还包括:
[0026]接收对所述知识库中的关联金融数据的进行编辑的编辑指令;
[0027]根据所述编辑指令对所述关联金融数据的进行编辑,并更新所述关联金融数据的时间属性。
[0028]为了实现上述目的,根据本申请的另一方面,提供了一种知识库构建装置。[0029]根据本申请的知识库构建装置包括:
[0030]比对单元,用于对所有待关联金融数据进行两两比对,以确定进行比对的待关联金融数据之间是否存在相关联的属性;其中,所述待关联金融数据包括两个或两个以上;[0031]关联单元,用于将两两之间具有相关联属性的待关联金融数据进行关联,以得到关联金融数据;
[0032]时间属性确定单元,用于将关联金融数据写入知识库时,实时确定每个关联金融数据写入知识库的时间,以根据所述时间生成对应的时间属性;
[0033]时间属性添加单元,用于对加入所述知识库中的每个关联金融数据添加对应的所述时间属性;并得到数据更新后的知识库。
[0034]进一步的,如前述的知识库构建装置,所述比对单元,包括:
[0035]相似度阈值设定模块,用于预先设定用于判断进行比对的待关联金融数据之间是否相似的相似度阈值;
[0036]属性比对模块,用于分别确定所述进行比对的待关联金融数据的属性的语义和语法;
[0037]相似度确定模块,用于根据所述进行比对的待关联金融数据的属性的语义和语法,确定所述进行比对的待关联金融数据之间的相似度;
[0038]判定模块,用于当所述相似度大于或等于所述相似度阈值时,判定所述进行比对的待关联金融数据之间存在相关联的属性。
[0039]进一步的,如前述的知识库构建装置,所述关联单元,包括:
[0040]筛选模块,用于利用度量学习得到的模型,对所述存在相关联的属性的待关联金融数据进行筛选;
[0041]相同属性确定模块,用于将符合所述模型的要求的待关联金融数据确定为具有相同属性的待关联金融数据;

本文发布于:2024-09-22 14:20:34,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/465442.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   金融   关联   知识库
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议