一种针对企业关联信息进行质量评估的计算方法与流程



1.本发明涉及企业信息评估技术领域,特别涉及一种针对企业关联信息进行质量评估的计算方法。


背景技术:



2.现在公司的注册量也都在急剧攀升,每天全国都有无数家新公司或者机构组织注册成立,同时随着公司业务范围的调整和扩大,为了更好地满足自身的企业发展,公司的法人不可避免地会在不同的地方注册多家相同或者不同类型的公司或者机构,来进行交易往来和业务合作,如何及时有效准确地反应企业与企业之间的关联关系,防范潜在的商业风险,对企业关联关系的评估就显得尤为重要;
3.目前企业之间的关联关系错综复杂,且数据量十分庞大,目前主要是依靠测试人员手工校验或者通过一些接口测试工具进行辅助,比如使用postman或者fiddler进行单一的数据匹配,但是,无论是通过手工校验还是测试工具校验,都只能对单个公司进行,且只能对关联公司一一进行校验,一旦遇到某个企业的关联信息有成百上千个的时候,便无法通过这种方法进行,准确性和时效性会很差,非常容易出现关联关系遗漏对的情况,无法大批量地对企业关联关系进行有效地数据验证。


技术实现要素:



4.本发明的目的在于提供一种针对企业关联信息进行质量评估的计算方法,以解决上述背景技术中提出的问题。
5.为实现上述目的,本发明提供如下技术方案:一种针对企业关联信息进行质量评估的计算方法,包括数据获取,获取具有关联关系的企业数据,并对所述企业数据进行检索,筛选生成所述对应公司的信息;将所述对应公司的信息分别传入所述新接口a和所述老接口b中,分别生成至少一条返回值信息,并对分别生成的所述返回值信息进行匹配,再通过公式对匹配后的返回值信息进行计算;其中,所述匹配操作包括对所述新接口a的返回值信息与所述老接口b的返回值信息进行比对,核查所述返回值信息是否具有所述关联的公司信息;其中,所述公式用于得到数据并对所述新接口a的质量进行评估。
6.优选的,在页面通过hive获取所述具有关联关系的企业数据,并记录;初始化页面,并通过sql语句将所述记录的企业数据进行检索筛选,生成所述对应公司的id、公司名称、统一社会信用代码和企业法人名词。
7.优选的,将所述对应公司的id、公司名称、统一社会信用代码和企业法人名词分别传入到所述新接口a和所述老接口b中,并分别生成至少一条返回值信息;其中,所述对应公司的id、公司名称、统一社会信用代码和企业法人名词分别进行参数化,并以组合的形式传入到新接口a和老接口b中;其中,所述新接口a和所述老接口b是以json格式展示的企业关联逻辑信息,所述企业关联逻辑信息包括与所述企业相关联的其他企业和机构组织和总的关联数;其中,所述新接口a和所述老接口b会分别生成所述企业的所有关联企业信息。
8.优选的,将所述新接口a和所述老接口b分别生成的所述返回值信息进行比对和匹配,并对所述具有关联的公司信息进行记录;其中,所述匹配结果包括:tp、fp、fn和tn,所述tp为匹配成功,所述fp、fn和tn为匹配失败。
9.优选的,所述tp为所述新接口a的返回值信息和所述老接口b的返回值信息均具有所述关联的公司信息,则记录所述新接口a和所述老接口b分别生成的具有关联的公司信息,并记为tp;所述fp为所述新接口a的返回值信息中具有所述关联的公司信息、所述老接口b的返回值信息中不具有所述关联的公司信息,则记录所述新接口a中生成的具有关联的公司信息,并记为fp;所述fn为所述新接口a的返回值信息中不具有所述关联的公司信息、所述老接口b的返回值信息中具有所述关联的公司信息,则记录所述老接口b中生成的具有关联的公司信息,并记为fn;所述tn为所述新接口a和所述老接口b的返回值信息均不具有所述关联的公司信息,则无信息被记录,并记为tn;其中所述tp、fp、fn和tn所包括的公司名称以列表形式存储,并将对应的tp、fp、fn和tn的数量以整数类型存储,并记为tp数、fp数、fn数和tn数。
10.优选的,所述公式包括公式c、公式d和公式e;所述公式c为“(tp数+tn数)/(tp数+tn数+fp数+fn数)”;所述公式d为“tp数/(tp数+fp数)”;所述公式e为“tp数/(tp数+fn数)”;
11.优选的,所述公式c用于计算所述对应公司的准确率;所述公式d用于计算所述对应公司的精确率;所述公式e用于计算所述对应公司的召回率。
12.本发明还提供了一种针对企业关联信息的质量评估装置,包括:检索模块,所述检索模块用于获取所述对应公司的id、公司名称、统一社会信用代码和企业法人名词;信息生成模块,所述信息生成模块包括新接口a和老接口b,所述新接口a和老接口b分别用于对检索模块得到的信息进行关联,从而得到具有关联公司信息的返回值信息;匹配模块,所述匹配模块用于对所述新接口a和老接口b生成的返回值信息进行比对匹配;存储模块,所述存储模块用于对返回值信息进行存储;计算模块,所述计算模块用于对匹配后的数据进行计算,得到所述对应公司的准确率、精确率和召回率;显示模块,所述显示模块用于对所有的数据进行可视化显示。
13.本发明还提供了一种电子处理设备,包括:处理器、存储器、显示器、通信接口和通信总线;其中,所述处理器、存储器、显示器和通信接口通过通信总线完成相互间的通信;其中,所述通信接口包括新接口a和老接口b,老接口b是相对比较稳定的接口且已经在实际运用中,但是由于老接口b本身存在一些缺陷问题,比如企业的关联匹配性较差,企业的数据信息不全等,所以需要重新开发和设计一套新接口a用来替代老接口b,为了准确评估正在设计开发的新接口a的算法逻辑模型质量,提高新接口a的企业关联逻辑的算法匹配度,我们默认将老接口b作为新接口a质量的参照标准进行比对;其中,所述处理器用于实现针对企业关联信息进行质量评估的计算方法。
14.优选的,所述存储器用于存放计算机程序,所述处理器用于运行所述存储器内所存放的计算机程序,所述显示器用于将所述对应公司计算后的准确率、精确率和召回率通过图表的方式进行展示。
15.本发明的技术效果和优点:
16.本发明利用老接口b作为新接口a的参照标准,并通过新接口a和老接口b的返回值信息进行对比,并记录对比信息,最后通过公式计算出新接口a数据质量的准确率、精确率
和召回率,从而去评估新接口a的质量并不断进行修正。
附图说明
17.图1为本发明质量评估装置结构示意图。
18.图2为本发明电子处理设备结构示意图。
19.图3为本发明计算方法步骤示意图。
20.图4为本发明计算方法流程示意图。
具体实施方式
21.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
22.本发明提供了如图1-4所示的一种针对企业关联信息进行质量评估的计算方法,包括数据获取,获取具有关联关系的企业数据,并对企业数据进行检索,筛选生成对应公司的信息;
23.将对应公司的信息分别传入新接口a和老接口b中,分别生成至少一条返回值信息,并对分别生成的返回值信息进行匹配,需先提取该公司的关联企业或者机构信息名称,新接口a记为name字段,老接口b记为entname字段,并各自分别组成一个新的列表,然后再去遍历列表的每一个值进行关联匹配,再通过公式对匹配后的返回值信息进行计算;
24.匹配操作包括对新接口a的返回值信息与老接口b的返回值信息进行比对,核查返回值信息是否具有关联的公司信息;
25.公式用于得到数据并对新接口a的质量进行评估;
26.在页面通过hive获取具有关联关系的企业数据,并记录,hive是基于hadoop的一个数据仓库工具,可以将结构化的数据文件影射为一张数据库表,用来进行数据提取、转化、加载,并提供类sql查询功能;
27.初始化页面,并通过sql语句将记录的企业数据进行检索筛选,生成对应公司的id、公司名称、统一社会信用代码和企业法人名词;
28.将对应公司的id、公司名称、统一社会信用代码和企业法人名词分别传入到新接口a和老接口b中,并分别生成至少一条返回值信息;
29.将新接口a和老接口b分别生成的返回值信息进行比对和匹配,并对具有关联的公司信息进行记录;
30.对应公司的id、公司名称、统一社会信用代码和企业法人名词分别进行参数化,并以组合的形式传入到新接口a和老接口b中;
31.新接口a和老接口b是以json格式展示的企业关联逻辑信息,企业关联逻辑信息包括与企业相关联的其他企业和机构组织和总的关联数;
32.新接口a和老接口b会分别生成企业的所有关联企业信息;
33.匹配结果包括:tp、fp、fn和tn,tp为匹配成功,fp、fn和tn为匹配失败;
34.tp为新接口a的返回值信息和老接口b的返回值信息均具有关联的公司信息,则记
录新接口a和老接口b分别生成的具有关联的公司信息,并记为tp,说明一种企业关联关系匹配正确,对应的关联关系建立成功,标记为tp,数据库中写入tp值,tp数量加1,fp为新接口a的返回值信息中具有关联的公司信息、老接口b的返回值信息中不具有关联的公司信息,则记录新接口a中生成的具有关联的公司信息,并记为fp,说明一种企业关系匹配错误,对应的关联关系建立失败,标记为fp,数据库中写入fp值,fp数量加1,fn为新接口a的返回值信息中不具有关联的公司信息、老接口b的返回值信息中具有关联的公司信息,则记录老接口b中生成的具有关联的公司信息,并记为fn,说明一种企业关系匹配错误,对应的关联关系建立失败,标记为fn,数据库中写入fn值,fn数量加1,tn为新接口a和老接口b的返回值信息均不具有关联的公司信息,则无信息被记录,并记为tn,说明一种企业关系匹配错误,对应的关联关系建立失败,标记为tn,数据库中写入tn值,tn数量加1,其中tp、fp、fn和tn所包括的公司名称以列表形式存储,并将对应的tp、fp、fn和tn的数量以整数类型存储,并记为tp数、fp数、fn数和tn数;
35.针对同一家公司的关联关系,当新接口a和老接口b的公司值相同,记为tp,剔除掉tp后,如果新接口a有关联的公司信息,而老接口b没有,记为fp;剔除掉tp后,如果新接口a没有关联的公司信息,而老接口b有,记为fn;剔除掉tp后,如果新接口a和老接口b都没有关联的公司信息,记为tn;公式包括公式c、公式d和公式e,公式c为“(tp数+tn数)/(tp数+tn数+fp数+fn数)”,公式d为“tp数/(tp数+fp数)”,公式e为“tp数/(tp数+fn数)”,公式c用于计算对应公司的准确率,公式d用于计算对应公司的精确率,公式e用于计算对应公司的召回率,通过计算后的准确率、精确率和召回率去评估新接口a的整体质量,从而对新接口a的算法逻辑模型进行动态调整;
36.本发明还提供了一种针对企业关联信息的质量评估装置,包括:检索模块,检索模块用于获取对应公司的id、公司名称、统一社会信用代码和企业法人名词;信息生成模块,信息生成模块包括新接口a和老接口b,新接口a和老接口b分别用于对检索模块得到的信息进行关联,从而得到具有关联公司信息的返回值信息;匹配模块,匹配模块用于对新接口a和老接口b生成的返回值信息进行比对匹配;存储模块,存储模块用于对返回值信息进行存储;计算模块,计算模块用于对匹配后的数据进行计算,得到对应公司的准确率、精确率和召回率,其中准确率指的是信息的准确与否,精确率指的是的信息的偏差程度,召回率制得是的信息是否全面,从而去评估新接口a的整体质量,即可对新接口a的算法逻辑模型进行动态调整,并不断进行修正;显示模块,所述显示模块用于对所有的数据进行可视化显示。
37.本发明还提供了一种电子处理设备,包括:处理器、存储器、显示器、通信接口和通信总线;其中,处理器、存储器、显示器和通信接口通过通信总线完成相互间的通信;其中,通信接口包括新接口a和老接口b,处理器用于实现针对企业关联信息进行质量评估的计算方法。
38.存储器用于存放计算机程序,处理器用于运行存储器内所存放的计算机程序,显示器用于将对应公司计算后的准确率、精确率和召回率通过图表的方式进行展示。
39.最后应说明的是:以上仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在
本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术特征:


1.一种针对企业关联信息进行质量评估的计算方法,其特征在于,包括:数据获取,获取具有关联关系的企业数据,并对所述企业数据进行检索,筛选生成所述对应公司的信息;将所述对应公司的信息分别传入所述新接口a和所述老接口b中,分别生成至少一条返回值信息,并对分别生成的所述返回值信息进行匹配,再通过公式对匹配后的返回值信息进行计算;其中,所述匹配操作包括对所述新接口a的返回值信息与所述老接口b的返回值信息进行比对,核查所述返回值信息是否具有所述关联的公司信息;其中,所述公式用于得到数据并对所述新接口a的质量进行评估。2.根据权利要求1所述的一种针对企业关联信息进行质量评估的计算方法,其特征在于,具体包括:在页面通过hive获取所述具有关联关系的企业数据,并记录;初始化页面,并通过sql语句将所述记录的企业数据进行检索筛选,生成所述对应公司的id、公司名称、统一社会信用代码和企业法人名词。3.根据权利要求2所述的一种针对企业关联信息进行质量评估的计算方法,其特征在于,具体包括:将所述对应公司的id、公司名称、统一社会信用代码和企业法人名词分别传入到所述新接口a和所述老接口b中,并分别生成至少一条返回值信息;其中,所述对应公司的id、公司名称、统一社会信用代码和企业法人名词分别进行参数化,并以组合的形式传入到新接口a和老接口b中;其中,所述新接口a和所述老接口b是以json格式展示的企业关联逻辑信息,所述企业关联逻辑信息包括与所述企业相关联的其他企业和机构组织和总的关联数;其中,所述新接口a和所述老接口b会分别生成所述企业的所有关联企业信息。4.根据权利要求1所述的一种针对企业关联信息进行质量评估的计算方法,其特征在于,具体包括:将所述新接口a和所述老接口b分别生成的所述返回值信息进行比对和匹配,并对所述具有关联的公司信息进行记录;其中,所述匹配结果包括:tp、fp、fn和tn,所述tp为匹配成功,所述fp、fn和tn为匹配失败。5.根据权利要求4所述的一种针对企业关联信息进行质量评估的计算方法,其特征在于,所述tp为所述新接口a的返回值信息和所述老接口b的返回值信息均具有所述关联的公司信息,则记录所述新接口a和所述老接口b分别生成的具有关联的公司信息,并记为tp;所述fp为所述新接口a的返回值信息中具有所述关联的公司信息、所述老接口b的返回值信息中不具有所述关联的公司信息,则记录所述新接口a中生成的具有关联的公司信息,并记为fp;所述fn为所述新接口a的返回值信息中不具有所述关联的公司信息、所述老接口b的返回值信息中具有所述关联的公司信息,则记录所述老接口b中生成的具有关联的公司信息,并记为fn;所述tn为所述新接口a和所述老接口b的返回值信息均不具有所述关联的公司信息,则
无信息被记录,并记为tn;其中所述tp、fp、fn和tn所包括的公司名称以列表形式存储,并将对应的tp、fp、fn和tn的数量以整数类型存储,并记为tp数、fp数、fn数和tn数。6.根据权利要求1所述的一种针对企业关联信息进行质量评估的计算方法,其特征在于,所述公式包括公式c、公式d和公式e;所述公式c为“(tp数+tn数)/(tp数+tn数+fp数+fn数)”;所述公式d为“tp数/(tp数+fp数)”;所述公式e为“tp数/(tp数+fn数)”。7.根据权利要求6所述的一种针对企业关联信息进行质量评估的计算方法,其特征在于,所述公式c用于计算所述对应公司的准确率;所述公式d用于计算所述对应公司的精确率;所述公式e用于计算所述对应公司的召回率。8.一种针对企业关联信息的质量评估装置,其特征在于,包括:检索模块,所述检索模块用于获取所述对应公司的id、公司名称、统一社会信用代码和企业法人名词;信息生成模块,所述信息生成模块包括新接口a和老接口b,所述新接口a和老接口b分别用于对检索模块得到的信息进行关联,从而得到具有关联公司信息的返回值信息;匹配模块,所述匹配模块用于对所述新接口a和老接口b生成的返回值信息进行比对匹配;存储模块,所述存储模块用于对返回值信息进行存储;计算模块,所述计算模块用于对匹配后的数据进行计算,得到所述对应公司的准确率、精确率和召回率;显示模块,所述显示模块用于对所有的数据进行可视化显示。9.一种电子处理设备,其特征在于,包括:处理器、存储器、显示器、通信接口和通信总线;其中,所述处理器、存储器、显示器和通信接口通过通信总线完成相互间的通信;其中,所述通信接口包括新接口a和老接口b;其中,所述处理器用于实现权利要求1-7任意一项所描述的针对企业关联信息进行质量评估的计算方法。10.根据权利要求9所述的一种电子处理设备,其特征在于,所述存储器用于存放计算机程序,所述处理器用于运行所述存储器内所存放的计算机程序,所述显示器用于将所述对应公司计算后的准确率、精确率和召回率通过图表的方式进行展示。

技术总结


本发明公开了一种针对企业关联信息进行质量评估的计算方法,包括数据获取,获取具有关联关系的企业数据,并对企业数据进行检索,筛选生成对应公司的信息;将对应公司的信息分别传入新接口A和老接口B中,分别生成至少一条返回值信息,并对分别生成的返回值信息进行匹配,再通过公式对匹配后的返回值信息进行计算。本发明利用老接口B作为新接口A的参照标准,并通过新接口A和老接口B的返回值信息进行对比,并记录对比信息,最后通过公式计算出新接口A数据质量的准确率、精确率和召回率,从而去评估新接口A的质量并不断进行修正。去评估新接口A的质量并不断进行修正。去评估新接口A的质量并不断进行修正。


技术研发人员:

林斌 胡永荣 徐士钊

受保护的技术使用者:

上海年云信息技术有限公司

技术研发日:

2022.10.10

技术公布日:

2022/12/23

本文发布于:2024-09-20 08:43:23,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/47836.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   接口   信息   公司
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议