知识图谱构建、串标识别方法、装置、设备和介质与流程



1.本技术涉及数据挖掘分析技术领域,特别是涉及知识图谱构建、串标识别方法、装置、设备和介质。


背景技术:



2.串标也称为串通投标,通常是指招标投标行业中几个投标人之间相互约定,一致抬高或压低投标报价进行投标,通过限制竞争排挤其他投标人,使某个利益相关者中标,从而谋取利益的手段和行为。串标不仅扰乱了市场秩序,逃避了主管部门的监管,还直接伤害了其他投标人的合法权益。因此需要对串标行为进行鉴别。
3.目前,招投标领域的围串标行为识别主要由人工审计的方式实现。然而由于围串标行为极其隐蔽,与围串标行为相关的数据规范庞大,人工审计需要消耗大量的时间和人力进行数据分析,效率低下,难以满足招投标的实时性需求。此外,随着公司规模和各业务需求量的持续增长,每年面临的招标任务不断上升,招标公司数量也逐渐增多,大量的信息和数据给招标工作带来更大的压力。不同审计人员对于如何从中挖掘衡量投标者之间的关系具有不同的判断标准,导致人工审计所得的串标行为识别结果并不准确。
4.因此,如何准确高效识别投标过程中的串标行为,是本领域亟待解决的技术问题。


技术实现要素:



5.基于上述问题,本技术提供了知识图谱构建、串标识别方法、装置、设备和介质,以实现准确高效识别投标过程中的串标行为。
6.本技术公开的第一方面,提供了一种知识图谱构建方法,包括:
7.采集各投标公司和关联公司的相关数据,所述关联公司为与所述投标公司存在资金关系且未参与投标的公司;
8.处理采集到的各公司的相关数据,生成存储于公司信息表、人员信息表和关联关系信息表的构建数据,所述构建数据为处理得到的适用于构建知识图谱的数据,所述公司信息表用于存储投标公司和关联公司的公司名称和信息,所述人员信息表用于存储各公司的人员信息,所述关联关系信息表用于存储各个公司间的关联关系,及各个公司与人员信息间的关联关系;
9.根据所述构建数据生成若干个节点和若干个边,所述节点包括用于表示公司名称、公司人员信息和信息的节点,所述边用于表示各个节点之间的关联属性或关系;
10.连接所有存在边的关联属性或关系的节点,得到招投标知识图谱。
11.可选的,所述根据所述构建数据生成若干个节点和若干个边,包括:
12.根据所述公司信息表中的构建数据生成投标公司的公司节点和节点、关联公司的公司节点和节点,根据所述人员信息表中的构建数据生成人员节点和人员信息节点,根据所述关联关系信息表中的构建数据生成各个节点之间的边。
13.本技术公开的第二方面,提供了一种串标识别方法,包括:
14.获取查询目标,所述查询目标为查询串标行为指令指示的一个或多个投标公司;
15.根据所述查询目标和招投标知识图谱,生成识别结果,所述识别结果用于表征所述查询目标是否存在串标行为,其中,所述招投标知识图谱基于前述第一方面中任一项所述的知识图谱构建方法得到的。
16.可选的,响应于所述查询目标为单个投标公司,所述根据所述查询目标和招投标知识图谱,生成识别结果,包括:
17.基于所述招投标知识图谱,查询单个投标公司的公司节点预设层数内的关联节点;
18.响应于查询到的关联节点中包含其他投标公司,确定识别结果为疑似串标。
19.可选的,响应于所述查询目标为多个投标公司,所述根据所述查询目标和招投标知识图谱,生成识别结果,包括:
20.基于所述招投标知识图谱查询所述多个投标公司各自对应的关联节点,所述关联节点包括所述多个投标公司的公司节点各自对应的人员节点、人员信息节点、节点;
21.匹配各个投标公司的关联节点中的人员信息或地址信息,计算得到相似度;
22.响应于所述相似度大于或等于预设阈值,确定识别结果为疑似串标。
23.可选的,响应于所述查询目标为多个投标公司,所述根据所述查询目标和招投标知识图谱,生成识别结果,包括:
24.基于所述招投标知识图谱,查询所述多个投标公司的公司节点间的边;
25.响应于各个投标公司的公司节点间存在预设边连接,生成识别结果为疑似串标。
26.可选的,响应于所述查询目标为多个投标公司,所述根据所述查询目标和招投标知识图谱,生成识别结果,包括:
27.基于所述招投标知识图谱查询所述多个投标公司各自对应的关联节点,所述关联节点包括与所述多个投标公司关联的公司节点,以及各个公司节点的人员节点、人员信息节点、节点;
28.响应于各个投标公司的公司节点在预设层数内存在共同父节点、各个投标公司的公司节点在预设层数内存在共同根节点或各个投标公司的公司节点在预设层数内与关联节点存在相同的预设边连接,生成识别结果为疑似串标。
29.本技术公开的第三方面,提供了一种知识图谱构建装置,包括:
30.相关数据采集模块,用于采集各投标公司和关联公司的相关数据,所述关联公司为与所述投标公司存在资金关系且未参与投标的公司;
31.构建数据生成模块,用于处理采集到的各公司的相关数据,生成存储于公司信息表、人员信息表和关联关系信息表的构建数据,所述构建数据为处理得到的适用于构建知识图谱的数据,所述公司信息表用于存储投标公司和关联公司的公司名称和信息,所述人员信息表用于存储各公司的人员信息,所述关联关系信息表用于存储各个公司间的关联关系,及各个公司与人员信息间的关联关系;
32.边和节点生成模块,用于根据所述构建数据生成若干个节点和若干个边,所述节点包括用于表示公司名称、公司人员信息和信息的节点,所述边用于表示各个节
点之间的关联属性或关系;
33.招投标知识图谱生成模块,用于连接所有存在边的关联属性或关系的节点,得到招投标知识图谱。
34.本技术公开的第四方面,提供了一种串标识别装置,包括:
35.查询目标获取模块,用于获取查询目标,所述查询目标为查询串标行为指令指示的一个或多个投标公司;
36.识别结果生成模块,用于根据所述查询目标和招投标知识图谱,生成识别结果,所述识别结果用于表征所述查询目标是否存在串标行为,其中,所述招投标知识图谱基于前述第一方面中任一项所述的知识图谱构建方法得到的。
37.本技术公开的第五方面,提供了一种电子设备,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现前述第一方面中任意一项所述的知识图谱构建方法,和/或前述第二方面提供的任意一种串标识别方法。
38.本技术公开的第六方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行实现前述第一方面中任意一项所述的知识图谱构建方法,和/或前述第二方面提供的任意一种串标识别方法。
39.相较于现有技术,本技术具有以下有益效果:
40.本技术公开了知识图谱构建、串标识别方法、装置、设备和介质,通过采集各投标公司和关联公司的相关数据,处理采集到的各公司的相关数据,生成存储于公司信息表、人员信息表和关联关系信息表的构建数据,根据所述构建数据生成若干个节点和若干个边,连接所有存在边的关联属性或关系的节点,得到招投标知识图谱。获取查询目标,根据所述查询目标和招投标知识图谱,生成识别结果。通过知识图谱技术只需要获取查询目标公司,输入要查询的一个或多个投标公司,就可以实现了单个投标公司分析或多投标公司关联关系自动挖掘,根据挖掘出的关联数据判断投标公司是否存在串标行为。该方法提高了串标行为识别效率。通过知识图谱技术只需要获取查询目标公司,输入要查询的一个或多个投标公司,就可以实现了单个投标公司分析或多投标公司关联关系自动挖掘,根据挖掘出的关联数据判断投标公司是否存在串标行为。该方法提高了串标行为识别效率。
附图说明
41.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
42.图1为本技术实施例所提供的知识图谱构建方法示意图;
43.图2为本技术实施例所提供的一种串标识别方法流程图;
44.图3为本技术实施例所提供的企业连接关系示意图;
45.图4为本技术实施例所提供的企业连接关系示意图;
46.图5为本技术实施例所提供的企业连接关系示意图;
47.图6为本技术实施例所提供的企业连接关系示意图;
48.图7为本技术实施例所提供的一种知识图谱构建装置的结构示意图;
49.图8为本技术实施例所提供的一种串标识别装置的结构示意图。
具体实施方式
50.正如前文描述,目前如何提高重算额度的效率,成为本领域技术人员亟待解决的技术问题。
51.发明人经过研究发现,现有技术中随着公司规模和各业务需求量的持续增长,每年面临的招标任务不断上升,给招标工作带来更大的压力。目前的风险判别方法是招标部门通过使用“企查查”api数据接口和vip会员投入大量人工搜索投标公司的相关信息,人工挖掘投标公司之间的关系加以判断。这种方式存在查询效率慢,无法做到多维度评判,无法深层次挖掘潜在信息的问题。所以对投标公司之间串标、围标的行为无法得到有效的数据支撑。投标公司和投标公司之间以及人员与投标公司之间的控股、投资、任职等关系错综复杂,如果只是分别查询单个投标公司,无法更准确的分析出之间的关联关系。根据构建的知识图谱判断是否存在串标行为的可能性。串标的行为分为以下3种形式:邀请其他陪标的单位同时投标,增大自己的中标几率;几家单位联合,轮流坐庄排挤其他投标单位;同一个人同时挂靠若干家单位参加投标。
52.本技术实施例提供的方法由检测系统执行,例如可以由检测服务器执行。所述检测服务器可以是一台服务器设备,也可以是由多台服务器组成的服务器集。
53.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
54.下面对本技术实施例提供的知识图谱构建方法进行详细介绍。参见图1,该图1为本技术实施例提供的知识图谱构建方法示意图,该方法流程的执行主体可以为由检测系统,包括:
55.步骤101:采集各投标公司和关联公司的相关数据。
56.其中,所述关联公司为与所述投标公司存在资金关系且未参与投标的公司。可以通过爬虫采集所有注册的投标公司的相关数据,存储在mongodb数据中;投标公司和关联公司的相关信息可以包括企业工商信息、企业法人、投资关系、控股关系、主要人员任职关系、担保关系、客户关系、供应商关系、关联方关系。
57.步骤102:处理采集到的各公司的相关数据,生成存储于公司信息表、人员信息表和关联关系信息表的构建数据。
58.其中,所述构建数据为处理得到的适用于构建知识图谱的数据。对所有采集到的注册投标公司数据进行预处理,处理成为适用于构建知识图谱的数据类型。在完成采集后,系统建立三张mysql表,存储预处理的数据;mysql三张表分别为company_node表、holder_people_node表、relation表。其中,company_node表:存储投标公司信息、关联公司信息(存在资金关系但并未参加本次投标的公司,例如投标公司的投资公司、控股公司等);holder_people_node表用于存储各个公司的股东信息、以及公司主要人员信息;relation表用于存储各个公司之间的关联关系、各人员信息与各个公司间的对应关系等关联关系信息。
59.步骤103:根据所述构建数据生成若干个节点和若干个边。
60.其中,所述节点包括用于表示公司名称、公司人员信息和信息的节点,所述边用于表示各个节点之间的关联属性或关系。各个公司间的之间的边代表关系,例如公司a与公司b之间存在边的关系可以为控股关系、投资关系、担保关系、客户关系和供应商关系等。关联属性用于表示各个公司节点与人员节点之间连接的边,或人员节点与人员信息节点之间连接的边,关联属性可以为从人员节点指向投标公司节点的任职属性、人员信息节点指向人员节点的身份信息和,如在知识图谱中法人a与a的邮箱账号、电话号码、年龄性别之间的连接关系为关联属性。
61.其中,边的属性可根据应用需要进行设定:控股边:holding。控股边从人员节点指向投标公司节点或投标公司节点/其他公司节点指向投标公司节点/关联公司节点。任职边:job。任职边从人员节点指向投标公司节点。投资边:invest。投资边从投标公司节点指向投标公司节点/关联公司节点。担保边:guarantee。担保边从投标公司节点指向投标公司节点/关联公司节点。客户边:client。客户边从投标公司节点指向投标公司节点/关联公司节点。供应商边:supplier。供应商边从投标公司节点指向投标公司节点/关联公司节点。关联方边:related_party。关联方边从投标公司节点指向投标公司节点/关联公司节点。
62.即根据已处理过的投标公司的相关信息,分析关联关系,设计知识图谱框架schema,构建知识图谱。其中,一个知识图谱的纲要schema就是相当于一个领域内的数据模型,包含了这个领域里面有意义的概念类型以及这些类型的属性。任何一个域的schema主要由类型(type)和属性(property)来表达。
63.在一些可能实现的方式中,所述根据所述构建数据生成若干个节点和若干个边,包括以下几个生成部分,需要说明的是以下第一部分与第二部分之间不存在先后顺序上的限制:
64.第一部分,根据所述公司信息表中的构建数据生成投标公司的公司节点和节点、关联公司的公司节点和节点。
65.根据构建数据直接生成投标公司的公司节点,分别提取公司信息表中的公司名称生成公司节点,提取公司信息表中的生成各个公司的专属节点。其中,构建数据包括存储于公司信息表、人员信息表和关联关系信息表的,适用于构建知识图谱的数据。例如当前投标公司包括公司a,公司b,公司c,公司d。分别生成上述四个公司的公司节点,公司a节点,公司b节点,公司c节点,公司d节点,以及各个公司对应的注册地址节点,公司a地址节点,公司b地址节点,公司c地址节点,公司d地址节点。关联公司为与公司a、b、c、d其中任意一个具有资金关系的公司,同理生成各自对应的关联公司的公司节点和节点。
66.第二部分,根据所述人员信息表中的构建数据生成人员节点和人员信息节点。
67.分别提取人员信息表中的人员名称形成人员节点,提取人员相关信息生成人员信息节点,其中人员相关信息可以为邮箱、电话号码、年龄、性别等固有属性信息。例如,提取到当前人员名称为李明,相应得提取人员信息表中李明相关的信息,生成人员信息节点,人员信息节点可以包括李明的邮箱节点,李明的电话号码节点,李明的性别年龄节点。
68.第三部分,根据所述关联关系信息表中的构建数据生成各个节点之间的边。
69.上述步骤中已经生成了若干个公司节点、节点、人员节点和人员信息节
点。获取各个节点之间的关联属性或关系,生成连接边。例如,根据关联关系表确定李明任职于公司a,生成任职边。在实际应用过程中,可以对任职边细化区分,例如可以将任职边细化为控股股东、实际控制人、董事、监事、高级管理人员等,例如生成李明节点(人员节点)指向公司a节点(投标公司节点)的控股股东边。同理,根据查询关联关系表确定投标公司a为公司b的供应商,生成公司a节点(投标公司节点)指向公司b(关联公司节点或投标公司节点)节点的供应商边。同理,其他关联属性和关系也可以生成相应的连接边。在实际应用过程中,后续采集到新的数据,可以根据新数据更新各个信息表,再根据新数据重新建立节点和边。
70.步骤104:连接所有存在边的关联属性或关系的节点,得到招投标知识图谱。
71.根据上述步骤中获取到的若干个节点和若干条边,上述第二部分生成的各个边即代表各个节点之间的连接关系。将具有连接关系的节点根据边连接,形成招投标知识图谱。
72.本是实例公开了知识图谱构建方法,通过采集各投标公司和关联公司的相关数据,处理采集到的各公司的相关数据,生成存储于公司信息表、人员信息表和关联关系信息表的构建数据,根据所述构建数据生成若干个节点和若干个边,连接所有存在边的关联属性或关系的节点,得到招投标知识图谱。通过知识图谱技术只需要获取查询目标公司,输入要查询的一个或多个投标公司,就可以实现了单个投标公司分析或多投标公司关联关系自动挖掘,根据挖掘出的关联数据判断投标公司是否存在串标行为。
73.本技术实施例提供了一种串标识别方法,包括步骤201~步骤202。本技术实施例提供的方法由检测系统执行,参见图2,图2为本技术实施例所提供的一种串标识别方法流程图。
74.步骤201:获取查询目标。
75.所述查询目标为本次串标查询过程中的目标公司,在一些可以实现的实施方式中,目标公司可以为一个或者多个公司。
76.步骤202:根据所述查询目标和招投标知识图谱,生成识别结果。
77.所述招投标知识图谱是基于若干个投标公司的相关数据构建的。其中相关数据可以包括信息、公司名称、公司主要任职人员名称以及各个任职人员的个人信息。其中,主要任职人员可以包括各个公司的控股股东、实际控制人、董事、监事、高级管理人员等。信息可以包括公司注册地址、公司总部地址和公司分部地址。公司名称可以包括公司曾用名、现用名全称和现用名缩写。任职人员个人信息可以包括等。所述识别结果用于表征所述查询目标是否存在串标行为。知识图谱是一种基于图的数据结构,由节点(point)和边(edge)组成,每个节点表示一个“实体”,每条边为实体与实体之间的“关系”,知识图谱本质上是语义网络。实体指的可以是现实世界中的事物,比如人、公司等;关系则用来表达不同实体之间的某种联系。
78.获取查询目标指示的目标查询公司,其中目标查询公司的体现形式可以为公司名称、公司代号或公司编号。将目标查询公司输入招投标知识图谱,生成本次串标行为识别的识别结果,即是否疑似串标。
79.在一种可能的实现方式中,根据所述查询目标和所述查询目标在招投标知识图谱中的关联节点,生成识别结果包括如下几种实现方式:
80.第一种识别方法,为查询目标为单个投标公司的情况下,识别步骤包括a1-a2:
81.a1:基于所述招投标知识图谱,查询单个投标公司节点预设层数内的关联节点。
82.即针对单个投标公司,到当前单个投标公司的节点,查出该投标公司节点对应的预设层数内的关联节点。其中,预设层数为根据实际需求设置,例如预设层数为1时,则获取该投标公司节点对应的所有上一层或下一层关联节点,实现对单个投标公司节点的分析。
83.a2:响应于查询到的关联节点中包含其他投标公司,生成识别结果为疑似串标。
84.如果上述获取到的关联节点中包含此次投标的其他公司,则判定这两个节点对应的公司可能存在串标的行为,生成判定结果为疑似串标。其中其他投标公司为其他参与本次投标的公司,例如本次投标中公司a、公司b、公司c、公司e参与投标,针对公司a对知识图谱进行查询,此时公司a为查询目标,公司b、公司c、公司e为其他公司,当公司a与这三个其他公司有直接的连接边关系,则生成判定结果疑似串标。
85.如图3所示,某企业1382与某企业126存在投资关系,即可能存在串标的行为。图3为本技术实施例提供的企业连接关系示意图。
86.第二种识别方法为查询目标为多个投标公司的情况下,识别步骤包括步骤b1-b3:
87.b1:基于所述招投标知识图谱查询所述多个投标公司各自对应的关联节点。
88.所述关联节点包括所述多个投标公司的公司节点各自对应的人员节点、人员信息节点、节点。系统获取输入的多个投标公司,获取各个投标公司节点对应的关联节点,例如多个投标公司中包括a,b,c,d,根据招投标知识图谱确定每个投标公司的关联节点,例如公司a的关联节点为公司b和公司d,公司c的关联节点为公司d。而后获取上述四个公司各自对应的人员节点、人员信息节点和节点。
89.b2:匹配各个投标公司的关联节点中的人员信息或地址信息,计算得到相似度。
90.根据上述步骤中获得各个公司节点以及个公司节点对应的信息节点,分别匹配各个投标公司节点与各个关联节点的法人信息或地址信息。例如将公司a的法人信息分别与公司b的法人信息以及公司d的法人信息两两之间进行匹配计算,确定相似度。
91.其中,法人信息可以为法人、法人的邮箱、法人的电话号码。地址信息可以指公司的注册地址。
92.b3:响应于所述相似度大于或等于预设阈值,确定识别结果为疑似串标。
93.在识别过程中,系统获取上述步骤中生成的相似度以及预设阈值,此处的预设阈值可以根据实际需求由系统管理员进行设置,可进行适应性调整,在此不做限制。例如,某几个投标公司节点中的法人、邮箱、电话三类工商信息中一类或多类相同,关于此处的几类的体现方式为相似度,例如当法人信息有上述三类时,则可以设定相似度为33%,即当各个投标公司之间存在上述法人信息有一类相同时,则判定这某几个公司可能存在串标的行为。针对地址信息,也可以设置相似度阈值为80%,存在某几个投标公司节点中的这类工商信息相似度不小于80%时,则判定这某几个公司可能存在串标的行为。
94.第三种识别方法为查询目标为多个投标公司的情况下,识别步骤包括步骤c1-c2:
95.c1:基于所述招投标知识图谱,查询多个投标公司节点的关联节点。
96.c2:响应于各个投标公司节点间存在预设边连接、在预设层数内存在共同父节点或在预设层数内存在共同根节点,生成识别结果为疑似串标。
97.其中预设边可以为一种或多种知识图谱中各个节点之间的关系边,例如可以是指
预设边为控股边。在后续过程中根据各个节点间的控股边连接关系判断是否存在串标情况。
98.针对多个投标公司节点,存在某几个投标公司节点之间存在直接的控股边、任职边、投资边、担保边、客户边、供应商边、关联方边中的一条或多条,则判定这某几个公司可能存在串标的行为。图4为本技术实施例提供的企业连接关系示意图,如图4某企业1496与某企业1271、某企业1443都存在投资关系,即可能存在串标的行为。
99.第四种识别方法为查询目标为多个投标公司的情况下,识别步骤包括步骤d1-d2:
100.d1:基于所述招投标知识图谱查询所述多个投标公司各自对应的关联节点。
101.所述关联节点包括所述多个投标公司的公司节点和投标公司的关联公司,以及上述各个公司各自对应的人员节点、人员信息节点、节点。
102.d2:响应于各个投标公司的公司节点在预设层数内存在共同父节点、各个投标公司的公司节点在预设层数内存在共同根节点或各个投标公司的公司节点在预设层数内与关联节点存在相同的预设边连接,生成识别结果为疑似串标。
103.在知识图谱中,在当前节点的上层已经没有其他的节点,这个节点叫做根节点;父节点是指在当前节点的上层节点,上层的节点就叫下层节点的父节点。响应于公司a与公司b在预设层数内具有共同的父节点或根节点,则判定当前投标存在疑似串标行为。如图5,图5为本技术实施例提供的企业连接关系示意图,图中企业1496为企业1271和企业1443的根节点,企业1271和企业1443在预设3层范围内存在共同的根节点,判定存在串标行为。
104.针对多个投标公司节点,存在某几个投标公司节点之间存在间接的预设边连接,其中预设边可以为任职边、投资边、担保边、客户边、供应商边、关联方边中的一条或多条。例如图6中,图6为本技术实施例提供的企业连接关系示意图,图中企业11指向企业10为供应关系,企业12指向企业11为供应关系,在预设三层内投标公司10与投标公司12有相同的供应边连接,因此生成识别结果为疑似串标。
105.以上为本技术实施例提供一种知识图谱构建及串标识别方法的一些具体实现方式,基于此,本技术还提供了对应的装置。下面将从功能模块化的角度对本技术实施例提供的装置进行介绍。请参考图7,图7为本技术实施例所提供的一种知识图谱构建装置的结构示意图。
106.所述知识图谱构建装置包括:
107.相关数据采集模块110,用于采集各投标公司和关联公司的相关数据,所述关联公司为与所述投标公司存在资金关系且未参与投标的公司;
108.构建数据生成模块111,用于处理采集到的各公司的相关数据,生成存储于公司信息表、人员信息表和关联关系信息表的构建数据,所述构建数据为处理得到的适用于构建知识图谱的数据,所述公司信息表用于存储投标公司和关联公司的公司名称和信息,所述人员信息表用于存储各公司的人员信息,所述关联关系信息表用于存储各个公司间的关联关系,及各个公司与人员信息间的关联关系;
109.边和节点生成模块112,用于根据所述构建数据生成若干个节点和若干个边,所述节点包括用于表示公司名称、公司人员信息和信息的节点,所述边用于表示各个节点之间的关联属性或关系;
110.招投标知识图谱生成模块113,用于连接所有存在边的关联属性或关系的节点,得
到招投标知识图谱。
111.基于此,本技术还提供了对应的装置。下面将从功能模块化的角度对本技术实施例提供的装置进行介绍。请参考图8,图8为本技术实施例还提供了一种串标识别装置,图8为本技术实施例所提供的一种串标识别装置的结构示意图,所述串标识别装置包括:
112.查询目标获取模块114,用于获取查询目标,所述查询目标为查询串标行为指令指示的一个或多个投标公司;
113.识别结果生成模块115,用于根据所述查询目标和招投标知识图谱,生成识别结果,所述识别结果用于表征所述查询目标是否存在串标行为,其中,所述招投标知识图谱基于本技术任一实施例所述的知识图谱构建方法得到的。
114.需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统或装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
115.应当理解,在本技术中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:只存在a,只存在b以及同时存在a和b三种情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
116.还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
117.结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
118.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

技术特征:


1.一种知识图谱构建方法,其特征在于,包括:采集各投标公司和关联公司的相关数据,所述关联公司为与所述投标公司存在资金关系且未参与投标的公司;处理采集到的各公司的相关数据,生成存储于公司信息表、人员信息表和关联关系信息表的构建数据,所述构建数据为处理得到的适用于构建知识图谱的数据,所述公司信息表用于存储投标公司和关联公司的公司名称和信息,所述人员信息表用于存储各公司的人员信息,所述关联关系信息表用于存储各个公司间的关联关系,及各个公司与人员信息间的关联关系;根据所述构建数据生成若干个节点和若干个边,所述节点包括用于表示公司名称、公司人员信息和信息的节点,所述边用于表示各个节点之间的关联属性或关系;连接所有存在边的关联属性或关系的节点,得到招投标知识图谱。2.根据权利要求1所述的方法,其特征在于,所述根据所述构建数据生成若干个节点和若干个边,包括:根据所述公司信息表中的构建数据生成投标公司的公司节点和节点、关联公司的公司节点和节点,根据所述人员信息表中的构建数据生成人员节点和人员信息节点,根据所述关联关系信息表中的构建数据生成各个节点之间的边。3.一种串标识别方法,其特征在于,包括:获取查询目标,所述查询目标为查询串标行为指令指示的一个或多个投标公司;根据所述查询目标和招投标知识图谱,生成识别结果,所述识别结果用于表征所述查询目标是否存在串标行为,其中,所述招投标知识图谱基于权利要求1-2任一项所述的知识图谱构建方法得到的。4.根据权利要求3所述的方法,其特征在于,响应于所述查询目标为单个投标公司,所述根据所述查询目标和招投标知识图谱,生成识别结果,包括:基于所述招投标知识图谱,查询单个投标公司的公司节点预设层数内的关联节点;响应于查询到的关联节点中包含其他投标公司,确定识别结果为疑似串标。5.根据权利要求3所述的方法,其特征在于,响应于所述查询目标为多个投标公司,所述根据所述查询目标和招投标知识图谱,生成识别结果,包括:基于所述招投标知识图谱查询所述多个投标公司各自对应的关联节点,所述关联节点包括所述多个投标公司的公司节点各自对应的人员节点、人员信息节点、节点;匹配各个投标公司的关联节点中的人员信息或地址信息,计算得到相似度;响应于所述相似度大于或等于预设阈值,确定识别结果为疑似串标。6.根据权利要求3所述的方法,其特征在于,响应于所述查询目标为多个投标公司,所述根据所述查询目标和招投标知识图谱,生成识别结果,包括:基于所述招投标知识图谱,查询所述多个投标公司的公司节点间的边;响应于各个投标公司的公司节点间存在预设边连接,生成识别结果为疑似串标。7.根据权利要求3所述的方法,其特征在于,响应于所述查询目标为多个投标公司,所述根据所述查询目标和招投标知识图谱,生成识别结果,包括:基于所述招投标知识图谱查询所述多个投标公司各自对应的关联节点,所述关联节点包括与所述多个投标公司关联的公司节点,以及各个公司节点的人员节点、人员信息节点、
节点;响应于各个投标公司的公司节点在预设层数内存在共同父节点、各个投标公司的公司节点在预设层数内存在共同根节点或各个投标公司的公司节点在预设层数内与关联节点存在相同的预设边连接,生成识别结果为疑似串标。8.一种知识图谱构建装置,其特征在于,包括:相关数据采集模块,用于采集各投标公司和关联公司的相关数据,所述关联公司为与所述投标公司存在资金关系且未参与投标的公司;构建数据生成模块,用于处理采集到的各公司的相关数据,生成存储于公司信息表、人员信息表和关联关系信息表的构建数据,所述构建数据为处理得到的适用于构建知识图谱的数据,所述公司信息表用于存储投标公司和关联公司的公司名称和信息,所述人员信息表用于存储各公司的人员信息,所述关联关系信息表用于存储各个公司间的关联关系,及各个公司与人员信息间的关联关系;边和节点生成模块,用于根据所述构建数据生成若干个节点和若干个边,所述节点包括用于表示公司名称、公司人员信息和信息的节点,所述边用于表示各个节点之间的关联属性或关系;招投标知识图谱生成模块,用于连接所有存在边的关联属性或关系的节点,得到招投标知识图谱。9.一种电子设备,其特征在于,所述电子设备包括处理器以及存储器:所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;所述处理器用于根据所述程序代码中的指令执行权利要求1-2中任一项所述的知识图谱构建方法,和/或权利要求3-7中任一项所述的串标识别方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-2中任一项所述的知识图谱构建方法,和/或权利要求3-7中任一项所述的串标识别方法。

技术总结


本申请公开了知识图谱构建、串标识别方法、装置、设备和介质,采集各投标公司和关联公司的相关数据,处理采集到的各公司的相关数据,生成存储于公司信息表、人员信息表和关联关系信息表的构建数据,根据所述构建数据生成若干个节点和若干个边,连接所有存在边的关联属性或关系的节点,得到招投标知识图谱。获取查询目标,根据所述查询目标和招投标知识图谱,生成识别结果。通过知识图谱技术只需要获取查询目标公司,输入要查询的一个或多个投标公司,就可以实现了单个投标公司分析或多投标公司关联关系自动挖掘,根据挖掘出的关联数据判断投标公司是否存在串标行为。该方法提高了串标行为识别效率。串标行为识别效率。串标行为识别效率。


技术研发人员:

李翔宇

受保护的技术使用者:

长城汽车股份有限公司

技术研发日:

2022.11.14

技术公布日:

2023/2/23

本文发布于:2024-09-20 11:00:48,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/66830.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:节点   公司   所述   图谱
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议