一种地址的匹配方法及装置与流程



1.本技术涉及地址匹配技术领域,尤其涉及一种地址的匹配方法及装置。


背景技术:



2.由于施工企业包含多达数千人的工作人员,若是人工进行工作人员的居住地址与公布的目标大厦是否匹配,以及是否存在工作人员的紧密接触成员等信息,存在工作量大,效率低,耗时高的技术问题。


技术实现要素:



3.本技术提供了一种地址的匹配方法及装置,解决了人工进行工作人员的居住地址与公布的目标大厦是否匹配,以及是否存在工作人员的紧密接触成员等信息,存在的工作量大,效率低,耗时高的技术问题。
4.有鉴于此,本技术第一方面提供了一种地址的匹配方法,所述方法包括:
5.s101、将包含至少一条目标地址信息的第一文本数据与包含至少一条人员地址信息的第二文本数据进行文字吻合度匹配,将匹配度不低于第一预设阈值的所述目标地址信息以及所述人员地址信息一一对应生成预匹配数据;
6.s102、将所述预匹配数据与预设一级关键字进行一级关键字定位,确定所述预设一级关键字在所述预匹配数据包含的所述目标地址信息以及所述人员地址信息中的位置;
7.s103、基于所述预设一级关键字的位置,将所述目标地址信息以及所述人员地址信息中在所述预设一级关键字前的文本数据进行文本一致性匹配,确定匹配度不低于第二预设阈值的所述预匹配数据中的所述人员地址信息;
8.s104、基于所述人员地址信息确定匹配人员的名单以及根据所述匹配人员的名单调取的排班出勤表,确定所述匹配人员关联的相关人员的名单并将所述相关人员赋予预设标识。
9.可选地,所述步骤s103具体包括:
10.基于所述预设一级关键字的位置,若所述目标地址信息以及所述人员地址信息中在所述预设一级关键字前的文本数据包含的文字数量小于特殊预设值,则以所述目标地址信息在所述预设一级关键字前的文本数据为基准,确定所述人员地址信息中在所述预设一级关键字前的文本数据与所述目标地址信息在所述预设一级关键字前的文本数据的文本一致性的匹配度不低于第二预设阈值的所述人员地址信息;
11.若所述目标地址信息或所述人员地址信息中在所述预设一级关键字前的文本数据包含的文字数量不小于特殊预设值,则以文字数量不小于特殊预设值的所述目标地址信息或所述人员地址信息在所述预设一级关键字前的文本数据为基准,确定对应的所述人员地址信息或所述目标地址信息中在所述预设一级关键字前的文本数据,与所述目标地址信息或所述人员地址信息在所述预设一级关键字前的文本数据的文本一致性的匹配度不低于第三预设阈值的所述人员地址信息。
12.可选地,所述步骤s103之后还包括:
13.基于所述预设一级关键字的位置,将所述预匹配数据与预设二级关键字进行二级关键字定位,确定所述预设二级关键字在所述预匹配数据包含的所述目标地址信息以及所述人员地址信息中的位置;
14.基于所述预设一级关键字以及所述预设二级关键字的位置,将所述目标地址信息以及所述人员地址信息中在所述预设一级关键字与所述预设二级关键字之间的文本数据进行文本一致性匹配,确定匹配度不低于第四预设阈值的所述预匹配数据中的所述人员地址信息。
15.可选地,所述步骤s101之后还包括:
16.将匹配度低于所述第一预设阈值的所述目标地址信息以及所述人员地址信息一一对应生成分析数据库,所述分析数据库中按照所述目标地址信息以及所述人员地址信息的匹配值进行区域划分。
17.可选地,所述步骤s104之后还包括:
18.向所述匹配人员的第一终端发送第一预设方案,向所述相关人员的第二终端发送第二预设方案。
19.本技术第二方面提供一种地址的匹配置,所述装置包括:
20.第一匹配单元,用于将包含至少一条目标地址信息的第一文本数据与包含至少一条人员地址信息的第二文本数据进行文字吻合度匹配,将匹配度不低于第一预设阈值的所述目标地址信息以及所述人员地址信息一一对应生成预匹配数据;
21.第一定位单元,用于将所述预匹配数据与预设一级关键字进行一级关键字定位,确定所述预设一级关键字在所述预匹配数据包含的所述目标地址信息以及所述人员地址信息中的位置;
22.第二匹配单元,用于基于所述预设一级关键字的位置,将所述目标地址信息以及所述人员地址信息中在所述预设一级关键字前的文本数据进行文本一致性匹配,确定匹配度不低于第二预设阈值的所述预匹配数据中的所述人员地址信息;
23.标记单元,用于基于所述人员地址信息确定匹配人员的名单以及根据所述匹配人员的名单调取的排班出勤表,确定所述匹配人员关联的相关人员的名单并将所述相关人员赋予预设标识。
24.可选地,所述第二匹配单元具体用于:
25.基于所述预设一级关键字的位置,若所述目标地址信息以及所述人员地址信息中在所述预设一级关键字前的文本数据包含的文字数量小于特殊预设值,则以所述目标地址信息在所述预设一级关键字前的文本数据为基准,确定所述人员地址信息中在所述预设一级关键字前的文本数据与所述目标地址信息在所述预设一级关键字前的文本数据的文本一致性的匹配度不低于第二预设阈值的所述人员地址信息;
26.若所述目标地址信息或所述人员地址信息中在所述预设一级关键字前的文本数据包含的文字数量不小于特殊预设值,则以文字数量不小于特殊预设值的所述目标地址信息或所述人员地址信息在所述预设一级关键字前的文本数据为基准,确定对应的所述人员地址信息或所述目标地址信息中在所述预设一级关键字前的文本数据,与所述目标地址信息或所述人员地址信息在所述预设一级关键字前的文本数据的文本一致性的匹配度不低
于第三预设阈值的所述人员地址信息。
27.可选地,还包括:
28.第二定位单元,用于基于所述预设一级关键字的位置,将所述预匹配数据与预设二级关键字进行二级关键字定位,确定所述预设二级关键字在所述预匹配数据包含的所述目标地址信息以及所述人员地址信息中的位置;
29.第三匹配单元,用于基于所述预设一级关键字以及所述预设二级关键字的位置,将所述目标地址信息以及所述人员地址信息中在所述预设一级关键字与所述预设二级关键字之间的文本数据进行文本一致性匹配,确定匹配度不低于第四预设阈值的所述预匹配数据中的所述人员地址信息。
30.可选地,还包括:
31.分析单元,用于将匹配度低于所述第一预设阈值的所述目标地址信息以及所述人员地址信息一一对应生成分析数据库,所述分析数据库中按照所述目标地址信息以及所述人员地址信息的匹配值进行区域划分。
32.可选地,还包括:
33.处理单元,用于向所述匹配人员的第一终端发送第一预设方案,向所述相关人员的第二终端发送第二预设方案。
34.从以上技术方案可以看出,本技术实施例具有以下优点:
35.本技术中,提供了一种地址的匹配方法,通过将每日公布的目标地址信息与数据库中的人员地址信息进行文字吻合度匹配,在不考虑语序的情况下,确定预匹配数据,进一步地定位预匹配数据中的预设一级关键字,基于预设一级关键字在预匹配数据中的位置,对位置前的文本数据进行文本一致性匹配,从而匹配到与目标地址信息对应的人员地址信息,最后通过调取人员地址信息对应人员的排班出勤表确定相关人员的名单,解决了人工进行工作人员的居住地址与公布的目标大厦是否匹配,以及是否存在工作人员的紧密接触成员等信息,存在的工作量大,效率低,耗时高的技术问题。
附图说明
36.图1为本技术实施例中一种地址的匹配方法的方法流程图;
37.图2为本技术实施例中一种地址的匹配装置的结构示意图。
具体实施方式
38.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
39.本技术设计了一种地址的匹配方法及装置,解决了人工进行工作人员的居住地址与公布的目标大厦是否匹配,以及是否存在工作人员的紧密接触成员等信息,存在的工作量大,效率低,耗时高的技术问题。
40.为了便于理解,请参阅图1,图1为本技术实施例中一种地址的匹配方法的方法流程图,如图1所示,具体为:
41.s101、将包含至少一条目标地址信息的第一文本数据与包含至少一条人员地址信息的第二文本数据进行文字吻合度匹配,将匹配度不低于第一预设阈值的目标地址信息以及人员地址信息一一对应生成预匹配数据;
42.需要说明的是,人员地址信息通常被保存于人员数据库之中,在确定了至少一条目标地址信息后,首先将基于目标地址信息与人员数据库中的人员地址信息进行文字吻合度的匹配,文字吻合度的匹配是指的不包含文字顺序,仅对是否存在该文字进行相关匹配,匹配度不低于第一预设阈值的目标地址信息以及人员地址信息将对应,从而生成包含多对应数据的预匹配数据。
43.发现可能存在简繁体比对问题、因地址间有特殊符合如空格,分号导致匹配度出现偏差问题,针对这些情况,进行文字吻合度匹配之前,将进行例如去特殊字符、系统同步简繁体后再匹配的预处理操作。
44.s102、将预匹配数据与预设一级关键字进行一级关键字定位,确定预设一级关键字在预匹配数据包含的目标地址信息以及人员地址信息中的位置;
45.需要说明的是,为了进一步地定位到预匹配数据中需要进行比对的内容位置,通过预设一级关键字的预先设置,从而确定预设一级关键字在预匹配数据包含的目标地址信息以及人员地址信息中的位置。预设一级关键字可以包含但不限于:座、楼、邨、段、中心、冰室、大厦等代表地段。
46.s103、基于预设一级关键字的位置,将目标地址信息以及人员地址信息中在预设一级关键字前的文本数据进行文本一致性匹配,确定匹配度不低于第二预设阈值的预匹配数据中的人员地址信息;
47.需要说明的是,由于基于文字吻合度的匹配并不包含文本顺序,而文本顺序的不同代表的地址差异度较大,在定位到预匹配数据中预设一级关键字的位置后,将预设一级关键字前的文本数据进行文本一致性匹配,即目标地址信息是否完全包含人员地址信息的内容,或人员地址信息是否完全包含目标地址信息的内容。从这里看出,文本一致性匹配为一个包含关系的匹配,并非指的是目标地址信息与人员地址信息一模一样。
48.s104、基于人员地址信息确定匹配人员的名单以及根据匹配人员的名单调取的排班出勤表,确定匹配人员关联的相关人员的名单并将相关人员赋予预设标识。
49.需要说明的是,在筛选出匹配的人员地址信息后,根据人员地址信息确认实际匹配人员的名单,再基于排班出勤表确定匹配人员关联的相关人员名单,从而赋予预设标识进行标记,即确定密切接触人员以及次密切接触人员的信息。
50.进一步地,步骤s103具体包括:
51.基于预设一级关键字的位置,若目标地址信息以及人员地址信息中在预设一级关键字前的文本数据包含的文字数量小于特殊预设值,则以目标地址信息在预设一级关键字前的文本数据为基准,确定人员地址信息中在预设一级关键字前的文本数据与目标地址信息在预设一级关键字前的文本数据的文本一致性的匹配度不低于第二预设阈值的人员地址信息;
52.若目标地址信息或人员地址信息中在预设一级关键字前的文本数据包含的文字数量不小于特殊预设值,则以文字数量不小于特殊预设值的目标地址信息或人员地址信息在预设一级关键字前的文本数据为基准,确定对应的人员地址信息或目标地址信息中在预
设一级关键字前的文本数据,与目标地址信息或人员地址信息在预设一级关键字前的文本数据的文本一致性的匹配度不低于第三预设阈值的人员地址信息。
53.需要说明的是,由于基于文字吻合度的匹配并不包含文本顺序,而文本顺序的不同代表的地址差异度较大,在定位到预匹配数据中预设一级关键字的位置后,将预设一级关键字前的文本数据进行文本一致性匹配,文本一致性匹配为一个包含关系的匹配,并非指的是目标地址信息与人员地址信息一模一样,因此,依旧可能存在一定的误差。
54.例如,目标地址信息为“顺意大厦”,而人员地址信息为“好顺意大厦”,通过文本一致性匹配将存在100%的匹配度。
55.针对上述特殊情况,则在定位到预匹配数据中预设一级关键字的位置后,将根据目标地址信息或人员地址信息中预设一级关键字前的文本数据包含的文字数量来进行区别匹配。
56.以特殊预设值为3个字符为例,若地址信息包含有预设一级关键字,则预设一级关键字前的3个文字也需达到100%匹配。
57.基于上述示例,目标地址信息为“顺意大厦”,而人员地址信息为“好顺意大厦”,以“大厦”作为预设一级关键字,由于人员地址信息中在“大厦”之前包含3个字符的文字“好顺意”,则将基于人员地址信息的“好顺意”与目标地址信息的“顺意”进行对比,从而将该人员地址信息与目标地址信息的对应关系剔除于预匹配数据之中。
58.进一步地,步骤s103之后还包括:
59.基于预设一级关键字的位置,将预匹配数据与预设二级关键字进行二级关键字定位,确定预设二级关键字在预匹配数据包含的目标地址信息以及人员地址信息中的位置;
60.基于预设一级关键字以及预设二级关键字的位置,将目标地址信息以及人员地址信息中在预设一级关键字与预设二级关键字之间的文本数据进行文本一致性匹配,确定匹配度不低于第四预设阈值的预匹配数据中的人员地址信息。
61.需要说明的是,在匹配到预设一级关键字的位置后,且对预设一级关键字前的目标地址信息以及人员地址信息进行文本一致性匹配通过,可能存在预设一级关键字后的地址信息存在误差的情况。
62.例如,目标地址信息为“顺意大厦1座”,而人员地址信息为“顺意大厦 12座”。
63.按照此前规则,该人员地址信息与目标地址信息将匹配成功,但实际上二者存在明显差异。
64.通过分析得出,在常见有预设一级关键字如“座、楼、邨、段、中心、冰室、大厦”等代表地段中,存在较为常见的二级地址,如xx座、xx号、xx 室,因此在一级地址已匹配的前提下,排查地址中是否存在二级地址的预设二级关键字,在预设一级关键字和预设二级关键字之间再做一次匹配,需要达到100%匹配度。
65.如修改后:
66.目标地址信息为“顺意大厦1座”,而人员地址信息为“顺意大厦12座”。
67.存在预设一级关键字“大厦”与预设二级关键字“座”,需匹配“大厦”与“座”之间的文字进行完全匹配,即12对比01(位数不够设置用0补位),从而将该人员地址信息与目标地址信息的对应关系剔除于预匹配数据之中。
68.进一步地,步骤s101之后还包括:
69.将匹配度低于第一预设阈值的目标地址信息以及人员地址信息一一对应生成分析数据库,分析数据库中按照目标地址信息以及人员地址信息的匹配值进行区域划分。
70.需要说明的是,未匹配到预设一级关键字或匹配度低于第一预设阈值的目标地址信息以及人员地址信息将被放入分析数据库,在此阶段,人工介入分析,分情况(根据匹配度达到60%~80%、60%以下、0等)抽查分析是否真实为非目标地址大厦。
71.进一步地,步骤s104之后还包括:
72.向匹配人员的第一终端发送第一预设方案,向相关人员的第二终端发送第二预设方案。
73.请参阅图2,图2为本技术实施例中一种地址的匹配装置的结构示意图,如图2所示,具体为:
74.第一匹配单元201,用于将包含至少一条目标地址信息的第一文本数据与包含至少一条人员地址信息的第二文本数据进行文字吻合度匹配,将匹配度不低于第一预设阈值的目标地址信息以及人员地址信息一一对应生成预匹配数据;
75.第一定位单元202,用于将预匹配数据与预设一级关键字进行一级关键字定位,确定预设一级关键字在预匹配数据包含的目标地址信息以及人员地址信息中的位置;
76.第二匹配单元203,用于基于预设一级关键字的位置,将目标地址信息以及人员地址信息中在预设一级关键字前的文本数据进行文本一致性匹配,确定匹配度不低于第二预设阈值的预匹配数据中的人员地址信息;
77.标记单元204,用于基于人员地址信息确定匹配人员的名单以及根据匹配人员的名单调取的排班出勤表,确定匹配人员关联的相关人员的名单并将相关人员赋予预设标识。
78.进一步地,第二匹配单元203具体用于:
79.基于预设一级关键字的位置,若目标地址信息以及人员地址信息中在预设一级关键字前的文本数据包含的文字数量小于特殊预设值,则以目标地址信息在预设一级关键字前的文本数据为基准,确定人员地址信息中在预设一级关键字前的文本数据与目标地址信息在预设一级关键字前的文本数据的文本一致性的匹配度不低于第二预设阈值的人员地址信息;
80.若目标地址信息或人员地址信息中在预设一级关键字前的文本数据包含的文字数量不小于特殊预设值,则以文字数量不小于特殊预设值的目标地址信息或人员地址信息在预设一级关键字前的文本数据为基准,确定对应的人员地址信息或目标地址信息中在预设一级关键字前的文本数据,与目标地址信息或人员地址信息在预设一级关键字前的文本数据的文本一致性的匹配度不低于第三预设阈值的人员地址信息。
81.进一步地,还包括:
82.第二定位单元,用于基于预设一级关键字的位置,将预匹配数据与预设二级关键字进行二级关键字定位,确定预设二级关键字在预匹配数据包含的目标地址信息以及人员地址信息中的位置;
83.第三匹配单元,用于基于预设一级关键字以及预设二级关键字的位置,将目标地址信息以及人员地址信息中在预设一级关键字与预设二级关键字之间的文本数据进行文本一致性匹配,确定匹配度不低于第四预设阈值的预匹配数据中的人员地址信息。
84.进一步地,还包括:
85.分析单元,用于将匹配度低于第一预设阈值的目标地址信息以及人员地址信息一一对应生成分析数据库,分析数据库中按照目标地址信息以及人员地址信息的匹配值进行区域划分。
86.进一步地,还包括:
87.处理单元,用于向匹配人员的第一终端发送第一预设方案,向相关人员的第二终端发送第二预设方案。
88.本技术实施例中,提供了一种地址的匹配方法及装置,通过将每日公布的目标地址信息与数据库中的人员地址信息进行文字吻合度匹配,在不考虑语序的情况下,确定预匹配数据,进一步地定位预匹配数据中的预设一级关键字,基于预设一级关键字在预匹配数据中的位置,对位置前的文本数据进行文本一致性匹配,从而匹配到与目标地址信息对应的人员地址信息,最后通过调取人员地址信息对应人员的排班出勤表确定相关人员的名单,解决了人工进行工作人员的居住地址与公布的目标大厦是否匹配,以及是否存在工作人员的紧密接触成员等信息,存在的工作量大,效率低,耗时高的技术问题。
89.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
90.本技术的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
91.应当理解,在本技术中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:只存在a,只存在b以及同时存在a和b三种情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b 或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
92.在本技术所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
93.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目
的。
94.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
95.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(英文全称: read-only memory,英文缩写:rom)、随机存取存储器(英文全称: random access memory,英文缩写:ram)、磁碟或者光盘等各种可以存储程序代码的介质。
96.以上所述,以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。

技术特征:


1.一种地址的匹配方法,其特征在于,包括:s101、将包含至少一条目标地址信息的第一文本数据与包含至少一条人员地址信息的第二文本数据进行文字吻合度匹配,将匹配度不低于第一预设阈值的所述目标地址信息以及所述人员地址信息一一对应生成预匹配数据;s102、将所述预匹配数据与预设一级关键字进行一级关键字定位,确定所述预设一级关键字在所述预匹配数据包含的所述目标地址信息以及所述人员地址信息中的位置;s103、基于所述预设一级关键字的位置,将所述目标地址信息以及所述人员地址信息中在所述预设一级关键字前的文本数据进行文本一致性匹配,确定匹配度不低于第二预设阈值的所述预匹配数据中的所述人员地址信息;s104、基于所述人员地址信息确定匹配人员的名单以及根据所述匹配人员的名单调取的排班出勤表,确定所述匹配人员关联的相关人员的名单并将所述相关人员赋予预设标识。2.根据权利要求1所述的地址的匹配方法,其特征在于,所述步骤s103具体包括:基于所述预设一级关键字的位置,若所述目标地址信息以及所述人员地址信息中在所述预设一级关键字前的文本数据包含的文字数量小于特殊预设值,则以所述目标地址信息在所述预设一级关键字前的文本数据为基准,确定所述人员地址信息中在所述预设一级关键字前的文本数据与所述目标地址信息在所述预设一级关键字前的文本数据的文本一致性的匹配度不低于第二预设阈值的所述人员地址信息;若所述目标地址信息或所述人员地址信息中在所述预设一级关键字前的文本数据包含的文字数量不小于特殊预设值,则以文字数量不小于特殊预设值的所述目标地址信息或所述人员地址信息在所述预设一级关键字前的文本数据为基准,确定对应的所述人员地址信息或所述目标地址信息中在所述预设一级关键字前的文本数据,与所述目标地址信息或所述人员地址信息在所述预设一级关键字前的文本数据的文本一致性的匹配度不低于第三预设阈值的所述人员地址信息。3.根据权利要求1所述的地址的匹配方法,其特征在于,所述步骤s103 之后还包括:基于所述预设一级关键字的位置,将所述预匹配数据与预设二级关键字进行二级关键字定位,确定所述预设二级关键字在所述预匹配数据包含的所述目标地址信息以及所述人员地址信息中的位置;基于所述预设一级关键字以及所述预设二级关键字的位置,将所述目标地址信息以及所述人员地址信息中在所述预设一级关键字与所述预设二级关键字之间的文本数据进行文本一致性匹配,确定匹配度不低于第四预设阈值的所述预匹配数据中的所述人员地址信息。4.根据权利要求1所述的地址的匹配方法,其特征在于,所述步骤s101之后还包括:将匹配度低于所述第一预设阈值的所述目标地址信息以及所述人员地址信息一一对应生成分析数据库,所述分析数据库中按照所述目标地址信息以及所述人员地址信息的匹配值进行区域划分。5.根据权利要求1所述的地址的匹配方法,其特征在于,所述步骤s104之后还包括:向所述匹配人员的第一终端发送第一预设方案,向所述相关人员的第二终端发送第二预设方案。
6.一种地址的匹配装置,其特征在于,包括:第一匹配单元,用于将包含至少一条目标地址信息的第一文本数据与包含至少一条人员地址信息的第二文本数据进行文字吻合度匹配,将匹配度不低于第一预设阈值的所述目标地址信息以及所述人员地址信息一一对应生成预匹配数据;第一定位单元,用于将所述预匹配数据与预设一级关键字进行一级关键字定位,确定所述预设一级关键字在所述预匹配数据包含的所述目标地址信息以及所述人员地址信息中的位置;第二匹配单元,用于基于所述预设一级关键字的位置,将所述目标地址信息以及所述人员地址信息中在所述预设一级关键字前的文本数据进行文本一致性匹配,确定匹配度不低于第二预设阈值的所述预匹配数据中的所述人员地址信息;标记单元,用于基于所述人员地址信息确定匹配人员的名单以及根据所述匹配人员的名单调取的排班出勤表,确定所述匹配人员关联的相关人员的名单并将所述相关人员赋予预设标识。7.根据权利要求6所述的地址的匹配装置,其特征在于,所述第二匹配单元具体用于:基于所述预设一级关键字的位置,若所述目标地址信息以及所述人员地址信息中在所述预设一级关键字前的文本数据包含的文字数量小于特殊预设值,则以所述目标地址信息在所述预设一级关键字前的文本数据为基准,确定所述人员地址信息中在所述预设一级关键字前的文本数据与所述目标地址信息在所述预设一级关键字前的文本数据的文本一致性的匹配度不低于第二预设阈值的所述人员地址信息;若所述目标地址信息或所述人员地址信息中在所述预设一级关键字前的文本数据包含的文字数量不小于特殊预设值,则以文字数量不小于特殊预设值的所述目标地址信息或所述人员地址信息在所述预设一级关键字前的文本数据为基准,确定对应的所述人员地址信息或所述目标地址信息中在所述预设一级关键字前的文本数据,与所述目标地址信息或所述人员地址信息在所述预设一级关键字前的文本数据的文本一致性的匹配度不低于第三预设阈值的所述人员地址信息。8.根据权利要求6所述的地址的匹配装置,其特征在于,还包括:第二定位单元,用于基于所述预设一级关键字的位置,将所述预匹配数据与预设二级关键字进行二级关键字定位,确定所述预设二级关键字在所述预匹配数据包含的所述目标地址信息以及所述人员地址信息中的位置;第三匹配单元,用于基于所述预设一级关键字以及所述预设二级关键字的位置,将所述目标地址信息以及所述人员地址信息中在所述预设一级关键字与所述预设二级关键字之间的文本数据进行文本一致性匹配,确定匹配度不低于第四预设阈值的所述预匹配数据中的所述人员地址信息。9.根据权利要求6所述的地址的匹配装置,其特征在于,还包括:分析单元,用于将匹配度低于所述第一预设阈值的所述目标地址信息以及所述人员地址信息一一对应生成分析数据库,所述分析数据库中按照所述目标地址信息以及所述人员地址信息的匹配值进行区域划分。10.根据权利要求6所述的地址的匹配装置,其特征在于,还包括:处理单元,用于向所述匹配人员的第一终端发送第一预设方案,向所述相关人员的第
二终端发送第二预设方案。

技术总结


本申请公开了一种地址的匹配方法及装置,通过将每日公布的目标地址信息与数据库中的人员地址信息进行文字吻合度匹配,在不考虑语序的情况下,确定预匹配数据,进一步地定位预匹配数据中的预设一级关键字,基于预设一级关键字在预匹配数据中的位置,对位置前的文本数据进行文本一致性匹配,从而匹配到与目标地址信息对应的人员地址信息,最后通过调取人员地址信息对应人员的排班出勤表确定相关人员的名单,解决了人工进行工作人员的居住地址与公布的目标大厦是否匹配,以及是否存在工作人员的紧密接触成员等信息,存在的工作量大,效率低,耗时高的技术问题。耗时高的技术问题。耗时高的技术问题。


技术研发人员:

陈惠梅 黄品 何佩桦

受保护的技术使用者:

广州华科信智慧科技有限公司

技术研发日:

2022.06.20

技术公布日:

2022/12/26

本文发布于:2024-09-23 06:31:31,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/49289.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   地址   信息   人员
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议