目标异网号码的确定方法、装置、设备及存储介质与流程



1.本技术涉及通信技术领域,尤其涉及一种目标异网号码的确定方法、装置、设备及存储介质。


背景技术:



2.对于运营商而言,用户数量是公司发展的重要保障,现有的异网号码挖掘方法大多基于o域数据中的通话数据确定本网号码的家庭关系,以精准寻与本网号码亲密度较高(如家庭关系)的异网号码,再通过本网号码为营销触点,引导和本网号码具有家庭关系的异网号码进行携号转网。
3.然而本网号码与同事、快递人员、外卖人员等都有可能产生重复且长周期的通话记录,无法准确确定与本网号码具有家庭关系的号码,因此,如何准确确定与本网号码具有家庭关系的异网号码成为亟待解决的技术问题。


技术实现要素:



4.本技术提供一种目标异网号码的确定方法、装置、设备及存储介质,以准确确定与本网号码具有家庭关系的异网号码。
5.为达到上述目的,本技术采用如下技术方案:
6.第一方面,本技术提供一种目标异网号码的确定方法,该方法包括:确定使用同一宽带的多个终端设备对应的电话号码中的本网号码和多个异网号码;若本网号码和第一异网号码之间的亲密度大于预设值,则确定第一异网号码为目标异网号码,多个异网号码包括第一异网号码,亲密度用于表征号码之间的通话关联程度。
7.可选的,确定使用同一宽带的多个终端设备对应的电话号码中的本网号码和异网号码,包括:根据预设规则,获取使用宽带的多个号码,预设规则用于从宽带的数据中提取号码;将多个号码与预设号码数据库对比,以确定多个号码中的本网号码和异网号码,预设号码数据库包括多个本网号码。
8.可选的,方法还包括:获取预设时间段内本网号码与异网号码之间的通话数据,通话数据包括通话时间和通话次数;
9.根据通话数据,确定亲密度。
10.可选的,方法还包括:根据用户特征数据以及预设携号转网模型,确定异网号码的携号转网概率,预设携号转网模型用于确定号码的携号转网概率;若异网号码的携号转网概率大于预设概率,则向本网号码对应的终端设备发送第一通知信息,第一通知信息用于通知对异网号码进行携号转网的操作,其中,用户特征数据包括本网号码、本网号码使用的宽带账号数量、联系号码是本网号码的宽带账号的数量、付费号码是本网号码的宽带账号的数量、本网号码当月宽带付费总和、存在异网号码的宽带账号的数量、同一宽带下异网号码的数量、通话关系密切的异网号码数量、本网号码与异网号码的平均亲密度中的一项或多项。
11.可选的,在无法获取到历史数据的情况下,获取多个异网号码在第一预设时间段内的实际携号转网的数据;将多个异网号码在第一预设时间内的实际携号转网的数据以及用户特征数据作为训练数据,并根据预设算法,训练得到第一携号转网概率预测模型;根据用户特征数据以及预设携号转网模型,确定异网号码的携号转网概率,包括:根据用户特征数据以及预设携号转网模型,确定异网号码在第二预设时间内的概率,第二预设时间段为第一预设时间段的下一个时间段。
12.可选的,获取多个异网号码在第二预设时间段内的实际携号转网的数据;使用多个异网号码在第二预设时间段内的实际携号转网的数据对预设携号转网模型进行更新,得到更新后的预设携号转网模型。
13.第二方面,本技术提供一种目标异网号码的确定装置,确定装置包括:确定单元;确定单元用于确定使用同一宽带的多个终端设备对应的电话号码中的本网号码和多个异网号码;确定单元,还用于在本网号码和第一异网号码之间的亲密度大于预设值时,确定第一异网号码为目标异网号码,多个异网号码包括第一异网号码,亲密度用于表征号码之间的通话关联程度。
14.可选的,确定单元,具体用于:根据预设规则,获取使用宽带的多个号码,预设规则用于从宽带的数据中提取号码;将多个号码与预设号码数据库对比,以确定多个号码中的本网号码和异网号码,预设号码数据库包括多个本网号码。
15.可选的,确定装置还包括:获取单元;获取单元用于获取预设时间段内本网号码与异网号码之间的通话数据,通话数据包括通话时间和通话次数;确定单元,还用于根据通话数据,确定亲密度。
16.可选的,确定装置还包括:发送单元;确定单元还用于根据用户特征数据以及预设携号转网模型,确定异网号码的携号转网概率,预设携号转网模型用于确定号码的携号转网概率;发送单元,用于在异网号码的携号转网概率大于预设概率时,向本网号码对应的终端设备发送第一通知信息,第一通知信息用于通知对异网号码进行携号转网的操作,其中,用户特征数据包括本网号码、本网号码使用的宽带账号数量、联系号码是本网号码的宽带账号的数量、付费号码是本网号码的宽带账号的数量、本网号码当月宽带付费总和、存在异网号码的宽带账号的数量、同一宽带下异网号码的数量、通话关系密切的异网号码数量、本网号码与异网号码的平均亲密度中的一项或多项。
17.可选的,确定装置还包括:训练单元;获取单元,用于在无法获取到历史数据的情况下,获取多个异网号码在第一预设时间段内的实际携号转网的数据;训练单元,用于将多个异网号码在第一预设时间内的实际携号转网的数据以及用户特征数据作为训练数据,并根据预设算法,训练得到第一携号转网概率预测模型;确定单元,具体用于根据用户特征数据以及预设携号转网模型,确定异网号码在第二预设时间内的概率,第二预设时间段为第一预设时间段的下一个时间段。
18.可选的,获取单元,还用于获取多个异网号码在第二预设时间段内的实际携号转网的数据;更新单元,用于使用多个异网号码在第二预设时间段内的实际携号转网的数据对预设携号转网模型进行更新,得到更新后的预设携号转网模型。
19.第三方面,本技术提供一种服务器,服务器包括:处理器、数据处理接口和存储器;其中,存储器用于存储一个或多个程序,该一个或多个程序包括计算机执行指令,当服务器
运行时,处理器执行该存储器存储的该计算机执行指令,以使服务器执行上述第一方面及其各种可选的实现方式中任意之一的目标异网号码的确定方法。
20.第四方面,本技术提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当计算机执行该指令时,该计算机执行上述第一方面及其各种可选的实现方式中任意之一的目标异网号码的确定方法。
21.第五方面,本技术提供了一种通信系统,包括服务器、宽带以及终端设备,服务器用于执行如第一方面和第一方面的任一种可能的实现方式中所描述的方法。
22.基于本技术实施例提供的技术方案,服务器在确定使用同一宽带的多个终端设备对应的电话号码中的本网号码和多个异网号码之后,确定本网号码和第一异网号码之间的亲密度。在确定本网号码和第一异网号码之间的亲密度大于预设值的情况下,服务器确定第一异网号码为目标异网号码。如此,服务器可以在确定本网号码与第一异网号码处于同一宽带的基础上,进一步确定本网号码与第一异网号码亲密度大于预设值,以确定本网号码与第一异网号码具有家庭关系,可以提高确定与本网号码具有家庭关系的异网号码的准确性。
附图说明
23.图1为本技术实施例提供的一种通信系统的结构示意图;
24.图2为本技术实施例提供的一种确定装置的结构示意图;
25.图3为本技术实施例提供的一种确定方法的流程示意图;
26.图4为本技术实施例提供的一种确定方法的流程示意图;
27.图5为本技术实施例提供的一种确定方法的流程示意图;
28.图6为本技术实施例提供的一种确定方法的流程示意图;
29.图7为本技术实施例提供的一种确定方法的流程示意图;
30.图8为本技术实施例提供的一种确定方法的流程示意图;
31.图9为本技术实施例提供的一种确定装置的结构示意图。
具体实施方式
32.下面结合附图对本技术实施例提供的一种目标异网号码的确定方法、装置、设备及存储介质进行详细地描述。
33.本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。
34.本技术的说明书以及附图中的术语“第一”和“第二”等是用于区别不同的对象,或者用于区别对同一对象的不同处理,而不是用于描述对象的特定顺序。
35.此外,本技术的描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
36.需要说明的是,本技术实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本技术实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应
被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
37.在本技术的描述中,除非另有说明,“多个”的含义是指两个或两个以上。
38.在介绍本技术实施例之前,对本技术实施例中的名词进行解释。
39.本网号码:属于本运营商管理的电话号码。
40.异网号码:不属于本运营商管理的电话号码。
41.现有的异网号码挖掘方法大多基于o域数据中的通话数据确定本网号码的家庭关系,以精准寻与本网号码亲密度较高(如家庭关系)的异网号码,再通过本网号码为营销触点,引导和本网号码具有家庭关系的异网号码进行携号转网。然而本网号码对应的用户与同事、快递人员、外卖人员等都有可能产生重复且长周期的通话记录,无法准确确定本网号码对应用户的家庭关系号码。
42.另外,引导和本网号码具有家庭关系的异网号码进行携号转网大都是运营商服务人员直接联系异网号码,但这种方法用户体验较差,异网号码携号转网的成功概率也不高。
43.鉴于此,本技术实施例提供了一种目标异网号码的确定方法,包括:
44.确定使用同一宽带的多个终端设备对应的电话号码中的本网号码和多个异网号码;若本网号码和第一异网号码之间的亲密度大于预设值,则确定第一异网号码为目标异网号码,多个异网号码包括第一异网号码,亲密度用于表征号码之间的通话关联程度。
45.下面结合说明书附图对本技术实施例提供的一种目标异网号码的确定方法(以下简称确定方法)进行说明。
46.本技术实施例提供的确定方法可以应用于图1所示的通信系统中,如图1所示,该通信系统10可以包括宽带设备11、服务器12、终端设备13。宽带设备11分别与服务器12终端设备13通信连接。例如,可以无线通信连接。
47.其中,宽带设备11可以用于为终端设备13提供网络信号,例如,可以为调制解调器。服务器12可以用于确定使用同一宽带的多个终端设备对应的电话号码中的本网号码和多个异网号码,并在本网号码和第一异网号码之间的亲密度大于预设值时,确定第一异网号码为目标异网号码。终端设备13可以为本网号码对应的终端设备,也可以为异网号码对应的终端设备,终端设备13可以用于通过宽带设备11进行网络连接。例如,终端设备13可以为手机、智能手表等。
48.需要说明的是,图1仅为示例性架构图,除图1中所示功能单元之外,该接入系统还可以包括其他功能单元,本技术实施例对此不进行限定。
49.在具体实现时,图1中的各个设备可以采用图2所示的组成结构,或者包括图2所示的部件。图2为本技术实施例提供的一种确定装置20的组成示意图,该确定装置20包括处理器201、通信接口202、通信线路203以及存储器204。
50.其中,处理器201可以是cpu、通用处理器网络处理器(network processor,np)、数字信号处理器(digital signal processing,dsp)、微处理器、微控制器、可编程逻辑器件(programmable logic device,pld)或它们的任意组合。处理器201还可以是其它具有处理功能的装置,例如电路、器件或软件模块,不予限制。在一种示例中,处理器201可以包括一个或多个cpu,例如,图2中的cpu0和cpu1。
51.通信接口202,用于与其他设备或其它数据处理网络进行数据处理。该其它数据处
理网络可以为以太网,无线确定网(radio access network,ran设备),无线局域网(wireless local area networks,wlan)等。数据处理接口可以是模块、电路、数据处理接口或者任何能够实现数据处理的装置。
52.通信线路203,用于在通信系统所包括的各部件之间传送消息。
53.存储器204,用于存储指令。其中,指令可以是计算机程序。
54.其中,存储器204可以是只读存储器(read-only memory,rom)或可存储静态消息和/或指令的其他类型的静态存储设备,也可以是随机存取存储器(ran设备dom access memory,ram)或可存储消息和/或指令的其他类型的动态存储设备,还可以是电可擦可编程只读存储器(electric模块ally erasable programmable read-only memory,eeprom)、只读光盘(compact disc read-only memory,cd-rom)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或其他磁存储设备等,不予限制。
55.需要指出的是,存储器204可以独立于处理器201存在,也可以和处理器201集成在一起。存储器204可以用于存储指令或者程序代码或者一些网络数据等。存储器302可以位于确定装置20内,也可以位于确定装置20外,不予限制。处理器201,用于执行存储器204中存储的指令,以实现本技术下述实施例提供的确定方法。
56.作为一种可选的实现方式,确定装置20包括多个处理器,例如,除图2中的处理器201之外,还可以包括处理器207。
57.作为一种可选的实现方式,确定装置20还包括输出设备205和输入设备206。示例性地,输入设备206是键盘、鼠标、麦克风或操作杆等设备,输出设备205是显示屏、扬声器(speaker)等设备。
58.本技术实施例中,芯片系统可以由芯片构成,也可以包括芯片和其他分立器件。
59.此外,本技术的各实施例之间涉及的动作、术语等均可以相互参考,不予限制。本技术的实施例中各个设备之间交互的消息名称或消息中的参数名称等只是一个示例,具体实现中也可以采用其他的名称,不予限制。
60.本技术实施例提供的确定方法可以应用于前述图1或图2中所示的确定装置。
61.需要说明的是,本技术提供的确定方法的执行主体为服务器,也可以是服务器中芯片或片上系统等,不予限制。
62.如图3所示,本公开实施例提供的确定方法可以包括:s301-s302。
63.s301、服务器确定使用同一宽带的多个终端设备对应的电话号码中的本网号码和多个异网号码。
64.其中,服务器可以为图1中的服务器12,也可以为服务器12中器件,如芯片,也可以为服务器12中的客户端。宽带可以为图1中的宽带11,也可以为宽带11中的器件,如芯片。终端设备可以为图1中的终端设备13,也可以为终端设备13中的器件,如芯片。
65.作为一种可能的实现方式,服务器可以先从宽带数据(也可以表示为data_edpi)中将使用同一宽带的多个号码进行提取,并与本网号码进行对比,从而将使用同一宽带的多个号码进行分类,得到使用同一宽带的多个本网号码(也可以表示为data_edpi_bw_msisdn)和多个异网号码(也可以表示为data_edpi_yw_msisdn)。
66.s302、若本网号码和第一异网号码之间的亲密度大于预设值,则服务器确定第一
异网号码为目标异网号码。
67.其中,第一异网号码为上述多个异网号码中的一个或多个,亲密度用于表征号码之间的通话关联程度,目标异网号码为携号转网概率比较大的异网号码。
68.作为一种可能的实现方式,服务器可以根据本网号码与第一异网号码之间的通话数据确定其亲密度是否大于预设值。
69.需要说明的,通话数据包括通话时间和通话次数,通话时间可以包括预设时间段内的通话总时长以及通话天数。
70.进一步的,若本网号码与第一异网号码的亲密度小于预设值,则确定第一异网号码为相关异网号码,相关异网号码为携号转网概率小于目标异网号码携号转网概率的异网号码。若本网号码与第一异网号码的亲密度大于预设值,但本网号码与第一异网号码未处于同一宽带,则确定第一异网号码为通话异网号码,通话异网号码为携号转网概率小于相关异网号码携号转网概率的异网号码。
71.基于本网号码与第一异网号码的亲密度以及是否处于同一宽带,服务器可以确定本网号码与异网号码对应关系数据(也可以表示为data_bw_yw_relation),data_bw_yw_relation可以包括本网号码、异网号码、对应关系类型(也可以表示为relation_type),示例性的,对应关系类型可以为同宽带关系(本网号码与上述相关异网号码之间的关系)、也可以为通话关系(本网号码与上述通话异网号码之间的关系)、还可以为同宽带关系+通话关系(本网号码与上述目标异网号码之间的关系)。
72.基于本技术实施例提供的技术方案,服务器在确定使用同一宽带的多个终端设备对应的电话号码中的本网号码和多个异网号码之后,确定本网号码和第一异网号码之间的亲密度。在确定本网号码和第一异网号码之间的亲密度大于预设值的情况下,服务器确定第一异网号码为目标异网号码。如此,服务器可以在本网号码与第一异网号码亲密度大于预设值的基础上,确定本网号码与第一异网号码处于同一宽带,以确定本网号码与第一异网号码具有家庭关系,可以提高确定与本网号码具有家庭关系的异网号码的准确性。
73.一种可能的实施例中,本技术实施例提供的确定方法,如图4所示,上述s301中,服务器确定使用同一宽带的多个终端设备对应的电话号码中的本网号码和多个异网号码的方法具体可以包括下述s3011-s3012:
74.s3011、服务器根据预设规则,获取使用宽带的多个号码。
75.其中,预设规则用于从宽带的数据中提取号码,使用宽带的多个号码可以为使用宽带进行上网的多个号码。
76.需要说明的,预设规则可以为服务器根据移动网络中的o域数据生成统一资源定位系统url中的号码提取规则,号码提取规则可以通过主机名信息、号码参数名称以及符合号码数字格式信息确定。
77.示例性的,预设规则的表达式可以为:
78.http://(.*?)/.*/([a-za-z_-]*=)([1][3-9][0-9]{9})[^0-9]。
[0079]
其中,(.*?)表示主机名信息,主机名信息可以包括终端设备的型号数据和一个随机的唯一标识符数据。例如,主机名信息可以为mi6-a12b34b32,也可以为mi6-b12-b34-b2。([a-za-z_-]*=)表示号码参数名称,例如可以为mobile,也可以为phone。([1][3-9][0-9]{9})可以为号码信息,号码信息包括号码所对应的数字。
[0080]
需要说明的,在服务器根据预设规则,获取使用宽带的多个号码之前,服务器可以将根据预设规则从url中提取出来的号码与包括该url的o域数据中的号码做对比,若根据预设规则从url中提取出来的号码与包括该url的o域数据中的号码相同,则服务器判断根据预设规则从url中提取出来的号码正确,以得到预设规则的号码提取正确率。当预设规则的号码提取正确率大于预设门限时,服务器确定使用该预设规则。
[0081]
s3012、服务器将多个号码与预设号码数据库对比,以确定多个号码中的本网号码和异网号码。
[0082]
其中,预设号码数据库包括多个本网号码。例如,预设号码数据库可以为b域数据中的号码数据库。
[0083]
作为一种可能的实现方式,服务器可以将多个号码中存在于预设号码数据库中的号码确定为本网号码,将多个号码中不存在于预设号码数据库中的号码确定为异网号码。
[0084]
由此,本技术中服务器通过将多个号码与预设号码数据库对比,可以准确的区别出同一宽带中的本网号码与异网号码。
[0085]
一种可能的实施例中,如图5所示,本技术实施例提供的方法还可以包括下述s401-s402:
[0086]
s401、服务器获取预设时间段内本网号码与异网号码之间的通话数据。
[0087]
作为一种可能的实现,服务器可以从o域数据中获取预设时间段内本网号码与异网号码之间的通话时间和通话次数。
[0088]
s402、服务器根据通话数据,确定本网号码与异网号码的亲密度。
[0089]
作为一种可能的实现方式,服务器可以将本网号码与异网号码的通话数据进行标准化处理,以确定本网号码与异网号码的亲密度。
[0090]
示例性的,本网号码与异网号码的亲密度可以通过以下公式确定:
[0091]
call_relation=call_cnt^+call_len^+call_day^。
[0092]
其中,call_relation表示本网号码与异网号码的亲密度,call_cnt^表示标准化处理后的通话总次数,call_len^表示标准化处理后的通话总时长=call_len,call_day^表示标准化处理后的通话总天数。
[0093]
示例性的,服务器可以通过以下公式进行标准化处理:
[0094][0095]
其中,x^表示标准化处理的数据,x表示实际数据,μ表示实际数据的平均数,σ表示原始数据标准差。
[0096]
以预设时间段为一个月,x为通话总次数,x^=call_cnt^为例,以下表1作为异网号码与本网号码的通话总次数数据。
[0097]
表1
[0098][0099]
需要说明的是,表1的数据仅为示例性的。本技术实施例中,通话数据还可以包括其他号之间的通话数据,不予限制。
[0100]
结合上述表1中的数据,则该多个号码的月通话总次数平均数μ=(15+11+9+12+8+5)/6=10,月通话总次数的数据标准差σ={[(15-10)^2+(11-10)^2+(9-10)^2+(12-10)^2+(8-10)^2+(5-10)^2]/6}^(1/2)=3.16228,标准化后的异网用户a和本网用户d的月通话总次数x^=(15-10)/3.16228=1.58。
[0101]
需要说明的,call_len^与call_day^的标准化处理过程与上述call_cnt^的计算过程类似,在此不再赘述。
[0102]
进一步的,服务器可以根据其亲密度生成o域通话数据中异网号码通话关系数据(也可以表示为data_call_yw),通话关系数据中包含异网号码、与异网号码亲密度较高的预设数量的本网号码、亲密度。示例性的,预设数量可以为3个。
[0103]
由此,本技术通过以上标准化处理过程,可以准确的确定本网用户与异网用户的通话关联程度。
[0104]
一种可能的实施例中,如图6所示,本技术实施例提供的方法还可以包括下述s501-s502:
[0105]
s501、服务器根据用户特征数据以及预设携号转网模型,确定异网号码的携号转网概率。
[0106]
其中,预设携号转网模型用于确定号码的携号转网概率。预设携号转网模型可以为逻辑回归模型logistic regression、决策树模型decision trees、k近邻算法模型(k-nn,k nearest neighbor)、支持向量机模型(svm,support vector machine)、朴素贝叶斯模型naive bayes、随机森林模型random forest、增强学习模型adaboost、提升机器算法模型lightgbm、神经网络模型neural networks。该预设模型为根据预设算法以及训练数据确定,预设算法与预设模型的类型对应,例如,逻辑回归模型logistic regression对应的算法可以为逻辑回归算法。
[0107]
其中,用户特征数据包括本网号码(也可以表示为bw_msisdn)、本网号码使用的宽带账号数量(也可以表示为edpi_num)、联系号码是本网号码的宽带账号的数量(也可以表
示为contact_num)、付费号码是本网号码的宽带账号的数量(也可以表示为payer_num)、本网号码当月宽带付费总和(也可以表示为sum_payme nt)、存在异网号码的宽带账号的数量(也可以表示为yw_account_num)、同一宽带下异网号码的数量(也可以表示为yw_user_epdi_num)、通话关系密切的异网号码数量(也可以表示为yw_user_call_num)、本网号码与异网号码的平均亲密度(也可以表示为avg_call_relation)。
[0108]
其中,服务器可以从b域数据中的本网宽带联系号码数据(也可以表示为data_b_bw_contact,data_b_bw_contact包括号码和宽带账号)获取本网号码,也可以从data_edpi_bw_msisdn获取本网号码,还可以从b域数据中的本网宽带付费号码数据(也可以表示为data_b_bw_payer,data_b_bw_payer包括号码和宽带账号)获取本网号码。
[0109]
服务器可以通过查看bw_msisdn在data_edpi_bw_msisdn中对应多少个不同的宽带账号确定edpi_num。服务器可以通过查看bw_msisdn在数据data_b_bw_contact中对应多少个不同的宽带账号确定contact_num。服务器可以通过查看bw_msisdn在数据data_b_bw_payer中对应多少个不同的宽带账号确定payer_num。服务器可以通过数据data_b_bw_payer得到本网宽带付费号码及其对应的宽带账号,并从b域数据获取宽带账号的本月出账费用数据(也可以表示为data_b_account_payment),以确定sum_payment。
[0110]
服务器可以通过data_edpi_yw_msisdn、异网应用程序(app,application)流量的宽带账号数据data_edpi_yw_account以及data_b_yw_contact,得到所有存在异网号码的宽带账号yw_account_num。服务器可以通过主机host和url字段筛选宽带数据中为异网app产生的流量数据,输出有过异网app流量的宽带账号数据data_edpi_yw_account。例如,如果宽带数据中host字段包含“10086”字符,或host字段包含“chinamobile”字符,或user agent字段包含“chinamobile”字符,则判断该条流量数据由中国移动官方app(异网app)产生。
[0111]
服务器可以通过data_edpi_yw_msisdn以及data_b_yw_contact,得到异网号码与宽带账号的对应关系,再通过data_edpi_bw_msisdn、data_b_bw_contact以及data_b_bw_payer,可得到本网号码与宽带账号的对应关系,基于异网号码与宽带账号的对应关系以及本网号码与宽带账号的对应关系,可以得到与本网用户同一宽带下的异网用户数量yw_user_epdi_num。
[0112]
服务器可以通过bw_msisdn在data_call_yw中对应多少个不同的yw_msisdn确定通话关系密切的异网号码数量yw_user_call_num。服务器可以通过查看bw_msisdn在数据data_call_yw中对应的call_relation的平均值确定平均通话关系密切指数avg_call_relation。
[0113]
作为一种可能的实现方式,服务器可以将用户特征数据输入到预设携号转网模型用于确定号码的携号转网概率。
[0114]
进一步的,服务器可以根据用户特征数据以及预设携号转网模型,确定异网号码在第二预设时间内的概率,第二预设时间段为第一预设时间段的下一个时间段。
[0115]
s502、若异网号码的携号转网概率大于预设概率,则服务器向本网号码对应的终端设备发送第一通知信息。
[0116]
其中,第一通知信息用于通知对异网号码进行携号转网的操作。
[0117]
示例性的,第一通知信息可以包括:根据本网号码的上网偏好特征,在本网号码成
功引导异网号码携号转网后,根据异网号码携号转网数量,赠送本网号码符合其偏好的增值业务或产品的通知信息,例如,增值业务或产品可以为视频类会员、游戏类加速包、打车类充值卡、智能家电、智能手机等。
[0118]
又一种示例中,第一通知信息可以包括:引导本网号码使异网号码成为本网号码副卡的优惠活动信息。
[0119]
作为一种可能的实现方式,服务器可以根据以下预设公式确定异网号码携号转网概率:
[0120]
transfer_score=edpi_num^+contact_num^+payer_num^+sum_payment^+yw_ac count_num^+yw_user_edpi_num^+yw_user_call_num^。
[0121]
其中,transfer_score异网号码携号转网概率,edpi_num^可以表示标准化处理后的本网号码使用的宽带账号数量、contact_num^可以表示标准化处理后的联系号码是本网号码的宽带账号的数量、payer_num^可以表示标准化处理后的付费号码是本网号码的宽带账号的数量、sum_payment^可以表示标准化处理后的本网号码当月宽带付费总和、yw_account_num^可以表示标准化处理后的存在异网号码的宽带账号的数量、yw_user_edpi_num^可以表示标准化处理后的同一宽带下异网号码的数量、yw_user_call_num^可以表示标准化处理后的通话关系密切的异网号码数量。标准化处理的具体流程可以参照s402,在此不予赘述。
[0122]
需要说明的,服务器可以在预设时间内确定接收第一通知信息的异网号码是否在服务器进行注册,若已注册,则服务器判断该异网号码成功携号转网。
[0123]
一种可能的实施例中,在无法获取到历史数据的情况下,如图7所示,本技术实施例提供的方法还可以包括下述s601-s602:
[0124]
s601、服务器根获取多个异网号码在第一预设时间段内的实际携号转网的数据。
[0125]
其中,第一预设时间段可以为任一时间段,实际携号转网的数据获取方式可以参考s502的说明,在此不予赘述。
[0126]
需要说明的,实际携号转网的数据可以用数字0和1表示,例如,异网号码的实际携号转网的数据为0时,则表示该异网号码没有进行携号转网,异网号码的实际携号转网的数据为1时,则表示该异网号码进行了携号转网。
[0127]
s602、服务器将多个异网号码在第一预设时间内的实际携号转网的数据以及用户特征数据作为训练数据,并根据预设算法,训练得到第一携号转网概率预测模型。
[0128]
其中,第一携号转网概率预测模型为准确率最高的预设携号转网模型。
[0129]
作为一种可能实现方式,服务器可以基于用户特征数据和实际携号转网的数据构建训练集数据和测试集数据,经过测试训练得到第一携号转网概率预测模型。
[0130]
一种可能的实施例中,在获取到历史数据的情况下,该方法还可以包括:
[0131]
s603、服务器根据历史数据以及预设算法,训练得到预设携号转网模型。
[0132]
其中,历史数据包括历史用户特征数据以及对应的携号转网结果。
[0133]
作为一种可能实现方式,服务器可以根据历史用户特征数据以及对应的携号转网结果构建训练集数据和测试集数据,经过测试训练得到准确率最高的预设携号转网模型。
[0134]
由此,本技术可以通过训练预设模型。可以准确的预测异网用户携号转网的概率。
[0135]
一种可能的实施例中,该方法还可以包括:
[0136]
s701、服务器获取多个异网号码在第二预设时间段内的实际携号转网的数据。
[0137]
其中,第二预设时间段为所述第一预设时间段的下一个时间段。
[0138]
s702、服务器使用多个异网号码在第二预设时间段内的实际携号转网的数据对预设携号转网模型进行更新,得到更新后的预设携号转网模型。
[0139]
作为一种可能的实现方式,服务器可以获取第二预设时间段内的实际携号转网的数据,重新根据预设算法训练携号转网模型,从而实现更新预设携号转网模型。
[0140]
一种可能的实施例中,本技术实施例提供的方法还可以包括下述s801。
[0141]
s801、服务器根据预设规则将宽带数据与宽带日志中的宽带账号相关联。
[0142]
其中,宽带数据包括:源网际互连协议ip、源端口、流量生成时间,宽带日志可以为宽带鉴权,授权,计费(aaa,authentication authorization accounting)日志,aaa日志包括:网络地址转换(nat,network address translation)ip、nat起始范围端口、nat结束范围端口、宽带账号上线时间、宽带账号下线时间;预设规则包括:源ip与nat ip相同、源端口大于nat起始端口且源端口小于nat结束端口、宽带数据生成时间在宽带账号上线时间以及宽带下线时间范围内。由此,本技术可以准确的将每条宽带数据与相应的宽带账号相关联。一种可能的实施例中,如图8所示,本技术实施例提供的方法还可以包括s1~s8。
[0143]
s1、服务器关联宽带数据与宽带账号。
[0144]
其中,s1的具体步骤可以参照上述s701中的描述,在此不予赘述。
[0145]
s2、服务器生成预设规则。
[0146]
其中,s2的具体步骤可以参照上述s3011中的描述,在此不予赘述。
[0147]
s3、服务器生成多个本网号码。
[0148]
其中,s3的具体步骤可以参照上述s3012中的描述,在此不予赘述。
[0149]
s4、服务器从b域数据、宽带数据以及o域数据获取异网号码特征数据。
[0150]
其中,s4的具体步骤可以参照上述s501中的描述,在此不予赘述。
[0151]
s5、服务器融合异网号码特征数据。
[0152]
其中,s5的具体步骤可以参照上述s501中的描述,在此不予赘述。
[0153]
s6、服务器生成异网号码携号转网概率。
[0154]
其中,s6的具体步骤可以参照上述s501-s502以及s601-s602中的描述,在此不予赘述。
[0155]
s7、服务器发送第一通知消息。
[0156]
其中,s7的具体步骤可以参照上述s502中的描述,在此不予赘述。
[0157]
s8、服务器反馈异网号码携号转网结果。
[0158]
其中,s8的具体步骤可以参照上述s502中的描述,在此不予赘述。
[0159]
本技术实施例可以根据上述方法示例对服务器进行功能模块或者功能单元的划分,例如,可以对应各个功能划分各个功能模块或者功能单元,也可以将两个或两个以上的功能集成在两个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块或者功能单元的形式实现。其中,本技术实施例中对模块或者单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0160]
图9示出了上述实施例中所涉及的确定装置的一种可能的结构示意图。如图9所示,确定装置90包括:确定单元901。
[0161]
确定单元901,确定使用同一宽带的多个终端设备对应的电话号码中的本网号码和多个异网号码;例如,如图3所示,确定单元901可以用于执行s301。
[0162]
确定单元901,还用于在本网号码和第一异网号码之间的亲密度大于预设值时,确定第一异网号码为目标异网号码,多个异网号码包括第一异网号码,亲密度用于表征号码之间的通话关联程度。例如,如图3所示,确定单元901可以用于执行s302。
[0163]
一种可能的设计中,确定单元901,具体用于:根据预设规则,获取使用宽带的多个号码,预设规则用于从宽带的数据中提取号码;将多个号码与预设号码数据库对比,以确定多个号码中的本网号码和异网号码,预设号码数据库包括多个本网号码。例如,如图4所示,确定单元901可以用于执行s3011-s3011。
[0164]
一种可能的设计中,确定装置还包括:获取单元902,获取单元902用于获取预设时间段内本网号码与异网号码之间的通话数据,通话数据包括通话时间和通话次数;例如,如图5所示,获取单元902可以用于执行s401。确定单元901,还用于根据通话数据,确定亲密度。例如,如图5所示,确定单元901可以用于执行s402。
[0165]
一种可能的设计中,确定装置还包括:发送单元903;确定单元901还用于根据用户特征数据以及预设携号转网模型,确定异网号码的携号转网概率,预设携号转网模型用于确定号码的携号转网概率;其中,用户特征数据包括本网号码、本网号码使用的宽带账号数量、联系号码是本网号码的宽带账号的数量、付费号码是本网号码的宽带账号的数量、本网号码当月宽带付费总和、存在异网号码的宽带账号的数量、同一宽带下异网号码的数量、通话关系密切的异网号码数量、本网号码与异网号码的平均亲密度。例如,如图6所示,确定单元901可以用于执行s502。发送单元903,用于在异网号码的携号转网概率大于预设概率时,向本网号码对应的终端设备发送第一通知信息,第一通知信息用于通知对异网号码进行携号转网的操作。例如,如图6所示,发送单元903可以用于执行s502。
[0166]
一种可能的设计中,确定装置还包括:训练单元904;获取单元902,用于在无法获取到历史数据的情况下,获取多个异网号码在第一预设时间段内的实际携号转网的数据;训练单元904,用于将多个异网号码在第一预设时间内的实际携号转网的数据以及用户特征数据作为训练数据,并根据预设算法,训练得到第一携号转网概率预测模型;确定单元,具体用于根据用户特征数据以及预设携号转网模型,确定异网号码在第二预设时间内的概率,第二预设时间段为第一预设时间段的下一个时间段。
[0167]
一种可能的设计中,训练单元904,还用于在获取到历史数据的情况下,根据历史数据以及预设算法,训练得到预设携号转网模型,历史数据包括历史用户特征数据以及对应的携号转网结果。例如,如图7所示,训练单元904可以用于执行s601-s602。
[0168]
一种可能的设计中,确定装置还包括:更新单元905;获取单元902,还用于获取多个异网号码在第二预设时间段内的实际携号转网的数据;更新单元905,用于使用多个异网号码在第二预设时间段内的实际携号转网的数据对预设携号转网模型进行更新,得到更新后的预设携号转网模型。
[0169]
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前
述方法实施例中的对应过程,在此不再赘述。
[0170]
本技术实施例提供一种包含指令的计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行上述方法实施例的目标异网号码的确定方法。
[0171]
本技术实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当目标异网号码的确定装置执行该指令时,该目标异网号码的确定装置执行上述方法实施例所示的方法流程中目标异网号码的确定装置执行的各个步骤。
[0172]
其中,计算机可读存储介质,例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(random access memory,ram)、只读存储器(read-only memory,rom)、可擦式可编程只读存储器(erasable programmable read only memory,eprom)、寄存器、硬盘、光纤、便携式紧凑磁盘只读存储器(compact disc read-only memory,cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合、或者本领域熟知的任何其它形式的计算机可读存储介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于特定用途集成电路(application specific integrated circuit,asic)中。在本技术实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0173]
以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何在本技术揭露的技术范围内的变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应该以权利要求的保护范围为准。

技术特征:


1.一种目标异网号码的确定方法,其特征在于,所述方法包括:确定使用同一宽带的多个终端设备对应的电话号码中的本网号码和多个异网号码;若所述本网号码和第一异网号码之间的亲密度大于预设值,则确定所述第一异网号码为目标异网号码,所述多个异网号码包括所述第一异网号码,所述亲密度用于表征号码之间的通话关联程度。2.根据权利要求1所述的方法,其特征在于,所述确定使用同一宽带的多个终端设备对应的电话号码中的本网号码和多个异网号码,包括:根据预设规则,获取使用所述宽带的多个号码,所述预设规则用于从宽带的数据中提取号码;将所述多个号码与预设号码数据库对比,以确定所述多个号码中的所述本网号码和所述异网号码,所述预设号码数据库包括多个本网号码。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:获取预设时间段内所述本网号码与所述异网号码之间的通话数据,所述通话数据包括通话时间和通话次数;根据所述通话数据,确定所述亲密度。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:根据用户特征数据以及预设携号转网模型,确定所述异网号码的携号转网概率,所述预设携号转网模型用于确定号码的携号转网概率;其中,所述用户特征数据包括本网号码、本网号码使用的宽带账号数量、联系号码是本网号码的宽带账号的数量、付费号码是本网号码的宽带账号的数量、本网号码当月宽带付费总和、存在异网号码的宽带账号的数量、同一宽带下异网号码的数量、通话关系密切的异网号码数量、本网号码与异网号码的平均亲密度中的一个或多个;若所述异网号码的携号转网概率大于预设概率,则向所述本网号码对应的终端设备发送第一通知信息,所述第一通知信息用于通知对异网号码进行携号转网的操作。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:在无法获取到历史数据的情况下,获取所述多个异网号码在第一预设时间段内的实际携号转网的数据;将所述多个异网号码在第一预设时间内的实际携号转网的数据以及所述用户特征数据作为训练数据,并根据预设算法,训练得到第一携号转网概率预测模型;所述根据用户特征数据以及预设携号转网模型,确定所述异网号码的携号转网概率,包括:根据所述用户特征数据以及所述预设携号转网模型,确定所述异网号码在所述第二预设时间内的概率,所述第二预设时间段为所述第一预设时间段的下一个时间段。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:获取所述多个异网号码在第二预设时间段内的实际携号转网的数据;使用所述多个异网号码在第二预设时间段内的实际携号转网的数据对所述预设携号转网模型进行更新,得到更新后的预设携号转网模型。7.一种目标异网号码的确定装置,其特征在于,所述确定装置包括:确定单元;所述确定单元包括第一确定模块以及第二确定模块;
所述第一确定模块,用于确定使用同一宽带的多个终端设备对应的电话号码中的本网号码和多个异网号码;所述第二确定模块,用于在所述本网号码和第一异网号码之间的亲密度大于预设值时,确定所述第一异网号码为目标异网号码,所述多个异网号码包括所述第一异网号码,所述亲密度用于表征号码之间的通话关联程度。8.根据权利要求7所述的确定装置,其特征在于,所述确定单元,具体用于:根据预设规则,获取使用所述宽带的多个号码,所述预设规则用于从宽带的数据中提取号码;将所述多个号码与预设号码数据库对比,以确定所述多个号码中的所述本网号码和所述异网号码,所述预设号码数据库包括多个本网号码。9.根据权利要求7或8所述的确定装置,其特征在于,所述确定装置还包括:获取单元;所述获取单元,用于获取预设时间段内所述本网号码与所述异网号码之间的通话数据,所述通话数据包括通话时间和通话次数;所述确定单元,用于根据所述通话数据,确定所述亲密度。10.根据权利要求9所述的确定装置,其特征在于,所述确定装置还包括:发送单元;所述确定单元,还用于根据用户特征数据以及预设携号转网模型,确定所述异网号码的携号转网概率,所述预设携号转网模型用于确定号码的携号转网概率;其中,所述用户特征数据包括本网号码、本网号码使用的宽带账号数量、联系号码是本网号码的宽带账号的数量、付费号码是本网号码的宽带账号的数量、本网号码当月宽带付费总和、存在异网号码的宽带账号的数量、同一宽带下异网号码的数量、通话关系密切的异网号码数量、本网号码与异网号码的平均亲密度中的一个或多个;所述发送单元,用于在所述异网号码的携号转网概率大于预设概率时,向所述本网号码对应的终端设备发送第一通知信息,所述第一通知信息用于通知对异网号码进行携号转网的操作。11.根据权利要求10所述的确定装置,其特征在于,所述确定装置还包括:训练单元;所述获取单元,用于在无法获取到历史数据的情况下,获取所述多个异网号码在第一预设时间段内的实际携号转网的数据;所述训练单元,用于将所述多个异网号码在第一预设时间内的实际携号转网的数据以及所述用户特征数据作为训练数据,并根据预设算法,训练得到第一携号转网概率预测模型;所述确定单元,具体用于根据所述用户特征数据以及所述预设携号转网模型,确定所述异网号码在所述第二预设时间内的概率,所述第二预设时间段为所述第一预设时间段的下一个时间段。12.根据权利要求11所述的确定装置,其特征在于,所述确定装置还包括:更新单元;所述获取单元,还用于获取所述多个异网号码在第二预设时间段内的实际携号转网的数据;所述更新单元,还用于使用所述多个异网号码在第二预设时间段内的实际携号转网的数据对所述预设携号转网模型进行更新,得到更新后的预设携号转网模型。13.一种服务器,其特征在于,所述服务器包括:处理器、数据处理接口和存储器;其中,
存储器用于存储一个或多个程序,该一个或多个程序包括计算机执行指令,当所述服务器运行时,处理器执行该存储器存储的该计算机执行指令,以使所述服务器执行权利要求1-6中任一项所述的方法。14.一种存储一个或多个程序的计算机可读存储介质,其特征在于,所述一个或多个程序包括指令,当所述指令被计算机执行时使所述计算机执行所述权利要求1-6中任一项所述的方法。

技术总结


本申请提供一种目标异网号码的确定方法、装置、设备及存储介质,涉及通信技术领域,能够提高终端设备接入所处区域目标异网号码的效率。该方法包括:确定使用同一宽带的多个终端设备对应的电话号码中的本网号码和多个异网号码;若本网号码和第一异网号码之间的亲密度大于预设值,则确定第一异网号码为目标异网号码,多个异网号码包括第一异网号码,亲密度用于表征号码之间的通话关联程度。于表征号码之间的通话关联程度。于表征号码之间的通话关联程度。


技术研发人员:

王天翼 程新洲 王泽林 曹晓冬 韩玉辉 成晨 宋春涛 董润莎 李京辉 郭省力

受保护的技术使用者:

中国联合网络通信集团有限公司

技术研发日:

2022.08.10

技术公布日:

2022/11/25

本文发布于:2024-09-20 13:35:51,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/8392.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:网号   本网   号码   多个
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议