网络通信异常用户识别方法、系统、设备以及介质与流程



1.本发明涉及通信技术,特别涉及一种网络通信异常用户识别方法、系统、设备以及介质。


背景技术:



2.随着互联网和移动终端的快速发展,电信犯罪频繁发生。
3.目前针对电话的识别主要来自用户的举报,以及建立黑白名单机制,根据电话的号码与电话库预存的号码的相似度来进行电话识别与拦截。但是电话的生存周期往往很短,而拦截机制信息更新滞后,保护性不强。电话行为的处理往往要等到受害者报案后再进行,此时民众已经受骗并且遭受了财物损失,行为不能被及时制止,受害者想要追回损失也只能等待警方破案,或者通过银行渠道进行。
4.手机用户对电话的过滤要求越来越高。但越来越多分子的通话行为趋于隐蔽化,通话行为相关的特征减弱,仅仅通过对通话文本进行分析识别,不可能进一步的提升手机系统对不良呼叫识别的精准率和召回率。


技术实现要素:



5.本发明要解决的技术问题是,能够通精确的对网络通信异常用户进行识别。
6.为解决上述技术问题,本发明提供的网络通信异常用户识别方法,其包括以下步骤:
7.s1.提取一终端的短信数据、流量数据以及通话数据;
8.s2.将所述短信数据与预存短信特征数据相比对,获得一第一匹配指数
9.将所述流量数据与预存流量曲线相拟合,获得一第二匹配指数;
10.将所述通话数据与预存通话数据相对比,获得一第三匹配指数;
11.s3.根据所述第一匹配指数、第二匹配指数以及第三匹配指数生成一异常指数;
12.s4.如果所述异常指数大于一异常阈值,则将所述终端关联一标识符,以指示该终端所关联的用户为异常用户。
13.较佳的,所述预存短信特征数据包括敏感词、所述敏感词出现次数、所述敏感词之间的时间间隔以及所述敏感词之间的间隔字符数;
14.将所述短信数据与预存短信特征数据相比对,获得所述第一匹配指数的方法包括以下步骤:
15.s211.根据所述短信数据提取与所述短信数据对应的短信文本;
16.s212.将所述短信文本进行分词,提取获得短信数据的多个敏感词、所述敏感词出现次数、所述敏感词之间的时间间隔以及所述敏感词之间的间隔字符数;
17.s213.根据所述敏感词、所示敏感词出现次数、所述敏感词之间的时间间隔以及所述敏感词之间的间隔字符数,获得所述短信数据与所述预存短信特征数据进行对比,将获得的最高匹配指数作为第一匹配指数。
18.较佳的,所示预存流量曲线中包含n段依次连接的直线段,n为大于1的整数;
19.将所述流量数据与一预存流量曲线相拟合,获得所述第二匹配指数的方法包括以下步骤:
20.s221.根据所述流量数据于一流量时间坐标系中获得一流量曲线,所述流量时间坐标系以时间为横轴,以流速为纵轴;
21.s222.将所述流量曲线拟合成一流量折线,所述流量折线包含n段依次连接的直线段;
22.s223.将所述流量折线与所述预存流量曲线进行匹配获得所述第二匹配指数。
23.较佳的,将所述通话数据与一预存通话数据相对比,获得所述第三匹配指数的方法包括以下步骤:
24.s231.数据服务器13根据通话数据提取与一终端进行数据交换的另一终端的终端id;
25.s232.将提取的该另一终端的终端id与所述预存通话数据中的终端id进行比对,获得所述第三匹配指数。
26.较佳的,根据所述第一匹配指数、所述第二匹配指数以及第三匹配指数生成一异常指数包括以下步骤:
27.s31.将所述第一匹配指数、所述第二匹配指数以及所述第三匹配指数进行加权累加,获得一加权累加值;
28.s32.将所述加权累加值进行归一化获得所述异常指数。
29.为解决上述技术问题,本发明提供的一种网络通信异常用户识别系统,其包括:
30.提取模块701,用于提取一终端的短信数据、流量数据以及通话数据;
31.短信模块702,用于将所述短信数据与预存短信特征数据相比对,获得一第一匹配指数;
32.流量模块703,用于将所述流量数据与一预存流量曲线相拟合,获得一第二匹配指数;
33.通话模块704,用于将所述通话数据与一预存通话数据相对比,获得一第三匹配指数;
34.指数模块705,用于根据第一匹配指数、第二匹配指数以及第三匹配指数生成一异常指数;
35.标识模块706,基于所述异常指数大于一异常阈值,将所述终端关联一标识符,以指示该终端所关联的用户为异常用户。
36.为解决上述技术问题,本发明提供的一种网络通信异常用户识别设备,其包括处理器 810及存储器820;
37.所述存储器820中存储有所述处理器810的可执行指令;
38.所述处理器810配置为经由执行所述可执行指令来执行上述的网络通信异常用户识别方法的步骤。
39.为解决上述技术问题,本发明提供的一种算机可读存储介质,其用于存储程序,所述程序被执行时实现上述网络通信异常用户识别方法的步骤。
40.本发明的网络通信异常用户识别方法,能够通过提取手机终端中的短信文本、数
据流量、以及通话情况,精确的对网络通信异常用户(例如涉嫌用户)进行识别。
附图说明
41.为了更清楚地说明本发明的技术方案,下面对本发明所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
42.图1是本发明的网络通信异常用户识别方法一实施例流程示意图;
43.图2是一种网络通信异常用户识别方法的具体实施场景;
44.图3是本发明的网络通信异常用户识别方法一实施例的第一匹配指数获取方法流程示意图;
45.图4是本发明的网络通信异常用户识别方法一实施例的第二匹配指数获取方法流程示意图;
46.图5是一种曲线拟合示意图;
47.图6是本发明的网络通信异常用户识别方法一实施例的第三匹配指数获取方法流程示意图;
48.图7为本发明的异常用户识别系统一实施例结构框图;
49.图8是本发明的异常用户识别设备一实施例结构框图;
50.图9是本发明的计算机可读存储介质一实施例的结构示意图。
51.从以下结合附图的详细描述中,本发明的特征和优点将变得更加明显。贯穿附图,相同的附图标识相应元素。在附图中,相同附图标记通常指示相同的、功能上相似的和/或结构上相似的元件。
具体实施方式
52.下面将结合附图,对本发明中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其它实施例,都属于本发明保护的范围。
53.本技术中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
54.需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
55.实施例一
56.如图1所示,一种网络通信异常用户识别方法,包括以下步骤:
57.s1.提取一终端的短信数据、流量数据以及通话数据;
58.s2.将所述短信数据与一预存短信特征数据相比对,获得一第一匹配指数;
59.将所述流量数据与一预存流量曲线相拟合,获得一第二匹配指数;
60.将所述通话数据与一预存通话数据相对比,获得一第三匹配指数;
61.s3.根据所述第一匹配指数、所述第二匹配指数以及第三匹配指数生成一异常指数;
62.s4.如果所述异常指数大于一异常阈值,则将所述终端关联一标识符,以指示该终端所关联的用户为异常用户。
63.图2是实施例一的网络通信异常用户识别方法的具体实施场景,一移动终端11与用户相关联。该移动终端11可以是任何一种可以与用户进行交互的人机交互电子产品,例如:智能手机、平板电脑以及台式电脑等。该终端装置的操作系统可以是任意操作系统,例如:android操作系统、ios操作系统。移动终端11通过网络12与数据服务器13相连,数据服务器13还可以是台式计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(cloud computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一松散耦合的计算机组成的虚拟超级计算机。网络12可以是互联网、广域网、城域网、vpn网络、无线自组织网络(ad hoc网络)等。数据服务器13由网络基础服务提供商运营维护。
64.实施例一的网络通信异常用户识别方法,能够通过提取手机终端中的短信文本、数据流量、以及通话情况,精确的对网络通信异常用户(例如涉嫌用户)进行识别。
65.实施例二
66.基于实施例一的网络通信异常用户识别方法,如图3所示,将所述短信数据与一预存短信特征数据相比对,获得所述第一匹配指数的方法包括以下步骤:
67.s211.根据所述短信数据提取与所述短信数据对应的短信文本;例如,数据服务器13 通过网络12提取移动终端11一定期间的短信数据,该期间可以为1小时、24小时等。数据服务器13需要对短信数据进行处理,获得相应的短信文本,例如:“我是****”。
68.s212.将所述短信文本进行分词,并获得多个敏感词、所述敏感词出现次数、所述敏感词之间的时间间隔以及所述敏感词之间的间隔字符数;例如,短信文本为“我是你领导”“给我转账”,对其进行分词后可以获得“我”、“是”、“你”、“领导”、“转账”,其中:“领导”、“转账”即为敏感词,“领导”出现次数为1,“转账”出现次数为1,“领导”、“转账”之间时间间隔为5min,“领导”、“转账”之间间隔字符为2。
69.s213.根据所述敏感词、所示敏感词出现次数、所述敏感词之间的时间间隔以及所述敏感词之间的间隔字符数,获得所述短信数据与所述预存短信特征数据进行对比,将获得的最高匹配指数作为第一匹配指数。
70.有一条预存短信特征数据同样包括敏感词、所示敏感词出现次数、所述敏感词之间的时间间隔以及所述敏感词之间的间隔字符数。如果该条预存短信特征数据中的敏感词、所示敏感词出现次数、敏感词之间的时间间隔以及敏感词之间的间隔字符数与提取得到的完全相同,则第一匹配指数为1,例如,两者均是“领导”、“转账”为敏感词,“领导”出现次数为1,“转账”出现次数为1,“领导”、“转账”之间时间间隔为5min,“领导”、“转账”之间间隔字符为2。
71.实施例三
72.基于实施例一的网络通信异常用户识别方法,如图4所示,将所述流量数据与一预
存流量曲线相拟合,获得所述第二匹配指数的方法包括以下步骤:
73.s221.根据所述流量数据于一流量时间坐标系中获得一流量曲线,所述流量时间坐标系以时间为横轴,所述流量时间坐标系以流速为纵轴;
74.s222.将所述流量曲线拟合成一流量折线,所述流量折线包含至少一个直线段;例如,如图5所示,在坐标系500中,流量曲线拟合形成流量折线510,流量折线包括了直线段 511以及直线段512。
75.s223.将所述流量折线与所述预存流量曲线进行匹配获得所述第二匹配指数,其中,所示预存流量曲线中包含的直线段数量与所示流量折线中的直线段数据相同。例如,如图5所示,一条预存流量曲线520同样包括了直线段521以及直线段522,如果直线段 511和直线段521夹角为0度,直线段512和直线段52夹角为0度,则第二匹配指数为 1。如果相应的夹角不为0,则根据相应比例获得第二匹配指数,该第二匹配指数小于1。
76.实施例四
77.基于实施例一的网络通信异常用户识别方法,如图6所示,将所述通话数据与一预存通话数据相对比,获得所述第三匹配指数的方法包括以下步骤:
78.s231.数据服务器13根据通话数据提取与终端进行数据交换的另一终端的终端id。例如,即移动终端11与另一个终端存在语音通话,则提取该另一终端的终端id,该终端 id通常为手机号码。
79.s232.将提取的该另一终端的终端id与所述预存通话数据中的终端id进行比对,获得所述第三匹配指数。
80.优选的,若所述预存通话数据中存在与该另一终端的终端id相同的终端id(例如手机号码),则所述第三匹配指数为1,否则为0。
81.实施例五
82.基于实施例一的网络通信异常用户识别方法,根据所述第一匹配指数、所述第二匹配指数以及第三匹配指数生成一异常指数包括以下步骤:
83.s31.将所述第一匹配指数、所述第二匹配指数以及所述第三匹配指数进行加权累加,获得一加权累加值;
84.s32.将所述加权累加值进行归一化获得所述异常指数。
85.例如,第一匹配指数为1,第二匹配指数为1,第三匹配指数为0,则加权累加后的加权累加值为2,对上述加权累加值归一化后为0.6。在步骤s4中,如果异常阈值为0.5,则该归一化后的值0.6大于0.5,该终端的用户为异常用户。
86.实施例六
87.如图7所示,一种网络通信异常用户识别系统700,包括:
88.提取模块701,提取一终端的短信数据、流量数据以及通话数据;
89.短信模块702,将所述短信数据与一预存短信特征数据相比对,获得一第一匹配指数;
90.流量模块703,将所述流量数据与一预存流量曲线相拟合,获得一第二匹配指数;
91.通话模块704,将所述通话数据与一预存通话数据相对比,获得一第三匹配指数;
92.指数模块705,根据第一匹配指数、第二匹配指数以及第三匹配指数生成一异常指数;
93.标识模块706,基于所述异常指数大于一异常阈值,将所述终端关联一标识符,以指示该终端所关联的用户为异常用户。
94.实施例七
95.如图8所示,一种网络通信异常用户识别设备800,包括处理器810、存储器820;
96.存储器820,其中存储有所述处理器810的可执行指令;
97.其中,所述处理器810配置为经由执行所述可执行指令来执行上述网络通信异常用户识别方法的步骤。
98.较佳的,异常用户识别设备800以通用计算设备的形式表现,异常用户识别设备800 的组件可以包括至少一个处理器810、至少一个存储器820、连接不同平台组件(包括存储器820和处理器810)的总线830、显示单元840等。
99.其中,存储器存储有程序代码,程序代码可以被处理器810执行,使得处理器810执行本说明书上述步骤。例如,处理器810可以执行如图1中所示的步骤。
100.存储器820可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram) 8201和/或高速缓存存储单元8202,还可以进一步包括只读存储单元(rom)8203。
101.存储器820还可以包括具有一组(至少一个)程序模块6205的程序/实用工具8204,这样的程序模块8205包括操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
102.总线830可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。
103.异常用户识别设备800也可以与一个或多个外部设备870(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该异常用户识别设备800交互的设备通信,和/或与使得该异常用户识别设备800能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o) 接口850进行。并且,异常用户识别设备800还可以通过网络适配器860与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线830与异常用户识别设备800的其它模块通信。应当明白,尽管图中未示出,可以结合异常用户识别设备800使用其它硬件和/或软件模块,例如微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器或数据备份存储平台等。
104.实施例八
105.如图9所示,一种计算机可读存储介质900,用于存储程序,所述程序被执行时实现上述网络通信异常用户识别方法的步骤。
106.计算机可读存储介质900,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如个人电脑上运行。可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
107.程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储
器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
108.计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。
109.可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
110.以上仅为本技术的优选实施例,并不用于限定本技术。对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。

技术特征:


1.一种网络通信异常用户识别方法,其特征在于,其包括以下步骤:s1.提取一终端的短信数据、流量数据以及通话数据;s2.将所述短信数据与预存短信特征数据相比对,获得一第一匹配指数;将所述流量数据与预存流量曲线相拟合,获得一第二匹配指数;将所述通话数据与预存通话数据相对比,获得一第三匹配指数;s3.根据所述第一匹配指数、第二匹配指数以及第三匹配指数生成一异常指数;s4.如果所述异常指数大于一异常阈值,则将所述终端关联一标识符,以指示该终端所关联的用户为异常用户。2.根据权利要求1所述的网络通信异常用户识别方法,其特征在于,所述预存短信特征数据包括敏感词、所述敏感词出现次数、所述敏感词之间的时间间隔以及所述敏感词之间的间隔字符数;将所述短信数据与预存短信特征数据相比对,获得所述第一匹配指数的方法包括以下步骤:s211.根据所述短信数据提取与所述短信数据对应的短信文本;s212.将所述短信文本进行分词,提取获得短信数据的多个敏感词、所述敏感词出现次数、所述敏感词之间的时间间隔以及所述敏感词之间的间隔字符数;s213.根据所述敏感词、所示敏感词出现次数、所述敏感词之间的时间间隔以及所述敏感词之间的间隔字符数,获得所述短信数据与所述预存短信特征数据进行对比,将获得的最高匹配指数作为第一匹配指数。3.根据权利要求1所述的网络通信异常用户识别方法,其特征在于,所示预存流量曲线中包含n段依次连接的直线段,n为大于1的整数;将所述流量数据与一预存流量曲线相拟合,获得所述第二匹配指数的方法包括以下步骤:s221.根据所述流量数据于一流量时间坐标系中获得一流量曲线,所述流量时间坐标系以时间为横轴,以流速为纵轴;s222.将所述流量曲线拟合成一流量折线,所述流量折线包含n段依次连接的直线段;s223.将所述流量折线与所述预存流量曲线进行匹配获得所述第二匹配指数。4.根据权利要求1所述的网络通信异常用户识别方法,其特征在于,将所述通话数据与一预存通话数据相对比,获得所述第三匹配指数的方法包括以下步骤:s231.数据服务器根据通话数据提取与一终端进行数据交换的另一终端的终端id;s232.将提取的该另一终端的终端id与所述预存通话数据中的终端id进行比对,获得所述第三匹配指数。5.根据权利要求1所述的网络通信异常用户识别方法,其特征在于,根据所述第一匹配指数、所述第二匹配指数以及第三匹配指数生成一异常指数包括以下步骤:s31.将所述第一匹配指数、所述第二匹配指数以及所述第三匹配指数进行加权累加,获得一加权累加值;s32.将所述加权累加值进行归一化获得所述异常指数。
6.一种网络通信异常用户识别系统,其特征在于,其包括:提取模块,用于提取一终端的短信数据、流量数据以及通话数据;短信模块,用于将所述短信数据与预存短信特征数据相比对,获得一第一匹配指数;流量模块,用于将所述流量数据与一预存流量曲线相拟合,获得一第二匹配指数;通话模块,用于将所述通话数据与一预存通话数据相对比,获得一第三匹配指数;指数模块,用于根据第一匹配指数、第二匹配指数以及第三匹配指数生成一异常指数;标识模块,基于所述异常指数大于一异常阈值,将所述终端关联一标识符,以指示该终端所关联的用户为异常用户。7.一种网络通信异常用户识别设备,其特征在于,其包括处理器及存储器;所述存储器中存储有所述处理器的可执行指令;所述处理器配置为经由执行所述可执行指令来执行权利要求1到6任一项的网络通信异常用户识别方法的步骤。8.一种算机可读存储介质,其特征在于,其用于存储程序,所述程序被执行时实现权利要求1到6任一项的网络通信异常用户识别方法的步骤。

技术总结


本发明公开了一种网络通信异常用户识别方法,其包括以下步骤:提取一终端的短信数据、流量数据以及通话数据;将所述短信数据与预存短信特征数据相比对,获得一第一匹配指数;将所述流量数据与预存流量曲线相拟合,获得一第二匹配指数;将所述通话数据与预存通话数据相对比,获得一第三匹配指数;根据所述第一匹配指数、第二匹配指数以及第三匹配指数生成一异常指数;如果所述异常指数大于一异常阈值,则将所述终端关联一标识符,以指示该终端所关联的用户为异常用户。本发明还公开了一种网络通信异常用户识别系统、设备以及介质。本发明,能够通精确的对网络通信异常用户进行识别。够通精确的对网络通信异常用户进行识别。够通精确的对网络通信异常用户进行识别。


技术研发人员:

周伟 许国泰 余景原 金豪 程德怿 陈兵

受保护的技术使用者:

上海市信息网络有限公司

技术研发日:

2022.08.09

技术公布日:

2022/11/25

本文发布于:2024-09-25 04:25:14,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/10057.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   指数   数据   终端
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议