异常数据检测方法、装置、电子设备及存储介质与流程



1.本公开的实施例涉及异常数据检测技术领域,尤其涉及一种异常数据检测方法、装置、电子设备及存储介质。


背景技术:



2.在互联网平台上提供了声纹验证的服务,声纹验证服务模块多次遭遇攻击性的验证行为,导致系统服务资源被占用,甚至是系统阶段性的瘫痪,严重影响了系统服务的稳定性,也浪费了不少人力和财力,降低了该项目的催收率和收益。
3.目前,多是通过机器扩容的检测方式,或基于深度学习的检测方式,或基于规则的检测方式进行检测,而机器扩容的检测方式浪费人力物力,并且还会出现类似问题,导致服务不稳定。而基于深度学习的检测方式需要大量标签数据,标注数据成本过高。基于规则的检测方式紧密结合业务规则,各个业务线规则差异较大,很多方案迁移到其他业务场景下并不适用。


技术实现要素:



4.本公开的实施例提供一种异常数据检测方法、装置、电子设备及存储介质,用以节省机器集成本,智能化管控带有攻击性的声纹数据的验证行为。
5.根据本公开的实施例的第一方面,提供了一种异常数据检测方法,其特征在于,包括:
6.获取在进行声纹验证过程中的声纹特征数据;
7.根据声纹验证场景信息,对所述声纹特征数据进行编码处理,生成编码声纹特征数据;
8.对所述编码声纹特征数据进行同维度转换处理,生成转换声纹特征数据;
9.识别所述声纹特征数据中的异常声纹数据。
10.可选地,所述获取在进行声纹验证过程中的声纹特征数据,包括:
11.获取在进行声纹验证过程中的对话特征、包序列特征和流量特征;
12.其中,所述对话特征包括:时间间隔特征和音量值特征,所述包序列特征包括:端口号特征、特征数据包大小特征,所述流量特征包括:具有特定标识的包数量和正向流特征。
13.可选地,所述根据声纹验证场景信息,对所述声纹特征数据进行编码处理,生成编码声纹特征数据,包括:
14.根据所述声纹验证场景信息,对所述声纹特征数据进行初始编码处理,生成初始编码特征数据;
15.对所述初始编码特征数据进行独热编码处理,生成所述编码声纹特征数据。
16.可选地,所述对所述编码声纹特征数据进行同维度转换处理,生成转换声纹特征数据,包括:
17.基于预设网络模型对所述编码声纹特征数据进行同维度转换处理,生成所述转换声纹特征数据;
18.其中,所述预设网络模型为采用独热编码后的声纹特征训练得到的。
19.可选地,所述识别所述声纹特征数据中的异常声纹数据,包括:
20.基于无监督学习检测算法对所述转换声纹特征数据中的异常声纹特征进行异常检测,得到所述声纹特征数据中的异常声纹数据。
21.可选地,所述基于无监督学习检测算法对所述转换声纹特征数据中的异常声纹特征进行异常检测,得到所述声纹特征数据中的异常声纹数据,包括:
22.基于所述无监督学习检测算法,获取所述转换声纹特征数据对应的特征数据密度;
23.根据所述特征数据密度,识别所述声纹特征数据中的异常声纹数据。
24.根据本公开的实施例的第二方面,提供了一种异常数据检测装置,其特征在于,包括:
25.声纹特征数据获取模块,用于获取在进行声纹验证过程中的声纹特征数据;
26.编码特征数据生成模块,用于根据声纹验证场景信息,对所述声纹特征数据进行编码处理,生成编码声纹特征数据;
27.转换特征数据生成模块,用于对所述编码声纹特征数据进行同维度转换处理,生成转换声纹特征数据;
28.异常声纹数据识别模块,用于识别所述声纹特征数据中的异常声纹数据。
29.可选地,所述声纹特征数据获取模块包括:
30.声纹特征数据获取单元,用于获取在进行声纹验证过程中的对话特征、包序列特征和流量特征;
31.其中,所述对话特征包括:时间间隔特征和音量值特征,所述包序列特征包括:端口号特征、特征数据包大小特征,所述流量特征包括:具有特定标识的包数量和正向流特征。
32.可选地,所述编码特征数据生成模块包括:
33.初始编码数据生成单元,用于根据所述声纹验证场景信息,对所述声纹特征数据进行初始编码处理,生成初始编码特征数据;
34.编码特征数据生成单元,用于对所述初始编码特征数据进行独热编码处理,生成所述编码声纹特征数据。
35.可选地,所述转换特征数据生成模块包括:
36.转换特征数据生成单元,用于基于预设网络模型对所述编码声纹特征数据进行同维度转换处理,生成所述转换声纹特征数据;
37.其中,所述预设网络模型为采用独热编码后的声纹特征训练得到的。
38.可选地,所述异常声纹数据识别模块包括:
39.异常声纹数据获取单元,用于基于无监督学习检测算法对所述转换声纹特征数据中的异常声纹特征进行异常检测,得到所述声纹特征数据中的异常声纹数据。
40.可选地,所述异常声纹数据获取单元包括:
41.特征数据密度获取子单元,用于基于所述无监督学习检测算法,获取所述转换声
纹特征数据对应的特征数据密度;
42.异常声纹数据识别子单元,用于根据所述特征数据密度,识别所述声纹特征数据中的异常声纹数据。
43.根据本公开的实施例的第三方面,提供了一种电子设备,包括:
44.处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述的异常数据检测方法。
45.根据本公开的实施例的第四方面,提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述任一项所述的异常数据检测方法。
46.本公开的实施例提供了一种异常数据检测方法、装置、电子设备及存储介质。通过获取在进行声纹验证过程中的声纹特征数据,根据声纹验证场景信息,对声纹特征数据进行编码处理,生成编码声纹特征数据,对编码声纹特征数据进行同维度转换处理,生成转换声纹特征数据,识别声纹特征数据中的异常声纹数据。本公开的实施例通过提取声纹验证场景下的声纹特征数据,并通过对提取的声纹特征数据进行编码和表征学习(即同维度的转换),可以节省机器集成本,智能化管控带有攻击性的声纹数据的验证行为。
附图说明
47.为了更清楚地说明本公开的实施例的技术方案,下面将对本公开的实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
48.图1为本公开的实施例提供的一种异常数据检测方法的步骤流程图;
49.图2为本公开的实施例提供的另一种异常数据检测方法的步骤流程图;
50.图3为本公开的实施例提供的一种异常点检测的示意图;
51.图4为本公开的实施例提供的一种异常数据检测装置的结构示意图。
具体实施方式
52.下面将结合本公开的实施例中的附图,对本公开的实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开的实施例一部分实施例,而不是全部的实施例。基于本公开的实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开的实施例保护的范围。
53.实施例一
54.参照图1,示出了本公开的实施例提供的一种异常数据检测方法的步骤流程图,如图1所示,该异常数据检测方法可以包括如下步骤:
55.步骤101:获取在进行声纹验证过程中的声纹特征数据。
56.本公开的实施例可以应用于对提取声纹验证场景下的声纹特征数据进行编码及表征学习,以解决声纹验证行为非平级问题,从而实现异常声纹特征的检测的场景中。
57.声纹特征数据是指在进行声纹验证的过程中产生的特征数据,在本示例中,声纹特征数据可以包括:对话特征、包序列特征和流量特征,其中,对话特征可以包括:时间间隔
特征和音量值特征,包序列特征可以包括:端口号特征、特征数据包大小特征,流量特征可以包括:具有特定标识的包数量和正向流特征,对于上述声纹特征数据将在下述实施例二中进行详细描述,本实施例在此不再加以赘述。
58.在需要进行声纹异常数据的检测时,可以获取在声纹验证过程中产生的声纹特征数据。
59.在获取到声纹验证过程中的声纹特征数据之后,执行步骤102。
60.步骤102:根据声纹验证场景信息,对所述声纹特征数据进行编码处理,生成编码声纹特征数据。
61.编码声纹特征数据是指对采集的声纹特征数据进行编码处理后得到的特征数据。
62.在获取到声纹验证过程中的声纹特征数据之后,可以根据声纹验证场景信息对声纹特征数据进行编码,以生成编码声纹特征数据。具体地,在进行声纹特征数据的编码过程中可以加入验证场景信息(如智能催收等场景),在进行编码处理之后即可得到编码声纹特征数据。
63.在根据声纹验证场景信息对声纹特征数据进行编码处理生成编码声纹特征数据之后,执行步骤103。
64.步骤103:对所述编码声纹特征数据进行同维度转换处理,生成转换声纹特征数据。
65.编码声纹特征数据是不同维度的特征数据,此时,需要将不同维度的编码声纹特征数据转换为同一维度的特征数据。
66.在本示例中,在对声纹特征数据进行编码处理生成编码声纹特征数据之后,则可以对编码声纹特征数据进行同维度转换处理,以将不同维度的特征数据转换为同一维度的特征数据,即可得到转换声纹特征数据。
67.在对编码声纹特征数据进行同维度转换处理生成转换声纹特征数据之后,执行步骤104。
68.步骤104:识别所述声纹特征数据中的异常声纹数据。
69.在对编码声纹特征数据进行同维度转换处理生成转换声纹特征数据之后,则可以识别出声纹特征数据中的异常声纹数据,在本实施例中,可以基于无监督的异常数据检测方式对声纹特征数据进行异常数据的检测,以检测出声纹特征数据中的异常声纹数据。
70.本公开的实施例提供的异常数据检测方法,通过获取在进行声纹验证过程中的声纹特征数据,根据声纹验证场景信息,对声纹特征数据进行编码处理,生成编码声纹特征数据,对编码声纹特征数据进行同维度转换处理,生成转换声纹特征数据,识别声纹特征数据中的异常声纹数据。本公开的实施例通过提取声纹验证场景下的声纹特征数据,并通过对提取的声纹特征数据进行编码和表征学习(即同维度的转换),可以节省机器集成本,智能化管控带有攻击性的声纹数据的验证行为。
71.实施例二
72.参照图2,示出了本公开的实施例提供的另一种异常数据检测方法的步骤流程图,如图2所示,该异常数据检测方法可以包括如下步骤:
73.步骤201:获取在进行声纹验证过程中的对话特征、包序列特征和流量特征。
74.本公开的实施例可以应用于对提取声纹验证场景下的声纹特征数据进行编码及
表征学习,以解决声纹验证行为非平级问题,从而实现异常声纹特征的检测的场景中。
75.在进行异常声纹数据的检测时,可以获取在进行声纹验证过程中的对话特征、包序列特征和流量特征,其中,对话特征可以包括:时间间隔特征和音量值特征,包序列特征可以包括:端口号特征、特征数据包大小特征,流量特征可以包括:具有特定标识的包数量和正向流特征。
76.当然,不仅限于此,在具体实现中,提取的声纹特征数据还可以包括其它特征,如声纹验证时间、声纹验证频率、ip等等。特征的提取方式可以为采用开源框架,如cicflowmeter框架等。
77.在获取到在进行声纹验证过程中的对话特征、包序列特征和流量特征之后,执行步骤202。
78.步骤202:根据所述声纹验证场景信息,对所述声纹特征数据进行初始编码处理,生成初始编码特征数据。
79.在获取到在进行声纹验证过程中的对话特征、包序列特征和流量特征之后,可以根据声纹验证场景信息对声纹特征数据进行初始编码处理,以生成初始编码特征数据,在具体实现中,采集到的声纹特征数据是带有时间戳的数据,无法直接使用,因此,本示例中,可以使用动作字典对采集的声纹特征数据进行编码,,一方面可以将标称型的动作数值化,也可以在编码的时候加入对场景的经验认知,从而更好的表述数据,例如,可以将对话时间间隔时长细化,如下述表1所示:
80.表1:
[0081][0082][0083]
在根据声纹验证场景信息对声纹特征数据进行初始编码处理生成初始编码特征数据之后,执行步骤203。
[0084]
步骤203:对所述初始编码特征数据进行独热编码处理,生成所述编码声纹特征数据。
[0085]
在得到初始编码特征数据之后,可以对初始编码特征数据进行独热编码(即one-hot)处理,以生成编码声纹特征数据,在本示例中,声纹特征数据在进行编码之后得到的初始编码特征数据不便直接使用,因为原本很多数据是平级的关系,编码后存在大小关系,为避免这种不正确的数值大小关系会给模型的训练带来困难,在本实施例中可以对初始编码特征数据进行one-hot化,以得到编码声纹特征数据。
[0086]
在对初始编码特征数据进行独热编码处理生成编码声纹特征数据之后,执行步骤204。
[0087]
步骤204:基于预设网络模型对所述编码声纹特征数据进行同维度转换处理,生成
所述转换声纹特征数据。
[0088]
在得到编码声纹特征数据之后,可以基于预设网络模型对编码声纹特征数据进行同维度转换处理,以生成转换声纹特征数据,即将编码声纹特征数据中不同维度的特征数据转化为同一维度的特征数据。
[0089]
在具体实现中,one-hot化后的行为序列有两个问题:一是不定长,长度由声纹验证时的特征个数决定;二是稀疏,one-hot将所有的行为动作都变成平级,但带来的问题就是稀疏,即每一个动作都变成了一个维度为n的向量,且向量只有一个1,其余的都为0;为了解决这两个问题,同时也为了更好的挖掘行为序列在时间上相关联中隐含的信息,在本示例中,可以使用双向lstm模型来训练one-hot化后的特征,然后使用双向lstm模型的隐藏层的输出作为后续使用的特征。
[0090]
双向lstm模型擅长处理时间上相关联的数据,因此在经过双向lstm模型的学习之后,新得到的特征能充分体现原始特征在时间上的相关性,同时相比于one-hot化后行为序列,具有维度稠密、长度为恒定为1的特点,便于后续使用机器学习方法检测。
[0091]
在基于预设网络模型对编码声纹特征数据进行同维度转换处理,生成转换声纹特征数据之后,执行步骤205。
[0092]
步骤205:基于无监督学习检测算法对所述转换声纹特征数据中的异常声纹特征进行异常检测,得到所述声纹特征数据中的异常声纹数据。
[0093]
在基于预设网络模型对编码声纹特征数据进行同维度转换处理,生成转换声纹特征数据之后,可以基于无监督学习检测算法对转换声纹特征数据中的异常声纹特征进行异常检测,以得到声纹特征数据中的异常声纹数据。在本示例中,可以基于无监督学习检测算法获取转换声纹特征数据对应的特征数据密度,并根据特征数据密度识别声纹特征数据中的异常声纹数据,如图3所示,当数据计算复杂度过高时,可以结合相应数据结构对检测算法进行剪枝或者对数据进行降维,以保证实时检测。
[0094]
在本示例中,由于业务场景基本无标签数据支持机器学习或者深度学习训练使用,因此本实施例采用无监督学习的方案,可用的无监督学习方案包括:lof、iforest等。局部异常因子lof算的理论是基于密度检测出异常点。
[0095]
本公开的实施例提供的异常数据检测方法,通过获取在进行声纹验证过程中的声纹特征数据,根据声纹验证场景信息,对声纹特征数据进行编码处理,生成编码声纹特征数据,对编码声纹特征数据进行同维度转换处理,生成转换声纹特征数据,识别声纹特征数据中的异常声纹数据。本公开的实施例通过提取声纹验证场景下的声纹特征数据,并通过对提取的声纹特征数据进行编码和表征学习(即同维度的转换),可以节省机器集成本,智能化管控带有攻击性的声纹数据的验证行为。
[0096]
实施例三
[0097]
参照图4,示出了本公开的实施例提供的一种异常数据检测装置的结构示意图,如图4所示,该异常数据检测装置400可以包括如下模块:
[0098]
声纹特征数据获取模块410,用于获取在进行声纹验证过程中的声纹特征数据;
[0099]
编码特征数据生成模块420,用于根据声纹验证场景信息,对所述声纹特征数据进行编码处理,生成编码声纹特征数据;
[0100]
转换特征数据生成模块430,用于对所述编码声纹特征数据进行同维度转换处理,
生成转换声纹特征数据;
[0101]
异常声纹数据识别模块440,用于识别所述声纹特征数据中的异常声纹数据。
[0102]
可选地,所述声纹特征数据获取模块包括:
[0103]
声纹特征数据获取单元,用于获取在进行声纹验证过程中的对话特征、包序列特征和流量特征;
[0104]
其中,所述对话特征包括:时间间隔特征和音量值特征,所述包序列特征包括:端口号特征、特征数据包大小特征,所述流量特征包括:具有特定标识的包数量和正向流特征。
[0105]
可选地,所述编码特征数据生成模块包括:
[0106]
初始编码数据生成单元,用于根据所述声纹验证场景信息,对所述声纹特征数据进行初始编码处理,生成初始编码特征数据;
[0107]
编码特征数据生成单元,用于对所述初始编码特征数据进行独热编码处理,生成所述编码声纹特征数据。
[0108]
可选地,所述转换特征数据生成模块包括:
[0109]
转换特征数据生成单元,用于基于预设网络模型对所述编码声纹特征数据进行同维度转换处理,生成所述转换声纹特征数据;
[0110]
其中,所述预设网络模型为采用独热编码后的声纹特征训练得到的。
[0111]
可选地,所述异常声纹数据识别模块包括:
[0112]
异常声纹数据获取单元,用于基于无监督学习检测算法对所述转换声纹特征数据中的异常声纹特征进行异常检测,得到所述声纹特征数据中的异常声纹数据。
[0113]
可选地,所述异常声纹数据获取单元包括:
[0114]
特征数据密度获取子单元,用于基于所述无监督学习检测算法,获取所述转换声纹特征数据对应的特征数据密度;
[0115]
异常声纹数据识别子单元,用于根据所述特征数据密度,识别所述声纹特征数据中的异常声纹数据。
[0116]
本公开的实施例提供的异常数据检测装置,通过获取在进行声纹验证过程中的声纹特征数据,根据声纹验证场景信息,对声纹特征数据进行编码处理,生成编码声纹特征数据,对编码声纹特征数据进行同维度转换处理,生成转换声纹特征数据,识别声纹特征数据中的异常声纹数据。本公开的实施例通过提取声纹验证场景下的声纹特征数据,并通过对提取的声纹特征数据进行编码和表征学习(即同维度的转换),可以节省机器集成本,智能化管控带有攻击性的声纹数据的验证行为。
[0117]
本公开的实施例还提供了一种电子设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现前述实施例的异常数据检测方法。
[0118]
本公开的实施例还提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述实施例的异常数据检测方法。
[0119]
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0120]
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。
各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本公开的实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本公开的实施例的内容,并且上面对特定语言所做的描述是为了披露本公开的实施例的最佳实施方式。
[0121]
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本公开的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0122]
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本公开的示例性实施例的描述中,本公开的实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本公开的实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本公开的实施例的单独实施例。
[0123]
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的替代特征来代替。
[0124]
本公开的实施例的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本公开的实施例的动态图片的生成设备中的一些或者全部部件的一些或者全部功能。本公开的实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本公开的实施例的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0125]
应该注意的是上述实施例对本公开的实施例进行说明而不是对本公开的实施例进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开的实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
[0126]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0127]
以上所述仅为本公开的实施例的较佳实施例而已,并不用以限制本公开的实施例,凡在本公开的实施例的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本公开的实施例的保护范围之内。
[0128]
以上所述,仅为本公开的实施例的具体实施方式,但本公开的实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开的实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的实施例的保护范围之内。因此,本公开的实施例的保护范围应以权利要求的保护范围为准。

技术特征:


1.一种异常数据检测方法,其特征在于,包括:获取在进行声纹验证过程中的声纹特征数据;根据声纹验证场景信息,对所述声纹特征数据进行编码处理,生成编码声纹特征数据;对所述编码声纹特征数据进行同维度转换处理,生成转换声纹特征数据;识别所述声纹特征数据中的异常声纹数据。2.根据权利要求1所述的方法,其特征在于,所述获取在进行声纹验证过程中的声纹特征数据,包括:获取在进行声纹验证过程中的对话特征、包序列特征和流量特征;其中,所述对话特征包括:时间间隔特征和音量值特征,所述包序列特征包括:端口号特征、特征数据包大小特征,所述流量特征包括:具有特定标识的包数量和正向流特征。3.根据权利要求1所述的方法,其特征在于,所述根据声纹验证场景信息,对所述声纹特征数据进行编码处理,生成编码声纹特征数据,包括:根据所述声纹验证场景信息,对所述声纹特征数据进行初始编码处理,生成初始编码特征数据;对所述初始编码特征数据进行独热编码处理,生成所述编码声纹特征数据。4.根据权利要求1所述的方法,其特征在于,所述对所述编码声纹特征数据进行同维度转换处理,生成转换声纹特征数据,包括:基于预设网络模型对所述编码声纹特征数据进行同维度转换处理,生成所述转换声纹特征数据;其中,所述预设网络模型为采用独热编码后的声纹特征训练得到的。5.根据权利要求1所述的方法,其特征在于,所述识别所述声纹特征数据中的异常声纹数据,包括:基于无监督学习检测算法对所述转换声纹特征数据中的异常声纹特征进行异常检测,得到所述声纹特征数据中的异常声纹数据。6.根据权利要求5所述的方法,其特征在于,所述基于无监督学习检测算法对所述转换声纹特征数据中的异常声纹特征进行异常检测,得到所述声纹特征数据中的异常声纹数据,包括:基于所述无监督学习检测算法,获取所述转换声纹特征数据对应的特征数据密度;根据所述特征数据密度,识别所述声纹特征数据中的异常声纹数据。7.一种异常数据检测装置,其特征在于,包括:声纹特征数据获取模块,用于获取在进行声纹验证过程中的声纹特征数据;编码特征数据生成模块,用于根据声纹验证场景信息,对所述声纹特征数据进行编码处理,生成编码声纹特征数据;转换特征数据生成模块,用于对所述编码声纹特征数据进行同维度转换处理,生成转换声纹特征数据;异常声纹数据识别模块,用于识别所述声纹特征数据中的异常声纹数据。8.根据权利要求7所述的装置,其特征在于,所述声纹特征数据获取模块包括:声纹特征数据获取单元,用于获取在进行声纹验证过程中的对话特征、包序列特征和流量特征;
其中,所述对话特征包括:时间间隔特征和音量值特征,所述包序列特征包括:端口号特征、特征数据包大小特征,所述流量特征包括:具有特定标识的包数量和正向流特征。9.一种电子设备,其特征在于,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1至6中任一项所述的异常数据检测方法。10.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行权利要求1至6中任一项所述的异常数据检测方法。

技术总结


本公开的实施例提供了一种异常数据检测方法、装置、电子设备及存储介质。所述方法包括:获取在进行声纹验证过程中的声纹特征数据;根据声纹验证场景信息,对所述声纹特征数据进行编码处理,生成编码声纹特征数据;对所述编码声纹特征数据进行同维度转换处理,生成转换声纹特征数据;识别所述声纹特征数据中的异常声纹数据。本公开的实施例通过提取声纹验证场景下的声纹特征数据,并通过对提取的声纹特征数据进行编码和表征学习(即同维度的转换),可以节省机器集成本,智能化管控带有攻击性的声纹数据的验证行为。击性的声纹数据的验证行为。击性的声纹数据的验证行为。


技术研发人员:

王喜 张振华 陈焜

受保护的技术使用者:

北京三快在线科技有限公司

技术研发日:

2022.03.03

技术公布日:

2022/7/1

本文发布于:2024-09-20 12:41:25,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/8563.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:特征   数据   所述   异常
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议