一种扩展模块的制作方法

1.本发明涉及通信技术领域，尤其涉及一种扩展模块。

背景技术：

2.随着人工智能的快速发展，智能语音在电话中的应用也越来越多，被广泛应用在智能客服、智能回访等众多场景。在实时语音沟通场景下，现有的语音处理方案实施过程中，需要开发c语言模块对接各种不同接口以对接各种相应的语音处理引擎，因此需要对c语言模块进行大量开发与维护，造成工作量和成本巨大，同时造成c语言模块的使用灵活度不够高。

技术实现要素：

3.针对现有技术存在的不足，本发明的目的在于提供一种扩展模块，用于提升语音模块的使用灵活度，同时降低使用成本。
4.为实现上述目的，本发明提供了如下技术方案：一种扩展模块，包括：
5.数据截取单元，用于截取中的若干音频流数据；
6.数据分析单元，连接所述数据截取单元，用于对各所述音频流数据进行数据分析，得到相应的报文版本号、报文类型、报文长度和报文内容；
7.数据计算单元，连接所述数据分析单元，用于将同一所述音频流数据的各所述报文版本号、所述报文类型、所述报文长度和所述报文内容与预设的标准数据库中的各标准报文数据进行相似度计算，得到相应的相似度值；
8.数据处理单元，连接所述数据比对单元，用于根据各所述相似度值处理得到综合相似度计算值，并根据所述综合相似度计算值和各所述相似度值对所述报文版本号、所述报文类型、所述报文长度和所述报文内容进行修正；
9.转发单元，连接所述数据处理单元，用于按照预设协议将修正后的所述报文版本号、所述报文类型、所述报文长度和所述报文内容封装形成可供多种语音处理引擎解析的标准网络数据包，并转发至业务平台。
10.进一步地，所述标准数据库中预先存储有若干标准报文数据，所述标准报文数据包括标准版本号、标准类型、标准长度和标准内容，所述数据计算单元包括：
11.第一计算子单元，用于将所述报文版本号与各所述标准版本号进行相似度计算，得到若干第一相似度值，并将各所述第一相似度值中的最大值作为第一最优相似度值；
12.第二计算子单元，用于将所述报文类型与各所述标准类型进行相似度计算，得到若干第二相似度值，并将各所述第二相似度值中的最大值作为第二最优相似度值；
13.第三计算子单元，用于将所述报文长度与各所述标准长度进行相似度计算，得到若干第三相似度值，并将各所述第三相似度值中的最大值作为第三最优相似度值；
14.第四计算子单元，用于将所述报文内容与各所述标准内容进行相似度计算，得到若干第四相似度值，并将各所述第四相似度值中的最大值作为第四最优相似度值。
15.进一步地，所述数据处理单元包括：
16.配置子单元，用于分别为所述第一最优相似度值、所述第二最优相似度值、所述第三最优相似度值和所述第四最优相似度值分别配置第一权重系数、第二权重系数、第三权重系数和第四权重系数；
17.综合计算子单元，连接所述配置子单元，用于分别将所述第一最优相似度值、所述第二最优相似度值、所述第三最优相似度值、所述第四最优相似度值、所述第一权重系数、所述第二权重系数、所述第三权重系数和所述第四权重系数带入预设的相似度计算公式中，得到一综合相似度计算值；
18.修正子单元，连接所述综合计算子单元，用于在所述综合相似度计算值大于预设的综合阈值，且所述第一最优相似度值、所述第二最优相似度值、所述第三最优相似度值或所述第四最优相似度值存在不大于预设的最低阈值时，对所述音频流数据的截取时刻、截取持续时间段、数据获取通道和数据解码方式进行检测得到若干检测结果，并根据各所述检测结果对所述报文版本号、所述报文类型、所述报文长度或所述报文内容进行修正。
19.进一步地，所述相似度计算公式配置为：
[0020][0021]
sy用于表示所述综合相似度计算值；
[0022]
a用于表示所述第一权重系数；
[0023]
b用于表示所述第二权重系数；
[0024]
c用于表示所述第三权重系数；
[0025]
d用于表示所述第四权重系数；
[0026]
x用于表示所述第一最优相似度值；
[0027]
y用于表示所述第二最优相似度值；
[0028]
z用于表示所述第三最优相似度值；
[0029]
k用于表示所述第四最优相似度值。
[0030]
进一步地，所述截取时刻与所述报文版本号相关联，所述截取持续时间段与所述报文长度相关联，所述数据获取通道与所述报文类型相关联，所述数据解码方式与所述报文内容相关联，所述标准版本号预先与标准截取时刻相关联，所述标准类型预先与标准截取持续时间段相关联，所述标准长度预先与标准数据获取通道相关联，所述标准内容预先与标准数据解码方式相关联，在所述综合相似度计算值大于预设的综合阈值，且所述第一最优相似度值、所述第二最优相似度值、所述第三最优相似度值或所述第四最优相似度值存在不大于预设的最低阈值时，所述修正子单元包括：
[0031]
第一修正从单元，用于将所述音频流数据的所述截取时刻与所述标准截取时刻进行比对，并在所述截取时刻与所述标准截取时刻之间相差超过预设的时刻差值时对所述截取时刻进行检测生成第一检测结果，进而在所述第一检测结果表明所述截取时刻错误时根据所述标准版本号对所述报文版本号进行修正；
[0032]
第二修正从单元，用于将所述音频流数据的所述截取持续时间段与所述标准截取持续时间段进行比对，并在所述截取持续时间段与所述标准截取持续时间段之间相差超过预设的时间段差值时对所述截取持续时间段进行检测生成第二检测结果，进而在所述第二
检测结果表明所述截取持续时间段错误时根据所述标准报文长度对所述报文长度进行修正；
[0033]
第三修正从单元，用于将所述音频流数据的所述数据获取通道与所述标准截取数据获取通道进行比对，并在所述数据获取通道与所述标准数据获取通道不相同时对所述数据获取通道进行检测生成第三检测结果，进而在所述第三检测结果表明所述数据获取通道错误时对根据所述标准长度对所述报文长度进行修正；
[0034]
第四修正从单元，用于将所述音频流数据的所述数据解码方式与所述标准数据解码方式进行比对，并在所述数据解码方式与所述标准数据解码方式不相同时对所述数据解码方式进行检测生成第四检测结果，进而在所述第四检测结果表明所述数据解码方式错误时对根据所述标准内容对所述报文内容进行修正。
[0035]
进一步地，所述配置子单元包括：
[0036]
配置从单元，用于分别为所述第一最优相似度值、所述第二最优相似度值、所述第三最优相似度值和所述第四最优相似度值分别配置第一初始系数、第二初始系数、第三初始系数和第四初始系数；
[0037]
调整从单元，连接所述配置从单元，用于在所述第一检测结果表明所述截取时刻错误时根据所述截取时刻与所述标准截取时刻之间的差值调整所述第一初始系数，得到所述第一权重系数；
[0038]
以及在所述第二检测结果表明所述截取持续时间段错误时根据所述截取持续时间段与所述标准截取持续时间段之间的差值调整所述第二初始系数，得到所述第二权重系数；
[0039]
以及在所述第三检测结果表明所述数据获取通道错误时根据所述数据获取通道与所述标准数据获取通道之间的相似度调整所述第三初始系数，得到所述第三权重系数；
[0040]
以及在所述第四检测结果表明所述数据解码方式错误时根据所述数据解码方式与所述标准数据解码方式之间的相似度调整所述第四初始系数，得到所述第四权重系数。
[0041]
进一步地，所述转发单元包括：
[0042]
封装子单元，用于根据所述预设协议的报文结构将修正后的所述报文版本号、所述报文类型、所述报文长度和所述报文内容封装形成初始网络数据包；
[0043]
加密子单元，连接所述封装子单元，用于根据预设的加密算法对所述初始网络数据包进行加密，形成所述标准网络数据包；
[0044]
所述业务平台上配置有至少一种语音处理引擎，所述业务平台根据与所述加密算法相对应的解密算法对所述标准网络数据包进行解密，进而根据所述语音处理引擎对解密后的所述标准网络数据包进行解析。
[0045]
进一步地，所述预设协议的报文结构包括所述报文版本号、所述报文类型、所述报文长度和所述报文内容。
[0046]
进一步地，所述报文类型包括文本命令报文、音频媒体报文和特殊编码类型报文。
[0047]
本发明的有益效果：
[0048]
本发明通过对音频流数据的截取后分析得到报文版本号、报文类型、报文长度和报文内容，进而根据报文版本号、报文类型、报文长度和报文内容与相应标准报文数据的相似度值对报文版本号、报文类型、报文长度和报文内容进行检测修正，实现了对音频流数据
的自动检测修正，提升了对报文版本号、报文类型、报文长度和报文内容的数据分析精度；同时本发明中的转发单元将修正后的报文版本号、报文类型、报文长度和报文内容封装成标准网络数据包，由于标准网络数据包可供多种语音处理引擎识别，因此可以实现灵活对接多种语音处理引擎，无须再对扩展模块进行开发，减少了对接和开发成本，利于推广。
附图说明
[0049]
图1是本发明中扩展模块的结构示意图。
[0050]
附图标记：1、数据截取单元；2、数据分析单元；3、数据计算单元；31、第一计算子单元；32、第二计算子单元；33、第三计算子单元；34、第四计算子单元；4、数据处理单元；41、配置子单元；411、配置从单元；412、调整从单元；42、综合计算子单元；43、修正子单元；431、第一修正从单元；432、第二修正从单元；433、第三修正从单元；434、第四修正从单元；5、转发单元；51、封装子单元；52、加密子单元。
具体实施方式
[0051]
下面结合附图和实施例，对本发明进一步详细说明。其中相同的零部件用相同的附图标记表示。需要说明的是，下面描述中使用的词语“前”、“后”、“左”、“右”、“上”和“下”指的是附图中的方向，词语“底面”和“顶面”、“内”和“外”分别指的是朝向或远离特定部件几何中心的方向。
[0052]
如图1所示，本实施例的一种扩展模块，包括：
[0053]
数据截取单元1，用于截取中的若干音频流数据；
[0054]
数据分析单元2，连接数据截取单元1，用于对各音频流数据进行数据分析，得到相应的报文版本号、报文类型、报文长度和报文内容；
[0055]
数据计算单元3，连接数据分析单元2，用于将同一音频流数据的各报文版本号、报文类型、报文长度和报文内容与预设的标准数据库中的各标准报文数据进行相似度计算，得到相应的相似度值；
[0056]
数据处理单元4，连接数据比对单元，用于根据各相似度值处理得到综合相似度计算值，并根据综合相似度计算值和各相似度值对报文版本号、报文类型、报文长度和报文内容进行修正；
[0057]
转发单元5，连接数据处理单元4，用于按照预设协议将修正后的报文版本号、报文类型、报文长度和报文内容封装形成可供多种语音处理引擎解析的标准网络数据包，并转发至业务平台。
[0058]
工作原理：
[0059]
在本实施中，扩展模块可以为c语言模块。可以选用freeswitch网关。数据截取单元1对音频流数据旁路截取主要通过freeswitch网关提供的asr扩展机制来完成。数据截取单元1通过switch_module_load_function注入加载模块，当freeswitch启动时，会调用switch_module_load_function函数，完成初始化加载。同时还通过switch_module_shutdown_function注入关停模块，当服务关闭时，进行运行数据的清理。数据截取单元1运行时，主要通过asr_feed接口完成实时音频流数据的旁路截取。当语音通话进行时，freeswitch会调用此接口，将音频流数据按帧传递给数据截取单元1，数据分析单元2对
数据截取单元1获取到的各音频流数据进行分析得到每组音频流数据的报文版本号、报文类型、报文长度和报文内容，进而数据计算单元3通过计算报文版本号、报文类型、报文长度和报文内容与表顺报文数据的相似度，使得数据处理单元4根据处理得到的综合相似度对报文版本号、报文类型、报文长度和报文内容进行自动检测修正，提升了对报文版本号、报文类型、报文长度和报文内容的数据分析精度。最终转发单元5按照预设协议将报文版本号、报文类型、报文长度和报文内容封装形成可供多种语音处理引擎解析的标准网络数据包，并转发至业务平台，业务平台上的各语音处理引擎解析标准网络数据包，得到报文版本号、报文类型、报文长度和报文内容。在报文内容中包含有语音通话数据，因此获得报文内容后业务平台可以根据需求进行人声检测、语音识别等下一步操作。
[0060]
在实施例中，预设协议可以为本发明设计的简单音频传输协议(simple voice transfer protocol，简称svtp)来完成。svtp协议可以完成扩展模块与业务应用之间控制命令交互与音频数据传输。当会话开始时，扩展模块通过svtp向业务应用发送会话开始命令，业务应用应答后，即可进行音频流数据的实时传输，音频流数据以标准网络数据包的形式传递至业务平台。业务应用在完成对标准网络数据包的处理时，可以将处理结果通过svtp协议反馈至扩展模块，如果不需要返回处理结果，可以直接响应结束会话的svtp报文并反馈至扩展模块。
[0061]
优选的，标准数据库中预先存储有若干标准报文数据，标准报文数据包括标准版本号、标准类型、标准长度和标准内容，数据计算单元3包括：
[0062]
第一计算子单元31，用于将报文版本号与各标准版本号进行相似度计算，得到若干第一相似度值，并将各第一相似度值中的最大值作为第一最优相似度值；
[0063]
第二计算子单元32，用于将报文类型与各标准类型进行相似度计算，得到若干第二相似度值，并将各第二相似度值中的最大值作为第二最优相似度值；
[0064]
第三计算子单元33，用于将报文长度与各标准长度进行相似度计算，得到若干第三相似度值，并将各第三相似度值中的最大值作为第三最优相似度值；
[0065]
第四计算子单元34，用于将报文内容与各标准内容进行相似度计算，得到若干第四相似度值，并将各第四相似度值中的最大值作为第四最优相似度值。
[0066]
具体地，本实施例中，第一计算子单元31、第二计算子单元32、第三计算子单元33和第四计算子单元34均采用皮尔逊积矩相关系数求得相似度值。最终在各组相似度值中选取最大值作为第一最优相似度值、第二最优相似度值、第三最优相似度值和第四最优相似度值。
[0067]
优选的，数据处理单元4包括：
[0068]
配置子单元41，用于分别为第一最优相似度值、第二最优相似度值、第三最优相似度值和第四最优相似度值分别配置第一权重系数、第二权重系数、第三权重系数和第四权重系数；
[0069]
综合计算子单元42，连接配置子单元41，用于分别将第一最优相似度值、第二最优相似度值、第三最优相似度值、第四最优相似度值、第一权重系数、第二权重系数、第三权重系数和第四权重系数带入预设的相似度计算公式中，得到一综合相似度计算值；
[0070]
修正子单元43，连接综合计算子单元42，用于在综合相似度计算值大于预设的综合阈值，且第一最优相似度值、第二最优相似度值、第三最优相似度值或第四最优相似度值
存在不大于预设的最低阈值时，对音频流数据的截取时刻、截取持续时间段、数据获取通道和数据解码方式进行检测得到若干检测结果，并根据各检测结果对报文版本号、报文类型、报文长度或报文内容进行修正。
[0071]
优选的，截取时刻与报文版本号相关联，截取持续时间段与报文长度相关联，数据获取通道与报文类型相关联，数据解码方式与报文内容相关联，标准版本号预先与标准截取时刻相关联，标准类型预先与标准截取持续时间段相关联，标准长度预先与标准数据获取通道相关联，标准内容预先与标准数据解码方式相关联，在综合相似度计算值大于预设的综合阈值，且第一最优相似度值、第二最优相似度值、第三最优相似度值或第四最优相似度值存在不大于预设的最低阈值时，修正子单元43包括：
[0072]
第一修正从单元431，用于将音频流数据的截取时刻与标准截取时刻进行比对，并在截取时刻与标准截取时刻之间相差超过预设的时刻差值时对截取时刻进行检测生成第一检测结果，进而在第一检测结果表明截取时刻错误时根据标准版本号对报文版本号进行修正；
[0073]
第二修正从单元432，用于将音频流数据的截取持续时间段与标准截取持续时间段进行比对，并在截取持续时间段与标准截取持续时间段之间相差超过预设的时间段差值时对截取持续时间段进行检测生成第二检测结果，进而在第二检测结果表明截取持续时间段错误时根据标准报文长度对报文长度进行修正；
[0074]
第三修正从单元433，用于将音频流数据的数据获取通道与标准截取数据获取通道进行比对，并在数据获取通道与标准数据获取通道不相同时对数据获取通道进行检测生成第三检测结果，进而在第三检测结果表明数据获取通道错误时对根据标准长度对报文长度进行修正；
[0075]
第四修正从单元434，用于将音频流数据的数据解码方式与标准数据解码方式进行比对，并在数据解码方式与标准数据解码方式不相同时对数据解码方式进行检测生成第四检测结果，进而在第四检测结果表明数据解码方式错误时对根据标准内容对报文内容进行修正。
[0076]
具体地，本实施例中，在综合相似度计算值大于预设的综合阈值，且第一最优相似度值、第二最优相似度值、第三最优相似度值或第四最优相似度值存在不大于预设的最低阈值时表明报文版本号、报文类型、报文长度和报文内容中至少存在一个数据异常，由于截取时刻与报文版本号相关联，截取持续时间段与报文长度相关联，数据获取通道与报文类型相关联，数据解码方式与报文内容相关联，标准版本号预先与标准截取时刻相关联，因此需要分别对截取时刻、截取持续时间段、数据获取通道和数据解码方式进行检测。第一修正从单元431根据将截取时刻与标准截取时刻比对做差，当二者之前的差值过大时表明表明截取时刻是异常的，进而表明截取时刻关联的报文版本号是不对的，因此通过用截取时刻相对应的标准截取时刻相关的标准版本号替代报文版本号，实现了对报文版本号的修正。第一修正从单元431根据将截取时刻与标准截取时刻比对做差，当二者之前的差值过大时表明表明截取时刻是异常的，进而表明截取时刻关联的报文版本号是不对的，因此通过用截取时刻相对应的标准截取时刻相关的标准版本号替代报文版本号，实现了对报文版本号的修正。
[0077]
第二修正从单元432根据将截取持续时间段与标准截取持续时间段比对做差，当
二者之前的差值过大时表明表明截取持续时间段是异常的，进而表明截取持续时间段关联的报文长度是不对的，因此通过用截取持续时间段相对应的标准截取持续时间段相关的标准长度替代报文版本号，实现了对报文长度的修正。
[0078]
第三修正从单元433根据将数据获取通道与标准数据获取通道比对做差，当二者之前的差值过大时表明表明数据获取通道是异常的，进而表明数据获取通道关联的报文类型是不对的，因此通过用数据获取通道相对应的数据获取通道相关的标准类型替代报文类型，实现了对报文类型的修正。
[0079]
第四修正从单元434根据将数据解码方式与标准数据解码方式比对做差，当二者之前的差值过大时表明表明数据解码方式是异常的，进而表明数据解码方式关联的报文内容是不对的，因此通过用数据解码方式相对应的标准数据解码方式相关的标准内容替代报文内容，实现了对报文内容的修正。
[0080]
优选的，
[0081]
sy用于表示综合相似度计算值；
[0082]
a用于表示第一权重系数；
[0083]
b用于表示第二权重系数；
[0084]
c用于表示第三权重系数；
[0085]
d用于表示第四权重系数；
[0086]
x用于表示第一最优相似度值；
[0087]
y用于表示第二最优相似度值；
[0088]
z用于表示第三最优相似度值；
[0089]
k用于表示第四最优相似度值。
[0090]
优选的，配置子单元41包括：
[0091]
配置从单元411，用于分别为第一最优相似度值、第二最优相似度值、第三最优相似度值和第四最优相似度值分别配置第一初始系数、第二初始系数、第三初始系数和第四初始系数；
[0092]
调整从单元412，连接配置从单元411，用于在第一检测结果表明截取时刻错误时根据截取时刻与标准截取时刻之间的差值调整第一初始系数，得到第一权重系数；
[0093]
以及在第二检测结果表明截取持续时间段错误时根据截取持续时间段与标准截取持续时间段之间的差值调整第二初始系数，得到第二权重系数；
[0094]
以及在第三检测结果表明数据获取通道错误时根据数据获取通道与标准数据获取通道之间的相似度调整第三初始系数，得到第三权重系数；
[0095]
以及在第四检测结果表明数据解码方式错误时根据数据解码方式与标准数据解码方式之间的相似度调整第四初始系数，得到第四权重系数。
[0096]
具体地，本实施例中，截取时刻、截取持续时间段和数据解码方式的检测均基于现有的检测工具进行检测，不再赘述。在第一检测结果表明截取时刻错误时，调整从单元412根据截取时刻与标准截取时刻之间的差值调整第一初始系数，在调整过程中，对第一初始系数的调整幅度与截取时刻与标准截取时刻之间的差值正相关，根据第一检测结果调整第一初始系数得到第一权重系数，实现了对报文版本号的数据控制闭环。第二检测结果表明
截取持续时间段错误时，调整从单元412根据截取持续时间段与标准截取持续时间段之间的差值调整第二初始系数，在调整过程中，对第二初始系数的调整幅度与截取持续时间段与标准截取持续时间段之间的差值正相关，根据第二检测结果调整第二初始系数得到第二权重系数，实现了对报文长度的数据控制闭环。第三检测结果表明数据获取通道错误时，调整从单元412根据数据获取通道与标准数据获取通道之间的相似度调整第三初始系数，在调整过程中，对第三初始系数的调整幅度与数据获取通道与标准数据获取通道之间的相似度正相关，根据第三检测结果调整第三初始系数得到第三权重系数，实现了对报文长度的数据控制闭环。第四检测结果表明数据解码方式错误时，调整从单元412根据数据解码方式与标准数据解码方式段之间的相似度调整第四初始系数，在调整过程中，对第四初始系数的调整幅度与数据解码方式与标准数据解码方式段之间的相似度正相关，根据第四检测结果调整第四初始系数得到第四权重系数，实现了对报文内容的数据控制闭环。
[0097]
优选的，转发单元5包括：
[0098]
封装子单元51，用于根据预设协议的报文结构将修正后的报文版本号、报文类型、报文长度和报文内容封装形成初始网络数据包；
[0099]
加密子单元52，连接封装子单元51，用于根据预设的加密算法对初始网络数据包进行加密，形成标准网络数据包；
[0100]
业务平台上配置有至少一种语音处理引擎，业务平台根据与加密算法相对应的解密算法对标准网络数据包进行解密，进而根据语音处理引擎对解密后的标准网络数据包进行解析。
[0101]
具体地，本实施例中，加密子单元52利用des算法对初始网络数据包进行加密，形成标准网络数据包；业务平台根据des算法对标准网络数据包进行解密，解密后的标准网络数据包可供语音处理引擎进行解析。通过设置加密子单元52，提升了数据在、扩展模块和业务平台之间数据交互的安全性，防止数据泄露。
[0102]
优选的，预设协议的报文结构包括报文版本号、报文类型、报文长度和报文内容。
[0103]
具体地，本实施例中，当报文结构变化时，通过升级版本号区分，报文版本号占用8位存储；报文类型占用8位存储；报文长度是无符号整型16位存储数字，最大可为65535；报文内容包含给定报文长度的报文内容。
[0104]
优选的，报文类型包括文本命令报文、音频媒体报文和特殊编码类型报文。
[0105]
以上仅是本发明的优选实施方式，本发明的保护范围并不仅局限于上述实施例，凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理前提下的若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

技术特征：

1.一种扩展模块，其特征在于，包括：数据截取单元(1)，用于截取中的若干音频流数据；数据分析单元(2)，连接所述数据截取单元(1)，用于对各所述音频流数据进行数据分析，得到相应的报文版本号、报文类型、报文长度和报文内容；数据计算单元(3)，连接所述数据分析单元(2)，用于将同一所述音频流数据的各所述报文版本号、所述报文类型、所述报文长度和所述报文内容与预设的标准数据库中的各标准报文数据进行相似度计算，得到相应的相似度值；数据处理单元(4)，连接所述数据比对单元，用于根据各所述相似度值处理得到综合相似度计算值，并根据所述综合相似度计算值和各所述相似度值对所述报文版本号、所述报文类型、所述报文长度和所述报文内容进行修正；转发单元(5)，连接所述数据处理单元(4)，用于按照预设协议将修正后的所述报文版本号、所述报文类型、所述报文长度和所述报文内容封装形成可供多种语音处理引擎解析的标准网络数据包，并转发至业务平台。2.根据权利要求1所述的扩展模块，其特征在于：所述标准数据库中预先存储有若干标准报文数据，所述标准报文数据包括标准版本号、标准类型、标准长度和标准内容，所述数据计算单元(3)包括：第一计算子单元(31)，用于将所述报文版本号与各所述标准版本号进行相似度计算，得到若干第一相似度值，并将各所述第一相似度值中的最大值作为第一最优相似度值；第二计算子单元(32)，用于将所述报文类型与各所述标准类型进行相似度计算，得到若干第二相似度值，并将各所述第二相似度值中的最大值作为第二最优相似度值；第三计算子单元(33)，用于将所述报文长度与各所述标准长度进行相似度计算，得到若干第三相似度值，并将各所述第三相似度值中的最大值作为第三最优相似度值；第四计算子单元(34)，用于将所述报文内容与各所述标准内容进行相似度计算，得到若干第四相似度值，并将各所述第四相似度值中的最大值作为第四最优相似度值。3.根据权利要求2所述的扩展模块，其特征在于：所述数据处理单元(4)包括：配置子单元(41)，用于分别为所述第一最优相似度值、所述第二最优相似度值、所述第三最优相似度值和所述第四最优相似度值分别配置第一权重系数、第二权重系数、第三权重系数和第四权重系数；综合计算子单元(42)，连接所述配置子单元(41)，用于分别将所述第一最优相似度值、所述第二最优相似度值、所述第三最优相似度值、所述第四最优相似度值、所述第一权重系数、所述第二权重系数、所述第三权重系数和所述第四权重系数带入预设的相似度计算公式中，得到一综合相似度计算值；修正子单元(43)，连接所述综合计算子单元(42)，用于在所述综合相似度计算值大于预设的综合阈值，且所述第一最优相似度值、所述第二最优相似度值、所述第三最优相似度值或所述第四最优相似度值存在不大于预设的最低阈值时，对所述音频流数据的截取时刻、截取持续时间段、数据获取通道和数据解码方式进行检测得到若干检测结果，并根据各所述检测结果对所述报文版本号、所述报文类型、所述报文长度或所述报文内容进行修正。4.根据权利要求3所述的扩展模块，其特征在于：
s
y
用于表示所述综合相似度计算值；a用于表示所述第一权重系数；b用于表示所述第二权重系数；c用于表示所述第三权重系数；d用于表示所述第四权重系数；x用于表示所述第一最优相似度值；y用于表示所述第二最优相似度值；z用于表示所述第三最优相似度值；k用于表示所述第四最优相似度值。5.根据权利要求3所述的扩展模块，其特征在于：所述截取时刻与所述报文版本号相关联，所述截取持续时间段与所述报文长度相关联，所述数据获取通道与所述报文类型相关联，所述数据解码方式与所述报文内容相关联，所述标准版本号预先与标准截取时刻相关联，所述标准类型预先与标准截取持续时间段相关联，所述标准长度预先与标准数据获取通道相关联，所述标准内容预先与标准数据解码方式相关联，在所述综合相似度计算值大于预设的综合阈值，且所述第一最优相似度值、所述第二最优相似度值、所述第三最优相似度值或所述第四最优相似度值存在不大于预设的最低阈值时，所述修正子单元(43)包括：第一修正从单元(431)，用于将所述音频流数据的所述截取时刻与所述标准截取时刻进行比对，并在所述截取时刻与所述标准截取时刻之间相差超过预设的时刻差值时对所述截取时刻进行检测生成第一检测结果，进而在所述第一检测结果表明所述截取时刻错误时根据所述标准版本号对所述报文版本号进行修正；第二修正从单元(432)，用于将所述音频流数据的所述截取持续时间段与所述标准截取持续时间段进行比对，并在所述截取持续时间段与所述标准截取持续时间段之间相差超过预设的时间段差值时对所述截取持续时间段进行检测生成第二检测结果，进而在所述第二检测结果表明所述截取持续时间段错误时根据所述标准报文长度对所述报文长度进行修正；第三修正从单元(433)，用于将所述音频流数据的所述数据获取通道与所述标准截取数据获取通道进行比对，并在所述数据获取通道与所述标准数据获取通道不相同时对所述数据获取通道进行检测生成第三检测结果，进而在所述第三检测结果表明所述数据获取通道错误时对根据所述标准长度对所述报文长度进行修正；第四修正从单元(434)，用于将所述音频流数据的所述数据解码方式与所述标准数据解码方式进行比对，并在所述数据解码方式与所述标准数据解码方式不相同时对所述数据解码方式进行检测生成第四检测结果，进而在所述第四检测结果表明所述数据解码方式错误时对根据所述标准内容对所述报文内容进行修正。6.根据权利要求5所述的扩展模块，其特征在于：所述配置子单元(41)包括：配置从单元(411)，用于分别为所述第一最优相似度值、所述第二最优相似度值、所述第三最优相似度值和所述第四最优相似度值分别配置第一初始系数、第二初始系数、第三
初始系数和第四初始系数；调整从单元(412)，连接所述配置从单元(411)，用于在所述第一检测结果表明所述截取时刻错误时根据所述截取时刻与所述标准截取时刻之间的差值调整所述第一初始系数，得到所述第一权重系数；以及在所述第二检测结果表明所述截取持续时间段错误时根据所述截取持续时间段与所述标准截取持续时间段之间的差值调整所述第二初始系数，得到所述第二权重系数；以及在所述第三检测结果表明所述数据获取通道错误时根据所述数据获取通道与所述标准数据获取通道之间的相似度调整所述第三初始系数，得到所述第三权重系数；以及在所述第四检测结果表明所述数据解码方式错误时根据所述数据解码方式与所述标准数据解码方式之间的相似度调整所述第四初始系数，得到所述第四权重系数。7.根据权利要求1所述的扩展模块，其特征在于：所述转发单元(5)包括：封装子单元(51)，用于根据所述预设协议的报文结构将修正后的所述报文版本号、所述报文类型、所述报文长度和所述报文内容封装形成初始网络数据包；加密子单元(52)，连接所述封装子单元(51)，用于根据预设的加密算法对所述初始网络数据包进行加密，形成所述标准网络数据包；所述业务平台上配置有至少一种语音处理引擎，所述业务平台根据与所述加密算法相对应的解密算法对所述标准网络数据包进行解密，进而根据所述语音处理引擎对解密后的所述标准网络数据包进行解析。8.根据权利要求1所述的扩展模块，其特征在于：所述预设协议的报文结构包括所述报文版本号、所述报文类型、所述报文长度和所述报文内容。9.根据权利要求8所述的扩展模块，其特征在于：所述报文类型包括文本命令报文、音频媒体报文和特殊编码类型报文。

技术总结

本发明公开了一种扩展模块，包括数据截取单元截取中的若干音频流数据；数据分析单元对各音频流数据进行数据分析得到报文版本号、报文类型、报文长度和报文内容；数据计算单元将各报文版本号、报文类型、报文长度和报文内容与预设的标准数据库中的各标准报文数据进行相似度计算，得到相似度值；数据处理单元根据各相似度值处理得到综合相似度计算值以对报文版本号、报文类型、报文长度和报文内容进行修正；转发单元按照预设协议将修正后的报文版本号、报文类型、报文长度和报文内容封装形成可供多种语音处理引擎解析的标准网络数据包并转发至业务平台。本发明提升语音模块的使用灵活度，并降低使用成本。并降低使用成本。并降低使用成本。