一种方言语义快速转写技术的制作方法



1.本发明涉及方言识别技术领域,具体为一种方言语义快速转写技术。


背景技术:



2.方言在不同的人中指代不同,中国人口中所称“方言”是一个政治学概念,实为“地方语言”,又称“白话”、“土话”或“土音”,指的是区别于标准语的某一地区的语言,这种叫法不考虑语言间的亲属关系。由于我国地大物博,且历史悠久,方言的种类也比较多。随着现在经济的发展和交通的便利,人员的流动性也逐渐变大。一些人由于长期在家乡采用方言进行沟通交流,当去往另外一个地方的时候,就算说普通话,也会夹杂一些方言,导致与其他人进行沟通交流的时候比较费劲。


技术实现要素:



3.(一)解决的技术问题
4.针对现有技术的不足,本发明提供了一种方言语义快速转写技术,解决了上述背景技术中所存在的问题。
5.(二)技术方案
6.为实现上述目的,本发明提供如下技术方案:一种方言语义快速转写技术,包括快速转写系统,所述块转写系统包括麦克风模块数据解析模块、声音识别模块、数据对比模块、方言数据库模块、数据处理分析模块和语义转写模块;
7.所述麦克风模块用于收录用户的声音;所述数据解析模块用于将麦克风模块收录的声音数据进行解析;所述声音识别模块用于识别解析后的用户声音数据;所述数据对比模块用于将识别后的声音数据与方言数据库中的数据进行比对,并确定为那种方言;所述数据处理分析模块用于处理和分析该方言数据的内容;所述语义转写模块用于将数据处理分析模块分析处理后的数据进行转写,形成可以让人们看懂的普通话。
8.优选的,所述数据解析模块用于将麦克风收录到的声音数据解析为音调数据、音频数据、音数据和读音数据。
9.优选的,所述声音识别模块包括音调识别模块、音频识别模块、音识别模块和读音识别模块;所述音调识别模块用于确定当前声音中的音调数据;所述音频识别模块用于确定当前声音的音频数据;所述音识别模块用于确定当前声音的音;所述读音识别模块用于确定当前声音每个字的读音。
10.优选的,所述方言数据库模块中收录每种方言的方言音调、方言音频、方言音和方言读音。
11.优选的,所述数据处理分析模块包括模糊分析模块、前后结合模块和最终推断模块;所述模糊分析模块用于在该方言下一个字的读音对应多个字,此时将对应的多个字都选定出来;所述前后结合模块用于将模糊分析模块选定的多个字与方言的前后文结合,并通过最终推断模块推断出当前读音所对应的字。
12.优选的,所述快速转写系统还包括显示模块和播放模块,所述显示模块用于将语义转写模块转写后的文字语义显示出来,所述播放模块用于将语义转写模块转写后的文字语义播放出来。
13.优选的,所述技术还包括快速转写方法,该方法基于快速转写系统实现,具体包括如下步骤:
14.s1、通过麦克风模块收录用户的声音,并交由数据解析模块将声音数据解析成音调、音、音频和每个字的读音数据;
15.s2、再通过声音识别模块识别方言的音调、音、音频和每个字的读音,并交由数据对比模块;
16.s3、数据对比模块根据声音识别模块识别到的音调、音、音频和每个字的读音与方言数据库中的方言数据比对,确定当前声音为哪一种方言;
17.s4、将确定下来的方言数据交由数据处理分析模块进行处理分析,从而确定当前方言的语义;
18.s5、将确定下来的语音数据交由语义转写模块,将方言转写成普通话语义,并通过显示模块进行显示或者通过播放模块进行播放。
19.(三)有益效果
20.本发明提供了一种方言语义快速转写技术,具备以下有益效果:
21.(1)、本发明可以快速的识别不同种类的方言,并将方言转写成可供其他人明白的普通语音,从而可以帮助不同区域的人员在进行沟通交流的时候更加的顺畅,不会存在语言上的障碍,进而可以帮助人们更好的进行社会性活动。
22.(2)、本发明在进行语义转写的时候,在遇到方言中的一个读音对应多个字的时候,此时可以结合该方言的前后文确定当前对应的文字,最终可以完成语义的撰写,使语义转写的正确率更高,避免出现张冠李戴的情况。
23.(3)、本发明在弯沉语义转写后,可以将转写的语义通过文字的形式显示出来,也可以通过声音的形式播放出来,从而帮助人们更好的进行沟通交流。
附图说明
24.图1为本发明的原理示意图。
具体实施方式
25.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
26.如图1所示,本发明提供一种技术方案:一种方言语义快速转写技术,包括快速转写系统,块转写系统包括麦克风模块、数据解析模块、声音识别模块、数据对比模块、方言数据库模块、数据处理分析模块、语义转写模块、显示模块和播放模块;
27.麦克风模块用于收录用户的声音;数据解析模块用于将麦克风模块收录的声音数据进行解析为音调数据、音频数据、音数据和读音数据;声音识别模块用于识别解析后的
用户声音数据,声音识别模块包括音调识别模块、音频识别模块、音识别模块和读音识别模块;音调识别模块用于确定当前声音中的音调数据;音频识别模块用于确定当前声音的音频数据;音识别模块用于确定当前声音的音;读音识别模块用于确定当前声音每个字的读音;数据对比模块用于将识别后的声音数据与方言数据库中的数据进行比对,并确定为那种方言;方言数据库模块中收录每种方言的方言音调、方言音频、方言音和方言读音;数据处理分析模块用于处理和分析该方言数据的内容,数据处理分析模块包括模糊分析模块、前后结合模块和最终推断模块;模糊分析模块用于在该方言下一个字的读音对应多个字,此时将对应的多个字都选定出来;前后结合模块用于将模糊分析模块选定的多个字与方言的前后文结合,并通过最终推断模块推断出当前读音所对应的字;语义转写模块用于将数据处理分析模块分析处理后的数据进行转写,形成可以让人们看懂的普通话;显示模块用于将语义转写模块转写后的文字语义显示出来,播放模块用于将语义转写模块转写后的文字语义播放出来。
28.一种方言语义快速转写技术还包括快速转写方法,该方法基于快速转写系统实现,具体包括如下步骤:
29.s1、通过麦克风模块收录用户的声音,并交由数据解析模块将声音数据解析成音调、音、音频和每个字的读音数据;
30.s2、再通过声音识别模块识别方言的音调、音、音频和每个字的读音,并交由数据对比模块;
31.s3、数据对比模块根据声音识别模块识别到的音调、音、音频和每个字的读音与方言数据库中的方言数据比对,确定当前声音为哪一种方言;
32.s4、将确定下来的方言数据交由数据处理分析模块进行处理分析,从而确定当前方言的语义;
33.s5、将确定下来的语音数据交由语义转写模块,将方言转写成普通话语义,并通过显示模块进行显示或者通过播放模块进行播放。
34.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
35.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

技术特征:


1.一种方言语义快速转写技术,包括快速转写系统,其特征在于:所述块转写系统包括麦克风模块、数据解析模块、声音识别模块、数据对比模块、方言数据库模块、数据处理分析模块和语义转写模块;所述麦克风模块用于收录用户的声音;所述数据解析模块用于将麦克风模块收录的声音数据进行解析;所述声音识别模块用于识别解析后的用户声音数据;所述数据对比模块用于将识别后的声音数据与方言数据库中的数据进行比对,并确定为那种方言;所述数据处理分析模块用于处理和分析该方言数据的内容;所述语义转写模块用于将数据处理分析模块分析处理后的数据进行转写,形成可以让人们看懂的普通话。2.根据权利要求1所述的一种方言语义快速转写技术,其特征在于:所述数据解析模块用于将麦克风收录到的声音数据解析为音调数据、音频数据、音数据和读音数据。3.根据权利要求1所述的一种方言语义快速转写技术,其特征在于:所述声音识别模块包括音调识别模块、音频识别模块、音识别模块和读音识别模块;所述音调识别模块用于确定当前声音中的音调数据;所述音频识别模块用于确定当前声音的音频数据;所述音识别模块用于确定当前声音的音;所述读音识别模块用于确定当前声音每个字的读音。4.根据权利要求1所述的一种方言语义快速转写技术,其特征在于:所述方言数据库模块中收录每种方言的方言音调、方言音频、方言音和方言读音。5.根据权利要求1所述的一种方言语义快速转写技术,其特征在于:所述数据处理分析模块包括模糊分析模块、前后结合模块和最终推断模块;所述模糊分析模块用于在该方言下一个字的读音对应多个字,此时将对应的多个字都选定出来;所述前后结合模块用于将模糊分析模块选定的多个字与方言的前后文结合,并通过最终推断模块推断出当前读音所对应的字。6.根据权利要求1所述的一种方言语义快速转写技术,其特征在于:所述快速转写系统还包括显示模块和播放模块,所述显示模块用于将语义转写模块转写后的文字语义显示出来,所述播放模块用于将语义转写模块转写后的文字语义播放出来。7.根据权利要求1-6任意一项所述的一种方言语义快速转写技术,其特征在于:所述技术还包括快速转写方法,该方法基于快速转写系统实现,具体包括如下步骤:s1、通过麦克风模块收录用户的声音,并交由数据解析模块将声音数据解析成音调、音、音频和每个字的读音数据;s2、再通过声音识别模块识别方言的音调、音、音频和每个字的读音,并交由数据对比模块;s3、数据对比模块根据声音识别模块识别到的音调、音、音频和每个字的读音与方言数据库中的方言数据比对,确定当前声音为哪一种方言;s4、将确定下来的方言数据交由数据处理分析模块进行处理分析,从而确定当前方言的语义;s5、将确定下来的语音数据交由语义转写模块,将方言转写成普通话语义,并通过显示模块进行显示或者通过播放模块进行播放。

技术总结


本发明涉及方言识别技术领域,且公开了一种方言语义快速转写技术,包括快速转写系统,所述块转写系统包括麦克风模块、数据解析模块、声音识别模块、数据对比模块、方言数据库模块、数据处理分析模块和语义转写模块;所述麦克风模块用于收录用户的声音;所述数据解析模块用于将麦克风模块收录的声音数据进行解析;所述声音识别模块用于识别解析后的用户声音数据。本发明可以快速的识别不同种类的方言,并将方言转写成可供其他人明白的普通语音,从而可以帮助不同区域的人员在进行沟通交流的时候更加的顺畅,不会存在语言上的障碍,进而可以帮助人们更好的进行社会性活动。可以帮助人们更好的进行社会性活动。可以帮助人们更好的进行社会性活动。


技术研发人员:

尚禹辰 李涵宇 陈昱涛

受保护的技术使用者:

尚禹辰

技术研发日:

2022.06.14

技术公布日:

2022/10/20

本文发布于:2024-09-21 13:24:59,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/23383.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:模块   方言   语义   数据
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议