首页 > 学术百科

一种软件设计宠物行为语言的人工智能翻译系统[发明专利]

(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号 (43)申请公布日 (21)申请号 202010190580.0

(22)申请日 2020.03.18

(71)申请人周升志

地址 330200 江西省南昌市青云谱区南莲

路608号

(72)发明人周升志　邓海英　邓海琳　黄解珠　

段凯文　廖健慧　江振东　

(74)专利代理机构南昌大牛知识产权代理事务

所(普通合伙) 36135

代理人喻莎

(51)Int.Cl.

G06K 9/62(2006.01)

G06N 3/04(2006.01)

G06N 3/08(2006.01)

G10L 17/26(2013.01)

G10L 25/30(2013.01)G10L 25/63(2013.01)

(54)发明名称

一种软件设计宠物行为语言的人工智能翻

译系统

(57)摘要

本发明涉及一种软件设计宠物行为语言的

人工智能翻译系统，属于软件设计与人工智能领

域，由以下部分组成：用户端、数据处理端、分类

处理端、信息汇总端和结果表达端。采用卷积神

经网络技术来实现宠物行为语言智能化分析的

系统，采用主成成分分析法(PCA)、深度信念神经

网络(DBN)和SoftMax函数进行分类处理技术来

实现宠物行为语言智能化分析的系统能够实现

更加高效、更为准确的宠物行为语言识别与翻

译。权利要求书2页说明书4页附图4页CN 111428769 A 2020.07.17

C N 111428769

1.一种软件设计宠物行为语言的人工智能翻译系统，其特征在于，由以下部分组成：用户端、数据处理端、分类处理端、信息汇总端和结果表达端。

2.根据权利要求1所述的用户端，其特征在于：以手机APP、、电脑软件形式设置在手机、平板电脑、电脑等智能终端，使用者根据软件注册操作提示，相应提供宠物的种类、年龄、性别生活环境和生活习惯相关信息；用户根据软件操作提示，用手机等智能终端对犬、猫的动作行为拍一段限定时间的视频或从相册选择已拍好的犬、猫行为视频，提交上传作为提供视频信息。

3.根据权利要求1所述的数据处理端，其特征在于：通过卷积神经网络的人工智能技术、主成成分分析法、深度信念神经网络和SoftMax函数进行分类处理，提取器官、声音和行为的变化表征，建立生成分析对象，具体体现在：对上传视频首先按已设定的各个器官特异点，提取头部、眼睛、鼻子、耳朵、舌头、牙齿、嘴唇和尾巴的器官变化表征；对上传视频按已设定的运动特异点，提取坐、站立、卧倒、匍匐和跳跃变化的表征；对上传视频按已设定的声音特异点，提取音高、音调、时间长短和时间频率变化的表征。

4.根据权利要求1所述的分类处理端，其特征在于：分类处理端为固化模型数据库，包含器官固化模型数据库、运动模型数据库和声音模型数据库三个数据库，由数据处理端采集的器官、行为和声音表征作为处理对象，按已设定的特异点分析方法，匹配分类处理端的固化模型数据库，得到固化模型数据库运算结果。

5.根据权利要求1所述的信息汇总端，其特征在于：信息汇总端是语言处理模块，对分类处理端的固化模

型数据库运算结果进行再处理，建立逻辑关系通过造句表达，固化模型数据库运算的结果为片段式信息，信息汇总端对上述大量的片段式信息做信息汇总，删除突兀、矛盾的词汇，建立词汇逻辑来造句表达，得到处理结果。

6.根据权利要求1所述的结果表达端，其特征在于：结果表达端是语言匹配模块，根据用户端注册提供的宠物种类、年龄和性别信息，相应匹配男声、女生和童声模式，对信息汇总端的处理结果进行声音表达。

7.根据权利要求4所述器官固化模型数据库、运动模型数据库的建立是通过卷积神经网络的人工智能技术实现；所述声音模型数据库过使用主成成分分析法(PCA)、深度信念神经网络(DBN)和SoftMax函数进行分类处理技术来实现。

8.根据权利要求3或权利要求7所述的卷积神经网络的人工智能技术，其特征在于，具体为以下步骤：

(1)首先，卷积神经网络的卷积层通过选择连续三个帧的图像进行卷积图像识别，保证每一个特征map上都能够与前一帧图像进行相连，来捕捉运动信息；

(2)再将大小为60*40的视频连续帧图像作为输入层元素，同时使用大小为7*7*3的3D 卷积和进行卷积操作，其中7*7标识空间维度，7*7*3表示使用三个空间维度的卷积核；

(3)再采用23*2max pooling操作对数据进行降采样；

(4)最后，再通过7*6*3的卷积核进行卷积操作，通过卷积操作值已经很小，故采用7*4大小的降采样层对数据进行操作，最终识别出动物的各个已设定的器官行为和动作行为。

9.根据权利要求3或权利要求7所述的主成成分分析法、深度信念神经网络和SoftMax 函数其特征在于，具体由以下步骤组成(1)通过短时平均能量算法进行音频识别；

(2)再次，通过主成成分分析法(PCA)对音频数据的冗余噪音，进行进行降维处理；

(3)处理后的音频数据输入到深度信念神经网络(DBN)中进行训练；

(4)最后通过SoftMax函数分类处理技术，对音频数据进行运算，从而完成音频情绪识别。

10.一种如权利要求1所述的软件设计宠物行为语言的人工智能翻译系统的应用，其特征在于：所述可分析的宠物种类包括犬类和猫。

一种软件设计宠物行为语言的人工智能翻译系统

技术领域

[0001]本发明涉及一种软件设计宠物行为语言的人工智能翻译系统，属于软件设计与人工智能领域。

背景技术

[0002]针对于宠物行为学的研究，国内研究比国外起步晚，在近几年才兴起对宠物行为学的研究，目前国内外暂无宠物行为语言的人工智能研究专利及软件产品，因此本发明具有独创性。宠物行为语言的研究对加深饲主与宠物沟通、宠物训导和宠物心理疾病的诊疗有非常重要的意义，但是宠物行为语言在国内发展晚，理论基础差且学习难度高，限制了宠物行为语言在生活和临床诊疗中的应用；其次，计算机技术应用于宠物行为语言的难度高，传统人工智能技术需要大量的视频数据库或图片数据库，难以实现智能化，因此国内外暂无相关宠物行为语言的人工智能软件。

[0003]目前国内外常用的神经网络识别方法为2DCNN，这种方法主要是通过将视频图像切割成为每一帧，再通过使用2DCNN神经网络识别模型时间维度下逐帧之间的运动信息交互，缺点为识别准确率偏低；而卷积神经网络技术的卷积层，是通过选择连续三个帧的图像进行卷积识别，替代2DCNN的单帧图像识别，保证每一个特征map上都能够与前一帧图像进行相连，来捕捉运动信息，准确率更高且技术更加先进。

[0004]由于音频信号存在高维度高冗余的特点，传统的音频情绪识别模型中，往往需要通过先对音频进行音频处理，根据实际需要提取较为合适的音频特征，最后通过建模将所提取到的特征进行模型训练，

最终达到音频情绪识别的效果，因此识别准确率低、效率低且难以实践应用。

发明内容

[0005]基于背景技术中提到的上述问题，为解决上述问题，本发明拟提供一种宠物行为语言的人工智能翻译系统。

[0006]本发明的系统是通过以下步骤实现的：

[0007]本发明的工作流程为，第一步，用户根据软件操作提示，用手机等智能终端对犬、猫的动作行为拍一段限定时间的视频或从相册选择已拍好的犬、猫行为视频，提交上传；第二步，数据处理端主要有三个作用，顺序不分先后。首先，对上传视频首先按已设定的各个器官特异点，提取眼睛、鼻子、耳朵、舌头、牙齿、嘴唇和尾巴的器官变化表征；其次，按已设定的运动特异点，提取坐、站立、卧倒、匍匐和跳跃变化的表征；最后，按已设定的声音特异点，提取音高、音调、时间长短和时间频率变化的表征；第三步，分类处理端为固化模型数据库，包含器官固化模型数据库、运动模型数据库和声音模型数据库三个数据库。数据处理端采集的器官、行为和声音表征按已设定的特异点分析方法，匹配分类处理端的固化模型数据库，得到固化模型数据库运算结果，其结果为片段式信息；第四步，信息汇总端对上述大量的片段式信息做信息汇总，删除突兀、矛盾的词汇，建立词汇逻辑来造句表达，得到处理

结果；第五步，结果表达端根据用户注册提供的宠物年龄和性别信息，相应匹配男声、女生和童声模式，对信息汇总端的处理结果进行声音表达。

[0008]本发明的技术方案为：

[0009]一种软件设计宠物行为语言的人工智能翻译系统，由以下部分组成：用户端、数据处理端、分类处理端、信息汇总端和结果表达端

[0010]所述的用户端为：以手机APP、、电脑软件形式设置在手机、平板电脑、电脑等智能终端，使用者根据软件注册操作提示，相应提供宠物的种类、年龄、性别生活环境和生活习惯相关信息；用户根据软件操作提示，用手机等智能终端对犬、猫的动作行为拍一段限定时间的视频或从相册选择已拍好的犬、猫行为视频，提交上传作为提供视频信息。[0011]所述的数据处理端：通过卷积神经网络的人工智能技术、主成成分分析法、深度信念神经网络和SoftMax函数进行分类处理，提取器官、声音和行为的变化表征，建立生成分析对象，具体体现在：对上传视频首先按已设定的各个器官特异点，提取头部、眼睛、鼻子、耳朵、舌头、牙齿、嘴唇和尾巴的器官变化表征；对上传视频按已设定的运动特异点，提取坐、站立、卧倒、匍匐和跳跃变化的表征；对上传视频按已设定的声音特异点，提取音高、音调、时间长短和时间频率变化的表征。

[0012]所述的分类处理端于：分类处理端为固化模型数据库，包含器官固化模型数据库、运动模型数据

库和声音模型数据库三个数据库，由数据处理端采集的器官、行为和声音表征作为处理对象，按已设定的特异点分析方法，匹配分类处理端的固化模型数据库，得到固化模型数据库运算结果。

[0013]所述的信息汇总端：信息汇总端是语言处理模块，对分类处理端的固化模型数据库运算结果进行再处理，建立逻辑关系通过造句表达，固化模型数据库运算的结果为片段式信息，信息汇总端对上述大量的片段式信息做信息汇总，删除突兀、矛盾的词汇，建立词汇逻辑来造句表达，得到处理结果。

[0014]所述的结果表达端：结果表达端是语言匹配模块，根据用户端注册提供的宠物种类、年龄和性别信息，相应匹配男声、女生和童声模式，对信息汇总端的处理结果进行声音表达。

[0015]所述器官固化模型数据库、运动模型数据库的建立是通过卷积神经网络的人工智能技术实现；所述声音模型数据库过使用主成成分分析法(PCA)、深度信念神经网络(DBN)和SoftMax函数进行分类处理技术来实现。

[0016]所述的卷积神经网络的人工智能技术，具体为以下步骤：

[0017](1)首先，卷积神经网络的卷积层通过选择连续三个帧的图像进行卷积图像识别，保证每一个特征map上都能够与前一帧图像进行相连，来捕捉运动信息；

[0018](2)再将大小为60*40的视频连续帧图像作为输入层元素，同时使用大小为7*7*3的3D卷积和进行卷

积操作，其中7*7标识空间维度，7*7*3表示使用三个空间维度的卷积核；[0019](3)再采用23*2max pooling操作对数据进行降采样；

[0020](4)最后，再通过7*6*3的卷积核进行卷积操作，通过卷积操作值已经很小，故采用7*4大小的降采样层对数据进行操作，最终识别出动物的各个已设定的器官行为和动作行为。

[0021]所述的主成成分分析法、深度信念神经网络和SoftMax函数，具体由以下步骤组成

本文发布于:2024-09-20 12:28:09，感谢您对本站的认可！

本文链接：https://www.17tex.com/xueshu/798533.html

上一篇：一种假病毒载体及其制备方法和应用[发明专利]

下一篇：汽车智能驾驶技术的专利申请书样例

标签：宠物行为进行

留言与评论（共有 0 条评论）