一种引入源语组块信息编码的神经机器翻译方法[发明专利]

专利名称:一种引入源语组块信息编码的神经机器翻译方法专利类型:发明专利
发明人:王强,吴开心,肖桐,朱靖波,张春良
申请号:CN201710795671.5
申请日:20170906
公开号:CN107632981A
公开日:
20180126
专利内容由知识产权出版社提供
摘要:本发明涉及一种引入源语组块信息编码的神经机器翻译方法,输入双语句子级平行数据,分别对源语和目标语分词,得到分词后的双语平行句对;对分词后的双语平行句对中的源语句子按时序进行编码,获取最后一层隐藏层上每个时序的状态,对输入的源语句按块进行切分;根据源语句的每个时序状态以及源语句的切分信息,获得源语句的块编码信息;将时序编码信息与块编码信息联合起来,获得最终的源语句记忆信息;解码器网络通过动态地查询源语句的记忆信息,利用注意力机制产生每一个时刻的上下文向量,并抽取特征向量,进行词汇预测。本发明自动对源语句进行块切分,不需要任何事先分块好的句子参与训练;能够捕捉到对源语句最新和最佳的分块方式。
申请人:沈阳雅译网络技术有限公司
地址:110004 辽宁省沈阳市和平区三好街55号1517室
国籍:CN
代理机构:沈阳优普达知识产权代理事务所(特殊普通合伙)
代理人:李晓光

本文发布于:2024-09-21 04:32:47,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/445196.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:信息   语句   编码   进行   分词
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议