专利名称:一种引入源语组块信息编码的神经机器翻译方法专利类型:发明专利 发明人:王强,吴开心,肖桐,朱靖波,张春良
申请号:CN201710795671.5
申请日:20170906
公开号:CN107632981A
公开日:
20180126
专利内容由知识产权出版社提供
摘要:本发明涉及一种引入源语组块信息编码的神经机器翻译方法,输入双语句子级平行数据,分别对源语和目标语分词,得到分词后的双语平行句对;对分词后的双语平行句对中的源语句子按时序进行编码,获取最后一层隐藏层上每个时序的状态,对输入的源语句按块进行切分;根据源语句的每个时序状态以及源语句的切分信息,获得源语句的块编码信息;将时序编码信息与块编码信息联合起来,获得最终的源语句记忆信息;解码器网络通过动态地查询源语句的记忆信息,利用注意力机制产生每一个时刻的上下文向量,并抽取特征向量,进行词汇预测。本发明自动对源语句进行块切分,不需要任何事先分块好的句子参与训练;能够捕捉到对源语句最新和最佳的分块方式。 申请人:沈阳雅译网络技术有限公司
地址:110004 辽宁省沈阳市和平区三好街55号1517室
国籍:CN
代理机构:沈阳优普达知识产权代理事务所(特殊普通合伙)
代理人:李晓光