一种基于语法树剪枝的翻译机测试方法[发明专利]

专利名称:一种基于语法树剪枝的翻译机测试方法专利类型:发明专利
发明人:房春荣,王擎宇,张犬俊,刘佳玮,陈振宇
申请号:CN202111471991.8
申请日:20211130
公开号:CN114239546A
公开日:
20220325
专利内容由知识产权出版社提供
摘要:本发明涉及一种机器翻译测试方法。该方法对语句构建依存语法树,按特定规则对语法树剪枝,基于一组依存语法树级别的删除运算符来破坏句子的有效性,从原始句子中删除单词或短语来生成新的语法和语义有效的句子,然后将原文和新生成的句子输入被测试的机器翻译系统,通过计算词袋距离,按照词袋距离大小排序扩增句子,选择距离最大的5个句子,通过手动为原句和翻译句子结果贴标签,标记出错的句子,完成对机器翻译系统的测试。本发明目的在于解决目前机器翻译测试主要通过替换句子中的部分单词来生成测试用例,测试性能主要受到所采用的语言模型的成熟度的限制。在数据扩增的同时,保证了句子的基本结构的不变性,从而发现了较多对错误,这些错误很多是过去机器翻译测试技术发现不了的。
申请人:南京大学
地址:210093 江苏省南京市鼓楼区汉口路22号南京大学软件学院925
国籍:CN

本文发布于:2024-09-21 01:26:24,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/428030.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:句子   测试   语法   距离   生成
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议