基于译文特征与内容的中英文跨语种抄袭识别方法[发明专利]

专利名称:基于译文特征与内容的中英文跨语种抄袭识别方法专利类型:发明专利
发明人:刘功申,张昊,袁松翔,孟魁,宁蔚
申请号:CN201310567555.X
申请日:20131114
公开号:CN103544326A
公开日:
20140129
专利内容由知识产权出版社提供
摘要:本发明提供了一种基于译文特征与内容的中英文跨语种抄袭识别方法,包括:第一步骤,用于对需要检测的文章进行词法与句法分析,以便为译文特征抽取做准备;第二步骤,用于进行译文特征抽取及数据统计,然后按照词数为基准进行归一化处理,最后得到各特征的每万词出现次数的具体数据指标;第三步骤,用于将数据指标放入已经生成好的决策树以及支持向量机中进行运算以计算出抄袭值;第四步骤,用于判定抄袭值是否超过阈值,而且,如果抄袭值没有超过预定的阈值,则判定本文章为非抄袭文章,如果抄袭值超过预定的阈值,则处理进入基于内容的抄袭算法流程。
申请人:上海交通大学
地址:200240 上海市闵行区东川路800号
国籍:CN
代理机构:上海思微知识产权代理事务所(普通合伙)
代理人:郑玮

本文发布于:2024-09-22 11:32:09,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/444012.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:抄袭   进行   译文   内容   用于
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议