一种专利文献翻译后的机器校对方法及其系统

著录项
  • CN202111634765.7
  • 20211229
  • CN114358030A
  • 20220415
  • 苏州远卓科技信息有限公司
  • 王格丽
  • G06F40/58
  • G06F40/58 G06F40/226 G06F40/131

  • 江苏省苏州市高新区邓尉路109号
  • 江苏(32)
  • 北京远大卓悦知识产权代理有限公司
  • 李淑亚
摘要
本发明属于机器翻译领域,公开了一种专利文献翻译后的机器校对方法,包括如下步骤:将翻译后的专利文献进行区域划分形成若干划分区;对若干划分区内的专利文献进行同步分区机器校对,同步分区机器校对包括对若干划分区内相同内容进行关联机器校对,其中,关联机器校对包括对专利文献各划分区内的相同内容只校对一次。此外,本发明还公布了使用该机器校对方法的机器校对系统。采用先分区,后同步机器校对的方式,可以有效提升机器校对的速率,提高专利文献机器翻译的效率。
权利要求

1.一种专利文献翻译后的机器校对方法,其特征在于,包括如下步骤:

将翻译后的专利文献进行区域划分形成若干划分区;

对所述若干划分区内的专利文献进行同步分区机器校对;

其中,所述同步分区机器校对包括对若干划分区内相同内容进行关联机器校对,所述关联机器校对包括对相同内容进行第一次校对后对后续相同内容直接匹配第一次校对的结果。

2.根据权利要求1所述的专利文献翻译后的机器校对方法,其特征在于,所述进行区域划分包括对所述翻译后的专利文献按照内容特征进行区域划分。

3.根据权利要求1所述的专利文献翻译后的机器校对方法,其特征在于,所述区域划分包括若干次划分形成若干级划分区。

4.根据权利要求3所述的专利文献翻译后的机器校对方法,其特征在于,所述若干级划分区包括一级划分区、二级划分区、三级划分区;其中,所述一级划分区包括:说明书摘要、权利要求、说明书、说明书附图;所述二级划分区包括技术领域、背景技术、发明内容、附图说明、具体实施方式;所述三级划分区包括摘要附图、实施例。

5.根据权利要求1所述的专利文献翻译后的机器校对方法,其特征在于,在所述进行同步分区机器校对前,还包括对若干划分区进行优先级排序的步骤。

6.根据权利要求5所述的专利文献翻译后的机器校对方法,其特征在于,所述优先级排序的方法为按照划分区内的专利文献的复杂度和/或重要度进行优先级排序。

7.根据权利要求5所述的专利文献翻译后的机器校对方法,其特征在于,所述同步分区机器校对还包括对获得第一优先级的划分区的专利文献内容进行若干次校对。

8.一种专利文献翻译后的机器校对系统,其特征在于,包括:

划分模块,被配置用于对翻译后的专利文献进行区域划分形成若干划分区;

执行模块,被配置用于对若干划分区内的专利文献内容进行同步分区机器校对。

9.根据权利要求8所述的专利文献翻译后的机器校对系统,其特征在于,所述专利文献翻译后的机器校对系统还包括:

优先级排序模块,被配置对区域划分后形成的专利文献划分区进行优先级排序。

10.根据权利要求8所述的专利文献翻译后的机器校对系统,其特征在于,所述划分模块还包括被配置用于对专利文献进行多级划分。

说明书
技术领域

本发明涉及机器翻译领域,特别涉及一种专利文献翻译后的机器校对方法及其系统。

专利文献是技术信息传递的重要载体,囊括了全球90%以上的最新技术情报。随着国际申请的增多,现有技术也不断壮大,在评估国内专利文献新创性时,外文专利也成了不可或缺的一部分。

机器翻译是获取外文专利文献中的现有技术的常用手段之一。但是,由于专利文献存在大量的技术用语,专有名词,因此,机器翻译的准确度较低,需要进行校对,通常校对的方式为人工校对或机器校对。但是,人工校对耗时耗力,成本较高;而机器校对,由于专利文献专业性强,内容庞杂,其存在校对速度慢,校对效率低的问题。

针对现有技术中存在的不足之处,本发明的目的是提供一种专利文献翻译后的机器校对方法及其系统,其能够提升专利翻译的速率,提高专利文献机器翻译的效率。

为了实现根据本发明的上述目的和其他优点,本发明的第一目的是提供一种专利文献翻译后的机器校对方法,包括如下步骤:

将翻译后的专利文献进行区域划分形成若干划分区;

对若干划分区内的专利文献进行同步分区机器校对;

其中,同步分区机器校对包括对若干划分区内相同内容进行关联机器校对,关联机器校对包括对相同内容进行第一次校对后对后续相同内容直接匹配第一次校对的结果。

作为优选,进行区域划分包括对所述翻译后的专利文献按照内容特征进行区域划分。

作为优选,区域划分包括若干次划分形成若干级划分区。

作为优选,若干级划分区包括一级划分区、二级划分区、三级划分区;其中,一级划分区包括:说明书摘要、权利要求、说明书、说明书附图;二级划分区包括技术领域、背景技术、发明内容、附图说明、具体实施方式;三级划分区包括摘要附图、实施例。

作为优选,在进行同步分区机器校对前,还包括对若干划分区进行优先级排序的步骤。

作为优选,优先级排序的方法为按照划分区内的专利文献的复杂度和/或重要度进行优先级排序。

作为优选,同步分区机器校对还包括对获得第一优先级的划分区的专利文献内容进行若干次校对。

本发明的第二目的是提供一种专利文献翻译后的机器校对系统,其特征在于,其使用上述的方法,包括:

划分模块,被配置用于对翻译后的专利文献进行区域划分形成若干划分区;

执行模块,被配置用于对若干划分区内的专利文献内容进行同步分区机器校对。

作为优选,专利文献翻译后的机器校对系统还包括:

优先级排序模块,被配置对区域划分后形成的专利文献划分区进行优先级排序。

作为优选,划分模块还包括被配置用于对专利文献进行多级划分。

与现有技术相比,本发明的有益效果是:

本发明在翻译后的专利文献校对前,将专利文献进行区域划分,随后对区域划分后的专利文献进行分区同步机器校对。与现有技术相比,其先分区后校对,与现有技术中,从头到尾校对专利文献相比,由于分区后,多区同步进行,校对速度会得到提升。此外,在复杂内容的划分区内分配更多内存和算力,加快了复杂部分的校对速度,最终提升了专利文献翻译后的校对效率。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。本发明的具体实施方式由以下实施例及其附图详细给出。

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1为根据本发明所述的专利文献翻译后的机器校对方法的流程图;

图2为根据本发明所述的专利文献翻译后的机器校对方法的实施例1的逻辑流程图;

图3为根据本发明所述的专利文献翻译后的机器校对方法的实施例2的逻辑流程图;

图4为根据本发明所述的专利文献翻译后的机器校对系统的结构框图;

图中10、划分模块;20、执行模块;30、优先级排序模块;40、分配模块。

下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。

在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。

参照图1,一种专利文献翻译后的机器校对方法,包括如下步骤:

S01:将翻译后的专利文献进行区域划分形成若干个划分区。

S02:对若干划分区的专利文献进行同步分区机器校对,其中,同步分区机器校对包括对若干划分区内相同内容进行关联机器校对,关联机器校对包括对所述专利文献各划分区内的相同内容匹配第一次校对的结果。即对相同内容匹配实行第一次校对的结果,具体而言,若相同内容第一次校对后翻译结果正确,则认为该校对内容无误,在后续检测到相同内容时,直接判定结果为正确。同样的,若第一次校对后翻译结构不正确,则重新翻译并重新校对,对于后续的内容也直接不进行校对而执行相同的操作。本发明中,首先将翻译后的专利文献进行分区,然后对若干分区内的专利文献进行分区机器校对。其通过区域划分的方式,进行专利文献的同步机器校对。提升了专利文献的机器校对速率,在提升速率的情况下,进行多遍机器校对复查,最终提升了专利文献机器校对的效率,此外,在同步分区校对中,对于划分区内相同内容进行关联机器校对,具体而言,由于专利文献的特殊性,如权利要求与说明书的发明内容有较多的相同相似内容,因此,在机器校对时,采用关联校对的方式,只对相同内容进行一次校对,通过只进行一次校对,进一步提升了机器校对的速率,加快专利文献翻译后的机器校对速率。

下文将结合更为具体的实施例对本分明所实现的有益效果作进一步的阐述。

实施例1

参照图2,该实施例提供了一种专利文献翻译后的机器校对方法,具体包括如下步骤:

S11:将专利文献按照内容特征进行一级区域划分,划分后为说明书摘要、权利要求、说明书、说明书附图四个部分。

S12:将划分后的说明书进行二级划分,划分后为技术领域、背景技术、发明内容、附图说明、具体实施方式五个部分。

S13:将划分后的具体实施方式进行三级划分,划分为若干个实施例。

S14:对划分后的专利文献各划分区内容进行机器校对,其中,对于权利要求与发明内容进行关联校对。

在该实施例中,通过多级划分,将翻译后的专利文献按内容特征进行更细化的划分,机器校对时更细化,能够通过不同内容特征匹配更为专业的词典进行机器校对,以此进一步加快专利文献的机器校对速度,匹配更为专业的词典进行机器校对,也进一步提升了专利文献的校对准确率,最终提升了专利文献机器校对的效率。

实施例2、

参照图3,该实施例提供了一种专利文献翻译后的机器校对方法,具体包括如下步骤:

S21:将专利文献按照内容特征进行一级区域划分,划分后为说明书摘要、权利要求、说明书、说明书附图四个部分。

S22:将划分后的说明书进行二级划分,划分后为技术领域、背景技术、发明内容、附图说明、具体实施方式五个部分。

S23:将划分后的具体实施方式进行三级划分,划分为若干个实施例。

S24:对划分后的专利文献各划分区进行优先级排序;具体而言,通过专利文献各划分区中的内容的复杂程度和/或重要程度进行优先级排序;如按照复杂程度排序的优选级排序为说明书、权利要求、说明书摘要、谁明书附图。

S25:按照优先级排序对各划分区的专利文献进行算力分配,具体而言,为优先级越高,其算力分配越多。

S26:按分配的算力对各分区的内容进行机器翻译校对。

S27:对优先级较高的分区内容进行多次机器校对。具体而言,如对因复杂度较高而使优先级较高的说明书进行三次校对,对因较简单而使优先级较低的说明书附图进行一次校对甚至于不校对。

在该实施例中,首先加入了优先级排序的步骤,对于专利文献中,复杂的、重要的内容确定为较高优先级,如说明书,权利要求;对于专利文献中,简单的、次重要的确定为较低优先级,如说明书摘要、说明书附图。在优先级排序后,对于有较高优先级的内容分配更多的算力进行机器校对,而对于较低优先级的内容分配较少的算力进行机器校对。通过此种方式分配,算力分配更合理,机器校对的效率更高,速度更快。此外,通过更多的算力处理复杂的内容,其也能间接提升专利机器校对的准确率。

此外,在该实施例中,对于复杂的重要的优先级排序较高的内容进行了多次校对,一方面,复杂内容多次校对,简单内容尽量少次校对甚至于不校对,如在一次校对说明书附图后,其将校对说明书附图的算力分配给说明书进行校对,如此可以使算力得到更充分的利用,与现有技术中,一篇专利文献翻译后的多次整体校对相比,综合提升了专利文献翻译后的机器校对速率。另一方面,对于重要内容的多次校对,提升了重要内容机器校对过程中的准确率,如对权利要求的多次校对,可以提升权利要求的表述准确性,避免了后续因翻译校对次数不足,翻译内容不准确,权利要求范围不清楚的情况。

实施例3

参照图4,一种专利文献翻译后的机器校对系统,其使用上述的专利文献翻译后的机器校对方法,包括:

划分模块10,被配置用于对翻译后的专利文献进行区域划分形成若干划分区;

执行模块20,被配置用于对若干划分区内的专利文献内容进行同步分区机器校对。

该机器校对系统的工作原理如下:获取专利文献后,通过划分模块10对翻译后的专利文献进行区域划分,随后将专利温馨啊区域划分后的内容发送给执行模块20,通过执行模块20执行同步机器校对,最终完成专利文献翻译后的机器校对。

在一些优选的实施例中,划分模块10还包括被配置用于进行若干级划分的操作。通过若干级的划分,将专利文献的内容进一步细化划分,更有利于专利文献的后续机器校对,使校对效率进一步提升。

在一些优选的实施例中,专利文献的机器翻译系统还包括优先级排序模块30,其被配置对区域划分后形成的专利文献划分区进行优先级排序。通过优先级排序,对重要的复杂的内容进行单独校对,优先校对,对多个简单的内容进行组合校对,置后校对。如对于专利文献的说明书进行单独校对,优先校对,对于专利文献的摘要和说明书附图进行组合校对、置后校对。通过优先级排序模块,进一步加快了专利文献校对速率,提升了专利文献的校对效率。

在一些优选的实施例中,对于优先级排序较高的内容,执行模块20对该内容进行多次校对,通过多次校对,提升了复杂的、重要的专利文献内容的校对准确率,从而提升了专利文献翻译后的机器校对的效率。

在一些优选的实施例中,专利文献的机器翻译系统还包括分配模块40,其被配置用于对优先级排序后的专利文献划分区进行算力分配。通过分配模块进行算力分配,对于复杂的重点的内容,如说明书,分配更多的算力进行校对,对于简单的,非重点内容如说明书附图,分配较少的算力进行校对。一方面,由于复杂内容算力更多,其机器校对效率会明显加快;另一方面,由于复杂内容的算力更多,其校对的准确率也会有提升。从而综合提升了专利文献的机器校对效率。

这里说明的设备数量和处理规模是用来简化本发明的说明的。对本发明的应用、修改和变化对本领域的技术人员来说是显而易见的。

尽管本发明的实施方案已公开如上,但其并不仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。

上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白,本说明书实施例可提供为方法或系统。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。

本说明书是参照根据本说明书实施例的方法、系统的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书实施例而已,并不用于限制本说明书一个或多个实施例。对于本领域技术人员来说,本说明书一个或多个实施例可以有各种更改和变化。凡在本说明书一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的权利要求范围之内。本说明书一个或多个实施例本说明书一个或多个实施例本说明书一个或多个实施例本说明书一个或多个实施例。

本文发布于:2024-09-23 04:24:28,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/69037.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议