专利文档的元件信息提取方法、处理装置以及存储介质

著录项
  • CN202010872351.7
  • 20200826
  • CN112017079A
  • 20201201
  • 深圳市唯德科创信息有限公司
  • 谢德意;陶帅军
  • G06Q50/18
  • G06Q50/18 G06F40/289

  • 广东省深圳市福田区深勘大厦1303
  • 广东(44)
摘要
本申请公开了一种专利文档的元件信息提取方法、处理装置以及存储介质,其中,该专利文档的审核方法包括:提取专利文档中的元件标号;对元件标号之前的文字进行切词处理,得到元件名称;将元件名称和元件标号组合形成元件信息。通过上述方式,能够准确的对专利文档中的元件信息进行提取。
权利要求

1.一种专利文档的元件信息提取方法,其特征在于,所述方法包括:

提取专利文档中的元件标号;

对所述元件标号之前的文字进行切词处理,得到元件名称;

将所述元件名称和所述元件标号组合形成元件信息。

2.根据权利要求1所述的方法,其特征在于,

所述提取专利文档中的元件标号,包括:

提取专利文档中的阿拉伯数字;

判断所述阿拉伯数字是否满足第一预设要求;

若是,则确定所述阿拉伯数字为元件标号。

3.根据权利要求2所述的方法,其特征在于,

所述判断所述阿拉伯数字是否满足预设要求,包括:

判断所述阿拉伯数字的位数是否小于预设位数阈值;

若是,则确定所述阿拉伯数字满足第一预设要求。

4.根据权利要求2所述的方法,其特征在于,

所述提取专利文档中的阿拉伯数字之后,还包括:

提取所述阿拉伯数字之后的英文字母;

判断所述英文字母是否满足第二预设要求;

在所述阿拉伯数字满足所述第一预设要求,且所述英文字母满足所述第二预设要求时,将所述阿拉伯数字和所述英文字母组合作为所述元件标号。

5.根据权利要求1所述的方法,其特征在于,

所述对所述元件标号之前的文字进行切词处理,得到元件名称,包括:

判断所述元件标号之前的设定数量个文字中是否有预设字/词;

若有,则将最后的预设字/词和元件标号之间的文字作为元件名称。

6.根据权利要求5所述的方法,其特征在于,

所述预设字/词为预设切词库中的字/词,所述预设切词库由用户自定义建立。

7.根据权利要求5所述的方法,其特征在于,

所述判断所述元件标号之前的设定数量个文字中是否有预设字/词,包括:

判断所述元件标号至所述元件标号之前的第一个标点符号之间的文字中是否有预设字/词。

8.根据权利要求1所述的方法,其特征在于,

所述对所述元件标号之前的文字进行切词处理,得到元件名称,包括:

获取所述元件标号至所述元件标号之前的第一个标点符号之间的目标文字;

将所述目标文字与预设名称库中的元件名称进行匹配,以得到元件名称。

9.一种专利文档的审核装置,其特征在于,所述审核装置包括处理器和存储器,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现如权利要求1-8任一项所述的方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序数据,所述程序数据在被处理器执行时,用以实现如权利要求1-8任一项所述的方法。

说明书
技术领域

本申请涉及文档审核技术领域,特别是涉及一种专利文档的元件信息提取方法、处理装置以及存储介质。

专利一般是由政府机关或者代表若干国家的区域性组织根据申请而颁发的一种文件,这种文件记载了发明创造的内容,并且在一定时期内产生这样一种法律状态,即获得专利的发明创造在一般情况下他人只有经专利权人许可才能予以实施。专利一般分为发明、实用新型和外观设计三种类型。

对于发明和实用新型专利而言,其一般是通过文字和附图的记载来限定专利的保护范围,以及对专利技术进行详细的介绍,并且专利作为法律文件也需要有一定的准确性保障。专利一般由人工撰写,难免会出现各种错误,因此,对专利文档进行自动化审核,成为了亟待解决的问题。

为解决上述问题,本申请提供了一种专利文档的元件信息提取方法、处理装置以及存储介质,能够准确的对专利文档中的元件信息进行提取。

本申请采用的一个技术方案是:提供一种专利文档的元件信息提取方法,该方法包括:提取专利文档中的元件标号;对元件标号之前的文字进行切词处理,得到元件名称;将元件名称和元件标号组合形成元件信息。

其中,提取专利文档中的元件标号,包括:提取专利文档中的阿拉伯数字;判断阿拉伯数字是否满足第一预设要求;若是,则确定阿拉伯数字为元件标号。

其中,判断阿拉伯数字是否满足预设要求,包括:判断阿拉伯数字的位数是否小于预设位数阈值;若是,则确定阿拉伯数字满足第一预设要求。

其中,提取专利文档中的阿拉伯数字之后,还包括:提取阿拉伯数字之后的英文字母;判断英文字母是否满足第二预设要求;在阿拉伯数字满足第一预设要求,且英文字母满足第二预设要求时,将阿拉伯数字和英文字母组合作为元件标号。

其中,对元件标号之前的文字进行切词处理,得到元件名称,包括:判断元件标号之前的设定数量个文字中是否有预设字/词;若有,则将最后的预设字/词和元件标号之间的文字作为元件名称。

其中,预设字/词为预设切词库中的字/词,预设切词库由用户自定义建立。

其中,判断元件标号之前的设定数量个文字中是否有预设字/词,包括:判断元件标号至元件标号之前的第一个标点符号之间的文字中是否有预设字/词。

其中,对元件标号之前的文字进行切词处理,得到元件名称,包括:获取元件标号至元件标号之前的第一个标点符号之间的目标文字;将目标文字与预设名称库中的元件名称进行匹配,以得到元件名称。

本申请采用的另一个技术方案是:提供一种专利文档的处理装置,该处理装置包括处理器和存储器,存储器用于存储程序数据,处理器用于执行程序数据以实现如上述的方法。

本申请采用的另一个技术方案是:提供一种计算机可读存储介质,该计算机可读存储介质中存储有程序数据,程序数据在被处理器执行时,用以实现如上述的方法。

本申请提供专利文档的元件信息提取方法包括:提取专利文档中的元件标号;对元件标号之前的文字进行切词处理,得到元件名称;将元件名称和元件标号组合形成元件信息。通过上述方式,能够准确的对专利文档中的元件信息进行提取,以便对元件名称、元件标号等进行审核,节约了人力成本,提高了专利审核效率,也可以对人力审核提供参考。

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:

图1是本申请一实施例提供的专利文档的审核方法的流程示意图;

图2是本申请一实施例提供的元件信息的提取方法的流程示意图;

图3是本申请一实施例提供的图文一致性审核的流程示意图;

图4是本申请一实施例提供的专利文档的权利要求树建立方法的流程示意图;

图5是本申请一实施例提供的专利文档辅助撰写方法的流程示意图;

图6是本申请一实施例提供的专利文档的处理装置的结构示意图;

图7是本申请一实施例提供的计算机可读存储介质的结构示意图。

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。可以理解的是,此处所描述的具体实施例仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请中的术语″第一″、″第二″等是用于区别不同对象,而不是用于描述特定顺序。此外,术语″包括″和″具有″以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及″实施例″意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

参阅图1,图1是本申请一实施例提供的专利文档的审核方法的流程示意图,该方法包括:

步骤11:显示一操作界面。

操作界面用于显示专利文件、显示审核结果、以及接收用户输入的操作指令。可选地,操作界面可以包括文档显示区域、审核结果显示区域以及多个操作按钮,文档显示区域用于显示导入的专利文档,审核结果显示区域用于显示审核结果,多个操作按钮用于接收用户输入的操作指令。

具体地,本实施例的方法可以通过一应用程序(application,APP)来实现,通过点击该APP的快捷方式可以进入登录界面,在登录界面输入账号、密码等用户信息可以进入上述操作界面。

步骤12:响应于在操作界面输入的导入指令,导入专利文档,并将专利文档显示于操作界面的文档显示区域;其中,文档显示区域中的专利文档处于可编辑状态。

可选地,操作界面上设置有一导入按钮,用户点击该导入按钮后弹出地址索引栏,根据用户的选择确定指定地址索引的一个专利文档进行导入。

可以理解地,本实施例中的专利文档可以是文件名后缀为″doc″或″docx″的文档,例如office办公软件中的word文档或者WPS办公软件中的word文档。当然,在其他实施例中,也可以是其他的文字编辑文档。

进一步,对于专利文档,其依然以原word中的界面显示于文档显示区域,具体包括功能栏和文字部分。其中,功能栏可以包括″开始″″插入″″页面布局″″引用″″审阅″″视图″等原word中自带的功能。例如,可以通过″开始″功能进行字体、字号、加粗、倾斜、下划线、颜等设置,也可以进行左对齐、居中对齐、右对齐等排版设置。

进一步,对于专利文档,可以直接对其进行编辑。例如,对于文字部分可以进行文字输入、修改、删除,对文字进行批注、突出显示等,对于附图部分,可以对附图进行删除和粘贴。可选地,对于采用visio软件绘制的附图,可以直接对附图进行编辑,例如,修改附图中的线条、形状、文字、标号等。

步骤13:对专利文档进行审核。

对专利文档进行审核主要包括三个部分:专利撰写规范审核、元件信息一致性审核和图文一致性审核。

一、专利撰写规范审核

专利撰写规范审核主要是根据专利撰写规范对专利文档进行审核,其中的专利撰写规范可以包括《专利法》《专利法实施细则》《专利审查指南》以及其他的自定义规范。下面通过几种例子来进行说明:

1、权利要求中的形式问题

例如:″多项引多项″问题,要求一个多项引用的权利要求所引用的多个权利要求中,没有多项引用的权利要求。具体可以通过获取权利要求中的阿拉伯数字信息,抓取其中的″A-B″″A至B″(A、B表示权利要求编号)等信息。具体举例,若权利要求5引用了权利要求1-4任一项,权利要求6引用了权利要求1-5任一项,即权利要求6引用的权利要求5也属于多项引用,因此,不符合专利撰写规范。

例如,″缺乏引用基础″问题,要求权利要求中通过″所述″引用的词句,需要在前述内容或引用的权利要求中出现过。具体可以通过获取权利要求中的″所述″,抓取″所述″之后的词句,在从前述内容和引用的权利要求中查是否已出现过。具体举例,若权利要求5中出现了″所述C″,则从权利要求5中″所述C″之前的内容中查是否有出现″C″,以及从权利要求5所引用的权利要求中查是否有出现″C″,若均未出现,则确定″所述C″缺乏引用基础。

例如,标点符号问题,按照规范每一个权利要求以″。″(句号)结尾,且每一个权利要求只能包含一个″。″。具体举例,可以查每一个权利要求中的″。″的数量,并确定权利要求结尾处是否以″。″结尾。

2、说明书中的形式问题

例如,说明书中的专利名称一般要求不超过25个字,具体可以检测说明书中的专利名称的字数来进行审核。

例如,附图说明和附图不一致的问题,附图说明一般对附图中的每一个图进行说明,附图中一般会以″图一″″图二″......的形式展示每一个附图,附图说明中需要对每一个附图进行说明,因此,可以检测附图说明中与附图是否对应。

例如,排版问题,对字体、行间距、段间距等进行检测,判断满足预设的要求。

例如,词句重复问题,一般连续出现两个相同的词句,则确定为重复问题,例如″所述所述″。

3、自定义规范

自定义规范可以根据日常的审核习惯或者用户自定义来设置。例如有的用户不喜欢在专利文档中出现一些太过于限制专利保护范围的用词,如″仅仅″″唯一″等,则可以将这次用词加入黑名单,在审核时,若文档中出现黑名单中的用词,则可以进行批注提醒。

二、元件信息一致性审核

元件信息一致性审核主要是对专利文档的文字部分进行审核,主要包括两个方面:同一元件名称对应的元件标号不同,以及同一元件标号对应的元件名称不同。下面需要用到一种元件信息的提取方法,参阅图2,图2是本申请一实施例提供的元件信息的提取方法的流程示意图,该方法包括:

步骤21:提取专利文档中的元件标号。

可以理解地,提取专利文档中的元件标号,主要是提取专利文档中说明书部分的元件标号。

可选地,在一种情况下,元件标号为阿拉伯数字。因此,可以提取专利文档中的阿拉伯数字;判断阿拉伯数字是否满足第一预设要求;若是,则确定阿拉伯数字为元件标号。

具体地,可以判断阿拉伯数字的位数是否小于预设位数阈值;若是,则确定阿拉伯数字满足第一预设要求。由于一般的标号都是两位数、三位数、四位数或五位数,一般不会有更多,可以根据实际情况在确定该预设位置阈值。如一连串的阿拉伯数字可能表示数据,例如″10111000″可能表示一个二进制数,例如″CNXXXXXXXX″(X表示任意阿拉伯数字)可能表示一个专利的申请号等。

可选地,在另一实施例中,元件标号为阿拉伯数字和英文字母的组合。因此,可以进一步提取阿拉伯数字之后的英文字母;判断英文字母是否满足第二预设要求;在阿拉伯数字满足第一预设要求,且英文字母满足第二预设要求时,将阿拉伯数字和英文字母组合作为元件标号。

具体地,一般以″阿拉伯数字+英文字母″组合形成元件标号时,英文字母的个数都是1个,因此,该第二预设要求可以判断英文字母的个数是否为1个。例如″101a″是一个满足要求的元件标号,而″101apple″则是一个不满足要求的元件标号。

步骤22:对元件标号之前的文字进行切词处理,得到元件名称。

可选地,可以采用语义识别技术获取元件标号之前的词语作为元件名称,也可以通过大数据获取词库,将元件标号之前的语句与词库进行对比,以获取元件名称,通常元件名称的字数比较短,因此,也可以加入字数的要求。例如,获取元件标号至元件标号之前的第一个标点符号之间的目标文字;将目标文字与预设名称库中的元件名称进行匹配,以得到元件名称。

具体地,在一具体的实施例中,可以判断元件标号之前的设定数量个文字中是否有预设字/词;若有,则将最后的预设字/词和元件标号之间的文字作为元件名称。具体地,通过预先设置的″切词库″来进行切词处理,″切词库″中词一般是表示方位、关系、动作的连接词,例如″和″″或″″在″″至″″连接″″对于″″关于″″根据″″通过″″除了″″由于″″的″″包括″″包含″″设置于″″位于″等,在进行切词时,从元件标号开始往前查是否有″切词库″中的词,若有,则确定元件标号和″切词库″之间的词为元件名称。

举例说明:专利文档中的一个句子如下:″将显示信号输入至显示屏100″。首先提取其中的阿拉伯数字″100″,然后从″100″之前查是否有切词库中的词,查到″至″,则将″至″和″100″之间的词″显示屏″作为元件名称。

另外,也可以根据一些特殊的元件信息设置不同的规则。例如包含英文字母的元件信息″LED显示屏100″,切词处理可以将″LED显示屏100″和″显示屏100″均作为切词结果,以便用户可以进行修改。例如标号中包含字母的元件信息″显示屏100a″,切词处理可以将″显示屏100″和″显示屏100a″均作为切词结果,以便用户可以进行修改。另外,除上述的″文字+数字″″字母+文字+数字″组合之外,还可以包括″字母+数字″(如LED 200)″文字+字母+数字″(如红光LED 300)″字母+汉字+数字″(如MOS管400)″数字+汉字+数字″(如4选1选择器500)。

在其他实施例中,也可以判断元件标号至元件标号之前的第一个标点符号之间的文字中是否有预设字/词。这里不再一一举例。

步骤23:将元件名称和元件标号组合形成元件信息。

在完成上述的切词处理后,可以得到文字部分的多个元件信息,则可以进行一致性审核,元件信息一致性审核主要包括两种:

同一元件名称对应的元件标号不同,例如″显示屏100″和″显示屏200″。具体可以将提取的元件信息进行一一对比,具体地,将所有元件名称相同的元件信息进行比对,判断其元件标号是否一致。可以理解地,若元件名称后面没有元件标号,也可以认定为不一致。

同一元件标号对应的元件名称不同,例如″显示屏100″和″摄像头100″。具体可以将提取的元件信息进行一一对比,具体地,将所有元件标号相同的元件信息进行比对,判断其元件名称是否一致。

三、图文一致性审核

如图3所示,图3是本申请一实施例提供的图文一致性审核的流程示意图,包括以下步骤:

步骤31:提取专利文档中文字部分的元件信息,以及提取所述专利文档中附图部分的元件标号;其中,所述元件信息包括元件名称和元件标号。

其中,可以采用切词法提取专利文档中文字部分的元件信息,上述实施例中已作介绍,这里不再赘述。

其中,可以对附图部分进行图像识别处理,得到多个元件标号。

元件标号一般是阿拉伯数字、英文字母、或阿拉伯数字和英文字母的组合,本实施例通过对附图进行图像识别处理,提取附图中的阿拉伯数字和英文字母,以得到每一附图中的元件标号。

具体地,对几种标号进行举例说明,阿拉伯数字一般可以是例如″100″″101″之类的标号,英文字母一般可以是例如″A″″b″之类的标号,阿拉伯数字和英文字母的组合一般可以是例如″200a″″101b″之类的标号。

可选地,上述的识别可以通过深度学习的方式来进行识别,具体可以通过有监督的深度神经网络来进行识别。例如,采用大量的附图作为训练数据,预先获取附图中的标号对每一附图进行标记,然后输入至神经网络中进行学习,通过计算输出值和真实值之间的损失值,对神经网络中的参数不断进行修正,以得到满足要求的神经网络,以便对附图中的标号进行识别。

可以理解地,专利文档中的附图在尺寸过大时,为了清晰的展示附图,一般会将附图的方向进行调整,在一实施例中,按照附图部分的当前排版格式,对附图部分进行第一次图像识别处理,得到第一类元件标号;将附图部分顺时针旋转90度,对附图部分进行第二次图像识别处理,得到第二类元件标号;将第一类元件标号和第二类元件标号组合得到多个元件标号。通过这样的方式,从两个方向分别通过图像识别获取元件标号,可以对进行旋转后的附图进行识别。

步骤32:基于所述元件信息,在所述附图部分的元件标号中进行查,以进行第一次图文一致性审核。

上述步骤中得到附图中的标号,本步骤中将切词得到的元件信息中的标号与附图中的标号进行一致性审核。具体可以包括以下情况:文字部分中的元件标号,在附图部分查到相同的元件标号,或者文字部分中的元件标号,在附图部分未查到。

步骤33:基于所述元件信息,在所述附图部分的元件标号中进行查,以进行第一次图文一致性审核。

上述步骤中得到附图中的标号,本步骤中针对附图中的每一标号,在文字部分中查是否有相匹配的标号,以进行图文一致性审核。具体可以包括以下情况:附图部分中的元件标号,在文字部分查到相同的元件标号,或者附图部分中的元件标号,在文字部分未查到。

可以理解地,步骤32是利用文字部分的标号在附图中查,步骤33是利用附图部分的标号在文字部分中查,两个步骤可以只选择其中的一个进行执行,也可以两个步骤均执行,进行双向的查审核。

另外,除了上述的审核过程之外,还可以根据权利要求建立权利要求树。如图4所示,图4是本申请一实施例提供的专利文档的权利要求树建立方法的流程示意图,该方法包括:

步骤41:获取专利文档的权利要求编号。

可选地,可以根据专利文档权利要求书部分的行首数字,确定多个权利要求以及每一权利要求的编号。可以理解地,权利要求编号从阿拉伯数字″1″开始递增排列,权利要求编号位于每一个权利要求的开端,即行首,所以,可以通过确定行首的数字来进行权利要求编号的获取。进一步,由于每一个权利要求只有一个″。″,在获取到第一个权利要求编号″1″时,可以自动去查下一个″。″之后的编号″2″,以此类推。

步骤42:获取专利文档的权利要求引用关系。

权利要求的引用关系可以根据每一个权利要求的第一句分析得到。一般权利要求的句式为″根据权利要求X......″,因此可以通过文字识别在获取″根据权利要求″之后的数字来确定每一权利要求的引用关系。另外,还可以根据每一权利要求中除权利要求编号之外的第一个数字组合,确定每一权利要求的引用关系。其中,数字组合主要是考虑到多项引用的问题,例如″根据权利要求1-3″,则可以确定该权利要求引用权利要求1、权利要求2和权利要求3。

步骤43:利用思维导图对权利要求编号和权利要求引用关系进行显示。

思维导图软件是一个创造、管理和交流思想的通用标准,其可视化的绘图软件有着直观、友好的用户界面和丰富的功能,这将帮助您有序地组织您的思维、资源和项目进程。思维导图软件作为一个组织资源和管理项目的方法,可从脑图的核心分枝派生出各种关联的想法和信息。

本申请方式所使用的APP可以内嵌一个思维导图插件,以实现思维导图的功能,或者与其他思维导图软件进行互动,来生成思维导图。

可选地,根据每一权利要求的引用关系,确定独立权利要求和从属权利要求;将每一独立权利要求作为自由主题,每一从属权利要求作为子主题,并根据权利要求引用关系建立思维导图。

具体地,若一个权利要求未引用任何权利要求,则可以确定该权利要求为独立权利要求,若一个权利要求引用其他权利要求,则可以确定该权利要求为从属权利要求。当然,在一些情况下,一些独立权利要求也可以引用其他权利要求,这种情况下,可以通过每一权利要求的句首文字来进行判断,例如,句尾为″一种″,则可以确定为独立权利要求,句尾为″根据权利要求″,则可以确定为从属权利要求。

可以理解地,以X-mind思维导图为例,X-mind中包含了自由主题和子主题,自由主题对应独立权利要求,子主题必须在一个自由主题的基础上产生,对应从属权利要求。因此可以根据权利要求及其引用关系建立一个以思维导图为基础的权利要求树。

进一步,还可以在思维导图中加入每一权利要求的内容。具体地:获取每一权利要求的文字内容;提取每一权利要求的文字内容的核心内容;将每一权利要求的核心内容显示于思维导图中的对应权利要求处。

其中,可以对每一权利要求的文字内容进行语义识别,以对每一权利要求的文字内容进行缩略处理,以得到每一权利要求的核心内容。或者对每一权利要求进行关键词提取,并将提取的关键词作为每一权利要求的核心内容。

步骤14:显示审核结果,并基于审核结果对专利文档进行批注。

其中,在审核结果显示区域分页显示一致性审核结果和专利撰写规范审核结果,并可接受输入的切换指令,对审核结果显示区域的显示页面进行切换;其中,一致性审核结果包括元件信息一致性审核结果和图文一致性审核结果。

另外,对于上述生成的权利要求树,也可以在审核结果显示区域进行显示。

可选地,审核结果显示区域分为三页,包括一致性审核、专利撰写规范审核和权利要求树。

对于一致性审核可以下表的形式显示:

元件名称 元件标号 附图位置 显示器 100 图1 摄像头 200 图1 显示器 101 300 图1 显示其 100 图1 LED显示器 100 图1 扬声器 400

对上表分析可知:

1、对于显示器100:

文字部分有″显示器100″,附图1中有对应的″100″标号,但是文字部分还有″显示其100″和″显示器101″这两种情况,认为判断可能是笔误写错,可以直接在表中或者专利文档中进行修改。

另外,文字部分还可能有因切词不准确出现的″LED显示器100″,此时用户可以根据实际情况确定标号100是对应″显示器″还是″LED显示器″。

2、对于摄像头200:

文字部分有″摄像头200″,附图1中也有对应的″200″标号。

3、对于标号300:

附图1中有标号″300″,但是在文字部分没有对应的标号。

4、对于扬声器400:

文字部分有″扬声器400″,但是在附图中没有查到。

可选地,对于上述不同的问题类型,可以对元件名称以及标号进行不同颜的显示,并在显示界面上提醒每一种颜所表示的问题类型,以便用户了解。

另外,在接收到对显示的元件信息、元件名称或元件标号的点击指定时,将专利文档的当前显示界面调整至相应的位置,并对相应的元件信息、元件名称或元件标号进行标记。例如,可以对相应的元件信息进行突出显示。

对于专利撰写规范审核结果,可以具体显示出对应的参考规范,即《专利法》《专利法实施细则》《专利审查指南》中的相关要求,并对应文档进行批注。

例如,某一权利要求中的″所述A″缺乏引用基础,导致权利要求保护范围不清楚,则可以在专利文档中的对应″所述A″的位置进行批注″缺乏引用基础,导致权利要求保护范围不清楚,不符合专利法第26条第4款的规定″,并在审核结果栏显示″批注N:缺乏引用基础,导致权利要求保护范围不清楚,不符合专利法第26条第4款的规定″。

对于权利要求树,可以直接出入X-mind的形式显示,且可对X-mind的思维导图进行编辑,例如,可以对其中的文字进行修改。另外,也可以是以图片的形式进行显示。

在上述审核过程完成之后,还可以对修改(批注)后的专利文档进行保存(或另存为),具体地,响应于在操作界面输入的保存指令,将已批注的专利文档保存至选择的地址。

参阅图5,图5是本申请一实施例提供的专利文档辅助撰写方法的流程示意图,该方法包括:

步骤51:获取专利撰写信息。

步骤52:根据专利撰写信息从模版数据库中获取对应的撰写模版。

其中,模版数据库是预先建立的包含专利撰写模版的数据库,具体可以由获取用户输入的撰写模版,或获取导入的专利文档以形成模版数据库。

其中,在一实施例中,该专利撰写信息可以是专利技术交底文档或已部分撰写的专利文档。

具体地,专利技术交底文档一般是发明人提供的对于专利技术进行介绍的文档,其中一般包括了背景技术,技术方案、保护要点和技术效果等内容。已部分撰写的专利文档即对专利文档进行撰写但是还未撰写完成。因此,可以对专利撰写信息进行关键词提取,得到多个关键词;根据关键词从模版数据库中获取对应的撰写模版。可选地,可以对专利技术交底文档或已部分撰写的专利文档的背景技术部分进行关键词提取,得到多个关键词。

其中,在另一实施例中,专利撰写信息包括技术领域信息、产品信息、申请国家信息、申请类型信息和申请人信息中的至少一种。

具体地,在建立模版数据库时,可以对每一模版关联一上述的信息,例如在模版入库时,需要至少确定其技术领域信息、产品信息、申请国家信息、申请类型信息和申请人信息中的一种。

步骤53:显示撰写模版,以对专利文档撰写提供辅助参考。

其中,可以将获取的撰写模版进行显示,以便用户在撰写专利文档时,可以直接参考该模版。

具体地,该撰写模版处于可编辑状态,以便用户可以对其中的内容进行复制。

可选地,若该撰写模版是专利文件中的一部分,则可以对应在该模版后显示该模版的出处,例如网络链接,以便用户可以根据该出处查到该模版的完整版本。另外,也可以支持导出模版、本地下载等功能。

另外,还可以建立一词语库,在用户撰写专利文档时,获取在专利文档中输入的目标词语;从词语库中查与目标词语相关联的至少一个关联词语;显示关联词语。

在一实施例中,该关联词语可以是该目标词语的上位概念词语,例如用户输入″智能手表″,则可以从词语库中查到″可穿戴设备″″智能设备″″智能装置″等词语。

在另一实施例中,该关联词语也可以是该目标词语的近义词,例如用户输入″智能手表″,则可以从词语库中查到″运动手表″″儿童手表″″导航手表″等词语。

另外,在专利文档撰写完成之后,还可以对专利文档进行查重,具体可以通过内部的专利库或者外部的专利库进行查重。内部的专利库可以是用户自行建立的专利库,外部专利库可以是某一个国家的专利库或者世界专利库。

参阅图6,图6是本申请一实施例提供的专利文档的处理装置的结构示意图,该专利文档的处理装置60包括处理器61和存储器62,其中,该存储器62用于存储程序数据,该处理器61用户执行该程序数据,以实现如下的方法:

显示一操作界面;响应于在操作界面输入的导入指令,导入专利文档,并将专利文档显示于操作界面的文档显示区域;其中,文档显示区域中的专利文档处于可编辑状态;对专利文档进行审核;显示审核结果,并基于审核结果对专利文档进行批注。

可选地,在另一实施例中,该处理器61用户执行该程序数据以实现如下的方法:提取专利文档中的元件标号;对元件标号之前的文字进行切词处理,得到元件名称;将元件名称和元件标号组合形成元件信息。

可选地,在另一实施例中,该处理器61用户执行该程序数据以实现如下的方法:提取专利文档中文字部分的元件信息,以及提取专利文档中附图部分的元件标号;其中,元件信息包括元件名称和元件标号;基于元件信息,在附图部分的元件标号中进行查,以进行第一次图文一致性审核;以及基于附图部分的元件标号,在文字部分进行查,以进行第二次图文一致性审核。

可选地,在另一实施例中,该处理器61用户执行该程序数据以实现如下的方法:获取专利文档的权利要求编号;获取专利文档的权利要求引用关系;利用思维导图对权利要求编号和权利要求引用关系进行显示。

可选地,在另一实施例中,该处理器61用户执行该程序数据以实现如下的方法:获取专利撰写信息;根据专利撰写信息从模版数据库中获取对应的撰写模版;显示撰写模版,以对专利文档撰写提供辅助参考。

参阅图7,图7是本申请一实施例提供的计算机可读存储介质的结构示意图,该计算机可读存储介质70中存储有程序数据71,该程序数据71在被处理器执行时,用于实现如下的方法:

显示一操作界面;响应于在操作界面输入的导入指令,导入专利文档,并将专利文档显示于操作界面的文档显示区域;其中,文档显示区域中的专利文档处于可编辑状态;对专利文档进行审核;显示审核结果,并基于审核结果对专利文档进行批注。

可选地,在另一实施例中,该程序数据71在被处理器执行时用于实现如下的方法:提取专利文档中的元件标号;对元件标号之前的文字进行切词处理,得到元件名称;将元件名称和元件标号组合形成元件信息。

可选地,在另一实施例中,该程序数据71在被处理器执行时用于实现如下的方法:提取专利文档中文字部分的元件信息,以及提取专利文档中附图部分的元件标号;其中,元件信息包括元件名称和元件标号;基于元件信息,在附图部分的元件标号中进行查,以进行第一次图文一致性审核;以及基于附图部分的元件标号,在文字部分进行查,以进行第二次图文一致性审核。

可选地,在另一实施例中,该程序数据71在被处理器执行时用于实现如下的方法:获取专利文档的权利要求编号;获取专利文档的权利要求引用关系;利用思维导图对权利要求编号和权利要求引用关系进行显示。

可选地,在另一实施例中,该程序数据71在被处理器执行时用于实现如下的方法:获取专利撰写信息;根据专利撰写信息从模版数据库中获取对应的撰写模版;显示撰写模版,以对专利文档撰写提供辅助参考。

在本申请所提供的几个实施方式中,应该理解到,所揭露的方法以及设备,可以通过其它的方式实现。例如,以上所描述的设备实施方式仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。

另外,在本申请各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

以上所述仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是根据本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

本文发布于:2024-09-20 19:55:15,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/69186.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议