一种用于专利技术现状的检索方法

著录项
  • CN201710946743.1
  • 20171012
  • CN107633095A
  • 20180126
  • 武汉大学
  • 王飞;刘斌;其他发明人请求不公开姓名
  • G06F17/30
  • G06F17/30 G06F17/27

  • 湖北省武汉市武昌区珞珈山武汉大学
  • 湖北(42)
  • 武汉科皓知识产权代理事务所(特殊普通合伙)
  • 鲁力
摘要
本发明涉及一种用于专利技术现状的检索方法,首先,根据检索专利关键词检索关联专利,依据检索专利的IPC分类信息将关联专利分配给不同的容器,根据不同容器中关联专利构建语言模型,进而形成复合域视角转换器。然后使用词嵌入技术对专利数据集中包含单一部层级分类的专利进行训练,获得不同分类下的语义向量化表示,以向量间的空间距离量化语义距离,形成语义关联的技术术语扩展源,结合复合视角下的词汇分布特征,进行语义?分布相结合的双一致性专利扩展。最后根据复合域视角转换器权值和不同专利检索列表中关联专利次序进行关联专利的有序化融合,形成唯一的关联专利列表。本发明旨在以自动化的方法实现专利技术查重中关联专利的检索。
权利要求

1.一种用于专利技术现状的检索方法,其特征在于,包含以下步骤:

步骤1:构建复合域视角下的视角转换器,对检索专利进行不同复合域视角下的技术特 征转换,形成不同视角下的专利查询;

步骤2:训练单一域视角下的语义向量模型,分别量化候选词汇与方面查询的语义和分 布一致性,实现复合域视角下的双一致性专利扩展;

步骤3:基于主题专利的视角权值和关联专利在方面检索结果集中的位序,实现多个检 索结果集的数据融合,形成一个主题相关的关联专利结果集。

2.根据权利要求1所述的一种用于专利技术现状的检索方法,其特征在于,步骤1的具 体实现包含以下子步骤:

步骤1.1:基于主题专利实施基准检索,生成复合域视角容器;

步骤1.2:基于复合域视角容器构建复合域视角转换器,进行主题专利的视角变换。

3.根据权利要求2所述的一种用于专利技术现状的检索方法,其特征在于,步骤1.1的 具体实现包含以下子步骤:

步骤1.1.1:从主题专利中抽取技术特征词汇进行基准检索,截取反馈列表中排序靠前 的TOP-K个关联专利;

步骤1.1.2:从主题专利中抽取所有IPC的部层级分类信息,并基于分类信息的所有组 合构建相应的复合域视角容器;

步骤1.1.3:循环实现反馈专利到相应复合域视角容器的分配任务,在每一轮循环中, 倘若反馈专利、检索专利和复合域视角容器的分类信息满足相应的分配规则,则将该反馈 专利分配给相应的复合域视角容器;分配规则如下:

(1)Ψ=G q∩G r.(2) (3)D Ψ∈α.

其中,q表示主题专利,r表示反馈专利,G表示IPC小组层级分类,D表示IPC部层级分类, α表示复合域视角容器的索引。

4.根据权利要求2所述的一种用于专利技术现状的检索方法,其特征在于,步骤1.2的 具体实现包含以下子步骤:

步骤1.2.1:评估复合域视角容器中关联专利与复合域视角容器技术特征的关联性,评 估方法如下:

其中,θ表示概率语言模型,即平均词频,r表示关联专利,α表示复合域视角容器的索 引,α+Δ表示复合域视角容器的增广索引,H表示相对熵,ALL表示复合域视角容器的全集索 引;

步骤1.2.2:评估复合域视角容器中每个词汇与复合域视角容器技术特征的关联性,进 而形成复合域视角变换器;评估方法如下:

其中,w表示技术词汇,Z表示归一化因子,Φ表示视角变换器;归一化方法如下:

步骤1.2.3:基于复合域视角变换器进行主题专利的视角变换,生成不同视角下的专利 查询;本专利提供了三种视角变换方法:

变换方法一,线性变换

P(w|χ)=λP(w|r)+(1-λ)P(w|Φ)

其中,χ表示视角转换后的方面查询,λ表示权重平衡因子;

变换方法二,乘积变换

P(w|χ)=P(w|r)*P(w|Φ)

变换方法三,相对熵变换

P(w|χ)=γP(w|r)+(1-γ)RE(P(w|r),P(w|Φ))

其中,Z表示归一化因子,归一化方法如下:

5.根据权利要求1所述的一种用于专利技术现状的检索方法,其特征在于,步骤2的具 体实现包含以下子步骤:

步骤2.1:基于专利数据集构建单一域视角下的语义向量空间模型;

步骤2.2:基于单一域视角下的语义向量空间模型对复合域视角下的方面查询进行双 一致性专利扩展。

6.根据权利要求5所述的一种用于专利技术现状的检索方法,其特征在于,步骤2.1的 具体实现包含以下子步骤:

步骤2.1.1:基于专利IPC分类体系的八个部层级分类信息,构建八个单一域视角的分 类容器;

步骤2.1.2:循环实现专利数据库中每一件专利到相应单一域视角容器的分配任务,在 每一轮循环中,倘若专利和单一域视角容器的分类信息满足相应的分配规则,则将该专利 分配给相应的单一域视角容器;分配规则如下:

(1) (2)D p=β..

其中,q表示专利,D表示IPC部层级分类,β表示单一域视角容器的索引;

步骤2.1.3:基于词嵌入技术对单一域视角容器中的专利进行训练,获得八个单一域视 角的语义向量空间。

7.根据权利要求5所述的一种用于专利技术现状的检索方法,其特征在于,步骤2.2的 具体实现包含以下子步骤:

步骤2.2.1:评估步骤2.1.3中单一域视角下语义向量空间产生的候选扩展词与步骤 1.2.3中复合域视角中仅包含单一部层级索引的方面查询之间的单一域视角下的分布关联 性,评估方法如下:

其中,β表示单一域视角索引,χ表示复合域视角仅中包含单一部层级索引β的方面查 询,w表示方面查询中的一个检索词,κ(w)表示单一域视角下语义向量空间中与检索词w存 在语义关联的词汇集合;

其中,c表示单一域视角下语义向量空间的候选扩展词,w′表示复合域视角下的方面查 询中的检索词,N表示复合域视角容器中反馈专利数目,n β(c,w′)表示步骤1.1.3中复合域 视角容器里同时包含候选扩展词c和检索词w′的反馈专利数目;

步骤2.2.2:评估步骤2.1.3中单一域视角下语义向量空间产生的候选扩展词与步骤 1.2.3中复合域视角中仅包含单一部层级索引的方面查询之间的单一域视角下的双一致关 联性,评估方法如下:

RS β(c|χ,w)=R β(c;χ)*SIM β(c|w)

其中,β表示单一域视角索引,SIM β(c|w)表示候选扩展词c和检索词w在步骤2.1.3训练 的语义向量空间β中的相应向量之间的欧式距离;

步骤2.2.3:评估步骤2.1.3中单一域视角下语义向量空间产生的候选扩展词与步骤 1.2.3中复合域视角中仅包含单一部层级索引的方面查询之间的复合域视角下的双一致关 联性,评估方法如下:

RS α(c|χ)=P α(w|χ)*∑ β∈αRS β(c|χ,w)

其中,α表示复合域视角索引,P(w|χ)表示步骤1.2.3中复合域视角下的方面查询中检 索词w的语言模型概率。

8.根据权利要求1所述的一种用于专利技术现状的检索方法,其特征在于,步骤3的具 体实现包含以下子步骤:

步骤3.1:基于步骤2.2.3生成复合域视角下的双一致性专利查询进行专利检索,获得 不同复合域视角下的关联专利列表;

步骤3.2:评估不同复合域视角的视角权重,评估方法如下:

其中,α表示复合域视角索引,N表示步骤1.1.1检索获得的反馈专利数目,n α表示步骤 1.1.3复合域视角容器α中的反馈专利数目;

步骤3.3:基于步骤3.1获得的关联专利的位序信息与步骤3.2获得的视角权重进行不 同复合域视角检索结果集的技术关联性融合,融合方法如下:

其中,r表示方面查询检索获得的关联专利,N α(χ)表示复合域视角α下的方面查询χ检索 获得的关联专利数目,o α(r,χ)表示关联专利r在方面查询χ检索结果集中的位序信息。

说明书
技术领域

本发明属于数据管理领域,涉及一种用于专利技术查重的关联专利查方法,尤 其涉及技术方面查询生成、双一致性扩展查询生成以及基于不同技术视角权值和关联专利 结果集次序的数据融合方法。

专利是现代企业保护科研投入,追求经济利益的主流方式。为了获得专利授权,专 利审查人员需要对申请专利进行技术唯一性为目的的技术现状检索。专利的数据量庞大, 使用词汇的歧义性强,并且专利文档是一种半结构化文档,无法直接提供有效的检索信息, 这些都使得专利检索面临着巨大的挑战。当前实施专利检索主要包含专利抽取和专利扩展 两个流程。专利抽取主要是剔除噪声词汇和歧义词汇,从查询专利中抽取能够体现技术特 征的术语词汇,形成一个信息集中的检索源,而专利扩展则是通过补充语义关联或者分布 关联的词汇,消除专利技术词汇的歧义,形成一个意向明确的专利查询。

专利抽取根据不同的技术关联性量化策略,分为单主题模型和多主题模型。单主 题模型的专利抽取认为整个专利技术方案仅仅包含单一技术特征,通常抽取具有高词频的 技术词汇形成唯一的专利查询。多主题模型的专利抽取认为一个技术方案由多个技术特征 组成,技术间的相似性是基于专利某个技术特征而非整个技术方案,采用聚类或者决策树 等方法形成多个专利查询。显然,专利多主题模型的技术量化策略更加接近人们关于技术 相似性的思维方式,但是,现有的多主题模型使用聚类等技术生成的专利查询并不能代表 一个明确的技术方面,并没有有效地改善专利的检索性能。

专利扩展根据不同的扩展源,分为分布一致性和语义一致性两种扩展策略。分布 一致性以初次检索得到的文档或者引用文献作为潜在扩展源,选择扩展源中与查询词汇具 有相似分布的词汇作为扩展词汇,而语义一致性则是借助Wikipedia、Freebase等成熟知识 库技术,提供查询词汇的上下位词汇和语义相近词汇作为扩展词汇。分布一致性选择了查 询词汇分布相近的词汇作为扩展源,但是,这些词汇可能与查询词汇没有语义上的关联,容 易引起语义的发散。语义一致性选择了查询词汇语义相近的词汇作为扩展源,但是,知识库 提供的词汇可能并不是专利选用词汇,可能引起词形的离散。

为了解决背景技术中存在的上述各种问题,本发明提供了一种在复合域视角下进 行专利词嵌入的扩展检索。在专利抽取方面,该发明通过将多主题模型与技术分类域相结 合,生成带有明确意图的多个方面查询,来克服现有多主题模型的查询指向不明确问题。在 专利扩展方面,该发明追求分布和语义相结合的双一致性扩展,通过词嵌入技术训练语义 向量模型作为领域相关的扩展源,进行查询词汇与扩展词汇分布关联性的量化,来减少检 索语义的模糊性。最后,基于查询专利的视角权值和反馈专利的主题关联性实现多个方面 检索的结果集融合。

本发明的方法所采用的技术方案是一种用于专利技术现状的检索方法,其特征在 于,包含以下步骤:

步骤1:构建复合域视角下的视角转换器,对检索专利进行不同复合域视角下的技 术特征转换,形成不同视角下的专利查询。

步骤2:训练单一域视角下的语义向量模型,分别量化候选词汇与方面查询的语义 和分布一致性,实现复合域视角下的双一致性专利扩展。

步骤3:基于主题专利的视角权值和关联专利在方面检索结果集中的位序,实现多 个检索结果集的数据融合,形成一个主题相关的关联专利结果集。

作为优选,步骤1的具体实现包含以下子步骤:

步骤1.1:基于主题专利实施基准检索,生成复合域视角容器。

步骤1.2:基于复合域视角容器构建复合域视角转换器,进行主题专利的视角变 换。

作为优选,步骤1.1的具体实现包含以下子步骤:

步骤1.1.1:从主题专利中抽取技术特征词汇进行基准检索,截取反馈列表中排序 靠前的TOP-K个关联专利。

步骤1.1.2:从主题专利中抽取所有IPC的部层级分类信息,并基于分类信息的所 有组合构建相应的复合域视角容器。

步骤1.1.3:循环实现反馈专利到相应复合域视角容器的分配任务,在每一轮循环 中,倘若反馈专利、检索专利和复合域视角容器的分类信息满足相应的分配规则,则将该反 馈专利分配给相应的复合域视角容器。分配规则如下:

(1)Ψ=Gq∩Gr.(3)DΨ∈α.

其中,q表示主题专利,r表示反馈专利,G表示IPC小组层级分类,D表示IPC部层级 分类,α表示复合域视角容器的索引。

作为优选,步骤1.2的具体实现包含以下子步骤:

步骤1.2.1:评估复合域视角容器中关联专利与复合域视角容器技术特征的关联 性,评估方法如下:

其中,θ表示概率语言模型,即平均词频,r表示关联专利,α表示复合域视角容器的 索引,α+Δ表示复合域视角容器的增广索引,H表示相对熵,ALL表示复合域视角容器的全集 索引。

步骤1.2.2:评估复合域视角容器中每个词汇与复合域视角容器技术特征的关联 性,进而形成复合域视角变换器。评估方法如下:

其中,w表示技术词汇,Z表示归一化因子,Φ表示视角变换器。归一化方法如下:

步骤1.2.3:基于复合域视角变换器进行主题专利的视角变换,生成不同视角下的 专利查询。本专利提供了三种视角变换方法:

●线性变换

P(w|x)=λP(w|r)+(1-λ)P(w|Φ)

其中,χ表示视角转换后的方面查询,λ表示权重平衡因子。

●乘积变换

P(w|χ)=P(w|r)*P(w|Φ)

●相对熵变换

P(w|χ)=γP(w|r)+(1-γ)RE(P(w|r),P(w|Φ))

其中,Z表示归一化因子,归一化方法如下:

作为优选,步骤2的具体实现包含以下子步骤:

步骤2.1:基于专利数据集构建单一域视角下的语义向量空间模型。

步骤2.2:基于单一域视角下的语义向量空间模型对复合域视角下的方面查询进 行双一致性专利扩展。

作为优选,步骤2.1的具体实现包含以下子步骤:

步骤2.1.1:基于专利IPC分类体系的八个部层级分类信息,构建八个单一域视角 的分类容器。

步骤2.1.2:循环实现专利数据库中每一件专利到相应单一域视角容器的分配任 务,在每一轮循环中,倘若专利和单一域视角容器的分类信息满足相应的分配规则,则将该 专利分配给相应的单一域视角容器。分配规则如下:

(2)Dp=β..

其中,q表示专利,D表示IPC部层级分类,β表示单一域视角容器的索引。

步骤2.1.3:基于词嵌入技术对单一域视角容器中的专利进行训练,获得八个单一 域视角的语义向量空间。

作为优选,步骤2.2的具体实现包含以下子步骤:

步骤2.2.1:评估步骤2.1.3中单一域视角下语义向量空间产生的候选扩展词与步 骤1.2.3中复合域视角中仅包含单一部层级索引的方面查询之间的单一域视角下的分布关 联性,评估方法如下:

其中,β表示单一域视角索引,χ表示复合域视角仅中包含单一部层级索引β的方面 查询,w表示方面查询中的一个检索词,κ(w)表示单一域视角下语义向量空间中与检索词w 存在语义关联的词汇集合。

其中,c表示单一域视角下语义向量空间的候选扩展词,w′表示复合域视角下的方 面查询中的检索词,N表示复合域视角容器中反馈专利数目,nβ(c,w′)表示步骤1.1.3中复 合域视角容器里同时包含候选扩展词c和检索词w′的反馈专利数目。

步骤2.2.2:评估步骤2.1.3中单一域视角下语义向量空间产生的候选扩展词与步 骤1.2.3中复合域视角中仅包含单一部层级索引的方面查询之间的单一域视角下的双一致 关联性,评估方法如下:

RSβ(c|χ,w)=Rβ(c;χ)*SIMβ(c|w)

其中,β表示单一域视角索引,SIMβ(c|w)表示候选扩展词c和检索词w在步骤2.1.3 训练的语义向量空间β中的相应向量之间的欧式距离。

步骤2.2.3:评估步骤2.1.3中单一域视角下语义向量空间产生的候选扩展词与步 骤1.2.3中复合域视角中仅包含单一部层级索引的方面查询之间的复合域视角下的双一致 关联性,评估方法如下:

其中,α表示复合域视角索引,P(w|χ)表示步骤1.2.3中复合域视角下的方面查询 中检索词w的语言模型概率。

作为优选,步骤3的具体实现包含以下子步骤:

步骤3.1:基于步骤2.2.3生成复合域视角下的双一致性专利查询进行专利检索, 获得不同复合域视角下的关联专利列表。

步骤3.2:评估不同复合域视角的视角权重,评估方法如下:

其中,α表示复合域视角索引,N表示步骤1.1.1检索获得的反馈专利数目,nα表示 步骤1.1.3复合域视角容器α中的反馈专利数目。

步骤3.3:基于步骤3.1获得的关联专利的位序信息与步骤3.2获得的视角权重进 行不同复合域视角检索结果集的技术关联性融合,融合方法如下:

其中,r表示方面查询检索获得的关联专利,Nα(χ)表示复合域视角α下的方面查询 χ检索获得的关联专利数目,oα(r,χ)表示关联专利r在方面查询χ检索结果集中的位序信 息。

本发明针对当前专利审查面临的人工查询效率低下,需要具备良好的领域知识和 专利技能的现实情况,通过综合利用机器学习、自然语言处理、信息检索等技术来研究专利 技术检索,提出了一种多技术主题和双一致性扩展的关联专利检索方法,旨在以自动化的 方法实现专利技术查重中关联专利的检索。

图1是本发明实施例的复合域视角下基于词嵌入技术的专利扩展检索。

图2是本发明实施例的基于复合域视角的多主题检索模型。

图3是本发明实施例的基于词嵌入技术的双一致性扩展模型。

图4是本发明实施例的多检索结果集融合模型。

为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发 明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不 用于限定本发明。

请见图1,本发明提供了一种用于专利技术查重的关联专利提取方法,是基于专利 技术分类信息和词嵌入技术的多主题双一致性专利扩展查询关联专利的方法。其特征在 于:整个检索过程区分为生成方面查询、双一致性专利扩展和多检索结果集融合三个子模 块,在生成方面查询子模块,根据主题专利的分类信息生成复合域视角容器对基准检索获 得的关联专利进行分类存储,基于复合域视角容器构建技术视角变换器,实现对主题专利 不同技术特征的视角变换,从而形成复合域视角下的方面查询。在双一致性扩展子模块,根 据专利分类信息构建单一域视角容器对专利数据集进行分类存储,使用单一域视角容器训 练语义向量空间作为领域相关的扩展源,基于语义向量空间中欧式距离所表达的语义关联 性和检索词汇-扩展词汇间互信息所表达的分布关联性实现双一致性扩展。在多检索结果 集融合子模块,基于复合域视角权值和检索关联专利的位序信息实现对多个检索结果集的 数据融合,形成统一的技术关联专利列表。该方法以技术领域特性实现方面查询生成、双一 致性扩展以及检索结果集融合,保证了专利现状检索的有效性和可靠性。

下面结合方面查询生成模块、双一致性扩展模块以及检索结果集融合模块来具体 解释面向专利查重的关联专利提取的工作模式,请见图2、图3和图4,本发明提供了一种领 域相关的方面查询扩展生成方法,包括以下步骤:

步骤1:构建复合域视角下的视角转换器,对检索专利进行不同复合域视角下的技 术特征转换,形成不同视角下的专利方面查询。

步骤1.1:基于主题专利实施基准检索,生成复合域视角容器。

步骤1.1.1:使用TF-IDF技术从主题专利中抽取技术特征词汇进行基准检索,截取 反馈列表中排序靠前的1000个关联专利。

步骤1.1.2:从主题专利中抽取所有IPC的部层级分类信息(例如:A、C),并基于分 类信息的所有组合构建相应的复合域视角容器(例如:A、C、AC)。

步骤1.1.3:循环实现反馈专利到相应复合域视角容器的分配任务,在每一轮循环 中,倘若反馈专利、检索专利和复合域视角容器的分类信息满足相应的分配规则,则将该反 馈专利分配给相应的复合域视角容器。分配规则如下:

(1)Ψ=Gq∩Gr.(3)DΨ∈α.

其中,q表示主题专利,r表示反馈专利,G表示IPC小组层级分类(例如:A01B 12/ 02),D表示IPC部层级分类(例如:A),α表示复合域视角容器的索引(例如:A)。

步骤1.2:基于复合域视角容器构建复合域视角转换器,进行主题专利的视角变 换。

步骤1.2.1:评估复合域视角容器中关联专利与复合域视角容器技术特征的关联 性,评估方法如下:

其中,θ表示概率语言模型,即平均词频,r表示关联专利,α表示复合域视角容器的 索引(例如:A),α+Δ表示复合域视角容器的增广索引(例如:AC),H表示相对熵,ALL表示复 合域视角容器的全集索引(例如:AC)。

步骤1.2.2:评估复合域视角容器中每个词汇与复合域视角容器技术特征的关联 性,进而形成复合域视角变换器。评估方法如下:

其中,w表示技术词汇,Z表示归一化因子,Φ表示视角变换器。归一化方法如下:

步骤1.2.3:基于复合域视角变换器进行主题专利的视角变换,生成不同视角下的 专利查询。本专利提供了三种视角变换方法:

●线性变换

P(w|χ)=λP(w|r)+(1-λ)P(w|Φ)

其中,χ表示视角转换后的方面查询,λ表示权重平衡因子,例如0.6。

●乘积变换

P(w|χ)=P(w|r)*P(w|Φ)

●相对熵变换

P(w|χ)=γP(w|r)+(1-γ)RE(P(w|r),P(w|Φ))

其中,Z表示归一化因子,归一化方法如下:

步骤2:训练单一域视角下的语义向量模型,分别量化候选词汇与方面查询的语义 和分布一致性,实现复合域视角下的双一致性专利扩展。

步骤2.1:基于专利数据集构建单一域视角下的语义向量空间模型。

步骤2.1.1:基于专利IPC分类体系的八个部层级分类信息,构建A到H八个单一域 视角的分类容器。

步骤2.1.2:循环实现专利数据库中每一件专利到相应单一域视角容器的分配任 务,在每一轮循环中,倘若专利和单一域视角容器的分类信息满足相应的分配规则,则将该 专利分配给相应的单一域视角容器。分配规则如下:

(2)Dp=β..

其中,q表示专利,D表示IPC部层级分类,β表示单一域视角容器的索引,即仅对应 A-H八个部层级分类之一。

步骤2.1.3:使用google发布的word2vec工具实现对单一域视角容器中的专利进 行训练,获得八个单一域视角的语义向量空间。

步骤2.2:基于单一域视角下的语义向量空间模型对复合域视角下的方面查询进 行双一致性专利扩展。

步骤2.2.1:评估步骤2.1.3中单一域视角下(例如:A)语义向量空间产生的候选扩 展词与步骤1.2.3中复合域视角中仅包含单一部层级索引(例如:A)的方面查询之间的单一 域视角下的分布关联性,评估方法如下:

其中,β表示单一域视角索引(例如:仅A),χ表示复合域视角中仅包含单一部层级 索引β的方面查询,w表示方面查询中的一个检索词,κ(w)表示单一域视角下语义向量空间 中与检索词w存在语义关联的词汇集合。

其中,c表示单一域视角下语义向量空间的候选扩展词,w′表示复合域视角下的方 面查询中的检索词,N表示步骤1.1.1中复合域视角容器中反馈专利数目(例如:1000),nβ (c,w′)表示步骤1.1.3中复合域视角容器里同时包含候选扩展词c和检索词w′的反馈专利 数目。

步骤2.2.2:评估步骤2.1.3中单一域视角下语义向量空间产生的候选扩展词与步 骤1.2.3中复合域视角中仅包含单一部层级索引的方面查询之间的单一域视角下的双一致 关联性,评估方法如下:

RSβ(c|χ,w)=Rβ(c;χ)*SIMβ(c|w)

其中,β表示单一域视角索引,SIMβ(c|w)表示候选扩展词c和检索词w在步骤2.1.3 训练的语义向量空间β中的相应向量之间的欧式距离(例如:SIMβ(c|w)=0.5)。

步骤2.2.3:评估步骤2.1.3中单一域视角下语义向量空间产生的候选扩展词与步 骤1.2.3中复合域视角中仅包含单一部层级索引的方面查询之间的复合域视角下的双一致 关联性,评估方法如下:

其中,α表示复合域视角索引(例如:AC),β表示单一域视角索引(例如:A或者C),P (w|χ)表示步骤1.2.3中复合域视角下的方面查询中检索词w的语言模型概率。

步骤3:基于主题专利的视角权值和关联专利在方面检索结果集中的位序,实现多 个检索结果集的数据融合,形成一个主题相关的关联专利结果集。

步骤3.1:基于步骤2.2.3生成复合域视角下的双一致性专利方面查询进行专利检 索,获得不同复合域视角下的关联专利列表,例如:A={rA1,rA2,…,rAn},C={rC1,rC2,…, rCn},AC={rAC1,rAC2,…,rACn}。

步骤3.2:评估不同复合域视角的视角权重,评估方法如下:

其中,α表示复合域视角索引,N表示步骤1.1.1检索获得的反馈专利数目(例如: 1000),nα表示步骤1.1.3复合域视角容器α中的反馈专利数目。

步骤3.3:基于步骤3.1获得的关联专利的位序信息与步骤3.2获得的视角权重进 行不同复合域视角检索结果集的技术关联性融合,融合方法如下:

其中,r表示方面查询检索获得的关联专利,Nα(χ)表示复合域视角α下的方面查询 χ检索获得的关联专利数目(例如:1000),oα(r,χ)表示关联专利r在方面查询χ检索结果集 中的位序信息。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领 域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替 代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

本文发布于:2024-09-22 07:17:22,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/68299.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议