专利检索结果列表数据排序规则调优方法及系统

著录项
  • CN202211416289.6
  • 20221112
  • CN115687463A
  • 20230203
  • 企知道网络技术有限公司
  • 袁军;王永强;刘落根
  • G06F16/248
  • G06F16/248 G06F16/2455 G06F16/2457 G06Q50/18

  • 广东省深圳市南山区西丽街道西丽社区留仙大道创智云城1标段1栋D座2201
  • 广东(44)
  • 北京维正专利代理有限公司
  • 张桂钦
摘要
本申请涉及数据展示排序的技术领域,公开了一种专利检索结果列表数据排序规则调优方法及系统,专利检索结果列表数据排序规则调优方法包括:获取用户账户的账户信息和历史使用信息以建立用户画像,所述用户画像包括用户需求信息;获取检索条件信息,基于检索条件信息从专利数据库中匹配对应的专利相关文件;基于历史检索条件信息生成浏览偏好信息,基于用户画像和浏览偏好信息生成数据排序规则信息;基于数据排序规则信息对专利相关文件进行排序,生成检索结果列表并对用户展示;本申请具有提高用户使用专利检索系统时的检索效率的效果。
权利要求

1.专利检索结果列表数据排序规则调优方法,其特征在于,包括:

获取用户账户的账户信息和历史使用信息以建立用户画像,所述用户画像包括用户需求信息;

获取检索条件信息,基于检索条件信息从专利数据库中匹配对应的专利相关文件;

基于历史检索条件信息生成浏览偏好信息,基于用户画像和浏览偏好信息生成数据排序规则信息;

基于数据排序规则信息对专利相关文件进行排序,生成检索结果列表并对用户展示。

2.根据权利要求1所述的专利检索结果列表数据排序规则调优方法,其特征在于:获取用户账户的账户信息和历史使用信息以建立用户画像,所述用户画像包括用户需求信息的步骤中,包括:

获取用户账户的账户信息,从所述账户信息中获取职业信息和单位信息;

获取用户账户的浏览记录和业务使用记录,生成历史使用信息,所述浏览记录包括专利相关文件浏览记录和业务浏览记录;

基于所述账户信息和历史使用信息评估用户需求,生成用户需求信息,并进一步基于用户需求信息建立用户画像。

3.根据权利要求1所述的专利检索结果列表数据排序规则调优方法,其特征在于:所述专利数据库还包括公众文件库,获取检索条件信息,基于检索条件信息从专利数据库中匹配对应的专利相关文件的步骤之前,还包括:

从专利数据库中爬取无需许可专利的专利相关文件并存储于公众文件库中;

对所述无需许可专利的专利相关文件进行标记。

4.根据权利要求1所述的专利检索结果列表数据排序规则调优方法,其特征在于:获取检索条件信息,基于检索条件信息从专利数据库中匹配对应的专利相关文件的步骤之后,包括:

读取各专利相关文件的著录信息,对匹配到的同案专利相关文件进行合并处理,生成合并文件;

将所述合并文件中不同版本专利相关文件的差异文本进行标记,并设置对应的显示选择开关。

5.根据权利要求1所述的专利检索结果列表数据排序规则调优方法,其特征在于:获取检索条件信息,基于检索条件信息从专利数据库中匹配对应的专利相关文件的步骤之后,包括:

基于检索条件信息对匹配到的每一专利相关文件进行相关度评估,生成相关度信息并标记至对应的专利相关文件;

将各专利相关文件的相关度信息与预设的相关阈值进行对比,将专利相关文件分类为高相关性文件和低相关性文件;

基于各专利相关文件的相关度信息进行排序,生成高相关性排序列表和低相关性排序列表。

6.根据权利要求1所述的专利检索结果列表数据排序规则调优方法,其特征在于:基于历史检索条件信息生成浏览偏好信息的步骤中,包括:

从历史检索条件信息中确定关键词信息和筛选条件信息,并将筛选条件信息存储至筛选记忆库中;

基于筛选记忆库中各筛选条件信息的数量评估用户的浏览偏好,生成浏览偏好信息。

7.根据权利要求6所述的专利检索结果列表数据排序规则调优方法,其特征在于:基于用户画像和浏览偏好信息生成数据排序规则信息的步骤中,包括:

基于用户画像评估用户的实际需求和资信情况,生成初步排序信息;

基于用户浏览偏好信息评估用户的筛选设置偏好,生成修正排序信息;

基于修正排序信息对初步排序信息进行修正,生成数据排序规则信息。

8.专利检索结果列表数据排序规则调优系统,其特征在于,包括:

用户画像建立模块,用于获取用户账户的账户信息和历史使用信息以建立用户画像,所述用户画像包括用户需求信息;

专利相关文件匹配模块,用于获取检索条件信息,基于检索条件信息从专利数据库中匹配对应的专利相关文件;

数据排序规则生成模块,用于基于历史检索条件信息生成浏览偏好信息,基于用户需求信息和浏览偏好信息生成数据排序规则信息;

检索结果列表生成模块,用于基于数据排序规则信息对专利相关文件进行排序,生成检索结果列表并对用户展示。

9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述专利检索结果列表数据排序规则调优方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述专利检索结果列表数据排序规则调优方法的步骤。

说明书
技术领域

本申请涉及数据展示排序的技术领域,尤其是涉及一种专利检索结果列表数据排序规则调优方法及系统。

目前,市场上存在许多用于检索公开的专利文件、专利申请文件和其他相关文件的系统,便于用户获取现有的专利相关文件;然而,现有的专利相关文件数量庞大,而用户使用专利检索系统,目的是为了检索到符合自身使用需求的专利相关文件,因此,如何提高用户的检索效率至关重要。

现有的专利检索系统通常是根据输入的检索式匹配到对应的专利文件,再由用户选择根据相关性、申请日或公开日进行排序,再结合筛选条件展示检索结果。

针对上述相关技术可知,现有的专利检索系统存在检索效率较低的问题。

为了提高用户使用专利检索系统时的检索效率,本申请提供一种专利检索结果列表数据排序规则调优方法及系统。

本申请的发明目的一采用如下技术方案实现:

专利检索结果列表数据排序规则调优方法,包括:

获取用户账户的账户信息和历史使用信息以建立用户画像,所述用户画像包括用户需求信息;

获取检索条件信息,基于检索条件信息从专利数据库中匹配对应的专利相关文件;

基于历史检索条件信息生成浏览偏好信息,基于用户画像和浏览偏好信息生成数据排序规则信息;

基于数据排序规则信息对专利相关文件进行排序,生成检索结果列表并对用户展示。

通过采用上述技术方案,获取用户账户的账户信息和历史使用信息,便于根据账户信息判断用户类型,根据历史使用信息分析用户对专利检索系统的使用需求,从而生成用户需求信息,并进一步对用户建立用户画像;获取检索条件信息,根据检索条件信息从专利数据库中匹配对应的专利相关文件,从而确定用户所需检索的文件;根据历史检索条件信息评估用户所需浏览的专利相关文件,从而生成浏览偏好信息,根据用户画像和浏览偏好信息生成数据排序规则信息,便于后续对检索到的专利相关文件进行排序;基于数据排序规则信息对匹配到的专利相关文件进行排序处理,以生成检索结果列表,将检索结果列表对用户展示,使用户根据检索结果列表的顺序查阅专利相关文件,从而提高了用户使用专利检索系统时的检索效率。

本申请在一较佳示例中:获取用户账户的账户信息和历史使用信息以建立用户画像,所述用户画像包括用户需求信息的步骤中,包括:

获取用户账户的账户信息,从所述账户信息中获取职业信息和单位信息;

获取用户账户的浏览记录和业务使用记录,生成历史使用信息,所述浏览记录包括专利相关文件浏览记录和业务浏览记录;

基于所述账户信息和历史使用信息评估用户需求,生成用户需求信息,并进一步基于用户需求信息建立用户画像。

通过采用上述技术方案,获取用户账户的账户信息,以便从用户的账户信息中获取用户的职业信息和工作单位信息,以便从用户的职业身份评估用户对专利检索系统的使用需求;获取用户账户的历史专利相关文件浏览记录、业务浏览记录和业务使用记录,以便判断用户在本专利服务平台的使用情况,便于后续判断用户的需求;基于账户信息和历史使用信息对用户需求进行评估,从而生成用户需求信息,进一步基于用户需求信息建立用户画像,以便后续针对用户画像调整专利检索结果中的展示顺序,使专利检索结果的展示顺序更符合用户的实际需求。

本申请在一较佳示例中:所述专利数据库还包括公众文件库,获取检索条件信息,基于检索条件信息从专利数据库中匹配对应的专利相关文件的步骤之前,还包括:

从专利数据库中爬取无需许可专利的专利相关文件并存储于公众文件库中;

对所述无需许可专利的专利相关文件进行标记。

通过采用上述技术方案,从专利数据库中爬取无效专利、失效专利等被公开且无需申请人或专利权人许可就能够使用的专利相关文件,将无需许可专利的专利相关文件并存储于公众文件库中,便于具有专利技术使用需求的用户能够查询到无需许可和付费就能够使用的专利技术;对无需许可专利的专利相关文件进行标记,便于用户在查看专利检索结果时可针对性地查看无需许可专利的专利相关文件。

本申请在一较佳示例中:获取检索条件信息,基于检索条件信息从专利数据库中匹配对应的专利相关文件的步骤之后,包括:

读取各专利相关文件的著录信息,对匹配到的同案专利相关文件进行合并处理,生成合并文件;

将所述合并文件中不同版本专利相关文件的差异文本进行标记,并设置对应的显示选择开关。

通过采用上述技术方案,读取各专利相关文件的著录信息,以便判断匹配到的专利相关文件中属于同案的专利相关文件,将同案专利相关文件进行合并处理,生成合并文件,便于用户对同案的多个专利相关文件进行对比;由于同案的多个专利相关文件存在差异的文本内容,因此,将合并文本中,不同版本专利相关文件之间存在差异的文本进行标记,并设置对应的显示选择开关,便于用户根据实际阅读需求使用显示选择开关选择对特定版本的差异文本进行针对性的显示,提高了用户对同案的多个不同版本专利相关文件的对比效率。

本申请在一较佳示例中:获取检索条件信息,基于检索条件信息从专利数据库中匹配对应的专利相关文件的步骤之后,包括:

基于检索条件信息对匹配到的每一专利相关文件进行相关度评估,生成相关度信息并标记至对应的专利相关文件;

将各专利相关文件的相关度信息与预设的相关阈值进行对比,将专利相关文件分类为高相关性文件和低相关性文件;

基于各专利相关文件的相关度信息进行排序,生成高相关性排序列表和低相关性排序列表。

通过采用上述技术方案,基于检索条件信息对匹配到的每一专利相关文件进行相关度评估,基于相关度评估的结果生成相关度信息并标记至对应的文件,以便判断检索结果中各专利相关文件与用户检索目标的相关度;将各专利相关文件的相关度信息与预设的相关阈值进行对比,将专利相关文件分为高相关性文件和低相关性文件,以便判断各专利相关文件的相关度高低情况;根据各专利相关文件的相关度信息进行排序,针对高相关性文件生成高相关性排序列表,针对低相关性文件生成低相关性排序列表,便于在后续需要根据相关性排序展示检索结果时调用高相关性排序列表或低相关性排序列表。

本申请在一较佳示例中:基于所述账户信息和历史使用信息评估用户需求,生成用户需求信息,并进一步基于用户需求信息建立用户画像的步骤中,包括:

基于用户的所述账户信息确定用户类型,所述用户类型包括各行业的企业用户、专利代理用户、法律行业用户和个人用户;

基于用户的历史使用信息和用户类型,生成用户需求信息;

基于用户的所述账户信息获取用户的资信信息,根据用户需求信息和资信信息建立对应的用户画像。

通过采用上述技术方案,由于使用专利检索系统的用户类型较多,且不同类型用户在检索专利相关文件时的目的不同,因而需要根据用户类型的不同而采取不用的规则对检索结果进行排序,基于用户的账户信息确定用户类型,包括不同行业的企业用户、专利代理用户、法律行业用户和个人用户,以便根据用户类型分析用户的需求;基于用户的历史使用信息和用户类型,对用户的需求进行综合评估,生成用户需求信息;根据用户的账户信息获取用户的资信信息,便于获知用户的资信情况,根据用户需求信息和资信信息共同建立用户画像,便于后续根据用户画像采取更具针对性的排序规则对专利相关文件的检索结果进行排序,使检索结果更贴近用户的实际需求。

本申请在一较佳示例中:基于历史检索条件信息生成浏览偏好信息的步骤中,包括:

从历史检索条件信息中确定关键词信息和筛选条件信息,并将筛选条件信息存储至筛选记忆库中;

基于筛选记忆库中各筛选条件信息的数量评估用户的浏览偏好,生成浏览偏好信息。

通过采用上述技术方案,从历史检索条件信息中确定关键词信息和筛选条件信息,以便基于关键词信息从专利数据库中匹配专利相关文件,并根据筛选条件信息判断用户的日常专利相关文件浏览偏好,将筛选条件信息存储至筛选记忆库中,用于记录用户日常专利相关文件浏览过程中的筛选设置并总结规律;根据筛选记忆库中各筛选条件信息的数量确定用户历史专利检索记录中的筛选设置,便于根据用户的历史筛选设置中各筛选条件信息的数量和占比评估用户的浏览偏好,生成浏览偏好信息以便后续根据浏览偏好信息对检索结果进行排序。

本申请在一较佳示例中:基于用户画像和浏览偏好信息生成数据排序规则信息的步骤中,包括:

基于用户画像评估用户的实际需求和资信情况,生成初步排序信息;

基于用户浏览偏好信息评估用户的筛选设置偏好,生成修正排序信息;

基于修正排序信息对初步排序信息进行修正,生成数据排序规则信息。

通过采用上述技术方案,基于用户画像评估用户的实际需求和资信情况,从而确定检索结果的初步排序规则,便于从适于用户实际情况的角度触发对专利相关文件的检索结果进行排序;由于根据用户的职业、所属单位、所属单位的资质信息为用户建立的画像只能从客观角度出发预测用户可能感兴趣的专利相关文件,难以反映用户的主观意愿和个性化需求,因此,基于用户浏览偏好信息评估用户在日常使用专利相关文件检索系统时的筛选设置偏好,从而生成修正排序信息,便于将通过用户浏览偏好信息所反映的主观意愿和个性化需求纳入专利相关文件检索结果排序的考虑中;基于修正排序信息对初步排序信息进行修正,从而综合评估用户的客观需求、主观意愿和个性化需求后生成数据排序规则信息,提高用户对专利相关文件检索结果展示排序的满意程度。

本申请在一较佳示例中:基于数据排序规则信息对专利相关文件进行排序,生成检索结果列表并对用户展示的步骤之前,包括:

读取各专利相关文件的著录信息,生成关联申请人名单和关联代理机构名单;

基于关联申请人名单逐一从专利数据库中匹配各申请人的关联文件,生成申请人关联专利信息;

基于关联代理机构名单逐一从专利数据库中匹配各代理机构的关联文件,生成代理机构关联专利信息。

通过采用上述技术方案,基于检索条件信息从专利数据库中匹配对应的专利相关文件后,根据数据排序规则信息对专利相关文件进行排序,并将生成的检索结果列表对用户展示;基于检索到的专利相关文件,读取各专利相关文件的著录信息获取出现过的申请人,以生成关联申请人名单,基于关联申请人名单中的各申请人逐一从专利数据库中匹配与各申请人相关的专利相关文件,进行统计后生成申请人关联专利信息,以便用户获知当前检索目标范围中各申请人的专利保有情况;基于检索到的专利相关文件,读取各专利相关文件的著录信息获取出现过的代理机构,以生成关联代理机构名单,基于关联代理机构名单中的各代理机构逐一从专利数据库中匹配与各代理机构相关的专利相关文件,进行统计后生成代理机构关联专利信息,以便用户获知当前检索目标范围中各代理机构的专利代理情况。

本申请的发明目的二采用如下技术方案实现:

专利检索结果列表数据排序规则调优系统,包括:

用户画像建立模块,用于获取用户账户的账户信息和历史使用信息以建立用户画像,所述用户画像包括用户需求信息;

专利相关文件匹配模块,用于获取检索条件信息,基于检索条件信息从专利数据库中匹配对应的专利相关文件;

数据排序规则生成模块,用于基于历史检索条件信息生成浏览偏好信息,基于用户需求信息和浏览偏好信息生成数据排序规则信息;

检索结果列表生成模块,用于基于数据排序规则信息对专利相关文件进行排序,生成检索结果列表并对用户展示。

通过采用上述技术方案,获取用户账户的账户信息和历史使用信息,便于根据账户信息判断用户类型,根据历史使用信息分析用户对专利检索系统的使用需求,从而生成用户需求信息,并进一步对用户建立用户画像;获取检索条件信息,根据检索条件信息从专利数据库中匹配对应的专利相关文件,从而确定用户所需检索的文件;根据检索条件信息评估用户当前所需浏览的专利相关文件,从而生成浏览偏好信息,根据用户需求信息和浏览偏好信息生成数据排序规则信息,便于后续对检索到的专利相关文件进行排序;基于数据排序规则信息对匹配到的专利相关文件进行排序处理,以生成检索结果列表,将检索结果列表对用户展示,使用户根据检索结果列表的顺序查阅专利相关文件,从而提高了用户使用专利检索系统时的检索效率。

本申请的发明目的三采用如下技术方案实现:

一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述专利检索结果列表数据排序规则调优方法的步骤。

本申请的发明目的四采用如下技术方案实现:

一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述专利检索结果列表数据排序规则调优方法的步骤。

综上所述,本申请包括以下至少一种有益技术效果:

1. 获取用户账户的账户信息和历史使用信息,便于根据账户信息判断用户类型,根据历史使用信息分析用户对专利检索系统的使用需求,从而生成用户需求信息,并进一步对用户建立用户画像;获取检索条件信息,根据检索条件信息从专利数据库中匹配对应的专利相关文件,从而确定用户所需检索的文件;根据检索条件信息评估用户当前所需浏览的专利相关文件,从而生成浏览偏好信息,根据用户需求信息和浏览偏好信息生成数据排序规则信息,便于后续对检索到的专利相关文件进行排序;基于数据排序规则信息对匹配到的专利相关文件进行排序处理,以生成检索结果列表,将检索结果列表对用户展示,使用户根据检索结果列表的顺序查阅专利相关文件,从而提高了用户使用专利检索系统时的检索效率。

2. 获取用户账户的账户信息,以便从用户的账户信息中获取用户的职业信息和工作单位信息,以便从用户的职业身份评估用户对专利检索系统的使用需求;获取用户账户的历史专利相关文件浏览记录、业务浏览记录和业务使用记录,以便判断用户在本专利服务平台的使用情况,便于后续判断用户的需求;基于账户信息和历史使用信息对用户需求进行评估,从而生成用户需求信息,进一步基于用户需求信息建立用户画像,以便后续针对用户画像调整专利检索结果中的展示顺序,使专利检索结果的展示顺序更符合用户的实际需求。

3. 基于检索条件信息对匹配到的每一专利相关文件进行相关度评估,基于相关度评估的结果生成相关度信息并标记至对应的文件,以便判断检索结果中各专利相关文件与用户检索目标的相关度;将各专利相关文件的相关度信息与预设的相关阈值进行对比,将专利相关文件分为高相关性文件和低相关性文件,以便判断各专利相关文件的相关度高低情况;根据各专利相关文件的相关度信息进行排序,针对高相关性文件生成高相关性排序列表,针对低相关性文件生成低相关性排序列表,便于在后续需要根据相关性排序展示检索结果时调用高相关性排序列表或低相关性排序列表。

图1是本申请实施例一中专利检索结果列表数据排序规则调优方法的流程图。

图2是本申请专利检索结果列表数据排序规则调优方法中步骤S10的流程图。

图3是本申请专利检索结果列表数据排序规则调优方法中步骤S13的流程图。

图4是本申请专利检索结果列表数据排序规则调优方法中步骤S20的流程图。

图5是本申请专利检索结果列表数据排序规则调优方法中步骤S20的另一流程图。

图6是本申请专利检索结果列表数据排序规则调优方法中步骤S30的流程图。

图7是本申请专利检索结果列表数据排序规则调优方法的另一流程图。

图8是本申请实施例二中专利检索结果列表数据排序规则调优系统的一原理框图。

图9是本申请实施例三中的设备示意图。

以下结合附图1至9对本申请作进一步详细说明。

实施例一

本申请公开了一种专利检索结果列表数据排序规则调优方法,可应用于专利服务平台中,进行专利检索结果的排序和优化;在本实施例中,专利服务平台包括专利检索服务、专利交易服务、专利代理服务、专利维权服务、技术开发服务等;专利服务平台设置有用于存储专利相关文件的专利数据库;在本实施例中,专利相关文件包括已被授予专利权的专利文件、还未授予专利权的专利申请文件、其他与专利申请或专利审查流程相关的公开文件。

如图1所示,具体包括如下步骤:

S10:获取用户账户的账户信息和历史使用信息以建立用户画像,所述用户画像包括用户需求信息。

在本实施例中,用户账户的账户信息是指用户账号在注册时填写的用户信息,具体包括用户所在单位信息、用户职业信息等对用户使用专利检索功能的目的可能相关的信息,具体也可以是用户在账户注册后补充填写的信息;历史使用信息包括用户在本申请中专利服务平台上各种业务的浏览、使用,文件的浏览、下载等的记录。

具体地,获取用户账号的账户信息和历史使用信息,以便对用户在本专利服务平台上提供的账户信息和用户使用本专利服务平台的情况进行分析,评估用户的使用需求生成用户需求信息,便于进一步对用户建立用户画像,以便后续根据用户画像为用户设定对应的专利检索结果排序规则。

其中,参照图2,在步骤S10中,包括:

S11:获取用户账户的账户信息,从所述账户信息中获取职业信息和单位信息。

在本实施例中,账户信息包括职业信息和单位信息,其中职业信息包括用户的职业、岗位信息,单位信息包括用户的工作单位名称、工作单位所属行业等信息。

具体地,获取用户账户的账户信息,从账户信息中获取用户的职业、岗位信息,以及用户工作单位名称、工作单位所属的行业等信息,便于后续根据用户的账户信息分析用户对于专利相关文件的浏览和使用需求。

S12:获取用户账户的浏览记录和业务使用记录,生成历史使用信息,所述浏览记录包括专利相关文件浏览记录和业务浏览记录。

在本实施例中,专利相关文件浏览记录是指用户对专利数据库中的专利相关文件的下载、查看历史记录;业务浏览记录是指用户对本申请中专利服务平台上各种业务的浏览记录;业务使用记录是指用户对本申请中专利服务平台上各种业务的使用记录。

具体地,获取用户账户的浏览记录和业务使用记录,从而生成历史使用信息,便于分析用户在本专利服务平台上对于各专利相关文件、业务咨询的浏览记录,以及用户对各业务的使用记录,便于后续分析用户对专利相关文件的浏览和使用需求。

S13:基于所述账户信息和历史使用信息评估用户需求,生成用户需求信息,并进一步基于用户需求信息建立用户画像。

具体地,基于账户信息和历史使用信息对用户的专利相关文件浏览使用需求进行评估,从而生成用户需求信息,基于用户需求信息和用户对应的资质信息对用户建立用户画像。

其中,参照图3,在步骤S13中,还包括:

S131:基于用户的所述账户信息确定用户类型,所述用户类型包括各行业的企业用户、专利代理用户、法律行业用户和个人用户。

在本实施例中,用户类型是指基于用户职业、工作单位类型等信息对用户进行分类后所确定类型。

具体地,基于用户的账户信息对用户进行分类,确定用户类型,用户类型包括各行业的企业用户、专利代理用户、法律行业用户和个人用户,其中专利代理用户可以由专利代理机构或专利代理相关行业的人员进行注册,法律行业用户可以由法律行业的相关机构、组织、企业的人员进行注册,企业用户可以由专利代理和法律行业之外的企业的人员进行注册,个人用户是指除了企业用户、专利代理用户、法律行业用户以外的用户。

S132:基于用户的历史使用信息和用户类型,生成用户需求信息。

具体地,由于不同类型用户使用专利检索系统的目的各不相同,通过对各类用户进行专利检索的目的进行大数据分析,以便确定各类型用户进行专利检索的目的;例如,对于企业用户,进行专利检索的主要目的通常是为了使用专利技术、进行技术开发等;对于专利代理用户,进行专利检索的主要目的通常是为了检验所代理专利技术特征的新创性等;对于法律行业用户,进行专利检索的目的通常是为了进行侵权判断等;对于个人用户,进行专利检索的目的通常是为学习之用,其中,个人用户中部分人员也可能是未对账户信息中的职业信息和单位信息进行填报的用户;因此,需要对不同用户的实际需求进行针对性的评估,以便后续根据用户的实际需求展示专利检索结果。

具体地,获取目标用户的历史使用信息和用户类型,根据目标用户的用户类型确定该类用户的进行专利检索的目的;再通过目标用户的历史使用信息,在用户进行专利检索的目的的基础上根据用户在专利服务平台上的业务需求和使用习惯进行调整,从而生成用户需求信息。

进一步地,也可以直接向用户发送调查问卷,根据用户在调查问卷中填报的专利检索目的和历史使用信息确定用户需求信息,以便提高用户需求信息的可靠性;对各类用户进行专利检索的目的的大数据分析的数据来源可以是调查问卷中获取的数据。

S133:基于用户的所述账户信息获取用户的资信信息,根据用户需求信息和资信信息建立对应的用户画像。

在本实施例中,用户的资信信息是指用户所述单位的资产信息和信用信息,是根据用户的账户信息中工作单位的名称,从工商登记网站或其他互联网公开渠道获取的。

具体地,基于用户的账户信息获取用户的资信信息,以便获知用户的资产和信用状况,根据用户需求信息和资信信息建立对应的用户画像,以便评估用户资信情况,判断用户可能使用的业务情况和专利检索目的,例如用户使用专利交易服务专利代理服务、专利维权服务、技术开发服务等服务的可能性,便于后续根据用户画像采取更具针对性的排序规则对专利相关文件的检索结果进行排序,使检索结果更贴近用户的实际需求。

S20:获取检索条件信息,基于检索条件信息从专利数据库中匹配对应的专利相关文件。

在本实施例中,检索条件信息是指用户在使用专利检索服务时使用的关键词、检索式和筛选条件等信息;专利数据库是指用于存储专利相关文件的数据库,其中,专利相关文件可以是通过数据爬虫从互联网上的专利公开网站爬取的。

具体地,获取用户在使用专利检索服务时填写的检索条件信息,基于检索条件信息从专利数据库中匹配对应的专利相关文件,便于后续作为专利检索结果进行展示。

其中,参照图4,在步骤S20之前,还包括:

S21:从专利数据库中爬取无需许可专利的专利相关文件并存储于公众文件库中。

在本实施例中,无需许可专利是指无效专利、失效专利等被公开且无需经过申请人或专利权人许可并付费就能够使用的专利技术;公众文件库是指用于存储无需许可专利的专利相关文件的数据库。

具体地,由于部分专利技术在申请后因为不符合专利审查要求的条件被驳回,或者是因主动撤回、视为撤回、视为放弃取得专利权的权利等程序未能得到授权,以及部分授权专利因未缴纳年费、专利权期限终止、专利权人主动放弃、专利无效等原因,使得专利处于公开且无效或失效的状态,这些专利技术无需申请人或专利权人的许可,也无需付费即可使用;因此,使用数据爬虫从专利数据库中爬取无需许可专利的专利相关文件,并存储于公众文件库中,便于具有专利技术使用需求的用户查询这些无需许可专利的专利相关文件并利用其专利技术。

进一步地,由于针对同一专利技术可以选择同日申请发明专利和实用新型专利,因此,对于此类专利技术的专利相关文件,需判断该专利技术对应的发明专利和实用新型专利是否均处于无效或失效状态,再将对应发明专利和实用新型专利均处于无效或失效状态的专利技术定义为无需许可专利;针对公众文件库开始独立的检索入口,便于用户针对性地检索无需许可专利的专利相关文件。

S22:对所述无需许可专利的专利相关文件进行标记。

具体地,针对无需许可专利的专利相关文件进行标记,便于用户在查看专利检索结果时判断各专利相关文件是否为无需许可专利的专利相关文件,以便针对性地查看无需许可专利的专利相关文件。

进一步地,在专利检索系统中增加仅显示无需许可专利的专利相关文件的筛选选项,便于进一步提高用户针对性查看无需许可专利的专利相关文件的效率。

其中,参照图5,在步骤S20之后,还包括:

S23:读取各专利相关文件的著录信息,对匹配到的同案专利相关文件进行合并处理,生成合并文件。

在本实施例中,同案专利相关文件是指与同一份技术方案关联的多个专利相关文件,包括发明专利的公开申请文件和授权专利文件,以及针对同一份技术方案同日申请的发明专利和实用新型专利的专利相关文件;合并文件是指针对同案的对个专利相关文件进行合并后生成的文件。

具体地,针对根据检索条件信息匹配到的所有专利相关文件读取对应的著录信息,将所有专利相关文件中属于同案的专利相关文件进行合并,生成合并文件便于用户对同案的多个专利相关文件进行对比。

S24:将所述合并文件中不同版本专利相关文件的差异文本进行标记,并设置对应的显示选择开关。

具体地,由于同案的多个专利相关文件存在差异的文本内容,因此,在合并文件中,针对不同版本专利相关文件之间存在差异的文本标记为差异文本;例如,某发明专利的授权专利文件相对于公开申请文件删除了一条权利要求,则该条权利要求则为该发明专利同案的多个专利相关文件的差异文本;对合并文件中的差异文本进行标记,并对各版本专利相关文件中的差异文本设置对应的显示选择开关,便于用户根据实际阅读需求使用显示选择开关选择对特定版本的差异文本进行针对性的显示,提高了用户对同案的多个不同版本专利相关文件的对比效率。

进一步地,合并文件还设置有简洁显示模式和完整显示模式,其中,简洁显示模式仅显示授权专利文件的内容,完整显示模式则显示合并文件对应的所有差异文本内容;在后续显示检索结果时,根据用户类型对用户显示合并文件的不同显示模式,针对企业用户、个人用户和法律行业用户,默认使用简洁显示模式,针对专利代理用户,则默认使用完整显示模式。

S25:基于检索条件信息对匹配到的每一专利相关文件进行相关度评估,生成相关度信息并标记至对应的专利相关文件。

具体地,基于检索条件信息中的关键词信息对自然语言算法进行特化训练,使用自然语言算法对匹配到的每一专利相关文件进行语义识别,生成各专利相关文件的语义识别结果,根据检索条件信息、文本相似度算法对各专利相关文件的语义识别结果进行相关度评估,从而针对每一专利相关文件生成相关度信息,并将相关度信息标记至对应的专利相关文件中;其中相关度信息可以是以分值的方式进行统计。

S26:将各专利相关文件的相关度信息与预设的相关阈值进行对比,将专利相关文件分类为高相关性文件和低相关性文件。

具体地,由于在专利检索系统的使用中,若关键词或检索式的设置不得当,可能会检索到成千上万个专利相关文件,许多专利相关文件与检索条件信息的关联度较低;因此,根据实际需求设置和调整相关度阈值,逐一将各专利相关文件的相关度信息与预设的相关阈值进行对比,将相关度信息高于相关阈值的专利相关文件定义为高相关性文件,将相关度信息低于相关阈值的专利相关文件定义为低相关性文件;便于后续用户根据检索到的专利相关文件为高相关性文件或低相关性文件来判断文件与检索条件信息的相关性。

S27:基于各专利相关文件的相关度信息进行排序,生成高相关性排序列表和低相关性排序列表。

具体地,基于各高相关性文件的相关度信息由高到低进行排序,生成高相关性排序列表;基于各低相关性文件的相关度信息由高到低进行排序,生成低相关性排序列表;便于后续生成检索结果列表时,可以选择仅针对高相关性排序列表中的文件按照数据排序规则信息进行排序,对于低相关性排序列表中的文件则可以直接按照相关性进行排序。

S30:基于历史检索条件信息生成浏览偏好信息,基于用户画像和浏览偏好信息生成数据排序规则信息。

具体地,由于用户画像是基于用户的客观需求和资信情况等客观信息而生成的,无法反映用户在使用专利检索时的主观偏好和个性化需求,基于历史检索条件信息评估用户当前所需浏览的专利相关文件,从而生成浏览偏好信息,根据用户画像和浏览偏好信息生成数据排序规则信息,便于后续结合用户客观条件和主观偏好对检索到的专利相关文件进行排序,提高用户体验。

其中,参照图6,在步骤S30中,包括:

S31:从历史检索条件信息中确定关键词信息和筛选条件信息,并将筛选条件信息存储至筛选记忆库中。

在本实施例中,关键词信息是指用于输入至专利检索系统中的检索式,包括关键词和各关键词之间的逻辑关系;筛选条件信息是指专利检索结果展示时设置的筛选条件和排序规则。

具体地,从历史检索条件信息中确定关键词信息和筛选条件信息,以便基于关键词信息从专利数据库中匹配专利相关文件,并根据筛选条件信息对专利检索结果的展示方式进行调整,根据筛选条件信息判断用户的日常专利相关文件浏览偏好;将用户每一次进行专利检索时对应的筛选条件信息依照时间顺序逐一存储至筛选记忆库中,用于记录用户日常专利相关文件浏览过程中的筛选设置并总结规律;其中,可以设置筛选条件信息存储的数量上限和/或时间限制,例如至多存储三天内的筛选条件信息,不足一百条的则继续存储。

S32:基于筛选记忆库中各筛选条件信息的数量评估用户的浏览偏好,生成浏览偏好信息。

具体地,基于筛选记忆库中的各类筛选条件信息的数量确定用户历史专利检索记录中的筛选设置,便于根据用户的历史筛选设置中各筛选条件信息的数量和占比评估用户的浏览偏好,生成浏览偏好信息,以便后续根据浏览偏好信息对检索结果进行排序;其中,若筛选记忆库中的各筛选条件信息对同一筛选条件存在不同的设置,则根据数量较多的筛选条件信息所对应的选项进行设置;例如,筛选记忆库中存在10条筛选条件信息,其中8条筛选条件信息选择过滤无效专利,2条筛选条件信息未选择过滤无效专利,则是否过滤无效专利的选项将根据数量较多的筛选条件信息所对应的“过滤无效专利”进行设置。

S33:基于用户画像评估用户的实际需求和资信情况,生成初步排序信息。

在本实施例中,数据排序规则信息是指在初步排序信息的基础上,通过修正排序信息对初步排序信息进行修正后所生成的用于控制专利检索结果中各专利文件排序规则的信息。

具体地,基于用户画像评估用户的实际需求和资信情况,从而确定检索结果的初步排序规则,便于从适于用户实际情况的角度触发对专利相关文件的检索结果进行排序。

S34:基于用户浏览偏好信息评估用户的筛选设置偏好,生成修正排序信息。

具体地,由于根据用户的职业、所属单位、所属单位的资质信息为用户建立的画像只能从客观角度出发预测用户可能感兴趣的专利相关文件,难以反映用户的主观意愿和个性化需求;因此,基于用户浏览偏好信息评估用户在日常使用专利相关文件检索系统时的筛选设置偏好,从而生成修正排序信息,便于将通过用户浏览偏好信息所反映的主观意愿和个性化需求纳入专利相关文件检索结果排序的考虑中,以便对初步排序信息进行修正。

S35:基于修正排序信息对初步排序信息进行修正,生成数据排序规则信息。

具体地,基于修正排序信息对初步排序信息进行修正,从而综合评估用户的客观需求、主观意愿和个性化需求后生成数据排序规则信息,以便后续通过数据排序规则信息对专利检索结果的展示进行排序,提高用户对专利相关文件检索结果展示排序的满意程度。

S40:基于数据排序规则信息对专利相关文件进行排序,生成检索结果列表并对用户展示。

具体地,基于数据排序规则信息对匹配到的专利相关文件进行排序处理,以生成检索结果列表,将检索结果列表对用户展示,使用户根据检索结果列表的顺序查阅专利相关文件,从而提高了用户使用专利检索系统时的检索效率。

其中,参照图7,在步骤S40之前,专利检索结果列表数据排序规则调优方法还包括:

S50:读取各专利相关文件的著录信息,生成关联申请人名单和关联代理机构名单。

在本实施例中,基于检索条件信息从专利数据库中匹配对应的专利相关文件后,关联申请人是指匹配到的所有专利相关文件中出现过的申请人名称;关联代理机构是指匹配到的所有专利相关文件中出现过的专利代理机构名称,

具体地,基于检索条件信息从专利数据库中匹配对应的专利相关文件后,根据数据排序规则信息对专利相关文件进行排序,并将生成的检索结果列表对用户展示;基于检索到的专利相关文件,读取各专利相关文件的著录信息获取出现过的申请人,以生成关联申请人名单;基于检索到的专利相关文件,读取各专利相关文件的著录信息获取出现过的代理机构,以生成关联代理机构名单。

S60:基于关联申请人名单逐一从专利数据库中匹配各申请人的关联文件,生成申请人关联专利信息。

具体地,基于关联申请人名单中的各申请人逐一从专利数据库中匹配各申请人所对应的所有专利相关文件,并对各申请人所对应的所有专利相关文件进行统计,根据公开文件确定各申请人对应的各类专利申请数量、授权数量、授权率、有效专利数量、无效专利数量等信息后生成申请人关联专利信息,以便用户获知当前检索目标范围中各申请人的专利保有情况;便于企业用户获知所属行业内龙头企业或竞争对手的专利保有情况。

S70:基于关联代理机构名单逐一从专利数据库中匹配各代理机构的关联文件,生成代理机构关联专利信息。

具体地,基于关联代理机构名单中的各代理机构逐一从专利数据库中匹配与各代理机构相关的专利相关文件,并对各代理机构所对应的所有专利相关文件进行统计,根据公开文件确定各代理机构对应的各类专利申请数量、授权数量、授权率等信息后生成代理机构关联专利信息,以便用户获知当前检索目标范围中各代理机构的专利代理数量;便于专利代理用户获知其他各代理机构的专利代理数量和代理质量信息。

应理解,上述实施例中各步骤的序号大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。

实施例二

如图8所示,本申请公开了一种专利检索结果列表数据排序规则调优系统,用于执行上述专利检索结果列表数据排序规则调优方法的步骤,该专利检索结果列表数据排序规则调优系统与上述实施例中专利检索结果列表数据排序规则调优方法相对应。

专利检索结果列表数据排序规则调优系统包括用户画像建立模块、专利相关文件匹配模块、数据排序规则生成模块和检索结果列表生成模块。各功能模块的详细说明如下:

用户画像建立模块,用于获取用户账户的账户信息和历史使用信息以建立用户画像,所述用户画像包括用户需求信息;

专利相关文件匹配模块,用于获取检索条件信息,基于检索条件信息从专利数据库中匹配对应的专利相关文件;

数据排序规则生成模块,用于基于历史检索条件信息生成浏览偏好信息,基于用户需求信息和浏览偏好信息生成数据排序规则信息;

检索结果列表生成模块,用于基于数据排序规则信息对专利相关文件进行排序,生成检索结果列表并对用户展示。

其中,用户画像建立模块包括:

账户信息获取分析子模块,用于获取用户账户的账户信息,从所述账户信息中获取职业信息和单位信息;

历史使用信息生成子模块,用于获取用户账户的浏览记录和业务使用记录,生成历史使用信息,所述浏览记录包括专利相关文件浏览记录和业务浏览记录;

用户需求评估子模块,用于基于所述账户信息和历史使用信息评估用户需求,生成用户需求信息,并进一步基于用户需求信息建立用户画像。

其中,用户需求评估子模块包括:

用户类型确定子模块,用于基于用户的所述账户信息确定用户类型,所述用户类型包括各行业的企业用户、专利代理用户、法律行业用户和个人用户;

用户需求信息生成子模块,用于基于用户的历史使用信息和用户类型,生成用户需求信息;

资信信息获取分析子模块,用于基于用户的所述账户信息获取用户的资信信息,根据用户需求信息和资信信息建立对应的用户画像。

其中,专利相关文件匹配模块包括:

相关度评估子模块,用于基于检索条件信息对匹配到的每一专利相关文件进行相关度评估,生成相关度信息并标记至对应的专利相关文件;

相关度对比子模块,用于将各专利相关文件的相关度信息与预设的相关阈值进行对比,将专利相关文件分类为高相关性文件和低相关性文件;

相关度排序子模块,用于基于各专利相关文件的相关度信息进行排序,生成高相关性排序列表和低相关性排序列表。

其中,数据排序规则生成模块包括:

检索条件信息分析子模块,用于从历史检索条件信息中确定关键词信息和筛选条件信息,并将筛选条件信息存储至筛选记忆库中;

浏览偏好信息生成子模块,用于基于筛选记忆库中各筛选条件信息的数量评估用户的浏览偏好,生成浏览偏好信息;

初步排序信息生成子模块,用于基于用户画像评估用户的实际需求和资信情况,生成初步排序信息;

修正排序信息生成子模块,用于基于用户浏览偏好信息评估用户的筛选设置偏好,生成修正排序信息;

数据排序规则信息生成子模块,用于基于修正排序信息对初步排序信息进行修正,生成数据排序规则信息。

其中,专利检索结果列表数据排序规则调优系统还包括:

著录信息获取模块,用于读取各专利相关文件的著录信息,生成关联申请人名单和关联代理机构名单;

申请人关联专利信息生成模块,用于基于关联申请人名单逐一从专利数据库中匹配各申请人的关联文件,生成申请人关联专利信息;

代理机构关联专利信息生成模块,用于基于关联代理机构名单逐一从专利数据库中匹配各代理机构的关联文件,生成代理机构关联专利信息。

实施例三

一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储账户信息、历史使用信息、用户画像、用户需求信息、检索条件信息、专利数据库、浏览偏好信息、数据排序规则信息、检索结果列表、著录信息、关联申请人名单、关联代理机构名单、申请人关联专利信息和代理机构关联专利信息等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现专利检索结果列表数据排序规则调优方法。

在一个实施例中,提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:

S10:获取用户账户的账户信息和历史使用信息以建立用户画像,所述用户画像包括用户需求信息;

S20:获取检索条件信息,基于检索条件信息从专利数据库中匹配对应的专利相关文件;

S30:基于历史检索条件信息生成浏览偏好信息,基于用户画像和浏览偏好信息生成数据排序规则信息;

S40:基于数据排序规则信息对专利相关文件进行排序,生成检索结果列表并对用户展示。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

S10:获取用户账户的账户信息和历史使用信息以建立用户画像,所述用户画像包括用户需求信息;

S20:获取检索条件信息,基于检索条件信息从专利数据库中匹配对应的专利相关文件;

S30:基于历史检索条件信息生成浏览偏好信息,基于用户画像和浏览偏好信息生成数据排序规则信息;

S40:基于数据排序规则信息对专利相关文件进行排序,生成检索结果列表并对用户展示。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)、DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域普通技术人员应当理解;其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

本文发布于:2024-09-22 08:23:15,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/68628.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议