一种实现区域企业知识产权摸底与管理的方法

著录项
  • CN201510539896.5
  • 20150831
  • CN105184705A
  • 20151223
  • 佛山市恒南微科技有限公司
  • 黄庆梅;郑俊杰;其他发明人请求不公开姓名
  • G06Q50/18
  • G06Q50/18

  • 广东省佛山市禅城区张槎三路35号德晖花园4号楼502室
  • 广东(44)
摘要
一种实现区域企业知识产权摸底与管理的方法。本发明公开了一种基于专利、商标和软件著作权三种常用的知识产权的公众公开的登记或变更公告数据的页面级别的通过getHTTPPage方法的抓取技术,再结合数据库技术,采用企业数据预处理,第一次定性查询,第二次定量查询和第三次详情查询,最后进行第二数据库为基础的知识产权状态监控、年费提醒等监控与管理的系统,本系统无需第三方的各种许可,而是通过合法的数据获取而低成本高速度地实现。
权利要求

1.一种实现区域企业知识产权摸底与管理的方法,其特征包括,其主要包含以下步骤:

步骤S102,在企业信息库中读出企业名称的待查数据;

步骤S103,根据三种类别将步骤S102所读出的企业名称通过函数转为下列所列的对应数据编码:专利公告信息对应编码方式为UTF8,软件著作权公告信息对应编码方式为GB2312,商标公告信息对应编码方式为UTF8;

步骤S104,在步骤S103生成的对应编码方式的数据后,通过URLencode/URLDecode加密/解密函数将上述步骤S103的数据进行加密,并输出为第一变量,其中软件著作权公告信息中,第一变量为明文,不进行加密;

步骤S105,以上述第一变量作为对应的URL的对应参数值生成第一URL;

步骤S106,通过getHTTPPage方式访问步骤S105生成的第一URL,获得第一URL对应的页面的HTML格式的数据源码供步骤S107进行标记截取;

步骤S107,通过S106获得的HTML格式的数据源码,通过HTML标记截取生成生成第一信息码;然后根据三种类别的知识产权类型对应不同的截取标记截取生成第二信息码;软件著作权类型时标记获取第三信息码;其中商标类型和专利类型没有第三信息码;

当第一信息码的值为空时,返回S102步骤,同时检查网络是否正常;当第二信息码为空时,跳过步骤S108,并设置第四信息码的值为“0”;当第二信息码不为空时,执行步骤S108;

步骤S108,生成第四信息码:知识产权类型为软件著作权类型时,当第二信息码不为空,并且第三信息码为空时,第四信息码通过标记获取生成,第二信息码不为空并且第三信息码不为空时,第四信息码的值为“1”;知识产权类型为专利时,第二信息码不为空时,第四信息码通过第二信息码去杂质后剩下数字;知识产权类型为商标时,第二信息码不为空时,第四信息码的值为“1”;

步骤S109,当第二信息码不为空时,将第一信息码、第二信息码和第四信息码的信息,以及相应的辅助数据对应存贮在第一比对信息库,即拥有知识产权的企业信息库中;

将所有数据执行步骤S110存入知识产权的企业信息总表,同时返回步骤S101将已经成功检索的记录的进行已执行的标记然后,返回步骤S102循环执行,直至所有符合条件的企业数据检索完成为止;

当全部待查的企业信息库中符合条件的数据均已被正确执行,并存入第一比对信息库后,第一比对信息库里的信息即为拥有知识产权的企业,并且记录着对应拥有商标、专利和软件著作权的一种或多种组合的记录,接下来执行步骤S201获取详细的知识产权状态记录及年费信息;

步骤S201从第一比对信息库中获取企业名称,将根据第一比对信息库中知识产权的类型分别生成对应的编码方式和URLencode/URLDecode加密/解密函数对应生成符合规范的企业名称数据,并设置为第二变量;

步骤S202,以第二变量为基础,对应不同的知识产权类型并发生成对应的带第二变量的第二URL,并通过getHTTPPage方式访问第二URL,将结果HTML静态化,供步骤S203分别进行标记截取;

步骤S203,根据不同的知识产权类别进行不同的标记进行HTML内容截取获得第五信息码、第六信息码、第七信息码和第八信息码;当第五信息码为空时,对应的企业的知识产权截取出错,返回步骤S201,并检查网络连接状态、第一信息库连接情况和对应的知识产权公告信息发布网站的URL是否发生变化;

当第五信息码不为空,第六信息码为空时,表明该企业对应的知识产权公布页面中显示只有一页的对应的知识产权,不翻页,程序依次标记并截取生成如下字段:企业名称、知识产权名称、知识产权类型、知识产权状态、知识产权编号和知识产权公开时间,同时与第二辅助信息存贮到第一企业知识产权信息库;

当第五信息码和第六信息码同时不为空,并且第七信息码为空时,第八信息码即为页码,将第八信息码去杂余数字后加入URL的页码参数,生成第三URL,以第三URL中的第八信息码为结束码,0为开始码生成FOR循环列出第三URL的子URL,并且依次执行步骤S203步骤,直至FOR循环结束;

步骤S204,通过步骤S203,知识产权的基本信息存入第一企业知识产权信息库后,当知识产权类型为专利时,按照步骤S201和步骤S202的方法,以第一企业知识产权信息库为数据基础,读取出企业名称、专利名称和专利申请号或者专利号,经过格式转化后获得对应的非加密的企业名称,不带点的专利号和通过URLencode加密后的专利名称,并通过专利号或专利申请号为变量参数,与专利公告发布网站的URL形成第三URL,并通过getHTTPPage方式访问第三URL,将结果HTML静态化,供步骤S205分别进行标记截取;

步骤S205,通过标记截取获得第九信息码、第十信息码、第十一信息码和第十二信息码,其中第九信息为申请人名称,第十信息码为专利申请号或者专利号,第十一信息码为申请日期,第十二信息码为专利状态,当专利法律状态为“专利权维持”时,转到对应的以专利申请号或者专利号为变量参数的指向“专利费用信息”的第四URL,并通过getHTTPPage方式访问第四URL,将结果HTML静态化,通过标识截取首年年费金额,将上述信息与第三辅助信息一并存入第二企业知识产权信息库;

步骤S206,当知识产权类型为专利时,读出第二企业知识产权信息库的专利状态为“专利权维持”的专利的专利申请号或专利号、专利名称、专利申请日期、专利首年年费金额信息,通过公式计算出第二年所需要缴纳的年费金额及缴费时间,然后发出信号提醒年费时间;

步骤S301,上述所有步骤完成后,分别对第一组步骤S101、S102、S103、S104、S105、S106、S107、S108和S109,第二组步骤S201、S202、S203、S204、S205和S206分别设定下一次的执行时间以定期检索,并且可以对S101的企业信息库中新增的企业进行增量的检索;

步骤S302,上述所有步骤完成后,结束全部步骤。

2.根据权利要求1所述的一种实现区域企业知识产权摸底与管理的方法,其特征包括,所述的第一信息码:通过以“”标记开始和“”标记结束生成;三种类别的知识产权类型对应如下标记生成第二信息码:专利类型的开始标记为“sop-totalCount”,结束标记为“]”,商标类型的开始标记为“regNum”,结束标记为“regNum”,软件著作权类型的开始标记为“登记日期”,结束标记为“>2”;软件著作权类型时获取第三信息码,其开始标记为“中国”,结束标记为“

3.根据权利要求1所述的一种实现区域企业知识产权摸底与管理的方法,其特征包括,执行步骤S102前执行步骤S101进行企业信息查询中,进行企业类型、企业名称、企业成立时间、企业注册资金和企业注册地址的一种条件或者多个条件组合检索筛选出所需要检索的数据。

4.根据权利要求1和权利要求2所述的一种实现区域企业知识产权摸底与管理的方法,其特征包括,所述的步骤S205,当专利法律状态为“专利权维持”时,还可以循环标记截取“应缴费信息”对应的每年的年费金额及对应的缴费截止日期并存入第二企业知识产权信息库中年费信息表中,并通过上述年费信息表与系统时间进行比对,在设定的提醒时间范围进行提醒。

5.根据权利要求1所述的一种实现区域企业知识产权摸底与管理的方法,其特征包括,所述的步骤S205,当专利法律状态为“专利权维持”时,第二年年费的时间计算为“专利申请日”+当前系统的时间中的年份;与此对应所需要缴纳的年费金额为:首年年费金额与第二企业知识产权信息库中年费对照表的数据比对确定是否减缓,然后根据减缓标记、申请时间和首年年费缴纳时间进行比对,确定专利类型和第二年年费的金额。

6.根据权利要求1所述的一种实现区域企业知识产权摸底与管理的方法,其特征包括,步骤S109所述的辅助数据包括通过步骤S102所读出的企业名称传递而获得企业名称,通过步骤S107和步骤S108追加获取当前的系统时间。

7.根据权利要求1所述的一种实现区域企业知识产权摸底与管理的方法,其特征包括,在执行步骤S102前,通过设置一定数量的采样数据进行采样,采样数据包括企业拥有三种知识产权类别的一种、两种、三种及上述组合的一定量的企业,以及没有任何知识产权的一定量的企业,采样走完整个流程,查看相关采集是否正常,此步骤确定网络是否正常,官方公布数据格式是否发生变化和确定所设置的数据编码方式是否正确。

8.根据权利要求1所述的一种实现区域企业知识产权摸底与管理的方法,其特征包括,步骤S203所述的第五信息码截取的开始标记与结束标记与第一信息码的标记相同,第六信息码截取的开始标记与结束标记与二信息码的标记相同,第七信息码截取的开始标记与结束标记与三信息码的标记相同,第八信息码对应的起止标记分别如下:

专利:开始标记“/”,结束标记为“    

  • ”;

    商标:开始标记“页  共”,结束标记:“页”;

    软件著作权:开始标记:“页/共”,结束标记:“页”。

  • 9.根据权利要求1所述的一种实现区域企业知识产权摸底与管理的方法,其特征包括,步骤S103所述的编码方式,当官方机构公布的数据对应的编码发生变更时,本方法将根据实际所发生的变化变更编码方式;步骤S104所述的URL中,当官方机构公布时采用的URL进行加密发布时,本方法将根据实际情况进行数据加密编码;步骤S104所述的URLencode/URLDecode加密/解密函数将上述步骤S103的数据进行加密,其加密编码根据实际情况进行一次加密、二次和多次加密。

    10.根据权利要求1所述的一种实现区域企业知识产权摸底与管理的方法,其特征包括,步骤S203中,当第八信息码的值大于1时,通过获取知识产权的条数的统计数据第十三信息码与现有的第二企业知识产权信息库中的数据对比,当第十三信息码不大于第二企业知识产权信息库中对应的企业的知识产权类型的总计数值时,不必进行第二页及后面的读取;当第十三信息码大于第二企业知识产权信息库中对应的企业的知识产权类型的总计数值时,根据超出的数量进行增量更新。

    说明书
    技术领域

    本发明主要涉及一种实现区域企业知识产权摸底与管理的方法,尤其是通过知识产权公布网站的页面信息抓取、分析、整理、建档和运用以实现待查的区域的企业的知识产权状态摸底以及拥有知识产权的企业进行状态监控、年费提醒等功能的方法。

    目前,一个地区,或者说一定区域的企业,想查询所有企业各自的知识产权拥有情况,尤其是广谱式的全民式查底,目前的方法相对难以实现,其不但需要到每个部门将专利、软件著作权和商标等数据归库,并且需要对每个地区数以百万计的企业与数以百万计的数据进行比对,这样不但成本高,而且数据源相对敏感而难以实现。

    然而,一个地区的企业的知识产权状况,对于地方知识产权政策的制定与实施,以及地方政府对企业知识产权的管理等具有极强的基础性需求。

    为了解决上述问题,本发明提出了一种基于专利、商标和软件著作权三种常用的知识产权的公众公开的登记或变更公告数据的页面级别的通过getHTTPPage方法的抓取技术,再结合数据库技术,采用企业数据预处理,第一次定性查询,第二次定量查询和第三次详情查询,最后进行第二数据库为基础的知识产权状态监控、年费提醒等监控与管理的方法,此方法无需第三方的各种许可,而是通过合法的数据获取而低成本高速度地实现。

    一种实现区域企业知识产权摸底与管理的方法,其主要包含以下步骤:

    步骤S102,在企业信息库中读出企业名称的待查数据;

    步骤S103,根据三种类别将步骤S102所读出的企业名称通过函数转为下列所列的对应数据编码:专利公告信息对应编码方式为UTF8,软件著作权公告信息对应编码方式为GB2312,商标公告信息对应编码方式为UTF8;

    步骤S104,在步骤S103生成的对应编码方式的数据后,通过URLencode/URLDecode加密/解密函数将上述步骤S103的数据进行加密,并输出为第一变量,其中软件著作权公告信息中,第一变量为明文,不进行加密;

    步骤S105,以上述第一变量作为对应的URL的对应参数值生成第一URL;

    步骤S106,通过getHTTPPage方式访问步骤S105生成的第一URL,获得第一URL对应的页面的HTML格式的数据源码供步骤S107进行标记截取;

    步骤S107,通过S106获得的HTML格式的数据源码,通过HTML标记截取生成生成第一信息码;然后根据三种类别的知识产权类型对应不同的截取标记截取生成第二信息码;软件著作权类型时标记获取第三信息码;其中商标类型和专利类型没有第三信息码;

    当第一信息码的值为空时,返回S102步骤,同时检查网络是否正常;当第二信息码为空时,跳过步骤S108,并设置第四信息码的值为“0”;当第二信息码不为空时,执行步骤S108;

    步骤S108,生成第四信息码:知识产权类型为软件著作权类型时,当第二信息码不为空,并且第三信息码为空时,第四信息码通过标记获取生成,第二信息码不为空并且第三信息码不为空时,第四信息码的值为“1”;知识产权类型为专利时,第二信息码不为空时,第四信息码通过第二信息码去杂质后剩下数字;知识产权类型为商标时,第二信息码不为空时,第四信息码的值为“1”;

    步骤S109,当第二信息码不为空时,将第一信息码、第二信息码和第四信息码的信息,以及相应的辅助数据对应存贮在第一比对信息库,即拥有知识产权的企业信息库中;

    将所有数据执行步骤S110存入知识产权的企业信息总表,同时返回步骤S101将已经成功检索的记录的进行已执行的标记然后,返回步骤S102循环执行,直至所有符合条件的企业数据检索完成为止;

    当全部待查的企业信息库中符合条件的数据均已被正确执行,并存入第一比对信息库后,第一比对信息库里的信息即为拥有知识产权的企业,并且记录着对应拥有商标、专利和软件著作权的一种或多种组合的记录,接下来执行步骤S201获取详细的知识产权状态记录及年费信息;

    步骤S201从第一比对信息库中获取企业名称,将根据第一比对信息库中知识产权的类型分别生成对应的编码方式和URLencode/URLDecode加密/解密函数对应生成符合规范的企业名称数据,并设置为第二变量;

    步骤S202,以第二变量为基础,对应不同的知识产权类型并发生成对应的带第二变量的第二URL,并通过getHTTPPage方式访问第二URL,将结果HTML静态化,供步骤S203分别进行标记截取;

    步骤S203,根据不同的知识产权类别进行不同的标记进行HTML内容截取获得第五信息码、第六信息码、第七信息码和第八信息码;当第五信息码为空时,对应的企业的知识产权截取出错,返回步骤S201,并检查网络连接状态、第一信息库连接情况和对应的知识产权公告信息发布网站的URL是否发生变化;

    当第五信息码不为空,第六信息码为空时,表明该企业对应的知识产权公布页面中显示只有一页的对应的知识产权,不翻页,程序依次标记并截取生成如下字段:企业名称、知识产权名称、知识产权类型、知识产权状态、知识产权编号和知识产权公开时间,同时与第二辅助信息存贮到第一企业知识产权信息库;

    当第五信息码和第六信息码同时不为空,并且第七信息码为空时,第八信息码即为页码,将第八信息码去杂余数字后加入URL的页码参数,生成第三URL,以第三URL中的第八信息码为结束码,0为开始码生成FOR循环列出第三URL的子URL,并且依次执行步骤S203步骤,直至FOR循环结束;

    步骤S204,通过步骤S203,知识产权的基本信息存入第一企业知识产权信息库后,当知识产权类型为专利时,按照步骤S201和步骤S202的方法,以第一企业知识产权信息库为数据基础,读取出企业名称、专利名称和专利申请号或者专利号,经过格式转化后获得对应的非加密的企业名称,不带点的专利号和通过URLencode加密后的专利名称,并通过专利号或专利申请号为变量参数,与专利公告发布网站的URL形成第三URL,并通过getHTTPPage方式访问第三URL,将结果HTML静态化,供步骤S205分别进行标记截取;

    步骤S205,通过标记截取获得第九信息码、第十信息码、第十一信息码和第十二信息码,其中第九信息为申请人名称,第十信息码为专利申请号或者专利号,第十一信息码为申请日期,第十二信息码为专利状态,当专利法律状态为“专利权维持”时,转到对应的以专利申请号或者专利号为变量参数的指向“专利费用信息”的第四URL,并通过getHTTPPage方式访问第四URL,将结果HTML静态化,通过标识截取首年年费金额,将上述信息与第三辅助信息一并存入第二企业知识产权信息库;

    步骤S206,当知识产权类型为专利时,读出第二企业知识产权信息库的专利状态为“专利权维持”的专利的专利申请号或专利号、专利名称、专利申请日期、专利首年年费金额信息,通过公式计算出第二年所需要缴纳的年费金额及缴费时间,然后发出信号提醒年费时间;

    步骤S301,上述所有步骤完成后,分别对第一组步骤S101、S102、S103、S104、S105、S106、S107、S108和S109,第二组步骤S201、S202、S203、S204、S205和S206分别设定下一次的执行时间以定期检索,并且可以对S101的企业信息库中新增的企业进行增量的检索;

    步骤S302,上述所有步骤完成后,结束全部步骤。

    所述的第一信息码:通过以“”标记开始和“”标记结束生成;三种类别的知识产权类型对应如下标记生成第二信息码:专利类型的开始标记为“sop-totalCount”,结束标记为“]”,商标类型的开始标记为“regNum”,结束标记为“regNum”,软件著作权类型的开始标记为“登记日期”,结束标记为“>2”;软件著作权类型时获取第三信息码,其开始标记为“中国”,结束标记为“

    执行步骤S102前执行步骤S101进行企业信息查询中,进行企业类型、企业名称、企业成立时间、企业注册资金和企业注册地址的一种条件或者多个条件组合检索筛选出所需要检索的数据。

    所述的步骤S205,当专利法律状态为“专利权维持”时,还可以循环标记截取“应缴费信息”对应的每年的年费金额及对应的缴费截止日期并存入第二企业知识产权信息库中年费信息表中,并通过上述年费信息表与系统时间进行比对,在设定的提醒时间范围进行提醒。

    所述的步骤S205,当专利法律状态为“专利权维持”时,第二年年费的时间计算为“专利申请日”+当前系统的时间中的年份;与此对应所需要缴纳的年费金额为:首年年费金额与第二企业知识产权信息库中年费对照表的数据比对确定是否减缓,然后根据减缓标记、申请时间和首年年费缴纳时间进行比对,确定专利类型和第二年年费的金额。

    步骤S109所述的辅助数据包括通过步骤S102所读出的企业名称传递而获得企业名称,通过步骤S107和步骤S108追加获取当前的系统时间。

    在执行步骤S102前,通过设置一定数量的采样数据进行采样,采样数据包括企业拥有三种知识产权类别的一种、两种、三种及上述组合的一定量的企业,以及没有任何知识产权的一定量的企业,采样走完整个流程,查看相关采集是否正常,此步骤确定网络是否正常,官方公布数据格式是否发生变化和确定所设置的数据编码方式是否正确。

    步骤S203所述的第五信息码截取的开始标记与结束标记与第一信息码的标记相同,第六信息码截取的开始标记与结束标记与二信息码的标记相同,第七信息码截取的开始标记与结束标记与三信息码的标记相同,第八信息码对应的起止标记分别如下:

    专利:开始标记“/”,结束标记为“    

  • 图1一种实现区域企业知识产权摸底与管理的方法的总体流程图。

    图2一种实现区域企业知识产权摸底与管理的方法第一组步骤集合的流程图。

    一种实现区域企业知识产权摸底与管理的方法,其主要包含以下步骤:

    步骤S101,进行企业信息查询中,进行企业类型等条件检索筛选出所需要检索的数据。

    步骤S102,在企业信息库中读出企业名称的待查数据,设变量为“aa”。

    步骤S103,根据三种类别将步骤S102所读出的企业名称通过函数转为下列所列的对应数据编码:专利公告信息对应编码方式为UTF8,软件著作权公告信息对应编码方式为GB2312,商标公告信息对应编码方式为UTF8。

    其中UTF8编码的需要在文件头加入以下代码段:

    GB2312编码的文件头加入如下代码:

    步骤S104,在步骤S103生成的对应编码方式的数据后,通过URLencode/URLDecode加密/解密函数将上述步骤S103的数据进行加密,并输出为第一变量,其中软件著作权公告信息中,第一变量为明文,不进行加密;URLencode/URLDecode加密/解密函数将上述步骤S103的数据进行加密,其加密编码根据实际情况进行一次加密、二次和多次加密,其中一次加密的bb=ce(""&aa&""),两次加密的方式为cc=ce(""&bb&""),多次加密的方法类似。

    步骤S105,以上述第一变量作为对应的URL的对应参数值生成第一URL,使用ASP分别表达如下第一变量假设为cname:

    1.专利公告数据:

    http://cpquery.sipo.gov//txnQueryOrdinaryPatents.do?select-key%3Ashenqingh=&select-key%3Azhuanlimc=&select-key%3Ashenqingrxm=<%=cname%>&select-key%3Azhuanlilx=&select-key%3Ashenqingr_from=&select-key%3Ashenqingr_to=&attribute-node:record_start-row=60&attribute-node:record_page-row=100&

  • 本文发布于:2024-09-20 17:25:04,感谢您对本站的认可!

    本文链接:https://www.17tex.com/tex/1/70046.html

    版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

    留言与评论(共有 0 条评论)
       
    验证码:
    Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议