基于XGBoost回归的技术成果定价评估方法

著录项
  • CN202011365765.7
  • 20201129
  • CN112766298A
  • 20210507
  • 同济大学
  • 柳先辉;李玉;陈宇飞;赵卫东
  • G06K9/62
  • G06K9/62 G06Q10/06

  • 上海市杨浦区四平路1239号
  • 上海(31)
  • 20200820 CN2020108416542
  • 上海科律专利代理事务所(特殊普通合伙)
  • 叶凤
摘要
一种基于XGBoost回归的技术成果定价评估方法:步骤1.在现有的专利数据库的基础上,将专利信息数据按照技术领域分为N个类,从专利数据库中提取与专利的价值评估信息相关数据,以及其对应的交易价格,构建用于模型训练的原始数据集;对这些原始数据集需要通过值标准化、编码操作进行数据预处理;步骤2.N个类中,将每类专利的原始数据集样本随机抽取分为训练集和测试集,并将每个类的训练集输入到对应的XGBoost模型中,并设置参数初始值。利用网格搜索确定各参数的值;训练各个XGBoost模型并得到各特征重要性排序;通过不断调整模型参数和选择特征直至模型收敛;步骤3.获取待评估的专利技术的每个关联特征的量值,输入至其所属类别的的模型中得到预测价值。
权利要求

1.一种基于XGBoost回归的技术成果定价评估方法,其特征在于,包括步骤:

步骤1.在已建立好或者通过购买现有的专利数据库的基础上,将专利信息数据按照技术领域分为N个类,从专利数据库中提取与专利的价值评估信息相关数据,以及其对应的交易价格,构建用于模型训练的原始数据集;

对这些原始数据集需要通过值标准化、编码操作进行数据预处理;

步骤2.N个类中,将每类专利的原始数据集样本随机抽取分为训练集和测试集,并将每个类的训练集输入到对应的XGBoost模型中,并设置参数初始值。利用网格搜索确定各参数的值;

训练各个XGBoost模型并得到各特征重要性排序;通过不断调整模型参数和选择特征直至模型收敛;

步骤3.获取待评估的专利技术的每个关联特征的量值,输入至其所属类别的的模型中得到预测价值。

2.如权利要求1所述的方法,其特征在于,步骤1中,

专利的价值评估影响因素构成原始数据集,包括技术价值因素、法律价值因素、经济价值因素;技术价值因素有技术成熟度、先进性、可替代性等;法律价值因素有专利稳定性、可维权性、有效期;经济价值因素有市场应用状况、市场规模前景、市场垄断程度。

3.如权利要求1所述的方法,其特征在于,步骤2中,

所述XGBoost模型的参数包括学习率、弱分类器个数、最大树深、叶节点权值之和最小值、节点最小分裂值、叶节点最小样本数、最小化损失函数值、行抽样率、列抽样率、L1正则化、L2正则化。

4.如权利要求1所述的方法,其特征在于,

步骤2中,所述XGBoost目标函数定义为:

其中i表示第i个样本,表示第i个样本的预测误差;Ω(fk)表示树的复杂度,表达式为T表示叶子节点的个数,ω表示节点的数值。

说明书
技术领域

本发明属于成果定价评估领域,基于XGBoost回归为科技成果的定价 评估提供了一种有效可行的方法。

技术成果价值评估是科技成果转化的重要环节,科学、客观、准确地评 价科技成果对调动科技人员积极性、促进科技发展具有重要作用。然而由于 成果评估过程中影响因素的复杂性,科技成果的供求双方在进行交易或者合 作时对于价值评定大多表现出很大的主观性和随意性。

目前技术成果评估方法中常见的有:成本法、市场法、收益法。成本 法是根据在投入到该技术开发的所有成本中扣除报废率后来估算市场价 值,这种方法比较片面,并不适用于所有情况。市场法是参考技术市场实 际成交的类似技术的交易案例来定价,目前国内尚未有十分透明的价格市 场,相关数据获取困难。收益法是根据技术成果的经济寿命期间所能创造 收益推算价值,但是由于收益的不确定性,这个方法也难以实施。

本发明针对技术成果定价评估这一难题,提出利用XGBoost回归,在 已经建立好的专利数据库的基础上实现一个自动估价方法,为科技成果定 价评估提供一个新的可行的解决思路。

本发明的主要目的是提出一种基于XGBoost回归的技术成果定价评估 技术,为科技成果的价值评估提供科学、高效的方法。

为解决上述技术问题本发明的具体步骤如下:

一种基于XGBoost回归的技术成果定价评估方法,其特征在于,包括步 骤:

步骤1.在已建立好或者通过购买现有的专利数据库的基础上,将专利信 息数据按照技术领域分为N个类,从专利数据库中提取与专利的价值评估信 息相关数据,以及其对应的交易价格,构建用于模型训练的原始数据集。

专利的价值评估影响因素构成原始数据集,包括技术价值因素、法律价 值因素、经济价值因素。技术价值因素有技术成熟度、先进性、可替代性等。 法律价值因素有专利稳定性、可维权性、有效期等。经济价值因素有市场应 用状况、市场规模前景、市场垄断程度等。对这些原始数据集需要通过值标 准化、编码等操作进行数据预处理。

步骤2.N个类中,将每类专利的原始数据集样本随机抽取分为训练集 和测试集,并将每个类的训练集输入到对应的XGBoost模型中,并设置参数 初始值。利用网格搜索确定各参数的值。

XGBoost模型的参数包括学习率、弱分类器个数、最大树深、叶节点权 值之和最小值、节点最小分裂值、叶节点最小样本数、最小化损失函数值、 行抽样率、列抽样率、L1正则化、L2正则化。训练各个XGBoost模型并得 到各特征重要性排序。通过不断调整模型参数和选择特征直至模型收敛。

步骤3.获取待评估的专利技术的每个关联特征的量值,输入至其所属类 别的的模型中得到预测价值。

步骤2中,所述XGBoost目标函数定义为:

其中i表示第i个样本,表示第i个样本的预测误差;Ω(fk)表示 树的复杂度,表达式为T表示叶子节点的个数,ω表 示节点的数值。

本发明的有益效果:

本发明基于XGBoost回归的方法对技术成果定价评估,为技术成果提 供了一个科学可靠的参考价值,对于科技成果转化起到了重要的作用,同时 对于保障专利交易双方的利益,形成一个规范的专利市场以及促进科技发展 有积极作用。

图1是基于XGBoost回归的技术成果定价评估技术的操作流程图。

下面结合附图和具体实施方式对本发明进行详细说明。

实施例

如图1所示,基于XGBoost回归的技术成果定价评估技术具体包括以 下步骤:

1.在已建立好的专利数据库的基础上,将专利信息数据按照技术领域分 为N个类,从数据库中提取与专利的价值评估信息相关数据,以及其对应的 交易价格,构建用于模型训练的原始数据集。专利的价值评估影响因素包括 技术价值因素、法律价值因素、经济价值因素。技术价值因素有技术成熟度、 先进性、可替代性等。法律价值因素有专利稳定性、可维权性、有效期等。 经济价值因素有市场应用状况、市场规模前景、市场垄断程度等。对这些原 始数据集需要通过值标准化、编码等操作进行数据预处理。

2.将每类专利的原始数据集样本随机抽取分为训练集和测试集,并将每 个类的训练集输入到对应的XGBoost模型中,并设置参数初始值。利用网格 搜索确定各参数的值。XGBoost模型的参数包括学习率、弱分类器个数、最 大树深、叶节点权值之和最小值、节点最小分裂值、叶节点最小样本数、最 小化损失函数值、行抽样率、列抽样率、L1正则化、L2正则化。训练各个 XGBoost模型并得到各特征重要性排序。通过不断调整模型参数和选择特征 直至模型收敛。

XGBoost目标函数定义为:

其中i表示第i个样本,表示第i个样本的预测误差。Ω(fk)表示 树的复杂度,表达式为T表示叶子节点的个数,ω表 示节点的数值。

3.获取待评估的专利技术的每个关联特征的量值,输入至其所属类别的 的模型中得到预测价值。

本文发布于:2024-09-23 06:35:05,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/69042.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议