基于时序模型的增员信息获取方法、装置、设备及介质与流程



1.本发明涉及人工智能领域,尤其涉及一种基于时序模型的增员信息获取方法、装置、设备及存储介质。


背景技术:



2.在企业增员的过程中,在考虑候选人的个人特征的同时,企业也对候选人有多个期望指标,通常需要基于历史候选人的信息及期望指标实现智能化增员,传统的增员方法一般是基于候选人的个人特征及期望指标特征训练多个融合的回归模型,并通过训练后的融合模型输出候选人对应的目标期望指标,以实现增员决策。
3.但是,由于传统的单个回归模型只能计算出候选人的单个目标期望指标,需要多个模型融合才能得到候选人对应的所有期望指标,使得获取候选人信息的效率较低,进而降低增员的效率;进一步地,传统模型也未考虑多个期望指标中每个期望指标对增员决策的影响程度,使得获取候选人信息的质量不高,进而降低增员的质量。


技术实现要素:



4.本发明提供一种基于时序模型的增员信息获取方法、装置、设备及存储介质,其主要目的是提高增员效率及增员质量。
5.为实现上述目的,本发明提供了一种基于时序模型的增员信息获取方法,包括:
6.获取历史用户特征集及历史期望特征集,分别将所述历史用户特征集及所述历史期望特征集进行时序关系添加,得到历史用户时序特征集及历史期望时序特征集,分别将所述历史用户时序特征集及所述历史期望时序特征集进行分类,得到用户特征类型及期望特征类型;
7.分别统计所述用户特征类型之间组合的用户特征概率及所述期望特征类型之间组合的期望特征概率;
8.将所述历史用户特征集及所述历史期望特征集作为初始训练数据集,并识别所述历史用户特征集及所述历史期望特征集之间的关联关系,并根据所述关联关系、所述用户特征概率及所述期望特征概率将所述初始训练数据集进行扩展,得到新训练数据集,合并所述初始训练数据集及所述新训练数据集作为目标训练数据集;
9.从所述目标训练数据集中获取用户特征集对应的真实期望特征集,根据所述目标训练数据集及所述真实期望特征集对预设的增员模型进行训练,得到训练完成的增员模型;
10.获取待增员用户的候选用户特征集,并将所述候选用户特征集输入所述训练完成的增员模型中,得到所述候选用户特征集对应的目标期望特征集,根据所述目标期望特征集对所述待增员用户进行增员决策,得到增员结果。
11.可选地,所述利用所述双塔模型中的融合层将所述用户交互矩阵集及所述机构交互矩阵集进行交互拼接,得到目标用户交互特征集,包括:
12.利用所述融合层中的膨胀因果卷积层将所述用户交互矩阵集及所述机构交互矩阵集进行拼接,得到初始目标用户交互特征集;
13.利用所述融合层中的残差连接层将所述初始用户机构交互特征集进行特征降维,得到所述目标用户交互特征集。
14.可选地,所述根据所述关联关系、所述用户特征概率及所述期望特征概率将所述初始训练数据集进行扩展,得到新训练数据集,包括:
15.根据所述用户特征概率及所述期望特征概率生成初始新训练数据集;
16.根据所述关联关系遍历所述初始新训练数据集中是否存在与历史用户特征集中相同的用户特征;
17.当所述初始新训练数据集中不存在与历史用户特征集中相同的用户特征时,计算所述用户特征与所述历史用户特征集中历史用户特征的相似度,根据所述相似度从所述历史用户特征集中查与所述用户特征相匹配的历史用户特征对应的期望特征;
18.将所述用户特征与所述用户特征对应的期望特征加入所述初始新训练数据集,得到所述新训练数据集。
19.可选地,所述分别统计所述用户特征类型之间组合的用户特征概率及所述期望特征类型之间组合的期望特征概率,包括:
20.利用预设的分类器将所述用户特征类型及所述期望特征类型分别进行用户分类及期望分类,得到所述用户特征类型之间的先验概率及所述期望特征类型之间的先验概率;
21.根据所述用户特征类型之间的先验概率确定所述用户特征类型所属类别的用户特征概率,再根据所述期望特征类型之间的先验概确定所述期望特征类型所属类别的期望特征概率。
22.可选地,所述分别将所述历史用户时序特征集及所述历史期望时序特征集进行分类,得到用户特征类型及期望特征类型,包括:
23.获取所述历史用户时序特征集的用户维度用户类标签,以及获取所述历史期望时序特征集的期望类标签;
24.分别将所述用户维度及所述期望维度进行降维,得到低维历史用户特征集及低维历史期望特征集;
25.根据所述用户类标签将所述低维历史用户特征集进行离散化,得到所述用户特征类型;
26.根据所述期望类标签将所述低维历史期望特征集进行离散化,得到所述期望特征类型。
27.可选地,其特征在于,所述根据所述目标训练数据集及所述真实期望特征集对预设的增员模型进行训练,得到训练完成的增员模型,包括:
28.利用所述预设的增员模型中的嵌入层将所述目标训练数据集进行位置编码,得到训练数据时序向量,其中所述目标训练数据集包括用户特征集及期望特征集;
29.利用所述增员模型中的编码层将所述训练数据时序向量进行编码,得到训练数据特征向量;
30.利用所述增员模型中的解码层对所述训练数据特征向量进行解码,得到所述用户
特征集的预测期望特征集;
31.利用所述增员模型中的损失函数计算所述预测期望特征集和所述真实期望特征集的损失值,根据所述损失值调整所述增员模型的参数,直到所述损失值满足预设条件时,得到所述训练完成的增员模型。
32.可选地,所述利用所述增员模型中的解码层对所述训练数据特征向量进行解码,得到所述用户特征集的预测期望特征集,包括:
33.利用所述解码层中的多头注意力机制层对所述训练数据特征向量进行混合点积操作,得到训练数据关联特征向量;
34.利用所述解码层中的正则层将所述训练数据关联特征向量进行解码,得到解码训练数据向量;
35.将所述解码训练数据向量输入至解码层中的激活函数中输出所述所述用户特征集的的预测期望特征集。
36.可选地,所述分别将所述历史用户特征集及所述历史期望特征集进行时序关系添加,得到历史用户时序特征集及历史期望时序特征集,包括:
37.获取所述历史用户特征集及所述历史期望特征集中各特征的采集时间,将所述采集时间转换为标准格式,得到各特征的时间戳;
38.分别将所述历史用户特征集之间及所述历史期望特征集之间存在时间关联的关联特征添加所述时间戳,并按照所述时间戳顺序将所述关联的特征分别表示为所述历史用户时序特征集及所述历史期望时序特征集。
39.为了解决上述问题,本发明还提供一种基于时序模型的增员信息获取装置,所述装置包括:
40.用户与期望特征分类模块,用于获取历史用户特征集及历史期望特征集,分别将所述历史用户特征集及所述历史期望特征集进行时序关系添加,得到历史用户时序特征集及历史期望时序特征集,分别将所述历史用户时序特征集及所述历史期望时序特征集进行分类,得到用户特征类型及期望特征类型;
41.用户与期望特征统计模块,用于分别统计所述用户特征类型之间组合的用户特征概率及所述期望特征类型之间组合的期望特征概率;
42.训练数据生成模块,用于将所述历史用户特征集及所述历史期望特征集作为初始训练数据集,并识别所述历史用户特征集及所述历史期望特征集之间的关联关系,并根据所述关联关系、所述用户特征概率及所述期望特征概率将所述初始训练数据集进行扩展,得到新训练数据集,合并所述初始训练数据集及所述新训练数据集作为目标训练数据集;
43.增员模型训练模块,用于从所述目标训练数据集中获取用户特征集对应的真实期望特征集,根据所述目标训练数据集及所述真实期望特征集对预设的增员模型进行训练,得到训练完成的增员模型;
44.增员决策模块,用于获取待增员用户的候选用户特征集,并将所述候选用户特征集输入所述训练完成的增员模型中,得到所述候选用户特征集对应的目标期望特征集,根据所述目标期望特征集对所述待增员用户进行增员决策,得到增员结果。
45.为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
46.存储器,存储至少一个计算机程序;及
47.处理器,执行所述存储器中存储的计算机程序以实现上述所述的基于时序模型的增员信息获取方法。
48.为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的基于时序模型的增员信息获取方法。
49.本发明实施例中,首先通过将历史用户特征集及历史期望特征集进行时序关系添加,同时确定用户特征与期望特征的特征时序,以增加特征之间的关联,并将历史用户时序特征集及历史期望时序特征集进行分类,统计用户特征类型之间组合的用户特征概率及期望特征类型之间组合的期望特征概率,能够统计期望特征之间的不同组合,确定各个期望特征对后续增员决策的影响程度,提高获取用户信息的质量,也便于提高后续增员质量;其次,通过识别所述历史用户特征集及所述历史期望特征集组合之间的关联关系,进一步加强了用户特征与多个期望特征之间的交互,并根据关联关系、所述用户特征概率及所述期望特征概率将所述初始训练数据集进行扩展,将得到扩展数据及历史数据作为训练数据集进行增员模型训练,在提高该模型准确率的同时解决了需要多个模型融合才能得到候选人对应的所有期望指标的问题,提高了增员效率;最后通过训练完成的模型输出与候选用户相匹配的目标期望特征,可以筛选出最匹配的候选用户,提高了增员质量。因此本发明实施例提出的基于时序模型的增员信息获取方法、装置、设备及存储介质可以提高增员效率及增员质量。
附图说明
50.图1为本发明一实施例提供的基于时序模型的增员信息获取方法的流程示意图;
51.图2为本发明一实施例提供的基于时序模型的增员信息获取方法中一个步骤的详细流程示意图;
52.图3为本发明一实施例提供的基于时序模型的增员信息获取方法中一个步骤的详细流程示意图;
53.图4为本发明一实施例提供的基于时序模型的增员信息获取装置的模块示意图;
54.图5为本发明一实施例提供的实现基于时序模型的增员信息获取方法的电子设备的内部结构示意图。
55.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
56.应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
57.本发明实施例提供一种基于时序模型的增员信息获取方法。所述基于时序模型的增员信息获取方法的执行主体包括但不限于服务端、终端等能够被配置为执行本技术实施例提供的该方法的电子设备中的至少一种。换言之,所述基于时序模型的增员信息获取方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集、云端服务器或云端服务器集等。
58.参照图1所示的本发明一实施例提供的基于时序模型的增员信息获取方法的流程示意图,在本发明实施例中,所述基于时序模型的增员信息获取方法包括以下步骤s1-s5:
59.s1、获取历史用户特征集及历史期望特征集,分别将所述历史用户特征集及所述历史期望特征集进行时序关系添加,得到历史用户时序特征集及历史期望时序特征集,分别将所述历史用户时序特征集及所述历史期望时序特征集进行分类,得到用户特征类型及期望特征类型。
60.本发明实施例中,所述历史用户特征集是指企业已招聘人员的相关个人信息,比如,已招聘的保险代理人的姓名、性别、年龄、户籍地址、工龄、离职原因以及一些面试信息(家庭情况、薪酬期望)等;所述历史期望特征集是指企业对已招聘人员的期望指标集,比如,保险代理人入职一段时间(如第三个月、半年)内达到的放款件数、有效放款件数及放款额度等。
61.本发明实施例中,所述用户特征类型是指不同用户特征的信息类型,比如,有一用户特征为工龄,则对应的用户特征类型为1年、2年及3年等;所述期望特征类型是指不同期望特征的信息类型,比如,有一期望特征为保险代理人的放款件数,则对应的期望特征类型为5件、10件及20件等。
62.本发明实施例中,通过通过将历史用户特征集及历史期望特征集进行时序关系添加,确定用户特征与期望特征的特征时序,获取用户特征对应的所有期望指标,提高用户信息的获取效率,还可以增加特征之间的关联,并将历史用户时序特征集及历史期望时序特征集进行分类,便于后续到用户特征最匹配的期望特征集。
63.作为本发明的一个实施例,所述分别将所述历史用户特征集及所述历史期望特征集进行时序关系添加,得到历史用户时序特征集及历史期望时序特征集,包括:
64.获取所述历史用户特征集及所述历史期望特征集中各特征的采集时间,将所述采集时间转换为标准格式,得到各特征的时间戳;分别将所述历史用户特征集之间及所述历史期望特征集之间存在时间关联的关联特征添加所述时间戳,并按照所述时间戳顺序将所述关联的特征分别表示为所述历史用户时序特征集及所述历史期望时序特征集。
65.其中,所述时间戳是使用数字签名技术产生的时间数据,数字签名的对象可以包括历史用户特征集及所述历史期望特征集、签名参数、签名时间等信息,所述本地时间是本地存储的历史用户特征集之间及所述历史期望特征集的时间;所述标准格式可以为数据在本地存储的年月日及时间,例如,2022.6.30.16:00。
66.本发明一实施例中,分别将所述历史用户特征集之间及所述历史期望特征集之间存在时间关联的特征添加所述时间戳,可以实时记录特征集的存储时间,还可以将特征之间按照时间戳顺序进行关联。
67.例如,历史用户特征集为x1,x2,

,xn,通过添加时间戳可以明确,x1先于x3发生,;有一历史期望特征集为y1,y2,y3则通过时间戳顺序我们可以明确y1先于y2先于y3发生,即有一期望特征y1为放款件数、y2为有效放款件数、y3为有效放款额度,这些特征之间是存在时间关联的。
68.进一步地,所述分别将所述历史用户时序特征集及所述历史期望时序特征集进行分类,得到用户特征类型及期望特征类型,包括:
69.获取所述历史用户时序特征集的用户维度及用户类标签,以及获取所述历史期望时序特征集的期望维度及期望类标签;分别将所述用户维度及所述期望维度进行降维,得到低维历史用户特征集及低维历史期望特征集;根据所述用户类标签将所述低维历史用户
特征集进行离散化,得到所述用户特征类型;根据所述期望类标签将所述低维历史期望特征集进行离散化,得到所述期望特征类型。
70.其中,所述用户维度是指历史用户时序特征集的维度;所述期望维度是指历史期望时序特征集的维度,可以通过局部线性嵌入算法对用户维度及期望维度进行降维,使得降维后的低维空间中数据不同类之间距离有较好的可分性,还可以保持高维空间特征之间的权值关系。
71.本发明一实施例中,所述用户类标签是指历史用户时序特征集中每个特征的类别标签,比如用户时序特征集中有一特征为x1,则对应的用户类标签有a种类型;所述期望类标签是指历史期望时序特征集中每个特征的类别标签,比如期望时序特征集中有y1,y2,y3连续变量,则对应的期望类标签为y1有d种类型、y2有e种类型、y3有f种类型。
72.本发明实施例中,由于历史用户时序特征集及历史期望时序特征集都为连续型变量,且不同特征之间存在关联关系,所以可以根据实际场景需求通过ille-hd3算法将特征进行离散化,实现特征的分类。
73.例如,历史期望时序特征集中包括保险代理人入职一段时间内达到的放款件数、有效放款件数及放款额度,通过分类可以得到保险代理人a对应的期望特征d1类为入职三个月内、e1类达到的放款件数为100件、f1类有效件数为70件。
74.s2、分别统计所述用户特征类型之间组合的用户特征概率及所述期望特征类型之间组合的期望特征概率。
75.本发明实施例中,所述用户特征概率是指用户特征之间的组合概率。所述期望特征概率是指期望特征之间的组合概率。
76.本发明实施例通过分别统计所述用户特征类型之间组合的用户特征概率及所述期望特征类型之间组合的期望特征概率,可以确定每个期望特征对后续增员决策的影响程度,提高获取用户信息的质量,也便于提高后续增员质量。
77.作为本发明的一个实施例,参考图2所示,所述分别统计所述用户特征类型之间组合的用户特征概率及所述期望特征类型之间组合的期望特征概率,包括以下步骤s21-s22:
78.s21、利用预设的分类器将所述用户特征类型及所述期望特征类型分别进行用户分类及期望分类,得到所述用户特征类型之间的先验概率及所述期望特征类型之间的先验概率;
79.s22、根据所述用户特征类型之间的先验概率确定所述用户特征类型所属类别的用户特征概率,再根据所述期望特征类型之间的先验概确定所述期望特征类型所属类别的期望特征概率。
80.其中,所述预设的分类器可以为贝叶斯分类器,所述先验表示根据经验得到的期望特征属于某期望特征类别的概率。
81.例如,不同的保险代理人的入职时间y1有a种类型、放款件数y2有b种类型、有效放款件数y3有c种类型,则可以统计各个保险代理人对应的期望类型之间的组合概率为f=a*b*c。
82.s3、将所述历史用户特征集及所述历史期望特征集作为初始训练数据集,并识别所述历史用户特征集及所述历史期望特征集之间的关联关系,并根据所述关联关系、所述用户特征概率及所述期望特征概率将所述初始训练数据集进行扩展,得到新训练数据集,
合并所述初始训练数据集及所述新训练数据集作为目标训练数据集。
83.本发明实施例中,所述关联关系是指用户特征对应的期望特征之间的关系,比如,有一用户的多个特征为x1、x2、x3存在对应的多个期望特征为y1、y2、y3;所述目标训练集是指包括历史用户特征集、历史期望特征集及所有扩展的用户特征集及期望特征集。
84.本发明一实施例中,可以通过apriori算法识别历史用户特征集及历史期望特征集之间的关联关系。
85.本发明实施例通过识别所述历史用户特征集及所述历史期望特征集之间的关联关系,进一步加强了用户特征与多个期望特征之间的交互,并根据特征概率、关联关系扩展历史用户特征集及历史期望特征集的数据作为目标训练数据,即将相关联的用户特征与期望特征作为后续模型训练的数据集,便于提高后续模型的准确率。
86.作为本发明的一个实施例,参考图3所示,所述根据所述关联关系、所述用户特征概率及所述期望特征概率将所述初始训练数据集进行扩展,得到新训练数据集,包括以下步骤s31-s34:
87.s31、根据所述用户特征概率及所述期望特征概率生成初始新训练数据集;
88.s32、根据所述关联关系遍历所述初始新训练数据集中是否存在与历史用户特征集中相同的用户特征;
89.s33、当所述初始新训练数据集中不存在与历史用户特征集中相同的用户特征时,计算所述用户特征与所述历史用户特征集中历史用户特征的相似度,根据所述相似度从所述历史用户特征集中查与所述用户特征相匹配的历史用户特征对应的期望特征;
90.s34、将所述用户特征与所述用户特征对应的期望特征加入所述初始新训练数据集,得到所述新训练数据集。
91.其中,所述新训练数据集的权重由于基于用户特征概率及期望特征概率生成,可以在扩展新训练数据的同时保持和初始训练数据一样的权重。
92.本发明一实施例中,可以通过余弦相似度算法计算用户特征与历史用户特征集中历史用户特征的相似度。
93.具体地,对于新训练数据,通过遍历所述初始新训练数据集中是否存在与历史用户特征集中用户特征的x1,x2,

xn组合,若在历史数据样本中存在,就可以得到和y1,y2,y3具体组合的一条序列关系,若初始新训练数据集中不存在与历史用户特征集中相同的用户特征时,通过计算新训练数据中用户特征与所有历史用户特征的一对一的余弦相似度,到最接近的x组合,并与对应的历史期望特征y建立关联关系,实现训练数据的扩展。
94.本发明一实施例中,对于历史期望特征集的数据扩展与上述方式一致,即遍历所有历史期望特征集y1,y2,...yn,补全期望特征与历史用户特征集x的对应关系。
95.s4、从所述目标训练数据集中获取用户特征集对应的真实期望特征集,根据所述目标训练数据集及所述真实期望特征集对预设的增员模型进行训练,得到训练完成的增员模型。
96.本发明实施例中,所述预设的增员模型可以为时序transformer模型,该模型包括:嵌入层、编码层、解码层及损失函数。
97.本发明实施例通过根据所述目标训练数据集及所述真实期望特征集对预设的增员模型进行训练,可以通过用户特征集及多个期望特征训练该模型,在提高该模型准确率
的同时解决了需要多个模型融合才能得到候选人对应的所有期望指标的问题,提高了增员效率。
98.作为本发明的一个实施例,所述根据所述目标训练数据集及所述真实期望特征集对预设的增员模型进行训练,得到训练完成的增员模型,包括:
99.利用所述预设的增员模型中的嵌入层将所述目标训练数据集进行位置编码,得到训练数据时序向量,其中所述目标训练数据集包括用户特征集及期望特征集;利用所述增员模型中的编码层将所述训练数据时序向量进行编码,得到训练数据特征向量;利用所述增员模型中的解码层对所述训练数据特征向量进行解码,得到所述用户特征集的预测期望特征集;利用所述增员模型中的损失函数计算所述预测期望特征集和所述真实期望特征集的损失值,根据所述损失值调整所述增员模型的参数,直到所述损失值满足预设条件时,得到所述训练完成的增员模型。
100.其中,将目标训练数据集进行位置编码,可以得到包含数据时序信息的位置编码向量,且所述位置编码可以通过下述公式实现:
[0101][0102][0103]
其中,pe(t,2i)表示输入的目标训练数据集中t时刻第i维的位置编码向量,d
model
表示目标训练数据集进行位置编码的维度,t表示输入目标训练数据集的时刻,i表示输入目标训练数据集的长度。
[0104]
本发明一实施例中,通过编码层可以进一步的提取训练数据时序向量的重要信息,使得模型在训练过程中更加准确;所述损失函数可以为交叉熵函数;所述调整所述增员模型的参数可以通过随机下降梯度方法实现。
[0105]
进一步地,所述利用所述增员模型中的解码层对所述训练数据特征向量进行解码,得到所述用户特征集的预测期望特征集,包括:
[0106]
利用所述解码层中的多头注意力机制层对所述训练数据特征向量进行混合点积操作,得到训练数据关联特征向量;利用所述解码层中的正则层将所述训练数据关联特征向量进行解码,得到解码训练数据向量;将所述解码训练数据向量输入至解码层中的激活函数中输出所述所述用户特征集的的预测期望特征集。
[0107]
其中,所述混合点积操作更加关注局部的特征,以保证在后续操作中重要特征不会丢失,且由于多头注意力机制的作用,还可以使模型在不同的表示子空间中获得不同位置的相同输入的注意力信息,且该多头注意力机制可以并行计算,进而提高该模型的性能和训练速度。
[0108]
本发明一实施例中,在层与层的连接上,利用正则层替代一般的残接连接层,可以提高模型的收敛速度,且在解码过程中也能进一步提高模型的预测结果。
[0109]
本发明实施例中,所述激活函数可以为softmax激活函数。
[0110]
s5、获取待增员用户的候选用户特征集,并将所述候选用户特征集输入所述训练完成的增员模型中,得到所述候选用户特征集对应的目标期望特征集,根据所述目标期望
特征集对所述待增员用户进行增员决策,得到增员结果。
[0111]
本发明实施例中,所述待增员的用户候选集是指企业待招聘员工的相关个人信息,包括姓名、性别、年龄、户籍地址、离职原因、是否从事相关行业等。
[0112]
本发明一实施例中,通过将所述候选用户特征集输入所述训练完成的增员模型中可以得到相匹配的多个期望特征。
[0113]
比如,有一待招聘保险代理人从事相关行业三年,年龄为28周岁,则通过模型可以预估该代理入职之后的得到的目标期望特征可以为每个月的放款件数可以达到80件,放款额度也可以达到较高业务水平较高,可以将该代理人进行招聘。
[0114]
本发明实施例中,首先通过将历史用户特征集及历史期望特征集进行时序关系添加,同时确定用户特征与期望特征的特征时序,以增加特征之间的关联,并将历史用户时序特征集及历史期望时序特征集进行分类,统计用户特征类型之间组合的用户特征概率及期望特征类型之间组合的期望特征概率,能够统计期望特征之间的不同组合,确定各个期望特征对后续增员决策的影响程度,提高获取用户信息的质量,也便于提高后续增员质量;其次,通过识别所述历史用户特征集及所述历史期望特征集组合之间的关联关系,进一步加强了用户特征与多个期望特征之间的交互,并根据关联关系、所述用户特征概率及所述期望特征概率将所述初始训练数据集进行扩展,将得到扩展数据及历史数据作为训练数据集进行增员模型训练,在提高该模型准确率的同时解决了需要多个模型融合才能得到候选人对应的所有期望指标的问题,提高了增员效率;最后通过训练完成的模型输出与候选用户相匹配的目标期望特征,可以筛选出最匹配的候选用户,提高了增员质量。因此本发明实施例提出的基于时序模型的增员信息获取方法可以提高增员效率及增员质量。
[0115]
本发明所述基于时序模型的增员信息获取装置100可以安装于电子设备中。根据实现的功能,所述基于时序模型的增员信息获取装置可以包括用户与期望特征分类模块101、用户与期望特征统计模块102、训练数据生成模块103、增员模型训练模块104、增员决策模块105,本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
[0116]
在本实施例中,关于各模块/单元的功能如下:
[0117]
所述用户与期望特征分类模块101,用于获取历史用户特征集及历史期望特征集,分别将所述历史用户特征集及所述历史期望特征集进行时序关系添加,得到历史用户时序特征集及历史期望时序特征集,分别将所述历史用户时序特征集及所述历史期望时序特征集进行分类,得到用户特征类型及期望特征类型。
[0118]
本发明实施例中,所述历史用户特征集是指企业已招聘人员的相关个人信息,比如,已招聘的保险代理人的姓名、性别、年龄、户籍地址、工龄、离职原因以及一些面试信息(家庭情况、薪酬期望)等;所述历史期望特征集是指企业对已招聘人员的期望指标集,比如,保险代理人入职一段时间(如第三个月、半年)内达到的放款件数、有效放款件数及放款额度等。
[0119]
本发明实施例中,所述用户特征类型是指不同用户特征的信息类型,比如,有一用户特征为工龄,则对应的用户特征类型为1年、2年及3年等;所述期望特征类型是指不同期望特征的信息类型,比如,有一期望特征为保险代理人的放款件数,则对应的期望特征类型为5件、10件及20件等。
[0120]
本发明实施例中,通过通过将历史用户特征集及历史期望特征集进行时序关系添加,确定用户特征与期望特征的特征时序,获取用户特征对应的所有期望指标,提高用户信息的获取效率,还可以增加特征之间的关联,并将历史用户时序特征集及历史期望时序特征集进行分类,便于后续到用户特征最匹配的期望特征集。
[0121]
作为本发明的一个实施例,所述用户与期望特征分类模块101通过执行下述操作分别将所述历史用户特征集及所述历史期望特征集进行时序关系添加,得到历史用户时序特征集及历史期望时序特征集,包括:
[0122]
获取所述历史用户特征集及所述历史期望特征集中各特征的采集时间,将所述采集时间转换为标准格式,得到各特征的时间戳;
[0123]
分别将所述历史用户特征集之间及所述历史期望特征集之间存在时间关联的关联特征添加所述时间戳,并按照所述时间戳顺序将所述关联的特征分别表示为所述历史用户时序特征集及所述历史期望时序特征集。
[0124]
其中,所述时间戳是使用数字签名技术产生的时间数据,数字签名的对象可以包括历史用户特征集及所述历史期望特征集、签名参数、签名时间等信息,所述本地时间是本地存储的历史用户特征集之间及所述历史期望特征集的时间;所述标准格式可以为数据在本地存储的年月日及时间,例如,2022.6.30.16:00。
[0125]
本发明一实施例中,分别将所述历史用户特征集之间及所述历史期望特征集之间存在时间关联的特征添加所述时间戳,可以实时记录特征集的存储时间,还可以将特征之间按照时间戳顺序进行关联。
[0126]
例如,历史用户特征集为x1,x2,

,xn,通过添加时间戳可以明确,x1先于x3发生,;有一历史期望特征集为y1,y2,y3则通过时间戳顺序我们可以明确y1先于y2先于y3发生,即有一期望特征y1为放款件数、y2为有效放款件数、y3为有效放款额度,这些特征之间是存在时间关联的。
[0127]
进一步地,所述分别将所述历史用户时序特征集及所述历史期望时序特征集进行分类,得到用户特征类型及期望特征类型,包括:
[0128]
获取所述历史用户时序特征集的用户维度及用户类标签,以及获取所述历史期望时序特征集的期望维度及期望类标签;分别将所述用户维度及所述期望维度进行降维,得到低维历史用户特征集及低维历史期望特征集;根据所述用户类标签将所述低维历史用户特征集进行离散化,得到所述用户特征类型;根据所述期望类标签将所述低维历史期望特征集进行离散化,得到所述期望特征类型。
[0129]
其中,所述用户维度是指历史用户时序特征集的维度;所述期望维度是指历史期望时序特征集的维度,可以通过局部线性嵌入算法对用户维度及期望维度进行降维,使得降维后的低维空间中数据不同类之间距离有较好的可分性,还可以保持高维空间特征之间的权值关系。
[0130]
本发明一实施例中,所述用户类标签是指历史用户时序特征集中每个特征的类别标签,比如用户时序特征集中有一特征为x1,则对应的用户类标签有a种类型;所述期望类标签是指历史期望时序特征集中每个特征的类别标签,比如期望时序特征集中有y1,y2,y3连续变量,则对应的期望类标签为y1有d种类型、y2有e种类型、y3有f种类型。
[0131]
本发明实施例中,由于历史用户时序特征集及历史期望时序特征集都为连续型变
量,且不同特征之间存在关联关系,所以可以根据实际场景需求通过ille-hd3算法将特征进行离散化,实现特征的分类。
[0132]
例如,历史期望时序特征集中包括保险代理人入职一段时间内达到的放款件数、有效放款件数及放款额度,通过分类可以得到保险代理人a对应的期望特征d1类为入职三个月内、e1类达到的放款件数为100件、f1类有效件数为70件。
[0133]
所述用户与期望特征统计模块102,用于分别统计所述用户特征类型之间组合的用户特征概率及所述期望特征类型之间组合的期望特征概率。
[0134]
本发明实施例中,所述用户特征概率是指用户特征之间的组合概率。所述期望特征概率是指期望特征之间的组合概率。
[0135]
本发明实施例通过分别统计所述用户特征类型之间组合的用户特征概率及所述期望特征类型之间组合的期望特征概率,可以确定每个期望特征对后续增员决策的影响程度,提高获取用户信息的质量,也便于提高后续增员质量。
[0136]
作为本发明的一个实施例,所述用户与期望特征统计模块102通过执行下述操作分别统计所述用户特征类型之间组合的用户特征概率及所述期望特征类型之间组合的期望特征概率,包括:
[0137]
利用预设的分类器将所述用户特征类型及所述期望特征类型分别进行用户分类及期望分类,得到所述用户特征类型之间的先验概率及所述期望特征类型之间的先验概率;
[0138]
根据所述用户特征类型之间的先验概率确定所述用户特征类型所属类别的用户特征概率,再根据所述期望特征类型之间的先验概确定所述期望特征类型所属类别的期望特征概率。
[0139]
其中,所述预设的分类器可以为贝叶斯分类器,所述先验表示根据经验得到的期望特征属于某期望特征类别的概率。
[0140]
例如,不同的保险代理人的入职时间y1有a种类型、放款件数y2有b种类型、有效放款件数y3有c种类型,则可以统计各个保险代理人对应的期望类型之间的组合概率为f=a*b*c。
[0141]
所述训练数据生成模块103,用于将所述历史用户特征集及所述历史期望特征集作为初始训练数据集,并识别所述历史用户特征集及所述历史期望特征集之间的关联关系,并根据所述关联关系、所述用户特征概率及所述期望特征概率将所述初始训练数据集进行扩展,得到新训练数据集,合并所述初始训练数据集及所述新训练数据集作为目标训练数据集。
[0142]
本发明实施例中,所述关联关系是指用户特征对应的期望特征之间的关系,比如,有一用户的多个特征为x1、x2、x3存在对应的多个期望特征为y1、y2、y3;所述目标训练集是指包括历史用户特征集、历史期望特征集及所有扩展的用户特征集及期望特征集。
[0143]
本发明一实施例中,可以通过apriori算法识别历史用户特征集及历史期望特征集之间的关联关系。
[0144]
本发明实施例通过识别所述历史用户特征集及所述历史期望特征集之间的关联关系,进一步加强了用户特征与多个期望特征之间的交互,并根据特征概率、关联关系扩展历史用户特征集及历史期望特征集的数据作为目标训练数据,即将相关联的用户特征与期
望特征作为后续模型训练的数据集,便于提高后续模型的准确率。
[0145]
作为本发明的一个实施例,所述训练数据生成模块103通过执行下述操作根据所述关联关系、所述用户特征概率及所述期望特征概率将所述初始训练数据集进行扩展,得到新训练数据集,包括:
[0146]
根据所述用户特征概率及所述期望特征概率生成初始新训练数据集;
[0147]
根据所述关联关系遍历所述初始新训练数据集中是否存在与历史用户特征集中相同的用户特征;
[0148]
当所述初始新训练数据集中不存在与历史用户特征集中相同的用户特征时,计算所述用户特征与所述历史用户特征集中历史用户特征的相似度,根据所述相似度从所述历史用户特征集中查与所述用户特征相匹配的历史用户特征对应的期望特征;
[0149]
将所述用户特征与所述用户特征对应的期望特征加入所述初始新训练数据集,得到所述新训练数据集。
[0150]
其中,所述新训练数据集的权重由于基于用户特征概率及期望特征概率生成,可以在扩展新训练数据的同时保持和初始训练数据一样的权重。
[0151]
本发明一实施例中,可以通过余弦相似度算法计算用户特征与历史用户特征集中历史用户特征的相似度。
[0152]
具体地,对于新训练数据,通过遍历所述初始新训练数据集中是否存在与历史用户特征集中用户特征的x1,x2,

xn组合,若在历史数据样本中存在,就可以得到和y1,y2,y3具体组合的一条序列关系,若初始新训练数据集中不存在与历史用户特征集中相同的用户特征时,通过计算新训练数据中用户特征与所有历史用户特征的一对一的余弦相似度,到最接近的x组合,并与对应的历史期望特征y建立关联关系,实现训练数据的扩展。
[0153]
本发明一实施例中,对于历史期望特征集的数据扩展与上述方式一致,即遍历所有历史期望特征集y1,y2,...yn,补全期望特征与历史用户特征集x的对应关系。
[0154]
所述增员模型训练模块104,用于从所述目标训练数据集中获取用户特征集对应的真实期望特征集,根据所述目标训练数据集及所述真实期望特征集对预设的增员模型进行训练,得到训练完成的增员模型。
[0155]
本发明实施例中,所述预设的增员模型可以为时序transformer模型,该模型包括:嵌入层、编码层、解码层及损失函数。
[0156]
本发明实施例通过根据所述目标训练数据集及所述真实期望特征集对预设的增员模型进行训练,可以通过用户特征集及多个期望特征训练该模型,在提高该模型准确率的同时解决了需要多个模型融合才能得到候选人对应的所有期望指标的问题,提高了增员效率。
[0157]
作为本发明的一个实施例,所述增员模型训练模块104通过执行下述操作根据所述目标训练数据集及所述真实期望特征集对预设的增员模型进行训练,得到训练完成的增员模型,包括:
[0158]
利用所述预设的增员模型中的嵌入层将所述目标训练数据集进行位置编码,得到训练数据时序向量,其中所述目标训练数据集包括用户特征集及期望特征集;
[0159]
利用所述增员模型中的编码层将所述训练数据时序向量进行编码,得到训练数据特征向量;
[0160]
利用所述增员模型中的解码层对所述训练数据特征向量进行解码,得到所述用户特征集的预测期望特征集;
[0161]
利用所述增员模型中的损失函数计算所述预测期望特征集和所述真实期望特征集的损失值,根据所述损失值调整所述增员模型的参数,直到所述损失值满足预设条件时,得到所述训练完成的增员模型。
[0162]
其中,将目标训练数据集进行位置编码,可以得到包含数据时序信息的位置编码向量,且所述位置编码可以通过下述公式实现:
[0163][0164][0165]
其中,pe(t,2i)表示输入的目标训练数据集中t时刻第i维的位置编码向量,d
model
表示目标训练数据集进行位置编码的维度,t表示输入目标训练数据集的时刻,i表示输入目标训练数据集的长度。
[0166]
本发明一实施例中,通过编码层可以进一步的提取训练数据时序向量的重要信息,使得模型在训练过程中更加准确;所述损失函数可以为交叉熵函数;所述调整所述增员模型的参数可以通过随机下降梯度方法实现。
[0167]
进一步地,所述利用所述增员模型中的解码层对所述训练数据特征向量进行解码,得到所述用户特征集的预测期望特征集,包括:利用所述解码层中的多头注意力机制层对所述训练数据特征向量进行混合点积操作,得到训练数据关联特征向量;利用所述解码层中的正则层将所述训练数据关联特征向量进行解码,得到解码训练数据向量;将所述解码训练数据向量输入至解码层中的激活函数中输出所述所述用户特征集的的预测期望特征集。
[0168]
其中,所述混合点积操作更加关注局部的特征,以保证在后续操作中重要特征不会丢失,且由于多头注意力机制的作用,还可以使模型在不同的表示子空间中获得不同位置的相同输入的注意力信息,且该多头注意力机制可以并行计算,进而提高该模型的性能和训练速度。
[0169]
本发明一实施例中,在层与层的连接上,利用正则层替代一般的残接连接层,可以提高模型的收敛速度,且在解码过程中也能进一步提高模型的预测结果。
[0170]
本发明实施例中,所述激活函数可以为softmax激活函数。
[0171]
所述增员决策模块105,用于获取待增员用户的候选用户特征集,并将所述候选用户特征集输入所述训练完成的增员模型中,得到所述候选用户特征集对应的目标期望特征集,根据所述目标期望特征集对所述待增员用户进行增员决策,得到增员结果。
[0172]
本发明实施例中,所述待增员的用户候选集是指企业待招聘员工的相关个人信息,包括姓名、性别、年龄、户籍地址、离职原因、是否从事相关行业等。
[0173]
本发明一实施例中,通过将所述候选用户特征集输入所述训练完成的增员模型中可以得到相匹配的多个期望特征。
[0174]
比如,有一待招聘保险代理人从事相关行业三年,年龄为28周岁,则通过模型可以
预估该代理入职之后的得到的目标期望特征可以为每个月的放款件数可以达到80件,放款额度也可以达到较高业务水平较高,可以将该代理人进行招聘。
[0175]
本发明实施例中,首先通过将历史用户特征集及历史期望特征集进行时序关系添加,同时确定用户特征与期望特征的特征时序,以增加特征之间的关联,并将历史用户时序特征集及历史期望时序特征集进行分类,统计用户特征类型之间组合的用户特征概率及期望特征类型之间组合的期望特征概率,能够统计期望特征之间的不同组合,确定各个期望特征对后续增员决策的影响程度,提高获取用户信息的质量,也便于提高后续增员质量;其次,通过识别所述历史用户特征集及所述历史期望特征集组合之间的关联关系,进一步加强了用户特征与多个期望特征之间的交互,并根据关联关系、所述用户特征概率及所述期望特征概率将所述初始训练数据集进行扩展,将得到扩展数据及历史数据作为训练数据集进行增员模型训练,在提高该模型准确率的同时解决了需要多个模型融合才能得到候选人对应的所有期望指标的问题,提高了增员效率;最后通过训练完成的模型输出与候选用户相匹配的目标期望特征,可以筛选出最匹配的候选用户,提高了增员质量。因此本发明实施例提出的基于时序模型的增员信息获取装置可以提高增员效率及增员质量。
[0176]
如图5所示,是本发明实现基于时序模型的增员信息获取方法的电子设备的结构示意图。
[0177]
所述电子设备可以包括处理器10、存储器11、通信总线12和通信接口13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如基于时序模型的增员信息获取程序。
[0178]
其中,所述存储器11至少包括一种类型的介质,所述介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:sd或dx存储器等)、磁性存储器、本地磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(smart media card,smc)、安全数字(secure digital,sd)卡、闪存卡(flash card)等。进一步地,所述存储器11还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备的应用软件及各类数据,例如基于时序模型的增员信息获取程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
[0179]
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(central processing unit,cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(control unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如基于时序模型的增员信息获取程序等),以及调用存储在所述存储器11内的数据,以执行电子设备的各种功能和处理数据。
[0180]
所述通信总线12可以是外设部件互连标准(peripheral component interconnect,简称pci)总线或扩展工业标准结构(extended industry standard architecture,简称eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述通信总线12总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。为
便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0181]
图5仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图5示出的结构并不构成对所述电子设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
[0182]
例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、wi-fi模块等,在此不再赘述。
[0183]
可选地,所述通信接口13可以包括有线接口和/或无线接口(如wi-fi接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。
[0184]
可选地,所述通信接口13还可以包括用户接口,用户接口可以是显示器(display)、输入单元(比如键盘(keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organic light-emitting diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
[0185]
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
[0186]
所述电子设备中的所述存储器11存储的基于时序模型的增员信息获取程序是多个计算机程序的组合,在所述处理器10中运行时,可以实现:
[0187]
获取历史用户特征集及历史期望特征集,分别将所述历史用户特征集及所述历史期望特征集进行时序关系添加,得到历史用户时序特征集及历史期望时序特征集,分别将所述历史用户时序特征集及所述历史期望时序特征集进行分类,得到用户特征类型及期望特征类型;
[0188]
分别统计所述用户特征类型之间组合的用户特征概率及所述期望特征类型之间组合的期望特征概率;
[0189]
将所述历史用户特征集及所述历史期望特征集作为初始训练数据集,并识别所述历史用户特征集及所述历史期望特征集之间的关联关系,并根据所述关联关系、所述用户特征概率及所述期望特征概率将所述初始训练数据集进行扩展,得到新训练数据集,合并所述初始训练数据集及所述新训练数据集作为目标训练数据集;
[0190]
从所述目标训练数据集中获取用户特征集对应的真实期望特征集,根据所述目标训练数据集及所述真实期望特征集对预设的增员模型进行训练,得到训练完成的增员模型;
[0191]
获取待增员用户的候选用户特征集,并将所述候选用户特征集输入所述训练完成的增员模型中,得到所述候选用户特征集对应的目标期望特征集,根据所述目标期望特征集对所述待增员用户进行增员决策,得到增员结果。
[0192]
具体地,所述处理器10对上述计算机程序的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
[0193]
进一步地,所述电子设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取介质中。所述计算机可读介质可以是非易失性的,也可以是易失性的。所述计算机可读介质可以包括:能够携待所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)。
[0194]
本发明实施例还可以提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
[0195]
获取历史用户特征集及历史期望特征集,分别将所述历史用户特征集及所述历史期望特征集进行时序关系添加,得到历史用户时序特征集及历史期望时序特征集,分别将所述历史用户时序特征集及所述历史期望时序特征集进行分类,得到用户特征类型及期望特征类型;
[0196]
分别统计所述用户特征类型之间组合的用户特征概率及所述期望特征类型之间组合的期望特征概率;
[0197]
将所述历史用户特征集及所述历史期望特征集作为初始训练数据集,并识别所述历史用户特征集及所述历史期望特征集之间的关联关系,并根据所述关联关系、所述用户特征概率及所述期望特征概率将所述初始训练数据集进行扩展,得到新训练数据集,合并所述初始训练数据集及所述新训练数据集作为目标训练数据集;
[0198]
从所述目标训练数据集中获取用户特征集对应的真实期望特征集,根据所述目标训练数据集及所述真实期望特征集对预设的增员模型进行训练,得到训练完成的增员模型;
[0199]
获取待增员用户的候选用户特征集,并将所述候选用户特征集输入所述训练完成的增员模型中,得到所述候选用户特征集对应的目标期望特征集,根据所述目标期望特征集对所述待增员用户进行增员决策,得到增员结果。
[0200]
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
[0201]
在本发明所提供的几个实施例中,应该理解到,所揭露的介质、设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0202]
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0203]
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
[0204]
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
[0205]
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本
发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
[0206]
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
[0207]
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
[0208]
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

技术特征:


1.一种基于时序模型的增员信息获取方法,其特征在于,所述方法包括:获取历史用户特征集及历史期望特征集,分别将所述历史用户特征集及所述历史期望特征集进行时序关系添加,得到历史用户时序特征集及历史期望时序特征集,分别将所述历史用户时序特征集及所述历史期望时序特征集进行分类,得到用户特征类型及期望特征类型;分别统计所述用户特征类型之间组合的用户特征概率及所述期望特征类型之间组合的期望特征概率;将所述历史用户特征集及所述历史期望特征集作为初始训练数据集,并识别所述历史用户特征集及所述历史期望特征集之间的关联关系,并根据所述关联关系、所述用户特征概率及所述期望特征概率将所述初始训练数据集进行扩展,得到新训练数据集,合并所述初始训练数据集及所述新训练数据集作为目标训练数据集;从所述目标训练数据集中获取用户特征集对应的真实期望特征集,根据所述目标训练数据集及所述真实期望特征集对预设的增员模型进行训练,得到训练完成的增员模型;获取待增员用户的候选用户特征集,并将所述候选用户特征集输入所述训练完成的增员模型中,得到所述候选用户特征集对应的目标期望特征集,根据所述目标期望特征集对所述待增员用户进行增员决策,得到增员结果。2.如权利要求1所述的基于时序模型的增员信息获取方法,其特征在于,所述根据所述关联关系、所述用户特征概率及所述期望特征概率将所述初始训练数据集进行扩展,得到新训练数据集,包括:根据所述用户特征概率及所述期望特征概率生成初始新训练数据集;根据所述关联关系遍历所述初始新训练数据集中是否存在与历史用户特征集中相同的用户特征;当所述初始新训练数据集中不存在与历史用户特征集中相同的用户特征时,计算所述用户特征与所述历史用户特征集中历史用户特征的相似度,根据所述相似度从所述历史用户特征集中查与所述用户特征相匹配的历史用户特征对应的期望特征;将所述用户特征与所述用户特征对应的期望特征加入所述初始新训练数据集,得到所述新训练数据集。3.如权利要求1所述的基于时序模型的增员信息获取方法,其特征在于,所述分别统计所述用户特征类型之间组合的用户特征概率及所述期望特征类型之间组合的期望特征概率,包括:利用预设的分类器将所述用户特征类型及所述期望特征类型分别进行用户分类及期望分类,得到所述用户特征类型之间的先验概率及所述期望特征类型之间的先验概率;根据所述用户特征类型之间的先验概率确定所述用户特征类型所属类别的用户特征概率,再根据所述期望特征类型之间的先验概确定所述期望特征类型所属类别的期望特征概率。4.如权利要求1所述的基于时序模型的增员信息获取方法,其特征在于,所述分别将所述历史用户时序特征集及所述历史期望时序特征集进行分类,得到用户特征类型及期望特征类型,包括:获取所述历史用户时序特征集的用户维度用户类标签,以及获取所述历史期望时序特
征集的期望类标签;分别将所述用户维度及所述期望维度进行降维,得到低维历史用户特征集及低维历史期望特征集;根据所述用户类标签将所述低维历史用户特征集进行离散化,得到所述用户特征类型;根据所述期望类标签将所述低维历史期望特征集进行离散化,得到所述期望特征类型。5.如权利要求1所述的基于时序模型的增员信息获取方法,其特征在于,所述根据所述目标训练数据集及所述真实期望特征集对预设的增员模型进行训练,得到训练完成的增员模型,包括:利用所述预设的增员模型中的嵌入层将所述目标训练数据集进行位置编码,得到训练数据时序向量,其中所述目标训练数据集包括用户特征集及期望特征集;利用所述增员模型中的编码层将所述训练数据时序向量进行编码,得到训练数据特征向量;利用所述增员模型中的解码层对所述训练数据特征向量进行解码,得到所述用户特征集的预测期望特征集;利用所述增员模型中的损失函数计算所述预测期望特征集和所述真实期望特征集的损失值,根据所述损失值调整所述增员模型的参数,直到所述损失值满足预设条件时,得到所述训练完成的增员模型。6.如权利要求5所述的基于时序模型的增员信息获取方法,其特征在于,所述利用所述增员模型中的解码层对所述训练数据特征向量进行解码,得到所述用户特征集的预测期望特征集,包括:利用所述解码层中的多头注意力机制层对所述训练数据特征向量进行混合点积操作,得到训练数据关联特征向量;利用所述解码层中的正则层将所述训练数据关联特征向量进行解码,得到解码训练数据向量;将所述解码训练数据向量输入至解码层中的激活函数中输出所述所述用户特征集的的预测期望特征集。7.如权利要求1至6中任一项所述的基于时序模型的增员信息获取方法,其特征在于,所述分别将所述历史用户特征集及所述历史期望特征集进行时序关系添加,得到历史用户时序特征集及历史期望时序特征集,包括:获取所述历史用户特征集及所述历史期望特征集中各特征的采集时间,将所述采集时间转换为标准格式,得到各特征的时间戳;分别将所述历史用户特征集之间及所述历史期望特征集之间存在时间关联的关联特征添加所述时间戳,并按照所述时间戳顺序将所述关联的特征分别表示为所述历史用户时序特征集及所述历史期望时序特征集。8.一种基于时序模型的增员信息获取装置,其特征在于,所述装置包括:用户与期望特征分类模块,用于获取历史用户特征集及历史期望特征集,分别将所述历史用户特征集及所述历史期望特征集进行时序关系添加,得到历史用户时序特征集及历
史期望时序特征集,分别将所述历史用户时序特征集及所述历史期望时序特征集进行分类,得到用户特征类型及期望特征类型;用户与期望特征统计模块,用于分别统计所述用户特征类型之间组合的用户特征概率及所述期望特征类型之间组合的期望特征概率;训练数据生成模块,用于将所述历史用户特征集及所述历史期望特征集作为初始训练数据集,并识别所述历史用户特征集及所述历史期望特征集之间的关联关系,并根据所述关联关系、所述用户特征概率及所述期望特征概率将所述初始训练数据集进行扩展,得到新训练数据集,合并所述初始训练数据集及所述新训练数据集作为目标训练数据集;增员模型训练模块,用于从所述目标训练数据集中获取用户特征集对应的真实期望特征集,根据所述目标训练数据集及所述真实期望特征集对预设的增员模型进行训练,得到训练完成的增员模型;增员决策模块,用于获取待增员用户的候选用户特征集,并将所述候选用户特征集输入所述训练完成的增员模型中,得到所述候选用户特征集对应的目标期望特征集,根据所述目标期望特征集对所述待增员用户进行增员决策,得到增员结果。9.一种电子设备,其特征在于,所述电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一项所述的基于时序模型的增员信息获取方法。10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于时序模型的增员信息获取方法。

技术总结


本发明涉及人工智能领域,揭露一种基于时序模型的增员信息获取方法,包括:将历史用户特征集及历史期望特征集进行时序关系添加及分类,以统计用户特征类型组合的用户特征概率及期望特征类型组合的期望特征概率;识别历史用户特征集及历史期望特征集之间的关联关系,并根据关联关系、用户特征概率及期望特征概率将初始训练数据集进行扩展,将得到扩展数据及历史数据作为训练数据集进行增员模型训练;通过训练完成的增员模型输出与候选用户相匹配的目标期望特征。本发明还涉及一种区块链技术,用户特征集及期望特征集可存储在区块链节点中。本发明还提出一种基于时序模型的增员信息获取装置、设备以及介质。本发明可以提高增员效率及增员质量。员效率及增员质量。员效率及增员质量。


技术研发人员:

任杰 张莉

受保护的技术使用者:

平安科技(深圳)有限公司

技术研发日:

2022.09.29

技术公布日:

2022/12/22

本文发布于:2024-09-24 11:32:15,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/47362.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   特征   用户   时序
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议