基于子空间投影神经网络的点击率预估方法和装置



1.本技术涉及人工智能技术领域,尤其涉及基于子空间投影神经网络的点击率预估方法和装置。


背景技术:



2.随着互联网的不断发展与进步,网络中物品和广告数量快速增加,用户在浏览各式各样的网站时面临信息过载的问题,如无法通过浏览电子商务网站中的所有候选物品到自己感兴趣的物品。对于服务提供商来说,为用户提供更符合用户兴趣爱好的物品可提高用户的在线时长和用户营收。在此背景下,推荐系统应运而生。推荐系统的主要任务是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息生产者和信息消费者的双赢。
3.在推荐系统中,点击率(click-through rate,ctr)预估,也称ctr预估,是非常重要的组成部分。给定一些物品,称为候选集,点击率预估可以估计出用户点击各个物品的概率,将用户最可能点击的物品排在前面,提高命中率。在点击率预估任务中,含有大量的离散化特征和连续性特征,该任务的主要工作都聚焦于如何对特征进行高效快速交叉并从中提取有效信息。目前点击率预估方法主要有两种方案:(1)基于因子分解机(fm,factorization machine)及其变种的特征交叉方案;(2)基于注意力机制的特征交叉方案。
4.基于fm及其变种的特征交叉方案:利用fm技术,通过将每个域中的离散特征转换为连续特征向量,并利用不同特征向量的内积作为相应两个特征间的权重,可解决特征过多导致的特征组合数量指数爆炸的问题。后续很多相关工作在fm的基础上提出并对fm进行改进,如ffm为不同域分配不同的嵌入向量矩阵,fwfm通过考虑域间特征交互强度进行优化改进,fmfm扩展了交互矩阵并使用可变嵌入维数减少参数量。
5.基于注意力机制的特征交叉方案:该方法利用自然语言处理和计算机视觉中的注意力机制对大量特征进行处理,如fibinet模型使用了计算机视觉中的senet模型建模不同特征向量的重要度,autoint模型和frnet模型使用自然语言处理中的多头注意力机制对特征间的交叉进行了建模。
6.方案1采用特征的二阶交叉信息来提取用户信息,给用户进行推荐。该方法在点击率预估任务上忽略了用户和物品特征中的高阶特征交叉信息的重要程度,导致高阶信息无法有效整合和提取,具有一定的局限性。
7.方案2采用了深度学习领域中基于注意力机制的方法,能更好捕捉特征交叉信息,并且不同特征交叉之间独立建模,可捕捉高阶特征交叉信息。但该方案对高阶特征交叉信息的捕捉不全面,存在信息提取不准确的问题。


技术实现要素:



8.本技术旨在至少在一定程度上解决相关技术中的技术问题之一。
9.为此,本技术的第一个目的在于提出一种基于子空间投影神经网络的点击率预估
方法,解决了现有方法对高阶信息无法有效整合和提取,具有一定局限性,进而导致存在信息提取不准确的技术问题,实现了端到端为用户提供个性化精确推荐。
10.本技术的第二个目的在于提出一种基于子空间投影神经网络的点击率预估装置。
11.本技术的第三个目的在于提出一种计算机设备。
12.为达上述目的,本技术第一方面实施例提出了一种基于子空间投影神经网络的点击率预估方法,包括:采集用户数据;对用户数据进行特征处理,得到用户特征,其中,特征处理包括归一化处理、离散化处理、未知值处理;将用户特征输入训练好的深度神经网络模型中,输出用户点击物品概率的预测结果,其中,深度神经网络模型由logloss损失函数进行训练生成;根据预测结果对物品候选集进行筛选,得到最终推荐结果。
13.本技术实施例的基于子空间投影神经网络的点击率预估方法,通过信息采集部分获取各类特征,并通过特征处理部分对原始特征进行处理以适配神经网络的输入,再通过概率预测部分对输入的特征进行点击率预估,最后通过个性化推荐部分对结果进行进一步优化,为用户提供个性化精确推荐。
14.可选地,在本技术的一个实施例中,用户数据包括痕迹数据、特征数据,痕迹数据为用户在当前平台浏览信息时产生的历史行为记录,特征数据为用户填写的用户自身信息,对用户数据进行特征处理,包括:
15.对连续特征的异常值进行归一化;
16.对稀疏的类别型特征进行离散化并转换成相应的id;
17.采集缺失的特征,并为缺失值赋予特定id,其中,特定id与普通id不同。
18.可选地,在本技术的一个实施例中,深度神经网络模型包括嵌入层、子空间投影层、深度层,logloss损失函数表示为:
[0019][0020]
其中,n表示样本数,yi表示真实标签,表示模型预测结果。
[0021]
可选地,在本技术的一个实施例中,将用户特征输入嵌入层进行特征嵌入,包括:
[0022]
将用户特征中的稀疏特征、数值特征转换为稠密向量;
[0023]
将不同域的稠密特征向量进行拼接,得到特征拼接向量作为嵌入层的输出;
[0024]
其中,稀疏特征转换生成的稠密向量表示为:
[0025]ei
=wixi[0026]
其中,wi表示特征域权重矩阵,xi表示特征域的one-hot向量;
[0027]
数值特征转换生成的稠密向量表示为:
[0028]ej
=vjxj[0029]
其中,vj表示数值特征域对应的特征向量,xj表示特征域的具体数值;
[0030]
所述特征拼接向量表示为:
[0031]
e=[e1,e2,

,ef]
[0032]
其中,e表示拼接后的向量,e表示各个域的特征向量,ef表示第f个域的特征向量。
[0033]
可选地,在本技术的一个实施例中,每个子空间投影层中并行堆叠多个不同的子空间,将特征拼接向量输入子空间投影层进行特征交互,包括:
[0034]
将正交投影矩阵进行分解,得到分解向量;
[0035]
对分解向量增加偏置并使用激活函数,得到投影后的向量;
[0036]
将所有不同的子空间投影向量进行拼接,得到子空间投影层的输出,
[0037]
其中,所述将正交投影矩阵进行分解,表示为:
[0038]
p=pdpc[0039]
pd=w(w
t
w)-1/2
[0040]
pc=(w
t
w)-1/2wt
[0041]
其中,pd表示将投影向量映射回原始的d维空间中,pc表示将x映射到c维的子空间中,w(w
t
w)-1wt
表示正交投影矩阵,w表示子空间基向量权重矩阵,w
t
w的根的计算方式为:
[0042]yk+1
=0.5*yk(3i-zkyk)
[0043]zk+1
=0.5*(3i-zkyk)zk[0044]
其中,k代表迭代轮数,i表示单位矩阵,yk表示上轮迭代产生的第一临时计算结果,yk表示本轮迭代产生的第一临时计算结果,y0=a,a表示初始矩阵,zk表示上轮迭代产生的第二临时结果,zk表示本轮迭代产生的第二临时计算结果,z0=i,
[0045]
所述投影后的向量表示为:
[0046]
t=pcx
[0047]
其中,x表示嵌入层向量或上一层子空间投影层的结果向量;
[0048]
所述投影后的向量表示为:
[0049]
u=φ(t+b)
[0050]
其中,φ表示激活函数,b表示偏置;
[0051]
所述子空间投影层的输出表示为:
[0052][0053]
其中,ui表示第i个子空间的投影向量。
[0054]
可选地,在本技术的一个实施例中,深度层包括多层全连接层,将子空间投影层的输出输入深度层中进行特征捕捉,包括:
[0055]
将子空间投影层的输出输入全连接层,得到中间结果;
[0056]
使用激活函数对中间结果进行处理,得到用户点击当前物品的概率。
[0057]
可选地,在本技术的一个实施例中,根据预测结果对物品候选集进行筛选,得到最终推荐结果,包括:
[0058]
去除物品候选集中用户已经点击或浏览过的物品;
[0059]
根据预测结果,使用桶排序算法在线性时间内对物品进行排序,得到物品顺序;
[0060]
按照物品顺序将多个相邻的同一类别的物品分散,得到最终物品顺序;
[0061]
按照最终物品顺序在浏览页面上展示物品,得到最终推荐结果。
[0062]
为达上述目的,本发明第二方面实施例提出了一种基于子空间投影神经网络的点击率预估装置,包括信息采集模块、特征处理模块、概率预测模块、个性化推荐模块,其中,
[0063]
信息采集模块,用于采集用户数据;
[0064]
特征处理模块,用于对用户数据进行特征处理,得到用户特征,其中,特征处理包括归一化处理、离散化处理、未知值处理;
[0065]
概率预测模块,用于将用户特征输入训练好的深度神经网络模型中,输出用户点击物品概率的预测结果,其中,深度神经网络模型由logloss损失函数进行训练生成;
[0066]
个性化推荐模块,用于根据预测结果对物品候选集进行筛选,得到最终推荐结果。
[0067]
可选地,在本技术的一个实施例中,根据预测结果对物品候选集进行筛选,得到最终推荐结果,包括:
[0068]
去除物品候选集中用户已经点击或浏览过的物品;
[0069]
根据预测结果,使用桶排序算法在线性时间内对物品进行排序,得到物品顺序;
[0070]
按照物品顺序将多个相邻的同一类别的物品分散,得到最终物品顺序;
[0071]
按照最终物品顺序在浏览页面上展示物品,得到最终推荐结果。
[0072]
为达上述目的,本发明第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现上述基于子空间投影神经网络的点击率预估方法。
[0073]
本技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到。
附图说明
[0074]
本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0075]
图1为本技术实施例一所提供的一种基于子空间投影神经网络的点击率预估方法的流程示意图;
[0076]
图2为本技术实施例的总体方案架构图;
[0077]
图3为本技术实施例的基于子空间投影的深度神经网络结构图;
[0078]
图4为本技术实施例的子空间投影示例图;
[0079]
图5为本技术实施例提供的一种基于子空间投影神经网络的点击率预估装置的结构示意图。
具体实施方式
[0080]
下面详细描述本技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本技术,而不能理解为对本技术的限制。
[0081]
下面参考附图描述本技术实施例的基于子空间投影神经网络的点击率预估方法和装置。
[0082]
图1为本技术实施例一所提供的一种基于子空间投影神经网络的点击率预估方法的流程示意图。
[0083]
如图1所示,该基于子空间投影神经网络的点击率预估方法包括以下步骤:
[0084]
步骤101,采集用户数据;
[0085]
步骤102,对用户数据进行特征处理,得到用户特征,其中,特征处理包括归一化处理、离散化处理、未知值处理;
[0086]
步骤103,将用户特征输入训练好的深度神经网络模型中,输出用户点击物品概率
的预测结果,其中,深度神经网络模型由logloss损失函数进行训练生成;
[0087]
步骤104,根据预测结果对物品候选集进行筛选,得到最终推荐结果。
[0088]
本技术实施例的基于子空间投影神经网络的点击率预估方法,如图2所示,首先通过信息采集部分获取各类特征,并通过特征处理部分对原始特征进行处理以适配神经网络的输入,再通过概率预测部分对输入的特征进行点击率预估,最后通过个性化推荐部分对结果进行进一步优化,为用户提供个性化精确推荐。
[0089]
可选地,在本技术的一个实施例中,信息采集部分是推荐领域中点击率预估最基础的阶段,是保证推荐效果的重要组成部分。点击率预估依赖用户物品的各种特征,这些特征对于建模用户点击某个物品的概率不可或缺。不同于普通推荐系统的简单特征采集,本方案在简单特征的基础上,给用户标注兴趣标签、用户画像等信息,同时给物品进行不同层级类别的分类,为用户和物品捕捉尽可能多的特征。
[0090]
信息采集部分主要包括两方面:痕迹数据、特征数据。
[0091]
痕迹数据主要指用户在当前平台浏览信息时留下的历史行为记录,这些数据在用户浏览各种物品时产生,包括用户的浏览记录、评论留言、时间戳、浏览时长等。这些历史行为痕迹数据记录了用户过去一段时间内的各种信息,同时隐含了用户的短期和长期历史兴趣,对于向用户提供精确的推荐结果具有重要意义。
[0092]
特征数据不仅包括用户的统计信息(性别、地理位置、年龄、注册时间等),也包括物品的统计信息(价格、日点击量、用户平均浏览时长、上线时间等)。这些信息来源于用户自己填写或者物品提供者填写的信息,对于点击率预估任务非常关键。同时为了更好捕捉用户体性特征,会对用户进行聚类并打上相关的标签作为用户画像,同样会给物品打上多级标签,这些特征可以提高点击率预估的准确性。
[0093]
特征处理部分主要是为了处理信息采集部分中复杂多样的特征,便于神经网络模型输入和计算。特征处理部分主要包含三个部分:归一化处理模块、离散化处理模块、缺失值处理模块。归一化处理模块处理连续特征中的异常值,部分特征如用户浏览时长的最大值和最小值间存在巨大差距,不进行有效处理会影响模型的预测效果。离散化模块主要处理稀疏的类别型特征,这类特征不能直接输入至深度神经网络中进行计算,需要进行离散化并转换成相应的id。缺失值处理模块处理上游信息采集部分中可能缺失的特征,并为缺失值赋予特殊id以便与普通id进行区分。
[0094]
可选地,在本技术的一个实施例中,概率预测部分由基于子空间投影的深度神经网络组成,将经过特征处理部分的特征输入模型中,并利用自定义算子和tensorrt等技术加快推理速度,完成用户对某个物品点击概率的计算。基于子空间投影的深度神经网络模型结构如图3所示,主要由三部分组成:嵌入层、子空间投影层和深度层,logloss损失函数表示为:
[0095][0096]
其中,n表示样本数,yi表示真实label,表示模型预测结果。
[0097]
可选地,在本技术的一个实施例中,将用户特征输入嵌入层进行特征嵌入,包括:
[0098]
在深度神经网络模型中,模型无法直接对稀疏特征进行处理,需要将稀疏特征转
换为稠密向量,稀疏特征转换成稠密向量的公式如下所示:
[0099]ei
=wixi[0100]
其中,wi表示特征域权重矩阵,xi表示特征域的one-hot向量;;
[0101]
对于数值特征,为每个域赋予一个特征向量比直接使用数值特征能获得更好的性能表现,所以在概率预测部分,同样将特征转换为稠密向量。数值特征转换公式如下所示:
[0102]ej
=vjxj[0103]
其中,vj表示数值特征域对应的特征向量,xj表示特征域的具体数值。
[0104]
最后通过将不同域的稠密特征向量进行拼接,得到嵌入层输出,即所有特征拼接向量。
[0105]
e=[e1,e2,

,ef]
[0106]
其中,e表示拼接后的向量,e表示各个域的特征向量,下标表示第几个域,例如e2表示第二个域的特征向量。
[0107]
可选地,在本技术的一个实施例中,用户和物品特征中包含丰富的信息,该模型使用子空间投影层对特征进行低阶和高阶交互。
[0108]
对于第k层来说,定义第k-1层的输出为x,其中n
k-1
表示当前子空间投影层的前一层的子空间投影个数,c
k-1
表示当前子空间投影层的前一层的子空间投影向量的维度。首先将x展开铺平,此时x∈rd,其中d=n
k-1
×ck-1

[0109]
对于每一层子空间投影层,本方案希望将x投影到子空间s中。其中s的基向量为权重矩阵w∈rd×c的列向量,其中c表示子空间的投影维度,并且d>>c。一种简捷的方法是根据数学公式直接计算x在s上的投影,具体计算公式如下所示:
[0110]
y=w(w
t
w)-1wt
x
[0111]
其中,y∈rd表示x在子空间s上的投影,w(w
t
w)-1wt
表示正交投影矩阵,用符号p表示。
[0112]
上述计算方法存在两个问题:一是计算耗时计算消耗大,二是投影后投影向量的维度依旧为d,维度并没有变小,不利于子空间投影层的不断堆叠,会导致计算成本大幅增加。
[0113]
因此,本方案使用一种新的计算方法,首先将正交投影矩阵p进行如下的分解:
[0114]
p=pdpc[0115]
pd=w(w
t
w)-1/2
[0116]
pc=(w
t
w)-1/2wt
[0117]
其中,pc将投影向量映射回原始的d维空间中,pd表示将x映射到c维的子空间中,
[0118]
直接计算w
t
w的根非常耗时,所以本方案采用如下的计算方法。
[0119]
首先使y0=a,z0=i,对于k从0开始,进行如下的运算:
[0120]yk+1
=0.5*yk(3i-zkyk)
[0121]zk+1
=0.5*(3i-zkyk)zk[0122]
其中,k代表迭代轮数,最终yk会收敛至zk会收敛至a表示需要开方的初始矩阵,
[0123]
在利用上述方法计算出w
t
w的根后,使
[0124]
t=pcx
[0125]
因为pd为y所处的rd维空间和t所处rc维空间之间的同构变换,所以可以使用t替代子空间向量y,并且pd不会改变向量的长度和角度等性质。
[0126]
为了增强特征的非线性特征,本方案在t上增加偏置并使用激活函数,具体计算如下:
[0127]
u=φ(t+b)
[0128]
其中,φ表示激活函数,本方案中采用relu激活函数,b表示偏置。
[0129]
为了从不同角度进行用户特征间的交叉,本方案在每个子空间投影层中并行堆叠多个不同的子空间,对于第i个子空间,得到投影后的向量ui,将所有不同的子空间投影向量进行拼接,得到这一层的最终输出u:
[0130][0131]
图4为一个高维向量向低维平面投影的示例。
[0132]
可选地,在本技术的一个实施例中,为了捕捉更进一步的特征高阶交叉的有关信息,本方案在子空间投影层上继续堆叠了深度层,深度层采用多层全连接层方案,使用3层每层400个隐藏单元的全连接层,并在最后使用sigmoid激活函数输出一个0至1之间的概率值,表示用户点击当前此物品的概率。
[0133]
可选地,在本技术的一个实施例中,在通过第三部分概率预测部分后,根据预测概率值对候选集进行一定的处理并最终为用户实现个性化精准推荐。其主要由四个模块组成,分别是去重模块、排序模块、打散模块和策略模块。
[0134]
去重模块对候选集中的商品进行去重操作,去除用户已经点击或浏览过的物品;排序模块根据上一部分概率预测部分所得到的点击预测概率值,使用桶排序算法在线性时间内对物品进行排序,将用户最有可能点击的物品排在前面,为用户提供个性化精准排序;打散模块主要对排序模块的物品顺序进行优化,将同一页推荐中多个相邻的同一类别的物品分散,同时避免不同页衔接处可能产生的同一类别物品聚集的问题,为用户带来更好的浏览体验;策略模块主要提供人为修正推荐结果和利用人为定义的先验规则优化排序结果的功能,例如活动期间对某些物品赋予更多的权重并将其排在靠前的位置,去除不符合法律法规的物品,根据不同用户的特征人为设置某些规则提高特定物品的权重等。
[0135]
为了实现上述实施例,本技术还提出一种基于子空间投影神经网络的点击率预估装置。
[0136]
图5为本技术实施例提供的一种基于子空间投影神经网络的点击率预估装置的结构示意图。
[0137]
如图5所示,该基于子空间投影神经网络的点击率预估装置包括信息采集模块、特征处理模块、概率预测模块、个性化推荐模块,其中,
[0138]
信息采集模块,用于采集用户数据;
[0139]
特征处理模块,用于对用户数据进行特征处理,得到用户特征,其中,特征处理包括归一化处理、离散化处理、未知值处理;
[0140]
概率预测模块,用于将用户特征输入训练好的深度神经网络模型中,输出用户点击物品概率的预测结果,其中,深度神经网络模型由logloss损失函数进行训练生成;
[0141]
个性化推荐模块,用于根据预测结果对物品候选集进行筛选,得到最终推荐结果。
[0142]
可选地,在本技术的一个实施例中,根据预测结果对物品候选集进行筛选,得到最终推荐结果,包括:
[0143]
去除物品候选集中用户已经点击或浏览过的物品;
[0144]
根据预测结果,使用桶排序算法在线性时间内对物品进行排序,得到物品顺序;
[0145]
按照物品顺序将多个相邻的同一类别的物品分散,得到最终物品顺序;
[0146]
按照最终物品顺序在浏览页面上展示物品,得到最终推荐结果。
[0147]
需要说明的是,前述对基于子空间投影神经网络的点击率预估方法实施例的解释说明也适用于该实施例的基于子空间投影神经网络的点击率预估装置,此处不再赘述。
[0148]
为了实现上述实施例,本发明还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现上述施例所述的方法。
[0149]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本技术的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0150]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本技术的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0151]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本技术的实施例所属技术领域的技术人员所理解。
[0152]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0153]
应当理解,本技术的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0154]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0155]
此外,在本技术各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0156]
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本技术的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本技术的限制,本领域的普通技术人员在本技术的范围内可以对上述实施例进行变化、修改、替换和变型。

技术特征:


1.一种基于子空间投影神经网络的点击率预估方法,其特征在于,包括以下步骤:采集用户数据;对所述用户数据进行特征处理,得到用户特征,其中,所述特征处理包括归一化处理、离散化处理、未知值处理;将所述用户特征输入训练好的深度神经网络模型中,输出用户点击物品概率的预测结果,其中,所述深度神经网络模型由logloss损失函数进行训练生成;根据所述预测结果对物品候选集进行筛选,得到最终推荐结果。2.如权利要求1所述的方法,其特征在于,所述用户数据包括痕迹数据、特征数据,所述痕迹数据为用户在当前平台浏览信息时产生的历史行为记录,所述特征数据为用户填写的用户自身信息,所述对所述用户数据进行特征处理,包括:对连续特征的异常值进行归一化;对稀疏的类别型特征进行离散化并转换成相应的id;采集缺失的特征,并为缺失值赋予特定id,其中,所述特定id与普通id不同。3.如权利要求1所述的方法,其特征在于,所述深度神经网络模型包括嵌入层、子空间投影层、深度层,所述logloss损失函数表示为:其中,n表示样本数,y
i
表示真实标签,表示模型预测结果。4.如权利要求3所述的方法,其特征在于,将所述用户特征输入所述嵌入层进行特征嵌入,包括:将所述用户特征中的稀疏特征、数值特征转换为稠密向量;将不同域的稠密特征向量进行拼接,得到特征拼接向量作为所述嵌入层的输出;其中,所述稀疏特征转换生成的稠密向量表示为:e
i
=w
i
x
i
其中,w
i
表示特征域权重矩阵,x
i
表示特征域的one-hot向量;所述数值特征转换生成的稠密向量表示为:e
j
=v
j
x
j
其中,v
j
表示数值特征域对应的特征向量,x
j
表示特征域的具体数值;所述特征拼接向量表示为:e=[e1,e2,

,e
f
]其中,e表示拼接后的向量,e表示各个域的特征向量,e
f
表示第f个域的特征向量。5.如权利要求4所述的方法,其特征在于,每个子空间投影层中并行堆叠多个不同的子空间,将所述特征拼接向量输入所述子空间投影层进行特征交互,包括:将正交投影矩阵进行分解,得到分解向量;对所述分解向量增加偏置并使用激活函数,得到投影后的向量;将所有不同的子空间投影向量进行拼接,得到所述子空间投影层的输出,其中,所述将正交投影矩阵进行分解,表示为:p=p
d
p
c
p
d
=w(w
t
w)-1/2
p
c
=(w
t
w)-1/2
w
t
其中,p
d
表示将投影向量映射回原始的d维空间中,p
c
表示将x映射到c维的子空间中,w(w
t
w)-1
w
t
表示正交投影矩阵,w表示子空间基向量权重矩阵,w
t
w的根的计算方式为:y
k+1
=0.5*y
k
(3i-z
k
y
k
)z
k+1
=0.5*(3i-z
k
y
k
)z
k
其中,k代表迭代轮数,i表示单位矩阵,y
k
表示上轮迭代产生的第一临时计算结果,y
k
表示本轮迭代产生的第一临时计算结果,y0=a,a表示初始矩阵,z
k
表示上轮迭代产生的第二临时结果,z
k
表示本轮迭代产生的第二临时计算结果,z0=i,所述投影后的向量表示为:t=p
c
x其中,x表示嵌入层向量或上一层子空间投影层的结果向量;所述投影后的向量表示为:u=φ(t+b)其中,φ表示激活函数,b表示偏置;所述子空间投影层的输出表示为:其中,u
i
表示第i个子空间的投影向量。6.如权利要求5所述的方法,其特征在于,所述深度层包括多层全连接层,将所述子空间投影层的输出输入所述深度层中进行特征捕捉,包括:将所述子空间投影层的输出输入全连接层,得到中间结果;使用激活函数对所述中间结果进行处理,得到用户点击当前物品的概率。7.如权利要求1所述的方法,其特征在于,所述根据所述预测结果对物品候选集进行筛选,得到最终推荐结果,包括:去除所述物品候选集中用户已经点击或浏览过的物品;根据所述预测结果,使用桶排序算法在线性时间内对物品进行排序,得到物品顺序;按照所述物品顺序将多个相邻的同一类别的物品分散,得到最终物品顺序;按照所述最终物品顺序在浏览页面上展示物品,得到最终推荐结果。8.一种基于子空间投影神经网络的点击率预估装置,其特征在于,包括信息采集模块、特征处理模块、概率预测模块、个性化推荐模块,其中,所述信息采集模块,用于采集用户数据;所述特征处理模块,用于对所述用户数据进行特征处理,得到用户特征,其中,所述特征处理包括归一化处理、离散化处理、未知值处理;所述概率预测模块,用于将所述用户特征输入训练好的深度神经网络模型中,输出用户点击物品概率的预测结果,其中,所述深度神经网络模型由logloss损失函数进行训练生成;所述个性化推荐模块,用于根据所述预测结果对物品候选集进行筛选,得到最终推荐结果。9.如权利要求8所述的装置,其特征在于,所述根据所述预测结果对物品候选集进行筛
选,得到最终推荐结果,包括:去除所述物品候选集中用户已经点击或浏览过的物品;根据所述预测结果,使用桶排序算法在线性时间内对物品进行排序,得到物品顺序;按照所述物品顺序将多个相邻的同一类别的物品分散,得到最终物品顺序;按照所述最终物品顺序在浏览页面上展示物品,得到最终推荐结果。10.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-7中任一所述的方法。

技术总结


本申请提出了一种基于子空间投影神经网络的点击率预估方法,涉及人工智能技术领域,其中,该方法包括:采集用户数据;对用户数据进行特征处理,得到用户特征,其中,特征处理包括归一化处理、离散化处理、未知值处理;将用户特征输入训练好的深度神经网络模型中,输出用户点击物品概率的预测结果,其中,深度神经网络模型由logloss损失函数进行训练生成;根据预测结果对物品候选集进行筛选,得到最终推荐结果。采用上述方案的本发明实现了端到端为用户提供个性化精确推荐。提供个性化精确推荐。提供个性化精确推荐。


技术研发人员:

欧中洪 张旭 宋美娜

受保护的技术使用者:

北京邮电大学

技术研发日:

2022.09.26

技术公布日:

2022/12/19

本文发布于:2024-09-23 04:35:46,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/43143.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:特征   向量   所述   物品
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议