信息获取方法、装置、设备及存储介质与流程



1.本技术实施例涉及互联网技术领域,尤其涉及一种信息获取方法、装置、设备及存储介质。


背景技术:



2.广告,顾名思义就是广而告之,向社会广大公众告知某件事物。广告投放是指广告主以付费方式通过广告媒体平台投放目标广告,以达到向用户传播与目标广告对应的广告对象的目的,该广告对象可以是商品、服务信息、应用程序或网站等。目前,在广告投放过程中,通常需要先对目标广告进行人定向以确定出目标广告的投放信息,即筛选出与目标广告相关的潜在受众,然后将目标广告投放给该投放信息包括的投放用户。
3.现有技术中,广告主先通过数据管理平台(data management platform,dmp)获取目标广告的投放信息,然后在投放端为目标广告绑定投放信息后进行广告投放。广告主在通过dmp获取目标广告的投放信息时,具体是需要广告主在dmp上设置目标广告的定向条件,dmp根据该定向条件确定投放信息。
4.但是,在实际场景中,以广告对象为商品为例,广告主要给每个商品创建一条广告,若使用上述方法对不同商品的广告进行人定向,需要广告主为每条广告设置定向条件以确定投放信息,获取广告的投放信息的效率较低,操作繁琐。


技术实现要素:



5.本技术提供一种信息获取方法、装置、设备及存储介质,以提高获取广告的投放信息的效率。
6.第一方面,本技术提供一种信息获取方法,包括:
7.获取所述目标广告对应的广告对象的目标类目
8.获取广告对象类目与投放信息的对应关系,所述对应关系根据历史广告的投放信息和历史广告投放日志生成;
9.从所述对应关系中查所述目标类目的投放信息;
10.将所述目标类目的投放信息确定为所述目标广告的投放信息。
11.可选的,所述对应关系按照第一预设周期生成并存储于内存中;
12.所述获取广告对象类目与投放信息的对应关系,包括:
13.从所述内存中获取所述对应关系。
14.可选的,所述获取广告对象类目与投放信息的对应关系,包括:
15.获取所述历史广告的投放信息和当前时间之前的历史广告投放日志;
16.根据广告与广告对象类目的映射关系和所述历史广告投放日志,确定目标广告投放日志;
17.根据所述历史广告的投放信息和所述目标广告投放日志生成所述对应关系。
18.可选的,所述历史广告投放日志包括用户标识、广告标识、用户曝光次数、点击次
数和转化次数,所述历史广告投放日志按照第二预设周期更新并存储,所述广告与广告对象类目的映射关系为广告标识与广告对象类目标识的映射关系;
19.所述根据广告与广告对象类目的映射关系和所述历史广告投放日志,确定所述目标广告投放日志,包括:
20.按照所述用户标识和所述广告对象类目标识,对所述广告与广告对象类目的映射关系和所述历史广告投放日志进行聚合处理,得到所述目标广告投放日志,所述目标广告投放日志包括用户标识、广告对象类目标识、广告对象类目下用户曝光次数和、广告对象类目下点击次数和以及用户转化次数。
21.可选的,所述获取广告对象类目与投放信息的对应关系,包括:
22.获取所述历史广告的投放信息和目标广告投放日志,所述目标广告投放日志根据广告与广告对象类目的映射关系和预设时间之前的历史广告投放日志确定并存储,所述预设时间为当前时间之前的时间;
23.根据所述历史广告的投放信息和所述目标广告投放日志生成所述对应关系。
24.可选的,所述根据所述历史广告的投放信息和所述目标广告投放日志生成所述对应关系,包括:
25.根据所述目标广告投放日志和所述广告与广告对象类目的映射关系,从所述历史广告的投放信息中确定出所述映射关系中存在的每个广告对象类目的第一投放信息;
26.根据所述映射关系中存在的每个广告对象类目和所述每个广告对象类目的第一投放信息,生成所述对应关系。
27.可选的,所述根据所述目标广告投放日志和所述广告与广告对象类目的映射关系,从所述历史广告的投放信息中确定出所述映射关系中存在的每个广告对象类目的第一投放信息,包括:
28.根据所述广告与广告对象类目的映射关系和所述历史广告的投放信息,确定所述历史广告的投放信息中的每个广告对应的广告对象类目的投放信息集合,其中,所述投放信息集合包括至少一个投放信息;
29.根据每个广告对象类目的投放信息集合和所述目标广告投放日志,计算所述每个广告对象类目的投放信息的转化率,所述投放信息的转化率为所述投放信息集合包括的每个投放信息的转化率;
30.对于每个广告对象类目,根据所述广告对象类目对应的投放用户与投放信息的对应关系以及所述广告对象类目的投放信息的转化率,确定每个投放用户属于所述广告对象类目的投放信息的概率,所述概率为每个投放用户所属的投放信息的转化率中的最大转化率;
31.根据所述每个投放用户属于所述广告对象类目的投放信息的概率,确定所述广告对象类目的第一投放信息,其中,所述广告对象类目的第一投放信息包括所述广告对象类目对应的投放用户中所述概率最大的预设数量的投放用户。
32.可选的,所述根据每个广告对象类目的投放信息集合和所述目标广告投放日志,计算所述每个广告对象类目的投放信息的转化率,包括:
33.对所述每个广告对象类目的投放信息集合,将所述每个广告对象类目的投放信息集合和所述目标广告投放日志以用户标识为关键字连接,并以投放信息标识为关键字进行
广告对象类目曝光次数、广告对象类目下点击次数和用户转化次数的聚合处理,得到所述投放信息集合包括的每个投放信息在每个广告对象类目的总曝光次数、总点击次数和总转化次数;
34.根据所述投放信息集合包括的每个投放信息在每个广告对象类目的总曝光次数、总点击次数和总转化次数,计算每个投放信息的转化率,所述转化率为所述总转化次数除以所述总点击次数的值。
35.可选的,所述根据所述映射关系中存在的每个广告对象类目和所述每个广告对象类目的第一投放信息,生成所述对应关系,包括:
36.对所述映射关系中存在的每个广告对象类目,根据预先训练的预测模型,从所述每个广告对象类目的第一投放信息中确定出每个广告对象类目的第二投放信息,所述预测模型的输入为广告对象类目标识和广告对象类目的第一投放信息中的任意一个投放用户的属性数据,所述预测模型的输出为所述任意一个投放用户的定向概率,所述定向概率为投放用户属于所述预测模型输入的广告对象类目标识对应的广告对象类目的投放信息的概率;
37.根据每个广告对象类目和每个广告对象类目的第二投放信息,生成所述对应关系。
38.可选的,所述根据预先训练的预测模型,从每个广告对象类目的第一投放信息中确定出每个广告对象类目的第二投放信息,包括:
39.对所述每个广告对象类目,分别将广告对象类目标识和广告对象类目的第一投放信息中的任意一个投放用户的属性数据输入到所述预测模型,得到每个广告对象类目的第一投放信息中的所有投放用户的定向概率;
40.按照定向概率从大到小的顺序,从每个广告对象类目的第一投放信息中选取预设数量的投放用户作为每个广告对象类目的第二投放信息。
41.可选的,所述预测模型为对多个样本数据训练得到的,所述样本数据包括广告对象类目标识、样本用户的属性数据和样本用户的定向概率,所述样本用户包括正样本用户和负样本用户,所述正样本用户的定向概率为1,所述负样本用户的定向概率为0,所述样本用户根据所述目标广告投放日志确定。
42.可选的,所述样本用户根据所述目标广告投放日志通过如下方式确定:
43.根据所述广告与广告对象类目的映射关系,从所述目标广告投放日志中选取预设时间段内的所述映射关系中存在的每个广告对象类目对应的转化人、点击未转化人和曝光未点击人,所述每个广告对象类目为所述广告与广告对象类目的映射关系中存在的广告对象类目,所述预设时间段为所述目标广告投放日志的时间节点之前的时间段;
44.从大盘用户中随机选取未曝光人,所述未曝光人为未看见所述广告与广告对象类目的映射关系中存在的广告的人;
45.对所述每个广告对象类目对应的转化人、点击未转化人和曝光未点击人进行降采样处理,以使得所述转化人、点击未转化人、曝光未点击人和未曝光人之间的比例为预设比例;
46.将满足所述预设比例的所述转化人、所述点击未转化人、所述曝光未点击人和所述未曝光人确定为所述样本用户,其中,所述转化人为正样本用户,除所述转化
人之外的人为负样本用户。
47.可选的,所述广告与广告对象类目的映射关系根据广告与广告对象的映射关系和广告对象与广告对象类目的映射关系确定。
48.第二方面,本技术提供一种信息获取装置,包括:获取单元和处理单元;
49.所述获取单元用于:
50.获取所述目标广告对应的广告对象的目标类目;
51.获取广告对象类目与投放信息的对应关系,所述对应关系根据历史广告的投放信息和历史广告投放日志生成;
52.所述处理单元用于:
53.从所述对应关系中查所述目标类目的投放信息;
54.将所述目标类目的投放信息确定为所述目标广告的投放信息。
55.第三方面,本技术提供一种信息获取设备,包括:处理器和存储器,该存储器用于存储计算机程序,该处理器用于调用并运行该存储器中存储的计算机程序,以执行第一方面的方法。
56.第四方面,本技术提供一种计算机可读存储介质,用于存储计算机程序,该计算机程序使得计算机执行第一方面的方法。
57.综上,在本技术中,通过获取目标广告对应的广告对象的目标类目,接着获取广告对象类目与投放信息的对应关系,由于对应关系是根据历史广告的投放信息和历史广告投放日志确定出的,因此对应关系存储的是广告系统已有的广告对象类目的投放信息,在从对应关系中查目标类目的投放信息时,可以从系统已有的广告对象类目的投放信息中查到目标类目的投放信息,该目标类目的投放信息即为目标广告的投放信息,属于同一广告对象类目的不同广告的投放信息是相同的,广告主在投放端只需指定要投放的目标广告,或者指定要投放的目标广告以及目标广告的广告对象类目,就可以获取到目标广告的投放信息,对于广告主而言操作简单,提高了获取广告的投放信息的效率。
附图说明
58.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
59.图1为本技术实施例提供的信息获取方法的一种应用场景示意图;
60.图2为本技术实施例提供的信息获取方法的另一种应用场景示意图;
61.图3为本技术实施例提供的一种信息获取方法的流程图;
62.图4为本技术实施例提供的一种信息获取方法的流程图;
63.图5为本技术实施例提供的一种信息获取方法的流程图;
64.图6为本技术实施例提供的一种信息获取方法的流程图;
65.图7为本技术实施例提供的一种信息获取方法的流程图;
66.图8为本技术实施例提供的一种信息获取方法的流程图;
67.图9为一种deepfm的网络结构示意图;
68.图10为本技术实施例提供的一种信息获取方法的流程图;
69.图11为本技术实施例提供的一种信息获取方法的流程图;
70.图12为本技术实施例提供的一种信息获取装置100的结构示意图;
71.图13是本技术实施例提供的信息获取设备200的示意性框图。
具体实施方式
72.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
73.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
74.在介绍本技术技术方案之前,下面先对本技术相关知识进行介绍:
75.1、人定向,是指筛选出与目标广告相关的潜在受众(即投放信息)的过程。潜在受众是指有较大概率接收到目标广告的用户。
76.2、广告曝光,是指用户看见广告,曝光用户是指看见广告的用户,例如某广告通过一广告媒体平台在预设时间段内投放,用户在预设时间段内打开该广告媒体平台,即可看见该广告,则该用户为该广告的曝光用户,反之,用户未在预设时间段内打开该广告媒体平台,未看见该广告,则该用户为该广告的未曝光用户。
77.3、广告对象,是指广告的对象,例如,广告对象可以是商品、服务信息、应用程序或网站等,在某种场景下,应用程序和网站也是一种商品。
78.4、广告对象类目,是指对广告对象分类,也称为广告对象类型。广告对象常见的是商品,商品类目是指根据一定的管理目的,为满足商品生产、流通、消费活动的全部或部分需要,将管理范围内的商品集合总体,以所选择的适当的商品基本特征作为分类标志,逐次归纳为若干个范围更小、特质更趋一致的子集合体(类目)。例如大类、中类、小类、细类,直至品种、细目等,从而使该范围内所有商品得以明确区分与体系化。目前,在电商平台中商品类目设置为三层:一级类目、二级类目和三级类目。例如,一级类目“家用电器”下的二级类目包括电视、空调、洗衣机、冰箱、生活电器、厨卫电器等等,其中的二级类目“电视”下的三级类目包括超薄电视、智能电视、oled电视和电视配件等等。
79.5、投放信息,是指广告的投放用户信息,包括投放用户标识,还可以包括投放用户数量,投放用户可以是广告的潜在受众,即有较大概率接收到投放广告的用户。
80.人定向是广告投放过程中的一个非常重要的环节,人定向的准确率和广告投放效果是成正比的。现有的人定向方法中,在对不同商品的广告进行人定向时,需要广告主为每条广告设置定向条件以确定投放信息,获取广告的投放信息的效率较低,操作繁
琐。
81.为了解决上述技术问题,本技术通过根据历史广告的投放信息和历史广告投放日志,生成广告对象类目与投放信息的对应关系,即生成广告系统已有的广告对象类目的投放信息,在确定目标广告的投放人时,先获取目标广告对应的广告对象的目标类目,就可以从系统已有的广告对象类目的投放信息中查到目标类目的投放信息,该目标类目的投放信息即为目标广告的投放信息,属于同一广告对象类目的不同广告的投放信息是相同的。从而,广告主在需要进行人定向时,广告主在投放端只需指定要投放的目标广告或者指定要投放的目标广告以及目标广告的广告对象类目,就可以获取到目标广告的投放信息,对于广告主而言操作简单,提高了获取广告的投放信息的效率。
82.进一步地,还可以提高获取广告的投放信息的准确率,保证广告的投放用户的转化率,实现成本控制的目的,进而可提高广告的投放效果。
83.下面将对本技术实施例的技术方案能够适用的应用场景做一些简单介绍,需要说明的是,下面介绍的应用场景仅用于说明本技术实施例而非限定。在具体实施时,可以根据实际需要灵活地应用本技术实施例提供的技术方案。
84.本技术提供的信息获取方法,可应用于广告系统中,该广告系统为能够提供广告媒体平台、以收费方式为广告主在广告媒体平台上投放广告的系统。广告媒体平台可以包括社交媒体平台、资讯媒体平台和视听媒体平台,社交媒体平台例如包括即时通讯客户端(如qq客户端或客户端)等,资讯媒体平台例如包括提供新闻资讯的客户端或网页等,视听媒体平台例如包括视频播放平台(如xx视频客户端)和音频播放平台(如xx音乐客户端)等。
85.在一种可实施的方式中,广告系统可以是一个基于网页或客户端进行人机交互的广告系统,广告系统包括投放端和后台服务器(下文简称服务器),投放端可以为运行于终端设备的浏览器中且通过浏览器显示的网页,投放端还可以为安装且运行于终端设备的应用程序(app),服务器可以为为广告主提供广告投放服务的服务器。其中,终端设备可以为手机、个人计算机或平板电脑等电子设备。
86.示例性的,图1为本技术实施例提供的信息获取方法的一种应用场景示意图,如图1所示,本实施例的应用场景中涉及服务器1、广告主操作的终端设备2和投放用户操作的终端设备3。广告主要对目标广告进行人定向以确定出目标广告的投放信息时,可通过广告系统的投放端(可以为运行于终端设备2的浏览器中且通过浏览器显示的网页或者为安装且运行于终端设备2的app)向服务器1发送目标广告的人定向请求,可选的,该人定向请求可以携带目标广告对应的广告对象类目,可选的,该人定向请求还可以携带至少一个定向条件,该定向条件可以是广告主设置的。服务器1接收到该人定向请求后,执行本技术实施例提供的信息获取方法,确定出目标广告的投放信息,并为目标广告绑定所确定的投放信息,如图1所示,该投放信息包括多个投放用户。进一步地,服务器1为目标广告绑定所确定的投放信息之后,若接收到目标广告的投放指令,该投放指令可以是广告主通过广告系统的投放端向服务器1发送的,则向投放信息投放目标广告,具体可以通过服务器默认的广告媒体平台或者广告主选择的广告媒体平台向投放信息投放目标广告,若投放用户通过操作终端设备3打开了已投放目标广告的广告媒体平台时,就可看见目标广告。可选的,服务器1为目标广告绑定所确定的投放信息之后,还可以直接向投放信息投放目标广
告。本技术实施例中,广告主只需要通过广告系统的投放端向服务器1发送目标广告的人定向请求,就可以实现对目标广告的人定向,对于广告主而言操作简单,提高了获取广告的投放信息的效率。
87.进一步地,还可以提高获取广告的投放信息的准确率,保证新广告的投放用户的转化率,实现成本控制的目的,进而可提高新广告的广告投放效果。
88.示例性的,图2为本技术实施例提供的信息获取方法的另一种应用场景示意图,如图2所示,本实施例的应用场景中涉及广告主、广告主操作的终端设备20和投放用户操作的终端设备30,广告主要对目标广告进行人定向以确定出目标广告的投放信息时,可通过广告系统的投放端(可以为运行于终端设备20的浏览器中且通过浏览器显示的网页或者为安装且运行于终端设备20的app)输入目标广告,在输入目标广告时,可以输入目标广告的标识和目标广告对应的广告对象的文本信息或图像信息,并通过广告系统的投放端触发对目标广告进行人定向,例如广告主点击终端设备20的显示界面显示的人定向按钮(如图2所示的确认按钮),即可触发对目标广告进行人定向。可选的,在输入目标广告时,还可以输入目标广告对应的广告对象类目;进一步地,在输入目标广告或者输入目标广告和目标广告对应的广告对象类目时,还可以输入至少一个定向条件,该定向条件可以是广告主设置的,定向条件例如包括地域、年龄和性别中的至少一项。终端设备20响应于广告主触发对目标广告进行人定向的操作,执行本技术实施例提供的信息获取方法,确定出目标广告的投放信息,进一步可以在终端设备20的当前显示界面显示目标广告的投放信息。
89.进一步地,若终端设备20接收到目标广告的投放指令,该投放指令可以是广告主通过点击终端设备20的显示界面显示的投放按钮(如图2中所示),则根据目标广告的投放信息投放目标广告,具体可以通过广告主选择的广告媒体平台向投放信息投放目标广告,若投放用户通过操作终端设备30打开了已投放目标广告的广告媒体平台时,就可看见目标广告。本技术实施例中,广告主只需要通过广告系统的投放端输入目标广告,或者输入目标广告和目标广告对应的广告对象类目,就可以获得目标广告的投放信息,对于广告主而言操作简单,提高了获取广告的投放信息的效率。进一步地,还可以提高获取广告的投放信息的准确率,保证新广告的投放用户的转化率,实现成本控制的目的,进而可提高新广告的广告投放效果。
90.下面将对本技术技术方案进行详细阐述:
91.实施例1
92.图3为本技术实施例提供的一种信息获取方法的流程图,该方法的执行主体可以是服务器或终端设备,如图3所示,该方法可以包括如下步骤:
93.s101、获取目标广告对应的广告对象的目标类目。
94.具体来说,本实施例的方法的执行主体为服务器时,广告主要对目标广告进行人定向时,可通过广告系统的投放端向服务器发送目标广告的人定向请求,该人定向请求可以携带目标广告的标识和目标广告对应的广告对象的文本信息或图像信息,或者,该人定向请求可以携带目标广告的标识和目标广告对应的广告对象类目。
95.相应地,若人定向请求携带目标广告的标识和目标广告对应的广告对象的文本信息,获取目标广告对应的广告对象的目标类目,具体可以是使用自然语言理解方法对文本信息解读获得目标广告对应的广告对象的目标类目;若人定向请求携带目标广告的标
识和目标广告对应的广告对象的图像信息,获取目标广告对应的广告对象的目标类目,具体可以是对图像信息进行图像识别获得目标广告对应的广告对象的目标类目。
96.若人定向请求携带目标广告的标识和目标广告对应的广告对象类目,即广告主直接指示了目标广告对应的广告对象类目,则服务器可直接获取目标广告对应的广告对象的目标类目。通过这种方式获取目标类目,准确性更高。作为一种可实施的方式,广告主在通过广告系统的投放端向服务器发送目标广告的人定向请求之前,广告系统的投放端可向广告主显示广告对象类目的选项供广告主选择,投放端所显示的广告对象类目是历史广告投放日志中涉及到的所有广告对象类目,即是广告系统已有的广告对象类目(即已进行过人定向的广告对象类目),因此可以保证目标类目输入的准确性,进而可保证目标广告的投放信息获取的准确性。
97.本实施例的方法的执行主体为终端设备时,广告主要对目标广告进行人定向以确定出目标广告的投放信息时,可通过广告系统的投放端输入目标广告,具体可以输入目标广告的标识和目标广告对应的广告对象的文本信息或图像信息,或者,可以输入目标广告的标识和目标广告对应的广告对象类目。
98.相应地,若终端设备确定广告主输入的是目标广告的标识和目标广告对应的广告对象的文本信息,获取目标广告对应的广告对象的目标类目,具体可以是使用自然语言理解方法对文本信息解读获得目标广告对应的广告对象的目标类目;若终端设备确定广告主输入的是目标广告的标识和目标广告对应的广告对象的图像信息,获取目标广告对应的广告对象的目标类目,具体可以是对图像信息进行图像识别获得目标广告对应的广告对象的目标类目。
99.若终端设备确定广告主输入的是目标广告的标识和目标广告对应的广告对象类目,即广告主直接指示了目标广告对应的广告对象类目,则可直接获取目标广告对应的广告对象的目标类目。通过这种方式获取目标类目,准确性更高。作为一种可实施的方式,终端设备确定广告主输入目标广告的标识后,可向广告主显示广告对象类目的选项供广告主选择,投放端所显示的广告对象类目是历史广告投放日志中涉及到的所有广告对象类目,即是广告系统已有的广告对象类目(即已进行过人定向的广告对象类目),因此可以保证目标类目输入的准确性,进而可保证目标广告的投放信息获取的准确性。
100.本实施例中,广告可以包括公益类广告和非公益类广告,非公益类广告例如包括商品广告,商品广告对应的广告对象即为商品,商品类目的划分可以使用现有的划分方式。对于公益类广告,还可以预先设置不同公益类广告对应的广告对象的类目。
101.需要说明的是,广告对象为商品时,所获取的目标广告对应的广告对象的目标类目可以是一级类目、二级类目和三级类目中的任意一个,可以理解的是,三级类目对应的投放信息的准确性最高。
102.进一步地,作为一种可实施的方式,在上述两种方式的基础上,该人定向请求还可以携带至少一个定向条件,该定向条件可以是广告主设置的,该定向条件例如可以包括投放信息数量和投放用户的用户画像特征(如年龄、性别和地域等)等,还可以包括其他条件,本实施例对此不作限制。该种方式一方面可以实现广告主的个性化定向要求,另一方面,若根据目标广告对应的广告对象的目标类目未查到目标类目的投放信息,例如目标广告对应的广告对象的目标类目是第一次出现,不在广告系统已有的广告对象类目中,此
时查不到目标广告对应的广告对象的目标类目,则可以根据该人定向请求携带的至少一个定向条件来进行人定向,避免人定向失败的情况发生。
103.s102、获取广告对象类目与投放信息的对应关系,该对应关系根据历史广告的投放信息和历史广告投放日志生成。
104.具体来说,广告对象类目与投放信息的对应关系可以为广告对象类目与投放信息的对应关系表,示例性的,如下表一所示为一种广告对象类目与投放信息的对应关系的示例,例如,广告系统已有的广告对象类目有n个,每个类目分别对应一个投放信息。
105.表一 广告对象类目与投放信息的对应关系
106.广告对象类目投放信息类目1投放信息1类目2投放信息2类目n投放信息n
107.其中,本技术实施例中,投放信息是指广告的投放用户信息,一个投放信息可以包括投放用户标识,还可以包括投放用户数量,例如,投放信息1中包括100个投放用户的标识。
108.其中,对应关系可以根据历史广告的投放信息和历史广告投放日志生成,历史广告可以是广告系统存储的完成了人定向的所有广告,每个历史广告均对应有投放信息,在完成一个广告投放后,广告系统存储该广告的投放信息,例如存储的格式可以是广告标识1:投放信息1、广告标识2:投放信息2
……
。历史广告投放日志包括用户标识、广告标识、用户曝光次数、点击次数和转化次数。
109.s103、从对应关系中查目标类目的投放信息。
110.s104、将目标类目的投放信息确定为目标广告的投放信息。
111.本实施例提供的信息获取方法,通过获取目标广告对应的广告对象的目标类目,接着获取广告对象类目与投放信息的对应关系,由于对应关系是根据历史广告的投放信息和历史广告投放日志确定出的,因此对应关系存储的是广告系统已有的广告对象类目的投放信息,在从对应关系中查目标类目的投放信息时,可以从系统已有的广告对象类目的投放信息中查到目标类目的投放信息,该目标类目的投放信息即为目标广告的投放信息,属于同一广告对象类目的不同广告的投放信息是相同的,广告主在投放端只需指定要投放的目标广告,或者指定要投放的目标广告以及目标广告的广告对象类目,就可以获取到目标广告的投放信息,对于广告主而言操作简单,提高了获取广告的投放信息的效率。
112.实施例2
113.在图1所示的实施例中,s102中获取广告对象类目与投放信息的对应关系,有两种可实施的方式,第一种实施方式是预先存储对应关系,在获取广告的投放信息时直接从内存中获取,在本实施方式中,对应关系可以是按照第一预设周期生成并存储于内存中。第一预设周期例如可以是一天、一周、半个月或一个月等,可以理解的是,由于该对应关系是根据历史广告的投放信息和历史广告投放日志生成,第一预设周期越短,历史广告的投放信息和历史广告投放日志对应的数据越多,相应地对应关系中的广告对象类目越多,信息获取方法的准确性越高。例如,第一预设周期是一天,则服内存中存储的是每天更新的广告对象类目与投放信息的对应关系。具体如何根据历史广告的投放信息和目标广告投放日志生
成对应关系,可以采用如下图3或图4所示的方式。可选的,对应关系可以存储在分布式文件系统(hadoop distributed file system,hdfs)中,hdfs能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。通过将对应关系存储在hdfs中,可以根据用户标识快速检索出与该用户标识关联的所有广告对象类目,即可以快速检索出一用户所属的广告对象类目的投放信息。
114.第二种实施方式是在接收到人定向请求后,根据历史广告的投放信息和历史广告投放日志生成对应关系。可以理解的是,历史广告的投放信息和历史广告投放日志均是相对于某个时间而言的历史数据,越靠近接收到人定向请求的时间,历史数据越多,信息获取方法的准确性就越高。相比较而言,第二种实施方式的历史数据比第一种实施方式的历史数据多,信息获取方法的准确性就较高。但是,第二种实施方式中,对应关系是实时生成的,响应速度比第一种实施方式慢。下面结合图3和图4详细说明第二种实施方式的具体实现过程。
115.图4为本技术实施例提供的一种信息获取方法的流程图,该方法的执行主体可以是服务器或终端设备,如图4所示,该方法在图3所示方法的基础上,可选的,上述s102可以通过如下步骤实现:
116.s1021、获取历史广告的投放信息和当前时间之前的历史广告投放日志。
117.具体来说,历史广告的投放信息是当前时间之前的历史数据,可以是接收到目标广告的人定向请求时刻之前的历史数据,历史广告可以是广告系统存储的完成了人定向的所有广告,每个历史广告均对应有投放信息,在完成一个广告投放后,广告系统存储该广告的投放信息,例如存储的格式可以是广告标识1:投放信息1、广告标识2:投放信息2
……

118.其中,历史广告投放日志包括用户标识、广告标识、用户曝光次数、点击次数和转化次数,历史广告投放日志按照第二预设周期更新并存储,第二预设周期可以与第一预设周期相同,例如可以为一天、一周、半个月或一个月等,也可以不同。服务器或终端设备可以直接获取当前时间之前的历史广告投放日志。
119.s1022、根据广告与广告对象类目的映射关系和历史广告投放日志,确定目标广告投放日志。
120.具体来说,广告与广告对象类目的映射关系具体为广告标识与广告对象类目标识的映射关系,例如广告1对应广告对象类目2,广告2对应广告对象类目3。
121.其中,可选的,广告与广告对象类目的映射关系可以根据广告与广告对象的映射关系和广告对象与广告对象类目的映射关系确定。广告系统的数据库中会存储一个广告与广告对象的映射关系表和一个广告对象与广告对象类目的映射关系表,广告与广告对象的映射关系表可以是广告主在创建广告的时候在广告系统填写的关系,广告系统以广告标识和广告对象标识的形式保存,广告标识和广告对象标识可以是多对多的映射关系。广告对象与广告对象类目的映射关系表的获取方式有两种,一种是广告主在创建广告时指定了广告对象类目,广告系统以广告对象标识和广告对象类目标识的形式保存。另一种是广告主在创建广告时上传广告对应的广告对象的文本信息或图像信息,广告系统通过自然语言理解方法解析文本信息获得广告对象对应的广告对象类目,或者通过对图像信息进行图像识别获得广告对应的广告对象类目,然后广告系统以广告对象标识和广告对象类目标识的形
式保存。
122.其中,广告对象类目有三级,广告对象与广告对象类目的映射关系表可以是广告对象标识和每一级类目标识的映射关系,如下表三所示为一种广告对象与广告对象类目的映射关系表的示例:
123.表三 广告对象与广告对象类目的映射关系表
124.广告对象一级类目二级类目三级类目广告对象1一级类目标识二级类目标识三级类目标识广告对象2一级类目标识二级类目标识三级类目标识广告对象n一级类目标识二级类目标识三级类目标识
125.表三中,以广告对象为商品为例,例如,广告对象1为电视,广告对象2为手机,广告对象3为燃气灶。
126.具体地,根据广告与广告对象的映射关系表和广告对象与广告对象类目的映射关系表确定广告与广告对象类目的映射关系,可以是按照广告对象标识为关键字的方式对两个表做连接操作再去重,即可得到广告与广告对象类目的映射关系。可选的,当一个广告标识与一个广告对象类目标识关联上后,抽取过程生成三条记录,即广告标识到一级类目标识、二级类目标识和三级类目标识在映射表中分别记录为三行,便于后续处理。
127.历史广告投放日志包括用户标识、广告标识、用户曝光次数、点击次数和转化次数,广告与广告对象类目的映射关系为广告标识与广告对象类目标识的映射关系,作为一种可实施的方式,s1022具体可以为:按照用户标识和广告对象类目标识,对广告与广告对象类目的映射关系和历史广告投放日志进行聚合处理,得到目标广告投放日志,目标广告投放日志包括用户标识、广告对象类目标识、广告对象类目下用户曝光次数和、广告对象类目下点击次数和以及用户转化次数。其中,广告与广告对象类目的映射关系可以是二者的映射关系表。聚合处理具体可以是按照用户标识和广告对象类目标识进行聚合,得到目标广告投放日志。
128.可选的,上述按照用户标识和广告标识,对广告与广告对象类目的映射关系和历史广告投放日志进行聚合处理,得到目标广告投放日志这一过程可以通过使用spark来完成,spark为一种专为大规模数据处理而设计的快速通用的计算引擎。通过使用spark,获取目标广告投放日志的速度较快。
129.s1023、根据历史广告的投放信息和目标广告投放日志生成对应关系。
130.本实施例中,目标广告投放日志是根据广告与广告对象类目的映射关系和当前时间之前的历史广告投放日志确定的,是在获取广告的投放信息时实时生成的,历史广告投放日志的时间点是当前时间之前。
131.在另一种可实施的方式中,目标广告投放日志可以是在获取广告的投放信息之前,根据广告与广告对象类目的映射关系和预设时间之前的历史广告投放日志确定后存储,预设时间为当前时间之前的时间,预设时间例如为一天、两天、一周、半个月、一个月等等。下面结合图4详细说明预先生成目标广告投放日志并存储的具体实现过程。
132.实施例3
133.图5为本技术实施例提供的一种信息获取方法的流程图,该方法的执行主体可以是服务器或终端设备,如图5所示,该方法在图3所示方法的基础上,可选的,上述s102可以
通过如下步骤实现:
134.s1021’、获取历史广告的投放信息和目标广告投放日志,目标广告投放日志根据广告与广告对象类目的映射关系和预设时间之前的历史广告投放日志确定,预设时间为当前时间之前的时间。
135.其中,有关历史广告的投放信息的相关解释可参见图3所示实施例中的解释,此处不再赘述。
136.其中,本实施例中的目标广告投放日志根据广告与广告对象类目的映射关系和预设时间之前的历史广告投放日志确定并存储于内存中,具体地,广告与广告对象类目的映射关系具体为广告标识与广告对象类目标识的映射关系,例如广告1对应广告对象类目2,广告2对应广告对象类目3。广告与广告对象类目的映射关系可以根据广告与广告对象的映射关系和广告对象与广告对象类目的映射关系确定。具体如何确定的过程可参见图3所示实施例中的解释,此处不再赘述。
137.其中,历史广告投放日志包括用户标识、广告标识、用户曝光次数、点击次数和转化次数,广告与广告对象类目的映射关系为广告标识与广告对象类目标识的映射关系,根据广告与广告对象类目的映射关系和预设时间之前的历史广告投放日志确定目标广告投放日志,具体如何确定的过程可参见图3所示实施例中的解释,此处不再赘述。
138.s1022’、根据历史广告的投放信息和目标广告投放日志生成对应关系。
139.需要说明的是,目标广告投放日志是相对于某个时间而言的历史数据,越靠近接收到人定向请求的时间,历史数据越多,信息获取方法的准确性就越高。相比较而言,图4所示实施例中实时生成的目标广告投放日志比图5所示实施例中预先生成并存储在内存中的历史数据多,信息获取方法的准确性就较高。但是,图4所示实施例中实时生成的响应速度比5所示实施例中预先生成并存储的响应速度慢。
140.下面结合图6详细说明图4所示实施例中s1023和图5所示实施例中s1022’的一种可实施的方式,即根据历史广告的投放信息和目标广告投放日志生成对应关系的具体实现过程。
141.实施例4
142.图6为本技术实施例提供的一种信息获取方法的流程图,该方法的执行主体可以是服务器或终端设备,如图6所示,该方法在图4或图5所示方法的基础上,可选的,上述s1023或s1022’可以通过如下步骤实现:
143.s201、根据目标广告投放日志和广告与广告对象类目的映射关系,从历史广告的投放信息中确定出映射关系中存在的每个广告对象类目的第一投放信息。
144.s202、根据映射关系中存在的每个广告对象类目和每个广告对象类目的第一投放信息,生成对应关系。
145.具体地,生成的对应关系即为映射关系中存在的每个广告对象类目和每个广告对象类目的第一投放信息。
146.作为一种可实施的方式,图7为本技术实施例提供的一种信息获取方法的流程图,如图7所示,该方法在图6所示方法的基础上,可选的,上述s201具体可以包括:
147.s2011、根据广告与广告对象类目的映射关系和历史广告的投放信息,确定历史广告的投放信息中的每个广告对应的广告对象类目的投放信息集合,其中,投放信息集合包
括至少一个投放信息。
148.具体地,历史广告的投放信息数量太多,可选的,在确定历史广告的投放信息中的每个广告对应的广告对象类目的投放信息集合时,还可以选取离当前时间最近的时间段内的历史广告的投放信息,例如,历史广告的投放信息为当前时间之前的历史广告的投放信息,例如为当前时间之前的90天、30天或120天等等。
149.具体地,历史广告的投放信息中包括的广告有多个,例如为n个,根据广告与广告对象类目的映射关系确定这n个广告中每个广告的广告对象类目,历史广告的投放信息中每个广告的投放信息集合即为每个广告对应的广告对象类目的投放信息集合。这一过程即为从历史广告的投放信息中确定出划分广告对象类目的投放信息集合。例如,广告对象类目1的投放信息集合中有3个投放信息,广告对象类目2的投放信息集合中有5个投放信息。
150.s2012、根据每个广告对象类目的投放信息集合和目标广告投放日志,计算每个广告对象类目的投放信息的转化率,投放信息的转化率为投放信息集合包括的每个投放信息的转化率。
151.具体地,目标广告投放日志包括多条,每条目标广告投放日志包括用户标识、广告对象类目标识、广告对象类目下用户曝光次数和、广告对象类目下点击次数和以及用户转化次数,根据每个广告对象类目的投放信息集合和目标广告投放日志,计算每个广告对象类目的投放信息的转化率,具体可以为:
152.首先,对每个广告对象类目的投放信息集合,将每个广告对象类目的投放信息集合和目标广告投放日志以用户标识为关键字连接,并以投放信息标识为关键字进行广告对象类目曝光次数、广告对象类目下点击次数和用户转化次数的聚合处理,得到投放信息集合包括的每个投放信息在每个广告对象类目的总曝光次数、总点击次数和总转化次数。
153.接着,根据投放信息集合包括的每个投放信息在每个广告对象类目的总曝光次数、总点击次数和总转化次数,计算每个投放信息的转化率,转化率为总转化次数与总点击次数的比值。
154.s2013、对于每个广告对象类目,根据广告对象类目对应的投放用户与投放信息的对应关系以及广告对象类目的投放信息的转化率,确定每个投放用户属于广告对象类目的投放信息的概率,该概率为每个投放用户所属的投放信息的转化率中的最大转化率。
155.具体地,一个投放用户可以属于一个或多个投放信息,在通过s2011确定出历史广告的投放信息中的每个广告对应的广告对象类目的投放信息集合后,对于每个广告对象类目,需要先根据该广告对象类目的投放信息集合获取该广告对象类目对应的投放用户与投放信息的对应关系,下述表二为一种投放用户与投放信息的对应关系的示例:
156.表二 投放用户与投放信息的对应关系
[0157][0158]
如上表二所示,例如,投放用户1属于三个投放信息(投放信息1、投放信息2和投放信息4),投放信息1包括n个投放用户。
[0159]
通过s2012计算得到每个广告对象类目的投放信息的转化率,对于每个广告对象类目,就可以确定每个投放用户属于该广告对象类目的投放信息的概率。
[0160]
例如,对于广告对象类目1对应的投放用户1,投放用户1属于三个投放信息(投放信息1、投放信息2和投放信息4),投放信息1的转化率为20%,投放信息2的转化率为30%,投放信息3的转化率为50%,则投放用户1属于广告对象类目1的投放信息的概率为50%。
[0161]
s2014、根据每个投放用户属于广告对象类目的投放信息的概率,确定广告对象类目的第一投放信息,其中,广告对象类目的第一投放信息包括广告对象类目对应的投放用户中定向概率最大的预设数量的投放用户。
[0162]
例如,预设数量为5千万,一个广告对象类目的第一投放信息包括该广告对象类目对应的投放用户中定向概率最大的5千万投放用户,即按照从大到小的顺序,概率排在前5千万的投放用户。
[0163]
现有技术中,定向条件是广告主自己设置,新广告主由于没有投放经验,无法获知准确率较高、可获得较高转化率的投放用户的人定向条件,仅限于广告主通过人工经验比较自身账号下的不同人定向确定优化的人定向条件,准确率和效率均较低。本实施例中,在确定每个广告对象类目的第一投放信息时,第一投放信息包括的投放用户是广告
对象类目对应的投放用户中概率最大的预设数量的投放用户,而该概率是每个投放用户所属的投放信息中的最大转化率,即投放用户的转化率是较高的,因此,进一步可以提高获取的广告的投放信息的准确率,保证新广告的投放用户的转化率,实现成本控制的目的,进而可提高新广告的广告投放效果。
[0164]
图8为本技术实施例提供的一种信息获取方法的流程图,如图8所示,该方法在图6所示方法的基础上,进一步地,上述s202具体可以包括:
[0165]
s2021、对映射关系中存在的每个广告对象类目,根据预先训练的预测模型,从每个广告对象类目的第一投放信息中确定出每个广告对象类目的第二投放信息。
[0166]
s2022、根据每个广告对象类目和每个广告对象类目的第二投放信息,生成对应关系。
[0167]
具体地,生成的对应关系即为每个广告对象类目和每个广告对象类目的第二投放信息的对应关系。
[0168]
其中,预测模型的输入为广告对象类目标识和广告对象类目的第一投放信息中的任意一个投放用户的属性数据,预测模型的输出为任意一个投放用户的定向概率,定向概率为投放用户属于预测模型输入的广告对象类目标识对应的广告对象类目的投放信息的概率。
[0169]
其中,投放用户的属性数据可以包括用户标识和用户画像特征,用户画像特征可以包括年龄、性别和地域等信息。
[0170]
可选的,s2021具体可以为:对每个广告对象类目,分别将广告对象类目标识和广告对象类目的第一投放信息中的任意一个投放用户的属性数据输入到预测模型,得到每个广告对象类目的第一投放信息中的所有投放用户的定向概率,按照定向概率从大到小的顺序,从每个广告对象类目的第一投放信息中选取预设数量的投放用户作为每个广告对象类目的投放信息。例如,预设数量为5千万。
[0171]
本实施例中,预测模型为对多个样本数据训练得到的,样本数据包括广告对象类目标识、样本用户的属性数据和样本用户的定向概率,样本用户包括正样本用户和负样本用户,正样本用户的定向概率为1,负样本用户的定向概率为0,样本用户根据目标广告投放日志确定。
[0172]
可选的,预测模型可以是使用深度学习模型或机器学习模型对多个样本数据训练得到,例如,使用深度学习模型中的深度神经网络(deep neural networks,dnn)模型,使用机器学习模型中的deepfm【1】模型和极端梯度上升(xgboost)【2】模型。
[0173]
下面以使用deepfm【1】模型为例,deepfm【1】模型的输入为广告对象类目标识和一个投放用户的属性数据,投放用户的属性数据包括用户标识和用户画像特征,图9为一种deepfm的网络结构示意图,请参照图9,广告对象类目标识和一个投放用户的属性数据被处理为多个字段(field)的格式,广告对象类目标识独自构成一个字段i,投放用户的属性数据例如被处理为字段j
……
、字段m。字段i、字段j
……
、字段m为图9中稀疏特征(sparse feature)的输入,密集的嵌入层(dense embedding)默认的嵌入层的维度(size)可以是2的幂次方,如8、16、32或64等,fm层和隐藏层(hidden layer)分别用不同的方式对投放用户和广告对象类目之间的关系建模,输出单元输出投放用户的定向概率。整个deepfm【1】模型可以使用交叉熵作为损失函数进行数值迭代优化。
[0174]
本实施例中,通过对映射关系中存在的每个广告对象类目,根据预先训练的预测模型,从每个广告对象类目的第一投放信息中确定出每个广告对象类目的第二投放信息,再生成每个广告对象类目和每个广告对象类目的第二投放信息的对应关系,通过预测模型加入了对第一投放信息中包括的投放用户的属性数据,该属性数据可以包括用户标识和用户画像特征,相当于根据用户的属性数据对第一投放信息进行筛选,得到更为准确的第二投放信息,使得获得的每个广告对象类目对应的投放信息更为准确。
[0175]
实施例5
[0176]
图8所示实施例中,样本用户是根据目标广告投放日志确定的,下面结合图10详细说明一种可实施的确定方式。
[0177]
图10为本技术实施例提供的一种信息获取方法的流程图,该方法的执行主体可以是服务器或终端设备,本实施例中为根据目标广告投放日志确定样本用户的具体过程,如图10所示,本实施例的方法可以包括:
[0178]
s301、根据广告与广告对象类目的映射关系,从目标广告投放日志中选取预设时间段内的至少一个广告对象类目对应的转化人、点击未转化人和曝光未点击人,至少一个广告对象类目为广告与广告对象类目的映射关系中存在的广告对象类目。
[0179]
其中,预设时间段为目标广告投放日志的时间节点之前的时间段,例如为目标广告投放日志的时间节点之前的3天、一周或半个月等等。目标广告投放日志包括多条,每条目标广告投放日志包括用户标识、广告对象类目标识、广告对象类目下用户曝光次数和、广告对象类目下点击次数和以及用户转化次数,例如,从目标广告投放日志中选取目标广告投放日志的时间节点之前的7天内的20个广告对象类目对应的转化人、点击未转化人和曝光未点击人,该20个广告对象类目为广告与广告对象类目的映射关系中存在的广告对象类目。
[0180]
其中,一个广告对象类目的转化人是指接收到该广告对象类目的广告且点击该广告并成为有效的(如购买广告对象)用户人,点击未转化人是指接收到该广告对象类目的广告且点击该广告但未转化的用户人,曝光未点击人是指接收到该广告对象类目的广告但未点击该广告的用户人。
[0181]
s302、从大盘用户中随机选取未曝光人,未曝光人为未看见广告与广告对象类目的映射关系中存在的广告的人。
[0182]
s303、对至少一个广告对象类目中的每个广告对象类目对应的转化人、点击未转化人和曝光未点击人进行降采样处理,以使得转化人、点击未转化人、曝光未点击人和未曝光人之间的比例为预设比例。
[0183]
其中,预设比例可以为1:a:b:c,a、b和c为小于或等于50的值,a、b和c可以相等,例如预设比例可以为1:2:2:3,还可以为1:50:50:50等。
[0184]
s304、将满足预设比例的转化人、点击未转化人、曝光未点击人和未曝光人确定为样本用户,其中,转化人为正样本用户,除转化人之外的人为负样本用户。
[0185]
广告投放的效果取决于转化率,本实施例中,通过根据目标广告投放日志确定样本用户,使得根据样本用户对应的样本数据训练得到的预测模型的准确性高,从而在获取广告的投放信息时,可保证获取的广告的投放信息的准确率。
[0186]
下面结合一个具体的实施例,对本技术实施例提供的信息获取方法的详细过程进
行说明。
[0187]
实施例6
[0188]
下面实施例中,是以目标广告投放日志的确定、广告对象类目与投放信息的对应关系的确定、样本用户的获取、预测模型的训练均是在接收到目标广告的人定向请求后进行的为例说明。
[0189]
图11为本技术实施例提供的一种信息获取方法的流程图,该方法的执行主体可以是服务器或终端设备,如图8所示,本实施例的方法可以包括:
[0190]
s401、获取目标广告对应的广告对象的目标类目。
[0191]
其中,获取目标广告对应的广告对象的目标类目详细过程可参见图2所示实施例中s101部分的描述,此处不再赘述。
[0192]
s402、获取历史广告的投放信息和当前时间之前的历史广告投放日志。
[0193]
其中,历史广告的投放信息为当前时间之前的历史广告的投放信息。
[0194]
本实施例中,例如当前时间之前的历史广告投放日志是每天更新并存储在内存中的。
[0195]
s403、根据广告与广告对象类目的映射关系和历史广告投放日志,确定目标广告投放日志。
[0196]
其中,具体的确定过程可参见图3所示实施例中s1022部分的描述,此处不再赘述。
[0197]
s404、根据广告与广告对象类目的映射关系和历史广告的投放信息,确定历史广告的投放信息中的每个广告对应的广告对象类目的投放信息集合,其中,投放信息集合包括至少一个投放信息。
[0198]
具体地,历史广告的投放信息数量太多,可选的,在确定历史广告的投放信息中的每个广告对应的广告对象类目的投放信息集合时,还可以选取离当前时间最近的时间段内的历史广告的投放信息,例如,历史广告的投放信息为当前时间之前的历史广告的定人,例如为当前时间之前的90天、30天或120天等等。
[0199]
s405、根据每个广告对象类目的投放信息集合和目标广告投放日志,计算每个广告对象类目的投放信息的转化率,投放信息的转化率为投放信息集合包括的每个投放信息的转化率。
[0200]
s406、对于每个广告对象类目,根据广告对象类目对应的投放用户与投放信息的对应关系以及广告对象类目的投放信息的转化率,确定每个投放用户属于广告对象类目的投放信息的概率,概率为每个投放用户所属的投放信息的转化率中的最大转化率。
[0201]
s407、根据每个投放用户属于广告对象类目的投放信息的概率,确定广告对象类目的第一投放信息,其中,广告对象类目的第一投放信息包括广告对象类目对应的投放用户中定向概率最大的预设数量的投放用户。
[0202]
s408、根据目标广告投放日志确定样本用户。
[0203]
具体过程可参见图7所示实施例中s301-s304的描述,此处不再赘述。
[0204]
s409、根据多个样本数据训练预测模型。
[0205]
其中,样本数据包括广告对象类目标识、样本用户的属性数据和样本用户的定向概率,样本用户包括正样本用户和负样本用户,正样本用户的定向概率为1,负样本用户的定向概率为0,样本用户根据目标广告投放日志确定。此处的样本用户为s408确定的样本用
户。
[0206]
在训练预测模型时,预测模型的输入为广告对象类目标识和样本用户的属性数据,预测模型的输出为样本用户的定向概率。
[0207]
s410、对至少一个广告对象类目中的每个广告对象类目,根据预测模型,从每个广告对象类目的第一投放信息中确定出每个广告对象类目的第二投放信息。
[0208]
其中,预测模型的输入为广告对象类目标识和广告对象类目的第一投放信息中的任意一个投放用户的属性数据,预测模型的输出为任意一个投放用户的定向概率,定向概率为投放用户属于输入的广告对象类目标识对应的广告对象类目的投放信息的概率。其中,投放用户的属性数据包括用户标识和用户画像特征,用户画像特征可以包括年龄、性别和地域等信息。
[0209]
可选的,s410具体可以为:对每个广告对象类目,分别将广告对象类目标识和广告对象类目的第一投放信息中的任意一个投放用户的属性数据输入到预测模型,得到每个广告对象类目的第一投放信息中的所有投放用户的定向概率,按照定向概率从大到小的顺序,从每个广告对象类目的第一投放信息中选取预设数量的投放用户作为每个广告对象类目的投放信息。例如,预设数量为5千万。
[0210]
s411、根据每个广告对象类目和每个广告对象类目的第二投放信息,生成广告对象类目与投放信息的对应关系。
[0211]
可选的,在生成对应关系后,可以将对应关系存储在hdfs中。
[0212]
s412、从对应关系中查目标类目的投放信息,将目标类目的投放信息确定为目标广告的投放信息。
[0213]
需要说明的是,s403-s408为确定广告对象类目的第一投放信息的过程,s409-s410为训练预测模型的过程,s403-s408和s409-s410这两个过程可以同时进行以加快速度。
[0214]
以下为本技术装置实施例,可以用于执行本技术上述方法实施例。对于本技术装置实施例中未披露的细节,可参考本技术上述方法实施例。为避免重复,此处不再赘述。
[0215]
实施例7
[0216]
图12为本技术实施例提供的一种信息获取装置100的结构示意图,如图12所示,本实施例的装置可以包括:获取单元110和处理单元120,
[0217]
其中,获取单元110用于:
[0218]
获取目标广告对应的广告对象的目标类目;
[0219]
获取广告对象类目与投放信息的对应关系,对应关系根据历史广告的投放信息和历史广告投放日志生成;
[0220]
处理单元120用于:
[0221]
从对应关系中查目标类目的投放信息;
[0222]
将目标类目的投放信息确定为目标广告的投放信息。
[0223]
可选的,对应关系按照第一预设周期生成并存储于内存中,获取单元110用于从内存中获取对应关系。
[0224]
可选的,获取单元110用于:获取历史广告的投放信息和当前时间之前的历史广告投放日志;
[0225]
根据广告与广告对象类目的映射关系和历史广告投放日志,确定目标广告投放日志;
[0226]
根据历史广告的投放信息和目标广告投放日志生成对应关系。
[0227]
可选的,历史广告投放日志包括用户标识、广告标识、用户曝光次数、点击次数和转化次数,历史广告投放日志按照第二预设周期更新并存储,广告与广告对象类目的映射关系为广告标识与广告对象类目标识的映射关系。获取单元110用于:按照用户标识和广告对象类目标识,对广告与广告对象类目的映射关系和历史广告投放日志进行聚合处理,得到目标广告投放日志,目标广告投放日志包括用户标识、广告对象类目标识、广告对象类目下用户曝光次数和、广告对象类目下点击次数和以及用户转化次数。
[0228]
可选的,获取单元110用于:获取历史广告的投放信息和目标广告投放日志,目标广告投放日志根据广告与广告对象类目的映射关系和预设时间之前的历史广告投放日志确定并存储,预设时间为当前时间之前的时间;
[0229]
根据历史广告的投放信息和目标广告投放日志生成对应关系。
[0230]
进一步地,获取单元110具体用于:
[0231]
根据目标广告投放日志和广告与广告对象类目的映射关系,从历史广告的投放信息中确定出映射关系中存在的每个广告对象类目的第一投放信息;
[0232]
根据映射关系中存在的每个广告对象类目和每个广告对象类目的第一投放信息,生成对应关系。
[0233]
进一步地,获取单元110具体用于:根据广告与广告对象类目的映射关系和历史广告的投放信息,确定历史广告的投放信息中的每个广告对应的广告对象类目的投放信息集合,其中,投放信息集合包括至少一个投放信息;
[0234]
根据每个广告对象类目的投放信息集合和目标广告投放日志,计算每个广告对象类目的投放信息的转化率,投放信息的转化率为投放信息集合包括的每个投放信息的转化率;
[0235]
对于每个广告对象类目,根据广告对象类目对应的投放用户与投放信息的对应关系以及广告对象类目的投放信息的转化率,确定每个投放用户属于广告对象类目的投放信息的概率,概率为每个投放用户所属的投放信息的转化率中的最大转化率;
[0236]
根据每个投放用户属于广告对象类目的投放信息的概率,确定广告对象类目的第一投放信息,其中,广告对象类目的第一投放信息包括广告对象类目对应的投放用户中概率最大的预设数量的投放用户。
[0237]
进一步地,获取单元110具体用于:对每个广告对象类目的投放信息集合,将每个广告对象类目的投放信息集合和目标广告投放日志以用户标识为关键字连接,并以投放信息标识为关键字进行广告对象类目曝光次数、广告对象类目下点击次数和用户转化次数的聚合处理,得到投放信息集合包括的每个投放信息在每个广告对象类目的总曝光次数、总点击次数和总转化次数;
[0238]
根据投放信息集合包括的每个投放信息在每个广告对象类目的总曝光次数、总点击次数和总转化次数,计算每个投放信息的转化率,转化率为总转化次数除以总点击次数的值。
[0239]
进一步地,获取单元110用于:
[0240]
对映射关系中存在的每个广告对象类目,根据预先训练的预测模型,从每个广告对象类目的第一投放信息中确定出每个广告对象类目的第二投放信息,预测模型的输入为广告对象类目标识和广告对象类目的第一投放信息中的任意一个投放用户的属性数据,预测模型的输出为任意一个投放用户的定向概率,定向概率为投放用户属于预测模型输入的广告对象类目标识对应的广告对象类目的投放信息的概率;
[0241]
根据每个广告对象类目和每个广告对象类目的第二投放信息,生成对应关系。
[0242]
进一步地,获取单元110具体用于:对每个广告对象类目,分别将广告对象类目标识和广告对象类目的第一投放信息中的任意一个投放用户的属性数据输入到预测模型,得到每个广告对象类目的第一投放信息中的所有投放用户的定向概率;
[0243]
按照定向概率从大到小的顺序,从每个广告对象类目的第一投放信息中选取预设数量的投放用户作为每个广告对象类目的投放信息。
[0244]
可选的,预测模型为对多个样本数据训练得到的,样本数据包括广告对象类目标识、样本用户的属性数据和样本用户的定向概率,样本用户包括正样本用户和负样本用户,正样本用户的定向概率为1,负样本用户的定向概率为0,样本用户根据目标广告投放日志确定。
[0245]
可选的,样本用户根据目标广告投放日志通过如下方式确定:
[0246]
根据广告与广告对象类目的映射关系,从目标广告投放日志中选取预设时间段内的至少一个广告对象类目对应的转化人、点击未转化人和曝光未点击人,至少一个广告对象类目为广告与广告对象类目的映射关系中存在的广告对象类目,预设时间段为目标广告投放日志的时间节点之前的时间段;
[0247]
从大盘用户中随机选取未曝光人,未曝光人为未看见广告与广告对象类目的映射关系中存在的广告的人;
[0248]
对至少一个广告对象类目中的每个广告对象类目对应的转化人、点击未转化人和曝光未点击人进行降采样处理,以使得转化人、点击未转化人、曝光未点击人和未曝光人之间的比例为预设比例;
[0249]
将满足预设比例的转化人、点击未转化人、曝光未点击人和未曝光人确定为样本用户,其中,转化人为正样本用户,除转化人之外的人为负样本用户。
[0250]
可选的,广告与广告对象类目的映射关系根据广告与广告对象的映射关系和广告对象与广告对象类目的映射关系确定。
[0251]
本技术实施例提供的装置,可执行上述方法实施例,其具体实现原理和技术效果,可参见上述方法实施例,本实施例此处不再赘述。
[0252]
实施例8
[0253]
图13是本技术实施例提供的信息获取设备200的示意性框图。
[0254]
如图13所示,该信息获取设备200可包括:
[0255]
存储器210和处理器220,该存储器210用于存储计算机程序,并将该程序代码传输给该处理器220。换言之,该处理器220可以从存储器210中调用并运行计算机程序,以实现本技术实施例中的方法。
[0256]
例如,该处理器220可用于根据该计算机程序中的指令执行上述方法实施例。
[0257]
在本技术的一些实施例中,该处理器220可以包括但不限于:
[0258]
通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等等。
[0259]
在本技术的一些实施例中,该存储器210包括但不限于:
[0260]
易失性存储器和/或非易失性存储器。其中,非易失性存储器可以是只读存储器(read-only memory,rom)、可编程只读存储器(programmable rom,prom)、可擦除可编程只读存储器(erasable prom,eprom)、电可擦除可编程只读存储器(electrically eprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(static ram,sram)、动态随机存取存储器(dynamic ram,dram)、同步动态随机存取存储器(synchronous dram,sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram,ddr sdram)、增强型同步动态随机存取存储器(enhanced sdram,esdram)、同步连接动态随机存取存储器(synch link dram,sldram)和直接内存总线随机存取存储器(direct rambus ram,dr ram)。
[0261]
在本技术的一些实施例中,该计算机程序可以被分割成一个或多个模块,该一个或者多个模块被存储在该存储器210中,并由该处理器220执行,以完成本技术提供的方法。该一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述该计算机程序在该信息获取设备中的执行过程。
[0262]
如图13所示,该信息获取设备还可包括:
[0263]
收发器230,该收发器230可连接至该处理器220或存储器210。
[0264]
其中,处理器220可以控制该收发器230与其他设备进行通信,具体地,可以向其他设备发送信息或数据,或接收其他设备发送的信息或数据。收发器230可以包括发射机和接收机。收发器230还可以进一步包括天线,天线的数量可以为一个或多个。
[0265]
应当理解,该信息获取设备中的各个组件通过总线系统相连,其中,总线系统除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。
[0266]
本技术还提供了一种计算机存储介质,其上存储有计算机程序,该计算机程序被计算机执行时使得该计算机能够执行上述方法实施例的方法。或者说,本技术实施例还提供一种包含指令的计算机程序产品,该指令被计算机执行时使得计算机执行上述方法实施例的方法。
[0267]
当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时,全部或部分地产生按照本技术实施例该的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设
备。该可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如数字视频光盘(digital video disc,dvd))、或者半导体介质(例如固态硬盘(solid state disk,ssd))等。
[0268]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0269]
在本技术所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,该模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0270]
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。例如,在本技术各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
[0271]
以上,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以该权利要求的保护范围为准。

技术特征:


1.一种信息获取方法,其特征在于,包括:获取目标广告对应的广告对象的目标类目;获取广告对象类目与投放信息的对应关系,所述对应关系根据历史广告的投放信息和历史广告投放日志生成;从所述对应关系中查所述目标类目的投放信息;将所述目标类目的投放信息确定为所述目标广告的投放信息。2.根据权利要求1所述的方法,其特征在于,所述对应关系按照第一预设周期生成并存储于内存中;所述获取广告对象类目与投放信息的对应关系,包括:从所述内存中获取所述对应关系。3.根据权利要求1所述的方法,其特征在于,所述获取广告对象类目与投放信息的对应关系,包括:获取所述历史广告的投放信息和当前时间之前的历史广告投放日志;根据广告与广告对象类目的映射关系和所述历史广告投放日志,确定目标广告投放日志;根据所述历史广告的投放信息和所述目标广告投放日志生成所述对应关系。4.根据权利要求3所述的方法,其特征在于,所述历史广告投放日志包括用户标识、广告标识、用户曝光次数、点击次数和转化次数,所述历史广告投放日志按照第二预设周期更新并存储,所述广告与广告对象类目的映射关系为广告标识与广告对象类目标识的映射关系;所述根据广告与广告对象类目的映射关系和所述历史广告投放日志,确定所述目标广告投放日志,包括:按照所述用户标识和所述广告对象类目标识,对所述广告与广告对象类目的映射关系和所述历史广告投放日志进行聚合处理,得到所述目标广告投放日志,所述目标广告投放日志包括用户标识、广告对象类目标识、广告对象类目下用户曝光次数和、广告对象类目下点击次数和以及用户转化次数。5.根据权利要求1所述的方法,其特征在于,所述获取广告对象类目与投放信息的对应关系,包括:获取所述历史广告的投放信息和目标广告投放日志,所述目标广告投放日志根据广告与广告对象类目的映射关系和预设时间之前的历史广告投放日志确定并存储,所述预设时间为当前时间之前的时间;根据所述历史广告的投放信息和所述目标广告投放日志生成所述对应关系。6.根据权利要求3或5所述的方法,其特征在于,所述根据所述历史广告的投放信息和所述目标广告投放日志生成所述对应关系,包括:根据所述目标广告投放日志和所述广告与广告对象类目的映射关系,从所述历史广告的投放信息中确定出所述映射关系中存在的每个广告对象类目的第一投放信息;根据所述映射关系中存在的每个广告对象类目和所述每个广告对象类目的第一投放信息,生成所述对应关系。7.根据权利要求6所述的方法,其特征在于,所述根据所述目标广告投放日志和所述广
告与广告对象类目的映射关系,从所述历史广告的投放信息中确定出所述映射关系中存在的每个广告对象类目的第一投放信息,包括:根据所述广告与广告对象类目的映射关系和所述历史广告的投放信息,确定所述历史广告的投放信息中的每个广告对应的广告对象类目的投放信息集合,其中,所述投放信息集合包括至少一个投放信息;根据每个广告对象类目的投放信息集合和所述目标广告投放日志,计算所述每个广告对象类目的投放信息的转化率,所述投放信息的转化率为所述投放信息集合包括的每个投放信息的转化率;对于每个广告对象类目,根据所述广告对象类目对应的投放用户与投放信息的对应关系以及所述广告对象类目的投放信息的转化率,确定每个投放用户属于所述广告对象类目的投放信息的概率,所述概率为每个投放用户所属的投放信息的转化率中的最大转化率;根据所述每个投放用户属于所述广告对象类目的投放信息的概率,确定所述广告对象类目的第一投放信息,其中,所述广告对象类目的第一投放信息包括所述广告对象类目对应的投放用户中所述概率最大的预设数量的投放用户。8.根据权利要求7所述的方法,其特征在于,所述根据每个广告对象类目的投放信息集合和所述目标广告投放日志,计算所述每个广告对象类目的投放信息的转化率,包括:对所述每个广告对象类目的投放信息集合,将所述每个广告对象类目的投放信息集合和所述目标广告投放日志以用户标识为关键字连接,并以投放信息标识为关键字进行广告对象类目曝光次数、广告对象类目下点击次数和用户转化次数的聚合处理,得到所述投放信息集合包括的每个投放信息在每个广告对象类目的总曝光次数、总点击次数和总转化次数;根据所述投放信息集合包括的每个投放信息在每个广告对象类目的总曝光次数、总点击次数和总转化次数,计算每个投放信息的转化率,所述转化率为所述总转化次数除以所述总点击次数的值。9.根据权利要求6所述的方法,其特征在于,所述根据所述映射关系中存在的每个广告对象类目和所述每个广告对象类目的第一投放信息,生成所述对应关系,包括:对所述映射关系中存在的每个广告对象类目,根据预先训练的预测模型,从所述每个广告对象类目的第一投放信息中确定出每个广告对象类目的第二投放信息,所述预测模型的输入为广告对象类目标识和广告对象类目的第一投放信息中的任意一个投放用户的属性数据,所述预测模型的输出为所述任意一个投放用户的定向概率,所述定向概率为投放用户属于所述预测模型输入的广告对象类目标识对应的广告对象类目的投放信息的概率;根据每个广告对象类目和每个广告对象类目的第二投放信息,生成所述对应关系。10.根据权利要求9所述的方法,其特征在于,所述根据预先训练的预测模型,从每个广告对象类目的第一投放信息中确定出每个广告对象类目的第二投放信息,包括:对所述每个广告对象类目,分别将广告对象类目标识和广告对象类目的第一投放信息中的任意一个投放用户的属性数据输入到所述预测模型,得到每个广告对象类目的第一投放信息中的所有投放用户的定向概率;按照定向概率从大到小的顺序,从每个广告对象类目的第一投放信息中选取预设数量的投放用户作为每个广告对象类目的第二投放信息。
11.根据权利要求9所述的方法,其特征在于,所述预测模型为对多个样本数据训练得到的,所述样本数据包括广告对象类目标识、样本用户的属性数据和样本用户的定向概率,所述样本用户包括正样本用户和负样本用户,所述正样本用户的定向概率为1,所述负样本用户的定向概率为0,所述样本用户根据所述目标广告投放日志确定。12.根据权利要求11所述的方法,其特征在于,所述样本用户根据所述目标广告投放日志通过如下方式确定:根据所述广告与广告对象类目的映射关系,从所述目标广告投放日志中选取预设时间段内的所述映射关系中存在的每个广告对象类目对应的转化人、点击未转化人和曝光未点击人,所述每个广告对象类目为所述广告与广告对象类目的映射关系中存在的广告对象类目,所述预设时间段为所述目标广告投放日志的时间节点之前的时间段;从大盘用户中随机选取未曝光人,所述未曝光人为未看见所述广告与广告对象类目的映射关系中存在的广告的人;对所述每个广告对象类目对应的转化人、点击未转化人和曝光未点击人进行降采样处理,以使得所述转化人、点击未转化人、曝光未点击人和未曝光人之间的比例为预设比例;将满足所述预设比例的所述转化人、所述点击未转化人、所述曝光未点击人和所述未曝光人确定为所述样本用户,其中,所述转化人为正样本用户,除所述转化人之外的人为负样本用户。13.一种信息获取装置,其特征在于,包括:获取单元和处理单元;所述获取单元用于:获取所述目标广告对应的广告对象的目标类目;获取广告对象类目与投放信息的对应关系,所述对应关系根据历史广告的投放信息和历史广告投放日志生成;所述处理单元用于:从所述对应关系中查所述目标类目的投放信息;将所述目标类目的投放信息确定为所述目标广告的投放信息。14.一种信息获取设备,其特征在于,包括:处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,以执行权利要求1至12中任一项所述的方法。15.一种计算机可读存储介质,其特征在于,用于存储计算机程序,所述计算机程序使得计算机执行如权利要求1至12中任一项所述的方法。

技术总结


本申请提供了一种信息获取方法、装置、设备及存储介质,涉及广告投放技术领域,该方法包括:获取目标广告对应的广告对象的目标类目,获取广告对象类目与投放信息的对应关系,该对应关系根据历史广告的投放信息和历史广告投放日志生成,从该对应关系中查目标类目的投放信息,将目标类目的投放信息确定为目标广告的投放信息。从而,提高了获取广告的投放信息的效率,且广告主的操作简单。且广告主的操作简单。且广告主的操作简单。


技术研发人员:

张思远

受保护的技术使用者:

腾讯科技(深圳)有限公司

技术研发日:

2021.06.23

技术公布日:

2022/12/22

本文发布于:2024-09-20 14:25:13,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/46835.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:广告   类目   对象   信息
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议