落地页文案添加方法、模型训练方法、装置及电子设备与流程



1.本公开涉及计算机视觉、深度学习、自然语言处理(natural language processing,nlp)等人工智能技术领域,尤其涉及一种落地页文案添加方法、模型训练方法、装置及电子设备。


背景技术:



2.落地页是向用户展示信息的页面,目前在一些落地页上可以展示一些文案,但目前落地页的文案一般是落地页生成之前人工手动编辑的,具体为用户在计算机编辑文案,并发送给落地页的服务器。


技术实现要素:



3.本公开提供了一种落地页文案添加方法、模型训练方法、装置及电子设备。
4.根据本公开的一方面,提供了一种落地页文案添加方法,包括:
5.提取落地页的第一特征信息;
6.基于所述第一特征信息对所述落地页执行文案生成操作,得到操作结果;
7.在所述操作结果表示未获取到所述落地页的有效文案的情况下,基于所述落地页的第二特征信息和行业信息中的至少一项,获取所述落地页的兜里文案;
8.基于候选文案,在所述落地页上添加文案,其中,在所述操作结果表示未获取到所述落地页的有效文案的情况下,所述候选文案包括所述兜里文案。
9.根据本公开的一方面,提供了一种模型训练方法,包括:
10.获取源文本和目标文本,其中,所述源文本包括如下至少一项:将第一样本落地页相关的业务信息在第一源训练样本前置得到的源文本、将第二样本落地页相关的地域信息在第二源训练样本前置得到的源文本;其中,所述第一源训练样本和所述第二源训练样本为预先设定的训练样本;和/或,所述目标文本包括:将多媒体创意中转化满足预设条件的关键词填充到创意标题得到的目标文本,所述多媒体创意为通过搜索引擎搜索到的多媒体创意,所述创意标题为所述多媒体创意的标题;
11.基于所述源文本和所述目标文本对预设网络模型进行训练,得到文本生成模型;其中,所述文本生成模型用于基于落地页的特征信息生成所述落地页的文案。
12.根据本公开的另一方面,提供了一种落地页文案添加装置,包括:
13.提取模块,用于提取落地页的第一特征信息;
14.生成模块,用于基于所述第一特征信息对所述落地页执行文案生成操作,得到操作结果;
15.获取模块,用于在所述操作结果表示未获取到所述落地页的有效文案的情况下,基于所述落地页的第二特征信息和行业信息中的至少一项,获取所述落地页的兜里文案;
16.添加模块,用于基于候选文案,在所述落地页上添加文案,其中,在所述操作结果表示未获取到所述落地页的有效文案的情况下,所述候选文案包括所述兜里文案。
17.根据本公开的另一方面,提供了一种模型训练装置,包括:
18.获取模块,用于获取源文本和目标文本,其中,所述源文本包括如下至少一项:将第一样本落地页相关的业务信息在第一源训练样本前置得到的源文本、将第二样本落地页相关的地域信息在第二源训练样本前置得到的源文本;其中,所述第一源训练样本和所述第二源训练样本为预先设定的训练样本;和/或,所述目标文本包括:将多媒体创意中转化满足预设条件的关键词填充到创意标题得到的目标文本,所述多媒体创意为通过搜索引擎搜索到的多媒体创意,所述创意标题为所述多媒体创意的标题;
19.训练模块,用于基于所述源文本和所述目标文本对预设网络模型进行训练,得到文本生成模型;其中,所述文本生成模型用于基于落地页的特征信息生成所述落地页的文案。
20.根据本公开的另一方面,提供了一种电子设备,包括:
21.至少一个处理器;以及
22.与所述至少一个处理器通信连接的存储器;其中,
23.所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开提供的落地页文案添加方法或者模型训练方法。
24.根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开提供的落地页文案添加方法或者模型训练方法。
25.根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开提供的落地页文案添加方法或者模型训练方法。
26.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
27.附图用于更好地理解本方案,不构成对本公开的限定。其中:
28.图1是本公开提供的一种落地页文案添加方法的流程图;
29.图2是本公开提供的一种模型训练方法的流程图;
30.图3是本公开提供的一种落地页文案添加方法的示意图;
31.图4a至图4c是本公开提供的落地页文案添加装置的结构图;
32.图5是本公开提供的一种模型训练装置的结构图;
33.图6是用来实现本公开实施例的一种电子设备的框图。
具体实施方式
34.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
35.请参见图1,图1是本公开提供的一种落地页文案添加方法的流程图,如图1所示,
包括以下步骤:
36.步骤s101、提取落地页的第一特征信息。
37.其中,上述落地页可以是广告落地页,也可以是展示其他多媒体信息的落地页,如企业宣传信息的落地页。
38.上述提取落地页的第一特征信息可以是提取落地页的文本和图像中至少一项特征信息。
39.步骤s102、基于所述第一特征信息对所述落地页执行文案生成操作,得到操作结果。
40.上述基于第一特征信息对所述落地页执行文案生成操作可以是,通过预先获取的文本生成模型,基于第一特征信息对所述落地页执行文案生成操作,即通过该文本生成模型对上述落地页进行文案预测。或者,上述基于第一特征信息对所述落地页执行文案生成操作可以是,将上述第一特征信息中的文本信息进行文案拼接。
41.需要说明的是,上述操作结果可以包括如下任一项:
42.未生成上述落地页的文案,例如:上述第一特征信息的有效内容不足,导致无法生成落地页的文案;
43.生成上述落地页的文案,但生成的文案不满足预设条件,如生成的文案中的核心词不在上述落地页内,或者,生成的文案的品牌与上述落地页不匹配等;
44.生成上述落地页的候选文案,生成的候选文案为有效文案。
45.步骤s103、在所述操作结果表示未获取到所述落地页的有效文案的情况下,基于所述落地页的第二特征信息和行业信息中的至少一项,获取所述落地页的兜里文案。
46.上述操作结果表示未获取到所述落地页的有效文案可以是,上述操作结果表示的文案不满足预设条件,如生成的文案中的核心词不在上述落地页内,或者,生成的文案的品牌与上述落地页不匹配等;或者,上述操作结果表示未获取到所述落地页的有效文案可以是,上述操作结果中没有文案,即上述文案生成操作没有生成文案;或者,上述操作结果表示未获取到所述落地页的有效文案可以是,上述操作结果中的候选文案的数量未达到预设数量;或者,上述操作结果表示未获取到所述落地页的有效文案可以是,生成的文案未覆盖上述落地页。
47.上述有效文案可以是满足预设条件的文案,如核心词在上述落地页内,或者,文案的品牌与上述落地页匹配等。或者,上述有效文案可以是预设数量文案,即生成的文案数量达到预设数量才有效。
48.上述第二特征信息可以是上述落地页的文本和图像中至少一项,且上述第二特征信息与上述第一特征信息可以存在交集,或者,上述第二特征信息与上述第一特征信息为不同的特征信息。
49.上述行业信息表示上述落地页所属的行业,例如:装修行业、汽车行业、法律行业等。
50.上述基于所述落地页的第二特征信息和行业信息中的至少一项,获取所述落地页的兜里文案可以是,基于所述落地页的第二特征信息生成上述落地页的兜里文案,或者,可以是基于行业信息在上述落地页所属的行业中获取文案作为兜里文案,或者,上述兜里文案包括基于第二特征信息生成的文案和基于上述行业信息获取的文案。
51.步骤s104、基于候选文案,在所述落地页上添加文案,其中,在所述操作结果表示未获取到所述落地页的有效文案的情况下,所述候选文案包括所述兜里文案。
52.上述候选文案包括兜里文案可以是,上述候选文案为上述兜里文案;或者,上述候选文案除了包括上述兜里文案,还可以包括上述操作结果中的文案,其中,上述操作结果中的文案数量未达到上述有效文案对应的预设数量,也就是说,上述操作结果虽然有文案,但由于文案数量未达标,从而表示未获取到落地页的有效文案。
53.在一些实施方式中,在上述操作结果表示获取到落地页的有效文案的情况下,上述候选文案包括上述操作结果中的有效文案。
54.需要说明的是,上述候选文案可以是一个或者多个文案,且在落地页上添加的文案可以是添加一个或者多个文案。
55.上述在落地页上添加文案可以是,以弹窗或者引导浮层等形式添加文案,其中,引导浮层也可以称作引导蒙版。
56.本公开中,由于在未获取到落地页的有效文案的情况下,基于落地页的第二特征信息和行业信息中的至少一项,获取落地页的兜里文案,这样可以使得获取的兜里文案是与落地页匹配的,从而可以避免在未获取到有效文案时无法在落地页添加匹配文案的情况,进而提高落地页的文案效果。
57.需要说明的是,本公开的落地页文案添加方法由电子设备执行,即上述方法包括的所有步骤由该电子设备执行,该电子设备可以是服务器、计算机、手机等电子设备。
58.在一个实施例中,图1所示的实施例中的基于所述落地页的第二特征信息和行业信息中的至少一项,获取所述落地页的兜里文案,包括如下至少一项:
59.提取所述落地页的第二特征信息,对所述第二特征信息进行拼接,得到所述落地页的兜里文案,所述第二特征信息包括关键片段信息和业务信息中的至少一项;
60.获取所述落地页的行业信息,基于所述行业信息获取所述落地页所属行业内点击率满足预设条件的目标文案,将所述目标文案作为所述落地页的兜里文案,其中,所述目标文案不包含业务信息。
61.上述关键片段信息可以是上述落地页中的关键词语,例如:在上述落地页中识别多个片段信息,每个片段信息包括词语,在这些词语中识别关键词语,例如:“极速上门”、“价低质优”、“品质保证”等。
62.上述行业信息可以是上述落地页中的行业短语,例如:“xx家政服务”、“xx装修”等。
63.上述对所述第二特征信息进行拼接可以是,将关键片段信息和业务信息进行拼接,例如:业务信息是“xx家政服务”,关键片段信息是“极速上门”,则拼接之后的兜里文案为“xx家政服务,极速上门”。或者,上述对第二特征信息进行拼接可以是,对多个关键片段信息进行拼接,例如:关键片段信息包括“极速上门”和“品质保证”,则拼接之后的兜里文案为“极速上门,品质保证”。
64.该实施例中,由于生成包括第二特征信息的兜里文案,这样可以提高兜里文案与落地页的匹配度,以进一步提高落地页的文案效果。
65.上述落地页所属行业内点击率满足预设条件的目标文案可以是,提取上述行业内点击率最高的一个或者多个文案,或者点击率达到预设阈值的文案,且上述目标文案可以
是用户编写的转化直达文案。通过上述目标文案可以快速获取到落地页的兜里文案,另外,由于上述目标文案不包含业务信息,这样使得目标文案具有很强的通用性,以满足不同落地页的需求。
66.在一些实施方式中,可以预先获取多个行业内的目标文案,这样针对不同行业的落地页可以快速生成兜里文案,以避免开通转化直达功能的落地页由于数据延迟的冷启动问题无法涉及生成文案。
67.在一个实施例,上述提取所述落地页的第二特征信息,包括:
68.提取所述落地页中的多个片段信息;
69.对所述多个片段信息评分,得到每个片段信息的分值;
70.在所述多个片段信息中选择至少一个片段信息作为所述关键片段信息,所述至少一个片段信息的分值高于所述多个片段信息中的其他片段信息的分值。
71.其中,上述对多个片段信息评分可以是按照预先的评分规则,对每个片段信息进行评分,例如:基于片段信息与落地页主题的规则对片段信息进行评分,或者,基于预先获取的评分模型对每个片段信息进行评分,如基于nlp文本评分模型对每个片段信息进行评分。
72.该实施例中,可以选择分值最高的关键片段信息,而分值最高的关键片段信息往往为落地页的优势片段信息,这样可以实现基于落地页的优势片段信息生成兜里文案,以提高兜里文案的文案效果。
73.在一个实施例中,所述对所述多个片段信息评分,得到每个片段信息的分值,包括:
74.提取目标片段信息中的文本特征信息;
75.计算所述文本特征信息与预设文本特征信息的重合度,基于所述重合度计算所述目标片段信息的分值;
76.其中,所述目标片段信息为所述多个片段信息中任一片段信息。
77.其中,上述预设文本特征信息可以是预先设定的目标文本,该目标文本为具备高转化率、高查准率或者高召回率等的文本,具体可以根据实际需求设定上述预设文本特征信息。
78.在一些实施方式中,上述提取文本特征信息和计算分值可以是通过nlp文本评分模型来实现,这样可以提高评分的效率。
79.该实施例中,由于上述目标片段信息为上述任一片段信息,这样可以实现每个片段信息都基于上述规则进行评分,从而实现选择与上述预设文本特征信息的重合度最高的关键片段信息,以提高上述兜里文案的文案效果。
80.需要说明的是,本公开并不限定通过上述评分的方式选择上述关键片段信息,例如:在一些实施例中,提取多个片段信息与上述落地页的主题名称相同或者相关的关键片段信息。
81.在一个实施例中,图1所示实施例中步骤s104包括:
82.对所述候选文案进行过滤处理,在所述落地页上添加过滤后的文案,其中,所述过滤处理包括如下至少一项:
83.核心词过滤、品牌过滤和片段过滤。
84.其中,上述核心词过滤包括:识别所述候选文案中的核心词,对所述核心词进行验证,在所述候选方案中包括第一文案的情况下,删除所述第一文案,所述落地页不包括所述第一文案的所述核心词。
85.上述核心词可以是通过预先获取的核心词识别模型进行识别,例如:通过定制自然语言处理(nlp customization,nlpc)核心词识别模型识别候选文案中的核心词。
86.上述落地页不包括所述第一文案的所述核心词可以是,落地页的光学字符识别(optical character recognition,ocr)文本不包括第一文案的核心词。
87.通过上述核心词过滤可以,过滤掉核心词不属于上述落地页的候选文案,以提高最终添加的文案与落地页的匹配度。
88.其中,所述品牌过滤包括:识别所述候选文案中的品牌信息,对所述品牌信息进行验证,在所述候选方案中包括第二文案的情况下,删除所述第二文案,所述落地页与所述第二文案的所述品牌信息不匹配。
89.上述品牌信息可以是通过预先获取的品牌识别模型识别候选文案中的品牌信息。
90.通过上述品牌过滤可以,过滤掉品牌信息不属于上述落地页的候选文案,以提高最终添加的文案与落地页的匹配度。
91.其中,上述片段过滤包括:识别所述候选文案中的预设类型的片段内容,对所述片段内容进行验证,在所述候选方案中包括第三文案的情况下,删除所述第三文案,所述落地页不包括所述第三文案的所述片段内容。
92.上述预设类型的片段内容可以是,营销内容的片段内容,即上述候选文案中营销片段内容。例如:某候选文案中包括:“立享x折”、“首付x元”、“免费”等营销话术片段,这样通过上述验证可以过滤掉不在上述落地页中出现的营销话术片段,以提高最终添加的文案与落地页的匹配度。
93.在一些实施方式中,对所述候选文案进行过滤处理可以是,对上述兜里文案进行过滤,因为,在一些实施方式中,上述候选文案可以是包括上述兜里文案,以及还包括通过上述文案生成操作得到已经过滤的候选文案。
94.在一个实施例中,在所述落地页上添加的文案为目标文案,所述目标文案包括多个信息,所述方法还包括:
95.将所述多个信息分别输入到信息识别模型进行关键点信息预测,得到所述目标文案的关键点信息,所述信息识别模型为用于识别文案的关键点信息的网络模型;
96.在所述落地页上对所述关键点信息进行突出展示。
97.上述信息识别模型为预先获取的,用于识别目标文案中准确率、查准率、召回率等中至少一项最高的关键点信息。上述关键点信息也可以称作上述目标文案的卖点信息。
98.上述在落地页上对关键点信息进行突出展示可以是,对上述关键点信息进行飘红,以突击上述关键点信息。例如:目标文案为“正负压成型裁切一体机,质量保障《b》支持定制《/b》”,其中“《b》”“《/b》”之间的片段(支持定制)为红。
99.该实施例中,由于在落地页上对所述关键点信息进行突出展示,这样可以提高文案信息的展示效果,这样当用户浏览上述落地页时可以快速查看到上述关键点信息。例如:对于转化直达文案,可以进一步突出转化直达文案,提升广告转化效率。
100.在一个实施例中,图1所示实施例中的步骤s102,包括:
101.通过文本生成模型,基于所述第一特征信息对所述落地页执行文案生成操作,得到操作结果;
102.其中,所述文本生成模型为用于基于所述落地页的所述第一特征信息,生成所述落地页的文案的网络模型。
103.上述第一特征信息为将落地页作为文本生成模型的输入而提取的特征信息。
104.上述文本生成模型可以是自然语言处理(natural language processing,nlp)模型,如文心(ernie-gen)模型,对此不作限定,在一些实施方式,上述文本生成模型也可以是注意力模型(attention model),在一些实施方式中,上述文本生成模型也可以是屏蔽序列到序列预训练(masked sequence to sequence pre-training,mass)模型。
105.在一些实施例中,上述文本生成模型可以为上述落地页生成约10条文案。其中,当落地页的页面有效内容不足、模型生成结果未通过预设条件等原因时,上述操作结果表示未获取到所述落地页的有效文案。
106.该实施例中,由于通过文本生成模型执行文案生成操作,从而可以提高候选文案的生成效率。
107.在一个实施例中,所述文本生成模型为基于源文本和目标文本进行训练得的文本生成模型;
108.所述源文本包括如下至少一项:将第一样本落地页相关的业务信息在第一源训练样本前置得到的源文本、将第二样本落地页相关的地域信息在第二源训练样本前置得到的源文本;其中,所述第一源训练样本和所述第二源训练样本为预先设定的训练样本;和/或,
109.所述目标文本包括如下至少一项:创意标题、将多媒体创意中转化满足预设条件的关键词填充到创意标题得到的目标文本,其中,所述多媒体创意为通过搜索引擎搜索到的多媒体创意,所述创意标题为所述多媒体创意的标题。
110.上述源文本和目标文本为文本生成模型为训练过程中使用的源文本和目标文本。
111.上述第一样本落地页和第二样本落地页可以是相同或者不同的落地页,且可以是一个或者多个落地页。
112.上述第一源训练样本和第二源训练样本可以是语料库中的训练文本。
113.上述将第一样本落地页相关的业务信息在第一源训练样本前置得到的源文本可以是,为了对每条训练样本圈定一个域(domain),将第一样本落地页相关的业务信息添加到该域中。例如:将与落地页相关性最大的10条业务短语(如:“多功能正负压机厂家”),分别在10个训练样本的源文本中前置。上述前置在源训练样本中的最前面添加业务信息。
114.上述将第二样本落地页相关的地域信息在第二源训练样本前置得到的源文本可以是,将第二样本落地页中的地域信息(如“上海”)在第二源训练样本。
115.在一些实施方式中,可以在同一源训练样本前置业务信息和地域信息得到源文本。
116.该实施例中,通过前置业务信息,可以使得源文本与落地页的相关性更强和更加丰富,以提高文本生成模型的预测准确性。而通过前置地域信息,可以显式地指出地域之间的关联,防止文本生成模型错误的学习地域关系,进而提高文本生成模型的预测准确性。
117.上述目标文本可以是,使用搜索引擎搜索结果的创意标题(如“如何选购{xxxx},厂家直销,价低同行”),代替用户自己编写的转化直达文案,作为文本生成模型微调的目标
文本。
118.或者,上述目标文本可以是,将多媒体创意(例如:广告创意)的转化量最高的关键词(如“多功能正负压一体机”)填充到创意标题中,得到更加完整的目标文本。
119.该实施例中,通过创意标题和多媒体创意中的关键词生成目标文本,这样由于搜索的创意标题相对优质,且在文案风格、文案和落地页相关性上都和转化直达文案相近,这样通过上述目标文本可以提升微调数据的数据量。
120.另外,上述创意标题还可以是搜索到的在一段时间内有展现的创意标题(如“如何选购多功能正负压一体机?厂家直销,价低同行”),这样在一定程度上保证了目标文本的质量和转化效率,进而提高文本生成模型的预测准确性。
121.在一些实施例中,上述添加的文案可以是转化直达文案,这样通过该文案可以提高落地页的转化率。
122.本公开中,由于在未获取到落地页的有效文案的情况下,基于落地页的第二特征信息和行业信息中的至少一项,获取落地页的兜里文案,这样可以使得获取的兜里文案是与落地页匹配的,从而可以避免在未获取到有效文案时无法在落地页添加匹配文案的情况,进而提高落地页的文案效果。
123.请参见图2,图2是本公开提供的一种模型训练方法的流程图,如图2所示,包括以下步骤:
124.步骤s201、获取源文本和目标文本,其中,所述源文本包括如下至少一项:将第一样本落地页相关的业务信息在第一源训练样本前置得到的源文本、将第二样本落地页相关的地域信息在第二源训练样本前置得到的源文本;其中,所述第一源训练样本和所述第二源训练样本为预先设定的训练样本;和/或,所述目标文本包括:将多媒体创意中转化满足预设条件的关键词填充到创意标题得到的目标文本,所述多媒体创意为通过搜索引擎搜索到的多媒体创意,所述创意标题为所述多媒体创意的标题;
125.步骤s202、基于所述源文本和所述目标文本对预设网络模型进行训练,得到文本生成模型;其中,所述文本生成模型用于基于落地页的特征信息生成所述落地页的文案。
126.其中,上述源文本、目标文本和文本生成模型可以参见上述落地页文案添加方法实施例的相应说明,此处不作赘述。
127.该实施例中,由于基于上述源文本和所述目标文本对预设网络模型进行训练,得到文本生成模型,从而提高文本生成模型的预测准确性。
128.需要说明的是,本公开的模型训练方法由电子设备执行,即上述方法包括的所有步骤由该电子设备执行,该电子设备可以是服务器、计算机、手机等电子设备。
129.需要说明的是,本公开提供的多种实施例可以单独实现,也可以相互结合实现,例如:如图3所示,在一种技术方案中包括如下内容:
130.301、文本生成模型,其中,文本生成模型可以基于落地页的业务信息、地域和ocr数据,以及搜索广告创意标题训练得到;
131.302、兜里文案生成,兜里文案可以基于落地页优势片段拼接得到,还可以包括行业高点击率的通用文案;
132.303、后处理,后处理包括:过滤和关键点信息飘红,其中,过滤包括:核心词过滤、品牌过滤和片段过滤。
133.请参见图4a,图4a是本公开提供的一种落地页文案添加装置,如图4a所示,落地页文案添加装置400包括:
134.提取模块401,用于提取落地页的第一特征信息;
135.生成模块402,用于基于所述第一特征信息对所述落地页执行文案生成操作,得到操作结果;
136.获取模块403,用于在所述操作结果表示未获取到所述落地页的有效文案的情况下,基于所述落地页的第二特征信息和行业信息中的至少一项,获取所述落地页的兜里文案;
137.添加模块404,用于基于候选文案,在所述落地页上添加文案,其中,在所述操作结果表示未获取到所述落地页的有效文案的情况下,所述候选文案包括所述兜里文案。
138.在一个实施例中,如图4b所示,所述获取模块403,包括如下至少一项:
139.拼接单元4031,用于提取所述落地页的第二特征信息,对所述第二特征信息进行拼接,得到所述落地页的兜里文案,所述第二特征信息包括关键片段信息和业务信息中的至少一项;
140.获取单元4032,用于获取所述落地页的行业信息,基于所述行业信息获取所述落地页所属行业内点击率满足预设条件的目标文案,将所述目标文案作为所述落地页的兜里文案,其中,所述目标文案不包含业务信息。
141.在一个实施例中,所述拼接单元4031用于:
142.提取所述落地页中的多个片段信息;
143.对所述多个片段信息评分,得到每个片段信息的分值;
144.在所述多个片段信息中选择至少一个片段信息作为所述关键片段信息,所述至少一个片段信息的分值高于所述多个片段信息中的其他片段信息的分值。
145.在一个实施例中,所述拼接单元4031用于:
146.提取目标片段信息中的文本特征信息;
147.计算所述文本特征信息与预设文本特征信息的重合度,基于所述重合度计算所述目标片段信息的分值;
148.其中,所述目标片段信息为所述多个片段信息中任一片段信息。
149.在一个实施例中,所述添加模块404用于:
150.对所述候选文案进行过滤处理,在所述落地页上添加过滤后的文案,其中,所述过滤处理包括如下至少一项:
151.核心词过滤、品牌过滤和片段过滤。
152.在一个实施例中,所述核心词过滤包括:识别所述候选文案中的核心词,对所述核心词进行验证,在所述候选方案中包括第一文案的情况下,删除所述第一文案,所述落地页不包括所述第一文案的所述核心词;和/或,
153.所述品牌过滤包括:识别所述候选文案中的品牌信息,对所述品牌信息进行验证,在所述候选方案中包括第二文案的情况下,删除所述第二文案,所述落地页与所述第二文案的所述品牌信息不匹配;和/或,
154.所述片段过滤包括:识别所述候选文案中的预设类型的片段内容,对所述片段内容进行验证,在所述候选方案中包括第三文案的情况下,删除所述第三文案,所述落地页不
包括所述第三文案的所述片段内容。
155.在一个实施例中,在所述落地页上添加的文案为目标文案,所述目标文案包括多个信息,如图4c所示,所述装置还包括:
156.预测模块405,用于将所述多个信息分别输入到信息识别模型进行关键点信息预测,得到所述目标文案的关键点信息,所述信息识别模型为用于识别文案的关键点信息的网络模型;
157.展示模块406,用于在所述落地页上对所述关键点信息进行突出展示。
158.在一个实施例中,所述生成模块402用于:
159.通过文本生成模型,基于所述第一特征信息对所述落地页执行文案生成操作,得到操作结果;
160.其中,所述文本生成模型为用于基于所述落地页的所述第一特征信息,生成所述落地页的文案的网络模型。
161.在一个实施例中,所述文本生成模型为基于源文本和目标文本进行训练得的文本生成模型;
162.所述源文本包括如下至少一项:将第一样本落地页相关的业务信息在第一源训练样本前置得到的源文本、将第二样本落地页相关的地域信息在第二源训练样本前置得到的源文本;其中,所述第一源训练样本和所述第二源训练样本为预先设定的训练样本;和/或,
163.所述目标文本包括如下至少一项:创意标题、将多媒体创意中转化满足预设条件的关键词填充到创意标题得到的目标文本,其中,所述多媒体创意为通过搜索引擎搜索到的多媒体创意,所述创意标题为所述多媒体创意的标题。
164.本公开提供的落地页文案添加装置能够实现本公开提供的落地页文案添加方法实现的各个过程,并达到相同的技术效果,为避免重复,这里不再赘述。
165.请参见图5,图5是本公开提供的一种模型训练装置,如图5所示,模型训练装置500包括:
166.获取模块501,用于获取源文本和目标文本,其中,所述源文本包括如下至少一项:将第一样本落地页相关的业务信息在第一源训练样本前置得到的源文本、将第二样本落地页相关的地域信息在第二源训练样本前置得到的源文本;其中,所述第一源训练样本和所述第二源训练样本为预先设定的训练样本;和/或,所述目标文本包括:将多媒体创意中转化满足预设条件的关键词填充到创意标题得到的目标文本,所述多媒体创意为通过搜索引擎搜索到的多媒体创意,所述创意标题为所述多媒体创意的标题;
167.训练模块502,用于基于所述源文本和所述目标文本对预设网络模型进行训练,得到文本生成模型;其中,所述文本生成模型用于基于落地页的特征信息生成所述落地页的文案。
168.本公开提供的者模型训练装置能够实现本公开提供的模型训练方法实现的各个过程,并达到相同的技术效果,为避免重复,这里不再赘述。
169.根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
170.其中,上述电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所
述至少一个处理器执行,以使所述至少一个处理器能够执行本公开提供的落地页文案添加方法或者模型训练方法。
171.上述可读存储介质存储有计算机指令,其中,所述计算机指令用于使所述计算机执行本公开提供的落地页文案添加方法或者模型训练方法。
172.上述计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开提供的落地页文案添加方法或者模型训练方法。
173.图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
174.如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(rom)602中的计算机程序或者从存储单元608加载到随机访问存储器(ram)603中的计算机程序,来执行各种适当的动作和处理。在ram 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、rom 602以及ram 603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。
175.设备600中的多个部件连接至i/o接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
176.计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如落地页文案添加方法或者模型训练方法。例如,在一些实施例中,落地页文案添加方法或者模型训练方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由rom 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到ram 603并由计算单元601执行时,可以执行上文描述的落地页文案添加方法或者模型训练方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行落地页文案添加方法或者模型训练方法。
177.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至
少一个输出装置。
178.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
179.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
180.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
181.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
182.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
183.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
184.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

技术特征:


1.一种落地页文案添加方法,包括:提取落地页的第一特征信息;基于所述第一特征信息对所述落地页执行文案生成操作,得到操作结果;在所述操作结果表示未获取到所述落地页的有效文案的情况下,基于所述落地页的第二特征信息和行业信息中的至少一项,获取所述落地页的兜里文案;基于候选文案,在所述落地页上添加文案,其中,在所述操作结果表示未获取到所述落地页的有效文案的情况下,所述候选文案包括所述兜里文案。2.根据权利要求1所述的方法,其中,所述基于所述落地页的第二特征信息和行业信息中的至少一项,获取所述落地页的兜里文案,包括如下至少一项:提取所述落地页的第二特征信息,对所述第二特征信息进行拼接,得到所述落地页的兜里文案,所述第二特征信息包括关键片段信息和业务信息中的至少一项;获取所述落地页的行业信息,基于所述行业信息获取所述落地页所属行业内点击率满足预设条件的目标文案,将所述目标文案作为所述落地页的兜里文案,其中,所述目标文案不包含业务信息。3.根据权利要求2所述的方法,其中,所述提取所述落地页的第二特征信息,包括:提取所述落地页中的多个片段信息;对所述多个片段信息评分,得到每个片段信息的分值;在所述多个片段信息中选择至少一个片段信息作为所述关键片段信息,所述至少一个片段信息的分值高于所述多个片段信息中的其他片段信息的分值。4.根据权利要求3所述的方法,其中,所述对所述多个片段信息评分,得到每个片段信息的分值,包括:提取目标片段信息中的文本特征信息;计算所述文本特征信息与预设文本特征信息的重合度,基于所述重合度计算所述目标片段信息的分值;其中,所述目标片段信息为所述多个片段信息中任一片段信息。5.根据权利要求1至4中任一项所述的方法,其中,所述基于候选文案,在所述落地页上添加文案,包括:对所述候选文案进行过滤处理,在所述落地页上添加过滤后的文案,其中,所述过滤处理包括如下至少一项:核心词过滤、品牌过滤和片段过滤。6.根据权利要求5所述的方法,其特征在于,所述核心词过滤包括:识别所述候选文案中的核心词,对所述核心词进行验证,在所述候选方案中包括第一文案的情况下,删除所述第一文案,所述落地页不包括所述第一文案的所述核心词;和/或,所述品牌过滤包括:识别所述候选文案中的品牌信息,对所述品牌信息进行验证,在所述候选方案中包括第二文案的情况下,删除所述第二文案,所述落地页与所述第二文案的所述品牌信息不匹配;和/或,所述片段过滤包括:识别所述候选文案中的预设类型的片段内容,对所述片段内容进行验证,在所述候选方案中包括第三文案的情况下,删除所述第三文案,所述落地页不包括所述第三文案的所述片段内容。
7.根据权利要求1至4中任一项所述的方法,在所述落地页上添加的文案为目标文案,所述目标文案包括多个信息,所述方法还包括:将所述多个信息分别输入到信息识别模型进行关键点信息预测,得到所述目标文案的关键点信息,所述信息识别模型为用于识别文案的关键点信息的网络模型;在所述落地页上对所述关键点信息进行突出展示。8.根据权利要求1至4中任一项所述的方法,其中,所述基于所述第一特征信息对所述落地页执行文案生成操作,得到操作结果,包括:通过文本生成模型,基于所述第一特征信息对所述落地页执行文案生成操作,得到操作结果;其中,所述文本生成模型为用于基于所述落地页的所述第一特征信息,生成所述落地页的文案的网络模型。9.根据权利要求8所述的方法,其中,所述文本生成模型为基于源文本和目标文本进行训练得的文本生成模型;所述源文本包括如下至少一项:将第一样本落地页相关的业务信息在第一源训练样本前置得到的源文本、将第二样本落地页相关的地域信息在第二源训练样本前置得到的源文本;其中,所述第一源训练样本和所述第二源训练样本为预先设定的训练样本;和/或,所述目标文本包括如下至少一项:创意标题、将多媒体创意中转化满足预设条件的关键词填充到创意标题得到的目标文本,其中,所述多媒体创意为通过搜索引擎搜索到的多媒体创意,所述创意标题为所述多媒体创意的标题。10.一种模型训练方法,包括:获取源文本和目标文本,其中,所述源文本包括如下至少一项:将第一样本落地页相关的业务信息在第一源训练样本前置得到的源文本、将第二样本落地页相关的地域信息在第二源训练样本前置得到的源文本;其中,所述第一源训练样本和所述第二源训练样本为预先设定的训练样本;和/或,所述目标文本包括如下至少一项:创意标题、将多媒体创意中转化满足预设条件的关键词填充到创意标题得到的目标文本,其中,所述多媒体创意为通过搜索引擎搜索到的多媒体创意,所述创意标题为所述多媒体创意的标题;基于所述源文本和所述目标文本对预设网络模型进行训练,得到文本生成模型;其中,所述文本生成模型用于基于落地页的特征信息生成所述落地页的文案。11.一种落地页文案添加装置,包括:提取模块,用于提取落地页的第一特征信息;生成模块,用于基于所述第一特征信息对所述落地页执行文案生成操作,得到操作结果;获取模块,用于在所述操作结果表示未获取到所述落地页的有效文案的情况下,基于所述落地页的第二特征信息和行业信息中的至少一项,获取所述落地页的兜里文案;添加模块,用于基于候选文案,在所述落地页上添加文案,其中,在所述操作结果表示未获取到所述落地页的有效文案的情况下,所述候选文案包括所述兜里文案。12.根据权利要求11所述的装置,其中,所述获取模块,包括如下至少一项:拼接单元,用于提取所述落地页的第二特征信息,对所述第二特征信息进行拼接,得到所述落地页的兜里文案,所述第二特征信息包括关键片段信息和业务信息中的至少一项;
获取单元,用于获取所述落地页的行业信息,基于所述行业信息获取所述落地页所属行业内点击率满足预设条件的目标文案,将所述目标文案作为所述落地页的兜里文案,其中,所述目标文案不包含业务信息。13.根据权利要求12所述的装置,其中,所述拼接单元用于:提取所述落地页中的多个片段信息;对所述多个片段信息评分,得到每个片段信息的分值;在所述多个片段信息中选择至少一个片段信息作为所述关键片段信息,所述至少一个片段信息的分值高于所述多个片段信息中的其他片段信息的分值。14.根据权利要求13所述的装置,其中,所述拼接单元用于:提取目标片段信息中的文本特征信息;计算所述文本特征信息与预设文本特征信息的重合度,基于所述重合度计算所述目标片段信息的分值;其中,所述目标片段信息为所述多个片段信息中任一片段信息。15.根据权利要求11至14中任一项所述的装置,其中,所述添加模块用于:对所述候选文案进行过滤处理,在所述落地页上添加过滤后的文案,其中,所述过滤处理包括如下至少一项:核心词过滤、品牌过滤和片段过滤。16.根据权利要求15所述的装置,其特征在于,所述核心词过滤包括:识别所述候选文案中的核心词,对所述核心词进行验证,在所述候选方案中包括第一文案的情况下,删除所述第一文案,所述落地页不包括所述第一文案的所述核心词;和/或,所述品牌过滤包括:识别所述候选文案中的品牌信息,对所述品牌信息进行验证,在所述候选方案中包括第二文案的情况下,删除所述第二文案,所述落地页与所述第二文案的所述品牌信息不匹配;和/或,所述片段过滤包括:识别所述候选文案中的预设类型的片段内容,对所述片段内容进行验证,在所述候选方案中包括第三文案的情况下,删除所述第三文案,所述落地页不包括所述第三文案的所述片段内容。17.根据权利要求11至14中任一项所述的装置,在所述落地页上添加的文案为目标文案,所述目标文案包括多个信息,所述装置还包括:预测模块,用于将所述多个信息分别输入到信息识别模型进行关键点信息预测,得到所述目标文案的关键点信息,所述信息识别模型为用于识别文案的关键点信息的网络模型;展示模块,用于在所述落地页上对所述关键点信息进行突出展示。18.根据权利要求11至14中任一项所述的装置,其中,所述生成模块用于:通过文本生成模型,基于所述第一特征信息对所述落地页执行文案生成操作,得到操作结果;其中,所述文本生成模型为用于基于所述落地页的所述第一特征信息,生成所述落地页的文案的网络模型。19.根据权利要求18所述的装置,其中,所述文本生成模型为基于源文本和目标文本进行训练得的文本生成模型;
所述源文本包括如下至少一项:将第一样本落地页相关的业务信息在第一源训练样本前置得到的源文本、将第二样本落地页相关的地域信息在第二源训练样本前置得到的源文本;其中,所述第一源训练样本和所述第二源训练样本为预先设定的训练样本;和/或,所述目标文本包括如下至少一项:创意标题、将多媒体创意中转化满足预设条件的关键词填充到创意标题得到的目标文本,其中,所述多媒体创意为通过搜索引擎搜索到的多媒体创意,所述创意标题为所述多媒体创意的标题。20.一种模型训练装置,包括:获取模块,用于获取源文本和目标文本,其中,所述源文本包括如下至少一项:将第一样本落地页相关的业务信息在第一源训练样本前置得到的源文本、将第二样本落地页相关的地域信息在第二源训练样本前置得到的源文本;其中,所述第一源训练样本和所述第二源训练样本为预先设定的训练样本;和/或,所述目标文本包括:将多媒体创意中转化满足预设条件的关键词填充到创意标题得到的目标文本,所述多媒体创意为通过搜索引擎搜索到的多媒体创意,所述创意标题为所述多媒体创意的标题;训练模块,用于基于所述源文本和所述目标文本对预设网络模型进行训练,得到文本生成模型;其中,所述文本生成模型用于基于落地页的特征信息生成所述落地页的文案。21.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法,或者以使所述至少一个处理器能够执行权利要求10所述的方法。22.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-9中任一项所述的方法,或者,所述计算机指令用于使所述计算机执行根据权利要求10所述的方法。23.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-9中任一项所述的方法,或者,所述计算机程序在被处理器执行时实现根据权利要求10所述的方法。

技术总结


本公开提供了一种落地页文案添加方法、模型训练方法、装置及电子设备,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、NLP等技术领域。具体实现方案为:提取落地页的第一特征信息;基于所述第一特征信息对所述落地页执行文案生成操作,得到操作结果;在所述操作结果表示未获取到所述落地页的有效文案的情况下,基于所述落地页的第二特征信息和行业信息中的至少一项,获取所述落地页的兜里文案;基于候选文案,在所述落地页上添加文案,其中,在所述操作结果表示未获取到所述落地页的有效文案的情况下,所述候选文案包括所述兜里文案。本公开可以提高落地页的文案效果。本公开可以提高落地页的文案效果。本公开可以提高落地页的文案效果。


技术研发人员:

牛宇航 陈旭 靳晓乐 张雪涵 刘丽 阳锋

受保护的技术使用者:

百度在线网络技术(北京)有限公司

技术研发日:

2022.09.21

技术公布日:

2022/12/16

本文发布于:2024-09-23 05:27:39,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/43424.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   文案   信息   文本
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议