视频要素重要度的计算方法及装置、存储介质、电子设备与流程



1.本发明涉及人工智能领域,具体而言,涉及一种视频要素重要度的计算方法及装置、存储介质、电子设备。


背景技术:



2.相关技术中,视频平台(如小视频,电影,广告等)对于投后视频素材仅提供多个数据维度指标,用以评估整体视频素材投放效果,如何自动化对视频素材标题和内容的核心要素提炼,进行细粒度评估,反馈各要素的重要性,取其精华,去其糟粕,对于营销广告视频素材的制作方向指导具有重要意义。
3.相关技术是通过用户评价,反馈,投诉等信息进行评估,以确定视频中的各种要素的优劣,但无法避免用户的主观情绪,甚至恶意刷屏,导致现有的素材要素的评估方式不准确,且效率低。
4.针对相关技术中存在的上述问题,目前尚未发现有效的解决方案。


技术实现要素:



5.本发明实施例提供了一种视频要素重要度的计算方法及装置、存储介质、电子设备。
6.根据本技术实施例的一个方面,提供了一种视频要素重要度的计算方法,包括:确定目标样本视频,并获取所述目标样本视频的多个视频文件,其中,所述目标样本视频包括多个视频文件,每个视频文件对应一个视频素材集合;从所述目标样本视频的多个视频文件中获取素材要素,以及采集所述多个视频文件的视频指标数据,其中,所述视频指标数据用于表征对应视频文件的用户兴趣度和成本转化率;根据所述视频指标数据计算所述素材要素的重要度。
7.进一步,从所述目标样本视频的多个视频文件中获取素材要素包括:针对所述目标样本视频的每个视频文件,解析所述视频文件的视频标题和视频字幕,其中,所述视频素材集合包括所述视频标题和视频字幕;提取所述视频标题和所述视频字幕的文本素材;获取所述文本素材的素材要素,其中,所述素材要素用于表征对应文本素材的关键语义特征。
8.进一步,获取所述文本素材的素材要素包括:抽取所述文本素材的实体信息,并对所述实体信息进行单词切分,得到单词序列;获取预设的关键字集合,并查所述单词序列中命中所述关键字集合的素材关键字;基于语义映射关系查与所述素材关键字或素材关键字组合匹配的要素内容,其中,所述语义映射关系包括多个素材关键字与要素内容的组合。
9.进一步,采集所述多个视频文件的视频指标数据包括以下至少之一:采集所述多个视频文件中每个视频文件的点击率;采集所述多个视频文件中每个视频文件的互动率;采集所述多个视频文件中每个视频文件的完播率;采集所述多个视频文件中每个视频文件的视频时长;采集所述多个视频文件中每个视频文件的收藏加购率;采集所述多个视频文
件中每个视频文件的单次转化成本。
10.进一步,根据所述视频指标数据计算所述素材要素的重要度包括:针对每个所述素材要素,确定所述素材要素对应的视频文件,以所述素材要素为key,对属于同一个key的视频文件的同一类视频指标数据进行聚合,得到聚合指标数据,其中,所述聚合指标数据包括多个视频指标数据;针对每个所述素材要素,计算对应的聚合指标数据的指标均值;根据所述指标均值计算对应素材要求的第一重要度,其中,所述第一重要度与所述指标均值呈正相关。
11.进一步,根据所述视频指标数据计算所述素材要素的重要度包括:基于所述视频指标数据选择第一视频集合,第二视频集合,第三视频集合,其中,所述第一视频集合是所述视频指标数据排序前m的视频文件,所述第二视频集合是所述视频指标数据排序前n的视频文件,所述第三视频集合是所述视频指标数据排序前p的视频文件,m<n<p;在所述第一视频集合,所述第二视频集合,以及所述第三视频集合中分别确定包含所述素材要素的指定视频数量,并分别计算所述指定视频数量在所述第一视频集合,所述第二视频集合,以及所述第三视频集合中的占比值,得到第一占比值,第二占比值,第三占比值;基于所述第一占比值,第二占比值,第三占比值确定所述素材要素的变化梯度,其中,所述变化梯度包括正向增加的梯度和负向降低的梯度;根据所述变化梯度计算所述素材要求的第二重要度,其中,所述第二重要度与所述变化梯度的变化趋势呈负相关。
12.进一步,在根据所述视频指标数据计算所述素材要素的重要度之后,所述方法还包括:基于所述重要度对多个素材要素进行排序;基于所述排序结果生成制作新视频的指导信息,其中,所述指导信息用于指示每个素材要素的选择推荐度。
13.根据本技术实施例的另一个方面,还提供了一种视频要素重要度的计算装置,包括:确定模块,用于确定目标样本视频,并获取所述目标样本视频的多个视频文件,其中,所述目标样本视频包括多个视频文件,每个视频文件对应一个视频素材集合;获取模块,用于从所述目标样本视频的多个视频文件中获取素材要素,以及采集所述多个视频文件的视频指标数据,其中,所述视频指标数据用于表征对应视频文件的用户兴趣度和成本转化率;计算模块,用于根据所述视频指标数据计算所述素材要素的重要度。
14.进一步,所述获取模块包括:解析单元,用于针对所述目标样本视频的每个视频文件,解析所述视频文件的视频标题和视频字幕,其中,所述视频素材集合包括所述视频标题和视频字幕;提取单元,用于提取所述视频标题和所述视频字幕的文本素材;获取单元,用于获取所述文本素材的素材要素,其中,所述素材要素用于表征对应文本素材的关键语义特征。
15.进一步,所述获取单元包括:切分子单元,用于抽取所述文本素材的实体信息,并对所述实体信息进行单词切分,得到单词序列;第一查子单元,用于获取预设的关键字集合,并查所述单词序列中命中所述关键字集合的素材关键字;第二查子单元,用于基于语义映射关系查与所述素材关键字或素材关键字组合匹配的要素内容,其中,所述语义映射关系包括多个素材关键字与要素内容的组合。
16.进一步,所述获取模块包括以下至少之一:第一采集单元,用于采集所述多个视频文件中每个视频文件的点击率;第二采集单元,用于采集所述多个视频文件中每个视频文件的互动率;第三采集单元,用于采集所述多个视频文件中每个视频文件的完播率;第四采
集单元,用于采集所述多个视频文件中每个视频文件的视频时长;第五采集单元,用于采集所述多个视频文件中每个视频文件的收藏加购率;第六采集单元,用于采集所述多个视频文件中每个视频文件的单次转化成本。
17.进一步,所述计算模块包括:聚合单元,用于针对每个所述素材要素,确定所述素材要素对应的视频文件,以所述素材要素为key,对属于同一个key的视频文件的同一类视频指标数据进行聚合,得到聚合指标数据,其中,所述聚合指标数据包括多个视频指标数据;第一计算单元,用于针对每个所述素材要素,计算对应的聚合指标数据的指标均值;第二计算单元,用于根据所述指标均值计算对应素材要求的第一重要度,其中,所述第一重要度与所述指标均值呈正相关。
18.进一步,所述计算模块包括:选择单元,用于基于所述视频指标数据选择第一视频集合,第二视频集合,第三视频集合,其中,所述第一视频集合是所述视频指标数据排序前m的视频文件,所述第二视频集合是所述视频指标数据排序前n的视频文件,所述第三视频集合是所述视频指标数据排序前p的视频文件,m<n<p;第一确定单元,用于在所述第一视频集合,所述第二视频集合,以及所述第三视频集合中分别确定包含所述素材要素的指定视频数量,并分别计算所述指定视频数量在所述第一视频集合,所述第二视频集合,以及所述第三视频集合中的占比值,得到第一占比值,第二占比值,第三占比值;第二确定单元,用于基于所述第一占比值,第二占比值,第三占比值确定所述素材要素的变化梯度,其中,所述变化梯度包括正向增加的梯度和负向降低的梯度;第三计算单元,用于根据所述变化梯度计算所述素材要求的第二重要度,其中,所述第二重要度与所述变化梯度的变化趋势呈负相关。
19.进一步,所述装置还包括:排序模块,用于在所述计算模块根据所述视频指标数据计算所述素材要素的重要度之后,基于所述重要度对多个素材要素进行排序;生成模块,用于基于所述排序结果生成制作新视频的指导信息,其中,所述指导信息用于指示每个素材要素的选择推荐度。
20.根据本技术实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的步骤。
21.根据本技术实施例的另一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:存储器,用于存放计算机程序;处理器,用于通过运行存储器上所存放的程序来执行上述方法中的步骤。
22.本技术实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述方法中的步骤。
23.通过本发明,确定目标样本视频,并获取目标样本视频的多个视频文件,其中,目标样本视频包括多个视频文件,每个视频文件对应一个视频素材集合,从目标样本视频的多个视频文件中获取素材要素,以及采集多个视频文件的视频指标数据,其中,视频指标数据用于表征对应视频文件的用户兴趣度和成本转化率,根据视频指标数据计算素材要素的重要度,通过解析视频文件中视频素材的素材要素和视频文件的视频指标数据,可以根据所述视频指标数据计算所述素材要素的重要度,解决了相关技术中不能准确计算视频文件中素材要素重要度的技术问题,提高了素材要素重要度的确定效率,为视频制作提供了更
准确的参考价值,从而提高视频文件的参考性和传阅度,减少了垃圾视频的数量。
附图说明
24.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:图1是本发明实施例的一种服务器的硬件结构框图;图2是根据本发明实施例的一种视频要素重要度的计算方法的流程图;图3是本发明实施例采用素材标题或内容挖掘素材要素价值的流程图;图4是本发明实施例的方案整体流程图;图5是根据本发明实施例的一种视频要素重要度的计算装置的结构框图;图6是实施本发明实施例的一种电子设备的结构框图。
具体实施方式
25.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。
26.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
27.实施例1本技术实施例一所提供的方法实施例可以在服务器、计算机、手机、或者类似的运算装置中执行。以运行在服务器上为例,图1是本发明实施例的一种服务器的硬件结构框图。如图1所示,服务器可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)和用于存储数据的存储器104,可选地,上述服务器还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述服务器的结构建成限定。例如,服务器还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
28.存储器104可用于存储服务器程序,例如,应用软件的软件程序以及模块,如本发明实施例中的一种视频要素重要度的计算方法对应的服务器程序,处理器102通过运行存储在存储器104内的服务器程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存
储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
29.传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(network interface controller,简称为nic),其可通过与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(radio frequency,简称为rf)模块,其用于通过无线方式与互联网进行通讯。
30.在本实施例中提供了一种视频要素重要度的计算方法,图2是根据本发明实施例的一种视频要素重要度的计算方法的流程图,如图2所示,该流程包括如下步骤:步骤s202,确定目标样本视频,并获取目标样本视频的多个视频文件,其中,目标样本视频包括多个视频文件,每个视频文件对应一个视频素材集合;在本实施例的目标样本视频是视频平台在多个时间段,多个渠道投放的不同标题和视频内容的视频。本实施例的视频素材集合包括视频内容,视频标题,视频字幕等。
31.步骤s204,从目标样本视频的多个视频文件中获取素材要素,以及采集多个视频文件的视频指标数据,其中,视频指标数据用于表征对应视频文件的用户兴趣度和成本转化率;本实施例的素材要素是视频素材的语义要素,用于表征视频素材的语义信息,用于表征素材的语义表达内容的语义类型,一个视频文件的视频素材可以包括多个语义要素,素材要素是构造标题或内容宣传的主要关键因素,是视频标题或内容词汇的语义表征的结果,如,视频素材为视频标题,标题为“双十一哪些东西一定要入!#双十一必买”中
ꢀ“
双十一”凝练出语义要素:优惠活动,其素材要素为优惠活动。
32.本实施例的视频指标数据可以但不限于为:点击率、互动率、完播率、视频时长、收藏加购率、单次转化成本等。
33.步骤s206,根据视频指标数据计算素材要素的重要度;本实施例的素材要素的重要度与该素材要求对视频文件的视频指标数据的贡献度,重要度越高,贡献度越大,则点击率等等视频指标越大。
34.通过上述步骤,确定目标样本视频,并获取目标样本视频的多个视频文件,其中,目标样本视频包括多个视频文件,每个视频文件对应一个视频素材集合,从目标样本视频的多个视频文件中获取素材要素,以及采集多个视频文件的视频指标数据,其中,视频指标数据用于表征对应视频文件的用户兴趣度和成本转化率,根据视频指标数据计算素材要素的重要度,通过解析视频文件中视频素材的素材要素和视频文件的视频指标数据,可以根据所述视频指标数据计算所述素材要素的重要度,解决了相关技术中不能准确计算视频文件中素材要素重要度的技术问题,提高了素材要素重要度的确定效率,为视频制作提供了更准确的参考价值,从而提高视频文件的参考性和传阅度,减少了垃圾视频的数量。
35.在本实施例的一个实施方式中,从目标样本视频的多个视频文件中获取素材要素包括:s11,针对目标样本视频的每个视频文件,解析视频文件的视频标题和视频字幕,其中,视频素材集合包括视频标题和视频字幕;
通过字幕文件或者语音识别音频等方式获得视频字幕。
36.s12,提取视频标题和视频字幕的文本素材;s13,获取文本素材的素材要素,其中,素材要素用于表征对应文本素材的关键语义特征。
37.在一个示例中,获取文本素材的素材要素包括:抽取文本素材的实体信息,并对实体信息进行单词切分,得到单词序列;获取预设的关键字集合,并查单词序列中命中关键字集合的素材关键字;基于语义映射关系查与素材关键字或素材关键字组合匹配的要素内容,其中,语义映射关系包括多个素材关键字与要素内容的组合。
38.在一个示例中,标题素材的素材要素包括:引人好奇,影响力,优惠活动,痛点,解决办法,知识提升,产品力,则通过关键字的语义映射关系如下:引人好奇:标题中含有问号、“原因”等关键词;影响力:标题中含有明星或网红等关键词;优惠活动:标题中含有双十一、双十二、年终钜惠、618、买一送一等关键词;痛点:标题中含有症状问题,如痘印、淡斑等关键词;解决办法:标题中含有“解决”、“方法”等关键词;知识提升:标题中含有“原因”、“解决”、“方法”、“原理”等关键词;产品力:标题中含有品牌的词汇,如“华为”。
39.在一个示例中,视频内容的字幕素材的素材要素包括:产品讲解,痛点,功能展示,资格认证,优惠活动,场景演示,内容要素通过关键字的语义映射关系如下:产品讲解:视频字幕中含有产品的功能点解释,如“去斑”、“美白”等关键词;痛点:视频字幕中含有“痘印”、“淡斑”等关键词;功能展示:视频字幕中含有“滴”、“抹”等动作关键词;资格认证:视频字幕中含有“证书”等关键词;优惠活动:视频字幕中含有“送”、“双十一”等关键词;场景演示:视频字幕前30词含有产品讲解的关键词为:生活场景故事,否则为达人讲解。
40.在本实施例的另外一些实施方式中,除了对视频文件中的文本进行语义识别之外,还可以对视频中的帧图像进行语义识别,可以通过截取视频文件的关键视频帧,通过多组关键视频帧中的图像信息生成素材关键字,或者是通过关键视频帧与单词序列中的关键字生成素材关键字。
41.可选的,采集多个视频文件的视频指标数据可以但不限于为:采集多个视频文件中每个视频文件的点击率;采集多个视频文件中每个视频文件的互动率;采集多个视频文件中每个视频文件的完播率;采集多个视频文件中每个视频文件的视频时长;采集多个视频文件中每个视频文件的收藏加购率;采集多个视频文件中每个视频文件的单次转化成本。
42.在本实施例的一方面,根据视频指标数据计算素材要素的重要度包括:针对每个素材要素,确定素材要素对应的视频文件,以素材要素为key,对属于同一个key的视频文件的同一类视频指标数据进行聚合,得到聚合指标数据,其中,聚合指标数据包括多个视频指标数据;针对每个素材要素,计算对应的聚合指标数据的指标均值;根据指标均值计算对应
素材要求的第一重要度,其中,第一重要度与指标均值呈正相关。
43.聚合取均值步骤及案例:其中,n为视频指标数据的数量,与包含当前素材要素的视频文件的数量对应,i∈[1,n],xi为任一视频指标数据,以标题或内容的关键要素作为key,对同属于一个key的数据指标进行聚合,对聚合结果根据均值公式求均值。
[0044]
在一个示例中,标题1:“双十一哪些东西一定要入!#双十一必买”,要素优惠活动:点击率0.1%;标题二:“双十二olay小白瓶买一送一”,要素优惠活动:点击率:0.3%;按优惠活动聚合取均值则为:优惠活动:[0.1%、0.3%],均值为0.2%。
[0045]
在本实施例的另一方面,根据视频指标数据计算素材要素的重要度包括:基于视频指标数据选择第一视频集合,第二视频集合,第三视频集合,其中,第一视频集合是视频指标数据排序前m的视频文件,第二视频集合是视频指标数据排序前n的视频文件,第三视频集合是视频指标数据排序前p的视频文件,m<n<p,m,n,p均为正整数;在第一视频集合,第二视频集合,以及第三视频集合中分别确定包含素材要素的指定视频数量,并分别计算指定视频数量在第一视频集合,第二视频集合,以及第三视频集合中的占比值,得到第一占比值,第二占比值,第三占比值;基于第一占比值,第二占比值,第三占比值确定素材要素的变化梯度,其中,变化梯度包括正向增加的梯度和负向降低的梯度;根据变化梯度计算素材要求的第二重要度,其中,第二重要度与所述变化梯度的变化趋势呈负相关。
[0046]
变化梯度的变化趋势是第一占比值

第二占比值

第三占比值的变化趋势,如越来越小,越来越大。
[0047]
在一些示例中,在根据变化梯度计算素材要求的第二重要度时,可以先通过正向梯度还是负向梯度计算出第二重要度的正负向。另一方面,还可以根据变化梯度的步长计算具体的值,如根据第一占比值-第二占比值的差值,与第二占比值-第三占比值的差值之和计算第二重要度的值,差值之和越大,第二重要度的值越大,如果是反向计算差值之和(第二占比值-第一占比值+第三占比值-第二占比值),则差值之和越大,第二重要度的值越小,还可以进行归一化处理或者计算比例值,将最终的值映射为范围在[-1,1]之间的值。
[0048]
在一个示例中,m,n,p分别为5,20,40。假设前5素材含有a要素4个,则占比为4/5=80%,含有b要素1个,则占比为20%;前20素材含有a要素10个,则占比为10/20=50%,含有b要素8个,则占比为8/20=40%;前40素材含有a要素12个,则占比为12/40=30%,含有b要素20个,则占比为20/40=50%。
[0049]
得到a要素占比变化梯度为80%-50%-30%,b要素占比变化梯度为:20%-40%-50%。
[0050]
含有a要素,让素材点击率更高,是正向影响,重要度为正值;含有b要素,让素材点击率偏低,是负向影响,重要度为负值。
[0051]
可选的,在根据视频指标数据计算素材要素的重要度之后,还包括:基于重要度对多个素材要素进行排序;基于排序结果生成制作新视频的指导信息,其中,指导信息用于指示每个素材要素的选择推荐度。
[0052]
在一个示例中,素材库包括3个素材,素材1,素材2,素材3,分别对应素材要素1,素材要素2,素材要素3,素材要素1最大,则视频制作平台推荐用户使用素材1完成新视频的制作。
[0053]
本实施例提供一种方法,可以自动化提取营销广告平台视频素材标题和内容的核心要素,如标题要素:痛点、优惠活动、引人思考、引人好奇、产品力、解决办法、知识提升等,并基于不同关键指标排名变化,如点击率变化、互动率变化、收藏加购率变化,统计得出营销广告视频素材要素的重要性排序,对比整体营销素材评估而言更加细致,且能取其精华去其糟粕;自动化提取广告视频素材标题和内容核心要素,节省人力,提供素材标题和内容制作的数据参考。
[0054]
图3是本发明实施例采用素材标题或内容挖掘素材要素价值的流程图。图4是本发明实施例的方案整体流程图,以营销广告平台视频素材标题或内容的关键要素挖掘的场景为例,包括:步骤一:用数据工具提取营销广告平台视频素材多个时间段的不同标题和视频内容(使用语音识别软件完成视频语音转文字)下的关键指标数据,如点击率、互动率、完播率、视频时长、收藏加购率、单次转化成本等;步骤二:人工制定标题或内容要素提炼标准并存储,将提炼标准程序化,根据程序批量提炼多个时间段的所有素材,自动记录关键指标数据,输出csv文件;步骤三:程序读取记录文件,根据提炼的素材要素和关键指标,按要素的关键指标聚合取均值,得到要素的重要性排序;按关键指标的排序分成三类高中低,统计各要素的数据变化,统计各要素的重要性和正负向影响;步骤四:根据汇总各要素的重要性结果,输出素材标题和内容制作指导建议文件csv。
[0055]
采用本实施例的方案,通过程序完成素材提炼和数据加工,可以大大节省人力成本;基于不同营销场景目标,可以细粒度评估视频素材标题或内容的优劣点,取其精华去其糟粕,对视频素材标题拟定和内容制作有一定数据参考价值。
[0056]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
[0057]
实施例2在本实施例中还提供了一种视频要素重要度的计算装置,用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
[0058]
图5是根据本发明实施例的一种视频要素重要度的计算装置的结构框图,如图5所示,该装置包括:确定模块50,获取模块52,计算模块54,其中,确定模块50,用于确定目标样本视频,并获取所述目标样本视频的多个视频文件,
其中,所述目标样本视频包括多个视频文件,每个视频文件对应一个视频素材集合;获取模块52,用于从所述目标样本视频的多个视频文件中获取素材要素,以及采集所述多个视频文件的视频指标数据,其中,所述视频指标数据用于表征对应视频文件的用户兴趣度和成本转化率;计算模块54,用于根据所述视频指标数据计算所述素材要素的重要度。
[0059]
可选的,所述获取模块包括:解析单元,用于针对所述目标样本视频的每个视频文件,解析所述视频文件的视频标题和视频字幕,其中,所述视频素材集合包括所述视频标题和视频字幕;提取单元,用于提取所述视频标题和所述视频字幕的文本素材;获取单元,用于获取所述文本素材的素材要素,其中,所述素材要素用于表征对应文本素材的关键语义特征。
[0060]
可选的,所述获取单元包括:切分子单元,用于抽取所述文本素材的实体信息,并对所述实体信息进行单词切分,得到单词序列;第一查子单元,用于获取预设的关键字集合,并查所述单词序列中命中所述关键字集合的素材关键字;第二查子单元,用于基于语义映射关系查与所述素材关键字或素材关键字组合匹配的要素内容,其中,所述语义映射关系包括多个素材关键字与要素内容的组合。
[0061]
可选的,所述获取模块包括以下至少之一:第一采集单元,用于采集所述多个视频文件中每个视频文件的点击率;第二采集单元,用于采集所述多个视频文件中每个视频文件的互动率;第三采集单元,用于采集所述多个视频文件中每个视频文件的完播率;第四采集单元,用于采集所述多个视频文件中每个视频文件的视频时长;第五采集单元,用于采集所述多个视频文件中每个视频文件的收藏加购率;第六采集单元,用于采集所述多个视频文件中每个视频文件的单次转化成本。
[0062]
可选的,所述计算模块包括:聚合单元,用于针对每个所述素材要素,确定所述素材要素对应的视频文件,以所述素材要素为key,对属于同一个key的视频文件的同一类视频指标数据进行聚合,得到聚合指标数据,其中,所述聚合指标数据包括多个视频指标数据;第一计算单元,用于针对每个所述素材要素,计算对应的聚合指标数据的指标均值;第二计算单元,用于根据所述指标均值计算对应素材要求的第一重要度,其中,所述第一重要度与所述指标均值呈正相关。
[0063]
可选的,所述计算模块包括:选择单元,用于基于所述视频指标数据选择第一视频集合,第二视频集合,第三视频集合,其中,所述第一视频集合是所述视频指标数据排序前m的视频文件,所述第二视频集合是所述视频指标数据排序前n的视频文件,所述第三视频集合是所述视频指标数据排序前p的视频文件,m<n<p;第一确定单元,用于在所述第一视频集合,所述第二视频集合,以及所述第三视频集合中分别确定包含所述素材要素的指定视频数量,并分别计算所述指定视频数量在所述第一视频集合,所述第二视频集合,以及所述第三视频集合中的占比值,得到第一占比值,第二占比值,第三占比值;第二确定单元,用于基于所述第一占比值,第二占比值,第三占比值确定所述素材要素的变化梯度,其中,所述变化梯度包括正向增加的梯度和负向降低的梯度;第三计算单元,用于根据所述变化梯度计算所述素材要求的第二重要度,其中,所述第二重要度与所述变化梯度的变化趋势呈负相关。
[0064]
可选的,所述装置还包括:排序模块,用于在所述计算模块根据所述视频指标数据
计算所述素材要素的重要度之后,基于所述重要度对多个素材要素进行排序;生成模块,用于基于所述排序结果生成制作新视频的指导信息,其中,所述指导信息用于指示每个素材要素的选择推荐度。
[0065]
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
[0066]
实施例3本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
[0067]
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:s1,确定目标样本视频,并获取所述目标样本视频的多个视频文件,其中,所述目标样本视频包括多个视频文件,每个视频文件对应一个视频素材集合;s2,从所述目标样本视频的多个视频文件中获取素材要素,以及采集所述多个视频文件的视频指标数据,其中,所述视频指标数据用于表征对应视频文件的用户兴趣度和成本转化率;s3,根据所述视频指标数据计算所述素材要素的重要度。
[0068]
可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(read-only memory,简称为rom)、随机存取存储器(random access memory,简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
[0069]
本发明的实施例还提供了一种电子设备,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
[0070]
可选地,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
[0071]
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:s1,确定目标样本视频,并获取所述目标样本视频的多个视频文件,其中,所述目标样本视频包括多个视频文件,每个视频文件对应一个视频素材集合;s2,从所述目标样本视频的多个视频文件中获取素材要素,以及采集所述多个视频文件的视频指标数据,其中,所述视频指标数据用于表征对应视频文件的用户兴趣度和成本转化率;s3,根据所述视频指标数据计算所述素材要素的重要度。
[0072]
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
[0073]
图6是本发明实施例的一种电子设备的结构图,如图6所示,包括处理器61、通信接口62、存储器63和通信总线64,其中,处理器61,通信接口62,存储器63通过通信总线64完成相互间的通信,存储器63,用于存放计算机程序;处理器61,用于执行存储器63上所存放的程序。
[0074]
上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
[0075]
在本技术的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0076]
在本技术所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
[0077]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0078]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0079]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0080]
以上所述仅是本技术的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。

技术特征:


1.一种视频要素重要度的计算方法,其特征在于,包括:确定目标样本视频,并获取所述目标样本视频的多个视频文件,其中,所述目标样本视频包括多个视频文件,每个视频文件对应一个视频素材集合;从所述目标样本视频的多个视频文件中获取素材要素,以及采集所述多个视频文件的视频指标数据,其中,所述视频指标数据用于表征对应视频文件的用户兴趣度和成本转化率;根据所述视频指标数据计算所述素材要素的重要度。2.根据权利要求1所述的方法,其特征在于,从所述目标样本视频的多个视频文件中获取素材要素包括:针对所述目标样本视频的每个视频文件,解析所述视频文件的视频标题和视频字幕,其中,所述视频素材集合包括所述视频标题和视频字幕;提取所述视频标题和所述视频字幕的文本素材;获取所述文本素材的素材要素,其中,所述素材要素用于表征对应文本素材的关键语义特征。3.根据权利要求2所述的方法,其特征在于,获取所述文本素材的素材要素包括:抽取所述文本素材的实体信息,并对所述实体信息进行单词切分,得到单词序列;获取预设的关键字集合,并查所述单词序列中命中所述关键字集合的素材关键字;基于语义映射关系查与所述素材关键字或素材关键字组合匹配的要素内容,其中,所述语义映射关系包括多个素材关键字与要素内容的组合。4.根据权利要求1所述的方法,其特征在于,采集所述多个视频文件的视频指标数据包括以下至少之一:采集所述多个视频文件中每个视频文件的点击率;采集所述多个视频文件中每个视频文件的互动率;采集所述多个视频文件中每个视频文件的完播率;采集所述多个视频文件中每个视频文件的视频时长;采集所述多个视频文件中每个视频文件的收藏加购率;采集所述多个视频文件中每个视频文件的单次转化成本。5.根据权利要求1所述的方法,其特征在于,根据所述视频指标数据计算所述素材要素的重要度包括:针对每个所述素材要素,确定所述素材要素对应的视频文件,以所述素材要素为key,对属于同一个key的视频文件的同一类视频指标数据进行聚合,得到聚合指标数据,其中,所述聚合指标数据包括多个视频指标数据;针对每个所述素材要素,计算对应的聚合指标数据的指标均值;根据所述指标均值计算对应素材要素的第一重要度,其中,所述第一重要度与所述指标均值呈正相关。6.根据权利要求1所述的方法,其特征在于,根据所述视频指标数据计算所述素材要素的重要度包括:基于所述视频指标数据选择第一视频集合,第二视频集合,第三视频集合,其中,所述第一视频集合是所述视频指标数据排序前m的视频文件,所述第二视频集合是所述视频指
标数据排序前n的视频文件,所述第三视频集合是所述视频指标数据排序前p的视频文件,m<n<p,m,n,p均为正整数;在所述第一视频集合,所述第二视频集合,以及所述第三视频集合中分别确定包含所述素材要素的指定视频数量,并分别计算所述指定视频数量在所述第一视频集合,所述第二视频集合,以及所述第三视频集合中的占比值,得到第一占比值,第二占比值,第三占比值;基于所述第一占比值,第二占比值,第三占比值确定所述素材要素的变化梯度,其中,所述变化梯度包括正向增加的梯度和负向降低的梯度;根据所述变化梯度计算所述素材要素的第二重要度,其中,所述第二重要度与所述变化梯度的变化趋势呈负相关。7.根据权利要求1所述的方法,其特征在于,在根据所述视频指标数据计算所述素材要素的重要度之后,所述方法还包括:基于所述重要度对多个素材要素进行排序;基于排序结果生成制作新视频的指导信息,其中,所述指导信息用于指示每个素材要素的选择推荐度。8.一种视频要素重要度的计算装置,其特征在于,包括:确定模块,用于确定目标样本视频,并获取所述目标样本视频的多个视频文件,其中,所述目标样本视频包括多个视频文件,每个视频文件对应一个视频素材集合;获取模块,用于从所述目标样本视频的多个视频文件中获取素材要素,以及采集所述多个视频文件的视频指标数据,其中,所述视频指标数据用于表征对应视频文件的用户兴趣度和成本转化率;计算模块,用于根据所述视频指标数据计算所述素材要素的重要度。9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至7中任一项所述的方法的步骤。10.一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:存储器,用于存放计算机程序;处理器,用于通过运行存储器上所存放的程序来执行权利要求1至7中任一项所述的方法的步骤。

技术总结


本发明公开了一种视频要素重要度的计算方法及装置、存储介质、电子设备,其中,该方法包括:确定目标样本视频,并获取目标样本视频的多个视频文件,其中,目标样本视频包括多个视频文件,每个视频文件对应一个视频素材集合;从目标样本视频的多个视频文件中获取素材要素,以及采集多个视频文件的视频指标数据,其中,视频指标数据用于表征对应视频文件的用户兴趣度和成本转化率;根据视频指标数据计算素材要素的重要度。通过本发明,解决了相关技术中不能准确计算视频文件中素材要素重要度的技术问题,提高了素材要素重要度的确定效率,为视频制作提供了更准确的参考价值,从而提高视频文件的参考性和传阅度,减少了垃圾视频的数量。频的数量。频的数量。


技术研发人员:

肖荣昌 许先才 吴建龙 熊磊

受保护的技术使用者:

深圳市云积分科技有限公司

技术研发日:

2022.11.02

技术公布日:

2022/12/12

本文发布于:2024-09-24 19:20:03,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/33680.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   视频   素材   视频文件
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议