图像处理方法、计算机设备及存储介质与流程



1.本技术涉及金融技术领域,具体是涉及一种图像处理方法、计算机设备及存储介质。


背景技术:



2.随着互联网技术的发展,人们足不出户即可在家享受网络上的各种服务,相关远程服务也应运而生。相关技术中,在远程人工客服业务场景下,为了统一客服背景形象,需要在人工客服的背后加装挡板,贴上企业/银行的标志,这种方式对场景的要求比较高,同时不便于背景内容的统一管理。同时,人工客服背景中有时会出现无关人员,背景较为杂乱。


技术实现要素:



3.有鉴于此,本技术提供一种图像处理方法、计算机设备及存储介质,以解决现有技术中远程人工客服的背景杂乱、不方便统一管理的问题。
4.为了解决上述技术问题,本技术提供的第一个技术方案为:提供一种图像处理方法,包括:获取单帧图像内的人物分割结果;基于所述人物分割结果,查并标记所述单帧图像内的连通区域,确定单帧图像内的目标人物区域;通过边界框(bounding box)标记所述目标人物区域的范围;其中,所述目标人物区域标记为1,除所述目标人物区域之外的所述单帧图像的剩余区域标记为0;保留标记为1的所述目标人物区域,去除标记为0的所述剩余区域的背景;替换所述剩余区域的背景为新的背景。
5.可选地,所述查并标记所述单帧图像内的连通区域,确定单帧图像内的目标人物区域包括:通过深度优先搜索算法(dfs)查所述单帧图像中的连通区域;确认所述单帧图像的中心点,并获取所述中心点与所述连通区域的距离;抹除超过阈值范围的所述连通区域;其中,所述阈值范围为预设的一定范围的所述连通区域与所述中心点之间的距离数值。
6.可选地,所述抹除超过阈值范围的所述连通区域之后,还包括:确认所述单帧图像内的剩余所述连通区域;获取中心人物区域;所述中心人物区域为所述目标人物区域中除去非人物的区域。
7.可选地,所述获取中心人物区域包括:按照面积大小将所述剩余所述连通区域进行排序;获取所述排序的结果,并将所述剩余所述连通区域中面积最大的所述连通区域作为所述中心人物区域。
8.可选地,所述通过边界框(bounding box)标记所述目标人物区域的范围,包括:通过二值化对所述单帧图像内的人物及非人物区域进行标记;基于所述标记的结果,通过边界框(bounding box)获取所述目标人物区域的二值掩码;将所述二值掩码与所述目标人物区域的alpha掩码相乘,获得所述目标人物区域的边界框并标记为1,所述边界框之外的所述剩余区域标记为0。
9.可选地,所述保留标记为1的所述目标人物区域,去除标记为0的所述剩余区域的背景,包括:去除标记为0的所述剩余区域的背景,获得所述目标人物区域。
10.可选地,所述获取单帧图像内的人物分割结果,包括:基于人物检测框,获取所述单帧图像内的所述人物的身体特征;截取所述人物检测框中的所述人物的部分图像。
11.可选地,所述截取所述人物检测框中的所述人物的部分图像,包括:获取所述人物检测框的整体高度;从所述人物检测框的底端截取所述人物检测框的整体高度的50-70%;去除被截取区域,则所述被截取区域之外的区域为所述人物分割结果。
12.为了解决上述技术问题,本技术提供的第二个技术方案为:提供一种计算机设备,包括:处理器和存储器,存储器连接所述处理器,用于存储可在所述处理器上运行的计算机程序;其中,所述处理器执行所述计算机程序时实现上述任一项所述的方法。
13.为了解决上述技术问题,本技术提供的第三个技术方案为:提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法。
14.本技术的有益效果:区别于现有技术,本技术的图像处理方法通过对单帧图像内的连通区域进行标记,并通过边界框对人物和非人物进行标记,对于标记有目标人物的区域保留,非人物区域进行删除,从而可以将单帧图像内的目标人物进行确定,其他的背景区域删除并替换为新的背景。该方法可以消除图像内的无关人员,便于图像背景内容的统一管理,同时对图像背景的处理效率较高。
附图说明
15.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
16.图1是本技术一实施例提供的图像处理方法的整体流程框图;图2是图1提供的步骤s1的子步骤的流程框图;图3是图2提供的步骤s12的子步骤的流程框图;图4是本技术一实施例提供的单帧图像的截取示意图;图5是图1提供的步骤s2的子步骤的流程框图;图6是本技术一实施例提供的抹除超过阈值范围的连通区域的步骤之后的步骤的流程框图;图7是图6提供的步骤s25的子步骤的流程框图;图8是图1提供的步骤s3的子步骤的流程框图;图9是本技术一实施例提供的远程客服的背景未消除的单帧图像示意图;图10是本技术一实施例提供的远程客服的背景部分消除的单帧图像示意图;图11是本技术一实施例提供的远程客服的背景完全消除的单帧图像示意图;图12是本技术一实施例提供的机器视角的单帧图像内背景人物消除的流程示意图;图13是本技术一实施例提供的计算机设备的结构示意图;
图14是本技术一实施例提供的计算机可读存储介质的结构示意框图。
具体实施方式
17.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术的一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
18.本技术中的术语“第一”、“第二”、仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、的特征可以明示或者隐含地包括至少一个该特征。本技术实施例中所有方向性指示(诸如上、下、左、右、前、后
……
)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
19.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
20.若本技术技术方案涉及个人信息,应用本技术技术方案的产品在处理个人信息前,已明确告知个人信息处理规则,并取得个人自主同意。若本技术技术方案涉及敏感个人信息,应用本技术技术方案的产品在处理敏感个人信息前,已取得个人单独同意,并且同时满足“明示同意”的要求。例如,在摄像头等个人信息采集装置处,设置明确显著的标识告知已进入个人信息采集范围,将会对个人信息进行采集,若个人自愿进入采集范围即视为同意对其个人信息进行采集;或者在个人信息处理的装置上,利用明显的标识/信息告知个人信息处理规则的情况下,通过弹窗信息或者请个人自行上传其个人信息等方式获得个人授权;其中,个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式以及处理个人信息种类等信息。
21.本技术发明人发现:以前,例如在金融科技的应用场景中,客户如果需要办理银行的开户、销户、贷款、对公等业务,必须要到银行网点的柜台人工客服受理。而现在,银行为了满足客户需求,提供了远程业务办理服务,客户在家里只需要通过手机app与银行客服音视频通讯,即可办理银行柜面的各种业务。目前在银行远程客服业务应用场景下,为了统一客服背景形象,需要在客服的背后加装挡板,贴上银行的标志,这种方式对场景的要求比较高,同时不便于背景内容的统一管理。还有一种常用的做法是基于深度学习的虚拟背景方案,比如某远程会议的应用就有此功能,远程会议本身算法针对的是把人物从背景中分割出来,应用场景主要是居家办公,对背景有第二人或者多人出镜无特殊要求。但是对于银行的远程客服座席来讲,很难获得一个完整独立的空间进行客户的视频对话,背景人物出镜情况难以避免,如图9所示,中央人物为座席客服人员,音视频通话客户可以看到,右侧为
不相关人员,目前算法无法消除右侧人员。因此在上述业务场景中,具有消除多人出镜的需求,但目前的业内或产品均无法满足这一业务场景的需求。
22.为了解决上述问题,本技术提供一种图像处理方法。
23.请参阅图1至图4,图1是本技术一实施例提供的图像处理方法的整体流程框图,图2是图1提供的步骤s1的子步骤的流程框图,图3是图2提供的步骤s12的子步骤的流程框图,图4是本技术一实施例提供的单帧图像的截取示意图。
24.本技术提供的图像处理方法可以应用于任何需要进行远程客服背景处理的场景中。为了便于描述,本技术的以下实施例以银行远程客服为例进行说明。该图像处理方法具体可以包括:s1:获取单帧图像内的人物分割结果。
25.具体的,单帧图像可以来自于远程客服在进行视频处理的过程中,任意截取的一个静止画面。人物分割结果主要是对单帧图像内的人物画面进行分割,在远程客服的应用场景中,主要分割获取人物的上半身图像。
26.在一实施例中,获取单帧图像内的人物分割结果的步骤s1,包括:s11:基于人物检测框,获取单帧图像内的人物的身体特征。
27.具体的,可以理解,在视频通话、监控、摄像等场景中,均会有一个人物检测框来用于检测画面中出现的人物。该人物检测框可以通过人物的身体特征,例如头、肩等所处的位置来对人物进行识别。
28.s12:截取人物检测框中的部分人物的图像。
29.具体的,当人物检测框中的人物的身体特征被识别之后,可以截取人物检测框中需要的人物图像的位置。例如,在视频通话中需要获取的是人物的上半身。那么就可以根据获取到人物身体特征,对单帧图像内的人物画面进行截取。
30.进一步的,截取人物检测框中的部分人物的图像的步骤s12,包括:s121:获取人物检测框的整体高度。
31.具体的,首先可以采用人物检测器获得人物检测框的位置,其中可以包括单帧图像内人物的头顶到图像中人物的最底端位置。例如,如图4所示,通过人物检测器获取到人物检测框中人物的整体高度为h。
32.s122:从人物检测框的底端截取人物检测框的整体高度的50-70%。
33.具体的,获取到人物检测框的整体高度后,相当于人物占用全部图像高度时,获取到了单帧图像中人物的全部高度,那么根据视频通话应用场景中需要获取上半身人物图像的要求,可以截取从人物检测框的最底端到人物检测框整体高度的一半高度。例如截取从人物检测框的最底端到人物检测框整体高度的50-70%,优选为50%,如图4所示。也就是说,可以截取到人物的从胸部上下到头顶位置的图像。可以理解,当人物的图像没有占用单帧图像的全部高度时,可以截取单帧图像中人物整体高度的50-70%。
34.s123:去除被截取区域,则被截取区域之外的区域为人物分割结果。
35.具体的,在获取到上述单帧图像截取区域之后,去除被截取的区域,就可以得到单帧图像的人物分割结果,也就是本实施例视频通话应用场景中所需要的人物特征。
36.s2:基于人物分割结果,查并标记单帧图像内的连通区域,确定单帧图像内的目标人物区域。
37.具体的,在获取到单帧图像中人物的分割结果之后,需要查单帧图像内的目标人物,因为单帧图像内可能出现不止一个人物,因此需要获取到正在处理业务的中心人物,即当前视频通话中处理业务的客服人员本人。可以理解,在单帧图像内,目标人物的区域均是连通的,那么通过查并标记单帧图像内的连通区域,就可以到单帧图像内的目标人物区域。
38.请参阅图5至图7,图5是图1提供的步骤s2的子步骤的流程框图,图6是本技术一实施例提供的抹除超过阈值范围的连通区域的步骤之后的步骤的流程框图,图7是图6提供的步骤s25的子步骤的流程框图。
39.在一实施例中,查并标记单帧图像内的连通区域,确定单帧图像内的目标人物区域的步骤s2,可以包括:s21:通过深度优先搜索算法(dfs)查单帧图像中的连通区域。
40.具体的,在本实施例中,通过深度优先搜索算法(deep first search,dfs)来获取单帧图像内的连通区域。具体可以通过连通区域分析算法,针对客服座席场景下的图像获取规则,获取单帧图像内人物的边框,以确定连通区域的目标人物所在的大致范围。
41.s22:确认单帧图像的中心点,并获取中心点与连通区域的距离。
42.具体的,获取目标人物的边框之后,可以通过确定该单帧图像的中心点,来确定连通区域与中心点的距离。连通区域可能有多个,在单帧图像的中心点确定之后,可以获取中心点与连通区域某一点或者边缘的距离。由于连通区域是不规则的图形,获取中心点与连通区域的边缘之间的距离也就是获取中心点与连通区域边上的若干个点之间的距离。
43.s23:抹除超过阈值范围的连通区域。
44.具体的,首先设置一个阈值范围,阈值范围为预设的一定范围的多个连通区域与单帧图像的中心点之间的距离数值。在获取每一个连通区域与中心点之间的距离之后,必然会出现有的距离大,有的距离小,通过该阈值范围排除超过范围的数值,即去除距离单帧图像中心点太远的连通区域。该步骤的目的为:因为远离中心点的连通区域一般来讲都是座席场景下单帧图像内的无关人员,因此通过将远离中心点的连通区域去除,可以去除部分无关人员。
45.在一实施例中,如图6所示,抹除超过阈值范围的连通区域的步骤s23之后,还可以包括:s24:确认单帧图像内的剩余连通区域。
46.具体的,去除单帧图像内距离中心点较远的连通区域之后,剩下的为集中在中心点附近的连通区域,即该剩余连通区域。
47.s25:获取中心人物区域;中心人物区域为目标人物区域中除去非人物的区域。
48.具体的,从剩余连通区域中获取中心人物区域,此处的中心人物区域可以理解为,在单帧图像中确定的目标人物区域中除去非人物的区域之外的区域。例如,在目标人物区域中可能还存在其他的设备、其他工作人员的手臂等非人物的区域,去除该非人物区域就可以得到中心人物区域。
49.进一步的,如图7所示,获取中心人物区域的步骤s25,包括:s251:按照面积大小将剩余连通区域进行排序。
50.具体的,去除距离中心点较远的连通区域之后,将阈值范围内的、集中在中心点周
围的剩余连通区域按照其面积大小进行排序,获得从大到小的剩余连通区域的排列顺序。
51.s252:获取排序结果,并将剩余连通区域中面积最大的连通区域作为中心人物区域。
52.具体的,获取到剩余连通区域的排序结果之后,就可以确定在剩余连通区域中,面积最大的连通区域就是中心人物区域,即当前视频通话中正在处理业务的客服人员。通过该方法确定中心人物区域的原理在于:在通过远程视频进行业务办理的过程中,一般无论背景多么杂乱,处于单帧图像中面积最大的、最中心的必然是当前的业务办理人员。其它“乱入”的不相关人员、设备等,均是相对占据图像区域较小、较为边缘的。因此,先通过去除距离中心点阈值范围之外的人员,再去除中心点附近小于最大面积的连通区域的人和物,即可确定中心人物区域。
53.s3:通过边界框(bounding box)标记目标人物区域的范围。
54.具体的,通过边界框(bounding box)对目标人物区域以及目标人物区域之外的剩余区域进行标记和区分,例如,目标人物区域标记为1,除目标人物区域之外的单帧图像的剩余区域标记为0,以便于后面对中心人物区域之外的区域进行背景替换。
55.请参阅图8至图12,图8是图1提供的步骤s3的子步骤的流程框图,图9是本技术一实施例提供的远程客服的背景未消除的单帧图像示意图,图10是本技术一实施例提供的远程客服的背景部分消除的单帧图像示意图,图11是本技术一实施例提供的远程客服的背景完全消除的单帧图像示意图,图12是本技术一实施例提供的机器视角的单帧图像内背景人物消除的流程示意图。
56.在一实施例中,通过边界框(bounding box)标记目标人物区域的范围的步骤s3,可以包括:s31:通过二值化对单帧图像内的人物及非人物区域进行标记。
57.具体的,对于相关目标人物区域的alpha掩码进行对应的二值化,二值化的主要目的是将alpha掩码的图像中所有人物用rgb值(255,255,255)表示,所有非人物用rgb值(0,0,0)表示。所获得的binary image(二值图像)和原图大小一致,每一个像素值为1或0,其中1标记的区域为前景,0标记的区域为背景。可以理解,前景所在区域为目标人物区域,背景所在区域为剩余区域。
58.s32:基于该标记结果,通过边界框(bounding box)获取目标人物区域的二值掩码。
59.具体的,通过上述的二值化标记,将目标人物区域和单帧图像内的剩余区域进行区分和标记。如图10所示,通过目标人物区域的边界框(边界框内为1),获得0/1二值掩码mmain。
60.s33:将二值掩码与目标人物区域的alpha掩码相乘,获得目标人物区域的边界框并标记为1,边界框之外的剩余区域标记为0。
61.具体的,将该二值掩码mmain与目标人物区域的alpha掩码ppha相乘,得到边界框的范围,并标记为1,则边界框外部的剩余区域为0。
62.s4:保留标记为1的目标人物区域,去除标记为0的剩余区域的背景。
63.具体的,基于上述二值化的标记,可以根据需要保留标记为1的区域,即目标人物所在区域,如图11所示,同时去除标记为0的区域,即单帧图像内的剩余区域。
64.进一步的,保留标记为1的目标人物区域,去除标记为0的剩余区域的背景的步骤s4,包括:s40:去除标记为0的剩余区域的背景,获得目标人物区域。
65.可以理解,去除了单帧图像内的剩余区域之后,仅保留了视频通话业务处理过程中的当前目标人物所在区域。
66.s5:替换剩余区域的背景为新的背景。
67.具体的,去除了剩余区域的背景之后,可以将该剩余区域的背景根据需要替换为新的背景。具体过程可以为:选取需要替换的背景图片b,计算最终替换背景后的输出=p’pha*f+(1-p’pha)*b,f和b分别为神经网络模型推理出的前景和背景图片,p’pha为新的背景的alpha掩码。该新的背景可以是纯背景,也可以是预设的业务场景图片等。具体根据需要设置,本技术对此不做限制。
68.本技术公开的图像处理方法包括:获取单帧图像内的人物分割结果;基于人物分割结果,查并标记单帧图像内的连通区域,确定单帧图像内的目标人物区域;通过边界框(bounding box)标记目标人物区域的范围;其中,目标人物区域标记为1,除目标人物区域之外的单帧图像的剩余区域标记为0;保留标记为1的目标人物区域,去除标记为0的剩余区域的背景;替换剩余区域的背景为新的背景。该方法可以有效地将不相关的非音视频座席业务人员进行消除,便于背景内容的统一管理,同时对图像背景的处理效率较高,能够帮助企业改善服务质量,提高客户满意度。
69.请参阅图13,图13是本技术一实施例提供的计算机设备的结构示意图。
70.计算机设备200,具体可以包括处理器210和存储器220。存储器220耦接处理器210。
71.处理器210用于控制计算机设备200的操作,处理器210还可以称为cpu(central processing unit,中央处理单元)。处理器210可能是一种集成电路芯片,具有信号的处理能力。处理器210还可以是通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器210也可以是任何常规的处理器等。
72.存储器220用于存储计算机程序,可以是ram,也可以是rom,或者其他类型的存储设备。具体的,存储器可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器中的非暂态的计算机可读存储介质用于存储至少一条程序代码。
73.处理器210用于执行存储器220中存储的计算机程序以实现本技术图像处理方法的实施例描述的图像处理方法。
74.在一些实施方式中,计算机设备200还可以包括:外围设备接口230和至少一个外围设备。处理器210、存储器220和外围设备接口230之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口230相连。具体的,外围设备包括:射频电路240、显示屏250、音频电路260和电源270中的至少一种。
75.外围设备接口230可被用于将i/o(input/output,输入/输出)相关的至少一个外围设备连接到处理器210和存储器220。在一些实施例中,处理器210、存储器220和外围设备
接口230被集成在同一芯片或电路板上;在一些其他实施方式中,处理器210、存储器220和外围设备接口230中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
76.射频电路240用于接收和发射rf(radio frequency,射频)信号,也称电磁信号。射频电路240通过电磁信号与通信网络以及其他通信设备进行通信,射频电路240则是计算机设备200的通信电路。射频电路240将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路240包括:天线系统、rf收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路240可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2g、3g、4g及5g)、无线局域网和/或wifi(wireless fidelity,无线保真)网络。在一些实施例中,射频电路240还可以包括nfc(near field communication,近距离无线通信)有关的电路,本技术对此不加以限定。
77.显示屏250用于显示ui(user interface,用户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏250是触摸显示屏时,显示屏250还具有采集在显示屏250的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器210进行处理。此时,显示屏250还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施方式中,显示屏250可以为一个,设置在计算机设备200的前面板;在另一些实施方式中,显示屏250可以为至少两个,分别设置在计算机设备200的不同表面或呈折叠设计;在另一些实施方式中,显示屏250可以是柔性显示屏,设置在计算机设备200的弯曲表面上或折叠面上。甚至,显示屏250还可以设置成非矩形的不规则图形,也即异形屏。显示屏250可以采用lcd(liquid crystal display,液晶显示屏)、oled(organic light-emitting diode ,有机发光二极管)等材质制备。
78.音频电路260可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器210进行处理,或者输入至射频电路240以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在计算机设备200的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器210或射频电路240的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路260还可以包括耳机插孔。
79.电源270用于为计算机设备200中的各个组件进行供电。电源270可以是交流电、直流电、一次性电池或可充电电池。当电源270包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
80.关于本技术计算机设备200的实施例中各功能模块或者部件功能和执行过程的详细阐述,可以参照上述本技术图像处理方法实施例中的阐述,在此不再赘述。
81.在本技术所提供的几个实施例中,应该理解到,所揭露的计算机设备200和图像处理方法,可以通过其它的方式实现。例如,以上所描述的计算机设备200的各实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的
划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
82.作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
83.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
84.请参阅图14,图14是本技术一实施例提供的计算机可读存储介质的结构示意框图。
85.参阅图14,上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在计算机可读存储介质300中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令/计算机程序用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种介质以及具有上述存储介质的电脑、手机、笔记本电脑、平板电脑、相机等计算机设备。
86.关于计算机可读存储介质300中的程序数据的执行过程的阐述可以参照上述本技术图像处理方法的实施例中阐述,在此不再赘述。
87.以上所述仅为本技术的实施方式,并非因此限制本技术的专利范围,凡是利用本技术说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本技术的专利保护范围内。

技术特征:


1.一种图像处理方法,其特征在于,包括:获取单帧图像内的人物分割结果;基于所述人物分割结果,查并标记所述单帧图像内的连通区域,确定单帧图像内的目标人物区域;通过边界框(bounding box)标记所述目标人物区域的范围;其中,所述目标人物区域标记为1,除所述目标人物区域之外的所述单帧图像的剩余区域标记为0;保留标记为1的所述目标人物区域,去除标记为0的所述剩余区域的背景;替换所述剩余区域的背景为新的背景。2.根据权利要求1所述的方法,其特征在于,所述查并标记所述单帧图像内的连通区域,确定单帧图像内的目标人物区域包括:通过深度优先搜索算法(dfs)查所述单帧图像中的连通区域;确认所述单帧图像的中心点,并获取所述中心点与所述连通区域的距离;抹除超过阈值范围的所述连通区域;其中,所述阈值范围为预设的一定范围的所述连通区域与所述中心点之间的距离数值。3.根据权利要求2所述的方法,其特征在于,所述抹除超过阈值范围的所述连通区域之后,还包括:确认所述单帧图像内的剩余所述连通区域;获取中心人物区域;所述中心人物区域为所述目标人物区域中除去非人物的区域。4.根据权利要求3所述的方法,其特征在于,所述获取中心人物区域包括:按照面积大小将所述剩余所述连通区域进行排序;获取所述排序的结果,并将所述剩余所述连通区域中面积最大的所述连通区域作为所述中心人物区域。5.根据权利要求1所述的方法,其特征在于,所述通过边界框(bounding box)标记所述目标人物区域的范围,包括:通过二值化对所述单帧图像内的人物及非人物区域进行标记;基于所述标记的结果,通过边界框(bounding box)获取所述目标人物区域的二值掩码;将所述二值掩码与所述目标人物区域的alpha掩码相乘,获得所述目标人物区域的边界框并标记为1,所述边界框之外的所述剩余区域标记为0。6.根据权利要求5所述的方法,其特征在于,所述保留标记为1的所述目标人物区域,去除标记为0的所述剩余区域的背景,包括:去除标记为0的所述剩余区域的背景,获得所述目标人物区域。7.根据权利要求1所述的方法,其特征在于,所述获取单帧图像内的人物分割结果,包括:基于人物检测框,获取所述单帧图像内的所述人物的身体特征;截取所述人物检测框中的所述人物的部分图像。8.根据权利要求7所述的方法,其特征在于,所述截取所述人物检测框中的所述人物的部分图像,包括:
获取所述人物检测框的整体高度;从所述人物检测框的底端截取所述人物检测框的整体高度的50-70%;去除被截取区域,则所述被截取区域之外的区域为所述人物分割结果。9.一种计算机设备,其特征在于,包括:处理器;存储器,连接所述处理器,用于存储可在所述处理器上运行的计算机程序;其中,所述处理器执行所述计算机程序时实现权利要求1至8任一项所述的方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至8任一项所述的方法。

技术总结


本申请公开了一种图像处理方法、计算机设备及存储介质,图像处理方法包括:获取单帧图像内的人物分割结果;基于人物分割结果,查并标记单帧图像内的连通区域,确定单帧图像内的目标人物区域;通过边界框(bounding box)标记目标人物区域的范围;其中,目标人物区域标记为1,除目标人物区域之外的单帧图像的剩余区域标记为0;保留标记为1的目标人物区域,去除标记为0的剩余区域的背景;替换剩余区域的背景为新的背景。该方法可以消除图像内的无关人员,便于图像背景内容的统一管理,同时对图像背景的处理效率较高。像背景的处理效率较高。像背景的处理效率较高。


技术研发人员:

黄炎鑫 张宁

受保护的技术使用者:

平安银行股份有限公司

技术研发日:

2022.11.04

技术公布日:

2022/12/16

本文发布于:2024-09-23 07:32:34,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/43037.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:区域   所述   人物   图像
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议