图数据压缩方法、装置、设备及介质与流程



1.本技术涉及人工智能和云计算技术领域,尤其涉及一种图数据压缩方法、装置、设备及介质。


背景技术:



2.目前,图数据一般由多个数据点构成,一般而言数据点具备较高的数据深度,图数据以结构清晰,便于数据查询的优势,具备越来越广泛的应用场景。在实际应用中,例如知识图谱、用户图谱、高光谱图像均可以属于图数据。其中,用户图谱例如可以是以用户标识作为用户节点,节点信息可以为具有较高深度的用户信息,用户之间的关系可以作为用户节点的边。知识图谱与之类似,同样是基于具有一定数据深度的节点和节点之间的连接关系生成。而高光谱图像一般是多个像素点组成,像素点的波段较多。例如,通过卫星采集的地表图像一般是2000*2000的分辨率,由400万个像素点构成,每个像素点由500个波段构成,500个波段可以理解为像素点的深度。
3.但是,由于数据点的结构较为复杂,数据深度较高,因而导致多个数据点构成的图数据的数据量较大,占用过多的存储空间,不利于数据的存储。因此,如何对图数据进行高精准压缩是目前亟待解决的技术问题。


技术实现要素:



4.本技术提供一种图数据压缩方法、装置、设备及介质,用以解决网络设备图数据压缩准确度不高的技术问题。
5.第一方面,本技术提供一种图数据压缩方法,包括:
6.确定待压缩的图数据中的至少一个数据点;所述数据点的数据深度大于深度阈值;
7.确定至少一个所述数据点中的有标签数据点和无标签数据点;
8.利用所述有标签数据点和所述无标签数据点之间的类别关联关系,提取至少一个所述数据点对应的降维矩阵;
9.基于所述图数据和所述降维矩阵的矩阵计算,获得所述图数据的目标图数据。
10.第二方面,本技术提供一种图数据压缩方法装置,包括:
11.数据确定单元,用于确定待压缩的图数据中的至少一个数据点;所述数据点的数据深度大于深度阈值;
12.标签划分单元,用于确定至少一个所述数据点中的有标签数据点和无标签数据点;
13.矩阵提取单元,用于利用所述有标签数据点和所述无标签数据点之间的数据点关联关系,提取至少一个所述数据点对应的降维矩阵;
14.目标确定单元,用于基于图数据和所述降维矩阵的矩阵计算,获得所述图数据的目标图数据。
15.第三方面,本技术提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;
16.所述存储器存储计算机执行指令;
17.所述处理器执行所述存储器存储的计算机执行指令,以实现如第一方面所述的图数据压缩方法。
18.第四方面,本技术提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面所述的图数据压缩方法。
19.本技术提供的图数据压缩方法,可以确定待压缩的图数据中的至少一个数据点。数据点的数据深度大于深度阈值。确定至少一个数据点中的有标签数据点和无标签数据点之后,可以根据有标签数据点和无标签之间的数据点关联关系,提取至少一个数据点的降维矩阵,通过降维矩阵可以对至少一个数据点进行降维计算,获得至少一个目标数据点。利用降维矩阵可以对至少一个数据点分别进行降维计算,可以获得准确的目标数据点,实现对至少一个数据点的有效降维,获得的至少一个目标数据点对应的目标图数据可以达到压缩的目的,实现对图数据的快速而准确的压缩。
附图说明
20.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
21.图1是本公开实施例提供的一种图数据压缩方法的一个应用系统架构图;
22.图2是本公开实施例提供的一种图数据压缩方法的一个实施例的流程图;
23.图3是本公开实施例提供的一种图数据压缩方法的又一个实施例的流程图;
24.图4是本公开实施例提供的一种图数据压缩方法的又一个实施例的流程图;
25.图5是本公开实施例提供的一种图数据压缩方法的又一个实施例的流程图;
26.图6是本公开实施例提供的一种图数据压缩装置的一个实施例的结构示意图;
27.图7是用于实现本公开提供的图数据压缩方法的一种电子设备的框图。
28.通过上述附图,已示出本技术明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本技术构思的范围,而是通过参考特定实施例为本领域技术人员说明本技术的概念。
具体实施方式
29.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
30.本公开的技术方案可以应用于金融、农业等存在图数据压缩需求的场景中,通过对图数据的至少一个数据点之间的关联关系进行提取,可以获得降维矩阵,从而利用降维矩阵对每个数据点进行降维,达到对由至少一个数据点构成的图数据的压缩,可以有效降低图数据的存储空间,更有利于图数据的存储和分析处理。
31.相关技术中,图数据一般由多个数据点构成,例如高光谱数据、知识图谱均可以作为图数据的一种。图数据与普通数据的区别在于,数据点的结构较为复杂,数据深度较高。例如,高光谱图像的像素点,也即数据点,可以由500个波段构成。但是,由于数据点的数据深度较高,导致图数据在存储时占用较大存储空间。为了降低图数据的数据量,提高数据处理效率,可以采用图学习模型对图数据进行降维。目前一般采用基于统计理论的主成分分析法、基于几何理论的无监督方法、基于标签信息的线性判别方法等,这些方法均为有监督的方法,从降维效果看,有监督的方法可以具备较高的鉴别效果。
32.为了解决上述技术问题,本技术方案考虑到,对于图数据而言,图数据中的至少一个数据点可能存在一定的关联关系,如果利用这些关联关系,对数据点之间的相同信息进行压缩,则可以对至少一个数据点完成降维,达到对图数据的压缩目的。
33.据此,本公开的技术方案,可以确定待压缩的图数据中的至少一个数据点。数据点的数据深度大于深度阈值。确定至少一个数据点中的有标签数据点和无标签数据点之后,可以根据有标签数据点和无标签之间的数据点关联关系,提取至少一个数据点的降维矩阵,通过降维矩阵可以对至少一个数据点进行降维计算,获得至少一个目标数据点。利用降维矩阵可以对至少一个数据点分别进行降维计算,可以获得准确的目标数据点,实现对至少一个数据点的有效降维,获得的至少一个目标数据点对应的目标图数据可以达到压缩的目的,实现对图数据的快速而准确的压缩。
34.本公开提供的图数据压缩方法、装置、设备及存储介质,可以应用于人工智能和云计算技术领域。也可以应用于人工智能和云计算技术领域以外的任意领域,例如可以应用于金融领域、遥感技术领域等。本公开对提供的图数据压缩方法、装置、设备及存储介质的具体应用领域并不做出过多限定。
35.下面以具体地实施例对本技术的技术方案以及本技术的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本技术的实施例进行描述。
36.图1为本公开实施例提供的一种图数据压缩方法的一个应用系统架构图,该图数据压缩系统可以包括:用户对应的电子设备11(以个人计算机为例),与电子设备存在有线或无线通信连接的云服务器12,以及用于存储数据的数据库13。电子设备11例如可以包括:服务器、图像采集设备、计算机、笔记本、遥感卫星等具备数据处理或者采集功能的设备。
37.其中,电子设备11可以向云服务器12发送待压缩的图数据。云服务器12中可以配置本公开的图数据压缩方法,对图数据进行压缩处理。处理过程中,图数据中的至少一个数据点可以按照有无标签被划分为有标签数据点121和无标签数据点122。可以利用有标签数据点121和无标签数据点122,分别构建同类数据点协同关系123、异类数据点协同关系124、以及无标签数据点的协同关系125。通过同类数据点协同关系123和无标签数据点的协同关系125可以构造半监督协同表达图,记为126,通过异类数据点协同关系124 可以构造类间协同表达图,127。半监督协同表达图,记为126和类间协同表达图,记为 127即为数据点关联关系,通过数据点关联关系即可以提取降维矩阵。也即,利用半监督协同表达图,记为126和类间协同表达图,记为127即可以确定半监督协同表达嵌入矩阵 128,该办监督协同表达嵌入矩阵128即为降维矩阵。通过降维矩阵可以对图数据进行降维,获得目标图数据129。
38.获得目标图数据129之后,可以将目标图数据存储至数据库13中。利用降维矩阵对
图数据降维之后,可以实现对图数据的有效降维,提高图数据的压缩效率和准确性。
39.如图2所示,为本公开实施例提供的一种图数据压缩方法的一个实施例的流程图,该方法可以配置为一图数据压缩装置,该图数据压缩装置可以位于电子设备中,其中,图数据压缩方法可以包括以下几个步骤:
40.201:确定待压缩的图数据中的至少一个数据点;数据点的数据深度大于深度阈值。
41.数据点的数据深度可以指数据的容量、字节或者波段,可以根据数据的定义确定数据深度的单位,例如rgb图像的数据深度为24字节,其中,8字节为r,8字节为g,8 字节为b。高光谱数据的像素点可以是500个波段。数据点的数据深度越大,数据点的数据量越大,对数据点进行存储时占用的内存也越大。深度阈值可以根据实际的使用需求设置。例如,图数据包括知识图谱时,数据点可以包括以键值对形式存储的数据。数据深度可以包括键值对的数量,也可以包括键值对的字段长度。
42.202:确定至少一个数据点中的有标签数据点和无标签数据点。
43.至少一个数据点可以包括有标签的数据点和无标签的数据点。在实际应用中,由于图数据的数据维度一般较高,若对图数据进行标注,相比于普通图像等数据,图数据的标注成本更高。例如,高光谱图像的数据维度一般是2000*2000,需要对图数据中的河流、树林、池塘、田野、建筑物、道路等不同类别进行标注。为了提高数据的压缩效率,本公开中,可以并不对所有数据点进行标注,对部分数据点进行标注即可。
44.其中,图数据的标注过程可以包括:对图数据进行关键区域提取,并对提取的关键区域按照对应的类型设置标签类型。图数据中未被标记为关键区域的数据点可以作为无标签数据点。
45.203:利用有标签数据点和无标签数据点之间的类别关联关系,提取至少一个数据点对应的降维矩阵。
46.类别关联关系可以指有标签数据点和无标签数据点之间的协同表达关系。有标签数据点可以属于至少一个标签类别,可以包括至少一个标签类别分别对应的标签数据点。同一标签类别之间的数据点可以使用向量表示关联关系,不同类别标签之间的数据点也可以使用向量表示关联关系,为了对无标签数据点进行准确利用,有标签数据点和无标签数据点之间也可以使用向量表示关联关系。也即,类别关联关系可以包括:同一标签类别之间的关联关系、不同标签类别之间的关联关系和有无标签类别之间的关联关系。
47.可选地,利用有标签数据点和无标签数据点之间的类别关联关系,提取至少一个数据点对应的降维矩阵,可以包括:利用有标签数据点和无标签数据点之间的类别关联关系,获取满足数据点压缩条件的降维矩阵。数据点压缩条件可以包括:以降维矩阵对数据点压缩后产生的数据形变或者数据最小。
48.204:基于图数据和降维矩阵的矩阵计算,获得图数据对应的目标图数据。
49.基于图数据和降维矩阵的矩阵计算可以包括:将降维矩阵转置,获得降维转置矩阵,将转置矩阵和图数据进行矩阵计算,获得目标图数据。降维矩阵可以使用p表示,则降维转置矩阵可以使用p
t
表示,通过降维转置矩阵p
t
与图数据x进行矩阵相乘p
t
x即可以获得目标图数据。
50.本公开实施例中,可以确定待压缩的图数据中的至少一个数据点。数据点的数据
深度大于深度阈值。确定至少一个数据点中的有标签数据点和无标签数据点之后,可以根据有标签数据点和无标签之间的类别关联关系,提取至少一个数据点的降维矩阵,通过降维矩阵可以对至少一个数据点进行降维计算,获得至少一个目标数据点。利用降维矩阵可以对至少一个数据点分别进行降维计算,可以获得准确的目标数据点,实现对至少一个数据点的有效降维,获得的至少一个目标数据点对应的目标图数据可以达到压缩的目的,实现对图数据的快速而准确的压缩。
51.作为一个实施例,有标签数据点可以包括至少一个标签类别分别对应的标签数据点。
52.如图3所示,与图2所示的实施例的步骤的不同之处在于,步骤203:利用有标签数据点和无标签数据点之间的类别关联关系,提取至少一个数据点对应的降维矩阵,可以包括:
53.301:以无标签数据点作为同一类别,结合至少一个标签类别分别对应的标签数据点,对同一类别的标签数据点之间的关联关系进行提取,获得类内协同信息。
54.将无标签数据点作为同一类别,可以对有标签数据点和无标签数据点进行同一类别间的特性进行提取,获得类内协同信息。由于类内协同信息是通过有标签数据点和无标签数据点确定,可以类内协同信息可以包括:半监督协同表达图。
55.同一类别的标签数据点之间的关联关系可以包括对相同类别的标签数据点进行位置标定。无标签数据点整体也可以作为无标签类别进行相同类别的标签数据点的关联提取。
56.类内协同信息可以包括对同一类别的数据点进行协同表达的重构关系和无标签数据点进行协同表达的重构关系。
57.302:根据至少一个标签类别分别对应的标签数据点,对不同类别的标签数据点之间的关联关系进行提取,获得类间协同信息。
58.不同类别的标签数据点之间的关联关系可以包括对不同类别的标签数据点进行位置标定。类间协同信息可以包括对不同类别的数据点进行协同表达的重构矩阵。
59.303:基于类内协同信息和类间协同信息,构造半监督协同嵌入方程。
60.可选地,类内协同信息可以使用(ws)
i,j
表示,类间协同信息可以使用(wd)
i,j
表示。其中,i表示1-n,j表示1-n,n为至少一个数据点的数量。
61.半监督协同嵌入方程可以表示为:
62.其中,p可以为待求解的降维矩阵,通过以半监督协同嵌入方程的计算值最小为优化目标,计算获得降维矩阵。
63.304:响应于针对半监督协同嵌入方程的求解指令,对半监督协同嵌入方程求解,获得降维矩阵。
64.可选地,对半监督协同嵌入方程求解,获得降维矩阵,可以包括:利用广义求解特征值算法,对半监督协同嵌入方程进行求解,获得降维矩阵。
65.本公开实施例中,可以使用类内协同信息和类间协同信息对至少一个数据点中的同一类数据点之间的类内关系,和不同类数据点之间的类间关系进行提取,实现对至少一个数据点在相同类别和不同类别之间的准确特征表达,实现对半监督协同嵌入方程的准确
构造,通过半监督协同嵌入方程的构造,通过对方程求解,计算获得降维矩阵,实现对降维矩阵的准确提取。
66.在一种可能的设计中,如图4所示,为本公开实施例提供的图数据压缩方法的又一个实施例的流程图。其中,以无标签数据点作为相同类别,结合至少一个标签类别分别对应的标签数据点,对同一类别的标签数据点之间的关联关系进行提取,获得类内协同信息,可以包括:
67.401:根据至少一个标签类别分别对应的标签数据点,对数据点在同一类别标签的相同特征关系进行提取,获得至少一个数据点分别对应的第一重构系数向量。
68.第一重构系数向量可以用于对相同标签类别的数据点进行同类约束,可以通过数据点在同一类别标签的相同特征关系提取获得。
69.可选地,对数据点在同一类别标签的相同特征关系,可以用于对至少一个数据点分别对应的重构系数向量进行优化求解,获得第一重构系数向量。
70.第一重构系数向量通过表示时,可以构建第一重构系数向量的第一系数方程,通过方程求解第一重构系数向量。第一系数方程可以通过1范数、二范数等距离计算公式确定。
71.第一重构系数向量可以与数据点的表征向量进行计算,以对图数据在对应数据点的转换向量进行计算,通过1范数或者2范数,计算数据点和转换向量之间的距离,并求解在距离取值最小时,第一重构系数向量的取值。
72.为了便于理解,以二范数为例,第一重构系数向量使用表示时,数据点对应的二范数距离的约束求解方程可以表示为:
[0073][0074]
通过在距离最小值的约束下对第一重构系数向量进行求解,可以获得第一重构系数向量的计算公式:
[0075]
其中,xs=xis,,可以为为数据点建立的同类表征向量,i可以为数据点的坐标值。同类表征向量的获取方式可以参考下述实施例中的描述。x可以为图数据,由至少一个数据点构成,β为常量,可以通过训练获得或是基于历史经验设置获得。
[0076]
402:将无标签数据点作为无标签类别,对数据点在无标签类别的相同特征关系进行提取,获得至少一个数据点分别对应的第二重构系数向量。
[0077]
第二重构系数向量可以用于对无标签类别进行同类约束,可以通过数据点在无标签类别的标签关联特征进行提取获得。
[0078]
对数据点在无标签类别的相同特征关系,可以用于对数据点的第二重构系数向量的求解。第二重构系数向量通过表示时,可以构建第二系数方差,通过方程求解获得第二重构系数向量。第二系数方差可以通过1范数、2范数等距离计算公式确定。
[0079]
第二重构系数向量可以与数据点的表征向量进行计算,以对图数据在对应数据点的转换向量进行计算,通过1范数或2范数,计算数据点和对应转换向量之间的距离,并求解距离取值最小时,第二重构系数向量的取值。
[0080]
为了便于理解,以二范数为例,第二重构系数向量通过表示时,数据点对应的二
范数距离的约束求解方程可以表示为:
[0081][0082]
通过在距离最小值的约束下对第二重构系数向量进行求解,可以获得第二重构系数向量的计算公式:
[0083]
其中,xu=xiu,,可以为为数据点建立的无标签向量。i可以为数据点的坐标值。无标签向量的获取方式可以参考下述实施例中的描述。x可以为图数据,由至少一个数据点构成,γ为常量,可以通过训练获得或是基于历史经验设置获得。
[0084]
403:将数据点对应的第一重构系数向量和第二重构系数向量加权,获得至少一个数据点分别对应的半监督权值向量。
[0085]
将数据点对应的第一重构系数向量和第二重构系数向量加权,获得该数据点对应的半监督权值向量(ws)i。
[0086]
第一重构系数向量的向量长度与至少一个数据点的数量相等。因此,将第一重构系数向量和第二重构系数向量加权时,可以将向量中的各个坐标点对应的取值相加,也即其中,j为向量中的坐标点。
[0087]
404:基于至少一个数据点分别对应的半监督权值向量,确定类内协同信息;类内协同信息用于构造至少一个数据点分别对应的有向重构图。
[0088]
至少一个数据点分别对应的半监督权值向量即可以构成类内协同信息ws。
[0089]
有向重构图可以将至少一个数据点作为节点,利用类内协同信息建立节点关联关系。
[0090]
本公开实施例中,通过将无标签数据点作为同一个类别,结合至少一个标签类别分别对应的标签数据点,可以对数据点在同一类别标签的相同特征关系进行提取,获得至少一个数据点分别对应的第一重构系数向量。第一重构系数向量可以对相同类别的数据点之间的关系进行更好地表达。此外,还可以将无标签数据点作为无标签类别,对数据点在无标签类别的相同特征关系进行提取,获得至少一个数据点分别对应的第二重构系数向量。第二重构向量可以对无标签类别进行关系表达。以数据点作为加权单位,将第一重构系数向量和第二重构系数向量加权,可以确保获得的半监督权值向量可以对同类数据点和不同类数据点之间的表达关系进行准确记录,使得类内协同信息的信息含量更全面,准确度更高。
[0091]
作为一种可选实施方式,步骤401,可以包括:根据至少一个标签类别分别对应的标签数据点,对数据点在同一类别标签的相同特征关系进行提取,获得至少一个数据点分别对应的第一重构系数向量,包括:
[0092]
根据至少一个标签类别分别对应的标签数据点,对同一标签类别的标签数据点之间的相同特性进行关系提取,获得至少一个数据点分别对应的同类表征向量;
[0093]
根据数据点的同类表征向量,计算获得数据点的第一重构系数向量,以确定至少一个数据点分别对应的第一重构系数向量。
[0094]
本公开实施例中,可以根据至少一个标签类别分别对应的标签数据点,对同一标签类别的标签数据点之间的相同特性进行关系提取,获得至少一个数据点分别对应的同类
表征向量。同类表征向量可以对数据点在至少一个数据点的类别相同与否进行准确定义,通过同类表征向量可以对数据点的第一重构系数向量进行准确确定。使得第一重构系数向量中包含数据点的同类特性,确保第一重构系数向量能够对同类数据点进行准确计算。
[0095]
在一种可能的设计中,任一个数据点的同类表征向量通过以下方式确定:
[0096]
针对至少一个数据点中的第一数据点,将至少一个数据点的数量作为向量长度,为第一数据点建立空的第一表征向量。
[0097]
遍历至少一个数据点,判断数据点与第一数据点是否属于同一类别,若是,则确定数据点在第一表征向量对应坐标处取值为1,若否,则确定数据点在第一表征向量对应坐标处取值为0。
[0098]
获得遍历结束时各坐标值已确定的第一表征向量为同类表征向量。
[0099]
为了同类表征向量的获取方式进行准确说明,如表1所示,假设存在6个数据点,以这6个数据点分别作为第一数据点,确定第一数据点与至少一个第一数据点分别对应的取值。假设1、2是同一标签类别,3、6是无标签类别,4、5为同一标签类别。表1:
[0100] 123456101000021000003000001400001050001006001000
[0101]
以上,数据点1的第一表征向量可以为【0,1,0,0,0,0】。数据点2的第二表征向量可以为【1,0,0,0,0,0】,数据点3的第一表征向量可以为【0,0,0,0,0,1】,数据点4的第一表征向量可以为【0,0,0,0,1,0】,数据点5的第一表征向量可以为【0,0,0,1,0,0】,数据点6 的第一表征向量可以为【0,0,1,0,0,0】。每个数据点可以对应有相应的第一表征向量。
[0102]
本公开实施例中,在确定数据点的同类表征向量时,可以针对至少一个数据点中数量作为向量长度,建立第一数据点的第一表征向量,第一表征向量作为空向量,需要确定向量的各个坐标点的取值。通过遍历至少一个数据点,可以判断数据点是否与第一数据点属于同一标签类别,将与第一数据点属于同一标签类别的坐标设置为1,将与第一数据点属于不同标签类别的坐标设置为0。通过对同一标签类别的标签设置,可以对第一数据点与至少一个数据点分别对应的类别关系进行准确提取,获得的同类表征向量可以对与第一数据点属于同一标签类别的数据点进行准确记录,实现准确的同类表征。
[0103]
作为又一种可选实施方式,步骤402,可以包括:将无标签数据点作为无标签类别,对数据点在无标签类别的相同特征关系进行提取,获得至少一个数据点分别对应的第二重构系数向量,包括:
[0104]
将无标签数据点作为同一类别,对数据点对应的无标签特征进行提取,获得至少一个数据点分别对应的无标签向量;
[0105]
根据数据点对应的无标签向量,计算获得数据点的第二重构系数向量,以获得至少一个数据点分别对应的第二重构系数向量。
[0106]
本公开实施例中,将无标签数据点作为同一类别,对各个数据点与无标签数据点
之间的关联进行准确提取,获得至少一个数据点各自对应的第二重构系数。通过数据点的无标签向量可以对数据点的第二重构系数向量进行准确提取,使得第二重构系数向量与各个数据点的无标签向量计算获得,综合考量了无标签数据之间的有效关联,提高了第二重构系数向量的获取效率和精度。
[0107]
在一种可能的设计中,任一个数据点的无标签向量通过以下方式确定:
[0108]
针对至少一个数据点中的第二数据点,将至少一个数据点的数量作为向量长度,为第二数据点建立空的标签向量;
[0109]
遍历至少一个数据点,判断数据点与第二数据点是否均为无标签数据点,若是,则确定数据点在标签向量对应坐标取值为1,若否,则确定数据点在标签向量对应坐标值为0;
[0110]
获得遍历结束时,坐标值均已确定的标签向量为无标签向量。
[0111]
为了同类表征向量的获取方式进行准确说明,如表2所示,假设存在6个数据点,以这6个数据点分别作为第一数据点,确定第一数据点与至少一个第一数据点分别对应的取值。假设1、2是同一标签类别,3、6是无标签类别,4、5为同一标签类别。表2:
[0112] 123456100000020000003000001400000050000006001000
[0113]
以上,除数据点3的标签向量为【0,0,0,0,0,1】和数据点6的标签向量为【0,0,1,0,0,0】之外,其它数据点的标签向量均可以为【0,0,0,0,0,0】。
[0114]
本公开实施例中,在确定数据点的无标签向量时,可以针对至少一个数据点中数量作为向量长度,建立第二数据点的标签向量,标签向量作为空向量,需要确定标签向量的各个坐标点的取值。通过遍历至少一个数据点,可以判断数据点是否与第二数据点均属于无标签类别,将与第二数据点均属于无标签类别的数据点对应的坐标设置为1,将与第二数据点不是均属于无标签类别的数据点的坐标设置为0。通过对无标签数据类别的设置,可以对各个数据点与无标签数据点对应的无标签关联关系进行准确提取,获得的无标签向量可以对与第二数据点均属于无标签的数据点进行准确记录,实现准确的无标签向量的表征。
[0115]
作为又一个实施例,如图5所示,为本公开实施例提供的图数据压缩方法的又一个实施例的流程图。其中,根据至少一个标签类别分别对应的标签数据点,对不同类别的标签数据点之间的关联关系进行提取,获得类间协同信息,可以包括:
[0116]
501:根据至少一个标签类别分别对应的标签数据点,对数据点在不同类别标签的相同特性进行关系提取,获得至少一个数据点分别对应的第三重构系数向量。
[0117]
502:基于至少一个数据点分别对应的第三重构系数向量,对不同类别的数据点间的协同关系进行提取,获得类间协同信息。
[0118]
类间协同信息可以包括类间权值矩阵(wd)
i,j

[0119]
第三重构系数向量,可以通过数据点在不同类别标签的相同特性进行关系提取获得。
[0120]
不同数据点间的协同关系提取可以指利用至少一个数据点分别对应的第三重构系数向量,对不同类的有标签数据点进行关系重构,使得经重构之后的数据与数据点的差异较小,确保降维的同时,保持数据的真实性。
[0121]
为了便于理解,以表示第三重构系数向量时,可以将向量提取问题转化为距离求解问题。可以计算数据点和数据点经第三重构系数向量转化之后的距离,将该距离最小作为优化目标。距离可以包括1范数距离、2范数距离等。
[0122]
以2范数距离为例,不同类别间的第三重构系数向量可以通过以下优化问题求解:
[0123][0124]
其中,xd=xid,,为类间表征向量。类间协同信息可以通过至少一个数据点分别对应的第三重构系数向量确定。
[0125]
本公开实施例中,可以根据至少一个标签类别分别对应的标签数据点,对数据点在不同类别标签的相同特性进行关系提取,获得至少一个数据点分别对应的第三重构向量。第三重构向量可以表征不同标签类别之间的数据点关联关系,通过至少一个数据点分别对应的第三重构系数向量,可以对不同类别的数据点之间的协同关系进行提取,获得类间协同信息。类间协同信息可以表示至少一个数据点分别对应的第三重构系数向量,可以实现对类间关系的准确提取,提高类间协同表达效果。
[0126]
在一种可能的设计中,根据至少一个标签类别分别对应的标签数据点,对数据点在不同类别标签的相同特性进行关系提取,获得至少一个数据点分别对应的第三重构系数向量,包括:
[0127]
针对至少一个标签类别分别对应的标签数据点,基于非同一类别的标签数据点,确定至少一个数据点分别对应的类间表征向量;
[0128]
根据数据点的类间表征向量,计算获得数据点的第三重构系数向量,以获得至少一个数据点分别对应的第三重构系数向量。
[0129]
本公开实施例中,可以通过不同类别的标签数据点对至少一个数据点在不同类别的关联特性提取,以获得至少一个数据点分别对应的类间表征向量。通过类间表征向量,可以计算数据点的第三重构系数向量,可以实现对至少一个数据点的第三重构系数向量的准确计算。
[0130]
可选地,根据数据点的类间表征向量,计算获得数据点的第三重构系数向量,包括:
[0131]
根据数据点的类间表征向量,构造数据点的类间协同方程。
[0132]
响应于针对类间协同方程的求解请求,计算获得数据点的第三重构系数向量,以获得至少一个数据点分别对应的第三重构系数向量。
[0133]
通过构建类间协同方程可以对第三重构系数向量准确求解。
[0134]
在某些实施例中,基于至少一个数据点分别对应的第三重构系数向量,对不同类别的样本间的协同关系进行提取,获得类间协同信息,包括:
[0135]
根据至少一个数据点分别对应的第三重构系数向量,按照至少一个数据点的位置进行向量组合,获得类间重构矩阵;
[0136]
针对任一个数据点,根据数据点在对应的第三重构系数向量中的目标位置,确定目标位置在类间重构矩阵中的转置位置。
[0137]
从类间重构矩阵中确定目标位置对应的第一取值和转置位置的第二取值。
[0138]
从第一取值和第二取值中选择最大值作为目标位置的目标取值,以获得类间重构矩阵中每个位置对应的目标取值。
[0139]
确定类间重构矩阵在每个位置替换为对应的目标取值构成的类间协同信息。
[0140]
数据点在第三重构系数向量中的目标位置(i,j),在目标位置的第一取值可以为转置位置可以为(j,i),在转置位置的第二取值可以为
[0141]
从第一取值和第二取值中选择最大值作为目标位置的目标取值,可以包括:从第一取值的绝对值和第二取值的绝对值中选择最大值作为目标位置的目标取值。目标位置的目标取值使用公式可以表示为:
[0142]
本公开实施例中,通过确定至少一个数据点分别在第三重构系数向量对应的类件重构矩阵,可以对同一数据点在目标位置和目标位置对应的转置位置的取值进行数据提取,获得数据点与同一其它数据点的类间关系数据,通过目标位置的第一取值和装置位置的第二取值进行类间关系的最大值选取,可以确保类间重构矩阵在同一位置的目标值进行最大值提换,确保类间重构矩阵能够最大限度地表征不同类数据点之间的差异,提高类间协同信息的准确表达性。
[0143]
在一种可能的设计中,任一个数据点的类间表征向量,通过以下步骤确定:
[0144]
针对至少一个数据点中的第三数据点,将至少一个数据点的数量作为向量长度,为第三数据点建立空的第二表征向量;
[0145]
遍历至少一个数据点,判断数据点与第三数据点是否属于同不同类别,若是,则确定数据点在第二表征向量对应坐标处取值为1,若否,则确定数据点在第二表征向量对应坐标处取值为0;
[0146]
获得遍历结束时各坐标值已确定的第二表征向量为类间表征向量。
[0147]
为了同类表征向量的获取方式进行准确说明,如表1所示,假设存在6个数据点,以这6个数据点分别作为第一数据点,确定第一数据点与至少一个第一数据点分别对应的取值。假设1、2是同一标签类别,3、6是无标签类别,4、5为同一标签类别。表1:
[0148] 123456100111120011113110110411100151110006110110
[0149]
以上,数据点1的第二表征向量可以为【0,0,1,1,1,1】。数据点2的第二表征向量可以为【0,0,1,1,1,1】,数据点3的第二表征向量可以为【1,1,0,1,1,0】,数据点4的第二表征向量可以为【1,1,1,0,0,1】,数据点5的第二表征向量可以为【1,1,1,0,0,0】,数据点6 的第二表征向量可以为【1,1,0,1,1,0】。每个数据点可以对应有相应的第二表征向量。
[0150]
本公开实施例中,在确定数据点的类间表征向量时,可以以至少一个数据点中数量作为向量长度,建立第三数据点的第二表征向量,第二表征向量作为空向量,需要确定各个坐标点的取值。通过遍历至少一个数据点,可以判断数据点是否与第三数据点属于不同类别,将与第三数据点均属于不同类别的数据点对应的坐标设置为1,将与第三数据点属于同一类别的数据点的坐标设置为0。通过对不同标签类别的设置,可以对各个数据点与不同类别的数据点对应的关联关系进行准确提取。
[0151]
为了对协同嵌入方程进行准确构造,在一种可能的设计中,基于类内协同信息和类间协同信息,构造半监督协同嵌入方程,可以包括:
[0152]
以至少一个数据点、类内协同信息和类间协同信息作为已知量和以降维矩阵作为未知量,生成半监督协同嵌入方程。
[0153]
可选地,可以将数据点和数据点对应的类内协同信息中对应的向量,和类间协同信息对应的向量作为已知量,将降维矩阵作为未知量,生成半监督协同嵌入方程。
[0154]
半监督协同嵌入方程可以表示为:
[0155][0156]
可以对满足半监督协同嵌入方程在取得最小值的情况下求解,获得降维矩阵p。
[0157]
本公开实施例中,可以通过至少一个数据点、类内协同信息和类间协同信息作为已知量构建半监督协同嵌入方程,该半监督协同嵌入方程以降维矩阵作为未知量,可以实现对半监督协同嵌入方程的准确构建。
[0158]
本公开的技术方案可以应用于多种技术领域,特别是农业遥感图像、高光谱图像、图谱等领域。
[0159]
因此,在某些实施例中,图数据可以包括图谱,图谱的多个数据点包括多个节点,多个节点包括有标签节点和无标签节点。图谱的两个节点连接形成图的边。节点可以包括相应的节点数据,节点数据的数据深度较高。
[0160]
本公开实施例中,以图谱作为图数据,可以实现对各种图谱的数据压缩。
[0161]
在某些实施例中,图数据包括高光谱图像,高光谱图像的多个数据点包括多个像素点,多个像素点包括:有标签像素点和无标签像素点。
[0162]
本公开实施例中,以高光谱图像作为图数据,实现对高光谱图像的数据压缩。
[0163]
如图6所示,为本公开实施例提供的一种图数据压缩装置的一个实施例的结构示意图,该图数据压缩装置可以配置有前述实施例提供的图数据压缩方法,图数据压缩装置可以位于第二电子设备中,该图数据压缩装置600可以包括以下几个单元:
[0164]
数据确定单元601,用于确定待压缩的图数据中的至少一个数据点;数据点的数据深度大于深度阈值;
[0165]
标签划分单元602:用于确定至少一个数据点中的有标签数据点和无标签数据点。
[0166]
矩阵提取单元603:用于利用有标签数据点和无标签数据点之间的类别关联关系,提取至少一个数据点对应的降维矩阵。
[0167]
目标确定单元604:用于基于图数据和降维矩阵的矩阵计算,获得图数据的目标图数据。
[0168]
作为一个实施例,有标签数据点包括:至少一个标签类别分别对应的标签数据点;
[0169]
矩阵提取单元,包括:
[0170]
关联提取模块,用于以无标签数据点作为同一类别,结合至少一个标签类别分别对应的标签数据点,对同一类别的标签数据点之间的关联关系进行提取,获得类内协同信息。
[0171]
信息提取模块,用于根据至少一个标签类别分别对应的标签数据点,对不同类别的标签数据点之间的关联关系进行提取,获得类间协同信息。
[0172]
方程构造模块,用于基于类内协同信息和类间协同信息,构造半监督协同嵌入方程。
[0173]
指令响应模块,用于响应于针对半监督协同嵌入方程的求解指令,对半监督协同嵌入方程求解,获得降维矩阵。
[0174]
在某些实施例中,关联提取模块,包括:
[0175]
第一获得子模块,用于根据至少一个标签类别分别对应的标签数据点,对数据点在同一类别标签的相同特征关系进行提取,获得至少一个数据点分别对应的第一重构系数向量。
[0176]
第二获得子模块,用于将无标签数据点作为无标签类别,对数据点在无标签类别的相同特征关系进行提取,获得至少一个数据点分别对应的第二重构系数向量。
[0177]
向量加权子模块,用于将数据点对应的第一重构系数向量和第二重构系数向量加权,获得至少一个数据点分别对应的半监督权值向量。
[0178]
协同构造子模块,用于基于至少一个数据点分别对应的半监督权值向量,确定类内协同信息;类内协同信息用于构造至少一个数据点分别对应的有向重构图。
[0179]
在某些实施例中,第一获得子模块具体用于:
[0180]
根据至少一个标签类别分别对应的标签数据点,对同一标签类别的标签数据点之间的相同特性进行关系提取,获得至少一个数据点分别对应的同类表征向量;根据数据点的同类表征向量,计算获得数据点的第一重构系数向量,以确定至少一个数据点分别对应的第一重构系数向量。
[0181]
作为又一个实施例,第一获得子模块具体还用于:
[0182]
针对至少一个数据点中的第一数据点,将至少一个数据点的数量作为向量长度,为第一数据点建立空的第一表征向量;
[0183]
遍历至少一个数据点,判断数据点与第一数据点是否属于同一类别,若是,则确定数据点在第一表征向量对应坐标处取值为1,若否,则确定数据点在第一表征向量对应坐标处取值为0;
[0184]
获得遍历结束时各坐标值已确定的第一表征向量为同类表征向量。
[0185]
在某些实施例中,第二获得子模块具体用于:
[0186]
将无标签数据点作为同一类别,对数据点对应的无标签特征进行提取,获得至少一个数据点分别对应的无标签向量;
[0187]
根据数据点对应的无标签向量,计算获得数据点的第二重构系数向量,以获得至少一个数据点分别对应的第二重构系数向量。
[0188]
作为一个实施例,第二获得子模块具体还用于:
[0189]
针对至少一个数据点中的第二数据点,将至少一个数据点的数量作为向量长度,为第二数据点建立空的标签向量;
[0190]
遍历至少一个数据点,判断数据点与第二数据点是否均为无标签数据点,若是,则确定数据点在标签向量对应坐标取值为1,若否,则确定数据点在标签向量对应坐标值为0;
[0191]
获得遍历结束时,坐标值均已确定的标签向量为无标签向量。
[0192]
作为一个实施例,信息提取模块可以包括:
[0193]
第三获得子模块,用于根据至少一个标签类别分别对应的标签数据点,对数据点在不同类别标签的相同特性进行关系提取,获得至少一个数据点分别对应的第三重构系数向量;
[0194]
类间获得子模块,用于基于至少一个数据点分别对应的第三重构系数向量,对不同类别的样本间的协同关系进行提取,获得类间协同信息。
[0195]
在某些实施例中,第三获得子模块,具体可以用于:
[0196]
针对至少一个标签类别分别对应的标签数据点,基于非同一类别的标签数据点,确定至少一个数据点分别对应的类间表征向量;
[0197]
根据数据点的类间表征向量,计算获得数据点的第三重构系数向量,以获得至少一个数据点分别对应的第三重构系数向量。
[0198]
作为一种可选实施方式,第三获得子模块,具体还用于:
[0199]
针对至少一个数据点中的第三数据点,将至少一个数据点的数量作为向量长度,为第三数据点建立空的第二表征向量;
[0200]
遍历至少一个数据点,判断数据点与第三数据点是否属于同不同类别,若是,则确定数据点在第二表征向量对应坐标处取值为1,若否,则确定数据点在第二表征向量对应坐标处取值为0;
[0201]
获得遍历结束时各坐标值已确定的第二表征向量为类间表征向量。
[0202]
在某些实施例中,类间获得子模块,具体用于:
[0203]
根据至少一个数据点分别对应的第三重构系数向量,按照至少一个数据点的位置进行向量组合,获得类间重构矩阵;
[0204]
针对任一个数据点,根据数据点在对应的第三重构系数向量中的目标位置,确定目标位置在类间重构矩阵中的转置位置;
[0205]
从类间重构矩阵中确定目标位置对应的第一取值和转置位置的第二取值;
[0206]
从第一取值和第二取值中选择最大值作为目标位置的目标取值,以获得类间重构矩阵中每个位置对应的目标取值;
[0207]
确定类间重构矩阵在每个位置替换为对应的目标取值构成的类间协同信息。
[0208]
在某些实施例中,方程构造模块,包括:
[0209]
方程构造子模块,用于以至少一个数据点、类内协同信息和类间协同信息作为已知量和以降维矩阵作为未知量,生成半监督协同嵌入方程。
[0210]
作为一种可选实施方式,图数据包括图谱,图谱的多个数据点包括多个节点,多个节点包括有标签节点和无标签节点。
[0211]
作为又一种可选实施方式,图数据包括高光谱图像,高光谱图像的多个数据点包括多个像素点,多个像素点包括:有标签像素点和无标签像素点。
[0212]
本公开的图数据压缩装置可以用于执行图数据压缩方法,关于各个步骤的具体执行方式和技术效果可以参考与图数据压缩方法相关的实施例,在此不再赘述。
[0213]
上述电子设备可以是无线终端也可以是有线终端。无线终端可以是指向用户提供语音和/或其他业务数据连通性的设备,具有无线连接功能的手持式设备、或连接到无线调制解调器的其他处理设备。无线终端可以经无线接入网(radio access network,简称ran) 与一个或多个核心网设备进行通信,无线终端可以是移动终端,如移动电话(或称为“蜂窝”电话)和具有移动终端的计算机,例如,可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置,它们与无线接入网交换语言和/或数据。再例如,无线终端还可以是个人通信业务(personal communication service,简称pcs)电话、无绳电话、会话发起协议(session initiation protocol,简称sip)话机、无线本地环路(wireless local loop,简称wll)站、个人数字助理(personal digital assistant,简称pda)等设备。无线终端也可以称为系统、订户单元(subscriber unit)、订户站(subscriber station),移动站(mobilestation)、移动台(mobile)、远程站(remote station)、远程终端(remote terminal)、接入终端(access terminal)、用户终端(user terminal)、用户代理(user agent)、用户设备(user device or user equipment),在此不作限定。可选的,上述电子设备还可以是智能手表、平板电脑等设备。
[0214]
图7是根据一示例性实施例示出的一种电子设备的框图,该设备可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。电子设备700可以包括以下一个或多个组件:处理组件702,存储器704,电源组件706,多媒体组件708,音频组件710,输入/输出(i/o)接口712,传感器组件 714,以及通信组件716。
[0215]
处理组件702通常控制装置700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器720来执行指令,以完成上述的图数据压缩模型训练方法或者图数据压缩方法的全部或部分步骤。此外,处理组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。例如,处理组件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。
[0216]
存储器704被配置为存储各种类型的数据以支持在装置700的操作。这些数据的示例包括用于在装置700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
[0217]
电源组件706为装置700的各种组件提供电力。电源组件706可以包括电源管理系统,一个或多个电源,及其他与为装置700生成、管理和分配电力相关联的组件。
[0218]
多媒体组件708包括在装置700和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件708包括
一个前置摄像头和/或后置摄像头。当装置700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
[0219]
音频组件710被配置为输出和/或输入音频信号。例如,音频组件710包括一个麦克风(mic),当装置700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中,音频组件710还包括一个扬声器,用于输出音频信号。
[0220]
i/o接口712为处理组件702和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
[0221]
传感器组件714包括一个或多个传感器,用于为装置700提供各个方面的状态评估。例如,传感器组件714可以检测到装置700的打开/关闭状态,组件的相对定位,例如组件为装置700的显示器和小键盘,传感器组件714还可以检测装置700或装置700一个组件的位置改变,用户与装置700接触的存在或不存在,装置700方位或加速/减速和装置 700的温度变化。传感器组件714可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件714还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
[0222]
通信组件716被配置为便于装置700和其他设备之间有线或无线方式的通信。装置 700可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信组件716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件716还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。
[0223]
在示例性实施例中,装置700可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述图数据压缩模型训练方法或者图数据压缩方法。
[0224]
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器704,上述指令可由装置700的处理器720执行以完成上述方法。例如,非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
[0225]
一种非临时性计算机可读存储介质,当该存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述电子设备的图数据压缩模型训练方法或者图数据压缩方法。
[0226]
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本技术的其它实施方案。本技术旨在涵盖本技术的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本技术的一般性原理并包括本技术未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本技术的真正范围和精神由下面的
权利要求书指出。
[0227]
应当理解的是,本技术并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本技术的范围仅由所附的权利要求书来限制。

技术特征:


1.一种图数据压缩方法,其特征在于,包括:确定待压缩的图数据中的至少一个数据点;所述数据点的数据深度大于深度阈值;确定至少一个所述数据点中的有标签数据点和无标签数据点;利用所述有标签数据点和所述无标签数据点之间的类别关联关系,提取至少一个所述数据点对应的降维矩阵;基于所述图数据和所述降维矩阵的矩阵计算,获得所述图数据的目标图数据。2.根据权利要求1所述的方法,其特征在于,所述有标签数据点包括:至少一个标签类别分别对应的标签数据点;所述利用所述有标签数据点和所述无标签数据点之间的类别关联关系,提取至少一个所述数据点对应的降维矩阵,包括:以所述无标签数据点作为同一类别,结合至少一个所述标签类别分别对应的标签数据点,对同一类别的标签数据点之间的关联关系进行提取,获得类内协同信息;根据至少一个所述标签类别分别对应的标签数据点,对不同类别的标签数据点之间的关联关系进行提取,获得类间协同信息;基于所述类内协同信息和所述类间协同信息,构造半监督协同嵌入方程;响应于针对所述半监督协同嵌入方程的求解指令,对所述半监督协同嵌入方程求解,获得所述降维矩阵。3.根据权利要求2所述的方法,其特征在于,所述以所述无标签数据点作为同一类别,结合至少一个所述标签类别分别对应的标签数据点,对同一类别的标签数据点之间的关联关系进行提取,获得类内协同信息,包括:根据至少一个所述标签类别分别对应的标签数据点,对所述数据点在同一类别标签的相同特征关系进行提取,获得至少一个所述数据点分别对应的第一重构系数向量;将所述无标签数据点作为无标签类别,对所述数据点在所述无标签类别的相同特征关系进行提取,获得至少一个所述数据点分别对应的第二重构系数向量;将所述数据点对应的所述第一重构系数向量和所述第二重构系数向量加权,获得至少一个所述数据点分别对应的半监督权值向量;基于至少一个所述数据点分别对应的半监督权值向量,确定所述类内协同信息;所述类内协同信息用于构造至少一个所述数据点分别对应的有向重构图。4.根据权利要求3所述的方法,其特征在于,所述根据至少一个所述标签类别分别对应的标签数据点,对所述数据点在同一类别标签的相同特征关系进行提取,获得至少一个所述数据点分别对应的第一重构系数向量,包括:根据至少一个所述标签类别分别对应的标签数据点,对同一标签类别的标签数据点之间的相同特性进行关系提取,获得至少一个所述数据点分别对应的同类表征向量;根据所述数据点的同类表征向量,计算获得所述数据点的第一重构系数向量,以确定至少一个所述数据点分别对应的第一重构系数向量。5.根据权利要求4所述的方法,其特征在于,任一个所述数据点的同类表征向量通过以下方式确定:针对至少一个所述数据点中的第一数据点,将至少一个所述数据点的数量作为向量长度,为所述第一数据点建立空的第一表征向量;
遍历至少一个所述数据点,判断所述数据点与所述第一数据点是否属于同一类别,若是,则确定所述数据点在所述第一表征向量对应坐标处取值为1,若否,则确定所述数据点在所述第一表征向量对应坐标处取值为0;获得遍历结束时各坐标值已确定的所述第一表征向量为所述同类表征向量。6.根据权利要求3所述的方法,其特征在于,所述将所述无标签数据点作为无标签类别,对所述数据点在所述无标签类别的相同特征关系进行提取,获得至少一个所述数据点分别对应的第二重构系数向量,包括:将所述无标签数据点作为同一类别,对所述数据点对应的无标签特征进行提取,获得至少一个所述数据点分别对应的无标签向量;根据所述数据点对应的无标签向量,计算获得所述数据点的第二重构系数向量,以获得至少一个所述数据点分别对应的第二重构系数向量。7.根据权利要求6所述的方法,其特征在于,任一个所述数据点的无标签向量通过以下方式确定:针对至少一个所述数据点中的第二数据点,将至少一个所述数据点的数量作为向量长度,为所述第二数据点建立空的标签向量;遍历至少一个所述数据点,判断所述数据点与所述第二数据点是否均为无标签数据点,若是,则确定所述数据点在所述标签向量对应坐标取值为1,若否,则确定所述数据点在所述标签向量对应坐标值为0;获得遍历结束时,坐标值均已确定的所述标签向量为所述无标签向量。8.根据权利要求2所述的方法,其特征在于,所述根据至少一个所述标签类别分别对应的标签数据点,对不同类别的标签数据点之间的关联关系进行提取,获得类间协同信息,包括:根据至少一个所述标签类别分别对应的标签数据点,对所述数据点在不同类别标签的相同特性进行关系提取,获得至少一个所述数据点分别对应的第三重构系数向量;基于至少一个所述数据点分别对应的所述第三重构系数向量,对不同类别的样本间的协同关系进行提取,获得类间协同信息。9.根据权利要求8所述的方法,其特征在于,所述根据至少一个所述标签类别分别对应的标签数据点,对所述数据点在不同类别标签的相同特性进行关系提取,获得至少一个所述数据点分别对应的第三重构系数向量,包括:针对至少一个所述标签类别分别对应的标签数据点,基于非同一类别的标签数据点,确定至少一个所述数据点分别对应的类间表征向量;根据所述数据点的类间表征向量,计算获得所述数据点的第三重构系数向量,以获得至少一个所述数据点分别对应的第三重构系数向量。10.根据权利要求9所述的方法,其特征在于,任一个所述数据点的类间表征向量,通过以下步骤确定:针对至少一个所述数据点中的第三数据点,将至少一个所述数据点的数量作为向量长度,为所述第三数据点建立空的第二表征向量;遍历至少一个所述数据点,判断所述数据点与所述第三数据点是否属于同不同类别,若是,则确定所述数据点在所述第二表征向量对应坐标处取值为1,若否,则确定所述数据
点在所述第二表征向量对应坐标处取值为0;获得遍历结束时各坐标值已确定的所述第二表征向量为所述类间表征向量。11.根据权利要求8所述的方法,其特征在于,所述基于至少一个所述数据点分别对应的所述第三重构系数向量,对不同类别的样本间的协同关系进行提取,获得类间协同信息,包括:根据至少一个所述数据点分别对应的第三重构系数向量,按照至少一个所述数据点的位置进行向量组合,获得类间重构矩阵;针对任一个所述数据点,根据所述数据点在对应的第三重构系数向量中的目标位置,确定所述目标位置在所述类间重构矩阵中的转置位置;从所述类间重构矩阵中确定所述目标位置对应的第一取值和所述转置位置的第二取值;从所述第一取值和所述第二取值中选择最大值作为所述目标位置的目标取值,以获得所述类间重构矩阵中每个位置对应的目标取值;确定所述类间重构矩阵在每个位置替换为对应的目标取值构成的所述类间协同信息。12.根据权利要求2所述的方法,其特征在于,所述基于所述类内协同信息和所述类间协同信息,构造半监督协同嵌入方程,包括:以至少一个所述数据点、所述类内协同信息和所述类间协同信息作为已知量和以所述降维矩阵作为未知量,生成半监督协同嵌入方程。13.根据权利要求1-11任一项所述的方法,其特征在于,所述图数据包括图谱,所述图谱的多个数据点包括多个节点,所述多个节点包括有标签节点和无标签节点。14.根据权利要求1-11任一项所述的方法,其特征在于,所述图数据包括高光谱图像,所述高光谱图像的多个数据点包括多个像素点,多个所述像素点包括:有标签像素点和无标签像素点。15.一种图数据压缩方法装置,其特征在于,包括:数据确定单元,用于确定待压缩的图数据中的至少一个数据点;所述数据点的数据深度大于深度阈值;标签划分单元,用于确定至少一个所述数据点中的有标签数据点和无标签数据点;矩阵提取单元,用于利用所述有标签数据点和所述无标签数据点之间的数据点关联关系,提取至少一个所述数据点对应的降维矩阵;目标确定单元,用于基于图数据和所述降维矩阵的矩阵计算,获得所述图数据的目标图数据。16.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1-14所述的图数据压缩方法中的任一种。17.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-14所述的图数据压缩方法中的任一种。

技术总结


本申请提供一种图数据压缩方法、装置、设备及介质,可以应用于人工智能和云计算技术领域,可用于金融领域和其它领域。包括:确定待压缩的图数据中的至少一个数据点;所述数据点的数据深度大于深度阈值;确定至少一个所述数据点中的有标签数据点和无标签数据点;利用所述有标签数据点和所述无标签数据点之间的类别关联关系,提取至少一个所述数据点对应的降维矩阵;基于所述图数据和所述降维矩阵的矩阵计算,获得所述图数据的目标图数据。本申请的方法提高图数据压缩精度和效率。法提高图数据压缩精度和效率。法提高图数据压缩精度和效率。


技术研发人员:

李熠

受保护的技术使用者:

中国工商银行股份有限公司

技术研发日:

2022.06.27

技术公布日:

2022/11/22

本文发布于:2024-09-22 06:57:48,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/1969.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:据点   向量   标签   所述
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议