一种基于个体重力特征的个人身份识别方法与流程



1.本发明属于身份识别技术领域,尤其涉及一种基于个体重力特征的个人身份识别方法。


背景技术:



2.生物特征识别现在是研究人员的主要主题之一,一些研究成果已经应用到日常生活和工作中,如虹膜识别、指纹识别和人脸识别。与它们相比,步态识别的优势在于其操作不会中断或干扰受试者的活动,这使得步态识别非常适合于难以与受试者直接接触或合作的情况。
3.传统的步态识别技术分为两类:基于外观的技术和基于模型的技术。
4.基于外观的技术直接对步态序列进行操作,而无需为行走的人假设任何特定的模型。如:一种融合可见光、红外、结构光的步态识别方法,从可见光传感器、红外传感器、结构光传感器获取三种原始图像数据,然后改进图像处理与多传感器融合方法,获得融合图,基于融合图进行步态识别(专利号:cn202210732669.4)。
5.通过提取人体轮廓,人体图像中的大部分外观特征被去除。尽管如此,轮廓仍然包含有关人体形状的信息,这些信息很容易因衣服和携带等情况而发生变化,即包括步态表示中的静态外观特征使现有方法容易受到协变量条件变化的影响。
6.基于模型的方法通常是视图和比例不变的。与整体方法相比,这是一个显著的优势,因为测试步态序列和参考序列不太可能从相同的角度捕获。如:一种基于人体轮廓和关键点特征融合的步态识别方法,包括:输入单人行走的步态视频,获取视频中的行人轮廓序列,将步态视频代入openpose算法模块,获得归一化的人体关键点信息序列,将行人轮廓序列代入gaitset算法模块,获得步态轮廓序列的特征;将人体关键点信息序列由lstm和cnn组成的人体关键点特征提取模块;分别获得步态轮廓特征向量和人体关键点特征向量;将步态轮廓特征向量和人体关键点特征向量连接后输入特征融合模块;将步态融合特征导入融合网络进行特征学习,识别出视频中人物的身份(专利号:cn202210452885.3)。
7.然而,由于基于模型的方法依赖于步态序列中特定步态参数的识别,这些方法通常需要高质量的步态序列才有用。此外,其他障碍,如行走对象的自遮挡,甚至可能导致无法计算模型参数。因此,多摄像机步态采集系统更适合此类技术。
8.最接近本发明方法的是一种基于wifi信号的速度无关步态识别方法,包括以下步骤:提取人员行走过程中随时间变化的wifi的csi幅值;对csi幅值进行预处理;判断是否有人在环境中行走,并提取步行活动片段;将步行活动片段转换成大小相同的时频图;搭建基于dann的速度无关步态识别模型,该模型包括特征提取器、身份识别器与速度识别器,特征提取器用于在输入的时频图中提取潜在的特征,身份识别器用于利用特征提取器提取的特征预测被测目标的身份,速度识别器用于利用特征提取器提取的特征预测被测目标的速度;训练速度无关步态识别模型并输出被测目标的身份(专利号:cn202210659791.3)。
9.以上方法同样不需要通过截取或录制步态影像,以提取相应特征数值。对于个人
隐私,有一定的保护作用。但由于以上方法需要在有wifi信号的场景方可使用,对于一些无法覆盖wifi信号,或wifi信号较差的环境,此方法难以实施。


技术实现要素:



10.为解决上述问题,本发明提出了一种基于个体重力特征的个人身份识别方法,通过构建个体重力特征数据库,计算受试者的联合分布与个体重力特征数据库中筛选出的每个候选人的分布的相似度,完成受试者的身份识别。
11.为实现上述目的,本发明提供了一种基于个体重力特征的个人身份识别方法,其特征在于,包括以下步骤:
12.分别获取已知身份的候选者个体重力特征数据和未知受试者个体重力特征数据,并分别去除所述候选者个体重力特征数据和所述未知受试者个体重力特征数据的背景噪声;
13.对去除背景噪声的所述候选者个体重力特征数据和去除背景噪声的所述未知受试者个体重力特征数据进行统一化处理;
14.分别提取统一化处理后的所述候选者个体重力特征数据和统一化处理后的所述未知受试者个体重力特征数据中的有效数据;
15.采用高斯核密度估计方法分别拟合所述候选者个体重力特征数据的有效数据中相关特征的分布和所述未知受试者个体重力特征数据的有效数据中相关特征的分布;
16.以copula函数连接函数,连接所述候选者的个体重力特征数据中有效数据的每一属性变量的分布,获得所述候选者个体重力特征数据联合分布;
17.以copula函数连接函数,连接受试者的个体重力特征数据中有效数据的每一属性变量的分布,获得受试者个体重力特征数据联合分布;
18.将所述候选者个体重力特征数据联合分布保存为候选者个人信息数据集,并将所述候选者个人信息数据集录入个体重力特征数据库;
19.根据置换检验,一一检验未知受试者与候选者的特征分布,获得通过置换检验的候选者名单;
20.计算通过置换检验的候选者个体重力特征数据联合分布与待辨认受试者个体重力特征数据联合分布的kl散度值,获得最小值;
21.将所述最小值与识别阈值比较,完成个人身份识别。
22.优选的,所述候选者个体重力特征数据和所述未知受试者个体重力特征数据通过采样点的传感器获得,分别包括:时间戳数据、压力值以及x、y、z三个方向上的加速度数据。
23.优选的,分别去除所述候选者个体重力特征数据和所述未知受试者个体重力特征数据的背景噪声的方法包括:
24.分别获取每一个采样点的压力值以及x、y、z三个方向上的加速度数据的测量序列,分别计算压力值以及x、y、z三个方向上的加速度数据的中位数以及标准差;
25.根据3sigma准则,将(中位数-3*标准差,中位数+3*标准差)范围以内的数值记为高斯噪声数据,将其去除。
26.优选的,对去除背景噪声的所述候选者个体重力特征数据和去除背景噪声的所述未知受试者个体重力特征数据进行统一化处理的方法包括:
27.选定一个采样点作为标定物,获取标定物与其余采样点上每个特征点数据的中位数与上下四分位点;根据仿射变换,通过标定物与其余采样点上的4个特征数值,处理其余采样点上的数据,获得每个采样点上统一化后的样本数据。
28.优选的,分别提取统一化处理后的所述候选者个体重力特征数据和统一化处理后的所述未知受试者个体重力特征数据中的有效数据的方法包括:
29.通过个体重力特征分析方法,分别获得统一化处理后的所述候选者个体重力特征数据的有效数据和统一化处理后的所述未知受试者个体重力特征数据中的有效数据,其中所述有效数据均包含五个特征,分别为有效压力值、x方向的加速度值、y方向的加速度值、z方向的加速的值以及步伐时间间隔有效值。
30.优选的,获得步伐时间间隔有效值的方法包括:
31.记录预设段采样点极大压力值下对应的采样时间,作为该采样点对应的时间序列;
32.基于所述时间序列,采用谱密度估计,拟合谱密度函数,并提取特征频率,所得特征频率倒数为单个脚步所对应的特征时间间隔,即步伐时间间隔有效值。
33.优选的,采用高斯核密度估计方法分别拟合所述候选者个体重力特征数据的有效数据中相关特征的分布和所述未知受试者个体重力特征数据的有效数据中相关特征的分布的方法包括:
34.用非参数估计中的高斯核密度估计方法分别拟合有效压力值、x方向的加速度值、y方向的加速度值、z方向的加速的值的分布;
35.其中所述高斯核密度估计方法为:假设一组数据x1...xn,其独立于未知的连续分布p(x),x0处的核密度估计定义:
[0036][0037]
其中,xi是x0附近的λ邻域内的观测值,λ是参数带宽,限制邻域大小,n表示x0处在带宽λ领域内包含的样本点个数,k
λ
(.)是高斯核函数,表达式为:
[0038]
优选的,将所述最小值与识别阈值比较,完成个人身份识别的方法包括:
[0039]
若所述最小值大于识别阈值α0,则认为受试者未曾被录入所述个体重力特征数据库,即是不明身份的人;
[0040]
若所述最小值小于识别阈值α0,则该联合分布对应的候选人即是识别结果。
[0041]
与现有技术相比,本发明具有如下优点和技术效果:
[0042]
1、由于本发明只涉及压力数据以及三个方向上的加速度值,不会进行录像、拍摄等行为,不会留下相关影像资料,可以有效地保护个人隐私。
[0043]
2、本发明的整个实施过程不会给参与者带来负担,即受试者不需要佩戴相应的测试仪器,避免额外的佩戴指导等步骤。
[0044]
3、本发明利用特制传感器,在受试者行走间实时收集数据,可以在行走过程中完成个人身份识别。在数据采集过程中,不会打断或干扰受试者当时的活动。
[0045]
4、由于个体重力特征压力识别很难隐藏、窃取或伪造,可以有效提高识别结果的真实性。
[0046]
5、本发明可以在受试者不直接接触任何设备或接触他人的情况下进行,可以避免不必要的接触,也不需要摘下口罩等行为,可以保护受试者的安全。
[0047]
6、本发明主要设计拟合密度分布函数,涉及参数较少,运算成本较低。
[0048]
7、本发明中涉及技术多是统计模型,可解释性强。
附图说明
[0049]
构成本技术的一部分的附图用来提供对本技术的进一步理解,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
[0050]
图1为一种基于个体重力特征的个人身份识别方法流程示意图。
具体实施方式
[0051]
需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
[0052]
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0053]
如图1所示,本发明提供了一种基于个体重力特征的个人身份识别方法,主要包括以下步骤:
[0054]
第一阶段:构建个体重力特征数据库
[0055]
(1)去除背景噪声
[0056]
导取已知身份的候选者个体重力特征数据后,根据3sigma准则,去除背景噪声。
[0057]
具体的,本发明中的已知身份的候选者个体重力特征数据通过采样点的传感器获得,包含时间戳数据、压力值以及x、y、z三个方向上的加速度数据,共计5个特征。针对压力值以及x、y、z三个方向上的加速度数据这4个特征,通过每一个采样点的每一个特征值的测量序列,可以分别计算其中位数以及标准差,根据3sigma准则,将(中位数-3*标准差,中位数+3*标准差)范围以内的数值记为高斯噪声数据,将其去除。
[0058]
其中,由于平均值极易受到极端值的影响,故本技术中采取中位数来表示每一个采样点数据的集中趋势。
[0059]
其中,3sigma准则又称为拉依达准则。假设一组检测数据只含有随机误差,对其进行计算处理得到标准偏差,按一定概率确定一个区间,认为凡超过这个区间的误差,就不属于随机误差而是粗大误差,含有该误差的数据应予以剔除。
[0060]
高斯分布的3sigma原则为:
[0061]
数值分布在(μ-σ,μ+σ)中的概率为0.6826;
[0062]
数值分布在(μ-2σ,μ+2σ)中的概率为0.9545;
[0063]
数值分布在(μ-3σ,μ+3σ)中的概率为0.9973。
[0064]
其中,μ是高斯分布数据的均值,σ是高斯分布数据的标准差。
[0065]
(2)传感器数据统一化
[0066]
因每个采样点的传感器为人工安置,为确保每个采样点上数据的一致性,需要对其进行统一化处理。选定其中一个采样点作为标定物,获取标定物与其余采样点上每个特
征点数据的中位数与上下四分位点。根据仿射变换,通过标定物与其余采样点上的4个特征数值,处理其余采样点上的数据,获得每个采样点上统一化后的样本数据。
[0067]
其中,仿射变换(affine transformation)是一种二维坐标到二维坐标之间的线性变换,保持二维图形的“平直性”(即变换后直线还是直线不会打弯,圆弧还是圆弧)和“平行性”(即确保二维图形间的相对位置关系不变,平行线还是平行线,相交直线的交角不变)。
[0068]
(3)提取有效数据
[0069]
统一化后的数据,若相邻的有效压力值对应的采样时刻之间的间隔小于时间阈值,则认为这是一步中的连续有效值,将其保留。当相邻的有效压力值时间间隔超过时间阈值,则这一步结束,并对这一步中的压力值进行采样。记录这一段采样点处的极大值与其相应的时间,作为该步下的测量值,作为一组有效数据保留。此时间阈值由行走时与地板接触时间确定,为0.1s量级。
[0070]
针对由以上方式提取的传感器数据对应的时间序列,采用谱密度估计(spectral density estimation),拟合谱密度函数,并提取特征频率,所得特征频率倒数为单个脚步所对应的特征时间间隔。
[0071]
通过个体重力特征分析方法,得到有效的特征值,其中包含五个特征,分别为有效压力值、x方向的加速度值、y方向的加速度值、z方向的加速的值以及步伐时间间隔有效值。
[0072]
具体的,收集所有采样点下传感器的有效数据,记录每一步的个体重力特征,其中包括每只脚踩下所得修正后的压力值和三个方向的加速度值,以及对应的时间信息。
[0073]
每一个体所采集到的个体重力特征数据库中,包含五个特征信息,分别为有效压力值、x方向的加速度值、y方向的加速度值、z方向的加速的值和每一步时间间隔有效值。
[0074]
(4)高斯核密度估计
[0075]
分别用非参数估计中的高斯核密度估计方法分别拟合除时间间隔以外的四个特征的分布(所涉及的参数带宽可通过k折交叉验证的方法自动选取最优值)。之后采用copula函数得到联合分布,将其存入候选人个人信息数据库中。
[0076]
其中,核密度估计方法
[0077]
假设一组数据x1,...,xn,其独立于未知的连续分布p(x)。x0处的核密度估计可定义如下:
[0078][0079]
其中,xi是x0附近的λ邻域内的观测值。λ是参数带宽,限制邻域大小。n表示x0处在带宽λ领域内包含的样本点个数。k
λ
(.)是选择的核函数,本发明中使用的是高斯核函数,它的函数表达式如下所示:
[0080][0081]
其中,交叉验证(cross validation),有的时候也称作循环估计(rotation estimation),是一种统计学上将数据样本切割成较小子集的实用方法。
[0082]
本发明中,使用k折交叉验证来选取最优带宽参数λ。k折交叉验证会把样本数据随机的分成k份(一般是均分),每次随机的选择k-1份作为训练集,剩下的1份做测试集。当这一轮完成后,重新随机选择k-1份来训练数据。最后来选择最优的模型以及对应参数。
[0083]
(5)联合分布
[0084]
采用copula函数得到的四个特征分布(分别为有效压力值、x方向的加速度值、y方向的加速度值、z方向的加速度的值)的联合分布,将联合分布保存为候选者个人信息数据集中。并将候选者个人信息数据集录入个体重力特征数据库。
[0085]
具体的,copula函数能够把随机变量之间的相关关系与变量的边际分布分开进行研究,这种思想方法在多元统计分析中非常重要。
[0086]
以二元为例,若h(x,y)是一个具有连续边缘分布的f(x)与g(y)的二元联合分布函数,那么存在唯一的copula函数c,使得h(x,y)=c(f(x),g(y))。反之,如果c是一个copula函数,而f(x)与g(y)是两个任意的概率分布函数,那么由上式定义的h(x,y)函数一定是一个联合分布函数,且对应的边缘分布刚好就是f(x)与g(y)。
[0087]
如果已知h,f与g,则copula函数可以表达为:
[0088]
c(u,v)=h(f-1
(u),g-1
(v))
[0089]
这里f-1
代表f的反函数,或者叫cdf的逆变换、逆累积分布函数。
[0090]
另外,根据3中所得单个脚步特征时间间隔,可估计实际脚步时间间隔。因随机和实验误差等原因会造成脚步的遗漏,数据中所采集的步伐时间间隔并非全部对应于相邻的脚步,呈现多峰分布。利用时间阈值,遍历所有单个脚步时间间隔,若在时间阈值的σ邻域中,则记录为一个时间样本,否则根据时间阈值对其进行归算,使其落到σ邻域中,将归算后的时间间隔数据存入数据库中。
[0091]
(6)建立个体重力特征数据库
[0092]
重复步骤(1)-(5),完成所有候选者的个人信息数据收集,并全部录入个体重力特征数据库。
[0093]
第二阶段:个人识别
[0094]
(1)去除背景噪声
[0095]
导取未知受试者个体重力特征数据后,根据3sigma准则,去除背景噪声。
[0096]
具体的,本发明中的未知受试者个体重力特征数据通过采样点的传感器获得,包含时间戳数据、压力值以及x、y、z三个方向上的加速度数据,共计5个特征。针对压力值以及x、y、z三个方向上的加速度数据这4个特征,通过每一个采样点的每一个特征值的测量序列,可以分别计算其中位数以及标准差,根据3sigma准则,将(中位数-3*标准差,中位数+3*标准差)范围以内的数值记为高斯噪声数据,将其去除。
[0097]
其中,由于平均值极易受到极端值的影响,故本技术中采取中位数来表示每一个采样点数据的集中趋势。
[0098]
其中,3sigma准则又称为拉依达准则。假设一组检测数据只含有随机误差,对其进行计算处理得到标准偏差,按一定概率确定一个区间,认为凡超过这个区间的误差,就不属于随机误差而是粗大误差,含有该误差的数据应予以剔除。
[0099]
高斯分布的3sigma原则为:
[0100]
数值分布在(μ-σ,μ+σ)中的概率为0.6826;
[0101]
数值分布在(μ-2σ,μ+2σ)中的概率为0.9545;
[0102]
数值分布在(μ-3σ,μ+3σ)中的概率为0.9973。
[0103]
其中,μ是高斯分布数据的均值,σ是高斯分布数据的标准差。
[0104]
(2)传感器数据统一化
[0105]
因每个采样点的传感器为人工安置,为确保每个采样点上数据的一致性,需要对其进行统一化处理。选定其中一个采样点作为标定物,获取标定物与其余采样点上每个特征点数据的中位数与上下四分位点。根据仿射变换,通过标定物与其余采样点上的4个特征数值,处理其余采样点上的数据,获得每个采样点上统一化后的样本数据。
[0106]
其中,仿射变换(affine transformation)是一种二维坐标到二维坐标之间的线性变换,保持二维图形的“平直性”(即变换后直线还是直线不会打弯,圆弧还是圆弧)和“平行性”(即确保二维图形间的相对位置关系不变,平行线还是平行线,相交直线的交角不变)。
[0107]
(3)提取有效数据
[0108]
统一化后的数据,若相邻的有效压力值对应的采样时刻之间的间隔小于时间阈值,则认为这是一步中的连续有效值,将其保留。当相邻的有效压力值时间间隔超过时间阈值,则这一步结束,并对这一步中的压力值进行采样。记录这一段采样点处的极大值与其相应的时间,作为该步下的测量值,作为一组有效数据保留。此时间阈值由行走时与地板接触时间确定,为0.1s量级。
[0109]
针对由以上方式提取的传感器数据对应的时间序列,采用谱密度估计(spectral density estimation),拟合谱密度函数,并提取特征频率,所得特征频率倒数为单个脚步所对应的特征时间间隔。
[0110]
通过个体重力特征分析方法,得到有效的特征值,其中包含五个特征,分别为有效压力值、x方向的加速度值、y方向的加速度值、z方向的加速的值以及步伐时间间隔有效值。
[0111]
具体的,收集所有采样点下传感器的有效数据,记录每一步的个体重力特征,其中包括每只脚踩下所得修正后的压力值和三个方向的加速度值,以及对应的时间信息。
[0112]
每一个体所采集到的个体重力特征数据库中,包含五个特征信息,分别为有效压力值、x方向的加速度值、y方向的加速度值、z方向的加速的值和每一步时间间隔有效值。
[0113]
(4)高斯核密度估计
[0114]
分别用非参数估计中的高斯核密度估计方法分别拟合除时间间隔以外的四个特征的分布(所涉及的参数带宽可通过k折交叉验证的方法自动选取最优值)。之后采用copula函数得到待辨认受试者的联合分布。
[0115]
其中,核密度估计方法
[0116]
假设一组数据x1,...,xn,其独立于未知的连续分布p(x)。x0处的核密度估计可定义如下:
[0117][0118]
其中,xi是x0附近的λ邻域内的观测值。λ是参数带宽,限制邻域大小。n表示x0处在带宽λ领域内包含的样本点个数。k
λ
(.)是选择的核函数,本发明中使用的是高斯核函数,它
的函数表达式如下所示:
[0119][0120]
其中,交叉验证(cross validation),有的时候也称作循环估计(rotation estimation),是一种统计学上将数据样本切割成较小子集的实用方法。
[0121]
本发明中,使用k折交叉验证来选取最优带宽参数λ。k折交叉验证会把样本数据随机的分成k份(一般是均分),每次随机的选择k-1份作为训练集,剩下的1份做测试集。当这一轮完成后,重新随机选择k-1份来训练数据。最后来选择最优的模型以及对应参数。
[0122]
(6)联合分布
[0123]
采用copula函数得到这四个特征分布的联合分布。
[0124]
具体的,copula函数能够把随机变量之间的相关关系与变量的边际分布分开进行研究,这种思想方法在多元统计分析中非常重要。
[0125]
以二元为例,若h(x,y)是一个具有连续边缘分布的f(x)与g(y)的二元联合分布函数,那么存在唯一的copula函数c,使得h(x,y)=c(f(x),g(y))。反之,如果c是一个copula函数,而f(x)与g(y)是两个任意的概率分布函数,那么由上式定义的h(x,y)函数一定是一个联合分布函数,且对应的边缘分布刚好就是f(x)与g(y)。
[0126]
如果已知h,f与g,则copula函数可以表达为:
[0127]
c(u,v)=h(f-1
(u),g-1
(v))
[0128]
这里f-1
代表f的反函数,或者叫cdf的逆变换、逆累积分布函数。
[0129]
另外,根据3中所得单个脚步特征时间间隔,可估计实际脚步时间间隔。因随机和实验误差等原因会造成脚步的遗漏,数据中所采集的步伐时间间隔并非全部对应于相邻的脚步,呈现多峰分布。利用时间阈值,遍历所有单个脚步时间间隔,若在时间阈值的σ邻域中,则记录为一个时间样本,否则根据时间阈值对其进行归算,使其落到σ邻域中,将归算后的时间间隔数据存入数据库中。
[0130]
(7)初步筛选
[0131]
首先利用归算后时间间隔数据,通过置换检验方法,一一检验受试者与候选者的特征分布,剔除无法通过置换检验的人员,缩小候选人名单。
[0132]
具体的,缩小候选人范围:首先利用归算后时间间隔数据,根据置换检验,计算检验统计量,一一比较判断受试者的特征分布与个体重力特征数据库中候选人的特征分布是否一致。若未通过检验,则表明该候选者的特征分布与受试者的明显不一致,将其剔除候选者名单。
[0133]
其中,h0假设:两样本来自同一总体。
[0134]
置换检验是fisher于20世纪30年代提出的一种基于大量计算(computationally intensive),利用样本数据的全(或随机)排列,进行统计推断的方法,因其对总体分布自由,应用较为广泛,特别适用于总体分布未知的小样本资料,以及某些难以用常规方法分析资料的假设检验问题。在具体使用上它和bootstrap methods类似,通过对样本进行顺序上的置换,重新计算统计检验量(可以是均值、中位数等统计量),构造经验分布,然后在此基础上求出p-value进行推断。
[0135]
置换检验基本思想:在h0假设成立的前提下,根据研究目的构造一个检验统计量,并利用样本数据,根据排列组合的原理,导出检验统计量的理论分布,在实际中往往因为排列组合数太多,而模拟其近似分布,然后求出在该分布中出现观察样本及更极端样本的概率p,通过和显著性水平α比较,做出统计推断。
[0136]
统计决策:如果p>α,表明h0假设成立,不拒绝h0假设;如果p<α,表明h0假设成立时,观察样本的出现是小概率事件,基于小概率在一次样本中基本不发生的原理,可以认为h0假设不成立,也就是不接受h0假设。
[0137]
(8)相似度识别
[0138]
计算受试者的联合分布与个体重力特征数据库中筛选出的每个候选人的分布的kl散度值,取其中的最小值。
[0139]
若最小值大于识别阈值α0,则认为受试者未曾被录入个体重力特征数据库,即是不明身份的人。
[0140]
若小于阈值α0,则该联合分布对应的候选人即是识别结果。
[0141]
其中,kl散度(kullback-leibler divergence),又可称相对熵(relative entropy)。一般用于度量两个概率分布函数之间的差异。
[0142]
假设有两个分布p和q,则这两个分布的kl散度定义如下:
[0143][0144]
注意:kl散度具有非对称性,即kl(p||q)≠kl(q||p)。
[0145]
在本发明中,kl散度用于度量两个联合分布的相似程度。kl散度值越小,相似度越高。
[0146]
以上,仅为本技术较佳的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应该以权利要求的保护范围为准。

技术特征:


1.一种基于个体重力特征的个人身份识别方法,其特征在于,包括以下步骤:分别获取已知身份的候选者个体重力特征数据和未知受试者个体重力特征数据,并分别去除所述候选者个体重力特征数据和所述未知受试者个体重力特征数据的背景噪声;对去除背景噪声的所述候选者个体重力特征数据和去除背景噪声的所述未知受试者个体重力特征数据进行统一化处理;分别提取统一化处理后的所述候选者个体重力特征数据和统一化处理后的所述未知受试者个体重力特征数据中的有效数据;采用高斯核密度估计方法分别拟合所述候选者个体重力特征数据的有效数据中相关特征的分布和所述未知受试者个体重力特征数据的有效数据中相关特征的分布;以copula函数连接函数,连接所述候选者的个体重力特征数据中有效数据的每一属性变量的分布,获得所述候选者个体重力特征数据联合分布;以copula函数连接函数,连接受试者的个体重力特征数据中有效数据的每一属性变量的分布,获得受试者个体重力特征数据联合分布;将所述候选者个体重力特征数据联合分布保存为候选者个人信息数据集,并将所述候选者个人信息数据集录入个体重力特征数据库;根据置换检验,一一检验未知受试者与候选者的特征分布,获得通过置换检验的候选者名单;计算通过置换检验的候选者个体重力特征数据联合分布与待辨认受试者个体重力特征数据联合分布的kl散度值,获得最小值;将所述最小值与识别阈值比较,完成个人身份识别。2.根据权利要求1所述的基于个体重力特征的个人身份识别方法,其特征在于,所述候选者个体重力特征数据和所述未知受试者个体重力特征数据通过采样点的传感器获得,分别包括:时间戳数据、压力值以及x、y、z三个方向上的加速度数据。3.根据权利要求2所述的基于个体重力特征的个人身份识别方法,其特征在于,分别去除所述候选者个体重力特征数据和所述未知受试者个体重力特征数据的背景噪声的方法包括:分别获取每一个采样点的压力值以及x、y、z三个方向上的加速度数据的测量序列,分别计算压力值以及x、y、z三个方向上的加速度数据的中位数以及标准差;根据3sigma准则,将(中位数-3*标准差,中位数+3*标准差)范围以内的数值记为高斯噪声数据,将其去除。4.根据权利要求3所述的基于个体重力特征的个人身份识别方法,其特征在于,对去除背景噪声的所述候选者个体重力特征数据和去除背景噪声的所述未知受试者个体重力特征数据进行统一化处理的方法包括:选定一个采样点作为标定物,获取标定物与其余采样点上每个特征点数据的中位数与上下四分位点;根据仿射变换,通过标定物与其余采样点上的4个特征数值,处理其余采样点上的数据,获得每个采样点上统一化后的样本数据。5.根据权利要求1所述的基于个体重力特征的个人身份识别方法,其特征在于,分别提取统一化处理后的所述候选者个体重力特征数据和统一化处理后的所述未知受试者个体重力特征数据中的有效数据的方法包括:
通过个体重力特征分析方法,分别获得统一化处理后的所述候选者个体重力特征数据的有效数据和统一化处理后的所述未知受试者个体重力特征数据中的有效数据,其中所述有效数据均包含五个特征,分别为有效压力值、x方向的加速度值、y方向的加速度值、z方向的加速的值以及步伐时间间隔有效值。6.根据权利要求5所述的基于个体重力特征的个人身份识别方法,其特征在于,获得步伐时间间隔有效值的方法包括:记录预设段采样点极大压力值下对应的采样时间,作为该采样点对应的时间序列;基于所述时间序列,采用谱密度估计,拟合谱密度函数,并提取特征频率,所得特征频率倒数为单个脚步所对应的特征时间间隔,即步伐时间间隔有效值。7.根据权利要求5所述的基于个体重力特征的个人身份识别方法,其特征在于,采用高斯核密度估计方法分别拟合所述候选者个体重力特征数据的有效数据中相关特征的分布和所述未知受试者个体重力特征数据的有效数据中相关特征的分布的方法包括:用非参数估计中的高斯核密度估计方法分别拟合有效压力值、x方向的加速度值、y方向的加速度值、z方向的加速的值的分布;其中所述高斯核密度估计方法为:假设一组数据x1...x
n
,其独立于未知的连续分布p(x),x0处的核密度估计定义:其中,x
i
是x0附近的λ邻域内的观测值,λ是参数带宽,限制邻域大小,n表示x0处在带宽λ领域内包含的样本点个数,k
λ
(.)是高斯核函数,表达式为:8.根据权利要求1所述的基于个体重力特征的个人身份识别方法,其特征在于,将所述最小值与识别阈值比较,完成个人身份识别的方法包括:若所述最小值大于识别阈值α0,则认为受试者未曾被录入所述个体重力特征数据库,即是不明身份的人;若所述最小值小于识别阈值α0,则该联合分布对应的候选人即是识别结果。

技术总结


本发明提供了一种基于个体重力特征的个人身份识别方法,包括以下步骤:分别获取已知身份的候选者和未知受试者个体重力特征数据,分别进行去除数据背景噪声处理、传感器数据统一化,提取有效数据、拟合相关特征分布后,采用Copula函数分别获得候选者和未知受试者个体重力特征数据的联合分布,将候选者个体重力特征数据联合分布保存为候选者个人信息数据集,并录入个体重力特征数据库;根据置换检验,检验未知受试者与候选者的特征分布,获得通过置换检验的候选者;计算通过置换检验的候选者中候选者个体重力特征数据联合分布与待辨认受试者个体重力特征数据联合分布的KL散度值,获得最小值;将最小值与识别阈值比较,完成个人身份识别。身份识别。身份识别。


技术研发人员:

王长贵 董平 张艺馨 钱家怡

受保护的技术使用者:

佛山市秦钻智能建材科技有限公司

技术研发日:

2022.08.26

技术公布日:

2022/11/22

本文发布于:2024-09-21 13:48:36,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/7519.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:特征   数据   重力   候选者
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议