多分类器融合的自适应脑区脑电伪迹检测方法



1.本发明属于脑电信号处理以及智慧医疗领域,使用多分类器融合的方法结合所提出的预先对伪迹信号进行脑部分区选择,设计了一种能够实现实时识别检测所采集的eeg数据中的多类伪迹信号的系统。


背景技术:



2.脑电图作为检查和记录患者神经系统疾病的必要检查手段,然而在脑电图的记录中,生理性的伪迹是难以避免的,这些伪迹信号夹杂在正常脑电背景里面,给医务人员识别正常的脑电背景数据增加了难度以及对后续脑电信号的应用增加了很多障碍。故检测出伪迹的位置并且明确伪迹的类型是非常必要的。
3.而传统的伪迹检测方法存在以下局限性:
4.1.传统检测方法使用独立成分分析(ica)的办法对伪迹进行处理和分析,但是脑部电极易受外部因素的影响,数据混合后导致各个通道数据不纯净,使得脑电数据不满足ica的处理方法的要求。
5.2.传统方法在区别eeg数据中的伪迹时,没有对伪迹出现的位置进行判断,并且使用相同的方法去检测,容易受到异常信号的干扰。
6.3.传统伪迹检测方法仅能对少数通道的某类伪迹信号进行处理,不具有多样性,不能够同时对eeg数据中存在的多类伪迹进行实时检测。
7.本发明弥补了传统伪迹检测方法的不足,使用多通道的数据,降低了eeg数据中少数通道信息异常的影响;通过对伪迹出现的脑部电极的分析,提出了预先区分伪迹出现的脑部区域,在提取对应的特征,实现更加准确伪迹的识别;对应不同类型的伪迹训练专门的分类器,通过融合多个分类器,结合多分类器特点,提高了识别的效率和准确性,可以实现对多种伪迹的实时识别。本发明相对于传统伪迹检测算法复杂性更低,识别速率更高,识别的伪迹类型更多。


技术实现要素:



8.本发明综合考虑了eeg数据中不同类型伪迹出现在不同脑部区域的情况,更全面的考虑了多通道的数据,筛选了在长程脑电数据记录中最常出现的几类伪迹信号,克服了传统的伪迹检测只能处理少数伪迹类型的情况,提出了预先对伪迹进行脑部区域分析并结合多分类器融合实现多类伪迹识别的系统,实现了对不同脑部区域的多种伪迹的识别。
9.本发明的技术方案主要包括如下步骤:
10.步骤1、对多通道的脑电eeg信号进行滤波和多类伪迹类别划分;
11.步骤2、针对步骤1划分得到的每类伪迹信号对应的脑部区域分析和通道关联性分析,得到每类伪迹的区域信息和通道信息。
12.步骤3、对每类伪迹的通道信息进行特征提取,共提取28维特征;
13.步骤4、针对步骤2划分的区域信息和步骤3提取的特征,使用relieff算法和mrmr
算法进行两阶段的特征选择,建立特征分组。
14.步骤5、使用机器学习算法结合步骤4选取的特征进行分类模型的训练。
15.步骤6、针对步骤5所训练得到的多个分类器进行系统搭建。
16.所述步骤1具体内容如下:
17.将19通道、1000hz的原始脑电eeg数据进行滤波处理,对每通道进行50hz的陷波滤波以及1hz~70hz的带通滤波处理,得到无非生理干扰的脑电eeg数据;脑电数据中的伪迹出现的非连续性,故使用滑动窗口的方法切分伪迹数据,设定每个滑动窗口的时间长度为1s;将含有眨眼伪迹的信号记为eye_blink类,类别标签为1;将含有额区肌电的信号记为frontal_emg类,类别标签为2;将含有咀嚼伪迹的信号记为chew_emg类,类别标签为3;将含有眨眼伪迹的信号记为temp_emg类,类别标签为4;将非常规脑电背景的信号记为unknow_sig类,类别标签为5;将正常的脑电背景信号记为norm_sig类,类别标签为0;并以训练样本(80%)和测试样本(20%)对数据集进行划分。
18.所述步骤2具体内容如下:
19.2-1.对步骤1中得到的每类伪迹信号提取伪迹信号的平均频率谱密度(psd),通过绘制插值图,对每类伪迹的插值图进行分析,得到眨眼伪迹信号和额区肌电信号主要出现在额区的fp1、fp2通道;咀嚼伪迹信号和颞区肌电信号主要出现在颞区的f7、f8、t3、t4通道;意义不明确的脑电信号在整个头皮上呈现高波幅和低频的特性,分布位置比较广泛,涵盖包括fp1、fp2、f7、f8、t3、t4通道在内的多个通道,波及多个电极。根据这5类信号(眨眼伪迹信号、额区肌电信号、咀嚼伪迹信号、颞区肌电信号、意义不明确的脑电信号)所出现的电极位置将脑部划分为三个区域:额区(front_region)、颞区(temp_region)、全局(global_region)。
20.2-2.对不同类型的伪迹信号针对步骤2-1中的所得到的区域信息的电极通道进行相关性分析,得到不同类型伪迹出现的通道呈现的相关性。
21.额区中眨眼伪迹在fp1、fp2通道呈现出高度相关性,额区肌电在fp1、fp2通道的相关性次之;颞区中咀嚼伪迹和肌电伪迹中f7与f8、t3和t4呈现出高度相关性;意义不明确的脑电信号(非常规脑电背景信号)在所有通道中呈现出高度的脑区对称性,左脑电极和右脑电极均呈现高度的相关性。故在额区选择fp1、fp2通道;在颞区选择f7、t4通道;在全局区域选择fp1、f7、t3、t5、o1、f3、c3、p3、fz、cz、pz通道作为研究的重点。
22.所述步骤3具体内容如下:
23.3-1.计算样本所有通道的最大值max、最小值min、峰值peak、峰峰值p2p(peak to peak)、均值mean、绝对平均值am(absolute mean)、方根幅值ra(root amplitude)、方差var(variance)、标准差std(standard deviation)、均方根rms(root mean square)、峭度kurt(kurtosis)、偏度ske(skewness)、波形因子sf(shape factor)、峰值因子pf1(peak factor)、脉冲因子pf2(pulse factor)、裕度因子mf(margin factor)、余隙因子cf(clearance factor)、中位数median、分形维数fd(fractal dimension)、近似熵apen(approximate entropy)、样本熵saen(sample entropy)、模糊熵fuen(fuzzy entropy)、谱熵spen(spectral entropy)、平均频率af(average frequency)、重心频率bf(barycenter frequency)、均方根频率rmsf(root mean square frequency)、频率标准差stdf(standard deviation of frequency)、平均频率谱密度apsd(average power spectral density);以
上共计28维特征;
24.假设每个数据样本格式为s
m*n
(m:通道数,n数据长度);
25.3-2通过如下公式计算不同通道数据的最小值min:
26.mini=mini(si*n)
27.式中mini()表示求解的第i通道的最小值。
28.3-3通过如下公式计算不同通道数据的峰值peak:
29.peaki=maxi(|si*n|)
30.式中|s
i*n
|表示求第i通道的绝对值,maxi()表示求解的第i通道的最大值。
31.3-4通过如下公式计算不同通道数据的分形维数fd:
[0032][0033]
其中fdi(s,ε)表示分形维数值,ε表示计盒维数计算时的格子边长,g(ε)表示信号数据的累计格子数,s表示每个样本数据。
[0034]
3-5通过如下公式计算不同通道数据的近似熵apen:
[0035]
apeni=φm(s
t*n
)-φ
m+1
(s
t*n
)
[0036][0037]
式中表示对信号序列的概率大小度量,φm(s
t*n
)表示为对信号序列概率度量的对数平均值。
[0038]
3-6通过如下公式计算不同通道数据的谱熵spen:
[0039][0040]
式中g
x
()表示给定数据序列遵守的传输函数。
[0041]
3-7通过如下公式计算不同通道数据的平均频率af:
[0042][0043]
式中w表示所给连续数据信号的频率。
[0044]
3-8通过如下公式计算不同通道数据的平均功率谱密度apsd:
[0045]
apsdi=psdi(afi)
[0046][0047]
式中psdi表示第i个通道的功率谱密度,fft()表示对信号做快速傅里叶变换,fs表示采样频率,afi表示第i个通道的平均频率。
[0048]
所述步骤4具体内容如下:
[0049]
4-1.对每一类伪迹提取的28维特征使用relieff算法做一阶段的特征选择,为下一步操作降低特征的冗余度,减少特征的重复使用,提高分辨效率。relieff算法的特征权重选择如下式所示:
[0050][0051]
式中p(c)表示该类特征所占总体的比例,p(class(r))为随机选取的某样本类的比例,a表示当前选中的特征,r、h分别表示特征a中的两个不同样本,diff(a,r,h)表示两个不同样本r、h在特征a上的差,mj(c)表示c类中的第j个最近邻样本,m表示抽样次数,k表示最近邻样本的个数;
[0052]
4-2.根据4-1中reliff算法对不同区域内的伪迹信息的特征排序,使用mrmr的方法做二次特征选择,构造出不同区域内的不同伪迹信息之间的最显著特征组合。mrmr算法如下式所示:
[0053]
最大相关性:
[0054][0055]
式中xi表示第i类特征,c表示目标分类,l表示选择的m个特征构成的特征子集,i(xi;c)表示第i个特征与目标分类c的互信息。
[0056]
最小冗余度:
[0057][0058]
mrmr权重结合算法:
[0059][0060]
其中,x表示在所给定的数据的包含的特征的集合,l
m-1
表示在给定的特征子集中选取的(m-1)个特征子集。
[0061]
本发明中采用了一种两阶段的特征选择方式实施方法如下(1)利用relieff算法筛选出不同分类器的候选特征集合,(2)mrmr算法被用于直接去除relieff算法得到特征候选集的冗余,为训练的分类器筛选出最佳特征分组。
[0062]
4-3.从步骤4-1与4-2中分析得到的不同特征组,对区分伪迹出现的脑区判断建立n1*m*chs维的特征组dfs;对于额区不同类型伪迹建立n1*m*chs维的特征组efs;对于颞区不同类型伪迹建立n1*m*chs维的特征组tfs;对于脑部全局建立n1*m*chs维的特征组gfs。其中n1表示样本数,m表示选取通道数量,chs表示选取的通道数。
[0063]
所述步骤5具体内容如下:
[0064]
5-1针对步骤4对不同伪迹以及脑部分区所提取的特征组以及携带的样本标签,结合机器学习算法对初始划分的训练集进行模型训练得到多个分类器模型;
[0065]
5-2使用训练好后的分类器模型对初始划分的测试集数据进行测试,并计算测试的准确度,修改分类器模型的参数,得到性能最优的分类器模型。使用特征组dfs训练得到
自适应判别脑部区域的分类器,并记为classifier0;使用特征组efs训练得到额区判别伪迹的分类器模型,并分别记为classifier1和classifier1’;使用特征组tfs训练得到颞区判别伪迹的分类器模型,并分别记为classifier2和classifier2’;使用特征组gfs训练得到判别全局区域的分类器模型,并记为classifier3。
[0066]
所述步骤6具体内容如下:
[0067]
6-1针对步骤5中对不同区域训练出的分类器搭建最终的多分类器融合的自适应脑区伪迹检测系统,由于原始eeg数据是连续的,故每次输入1s的数据片段,使用分类器classifier0自适应的判断输入数据的脑部分区,在得到区域信息后,分别使用各区域对应的分类器对信号提取特征进行伪迹检测。
[0068]
6-2使用未处理过的原始eeg数据测试系统,能够准确的识别出连续数据的不同类型的伪迹。
[0069]
本发明有益效果如下:
[0070]
运用多分类器融合的自适应脑区脑电伪迹检测方法来处理原始脑电数据,通过预先划分伪迹信号出现的区域,提升伪迹检测的准确性,同时也可以实现对脑电数据中多类伪迹信号的识别,克服了传统识别方法识别类型单一、流程复杂、识别效率低、受通道干扰的缺点。训练的多个分类器模型,没有局限于单一机器学习方法,采用多种类的分类器模型可以结合不同方法的优点,实现更好的识别效果。本发明可以实现对原始eeg数据中的多类伪迹进行检测。
附图说明
[0071]
图1为本发明的信号处理及自适应脑区选择示意图;
[0072]
图2为本发明分类器融合系统框架示意图;
[0073]
图3为本发明实际应用性能评估。
具体实施方式:
[0074]
下面结合附图和具体实施方式对本发明的做详细说明。
[0075]
如图1和图2所示分别为通道数据切分脑部区域划分和多分类器融合的系统框架图,特征提取以及选择和多分类器模型的构建在发明内容中已经详细介绍,即本发明的技术方案主要包括如下步骤:
[0076]
步骤1、对多通道的脑电eeg信号进行滤波和多类伪迹类别划分;
[0077]
步骤2、针对步骤1划分得到的每类伪迹信号对应的脑部区域分析和通道关联性分析,得到每类伪迹的区域信息和通道信息。
[0078]
步骤3、对每类伪迹的通道信息进行特征提取,共提取28维特征;
[0079]
步骤4、针对步骤2划分的区域信息和步骤3提取的特征,使用relieff算法和mrmr算法进行两阶段的特征选择,建立特征分组。
[0080]
步骤5、使用机器学习算法结合步骤4选取的特征进行分类模型的训练。
[0081]
步骤6、针对步骤5所训练得到的多个分类器进行系统搭建。
[0082]
所述步骤1具体内容如下:
[0083]
将19通道、1000hz的原始脑电eeg数据进行滤波处理,对所有通道进行50hz的陷波
滤波以及1hz~70hz的带通滤波处理,得到无非生理干扰的脑电eeg数据;脑电数据中的伪迹出现的非连续性,故使用滑动窗口的方法切分伪迹数据,设定每个滑动窗口的时间长度为1s;将含有眨眼伪迹的信号记为eye_blink类,类别标签为1;将含有额区肌电的信号记为frontal_emg类,类别标签为2;将含有咀嚼伪迹的信号记为chew_emg类,类别标签为3;将含有眨眼伪迹的信号记为temp_emg类,类别标签为4;将非常规脑电背景的信号记为unknow_sig类,类别标签为5;将正常的脑电背景信号记为norm_sig类,类别标签为0;并将所有的样本均划分为训练样本(80%)和测试样本(20%)。
[0084]
所述步骤2具体内容如下:
[0085]
2-1.对步骤1中得到的每类伪迹信号提取伪迹信号的平均频率谱密度(psd),通过绘制插值图,对每类伪迹的插值图进行分析,得到眨眼伪迹信号和额区肌电信号主要出现在额区的fp1、fp2通道;咀嚼伪迹信号和颞区肌电信号主要出现在颞区的f7、f8、t3、t4通道;意义不明确的脑电信号在整个头皮上呈现高波幅和低频的特性,分布位置比较广泛,涵盖包括fp1、fp2、f7、f8、t3、t4通道在内的多个通道,波及多个电极。根据这5类信号(眨眼伪迹信号、额区肌电信号、咀嚼伪迹信号、颞区肌电信号、意义不明确的脑电信号)所出现的电极位置将脑部划分为三个区域:额区(front_region)、颞区(temp_region)、全局(global_region)。
[0086]
2-2.对不同类型的伪迹信号针对步骤2-1中的所得到的区域信息的电极通道进行相关性分析,得到不同类型伪迹出现的通道呈现的相关性。
[0087]
额区中眨眼伪迹在fp1、fp2通道呈现出高度相关性,额区肌电在fp1、fp2通道的相关性次之;颞区中咀嚼伪迹和肌电伪迹中f7与f8、t3和t4呈现出高度相关性;意义不明确的脑电信号(非常规脑电背景信号)在所有通道中呈现出高度的脑区对称性,左脑电极和右脑电极均呈现高度的相关性。故在额区选择fp1、fp2通道;在颞区选择f7、t4通道;在全局区域选择fp1、f7、t3、t5、o1、f3、c3、p3、fz、cz、pz通道作为研究的重点。
[0088]
所述步骤3具体内容如下:
[0089]
3-1计算样本所有通道的最大值max、最小值min、峰值peak、峰峰值p2p(peak to peak)、均值mean、绝对平均值am(absolute mean)、方根幅值ra(root amplitude)、方差var(variance)、标准差std(standard deviation)、均方根rms(root mean square)、峭度kurt(kurtosis)、偏度ske(skewness)、波形因子sf(shape factor)、峰值因子pf1(peak factor)、脉冲因子pf2(pulse factor)、裕度因子mf(margin factor)、余隙因子cf(clearance factor)、中位数median、分形维数fd(fractal dimension)、近似熵apen(approximate entropy)、样本熵saen(sample entropy)、模糊熵fuen(fuzzy entropy)、谱熵spen(spectral entropy)、平均频率af(average frequency)、重心频率bf(barycenter frequency)、均方根频率rmsf(root mean square frequency)、频率标准差stdf(standard deviation of frequency)、平均频率谱密度apsd(average power spectral density);以上共计28维特征;
[0090]
假设每个数据样本格式为s
m*n
(m:通道数,n数据长度);
[0091]
3-2通过如下公式计算不同通道数据的最大值max:
[0092]
maxi=maxi(s
i*n
)
[0093]
式中maxi()表示求解的第i通道的最大值。
[0094]
3-3通过如下公式计算不同通道数据的最小值min:
[0095]
mini=mini(s
i*n
)
[0096]
式中mini()表示求解的第i通道的最小值。
[0097]
3-4通过如下公式计算不同通道数据的峰值peak:
[0098]
peaki=maxi(|s
i*n
|)
[0099]
式中|s
i*n
|表示求第i通道的绝对值。
[0100]
3-5通过如下公式计算不同通道数据的峰峰值p2p:
[0101]
p2pi=maxi(s
i*n
)-mini(s
i*n
)
[0102]
3-6通过如下公式计算不同通道数据的均值mean:
[0103][0104]
3-7通过如下公式计算不同通道数据的绝对平均值am:
[0105][0106]
3-8通过如下公式计算不同通道数据的方根幅值ra:
[0107][0108]
3-9通过如下公式计算不同通道数据的方差var:
[0109][0110]
式中表示第i个通道所有数据的期望值。
[0111]
3-10通过如下公式计算不同通道数据的标准差std:
[0112][0113]
式中vari表示3-9中计算的第i个通道的方差。
[0114]
3-11通过如下公式计算不同通道数据的均方根rsm:
[0115][0116]
3-11通过如下公式计算不同通道数据的峭度kurt:
[0117][0118]
式中μi表示第i个通道所有数据的均值,σi表示第i个通道所有数据的标准差。3-12通过如下公式计算不同通道数据的偏度ske:
[0119][0120]
3-13通过如下公式计算不同通道数据的波形因子sf:
[0121][0122]
式中的rmsi表示3-11中计算的第i个通道的均方根。
[0123]
3-14通过如下公式计算不同通道数据的峰度因子pf1:
[0124][0125]
式中的peaki表示3-4中计算的第i通道的峰值。
[0126]
3-15通过如下公式计算不同通道数据的脉冲因子pf2:
[0127][0128]
式中的ami表示3-7中计算的第i个通道的绝对平均值。
[0129]
3-16通过如下公式计算不同通道数据的裕度因子mf:
[0130][0131]
式中的rai表示3-8中计算的第i个通道的方根幅值。
[0132]
3-17通过如下公式计算不同通道数据的余隙因子cf:
[0133][0134]
3-18通过如下公式计算不同通道数据的中位数median:
[0135][0136]
式中的sort(s
i*n
)表示对第i个通道的所有数据进行排序。
[0137]
3-19通过如下公式计算不同通道数据的分形维数fd:
[0138][0139]
其中fdi(s,ε)表示分形维数值,ε表示计盒维数计算时的格子边长,g(ε)表示信号数据的累计格子数。
[0140]
3-20通过如下公式计算不同通道数据的近似熵apen:
[0141]
apeni=φm(s
t*n
)-φ
m+1
(s
t*n
)
[0142][0143]
式中表示对信号序列的概率大小度量,φm(s
t*n
)表示为对型号序列概率度量的对数平均值。
[0144]
3-21通过如下公式计算不同通道数据的样本熵saen:
[0145][0146]
式中m表示重构信号的维数,δ表示时间延迟,r表示预定义的阈值参数,n()表示匹
配m维向量对的数目。
[0147]
3-22通过如下公式计算不同通道数据的模糊熵fuen:
[0148][0149][0150]
式中on(m,r)表示重构的n-1维矢量,表示定义的模糊函数关系的相似度,m、r分别表示指数函数边界的梯度和宽度。
[0151]
3-23通过如下公式计算不同通道数据的谱熵spen:
[0152][0153]
式中g
x
()表示给定数据序列遵守的传输函数。
[0154]
3-24通过如下公式计算不同通道数据的平均频率af:
[0155][0156]
式中w表示所给连续数据信号的频率。
[0157]
3-25通过如下公式计算不同通道数据的重心频率bf:
[0158][0159]
3-26通过如下公式计算不同通道数据的均方根频率rmsf:
[0160][0161]
3-27通过如下公式计算不同通道数据的频率标准差stdf:
[0162][0163]
式中bfi表示第i个通道的重心频率。
[0164]
3-28通过如下公式计算不同通道数据的平均功率谱密度apsd:
[0165]
apsdi=psdi(afi)
[0166][0167]
式中psdi表示第i个通道的功率谱密度,fft(*)表示对信号做快速傅里叶变换,fs表示采样频率,afi表示第i个通道的平均频率。
[0168]
所述步骤4具体内容如下:
[0169]
4-1对根据权利要求4中对每一类伪迹提取的28维特征使用relieff算法做特征选择,为下一步操作降低特征的冗余度,减少特征的重复使用,提高模型的分辨效率。relieff算法的特征权重选择如下式所示:
[0170][0171]
式中p(c)表示该类特征所占总体的比例,p(class(r))为随机选取的某样本类的比例,a表示当前选中的特征,r、h分别表示特征a中的两个不同样本,diff(a,r,h)表示两个样本在特征a上的差,mj(c)表示c类中的第j个最近邻样本,m表示抽样次数,k表示最近邻样本的个数;
[0172]
4-2根据权利要求3中针对不同伪迹所划分的区域所包含的伪迹特征使用mrmr的方法做二次特征选择,构造出区域之间的最显著特征,以及筛选出区域内部不同类型伪迹的最显著特征mrmr算法如下式所示:
[0173]
最大相关性:
[0174][0175]
式中xi表示第i类特征,c表示目标分类,l表示选择的m个特征构成的特征子集,i(xi;c)表示第i个特征与目标分类c的互信息。
[0176]
最小冗余度:
[0177][0178]
mrmr权重结合算法:
[0179][0180]
其中,x表示在所给定的数据的包含的特征的集合,l
m-1
表示在给定的特征子集中选取的(m-1)个特征子集。
[0181]
本发明中采用了一种两阶段的特征选择方式实施方法如下(1)利用relieff算法筛选出不同分类器的候选特征集合,(2)mrmr算法被用于直接去除relieff算法得到特征候选集的冗余,为训练的分类器筛选出最佳特征分组。
[0182]
4-3.从步骤4-1与4-2中分析得到的不同特征组,对区分伪迹出现的脑区判断建立n1*m*chs维的特征组dfs;对于额区不同类型伪迹建立n1*m*chs维的特征组efs;对于颞区不同类型伪迹建立n1*m*chs维的特征组tfs;对于脑部全局建立n1*m*chs维的特征组gfs。其中n1表示样本数,m表示选取通道数量,chs表示选取的通道数。
[0183]
所述步骤5,具体内容如下:
[0184]
5-1针对步骤4对不同伪迹以及脑部分区所提取的特征组合以及样本标签,结合机器学习算法对初始划分的训练集进行模型训练得到多个分类器模型;
[0185]
5-2使用训练好后的分类器模型对初始划分的测试集数据进行测试,并计算测试的准确度,修改分类器模型的参数,得到性能最优的分类器模型。使用特征组dfs训练得到
自适应判别脑部区域的分类器,并记为classifier0;使用特征组efs训练得到额区判别伪迹的分类器模型,并分别记为classifier1和classifier1’;使用特征组tfs训练得到颞区判别伪迹的分类器模型,并分别记为classifier2和classifier2’;使用特征组gfs训练得到判别全局区域的分类器模型,并记为classifier3。
[0186]
所述步骤6,具体内容如下:
[0187]
6-1针对步骤5中对不同区域训练出的分类器搭建最终的多分类器融合的自适应脑区伪迹检测系统,由于原始eeg数据是连续的,故每次输入1s的数据片段,使用分类器classifier0自适应的判断输入数据的脑部分区,在得到区域信息后,分别使用各区域对应的分类器对信号提取特征进行伪迹检测。
[0188]
6-2使用未处理过的原始eeg数据测试系统,能够准确的识别出连续数据的不同类型的伪迹。
[0189]
为了实现更好的脑电数据多伪迹识别效果,以下将从实际的应用时的参数设置和设计方面展开介绍,以作为该发明用于其他应用时的参考;
[0190]
使用本方法对多通道脑电数据进行处理时,需要对采集的脑电数据进行50hz的陷波滤波以及1hz~70hz的带通滤波,由于伪迹出现的频次都是间断的,不同类型的单个伪迹出现的综合时长不超过1s,所以在输入数据时每段数据的长度都是1s,为了防止数据的漏检,对数据读取采用了50%的重叠率,降低漏检率。针对步骤3对脑电数据提取的共28维特征,其中包含了时域、频域以及非线性特征,通过对这些特征的分析得到不同类型的伪迹对于特征的显著性排列,并选取合适的特征组作为训练分类器模型的主要依据。
[0191]
在特征选择时,同时使用relieff算法和mrmr算法进行两阶段的特征选择和处理,建立对不同类型伪迹有高敏感度的特征组,对比不同的分类器模型,选择准确率最高,稳定性最好的模型作为最终系统的分类器模型。实验中所使用到的分类器的参数均在训练过程中进行动态调整,其中k邻近分类模型(knn)的聚类个数k不超过20,且不取偶数,随机森林分类模型(rf)的决策树动态调整,使准确率达到最佳,朴素贝叶斯分类模型(nb)使用内部默认调整参数,支持向量机分类模型(svm)建立标准模板参数,在训练模型时会根据输入的数据进行动态的调整内部参数达到最佳效果。
[0192]
在步骤5中训练出的模型中,classifier0为支持向量机模型(svm)测试集准确率为95.83%,classifier1为支持向量机模型(svm)测试集准确率为99.83%,classifier1’为随机森林模型(rf)测试集准确率为96.93%,classifier2为随机森林模型(rf)测试集准确率为93.12%,classifier2’为朴素贝叶斯模型(nb)测试集准确率为99.49%,classifier3为朴素贝叶斯模型(nb)测试集准确率为98.15%。每个分类器都有较高的分辨性能,能够实现比较准确的多伪迹识别效果。
[0193]
如图3所示,将所得到的分类器按照图2的方式进行多分类器的融合后的到的最终的系统模型,在该模型上测试了一段两分钟真实患者的脑电数据,其中实际标签是由专业的脑电技术人员所标记,预测个数是使用本发明的模型所得到的不同伪迹个数,通过核对人工标记和模型预测的标签数据,得到最终的识别准确率,可以看出,对于不同类型的伪迹都有较高的识别率,处理效率可以达到实时分析的要求。
[0194]
本发明的提出分类器融合系统所使用的分类器的融合方式还有助于减少分类的复杂度,提高分类的准确率,以实现实时的检测脑电数据中的伪迹信号,可以帮助医生在临
床医疗中快速确定所记录的脑电数据的伪迹类型以及减少伪迹对诊断的干扰。

技术特征:


1.多分类器融合的自适应脑区脑电伪迹检测方法,其特征在于包括如下步骤:步骤1、对多通道的脑电eeg信号进行滤波和多类伪迹类别划分;步骤2、针对步骤1划分得到的每类伪迹信号对应的脑部区域分析和通道关联性分析,得到每类伪迹的区域信息和通道信息;步骤3、对每类伪迹的通道信息进行特征提取,共提取28维特征;步骤4、针对步骤2划分的区域信息和步骤3提取的特征,使用relieff算法和mrmr算法进行两阶段的特征选择,建立特征分组;步骤5、使用机器学习算法结合步骤4选取的特征进行分类模型的训练;步骤6、针对步骤5所训练得到的多个分类器进行系统搭建。2.根据权利要求1所述的多分类器融合的自适应脑区脑电伪迹检测方法,其特征在于所述步骤1具体内容如下:将19通道、1000hz的原始脑电eeg数据进行滤波处理,对每通道进行50hz的陷波滤波以及1hz~70hz的带通滤波处理,得到无非生理干扰的脑电eeg数据;脑电数据中的伪迹出现的非连续性,故使用滑动窗口的方法切分伪迹数据,设定每个滑动窗口的时间长度为1s;将含有眨眼伪迹的信号记为eye_blink类,类别标签为1;将含有额区肌电的信号记为frontal_emg类,类别标签为2;将含有咀嚼伪迹的信号记为chew_emg类,类别标签为3;将含有眨眼伪迹的信号记为temp_emg类,类别标签为4;将非常规脑电背景的信号记为unknow_sig类,类别标签为5;将正常的脑电背景信号记为norm_sig类,类别标签为0;并以训练样本和测试样本对数据集进行划分。3.根据权利要求1或2所述的多分类器融合的自适应脑区脑电伪迹检测方法,其特征在于所述步骤2具体内容如下:2-1.对步骤1中得到的每类伪迹信号提取伪迹信号的平均频率谱密度,通过绘制插值图,对每类伪迹的插值图进行分析,得到眨眼伪迹信号和额区肌电信号主要出现在额区的fp1、fp2通道;咀嚼伪迹信号和颞区肌电信号主要出现在颞区的f7、f8、t3、t4通道;意义不明确的脑电信号在整个头皮上呈现高波幅和低频的特性,分布位置比较广泛,涵盖包括fp1、fp2、f7、f8、t3、t4通道在内的多个通道,波及多个电极;根据眨眼伪迹信号、额区肌电信号、咀嚼伪迹信号、颞区肌电信号、意义不明确的脑电信号这5类信号所出现的电极位置将脑部划分为三个区域:额区、颞区、全局;2-2.对不同类型的伪迹信号针对步骤2-1中的所得到的区域信息的电极通道进行相关性分析,得到不同类型伪迹出现的通道呈现的相关性;额区中眨眼伪迹在fp1、fp2通道呈现出高度相关性,额区肌电在fp1、fp2通道的相关性次之;颞区中咀嚼伪迹和肌电伪迹中f7与f8、t3和t4呈现出高度相关性;意义不明确的脑电信号在所有通道中呈现出高度的脑区对称性,左脑电极和右脑电极均呈现高度的相关性;故在额区选择fp1、fp2通道;在颞区选择f7、t4通道;在全局区域选择fp1、f7、t3、t5、01、f3、c3、p3、fz、cz、pz通道作为研究的重点。4.根据权利要求3所述的多分类器融合的自适应脑区脑电伪迹检测方法,其特征在于所述步骤3具体内容如下:3-1.计算样本所有通道的最大值max、最小值min、峰值peak、峰峰值p2p、均值mean、绝对平均值am、方根幅值ra、方差var、标准差std、均方根rms、峭度kurt、偏度ske、波形因子
sf、峰值因子pf1、脉冲因子pf2(pulse factor)、裕度因子mf、余隙因子cf、中位数median、分形维数fd、近似熵apen、样本熵saen、模糊熵fuen、谱熵spen、平均频率af、重心频率bf、均方根频率rmsf、频率标准差stdf、平均频率谱密度apsd;以上共计28维特征;假设每个数据样本格式为s
m*n
,m:通道数,n数据长度;3-2通过如下公式计算不同通道数据的最小值min:min
i
=min
i
(s
i*n
)式中min
i
()表示求解的第i通道的最小值;3-3通过如下公式计算不同通道数据的峰值peak:peak
i
=max
i
(|s
i*n
|)式中|s
i*n
|表示求第i通道的绝对值,max
i
()表示求解的第i通道的最大值;3-4通过如下公式计算不同通道数据的分形维数fd:其中fd
i
(s,ε)表示分形维数值,ε表示计盒维数计算时的格子边长,g(ε)表示信号数据的累计格子数,s表示每个样本数据;3-5通过如下公式计算不同通道数据的近似熵apen:apen
i
=φ
m
(s
t*n
)-φ
m+1
(s
t*n
)式中表示对信号序列的概率大小度量,φ
m
(s
t*n
)表示为对信号序列概率度量的对数平均值;3-6通过如下公式计算不同通道数据的谱熵spen:式中g
x
()表示给定数据序列遵守的传输函数;3-7通过如下公式计算不同通道数据的平均频率af:式中w表示所给连续数据信号的频率;3-8通过如下公式计算不同通道数据的平均功率谱密度apsd:apsd
i
=psd
i
(af
i
)式中psd
i
表示第i个通道的功率谱密度,fft()表示对信号做快速傅里叶变换,fs表示采样频率,af
i
表示第i个通道的平均频率。5.根据权利要求4所述的多分类器融合的自适应脑区脑电伪迹检测方法,其特征在于所述步骤4具体内容如下:4-1.对每一类伪迹提取的28维特征使用relieff算法做一阶段的特征选择,relieff算
法的特征权重选择如下式所示:式中p(c)表示该类特征所占总体的比例,p(class(r))为随机选取的某样本类的比例,a表示当前选中的特征,r、h分别表示特征a中的两个不同样本,diff(a,r,h)表示两个不同样本r、h在特征a上的差,m
j
(c)表示c类中的第j个最近邻样本,m表示抽样次数,k表示最近邻样本的个数;4-2.根据4-1中reliff算法对不同区域内的伪迹信息的特征排序,使用mrmr的方法做二次特征选择,构造出不同区域内的不同伪迹信息之间的最显著特征组合;mrmr算法如下式所示:最大相关性:式中x
i
表示第i类特征,c表示目标分类,l表示选择的m个特征构成的特征子集,i(x
i
;c)表示第i个特征与目标分类c的互信息;最小冗余度:mrmr权重结合算法:其中,x表示在所给定的数据的包含的特征的集合,l
m-1
表示在给定的特征子集中选取的(m-1)个特征子集;4-3.从步骤4-1与4-2中分析得到的不同特征组,对区分伪迹出现的脑区判断建立n1*m*chs维的特征组dfs;对于额区不同类型伪迹建立n1*m*chs维的特征组efs;对于颞区不同类型伪迹建立n1*m*chs维的特征组tfs;对于脑部全局建立n1*m*chs维的特征组gfs;其中n1表示样本数,m表示选取通道数量,chs表示选取的通道数。6.根据权利要求5所述的多分类器融合的自适应脑区脑电伪迹检测方法,其特征在于所述步骤5具体内容如下:5-1针对步骤4对不同伪迹以及脑部分区所提取的特征组以及携带的样本标签,结合机器学习算法对初始划分的训练集进行模型训练得到多个分类器模型;5-2使用训练好后的分类器模型对初始划分的测试集数据进行测试,并计算测试的准确度,修改分类器模型的参数,得到性能最优的分类器模型;使用特征组dfs训练得到自适应判别脑部区域的分类器,并记为classifier0;使用特征组efs训练得到额区判别伪迹的分类器模型,并分别记为classifier1和classifier1’;使用特征组tfs训练得到颞区判别
伪迹的分类器模型,并分别记为classifier2和classifier2’;使用特征组gfs训练得到判别全局区域的分类器模型,并记为classifier3。7.根据权利要求6所述的多分类器融合的自适应脑区脑电伪迹检测方法,其特征在于所述步骤6具体内容如下:6-1针对步骤5中对不同区域训练出的分类器搭建最终的多分类器融合的自适应脑区伪迹检测系统,由于原始eeg数据是连续的,故每次输入1s的数据片段,使用分类器classifier0自适应的判断输入数据的脑部分区,在得到区域信息后,分别使用各区域对应的分类器对信号提取特征进行伪迹检测;6-2使用未处理过的原始eeg数据测试系统,能够准确的识别出连续数据的不同类型的伪迹。

技术总结


本发明公开了一种多分类器融合的自适应脑区脑电伪迹检测方法。本发明步骤:1、对多通道的脑电EEG信号进行滤波和多类伪迹类别划分;2、针对得到的每类伪迹信号对应的脑部区域分析和通道关联性分析,得到每类伪迹的区域信息和通道信息;3、对每类伪迹的通道信息进行特征提取;4、针对区域信息和提取的特征,使用ReliefF算法和mRMR算法进行两阶段的特征选择,建立特征分组;5、使用机器学习算法结合选取的特征进行分类模型的训练;6、针对步骤5所训练得到的多个分类器进行系统搭建。本发明克服了临床上人工定位伪迹的繁琐,提高了异常信号的快速定位,解决了现有伪迹识别技术的单调性,同时可以实现对多通道脑电EEG数据进行实时的伪迹检测。时的伪迹检测。时的伪迹检测。


技术研发人员:

曹九稳 方智波 郑润泽 赖晓平 蒋铁甲 高峰

受保护的技术使用者:

杭州电子科技大学

技术研发日:

2022.09.23

技术公布日:

2022/12/19

本文发布于:2024-09-24 08:29:55,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/45583.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:通道   特征   数据   信号
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议