基于脑电信号特征提取的睡眠分期方法研究

0引言
睡眠是一项非常重要的生命过程,但至今人们对其了解甚少。关于睡眠的研究最早在20世纪30年代,德国精神病学家Berger[1]发现人在睡眠和清醒期(wakefulness,W)的脑电(electroencephalogram,EEG)活动呈现不同的节律。1953年,Aserinsky等[2]发
现了快速眼动(rapid eye movement,REM)睡眠与非快速眼动(non-rapid eye movement,NREM)睡眠。1968年,Rechtschaffen和Kales[3]提出R&K睡眠分期标准,将NREM期细分为S1、S2、S3、S44个阶段。S1、S2阶段为浅度睡眠期(light sleep,LS),S3、S4阶段为慢波睡眠期(slow-wave sleep,SWS)。2007年美国睡眠医学学会(American Academy of Sleep Medicine,AASM)将
基于脑电信号特征提取的睡眠分期方法研究
刘戈1,刘洪运2,石金龙2,王国静2,胡敏露2,王卫东2*
(1.解放军总医院海南医院,海南三亚572013;2.解放军总医院医学创新研究部,北京100853)
基金项目:国家自然科学基金资助项目(61701540);国家
重点研发计划项目子课题(2016YFC1305703);军队重大
科研项目子课题(AWS14R010)
作者简介:刘戈(1992—),女,硕士,助理工程师,主要
从事基于人工智能的生理信号分析方面的研究工作,
E-mail:****************。
通信作者:王卫东,E-mail:*****************
R&K 金标准中的S1、S2期相应更改为N1(NREM 1)、N2(NREM 2)期,S3、S4期合并为N3(NREM 3)期。
睡眠分期标准如图1所示。
近年来,基于单通道EEG 、多通道EEG 、心电(electrocardiogram ,ECG )、眼电(electro-oculogram ,EOG )、肌电(electromyogram ,EMG )和呼吸等生理信号提取特征并使用分类器进行睡眠分期研究的国内外学者越来越多。表1列举了一些代表性研究,可以
发现,对单一信号而言,基于EEG 的睡眠分期效果
最好,ECG 次之,EOG 和EMG 更差一些。因此,本文以分期准确率为重点,研究一种基于单通道EEG 特征提取的睡眠分期方法。
传统的睡眠EEG 特征提取方法主要有时域、频域、非线性分析方法。时域分析是出现最早且最直观
的分析方法,频域分析仅能发掘信号的频域特征。这
2种分析方法对于EEG 这种非平稳、非线性信号而言存在一定的局限性。非线性分析方法,如样本熵、模糊熵、功率谱熵等适用于EEG 信号,但忽略了非高斯过程的某些有用信息,如相位信息。而高阶谱分析就可以发现睡眠EEG 的相位耦合信息。本文将在传统特征的基础上提取EEG 双谱特征、递归性特征和符号动力学特征,有针对性地补充传统特征未能表现的睡眠EEG 有用信息或改进传统特征的不足,组成一组信息表达较为全面的特征向量并使用分类器进行睡眠自动分期。1方法
本研究的技术路线如图2所示,首先获取睡眠
EEG 数据并进行预处理,然后使用各种特征提取方法获得EEG 样本的特征参量,使用支持向量机(sup -port vector machine ,SVM )作睡眠时相分类,最后经
隐马尔可夫模型(hidden Markov model ,HMM )学习睡眠阶段之间的过渡规则并对已分类得到的睡眠标签作修正,最终得到整夜睡眠分布及分期准确率。下面将对各部分进行具体介绍。
1.1数据获取和预处理
本文使用的睡眠EEG 数据来自于麻省理工学院(Massachusetts Institute of Technology ,MIT )创建的睡眠生理信号开源数据库(网址为physionet.
org/physiobank/database/sleep-edfx/)
[10]
。随机选取10名受试者整夜睡眠实测数据,共10组EEG 数据。其
中6组为健康志愿者的睡眠数据,另外4组为有轻微失眠志愿者的睡眠数据。均使用Fpz-Cz 单导联EEG 信号,受试者包括3名男性和7名女性,年龄21~65岁。测试过程中未使用任何药物进行干扰。采
样频率均为100Hz 。睡眠分期结果由专家进行了人工标注(以R&K 睡眠分期标准标记),以专家标注结
果作为标签来测试本文提出方法的分期准确性。定义30s 的EEG 为一个样本,本文所选取的10名受试者睡眠样本分布见表2。
图1睡眠分期标准
表1睡眠分期国内外代表性研究
作者分期生理信号特征数/个
分类器准确率/%Koley 等[4]
睡眠5期EEG 39支持向量机85.7Ebrahimi 等[5]
睡眠4期ECG 34线性判别法80Ghimatgar 等[6]
睡眠5期EEG 136随机森林87.82杨芳等
[7]
睡眠5期EEG 9支持向量机88.45李杰[8]睡眠4期
EMG 、EOG 6特征评分表73黄文汉等
[9]
睡眠3期
ECG 、呼吸
19
随机森林
71.9
R&K AASM
图2
基于单通道EEG 进行睡眠分期的技术路线图
表2受试者睡眠样本分布情况
序号受试者总样本W 期S1期S2期S3期S4期REM 期1SC4002E0130736356
373972032152
SC4042E0
1280
265
137514
91
6
267
3
SC4112E0
982306
18
396
90
21
151
4
SC4032E0
1212
437
45
400
55
76
199
5
SC4052E01130
107
113
616
106
8
180
6
SC4072E01163
297
84
商业理论392
59163
168
7
ST7022J0
943
73
74
353
127
157
159
8
ST7121J0
1018
62
34
452
120832679ST7132J0852
60
89
384
8419
21610总计
ST7152J0
1038
10925
49
2019
81
731
447
4327碱血症
85
914
176912
200
2022
单位:个
由于EEG信号具有很强的变异性和随机性,且易受到其他生理信号和外界环境的干扰,所以需要对原始数据进行预处理以消除可能存在的噪声干扰。本研究选用0.5~47Hz的FIR(finite impulse
response)带通滤波器对原始EEG数据作去噪处理。
1.2特征提取
本文提取了时域、频域、双谱、非线性特征共计48个,详见表3。下面将着重介绍本研究中使用到的部分特征。
1.2.1频域特征
使用自回归(auto-regression,AR)参数模型法求得EEG的功率谱密度分布函数,分别求取0.5~4Hz (δ波)、4~8Hz(θ波)、8~13Hz(α波)和13~30Hz(β波)4个频带的功率以及0.5~30Hz频率范围的总功率(E z)。以4种特征波占总功率的比值作为其频域的4个特征。频域能量特征被证实是应用于睡眠分期的有效特征[7,11]。
将频域的功率谱密度与香农熵相结合,可得到功率谱熵。功率谱熵被发现对S2期与SWS期的区分有非常显著的意义[12]。功率谱熵的计算公式为E P=-∑P i ln(P i)(1)式中,P i为频率值i处的归一化功率谱密度。95%频谱边缘频率(SEF95)是在功率谱密度分布函数的基础上,计算95%曲线下面积的频谱边界频率,指95%总功率谱处最高边界的频率。它将功率谱简化为单一的参数(即独立的观察指标),能够清楚地表示脑电图功率与频谱的移动。麻醉过程中的
SEF95值反映EEG信号从清醒时候的高频波为主到麻醉后低频波占优势的过程。而与麻醉深入过程类
似,在睡眠由浅入深的过程中,SEF95值也会随着睡眠的加深而减小,REM期又稍增大。图3为SC4112E0受试者的982个睡眠样本6个睡眠时相SEF95值的平均值变化图,其规律性明显。说明SEF95除可作为麻醉深度的指标外,还可作为睡眠深度判别的依据之一。
1.2.2双谱特征
为补充传统分析方法难以得到的EEG信息或者改进传统特征的不足,本文引入了高阶统计量。高阶统计量是指阶数大于二阶的统计量,主要有高阶矩、高阶累积量和高阶谱等[13]。高阶统计量于传统特征而言,其优势在于:(1)高阶统计量可以展现EEG 信号的相位耦合信息,而传统特征仅能展现EEG 信号的幅值信息。(2)高斯过程三阶及以上累积量均为0,因此高阶统计量可以有效抑制信号的背景高斯噪声。
双谱(即三阶谱)是最常用、最简单的高阶谱。双谱是三阶累积量的二维傅里叶变换,其公式表示如下:留住今天的太阳
B x(f1,f2)=∞
τ1=-∞
∑∞τ2=-∞∑c3x(τ1,τ2)e-j(ω1τ1+ω2τ2)(2)
式中,f1、f2为归一化频率;τ1、τ2为三阶累积量c3x的时延;ω1=2πf1,ω2=2πf2。双谱值B反映的是(ω1,ω2)处的幅值相位耦合能量。本文将在双谱值B的基础上,进一步研究用于睡眠分期的定量特征。
表3特征列表黄铜矿
标签描述类型F1~F6EEG信号(mean,std,skewness,kurtosis,zero-crossing
rate,CV)时域特征F7~F8Hjorth参数(M0,C0)时域特征F9~F14倒谱(mean,std,skewness,kurtosis,zero-crossing rate,
CV)时域特征F15~F18E(β)/E z、E(α)/E z、E(θ)/E z、E(δ)/E z频域特征F19~F32自回归系数(P=14)频域特征F3395%频谱边缘频率(SEF95)频域特征F34功率谱熵频域特征F35快慢同步比(SyncFS)双谱特征F36双谱熵双谱特征F37快慢同步熵比双谱特征F38样本熵非线性特征F39模糊熵非线性特征F40多尺度熵非线性特征
F41符号序列熵非线性特征F42符号序列样本熵非线性特征F43~F48递归定量特征(RR,DET,DLL,ENTR,LAM,TT)非线性特征注:mean为均值,std为方差,skewness为偏斜度,kurtosis为峰度,zero-crossing rate 为过零率,CV为变异系数,M0为移动性,C0为复杂性,E(β)为β波(13~
30Hz)功率,E(α)为α波(8~13Hz)功率,E(θ)为θ波(4~8Hz)功率,E(δ)为δ波(0.5~4Hz)功率,E z为0.5~30Hz频带总功率,P为自回归模型阶数,RR为递归率,DET为确定性测度,DLL为平均对角线长度,ENTR为递归熵,LAM为层状度,TT为捕获时间。
图3SC4112E0受试者睡眠6期各期SEF95平均值18
16
14
12
10
8
6
4W S1S2S3S4REM
睡眠时相
(1)快慢同步比。
快慢同步比是应用于麻醉深度检测的EEG 双频指数(bispectral index ,BIS )的子参数,能够定量反
映不同频带信号相位耦合的程度[14]。在BIS 指数中,快慢同步比的定义为SynchFastSlow=lg
B 0.5~47
B 40~47
(3)
式中,B 0.5~47代表EEG 整个频域0.5~47Hz 的双谱值
之和;B 40~47代表高频区域40~47Hz 的双谱值之和。两者之比取对数作为反映双谱分析中相位耦合信息
的指标——
—快慢同步比。基于前期的研究,定义用于睡眠分期的最优快慢同步比公式如下[15]:
SynchFS=lg
B 0.5~40B 10~40
(4)
式中,B 0.5~40代表EEG 频域0.5~40Hz 的双谱值之和,B 10~40代表高频区域10~40Hz 的双谱值之和。
(2)双谱熵。
与功率谱熵类似,将香农熵应用到双谱域可得
双谱熵[16]
。双谱熵反映包含有相位耦合信息的双谱值的非线性特性,其计算步骤如下:
①计算求得EEG 信号的双谱值B x (k 1,
k 2);②计算各点双谱值占整个双谱域双谱值总和的概率:
p B (k 1,
k 2)=B (k 1,k 2)N k 1=1N
k 2=1
B (k 1,k 2)
一致性检验(5)
③求出双谱熵:
H =-N
k 1=1∑N k 2=1
∑p B (k 1,k 2)ln p B (k 1,
k 2)(6)
(3)快慢同步熵比。
基于双谱熵的计算方法,结合快慢同步比的定义,可定义快慢同步熵比,公式如下:
EnSynchFS=
H 0.5~40H 10~40
(7)
式中,H 0.5~40表示在0.5~40Hz 频带内的双谱熵,H 10~40
表示在10~40Hz 频带内的双谱熵。快慢同步熵比反映2个双谱作用域的双谱熵的比值。1.2.3符号动力学与熵
研究表明,对比时域、频域和时频分析方法,采用非线性方法对非平稳EEG 信号作睡眠分期的效果最优[17]。而熵运算在非线性分析中占有重要地位。目前,以样本熵、模糊熵、多尺度熵为特征作睡眠时相划分是使用较普遍的一种方法。大量研究证明,这
些熵对睡眠分期效果显著[18-20]。3种特征具体的计算
流程本文不再详述[7,20]
。但传统熵存在其不足之处,主要包括:(1)传统熵值易受非平稳突变干扰的影响;
(2)传统熵受序列概率分布的影响,从而导致其并非
单纯反映序列的信息增长率。为了改进这些不足,本
文使用了将符号动力学与熵运算相结合的生物电研究方法。具体步骤:首先,定义符号,对生物电信号进行符号粗粒化;其次,定义维数m 和时延τ,得到短符号序列[21];
最后,对短符号序列作不同的熵运算,可得符号化熵。符号化就是利用有限的符号实现数据的离散化。定义短符号序列的过程就是进行相空间重构,相空间重构后的字包含有相邻时间采样点的动态信息。因此,使用符号化熵作为睡眠分期的有效非线性特征以达到对生物电信号特征的有效提取和分析,本文中提取的符号化熵包括以下2种:
(1)符号序列熵(F41)。符号化序列求香农熵可得符号序列熵[22]。将原始时间序列符号化,得到符号序列Y ,定义短符号字长(即维数m )为2、时延τ为1对符号序列进行相空间重构,得到符号嵌入矢量。对符号嵌入矢量中的所有短符号序列求熵即可得到符号序列熵。
(2)符号序列样本熵(F42)。
将原始时间序列符号化和相空间重构后得到的短符号序列求样本熵可得到符号序列样本熵。它与样本熵的计算相似,不同之处在于将样本熵中“嵌入矢量相似”的判断转化为“符号嵌入矢量相等”的判断[23]。
符号的定义可以有各种不同的方法,本文使用
如下函数进行符号定义:
图42种符号熵计算流程图
y i =0:μ1<x i ≤(1+a )μ1or (1+a )μ2≤x i <μ2
1:(1+a )μ1<x i <∞or
-∞<x i <(1+a )μ2
2:(1-a )μ1≤x i <μ1or
μ2<x i ≤(1-a )μ2
3:(1-a )μ2<x i <(1-a )μ1
⎧⎩
⏐⏐⏐⏐⏐⏐⏐⏐⏐⏐⏐⏐⎨⏐⏐⏐⏐⏐⏐⏐⏐⏐⏐⏐⏐(8)
式中,x i 为EEG 序列X 中的元素;
y i 为得到的符号序列Y 中的元素;μ1为原始序列X 中大于等于0的
取样信号的平均值;μ2为序列X 中小于0的取样信
号的平均值;a 是一个特殊的参数,其值过大会丢失原始数据的详细信息,过小会造成时间序列受噪声影响明显,通常情况下取a =0.05[24]。图5为2名受试
者睡眠6期符号序列样本熵均值图及组间统计学分析结果,可以发现,随着睡眠的加深,符号序列样本熵逐渐减小,S4期达到最小,到REM 期又有大幅增加。对该特征做统计学分析,发现仅标注出的组间符号序列样本熵,无显著统计学差异(P >0.05),其他各组间均有显著统计学差异。
1.2.4递归定量分析
递归性表述的是系统在特定时间状态具有相似性,是动态系统和非线性系统的基本特性之一。动力学系统可以用向量集表示,当动力学系统中的某2个特定时刻的向量之间的欧氏距离小于一定数值时,定义为递归。1987年,Eckmann 等[25]第一次提出递归图(recurrence plot ,RP )分析方法。若2个时刻递归,定义为R i ,j =1,在递归图中表现为黑;若2个时刻非递归,定义为R i ,j =0,
在递归图上表示为白。1994年,Webber 等[26]首次提出用递归定量分析
(recurrence quantification analysis ,RQA )方法对递归图中的递归
点和规则线段所占的比例进行定量分析。RQA 的主要量化参数有递归率(RR )、确定性测度(DET )、平均对角线长度(DLL )、递归熵(ENTR )、层状度(LAM )、
捕获时间(TT )等。
在不同的睡眠时相,EEG 信号的递归特性不同,且呈现有规律的变化。图6为随机选取的不同睡眠时相的30s EEG 样本各12个计算得到的6个递归定量特征变化规律图。可以发现,由W 期到NREM 期,随着睡眠的不断加深,EEG 信号递归性增强,混沌性
变弱,随机性减小,6个定量特征值均逐渐增大,到S4期达到最大。在REM 期EEG 信号递归性减弱,6个定量特征值又减小。本文使用RR 、DET 、DLL 、ENTR 、
LAM 、TT 这6种递归定量特征(F43~F48)作为睡眠自动分期的特征值。
1.3SVM
本文选择台湾的林智仁教授在2001年开发的
一套成熟、使用非常普遍的SVM 库——
Libsvm 工具包,采用径向基核函数进行非线性分类,同时使用网格搜索方法选取需要设置的2个子参数c 和g ,作多元分类。
使用Libsvm 工具包进行分类的步骤如下:(1)按照Libsvm 工具包要求的格式准备数据集,要求格式为:<label><index1>:<value1><index2>:<value2><index3>:<value3>……
(2)对数据做标准化处理。对数据集进行简单的缩放处理。缩放的主要目的为:①避免一些特征值范围过大而另一些特征值范围过小;②避免计算过程过于复杂。本文使用Z-score 标准化方法(又叫零-均值规范化、标准差标准化)处理数据,经过处理的数据的均值为0,标准差为1。Z-score 标准化的公式如下:
x z =x -x ⎺σ
(9)
式中,x ⎺
为原始数据的均值,σ为原始数据的标准差。(3)应用径向基核函数(RBF 核函数)将输入样本映射到高维特征空间,解决在低维空间中线性不可分的问题。
(4)选择得到最优的c 和g 。c 为惩罚因子,表示对类中离样本的重视程度,c 值越大说明越重视离样本;g 为核函数参数。c 和g 的选择对分类精度影响很大,在本研究中,使用SVMcgForClass 函数完成c 和g 的选择。
(5)用得到的最优c 和g 训练分类模型。使用Libsvm 工具包中的svmtrain 函数训练多分类模型。
图5
2名受试者睡眠6期符号序列样本熵均值图
SC4002E0受试者SC4112E0受试者0.400.350.300.250.200.150.100.050
P >0.05P >0.05
mis系统P >0.05
P >0.05P >0.05
P >0.05
P >0.05
W S1
S2
S3S4REM

本文发布于:2024-09-22 22:29:23,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/204411.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:睡眠   特征   符号   信号   分期   序列   进行   使用
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议