基于小波包络分析和LSTM网络的运动想象脑电分类外文翻译资料

 2022-08-09 09:43:30

英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料


基于小波包络分析和LSTM网络的运动想象脑电分类

摘要

基于运动想象(MI)的脑-机接口(BCI)有助于利用运动想象脑电图(EEG)将人类运动意图转化为控制信号的媒介。BCI研究的一个主要挑战是识别非平稳的脑电信号来对人类运动意图进行分类。我们提出了一种基于小波包络分析和长时短时记忆(LSTM)分类器的新方法,该方法考虑了脑电信号的幅度调制特性和时间序列信息,将脑电信号分为多个类别。首先,结合希尔伯特变换和离散小波变换,提取出包含脑电信号幅度调制和频率调制信息的重要特征。然后,小波包络特征被输入到具有用于分类的输入门、遗忘门和输出门的LSTM分类器中。最后,在2003年BCI竞赛数据集III上进行了5次交叉验证实验,实验结果表明该方法有助于获得更高的分类精度。

关键词:脑机接口,离散小波变换,希尔伯特变换,长短期记忆

1 引言

脑机接口(BCI)为用户提供了不依赖于大脑周围神经和肌肉正常输出通道的通信和控制通道[1]。 BCI系统记录大脑活动,通过信号处理部分识别用户的意图,然后通过将适当的信号发送到外部设备来控制设备。有了BCI,那些严重残疾的人(例如中风,脊髓损伤,脑外伤等)有望重新建立其环境控制能力。

可以使用各种技术来测量大脑活动,但是基于脑电图(EEG)的BCI系统具有较高的时间分辨率,相对较低的成本,并且更便于患者使用[2]。运动想象(MI)是获取EEG信号的有效方法之一。尽管基于MI的BCI系统已经取得了重要的发展,但分类精度低,仍然是一个重要问题[3]。 EEG信号本质上是非常不稳定的时间序列信号,而时间序列信息是有助于提高EEG信号的分类性能[4]。但是,大多数分类器都不考虑此特征。

由于数十亿个神经元之间的复杂互连,因此记录的EEG信号本质上是非线性,非平稳的。因此,对于BCI系统而言,从复杂的MI-EEG中提取可有效识别运动任务的特征非常重要。在脑电特征提取中已应用了许多方法,例如光谱分析[5],小波变换(WT)[6],希尔伯特变换(HHT)[7]和短时傅立叶变换(STFT)[8]。其中,小波变换算法不仅可以对信号进行多尺度分解,而且具有多分辨率的特征,可以有效地获得信号的时间和频率信息[9]。徐等人提出了一种基于离散小波变换(DWT)和自回归(AR)模型的脑电特征提取新方法,其中将小波系数统计和六阶AR系数的组合特征用作分类器的输入向量[10]。王等人提出了一种基于小波变换和独立分量分析的方法来提取脑电信号的时频和空间特征[6]。另一方面,生物电过程中振幅调制的存在具有根本性质,因为它直接反映了神经系统和其他身体系统中的控制,同步,调节和相互作用[11]。当前,研究人员试图探索脑电信号处理领域中包络分析(EA)的能力[12]。 吴等人使用滑动窗口ICA算法检测包络并将其应用于EEG分类[13]。Clerico 等人提取脑电信号中每个频带的包络的互信息作为特征,当将建议的特征与频谱功率和不对称指数特征融合时,可获得高达20%的增益[14]。

分类是BCI信号分析的另一个重要步骤。目前,常用的MI-EEG分类器,如支持向量机[15],线性判别分析(LDA),K最近邻(KNN)[17]和逻辑回归(LR)[17]在分类上没有利用脑电信号的时间序列信息。然而,脑电信号是一种时间序列信号,而时间序列信息,且由于这些信号本质上是高度不稳定的,因此有助于增强EEG信号的分类性能[18]。近年来。循环神经网络(RNN)被广泛应用于时间序列的信号处理,并已成为语音识别领域,机器人运动识别领域和图像文本识别领域的有效识别模型。然而,传统的RNN在训练过程中存在梯度爆炸或梯度消失的问题,这导致RNN无法使用较早的信息。也就是说,序列输入越远,权重正确改变的影响就越小。因此,训练的结果通常偏向于新信息,也就是说,它没有长记忆功能。针对这一问题,Hochreiter和Schmidhuber向传统的RNN中引入了存储单元来存储长时间信息,并提出了长期短期记忆(LSTM)循环神经网络[22]。

本文提出了一种利用小波包络分析和LSTM分类器进行MI-EEG分类的新方法。为了获取调幅和调频的基本信息,首先对脑电信号进行离散小波变换。然后,为了提取小波包络,我们选择特定的小波子带进行希尔伯特变换(HT)。最后,由输入层、LSTM隐藏层和输出层组成的LSTM分类器用于识别MI-EEG信号。

本文的组织结构如下:在第2节中,说明了所使用的方法,包括基于DWT的EA和LSTM方法,并给出了分类过程的说明。第三部分介绍了实验研究,本节给出了数据来源,实验结果和讨论。第四部分总结了论文。

2方法

2.1离散小波变化

与离散傅立叶变换(DFT)和STFT相比,小波变换将信号重构为由小波系数加权的小波基的线性组合,并具有更好的时频变换特性。小波变换的另一个特征是支持短期尺度的高频分析和长期尺度的低频分析。由于其多分辨率特性,因此适合提取非平稳信号(例如EEG信号)的特征。WT分析可以分为两种类型:连续小波变换(CWT)和离散小波变换(DWT)。根据该原则,CWT定义如下[23]:

其中,,和分别称为小波函数,缩放参数,位移参数和被处理信号。可以看出,一维信号在小波变换之后变成二维信号。因此,离散小波变换(DWT)为:

在实际应用中,基于Mallat算法[24]将信号分解为有限层。离散小波变换(DWT)通过将信号分解为粗略的近似和细节信息来分析不同分辨率的不同频带上的信号[25]。在信号的多分辨率分解过程中,每个级由两个数字滤波器和两个下采样器组成,第一个高通和低通滤波器的下采样输出提供细节D1和近似值A1,分别分解第一近似值A1并继续该过程[26],图1展示了小波分解的结构。

图1 具有4个分解级别的DWT树

2.2希尔伯特变换

为了提取每个子带信号的包络,我们对每个子带的信号进行希尔伯特变换。希尔伯特变换是提取包络信号的经典方法。它可以有效地提取窄带载波信号的包络,被广泛用于脑电信号的包络提取。在希尔伯特变换之后,信号的振幅是恒定的,并且相位改变。负频率和正频率分别为 90和 90相移。希尔伯特变换后的信号是:

因此得到分析信号:

信号的振幅就是原始信号的包络:

2.3 长短期记忆网络

在传统的神经网络中,梯度信号在反向传播过程中将递​​归隐藏层的神经元之间的权重矩阵乘以很多倍(与时间步长一样多)。因此,变换矩阵的权重很对于梯度信号很重要。如果矩阵中的权重较小,则可能导致消失梯度。相反,如果矩阵中的权重较大,则可能导致所谓的爆炸梯度。这些问题是LSTM模型背后的主要动机,该模型引入了一种称为存储单元的新结构。从图2中可以看到,LSTM专门设计了用于存储历史信息的存储单元,而历史信息的更新和利用则由3个门控制:输入门,忘记门,输出门[27-28]。

图2 LSTM存储单元的图示

对于本文使用的LSTM版本,LSTM由以下复合函数实现:

其中,和是逐点非线性激活函数。逻辑S形函数()用作门激活函数,双曲线正切函数()通常用作块输入和输出激活函数。两个向量的逐点乘法用表示[28]。

2.4 分类程序介绍

本文采用离散小波变换和希尔伯特变换提取脑电信号的小波包络特征,并用LSTM循环神经网络作为分类器来识别MI-EEG信号。该算法的框图如图3所示。

图3 算法框图

单个子带的特征序列包含的频域信息太少。在本文中,多个子带特征序列的组合用于提供不同的频域信息。但是,由于每个子带包络的时间序列不一致,因此不能将多个子带时间序列同时输入到LSTM分类器中,并且不能矢量化多个子带时间序列的组合。因此,使用滑动矩形窗口来获得固定长度的时间序列,并且将每个窗口处的多个子带的统计特征组合计算为每个窗口的特征。用于运动图像任务的特征提取过程如下:

(1)使用重叠窗口的矩形窗口在原始EEG上滑动。每个窗口包含一个单独的EEG段。 (2)DWT用于将滑动窗口内的每个EEG片段分解为不同的频带。

(3)在分解后的DWT子带上进行HT,得到子带包络。

(4)计算统计特征以表征脑电信号的包络谱。以下统计特征用于表征包络频谱的时频分布:1)每个子带中包络频谱的平均值。

2)每个子带中的包络频谱能量。

3)每个子带中的包络谱的标准偏差。

4)每个子带中的包络谱的最大值。

(5)将同一时间窗下不同频段的统计特征合并为特征向量,并根据时间窗序列将特征向量合并为特征时间序列。

分类过程可分为两部分:第一部分是基于训练数据集优化分类器。训练集的小波包络特征输入到LSTM分类器中,整个网络通过监督学习进行训练。在训练过程中,使用全向后传播算法(Full BPTT)算法将错误从最后一层转移到下一层,以最大程度地减少错误并更新网络参数集。第二部分是测试数据集的分析。将测试集的小波包络特征输入经过训练的LSTM分类器,然后根据分类结果评估LSTM分类器的性能。

3 实验研究

3.1实验数据

格拉茨技术大学的Dr.Gert Pfurtscheller提供的2003年BCI竞赛数据集III被用来评估我们提出的方法的分类性能[29]。该数据集中的EEG信号是使用通道C3,Cz和C4为一名正常女性受试者测量的,该受试者需要通过左右手运动的想象来控制反馈条。数据集包括140条训练轨迹和140条测试轨迹,具体的实验范例如下图4所示。每次试验9秒。在时,听觉刺激指示试验开始,并且一个“ ”显示1秒;在时,向左或向右箭头的显示作为提示,同时要求对象沿提示的方向进行运动想象;然后有一段休息时间,受试者放松并为下一组实验做好准备。

图4 2003实验范式的时间安排

3.2 特征提取

在这项研究中,DWT用于分解通道C3,C4和Cz的滑动窗口内的每个EEG段。 矩形窗口的大小为1s,相邻窗口的一半重叠。 此外,由于仅使用和之间的数据,因此通过滑动窗口可以获得长度为7的时间序列。 每个脑电图段被Daubechies 4抽头小波分解为5个级别。表1表示EEG信号在128Hz下的小波包络系数的频率分布。 在本文中,选择了四个子带进行希尔伯特变换。 图5展现出了我们为一个EEG段选择的子带小波系数。

表1 脑电信号的频带采用第五级分解

分解水平

子带

频率范围(Hz)

1

D1

32-64

2

D2

16-32

3

D3

8-16

4

D4

4-8

5

D5

2-4

5

A5

0-2

图5 C3,C4和Cz的小波分解

图6 一段脑电图的分解子带的小波包络

如图6所示,在DWT分解子带上执行HT,以获得子带包络。结合从C3,C4和Cz的选定子带中提取的所有小波包络统计特征,获得尺寸的特征向量作为每个EEG时间序列的特征。最后,将所形成的尺寸的特征时间序列用作LSTM神经网络的输入。

3.3 基于LSTM的循环网络的分类

LSTM循环神经网络结构中的网络层数和LSTM单元数对所获得特征的性能影响很大。具有少量LSTM单元的LSTM网络可能不足以模拟复杂的功能,另一方面,具有过多LSTM细胞的神经网络可能导致训练集过度拟合并失去神经网络的主要期望特征——促进能力 [30]。当前,没有选择适当数量的隐藏层的通用方法。通常,最佳的神经网络架构是通过反复试验找到的。据此,本文首先探讨了一个隐藏层有的隐藏层单元数目对实验结果的影响。实验结果如表2所示。从表中可以看出,对于MI-EEG信号,具有一个由25个LSTM单元组成的隐藏层的网络可以提高分类精度。除了一个隐藏的分层网络体系结构,我们还对具有两个或三个隐藏层的大型网络进行了实验,但是与一个隐藏层相比,我们在训练和测试结果方面并未观察到明显的改进。输出数量为1,以想象左手运动、想象右手运动为目标输出的样本分别给出0、1的二进制目标值。

表2 在一个隐藏层中具有不同数量的神经元的分类精度

隐藏层的神经元数量

分类精度

23

88.57%

24

89.29%

25

91.43%

26

90.08%

lt;

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[239944],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。