英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料
摘要
在人机交互(HCI)中,可以将脑电图(EEG)信号作为附加输入添加到计算机中。在人机界面中集成基于实时EEG的人类情感识别算法,根据应用程序的目的,使用户体验到更完整,更具吸引力,或多或少的情绪压力。目前,最准确的基于EEG的情感识别算法是依赖于对象的,并且每次在运行应用程序之前都需要用户进行训练。在本文中,我们提出了一种实时的新颖的具有最稳定特征的面向对象的算法,该算法比其他算法具有更好的准确性,因为重点在于它对用户只有一次训练,随后不允许重新训练。本文所提出的算法在包含五个对象的情感脑电数据库上进行测试。对于每个对象,诱发四种情绪(愉快,快乐,恐惧和愤怒),并且连续八天每天记录两次情感脑电图。测试结果表明,新算法可以用于实时情感识别应用中,而不需要为了足够的准确度重新训练。所提出的算法与实时应用程序“Emotional Avatar ”和“Twin Girls”集成去实时监控用户情绪。
关键词:EEG·情绪识别·分形维数(FD)·稳定性·内部类相关系数(ICC)
介绍
脑电图(EEG)是测量人脑电位的时间序列。以前,EEG仅限于医学应用,例如帮助脑部疾病如癫痫,注意力缺陷型多动症(ADHD),阿尔茨海默氏病等的诊断。然而,随着科技的进步,引入市场的新型EEG设备是可穿戴,便携,无线和易于使用的。从而使得EEG的应用从医疗用途扩展到个人娱乐用途。现在,基于脑电的情绪识别引起了高度的关注,因为人们希望机器能够以更人性化的方式识别人类情感并与我们互动。基于EEG的人机界面可以适应用户的内心情绪,并可以由用户的情绪驱动。在许多应用中实现情感接口是有用的,例如(1)可以根据用户的情绪改变流动的游戏;(2)监视可能有情绪表达困难的患者情绪的医疗应用;(3)根据已识别的用户情绪调整在线广告的神经营销学等。
人类的情感是一种会导致身体和心理产生变化的复杂情感,这可以通过面部表情,手势,交谈时的语调等来反映。识别人类情感的努力可以追溯到1972年,它根据说话人的言语判断情绪。然而,由于可以有意改变面部表情,手势和语调以隐藏真实情绪,因此基于这种表面特征的情感识别可能不可靠。 脑电图直接测量脑活动的变化,基于脑电图的情绪识别很有可能评估受试者的真实内心情感。
当前基于EEG的情感识别算法是依赖于对象的,并且几乎每次都需要在运行实时情绪识别应用程序之前进行训练。在训练期间,将刺激(音频/视频)呈现给对象以唤起某些目标情绪 同时记录受试者的EEG。记录的EEG数据经过特征提取以提取数字特征参数,并且提取的特征被馈入用于训练的分类器。
在基于脑电的情绪识别研究中,采用了不同的特征和不同的分类器。 Ishino和Hagiwara 使用小波变换,快速傅立叶变换(FFT)和统计量如均值和方差作为特征,并采用神经网络(NN)对四种情绪进行分类,3个通道的准确率达到了67.7%。 Lin等人利用对称电极的功率差异和支持向量机(SVM)中对四种情绪进行分类,在32个通道中获得了90.72%的准确度。 Schaaff 和Chanel等人利用短时傅立叶变换(STFT)提取特征,SVM作为分类器,识别三种情绪分别达到62.07%(16通道)和63%(64通道)的精度。在另一项研究中,Shaaff 将信道数目减少到4个,并将统计特征,功率特征和互相关特征与SVM。一起使用,对3种情感的识别准确率为47.11%。在[22]中对四种情绪进行识别,为分类器以脑球功率谱的差异性对称性为特征,SVM为分类器,使用32个通道获得了82.29%的准确性。 使用来自62个通道和K-最近邻(KNN)分类器的不同EEG频带的统计特征,在[29]中识别出五种情绪,准确率为83.04%。Li和Lu [21]利用支持向量机从62个通道中区分对数变异的两种情绪,准确率达到93.5%。Liu和Sourina [24]采用分形维数(FD)特征以及统计高阶交叉(HOC)特征,并使用了SVM分类器。四个频道最多可识别八种情绪。 平均准确度从53.75%(八情绪)到83.73%(两情绪)。
Sohaib等人评估了不同分类器的性能,并且报告了使用SVM作为分类器和源自6个电极的统计特征获得的3种情绪的最佳准确度为56.10%。同样,在另一项工作[30]中,当使用来自4个通道的HOC特征识别6种情绪时,比较二次判别分析(QDA)和SVM。据报道,与使用QDA获得的62.3%相比,SVM具有更好的准确性83.3%。Wang等人在他们的工作中报告了类似的发现,Wang采用统计特征和功率特征,比较了K-NN,SVM和多层感知器(MLP)之间的分类性能,其中支持向量机(SVM)在识别4个62个频道的情感类别时报道了66.51%的准确率,是所有情感中最高的。Brown等人采用8个通道和3个不同分类器(QDA,SVM和K-NN)的功率比特征和波段功率特征来评估3种情感的识别性能。 在这项研究中,K-NN对不同受试者的准确度最高,从50%到64%。Frantzidis 利用EEG的事件相关电位(ERP)和事件相关振荡(ERO)特性, 使用ERP幅度,ERP延迟和ERO幅度作为特征。 选择Mahalanobis Distance(MD)分类器和SVM并相互比较。识别4种情绪,支持向量机胜过1.8%,达到81.3%的准确性。
必须指出的是,不同算法之间的直接比较是不恰当的,因为所报道的准确度是在不同的实验设置下获得的。尽管如此,一些结论可以在没有过度概括的情况下得出。脑电信号的采集通道越多,识别情绪精度越高。 支持向量机作为一种受欢迎的分类器,已被广泛用于这些研究中[4,5,8,14,21-24,30-32,36-38,41]。此外,为了评估不同分类器的性能,已经在[5,8,22,30,38,41]中设置了对照实验。支持向量机比其他分类器因其有效性和更高的精度而更受欢迎。
脑电特征的稳定性问题首先在医疗应用中提出。一种特征必须表现出高稳定性才能在临床使用。一个稳定的特征应该在同一个对象的重复EEG测量之间表现出一致性。已经研究了几种常见EEG特征的稳定性,例如频带功率,相干性和熵。在[9,10]中,26个实验者参与了为期10个月的实验。 据报道绝对功率特征和相对功率特征具有相似的稳定性,而连贯性不如前两者稳定。 从alpha波段获得的功率特性是最稳定的,其次是theta波段,deltaband波段和beta波段功率特性。Salinsky等人[34]招募了19名受试者,并在12-16周的时间间隔内以闭眼状态记录了他们的EEG。 据报道,峰值alpha频率和中位频率是最稳定的。 绝对功率的稳定性和相对功率之间没有显著差异。 KondacsandSzaboacute;[18]在25-62个月的时间间隔内研究了45名受试者的静息,闭眼EEG的功率谱特征和相干特征。据报道稳定性是从1.5到25Hz的频率范围的最大总功率,其次是alpha;平均频率,alpha;和beta;绝对功率,delta;绝对功率和alpha;相干性。 Gudmundsson等人[11]研究功率谱参数,熵和一致性特征。脑电图数据来自15个老年人,在两个月内每个人记录10个会话。 据报道功率谱参数比熵更稳定,相干性最不稳定。 在功率特征中,theta频段是最稳定的,其次是alpha,beta,delta和gamma频段。 可以肯定的是,这些研究之间并不容易找到相似之处,因为主体,特征,数据处理技术,重测间隔都是不同的。然而,一些常见的研究扫描表明:绝对功率特征和相对功率特征具有相似的稳定性能; 功率特征比相关性特征更稳定。
在基于EEG的情感识别中,也需要稳定的EEG特征,以便省略重复训练。理想情况下,稳定的脑电特征应该能够持续识别同一受试者的同一情绪。 虽然功率特征是医学应用中最稳定的特征,但对情感识别应用还需进一步分析。刘等人已经证明,分形维数特征优于功率特征在效价识别中的准确性[25]。在[19]中,我们研究了基于实时EEG的情感识别算法[24]中使用的各种特征的稳定性。 在本文中,我们进一步研究更多特征的稳定性,并提出一种具有最稳定特征的基于实时EEG的新型情感识别算法。实施的算法集成了两个用于情感监控的应用程序,如“Emotional Avatar”和“Twin Girls”。所提出的算法允许对象仅进行一次训练,并且该训练可以用于每次新课程的未训练的应用中。我们设计和实现用于收集标有四种情绪的脑电图数据的实验,所述四种情绪例如愉快,快乐,惊吓和 愤怒。 这些数据是在连续八天内收集来的五个实验对象(每个对象每天两次)。
本文的结构如下。 在第二章给出了包括分形维数,幂,统计特征,高阶交叉等特征提取方法在内的相关工作。 在第三章中描述了采集对象的EEG数据的实验。 在第四章中提出了稳定情感识别算法。 第五节给出了数据处理和分析的结果和讨论。第六节给出了该算法的应用。 第7部分总结全文。
2 相关工作
2.1 分形维数特征提取
FD测量对象的几何复杂性。FD特征在基于脑电的情感识别应用中已被证明是有效的[24]。下面的工作[24],Higuchi算法[13]被用来计算脑电图的FD特征。
令X(1),X(2),...,X(N)表示时间序列样本(以下相似),从每k个样本中拾取一个样本构造新的时间序列:
(中间公式省略翻译)
2.2 功率特征提取
在EEG研究中,将EEG功率谱划分为几个常用的子频带(尽管频率范围可能略微有所不同):alpha频带,theta频带,beta频带。在我们的研究中,计算脑电信号的theta频带(4-8Hz),alpha频带(8-12Hz)和beta频带(12-30Hz)的功率特征。
(中间公式省略翻译)
2.3 统计特征提取
[33]采用了6个统计特征,并在[24]中基于EEG的情感识别中使用。 它们是平均值(7),标准偏差(8),第一差异绝对值的均值(9),归一化EEG的第一差异的绝对值的均值(10),第二差异的绝对值的均值(11 ),如(7)-(12)中所规定的归一化EEG的第二差异的绝对值的均值(12)。
(中间公式省略翻译)
2.4 更高阶交叉特征提取
Kedem [16]提出了更高阶交叉(HOC),并将其用于[24,30,32]作为识别来自EEG信号的人类情绪的特征,HOC计算如下。
(中间公式省略翻译)
2.5 同类相关系数
通过类内相关系数(ICC)对特征参数的稳定性进行量化。 与基于成对比较的Pearson相关系数不同,ICC允许评估分组数据中的相似性。它描述了来自同一组的数据相互之间的相似程度。 Pearson相关系数和ICC都被用来检验脑电参数的稳定性[1,11,18,34,40]。 然而,当检查来自多个会话的脑电参数的稳定性时,ICC是优选的。多种ICC模型,如ICC(1),ICC(C,1),ICC(A,1)等[28]。 在这些模型中ICC(1)常用于脑电稳定性研究[1,11]。ICC(1)来源于单向ANOVA模型,定义如下:
(中间公式省略)
3实验
3.1实验方案
情感脑电特征的稳定性是我们研究的兴趣所在。 与目前的EEG基准数据集相比,如DEAP数据集[17],其中包括多个对象,但每个对象只有一个单一的脑电图记录会话,我们设计并进行了一个实验,收集来自多个会话的情感脑电数据。我们设计并进行了一项实验,以收集来自多个小组对象的情感脑电图数据。这项初步研究包括五个受试者,四个男性和一个女性,年龄为24-28岁。所有受试者均未报告精神疾病或头部受伤史。 每个受试者连续8天每天记录两次会议,即每个受试者记录16次会话。一个14通道的Emotiv EEG设备(见图1)被用来以128Hz的采样率记录脑电图数据。每个会话由四个试验组成,每个试验对应一个诱发情绪,即四个情绪被引入一个会话,所以每个对象都有4times;2times;8 = 64个试验。这有标准情感刺激库,如国际情感图片系统(IAPS)[20]和国际情感数字化声音(IADS)[3]。在我们的研究中,IADS被选作实验设计,因为在受试者暴露于音频刺激,受试者可以保持闭眼,从而避免可能会污染脑电信号的眼球运动。情绪采集实验协议遵循工作[24]。 从同一类型的IADS中选择并附加声音片段制作76秒的音频文件,第一个16秒钟沉默以平息主题。 四个音频文件被用作刺激来唤起四种不同的情绪,即愉快,快乐,生气和受惊。在每次实验过程中,只有一名受试者被邀请进实验室,并对实验方案进行了充分被指导。 受试者戴着Emotiv EEG设备和一对耳机,音量调节得当,并且要求她闭着眼睛坐下,尽可能避免肌肉运动,以减少眼球运动,牙齿紧绷,颈部活动等可能产生的假象。随后,在试验中,受试者必须自行完成评估描述他的情绪(高兴,受惊等)。这种自我评估被用作评估受试者真实情绪的基础事实。这种情绪采集实验的协议如图2所示。
4方法
4.1特征提取
在提取特征之前,所有原始EEG数据都是集中的(零均值)。然后应用2-42 Hz带通滤波器,因为主要的EEG波(alpha;,theta;,beta;,delta;和gamma;)都在这个带宽内[35]。 正如第二章介绍的,FD特征,alpha功率,theta功率,beta功率,theta / beta比率,6个统计特征,HOC特征是从四种情绪状态的EEG中计算出来的。去掉第一个16s的无声部分中,第一个5s和最后6s的音频,第22秒到第70秒的EEG用于数据处理。获得每个对象每种情绪的16个49s脑电信号。正如[26]中证明的那样得分最高的的5个通道被选中,即:通道FC5,F4,F7,AF3和T7(见图3)。 Emotiv默认通道参考了两个突触的平均值。如[24]中提出的,所有特征都是从集中的,过滤过的EEG数据中计算出来的,大小为512和75%重叠的窗口(每次向前移动128个采样点)。下面的工作[18],对数转换适用于功率特征。
4.2 稳定性评估
分别计算每个对象的EEG数据四种脑电特征(FD,功率和功率比,统计学和HOC)。 然
全文共7653字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[16339],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。