情感脑机接口研究综述
1
2
3
4
5
6
A survey of affective brain-computer interface
1
2
3
4
5
6
Revised: 2021-03-04 Online: 2021-03-15
Fund supported: |
|
作者简介 About authors
吕宝粮(1960-),男,IEEEFellow,上海交通大学计算机科学与工程系教授、博士生导师,上海交通大学计算机科学与工程系仿脑计算与机器智能研究中心主任,上海交通大学上海市教委智能交互与认知工程重点实验室主任,上海交通大学医学院附属瑞金医院脑机接口与神经调控中心共同主任,上海交通大学医学院附属瑞金医院脑病中心米哈游联合实验室主任,上海交通大学清源研究院执行院长。长期致力于仿脑计算理论与模型、神经网络、情感智能和情感脑机接口的基础算法及其在情感障碍疾病的诊疗的应用等方向的研究。亚太神经网络学会理事,IEEETransactionsonCognitiveandDevelopmentalSystems、《模式识别与人工智能》《智能科学与技术学报》编委。曾获得2018IEEETransactionsonAutonomousMentalDevelopment最佳论文奖和2020年度第十届吴文俊人工智能科学技术奖自然科学奖一等奖。 。
张亚倩(1992-),女,博士,上海交通大学计算机科学与工程系助理研究员,主要研究方向为强化学习、人机交互。 。
郑伟龙(1988-),男,博士,麻省理工学院脑与认知科学系博士后,主要研究方向为脑机接口、情感计算、计算神经科学。 。
情感智能研究的一个重要目标是让机器对人的情绪进行实时、准确的判别,并在此基础上进行更加自然、友好的人机交互。情感脑机接口是一种对人的情绪进行识别和(或)调控的脑机接口,是目前实现情感智能的主要途径。阐述了情感脑机接口的基本概念、工作原理、研究现状、代表性应用和发展趋势,探讨了情感脑机接口在通用人工智能发展过程中所能发挥的作用以及情感脑机接口研究面临的挑战。
关键词:
An important research goal in emotion artificial intelligence is to make machines understand and recognize human emotions in real-time and facilitate human-computer interaction in a more natural and friendly way.Affective brain-computer interface (aBCI) is a type of BCI that can recognize and/or modulate human emotion.Thus, aBCI plays a critical role in promoting emotion artificial intelligence.The basic concepts and recent research development of aBCI were summarized, and the applications of aBCI in a wide range of domains were outlined.The roles that the aBCI can play in the development of artificial general intelligence and the challenges faced by the aBCI research community were discussed.
Keywords:
本文引用格式
吕宝粮, 张亚倩, 郑伟龙.
LU Bao-Liang.
1 引言
人们在日常生活和交流中,通常通过面部表情、语音对话、肢体语言等外部行为信号识别周围人的情绪,从而实现带有情感的自然的交流与互动。如何让机器也能像人一样对人的情绪进行实时、准确的判别,并在此基础上进行更加自然、友好的人机交互,是情感智能(emotion artificial intelligence)或情感计算(affective computing)研究的重要目标之一。情感脑机接口(affective brain computer interface,aBCI)是情感智能的一个分支,也是目前实现情感智能研究目标的重要途径[1]。
本文综述了情感脑机接口的研究现状、基本原理和关键算法,介绍了情感脑机接口研究面临的挑战,展望了情感脑机接口未来的发展趋势和应用前景。第2节简要介绍了情绪、情绪模型和情绪的神经机理。第3节介绍了情感脑机接口的基本要素和重要算法,重点讨论了脑电信号的基本特性,情绪诱发实验、情绪类别的标注和情绪脑电数据集,以及基于迁移学习的跨被试和跨模态情感模型。第4节介绍了多模态情感脑机接口,探讨了包括眼动等多模态生理信号和外部行为信号的多模态融合问题。第5节介绍了代表性的情感脑机接口应用和正在开发的情感脑机接口应用系统。第6节讨论了情感脑机接口对通用人工智能(artificial general intellgence)研究可能发挥的作用和情感脑机接口有待解决的问题。第7节对全文进行了总结。
2 情绪、情绪模型和情绪的神经机理
情绪是在外界刺激条件下人的复杂的生理物理变化过程,具有 3 种成分:主观体验,即人对于不同情绪的自我感受;外部表现,即人处在不同情绪时身体各部分动作的量化反应形式;生理唤醒,即由情绪的变化引起的生理信号的变化[5]。
人的情绪会受到时间、地理、文化以及个体差异等因素的影响。目前,研究人员主要关注两类情绪模型:离散模型和维度模型。离散模型认为情绪是由多种不同的、离散的基本情绪组成的,其余的情绪是这些基本情绪的组合,人的真实情绪包含这些基本情绪以及其他复杂情绪。离散模型中比较著名的是Ekman P提出的情绪理论[6]。
维度模型则把情绪定义在由多个维度组成的坐标系中,其中被广泛使用的是Russell J A于1980年提出的情绪二维模型[7],它将人类的所有情绪描述在由效价(valence)和唤醒度(arousal)建立的二维坐标系中。所有情绪可以由该二维坐标系中的一个点坐标表示。通过使用维度的方法,人们可以更具体地评估和量化刺激引发的情绪反应。
上述离散模型和维度模型在情感脑机接口中被广泛应用。但值得注意的是,最近的心理学相关研究指出了这些传统模型的局限性[4]。一方面,维度模型中正面和负面情绪被描述为互斥关系,但人类日常生活中存在快乐和悲伤共同出现的情绪,例如大学毕业的时刻[8],维度模型无法很好地描述这种情绪。另一方面,近年来发展的积极心理学理论指出,传统的情绪理论对于正面情绪的复杂性考虑不足,实际上人们在日常生活中可以体验到多种复杂的积极情绪,包括喜悦、感激、兴趣、希望、骄傲、娱乐、灵感和爱心等[9]。因此,情感脑机接口研究的重要挑战是如何结合心理学、认知科学等学科的最新研究进展,建立更完备和精细的情绪模型,从而实现更自然的情感交互。
人们一般认为人类情感产生于边缘系统脑区之间的相互作用,边缘系统脑区包括杏仁核、海马、岛叶和扣带回皮质。但受之前的研究所采用的技术手段在空间和时间分辨率上的限制,边缘系统脑区在快速时间尺度上的相互作用是如何影响情绪变化的,尚无定论。
上述关于情绪的研究主要侧重解剖方面,通过动物实验,神经科学家可以进一步研究情绪产生和变化的神经机理和因果关系。目前,已经在哺乳动物大脑皮层下区域发现了一些核心情感系统,如基于多巴胺的促进积极觅食的搜寻系统,基于杏仁核、末端纹状体的床核传播网络的焦虑情绪相关系统等[13]。
但关于动物究竟是否拥有类似于人的情绪体验以及如何定义动物的情绪的基本问题,学界尚未有明确的共识。2020年德国马普所的研究团队发表在《科学》期刊上的文章研究了小鼠的6种情绪[14]。该研究发现,小鼠在6种外界刺激下会展现出相应的面部表情,并在岛状皮质区域检测到相关的神经元活动。这种面部表情的变化在强度、效价、持久性上均表现出与情绪相似的特性。这一发现是动物情绪模型研究的一项具有里程碑意义的突破。结合物种之间的同源性,将人类影像学的研究发现和动物实验的发现结合,有望帮助人们加速对人类自身情绪神经机理探索的进程,从而为情感脑机接口的研究提供神经生理学的支撑。
3 情感脑机接口
本节主要介绍情感脑机接口的基本要素,包括情绪识别和情绪调控脑机接口的整体结构、脑电信号的采集与处理、脑电信号的基本特性、情绪诱发实验的设计、情绪类别的标注以及常用的情绪脑电数据集。然后结合新的深度学习算法,重点探讨基于迁移学习的跨被试和跨模态情感模型的研究进展。
3.1 情感脑机接口的构成
情感脑机接口结构示意图如图1所示。具体地讲,情感脑机接口可细分为两类:一类仅对人的情绪进行识别(emotion recognition),被称为情绪识别脑机接口;另一类在情绪识别的基础上对人的情绪进行调控(emotion recognition and regulation),被称为情绪调控脑机接口。目前,国内外对情感脑机接口的研究大多属于情绪识别脑机接口,而情绪调控脑机接口的研究刚刚起步,尚处于萌芽阶段。
图1
3.2 脑电信号
在对脑电信号进行预处理后,提取与情绪相关的脑电特征,通过离散短时傅里叶变换算法将时序的脑电信号转换到频域上。在频域上,脑电信号可分为5个频段,即delta(0.5~4 Hz)、theta(4~8 Hz)、alpha (8~13 Hz)、beta(13~30 Hz)和gamma(30~42 Hz)。利用信号处理技术,提取脑电信号在不同频段的情绪特征,常用的特征包括能量谱密度(power spectrum density,PSD)、微分熵(differential entropy, DE)、微分熵不对称(rational asymmetry,RASM),以及微分熵不对称差(differential asymmetry, DASM)等。
此外,由于情绪的变化是一个相对平缓的渐变过程,而提取的脑电特征的变化常常较为剧烈。因此,为了去除脑电特征中与情绪无关的脑电活动,可以采用线性动力系统平滑算法对脑电信号进行特征平滑,从而消除或降低与情绪无关的脑电信号的影响。最后,将提取的特征输入分类器进行训练和测试。
值得注意的是,脑电信号是一种非稳态信号,不同个体的脑电信号有差异,即使同一个体的脑电信号也会随着时间的变化而变化。因此,利用脑电信号进行情绪识别需要回答的基本问题是,脑电信号是否存在与情绪类别相关的模式,这种模式是否广泛存在于不同个体之间,并在时间上稳定。针对此问题,研究者发现了一些有趣的跨被试的情绪模式[22]。在beta和gamma频段,侧颞叶区域对于正面情绪的激活比负面情绪的激活更多。更为重要的是,在对同一被试进行3次重复实验,每次间隔1周以上的实验条件下,上述的关键频段和脑区会稳定出现。这些发现为基于脑电信号的情绪识别奠定了理论基础。
在脑电信号采集方面,实验室常用的脑电信号采集设备一般包含32通道、62通道或128通道。其中可能包含一些与情绪无关的脑电信号,给情绪识别带来噪声和干扰。因此,找出关键的导联位置很重要,可以为脑电帽的设计和穿戴设备的简化提供参考。
自20世纪90年代开始,医学、认知科学等领域的研究人员就在探索与情绪相关的关键脑电特征。1985年Ray W J等人[23]发表在《科学》期刊上的文章指出,在正面和负面情绪任务中,颞叶区域左右半球大脑的beta频段脑电激活强度存在差异。类似地,Ahern G L等人[24]在额叶区域观察到情绪的偏侧化激活,正面情绪时,左半球比右半球激活程度高,而负面情绪时,正好相反。近年来,随着机器学习技术的发展,研究者可以通过更有效的数据分析技术进一步研究脑电活动与情绪的关系。Zheng W L等人[22]通过分析深度信念网络的权重发现,情绪识别中颞叶和前额叶附近的通道对于情绪识别最重要,并且基于这些脑区位置的4个关键导联对3类情绪进行识别的准确率可以达到甚至超过使用全部62个通道的准确率。在频段方面,一些相关研究通过小波变换[25]、支持向量机(support vector machine,SVM)[26,27]、功能网络分析[28]等方法发现, beta和gamma等高频段与情绪识别的关系更密切。
3.3 情绪诱发实验和情绪类别标注
目前,情感脑机接口的研究一般在可控的实验室环境下进行,通过情感交互实验诱发被试的情绪,同时采集被试的脑电信号和其他生理信号。具体地,在实验过程中,要求被试积极主动地接受情绪刺激素材的刺激,如图片、音频和视频等,以便诱发出特定的被试情绪。这类实验被称为情绪诱发实验。这样做的原因是目前还没有很好的技术手段能在日常生活中采集高质量的带标签的情感数据,所以只能在实验室环境里完成特定的情绪诱发任务。当然,情感脑机接口的最终目标是不需要用户接受额外的刺激,用户可以在日常生活的真实场景中自由地使用情感脑机接口。
3.4 情绪脑电数据集
SEED数据集目前包括3个子集,即3类情绪脑电数据集SEED、4 类情绪脑电数据集SEED-IV和警觉度估计脑电数据集 SEED-VIG。3 类情绪脑电数据集SEED包含15名被试的62通道的脑电和眼动数据,每位被试在不同时间参与了3次实验,在每次实验中,被试观看了15段4 min左右的电影片段,诱发的情绪为正面、中性以及负面3类。相较于其他数据集,该数据集的特点是包含了相同被试不同时间的情绪数据,有助于研究脑电和眼动数据随时间变化的模式和规律,评估模型或系统跨被试和跨实验的性能变化。
3.5 跨被试情感模型与迁移学习
在迁移学习框架中,标注好的训练数据集被称为源域(source domain),测试数据集被称为目标域(target domain)。迁移学习的核心思想是降低源域和目标域之间的域差异(domain shift),使得在源域上训练的模型可以被推广到目标域。
随着深度学习的发展,基于深度网络和生成对抗网络的迁移学习也被应用于情感脑机接口,使跨被试的情绪识别性能获得了明显的提升。基于Wasserstein 距 离 的 生 成 对 抗 域 适 应 网 络(Wasserstein generative adversarial network domain adaptation,WGANDA)达到了目前 SEED 数据集上跨被试情绪识别的最高准确率87%,相较于传统的方法提升了29%左右[39]。由于在脑机接口中每一个被试都是一个源域,所以常常面临源域数目过多的问题。通过多源域选择算法,可以去除与新被试差异较大的数据,实现在减少计算量的同时避免产生负迁移(negative transfer)[38,43]。
尽管上述迁移学习方法不需要目标域的标签数据,但是仍然需要采集目标域的特征数据,此类算法被称为域适应(domain adaptation)算法。域适应算法的缺点是在实际使用中会导致校准时间过长。另一类迁移学习方法被称为域泛化(domain generalization)算法,它的核心思想是不需要采集目标域数据,而是使用来自多个源域的数据,以实现提取与域无关而与任务相关的特征信息为目标的特征映射。
域泛化算法的优点是可以对未知的目标域数据进行高鲁棒性的预测。在无法获取新被试的数据,或者要面向很多新被试进行预测的情况下,基于域泛化算法的情感脑机接口可以获得较高的精度和较强的泛化能力[44]。但是,域泛化算法由于没有使用任何目标域信息,性能往往低于域适应算法。
最近的一项研究工作尝试寻找域适应与域泛化算法之间的平衡,通过使用少量的目标域数据实现性能的提升。这种算法被称为即插即用域适应算法,能使跨被试的情感模型在 SEED 数据集上只使用45 s左右的校准数据,而获得了85%左右的准确率[45]。
3.6 跨模态情感模型
在情感脑机接口的实际应用中,由于硬件条件的限制,常常会产生模态改变或缺失的情况。一方面,脑电设备价格较为昂贵,并且佩戴与调试等操作难度较高,在家庭环境中配置难度较大。这些问题导致在许多应用场景中可能缺失脑电模态,而只有眼动、视频等模态。另一方面,不同的脑电设备的通道个数和信号质量常常不同,导致训练样本与实际采集的测试数据有差异,使模型的性能大大下降。因此,建立可靠、鲁棒的情感脑机接口的一个重要挑战是如何充分考虑实际使用情况,使模型在模态改变或缺失的情况下也能达到较为令人满意的性能。针对这些问题,一些学者研究了基于异质迁移学习(heterogeneous transfer learning,HTL)的跨模态情感模型[47]。异质迁移学习是针对源域和目标域的特征空间或任务空间不完全相同的场景提出的迁移学习方法[48]。
针对模态缺失的问题,在训练过程中,跨模态情感模型可以综合分析多个模态的信号,提取模态之间的关联特性。在测试阶段,基于部分模态信息进行预测。例如,建立脑电信号与眼动信号的关联,使得在脑电信号难以采集的应用场景中,可以通过异质迁移学习方法单独使用眼动信号对情绪做出评估,保证在模态缺失的情况下,评估性能的下降程度在可接受的范围内,从而提高模型的鲁棒性[47]。
4 多模态情感脑机接口
情绪的变化非常复杂,单一模态信号无法对情绪进行全面客观的度量。因此,对多模态情感脑机接口的研究越来越受到人们的关注。
4.1 多模态生理信号
4.2 眼动信号
4.3 外部行为信号
近年来,随着计算机视觉和语音处理技术的快速发展,研究者可以使用更为丰富和有效的技术手段来分析和处理面部表情、肢体语言、声音、文本等外部行为信号,并从中识别情绪。Cowen A S等人[62]通过深度学习算法研究了来自144个国家的600万个视频。作者从这些视频中发现了面部表情与社交场景的关系,例如婚礼、体育比赛等,这种关联普遍存在于不同文化背景下。这一研究结果为基于外部行为信号的情绪识别提供了进一步的技术支撑。
外部行为信号的优点是比较容易获取,这也促进了基于外部行为信号的情绪识别的广泛应用。但是外部行为信号也存在一定的局限性。情绪是一种内在的心理状态,人可以通过一定外部手段隐藏自己的真实情绪。例如,在一些社交场合通过微笑掩饰自己的消极情绪,这使得单纯依靠外部行为信号进行情绪识别会产生比较大的误差。
4.4 功能性神经成像
脑电信号的一个局限性是空间分辨率比较低。相比而言,基于血氧的脑成像技术(如功能磁共振等)具有较好的空间分辨率,已被广泛用于神经影像学研究,是研究人员探究大脑活动机制的重要工具。因此,在情绪的神经机理研究中,融合脑电与各种大脑成像模态信息可以提供高分辨率的时空神经图像,有助于在产生情感状态时进一步了解大脑机制。最近的一项研究工作发现了功能性近红外光谱技术(functional near-infrared spectroscopy, fNIRS)和脑电信号之间的相关性,并且与单一模态相比,融合fNIRS和脑电信号可以达到更高的情绪识别准确率[63]。
4.5 多模态信号融合
建立多模态情感脑机接口的关键问题是如何将多模态信号进行有效融合,从而实现对情绪的精确识别。常见的多模态融合方法包括:数据层面融合、特征层面融合以及决策层面融合。
5 情感脑机接口的应用
我国和全球的神经疾病和精神疾病的发病率逐年增加,给人类的健康带来重大挑战。例如,世界卫生组织指出,全球有超过2.64亿的抑郁症患者[72],每年给全球经济造成约1万亿美元的负担,是导致全球疾病负担的一个重要因素。
另外,预计到2040年,我国65岁及以上老年人口占总人口的比例将超过 20%。到那时医院护理和家庭养老都需要大量的服务机器人。而服务机器人不像工业生产线上的工业机器人,它们必须与人打交道。因此,这些服务机器人必须具有情感智能。
本节介绍情绪识别脑机接口代表性应用和正在开发的两个情感脑机接口应用系统。
5.1 工作负荷检测
常用的精神负荷评估指标包括任务完成的速度和准确性。但是,这两种指标的获取常常比较滞后,一般需要在任务完成之后才能获得。这使得调控系统无法及时捕捉个人状态的变化,从而无法及时进行反馈。另外,在一些情况下,完成任务的速度和准确性比较难以量化[76]。
5.2 情感障碍疾病的辅助诊断
许多研究表明,前额叶皮层的脑电活动与情感障碍疾病有关。1993年Wheeler R E等人[21]发现,通过静息态 alpha 频段的脑电图功率测量反映出的前额叶激活中的半球不对称性,与情感刺激的效价反应有关。进一步研究发现,这种脑电活动的非对称性是一个稳定的特征,左额叶过度激活是抑郁症的稳定标志。研究人员采用左侧电极 alpha 活动减去右侧电极 alpha 活动获得不对称性评分,发现抑郁自评越严重的被试,不对称性评分越高。这一发现引起了许多人的相继研究,有些研究发现了相同的规律,有些研究却显示两者的关系并不显著。针对这一问题,Thibodeau R 等人[82]系统地对比和总结了不同的实验条件,探究 alpha 频段的不对称性与情感类障碍(抑郁症、焦虑症、抑郁合并焦虑)的关系是否受其他因素的影响。作者发现脑电记录的时间、被试的年龄以及抑郁评价的手段都会对实验结果产生影响。
由于精神障碍疾病的复杂特性,抑郁症也可能存在不同的症状组合,Putnam K M等人[20]探究了脑电与具体的抑郁症的症状的关系。作者通过高密度脑电图采样和多项自评量表方法,研究了与抑郁症相关的两个关键症状,即思维反刍(rumination)和自尊(self-esteem)。分析了6名抑郁症病人和7 名健康对照组的静息态 alpha 频段脑电活动与抑郁症状的关系。症状相关量表每天收集5次,测量7 天。该研究发现,在抑郁症组中,当思维反刍症状更加明显时,双侧前额叶相关脑电活动降低;当自尊水平更高时,常伴随着较低的左侧前额叶活动。而这种对应关系在健康对照组并没有被观察到。该结果表明,抑郁症的特定症状可能与前额叶alpha脑电活动特定模式相关。
此外,相似症状的患者中也可能存在不同的疾病亚型,参考文献[85]探索了通过静息态脑电区分不同的精神疾病亚型的可能性。该研究通过从高密度静息态脑电中溯源重建信号,利用静息态脑电的功能连接模式区分创伤后应激障碍和重度抑郁症两个亚型。
5.3 抑郁症的客观评估系统
目前,抑郁症评估与诊断主要靠临床医生根据患者自述以及自评或他评量表进行。由于量表填写过程比较主观,基于这些信息进行的抑郁症评估存在较大的个人差异,难以实现客观的评估。针对抑郁症客观评估的特点,本文提出了基于多模态情感脑机接口的解决方案和下列情绪交互实验的设计目标。
首先,实验需要有心理学或认知科学理论的支撑,通过设计和开发新的实验方案,反映出与心理学或认知科学实验类似的特性。其次,实验需要有一定的沉浸感、趣味性和交互性。由于抑郁症患者一个常见的表现是兴趣匮乏,增强实验的趣味性和交互性可以在一定程度上帮助抑郁症患者积极参与实验,并顺利完成实验任务,从而提升数据的可靠性和有效性。
本文开发的多模态情感脑机接口系统 LEAF,通过同步采集脑电、眼动、视频、音频和文本等多模态数据,能从多个角度对患者的情绪进行建模,从而提高情绪识别的准确率和可靠性,实现抑郁症客观评估的一些基本功能。
具体地,在问诊阶段,通过增加面部表情识别摄像头、录音设备、场景摄像头以及睡眠状态监测手环等,采集患者的行为信息和生理特征。医生问诊结束后,增加情感交互实验环节。在交互实验中融入对睡眠质量、情绪、注意力等指标的客观评测。实验结合个性化引导、机器人交互、多模态刺激等形式,使其既能诱发患者的情绪,又能让被试快速适应实验环境。
根据量表反映的信息,笔者设计开发的抑郁症客观评估实验主要包括以下内容:睡眠状态评估、情绪评估、注意力评估以及警觉度评估。在实验中同步采集脑电、眼动、视频、语音和文本等多模态数据,用以建立抑郁症评估模型。
5.4 面向难治性抑郁症治疗的闭环神经调控系统
闭环脑机接口主要关注的问题是何时以何种方式进行干预最有效。不同的个体所需的最优干预方案可能不同,通过强化学习,可以根据情感脑机接口的反馈信息自适应地调节干预方式。例如,调节脑深部电刺激的刺激参数,从而达到最优的调控效果。图2 给出了一个面向难治性抑郁症治疗的基于强化学习的闭环神经调控框架。
图2
由于精神障碍在每个患者的大脑中的表现不同,个性化的脑深度刺激存在很多挑战。每个患者的大脑活动和症状对刺激的反应可能非常不同,这使得研究者很难知道刺激对特定患者的效果和影响。来自南加州大学的Shanechi团队开发了一种新方法[96],通过开发动态输入输出模型来预测大脑多个脑区对刺激模式变化的反应。他们发现大脑网络活动受刺激的幅值和频率的调控,预测刺激的实时动态效果可以帮助研究者设计更加精确的闭环神经调控系统。
6 情感脑机接口的机遇与挑战
早在2016年,《科学美国人》就提出了关于未来人类的20个大问题,其中第15个问题是人们能用可穿戴技术探测自己的情绪吗。麻省理工学院罗瑟琳·皮卡回答说:在未来10年,可穿戴设备可以为人们的健康提供个性化的预报。未来 20 年,可穿戴式设备和从其获得的分析数据,能显著降低精神和神经疾病的发病概率。
相对于人类自身仅靠面部表情、语音对话、肢体语言来识别对方的情绪,多模态情感脑机接口系统可以利用更多模态的生理信号。因此,理论上讲,多模态情感脑机接口能更精确、客观地识别人的情绪,从而实现情感智能的研究目标。
6.1 情感脑机接口与通用人工智能
AlphaGo战胜人类围棋顶尖高手,从人工智能的角度,AlphaGo具有强大的逻辑智能,但它并不具有任何情感智能。李世石曾表示跟AlphaGo下棋没有感情上的交流,困难超出想象。这正体现出情感智能的重要性。未来的通用人工智能一定是逻辑智能和情感智能的有机结合,缺一不可。但是,目前无论是学术界还是工业界,还主要侧重于逻辑智能的研究与开发,对情感智能的研究尚处于萌芽阶段。
人工智能追求的终极目标是让机器能像人一样学习、思考和具有情感。根据目前神经科学、认知科学、计算机科学和人工智能的发展水平,要实现像人一样的情感至少需要经历4个阶段[5]。第一阶段,大多数人工智能系统仅具有逻辑智能,而不具备任何情感智能。第二阶段,机器能精确识别人的情绪并进行情感反馈。第三阶段,机器具有自主学习能力并对客观世界有全面的感知和认知。第四阶段,机器具有价值观、意识和创造性,形成自我,具有像人一样的情感,从而具有与人进行自然情感交互的能力。目前人工智能的研究水平正在从第一阶段迈向第二阶段。而在通用人工智能发展过程中,情感脑机接口将发挥重要的作用,因为它是能够使未来机器人精确地识别人的情绪的关键技术。
6.2 情感脑机接口面临的挑战
Shanechi M M[3]对运动脑机接口和情感脑机接口的特点进行了系统的分析和比较,总结了情感脑机接口面临的主要挑战。首先,从脑电信号获取的角度来说,情绪关联着分布式多点皮层网络,并且其职能尚未有明确定义。其次,从行为观测的角度来说,情绪一般按照情绪种类呈现离散化分布,并且情绪的动态变化频率较低。同时,在行为时间上,一种情绪可能持续数分钟至数天或更长。另外,从状态评估的角度来说,情绪评估往往面临的难度更大。常见评估方法是自我评估量表,通常准确性较低。理论上讲,情绪很难找到金标准,原因是每个人实际上都无法准确地定量描述自己的情绪。应用情感脑机接口进行情绪调控,需要充分理解脑刺激的效果,即对电刺激和大脑反应之间的关系进行建模。由于情绪关联着分布式多点皮层网络,建模过程面临更大的挑战。
除了上述提到的挑战,情感脑机接口还有以下尚未解决的问题。
(1)在数据采集方面,目前情感脑机接口的数据集存在较大的局限性。一方面,数据规模相对较小,一般不超过100人次。另一方面,被试比较单一,大部分是大学生。亟须综合考虑年龄、性别、受教育程度等因素,建立更全面、广泛的多模态情感数据集。
(2)在情绪诱发实验方面,情感脑机接口数据的采集主要依靠传统的实验范式,如基于视频、图片的情绪诱发实验。此类实验时间较长、内容单一。另外,目前的情绪实验设定与社交环境是隔离的,被试被动地接受刺激,不能主动地与环境互动。将来,需要通过引入社交互动来改善实验环境,提高情绪诱发的效果。
(3)情感标签被标注为离散的类别,这种方法没有考虑情绪随时间的动态变化。如何在连续的范围内准确地识别情绪,并在较高的时间分辨率下进行情绪类别标注,是需要解决的一个问题。
(4)需要引入更多的传感器模态,研究它们彼此之间的相互作用和互补特性。如何有效地将各种采样率下的不同模态的信号进行有效融合,仍然是一个未解决的问题。
(5)需要考虑实验室环境与实际应用环境的差异。如何将实验室环境下训练的情感模型高效地推广到实际应用环境,也是一个需要继续探索的研究课题。
7 结束语
本文围绕情感脑机接口的研究及应用,对近年来情感脑机接口的相关研究进行了综述。在基础理论方面,介绍了情绪、情绪模型和情绪的神经机理,以及情感脑机接口的基本构成,包括脑电信号的处理、情绪诱发实验的设计、情绪类别的标注以及常用的情绪脑电数据集。结合新的深度学习算法,介绍了基于迁移学习的跨被试和跨模态情感模型的研究进展。在多模态情感机接口方面,介绍了包括脑电、眼动等多模态生理信号,以及视频、音频等外部行为信号的多模态信号融合技术。在应用研究方面,介绍了情感脑机接口在工作负荷检测、情感障碍疾病的辅助治疗领域的应用,重点介绍了情感脑机接口辅助抑郁症的客观评估与治疗的研究进展。最后,列举了情感脑机接口研究需要解决的若干公开问题。
参考文献
脑-机接口:原理与实践
[M].
Brain-computer interfaces:principles and practice
[M].
Brain- computer interfaces:revolutionizing human-computer interaction
[M].[S.l.]:
Ten challenges for EEG-based affective computing
[J]. ,
情感脑-机接口
[M]// .
Affective brain-computer interface
[M]//
Can people feel happy and sad at the same time?
[J]. ,
Neuroimaging of cerebral activations and deactivations associated with hypercapnia and hunger for air
[J]. ,
Classical fear conditioning in functional neuroimaging
[J]. ,
Functional neuroanatomy of emotion:a meta-analysis of emotion activation studies in PET and fMRI
[J]. ,
Imaging human emotions and affective feelings:implications for biological psychiatry
[M].
Facial expressions of emotion states and their neuronal correlates in mice
[J]. ,
面向脑电数据的知识建模和情感识别
[J]. ,
EEG-data-oriented knowledge modeling and emotion recognition
[J].
基于生理信号的情感计算研究综述
[J]. ,
Physiological signals based affective computing:a systematic review
[J].
面向情绪识别的脑电特征研究综述
[J]. ,
A review of EEG features for emotion recognition
[J].
EEG theta power activity reflects workload among army combat drivers:an experimental study
[J]. ,
Estimating workload using EEG spectral power and ERPs in the n-back task
[J]. ,
Depressive symptoms and baseline prefrontal EEG alpha activity:a study utilizing ecological momentary assessment
[J]. ,
Frontal brain asymmetry and emotional reactivity:a biological substrate of affective style
[J]. ,
Investigating critical frequency bands and channels for EEG-based emotion recognition with deep neural networks
[J]. ,
EEG alpha activity reflects attentional demands,and beta activity reflects emotional and cognitive processes
[J]. ,
Differential lateralization for positive and negative emotion in the human brain:EEG spectral analysis
[J]. ,
Wavelet-based emotion recognition system using EEG signal
[J]. ,
Emotion classification using minimal EEG channels and frequency bands
[C]//
Emotion classification based on gamma-band EEG
[C]//
High gamma band EEG closely related to emotion:evidence from functional network
[J]. ,
A dataset of continuous affect annotations and physiological signals for emotion analysis
[J]. ,
Inter-brain EEG feature extraction and analysis for continuous implicit emotion tagging during video watching
[J]. ,
Emotions promote social interaction by synchronizing brain activity across individuals
[J]. ,
DEAP:a database for emotion analysis; using physiological signals
[J]. ,
DREAMER:a database for emotion recognition through EEG and ECG signals from wireless low-cost off-the-shelf devices
[J]. ,
Real-time movie-induced discrete emotion recognition from EEG signals
[J]. ,
A multimodal database for affect recognition and implicit tagging
[J]. ,
Emotion and personality recognition using commercial sensors
[J]. ,
AMIGOS:a dataset for affect,personality and mood research on individuals and groups
[J]. ,
Improving EEG-based emotion classification using conditional transfer learning
[J]. ,
WGAN domain adaptation for EEG-based emotion recognition
[C]//
Personalizing EEG-based affective models with transfer learning
[C]//
A review on transfer learning in EEG signal analysis
[J]. ,
Transfer learning for EEG-based brain-computer interfaces:a review of progresses since 2016
[J]. .
Multisource transfer learning for cross-subject EEG emotion recognition
[J]. ,
Reducing the subject variability of EEG signals with adversarial domain generalization
[C]//
Plug-and-play domain adaptation for cross-subject EEG-based emotion recognition
[C]//
Seizure classification from EEG signals using transfer learning,semi-supervised learning and TSK fuzzy system
[J]. ,
用异质迁移学习构建跨被试脑电情感模型
[J]. ,
Building cross-subject EEG-based affective models using heterogeneous transfer learning
[J].
Heterogeneous transfer learning for image classification
[C]//
Review of eye-related measures of drivers’ mental workload
[J]. ,
EOG-based drowsiness detection using convolutional neural networks
[C]//
A wireless sEMG recording system and its application to muscle fatigue detection
[J]. ,
GSR and blink features for cognitive load classification
[C]//
Assessing pilot workload.Why measure heart rate,HRV and respiration?
[J]. ,
Continuous emotion detection using EEG signals and facial expressions
[C]//
Fusion of facial expressions and EEG for multimodal emotion recognition
[J]. ,
Multi-modal emotion analysis from facial expressions and electroencephalogram
[J]. ,
Multimodal emotion recognition using deep generalized canonical correlation analysis with an attention mechanism
[C]//
Emotionmeter:a multimodal framework for recognizing human emotions
[J]. ,
Combining eye movements and eeg to enhance emotion recognition
[C]//
Is there universal recognition of emotion from facial expression? A review of the cross-cultural studies
[J]. ,
Sixteen facial expressions occur in similar contexts worldwide
[J]. ,
Multimodal affective state assessment using fNIRS+ EEG and spontaneous facial expression
[J]. ,
Multimodal multi-channel on-line speaker diarization using sensor fusion through SVM
[J]. ,
Feature-level fusion approaches based on multimodal EEG data for depression recognition
[J]. ,
Schizophrenia diagnosis using innovative EEG feature-level fusion schemes
[J]. ,
Decision-level fusion of EEG and pupil features for single-trial visual detection analysis
[J]. ,
Multimodal emotion recognition using EEG and eye tracking data
[C]//
Multimodal deep learning
[C]//
Multimodal emotion recognition using multimodal deep learning
[J]. ,
Multimodal learning with deep boltzmann machines
[J]. ,
Global,regional,and national incidence,prevalence,and years lived with disability for 328 diseases and injuries for 195 countries,1990-2016:a systematic analysis for the Global Burden of Disease Study 2016
[J]. ,
Flow theory and research
[M].[S.l.]:
Modeling and predicting mental workload in en route air traffic control:critical review and broader implications
[J]. ,
Autonomic nervous system and subjective ratings of strain in air-traffic control
[J]. ,
EEG correlates of task engagement and mental workload in vigilance,learning,and memory tasks
[J]. ,
Combining and comparing EEG,peripheral physiology and eye-related measures for the assessment of mental workload
[J]. ,
Physiological reflections of mental workload
[J]. ,
Measuring mental workload using physiological measures:a systematic review
[J]. ,
Effects of mental workload on physiological and subjective responses during traffic density monitoring:a field study
[J]. ,
Depression,anxiety,and resting frontal EEG asymmetry:a meta-analytic review
[J]. ,
EEG resting-state large-scale brain network dynamics are related to depressive symptoms
[J]. ,
A case-based reasoning model for depression based on three-electrode EEG data
[J]. ,
Identification of psychiatric disorder subtypes from functional connectivity patterns in resting-state electroencephalography
[J]. ,
A new depression scale designed to be sensitive to change
[J]. ,
Two shorter forms of the CES-D depression symptoms index
[J]. ,
Screening depressed patients in family practice:a rapid technic
[J]. ,
The PHQ‐9:validity of a brief depression severity measure
[J]. ,
The hospital anxiety and depression scale
[J]. ,
Depression and the newcastle scales their relationship to Hamilton’s scale
[J]. ,
Long-term follow-up of bilateral subthalamic deep brain stimulation for refractory tardive dystonia
[J]. ,
Modelling and prediction of the dynamic responses of large-scale brain networks during direct electrical stimulation
[J]. ,
State- dependent responses to intracranial brain stimulation in a patient with depression
[J]. ,
Direct electrical stimulation of lateral orbitofrontal cortex acutely improves mood in individuals with symptoms of depression
[J]. ,
/
〈 | 〉 |