Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 计算机论文 > 正文

EEG 融入自标签的自监督对比学习情感分析方法论文

发布时间:2023-03-08 09:52:51 文章来源:SCI论文网 我要评论














SCI论文(www.lunwensci.com)

  摘 要:基于脑电信号的情绪识别是推断人类内心情绪状态的有效方法。近年来脑电信号的发展主要受标签标注的限制, 如何从无标签脑电数据中学习到稳健的矢量表达是当前研究的重点。本文在自监督模型基础上,将经特征拓扑后的脑电数据作 为输入,在训练过程中融入自标签 Top-K,同时引入注意力机制,使模型获得更好的性能。模型在脑电数据集 SEED 上取得了 78.3% 的分类准确度。

  关键词:EEG,差分熵,自监督对比学习,自标签,注意力机制

  Self-supervised Contrastive Learning Sentiment Analysis Method with EEG Incorporating Self-labeling

  ZAN Mengyuan, WEI Yixin, QIAO Kunyuan

  (Tianjin Normal University, Tianjin 300000)

  【Abstract】: Emotion recognition based on EEG signals is an effective method to infer the emotional state of human beings. In recent years, the development of EEG signals is mainly limited by labels. How to learn robust vector representations from unlabeled EEG data is the focus of current research. Based on the self-supervised model, this paper takes the EEG data after feature topology as input, incorporates the self-label Top-K in the training process, and introduces an attention mechanism to make the model achieve better performance. The model achieved a classification accuracy of 78.3% on the EEG dataset SEED.

  【Key words】: EEG;differential entropy;self-supervised contrast learning;self-labeling;attention mechanism

  0 引言

  生理情感识别是情感计算研究的一个热门领域。脑 电图作为生理信号的一种,通过采集与多重处理获得高 质量的数据,常用的方法是提高脑电图像的分辨率 [1]。 传统的监督学习依赖于大量标签数据,而这需耗费大量 的人力、财力,同时也存在标注偏差。而自监督模型可 以通过分析大量无标签数据和噪声数据的潜在结构,为 下游的分类任务提供稳健的特征表示解决标签问题。但 自监督也存在一定的问题 :由于自监督学习过程中对数 据质量要求较高,且对数据的真实分类是未知的,在判 别正负样本的过程中存在局限性。

\

 

  针对上述问题,本文提出了一种新型自监督对比学习情感分析模型。首先对脑电数据进行了拓扑特征处理提 高数据质量,然后投入自监督模型训练,训练过程中提出 一种自标签功能均衡正负样本的量, 并引入注意力机制 [2] 均衡正负样本对模型的贡献,以提高后续分类的精度。

  本文的主要贡献如下 :

  (1)将特征脑电数据拓扑,提高数据质量。

  (2)提出的训练过程中的自标签 Top-K 方法。

  (3)引入注意力机制,均衡正负样本的贡献。

  1 相关工作

  1.1 脑电信号(EEG)

  脑电图 (EEG) 是一种用于测量大脑电极活动的非侵 入性技术。EEG 的采集是通过记录放置在颅骨上的一系列传感器之间的电压差获得。尽管记录方法简单,但 在采集的过程当中会有诸多噪声和环境因素的干扰导致 采集到的 EEG 信号嘈杂,数据质量较差,难以普及应用。

  1.2 自监督对比学习

  自监督对比学习由两部分组成:(1)辅助任务(Pretext Task)利用无标签数据训练出一个能编码出稳健的矢量 表达的高性能编码器。(2) 下游任务(A Supervised Task) 与监督学习相比, 自监督训练出来的模型并不针 对于某一特定的任务,它所训练出来的辅助任务可以很 好的与各种下游的分类任务相结合,具有很好的泛化性。

  目前通用的主流的辅助任务模型有常见的 SimCLR[3]、 MoCo 等。核心是将无标签的数据进行训练,通过将正 样本拉近,将负样本推远,来实现编码器优化。但在判 别正负样本时判断过于片面,会对模型性能的提高起到 反作用,这也是后续提出 Top-K 自标签的意义所在。

  2 解决负样本局限性的自监督对比学习

  2.1 模型构造

  本文主要有特征脑电拓扑、ResNet、自标签 Top-K、 基于注意力的贡献优化以及为进一步提取特征的 MLP 层,共五个部分,如图 1 所示。

\

 

  本文模型首先将 DE 拓扑脑电数据 [4] 投入自监督模 型,同时训练过程中引入自标签 Top-K 选取出更多正 样本,同时引入注意力机制赋予正样本对更大权重,使 得辅助任务具有更好的性能和更高的鲁棒性。

  2.2 处理流程

  用特征脑电数据 x 与自监督对比模型结合得到表征 zi,zj ,在训练过程中自标签选举出 Top-K 正样本,增大 正样本数量,优化模型学习方向,又进一步加入注意力 机制,增大正样本的权重提高正样本对对模型的影响。

  2.2.1 特征脑电与拓扑数据增强(TP-DE)

  对从电极中得到的原始信号, 我们提取其特征,采用立方插值算法拓扑,如式(1)所示。

\

 

  2.2.2 Encoder+MLP

  由于是无标签下的学习,所以学习到好的表征至关重 要。ResNet 作为一种常用的基础编码器,使用灵活,将 其 作 为 编 码 器 获 得 hi=f(xi)=ResNet(xi),hj=f(xi)=ResNet( xi),这里 hi , hj ∈ Rd 。经 MLP 将特征映射到更高层次的表征空间得到 zi,zj ,其中 zi , zj ∈ Rm 。经实验验证,MLP 的存在很有意义。

\

 

  2.2.3 自标签 Top-K

  对于传统的自监督模型,在正负样本的判别过程存在 局限,在一个 Batch 中,被判为负样本的数据中可能还 存在与锚点属于同一类的样本,这样的误判会对模型的 训练起到反作用。为解决此问题,在这里利用余弦相 似度,经排序选出前 K 的样本,划为锚点的正样本。这 里也可基于其他相似度的衡量标准,余弦相似度表达如 式(2)所示 :

\
\
 

  2.2.4 注意力机制 (Attention)

  注意力机制能提高正样本的表征相似度权重,通 过考虑全局信息,计算得到不同的权重值 α,然后将样 本对的权重与选举输出的 Top-K 进行对应的加权求和,得到更具稳定性的矢量表达,式子如式(7)所示 :
\
 

  3 实验与分析

  3.1 实验数据集

  在本文使用 SEED[5] 数据集验证提出的方法。SEED 数据集包含三种类别情绪。

\
 

  3.2 结果分析

  3.2.1 测试结果

  自监督实验中影响模型的参数因素有很多。经实验 分析,数据增强的类型、学习率等参数并不会对模型造 成大的影响,而合适 batch_size 和训练的 Epoch 会对 模型的性能造成重要影响,经实验,我们从中选取出最 优的实验数据 batch_size 为 128.Epoch 为 50 时, 可 得到最好性能。

  通过下游监督任务分类的精度可以来验证模型的性能,实验中,所有模型都采用相同编码器,经相同处理 的数据投入,相较于传统的 MoCo 的结果 69.4%,本 模型高出约八个百分点,可达到 78.3% 的分类精确度, 且随着后续投入微调标签的精度仍有提升的潜力。并且 进行了消融实验,验证了加入 Top-K 与注意力机制对 模型性能提升的有效性。

  3.2.2 超参数分析

  经分析,也理应存在一个最适 K 值,使模型达到最 优,经实验,得出最优 Top-K 为 5.

  4 结语

  本文模型通过自监督 Top-K 注意力机制实现通过 表征相似度来对未标记的数据进行分类,解决了正负样 本的误判,和样本对模型贡献不均衡问题,较目前的在 生理信号识别的主流方法上有所创新,达到了较高的精 确度,经消融实验与超参数分析,证明了该模型结构的 合理性和可行性。

  参考文献

  [1] 权学良,曾志刚,蒋建华,等.基于生理信号的情感计算研究综 述[J]. 自动化学报,2021.47(8):1769-1784.

  [2] VASWANI A,SHAZEER N,PARMAR N,et al.Attention Is All You Need[J].ArXiv,2017.30(1):5998-6008.

  [3] CHEN T,KORNBLITH S,SWERSKY K,et al.Big Self- supervised Models are Strong Semi-supervised Learners[J]. Arxiv, 2020.33(1):22243-22255.

  [4] HWANG S,HONG K,SON G,et al.Learning CNN Features from DE Features for EEG-based Emotion Recognition[J]. Pattern Analysis and Applications,2020.23(3):1323-1335.

  [5] ZHENG W L,LU B L.Investigating Critical Frequency Bands and Channels for EEG-based Emotion Recognition with Deep Neural Networks[J].IEEE Transactions on Autonomous Mental Development,2015.7(3):162-175.

关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/52608.html

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml