Abstract

在脑-机接口(BCI)中,对用户大脑活动的测量分为计算机命令。在基于脑电的脑机接口系统中,分类现象的起源通常被认为是空间上局限于皮层体积,而混合在脑电中。我们研究是否可以通过重建体积中的源活动来获得更精确的BCI。接近。我们将生理驱动的源重构与统计机器学习获得的数据驱动表示进行了对比。我们在一个常见的线性字典框架中解释了这些方法,并回顾了获取字典参数的不同方法。我们考虑了信源重构对脑机接口分类中的一些主要困难的影响,即信息丢失、特征选择和脑电信号的非平稳性。主要结果。我们的分析表明,这两种方法主要在参数估计上有所不同。因此,如果不使用机器学习或在其产生的最佳参数较少的情况下,可以期望生理源重建提高BCI的准确性。我们认为,表面脑电分类所考虑的困难仍然存在于重构体中,数据驱动技术仍然是必要的。最后,我们提出了一些比较方法的建议。意义。本文阐述了脑电信号源重构与基于机器学习的脑电数据表示方法之间的关系。所提供的分析和讨论将有助于理解、应用、比较和改进这些技术。

1.Introduction

大脑-计算机接口(BCI)通过对用户大脑活动的测量进行分类并使用预测来控制应用程序。基于脑电图(EEG)的脑机接口因其信息传输率低而受到严重挑战[1,2]。其中一个可能的原因是由于脑电图信号的产生。在用表面脑电图测量电位之前,大脑的电活动已经通过神经组织、颅骨和头皮传播。这种体积传导混合、模糊并可能抵消体积中不同电源的贡献[3]。体积传导效应可以部分解释建立可用脑机接口系统的困难,因为获得的脑电信号是不同来源和噪声的混合物。

在典型的脑机接口研究中,使用机器学习技术来估计信号处理参数和分类器,这些参数使用来自用户的EEG数据[2,4,5]。这些方法在信号受到体积传导的影响后对其进行操作,并且需要处理数据中可能引入的困难。信号的可分辨部分来自一个单一的大脑区域,这些方法需要从脑电混合物中隐式地发现和提取该部分。为此,他们需要训练数据,有时他们只能找到次优的解决方案[6]。这些属性是有问题的,因为所需的数据收集(或校准)步骤给用户带来了不便,但由此产生的精度可能仍然很低。如果我们使用生理学知识和电磁建模来尝试显式地反转体传导过程,我们能需要更少的数据或提高BCI的准确性吗?随后,将使用卷中重构的信号源继续进行后续分类(例如[7])。在这里,我们将这种使用重构源的分类方法称为体积(源重构,逆)方法,与同样对EEG信号进行分类的表面方法不同,但没有明确尝试根据几何体模型恢复源。通常,容积法依赖于生理头部模型,而表面法则倾向于基于测量的统计建模。

可以预期源重构可以减轻体积传导效应,例如源的混合[8-10]。此外,它也很吸引人,因为体积表示法中的数据相对于已知的大脑结构更容易解释[11]。此外,它允许对分类器设置生理约束。例如,可以将解决方案限制在特定的感兴趣区域(ROI,例如[12]),这可能是有用的,因为众所周知,诸如运动图像[13,14]和稳态视觉诱发电位(SSVEPs,[15] )依赖于从被认为局限于特定解剖和功能区域的皮质源检测模式。将解决方案限制在相关区域可能会防止无关来源干扰分类。

大量的研究工作已经进入了经验脑电图研究中,在脑机接口分类管道中使用了逆模型[7,12,16-31]。尽管进行了这项工作,体积重建比表面法能获得更好的分类精度的证据仍然没有定论。尽管一些实证研究声称体积法具有优势[7,21,24,25,30,31],但其他报告显示的精确度与表面法得出的精度相差不大[12,18,23,26,28]。此外,随着时间的推移,一些研究小组已经改变了他们的观点,例如,Goel等人[25]关于体积法的最初支持性主张后来被一个更加谨慎的声明所取代[26]。目前作者所知的源重构并没有数学证明可以提高分类精度。

许多实证研究的一个中心问题是,报告的结果不能最终归因于来源重建。在许多研究中,所提出的体积法并没有与通过机器学习优化参数的等效结构曲面法进行比较,而是与一种更简单的方法进行比较,或者根本没有进行比较[7,18,24,31]。这有效地为比较插入了结构性偏差。一般来说,表面法和体积法之间比较的公平性可能会受到质疑,以及缺乏独立的确认研究(如在[29]中观察到的)。 在这里,我们采取不同的方法,而不是提出另一项实证研究。我们从理论上更深入地研究了表面解和体积解之间的关系。特别地,我们将解释源重构和在BCI中使用统计估计的表面空间滤波器都是获得数据的替代线性表示的方法。我们讨论了各种相关的方法及其预期性质。最后,我们考虑了在BCI分类中,当问题被考虑到体积而不是表面时,会发生什么。 论文的其余部分安排如下。在第2节和第3节中,我们分别简要介绍了信源重建和BCI。在第4节中,我们将通过使用线性表示来解释两者之间的关系。在第5节中,我们研究了获得线性表示的不同方法的预期性质。然后,我们在第6节继续讨论卷中的表示如何影响BCI中的几个重要挑战。在第7节中,我们描述了在比较基于体积和曲面的方法时应记住的注意事项。我们在第8节中提出了一些未来的工作建议,最后在第9节中提出了我们的结论。

2. Source reconstruction

体积传导将脑电测量的体-面电位中的电活动传播。重建震源的标准方法是建立体积传导模型(正演问题),然后根据模型找到解释观测结果的震源活动。这等于解决了一个反问题。让我们简单地描述一下这两个问题。

2.1 The forward problem

脑电前向问题涉及到计算脑电测量值给定的来源在体积。线性叠加模型通常被认为是一种解,可以从电磁学中推导出来[3,8,32]。模型可以表述如下[8-10],
其中样本x∈包含从n个电极测得的电位,s∈代表m源振幅(通常为m >> n) ,A∈是用户特定的leadfield(增益)矩阵,t是采样时间2。leadfield矩阵编码从体源映射到表面电位的体积传导模型。例如,矩阵取决于解剖学和解剖学建模方式、源和电极的数量及其位置、每个源的自由度和测量单位。矩阵A本身对于源位置和方向是非线性的[8]。但是,如果源的位置和方向已经修好了,方程(1)的正问题可以看作是线性的。在这里,我们使用一个共同的假设,A是一个数值,固定的矩阵,从生理学上为一个选定的源和电极布局。s的索引对应于所用头部模型三维体积中的前缀源位置。有关leadfield构造的详细信息,请参见示例[8,32]。前向方程(1)可以自然地推广到多个测量(如[8,10,33]),我们得到
其中矩阵X∈包含l个后向多维曲面样本x(t),S∈表示源s(t)的对应矩阵。如果我们假设A是一个很好的容积传导模型,这就意味着脑电信号处理的几个困难,因为它试图推断潜在的容积活动。首先,由于电位源的数量m大大超过了可用电极的数量n,矩阵A通常不是正方形的,参见示例[10]。在基于逆的脑机接口研究中,m/n的比值通常在20到100之间,见示例[24,28,30]。因此,许多不同的向量s可以产生相同的测量x(加上噪声)。相关的反演问题称为不适定。矩阵A也是典型的病态[9,10],即矩阵的奇异值迅速衰减。这可能是因为附近的电极在基体中有几乎共线的投影,表明它们的体积传导相似。病态矩阵A对不同源空间方向的标度非常不同。如果是矩阵A的第i个奇异值,我们从线性代数中知道,对于矩阵A的相应的左、右奇异向量=。因此,给定奇异向量的正交性,构造s=用标量,我们得到x=As==。换言之,leadfield通过其奇异值来缩放每个分量。很难将强阻尼震源方向(小)上的活动与测量噪声区分开来。相反地,如果方程(1)完全满足每个后续样本,即使实际源活动变化很小,x中的小测量噪声甚至舍入误差可能需要对源估计值进行较大的更改。在这个意义上,病态矩阵A可以被认为是不稳定的。

2.2 The inverse problem

在反问题中,任务是恢复给定测量值的源。解的非唯一性和正演模型的病态性阻止了方程(1)的简单反演。标准逆不能作为非平方项使用,奇异值快速衰减会导致伪逆解被噪声控制。这些困难可以通过正则化解来缓解[10,34]。正则化的源重构可以作为一个优化问题(如[35]),
图片说明 >= 0和 分别是数据和正则化损失函数,具有标量 控制它们的相对重要性。损失函数定义了每个候选的代价,重建问题的解决方案是ˆS。直观地说,数据损失用于惩罚偏离方程(2)的解,而正则化损失试图惩罚不太可能的解决方案,预期是错误的,例如,由于噪声。例如,由于leadfield的奇异值衰减,表示测量噪声可能需要S中的大系数。这样的解决方案可以通过给它们分配一个高成本的正则化损失来避免,并可能在数据丢失增加的情况下进行权衡。 在上述定义中,正则化损失可被视为先验。通过适当选择函数形式,损失函数可以对应特定概率分布的观测似然项和先验项。例如,如果l=1(即单样本逆),则选择二次损失函数并求解方程(3)相当于假设高斯分布[36],并且等于众所周知的最小范数算法。也可以看作是Tikhonov正则化[10]。如果选择的损失函数存在概率解释,则优化可以看作是概率推理中的最大似然参数估计。关于反问题中正则化的广泛处理,参见例如[37]。 正则化声源重构问题的解可以通过对应于不同假设和损失函数的各种算法来估计。其中包括最小范数(MN,[38])、加权最小范数(WMN,例如[39])、拉普拉斯加权最小范数(LWMN,[40])算法以及其他[10]。算法的最佳选择可能取决于数据和重建的用途[9,35]。 对于许多经典算法,解可以通过测量值的线性变换来获得,即 对于从A导出的一些矩阵W,例如算法MN、WMN和LWMN就是这种情况(参见示例[10])。有趣的是,上述算法不需要数据X来估计变换W的系数。然而,EEG数据可以用来为正则化参数λ选择合适的值。 还有一些损失函数导致的解不是通过测量值的线性变换得到的。例如,在方程(3)中使用l1范数类正则化表示对稀疏解的偏好。解决相应的优化问题可能需要迭代方法[41]。其他一些著名的非线性逆算法,如FOCUSS[39]和sLoreta[42]使用方程(4)等线性变换来提供进一步细化的初始解。

3. BCIs

基于脑电的脑机接口系统(BCIs)不是以恢复体积源为目标,而是试图预测观察到的试验X是哪一类心理活动的结果。形式上,我们可以指定一个决策函数 对于k类分类,其中Θ是函数的参数。如果找到一个决策函数,它能准确地将不同类别的短测试片段进行分类,并将其推广到以前看不到的测试中,则可以获得较高的BCI比特率。用户通过在已识别的心理活动之间交替来控制最终应用程序。 原则上,决策函数的所有参数Θ可以通过机器学习使用训练数据进行联合估计。为了获得数据,用户被指示重复执行不同类别的心理任务(例如想象左手移动、想象右手移动……)。然后将每个试验的脑电图记录与相应的类别标签相关联,形成训练集。 对于复杂的非线性函数,参数估计可能很困难[6]。在BCIs中,总体决策函数fΘ通常分阶段构造为,其中g是分类器,h是特征提取器,两者都具有指定或估计的特定参数。特征提取函数h通常针对所讨论的BCI类型而定制,它可以执行一个或多个变换,包括线性时间滤波、线性空间滤波、随时间平均和非线性变换等。然后,在特征可用的情况下,使用现成的监督学习方法,如线性判别分析或支持向量机来估计分类器g[2,4,5]的参数。 在本论文的范围内,我们考虑使用方程(3)或(4)获得的特征ˆ。如果用一个带体积解释的leadfield来求解这两个方程,我们有一个体积BCI方法。否则,我们认为它是表面BCI。后一个方程通常用于表面BCI中,直接将空间滤波器指定为W的行。这种滤波器有助于在BCI中达到更高的分类精度(例如[15,43–45])。例如,在运动图像中,当定位在运动皮层上方的电极上时,空间拉普拉斯滤波器具有增强特征的效果[43]。类似地,在P300[46]和SSVEP范例[15]中,可以估计空间滤波器,以提取信号的可辨别方面并从中丢弃不相关的变化。 最后,在分类之前,ˆS中的表示可能会经历其他处理和非线性,这取决于BCI的类型。例如,在不进行非线性特征变换的情况下,可以检测到锁相P300模式[46],而运动图像使用平方变换来计算光谱功率(例如[13])。

4.Linear representations

用方程(1)的线性叠加模型表示数据是BCI中体积法和表面法的共同点。由于线性生成模型,我们谈到线性表示。在实际应用中,由于噪声、矩阵A和系数ˆS的选择,方程可能只能近似成立。求解给定X的方程(2)称为字典学习或表示学习[47],而方程(3)是指定此目标的一种方法。

对于源代码重建,以前已经建立了与字典方法的连接(例如在[33])。通过求解方程(3)得到的相应表示式ˆS,可以将体积传导的正演模型A视为表示每个试验X的基础或字典。列构成空间曲面模板的字典。矩阵ˆS由所表示的样本ˆS组成。ˆS的每个系数加权一个线性模板,参与用等式(1)表示相应的x。这一点很容易看出,通过重新排序方程中的和,使样本x由a的加权列的线性和生成,每一个都乘以来自ˆs的单个源特定标量系数。如果字典模板的数量超过观测数据的维数(m>n),就像脑电图正演模型的情况一样,字典被称为过完备[33,47],尽管方程(1)中对应的方程组是欠确定的。这是因为从表示度量的角度来看,一个过完备字典允许用许多不同的方法来表示每个x。首选的表示可以由优先级选择。

为了证明BCI中使用的空间变换也存在线性叠加模型,我们可以从方程(4)开始观察到,其中是W的伪逆。如果我们另外假设W具有秩n,则可以使方程精确。表示A=,我们得到了方程(1),即正演模型。因此,我们可以将通过空间滤波器获得的ˆ解释为对由混合以获得测量值X的抽象源活动的试验。尽管我们在这里说明了一些正向模型隐式编码在矩阵W中,但BCI[48–50]的范围内也提出了模型显式的表面方法。

5. Finding representations for BCI

在BCI中使用基于线性表示的特征需要指定如何获得S。为此,有各种各样的方法,而依赖源重建只是其中之一。一些其他技术也估计字典A。如果结果可以通过等式(4)实现,则只需通过简单的乘法来优化W。在下面我们将讨论寻找表示的各种方法,以及我们可以从中得到什么样的属性。我们选择了根据字典A的来源(或者相应的转换W,如果有的话)对不同的方法进行分类。

注意,估算A系数的技术细节不在当前工作范围内。可以说,这项任务主要是通过非线性技术来解决的,不管A是来自解剖学还是从数据中估计出来的。建议读者参考参考出版物了解具体方法的细节。

5.1. Case 1—Dictionaries from filter design

找到这种表示的一种方法是对信号产生进行假设,然后设计在满足这些假设时工作最佳的滤波器。例如,可以假设大脑表面的放射状的电源是感兴趣的,随后可以获得空间表面拉普拉斯滤波器来增强这些源。这种技术有时被称为头皮电流密度(SCD)[3,51,52]。这些空间滤波器可以编码在一个矩阵W中,矩阵的每一行包含一个位于不同头皮位置的滤波器。这样的过滤器不适合任何特定用户或脑机接口任务的特点,也不明确定位皮质源。然而,它们可以减轻体积传导效应(例如[52]),并被经典地用于改善运动图像BCI[43]。表达式由式(4)得到,取滤波器矩阵的伪逆可得到相应的字典。这种方法在图像编码中具有明显的并行性,可以选择一组预定义的基函数(如小波)作为字典来表示数据[47]。

5.2. Case 2—Leadfield as a dictionary

如果我们对用户的解剖学和体积传导的物理有了更多的了解,这些都可以被编码在leadfield 中。基于源重构的BCI的研究通常在leadfield参数化和所使用的逆算法(priors)上有所不同。将leadfield指定为一个固定的参数也可以被认为是一个非常重要的优先事项:指定EEG信号应该用的模板是一个硬约束。求解方程(3)提供了重建源的表示。对于某些算法,解可能具有方程(4)的形式(见第2.2节)。 如果源重构目标可以通过从生理模型a导出的线性变换W来求解,则矩阵W的行是空间滤波器,每行对应于恢复在头部模型中几何定位的特定源。为了恢复源,这些投影执行跨表面电极测量的空间积分,可能再次类似于不同的局部空间拉普拉斯变换[3]。反变换使用来自体积传导模型A的信息,但结果没有针对任何特定的BCI任务进行优化。由于来源通常密集地分布在体积或其子集(如皮层),如果可用于鉴别的信息散布在不同来源的大区域,则必须在源重构后以某种方式将该区域挑出并进行整合。源重建没有执行特定于任务的体积集成或特征选择。为了解决这些问题,许多研究最终使用记录的、标记的EEG数据和统计技术来寻找合适的整合变换和分类器,即使在使用源重构的情况下(例如[7,22-24,26,28,31])。 在使用信源重构进行BCI时,一个重要的考虑因素是,并非所有的逆方法都能保持信号的时间结构[53]。由于主要的脑机接口范式(运动图像、P300和SSVEP)是基于检测EEG中的时空模式的,因此最好使用这种保留时间结构的逆方法。

5.3. Case 3—Dictionary is learned

如果我们想对信号进行分解,但又不能访问生理模型,那么我们就有一个盲源分离问题(例如[54])。在盲源分离中,通常假设我们知道混合变换的函数类(如线性矩阵),但不知道它的参数值。然后根据数据估计这些值。对于线性表示,使用类似方程(3)的目标函数,其区别在于在这种情况下字典A也被估计。可以为矩阵A指定一个损失项或硬约束,例如优选矩阵的正交性或小范数。同样,使用ˆS上的先验知识来指导优化,使其对训练数据具有期望的性质,例如稀疏性或非高斯性[54]。这类方法的例子包括诸如主成分分析(PCA)[54],独立成分分析(ICA)[54]和各种字典学习技术[47,48,50]等著名的投影追踪和无监督学习算法。 如果所使用的技术以等式(4)的形式提供解决方案,通常会返回两个矩阵, 的列对应于空间模板字典,,行包含提取相应特征权重的空间过滤器。应该注意的是,在这种情况下,获得的表示可以与皮质解剖或局部来源没有明确的联系。然而,统计方法可能会隐含地发现与生理局部来源相对应的表示[55-57],这表明从数据中提取有生理意义的方面或减轻体积传导效应并不一定需要手动将明确的生理学知识插入到处理管道。 与源重构发现的试图重建每个独立源的表示不同,如果由数据和优化目标函数决定,则从无监督方法获得的表示可以在表面和在体积中进行隐式积分。例如,如果该方法依赖于方程(4)的计算,则估计的变换W将通过线性混合不同的体源估计来隐式地进行体积积分,如果这样可以提高目标函数的值。举一个更具体的例子,如果一个大脑区域的电活动独立于其他区域,那么ICA应该尝试将这个区域的来源组合起来,并将它们作为一个或多个独立的组成部分与其他活动分开(例如[58])。 无监督方法可以用来获得欠完备、双主客体和过完备词典及其相应的表示。如果所使用的假设是有效的并且与数据兼容,那么原则上这些方法可以找到有意义的表示。无监督的方法将参数拟合到用户的EEG中,但它们并不适用明确尝试调整表征,以区分脑机接口中的心理任务。
图片说明

5.4. Case 4—Dictionary is learned using labels

字典也可以根据BCI的既定实践针对特定的BCI任务进行优化[4]。除了用标签数据拟合分类器外,所用的表示本身也进行了优化,使数据更易于分类。虽然表示法和分类器大部分仍然是单独优化的,甚至是顺序优化,但这可以看作是从数据中联合估计所有决策函数参数Θ的一个步骤。与我们之前描述的无监督技术不同,这里使用试验标签和脑电图数据来定义优化目标中的优先级。 脑机接口中用于表征学习的监督技术有:运动图像的通用空间模式(CSP)[44],P300的xDAWN[45]。同样,作为结果,这些方法通常返回一个线性变换W和一个相应的字典a。也存在使用迭代技术来寻找表示的方法,例如判别字典学习(DDL)[49]。使用监督学习发现的词典通常是严重欠完备的:少量的基函数比使用更多的基函数可以获得更好的分类精度[44,45,49]。这可能是因为相应的投影在曲面上显式地执行积分,在体积中隐式地执行积分,只试图提取数据的相关部分。回想一下,BCI分类最终将每个试验X映射到k类分类的log2(k)位。对于BCI,这种降维可以在表示阶段开始,因为不需要表示X中对分类器g不有用的部分。在表示中具有不相关的维数可能会增加过度拟合分类器的风险[6]。 使用统计、数据驱动方法的一个代价是,学习一个能够很好地推广到新的、看不见的数据的表示和分类器,可能需要大量的训练数据[59]。其他各种各样的问题也会影响到这项努力。我们在表1中列出了一些可能的困难。进一步的讨论可以在统计学习的标准教科书中找到(例如[6])。

5.5. Case 5—Combination approaches

前面的情况1和2以固定线性变换或字典的形式使用先验知识。案例3和案例4是更多的是数据驱动,因为字典是根据数据来估计的。也可以考虑不同的组合。特别是,使用一种称为波束形成器的技术(例如[18,21,23,28])提出了结合生理导联场和BCI试验标记信息的方法。这些方法通常估计突出来自特定体积源的信息的投影W,同时抑制来自其他地方的信息,使得这些方法除了进行空间积分外,还可以进行体积积分。可以对波束形成器进行优化,以区分不同的体积源或区域,但它们也可以与类似CSP的目标相结合,以找到提取与不同类别相关的部分EEG信号的投影[18,21]。
图片说明

5.6 Summary

我们在表2中总结了案例2-4的一些典型特性。这两种方法的主要区别在于词典的来源以及脑电数据和试验标签对参数的影响程度。在其他方面,这些方法更相似,例如,只要有参数要拟合,就可以考虑正则化。然而,如果没有生理学模型,生理学的先验知识可能很难确定。

6. As above, so below

我们现在要说明的是,源重构可能不会使BCI分类问题变得微不足道。我们考虑的是,当使用基于生理学的leadfield求解方程(3)而不为分类目的优化表示时,体积重建如何影响分类问题。这与前面第5.2节相对应。特别地,我们将讨论通过源重构进行信息恢复、与体感兴趣区域相关的特征选择和集成问题,以及EEG信号产生的非平稳性。

6.1 What is not there can be difficult to restore

脑机接口脑电试验的分类受体积传导效应的影响,体积传导会导致传播过程中的电活动模糊和取消[3]。这反映在leadfield模型A的属性中。前向变换既可以完全丢失信息,也可以抑制信息,如我们在第2.1节中所述。从数学上讲,源活动的不同配置映射到相同的测量值x(加上随机噪声),并且体积空间中的一些向量具有非常弱的投影,很难从x中的噪声中分离出来。 尽管重建源可能会减轻体积传导效应,但应强调的是,源重建(或测量的任何其他确定性变换)无法恢复最初不在源中的此类信息,体积传导丢失的信息仍将丢失。然而,它可能会得到补偿与事先的信念。让我们来看看这两种说法。 首先,在某些情况下,原始源活动本身很难分类。运动图像研究表明,某些用户无法获得高于随机猜测精度的分类性能,而且一般来说,通过训练用户,可以提高分类精度[1]。运动表象研究中的使用者通常会在不同的时间里练习这些表象(例如[13,14,43])。除非假设容积传导和随后的前向模型A随想象训练而改变,否则我们可以说训练效果发生在原始源活动的性质上,使得产生的EEG更易于分类。如果用户没有在真实的数据源中生成可辨别的活动,那么重构这些数据源不应该对BCI有所帮助。 第二,如果我们再次假设A是一个精确的体积传导模型,一个简单的论点表明它可能会导致不可撤销的信息损失。我们从线性代数中知道向量的存在使得,因为A有一个维数为m−n的空空间。我们现在可以从这些向量的任意线性组合中构造矩阵的每一列,并将信息编码到求和权重中,结果为。现在考虑+。所以 ,因此如果编码的信息独立于,该信息无法从X中恢复。然而,公式(3)中的正则化损失等先验信息有助于对缺失信息做出假设,因为先验可以沿着A的零空间转换解,而这种转换对于数据丢失项是不可见的。然而,受先验知识影响的解决方案不一定是原始方案:插入的信息等于插入的假设。例如,选择具有最小范数的解ˆS决不能证明最小范数配置导致测量与噪声一起产生。 如果无法明确地恢复丢失的信息,则可以询问是否仍可以使潜在的信息丢失更小。一种可能的方法是增加电极的数量。众所周知,密集的电极覆盖可以改善源定位[60,61],从而提供更多关于源活动的信息。然而,目前还不清楚这对于BCI中分类的现象有多有用。经验证据表明,当添加更多电极后,表面BCI通常不会显著改善。相反,人们经常观察到,少量放置良好的电极比较大的电极组(例如在运动图像[62]中)效果更好,这可能是由于过度拟合所用统计模型的可能性增加。更普遍地说,Graimann等人在他们的BCI介绍中说,“大多数小组都试图最小化电极的数量,以减少设置时间和麻烦”[63]。目前尚不清楚所使用的信号处理技术的局限性是否妨碍了从大量电极中获益,或者如果在某一点之后,附加电极仅恢复与BCI相关的少量附加信息。如果附近电极的体积传导非常相似,则可能是后者。

6.2 Where is my region of interest?

与增加鉴别信息的数量不同,源重构的一个更合理的好处是,它允许对所用信号处理进行更直观的解释(例如,允许更少的“黑匣子”BCI[11])。这是因为体积中的信号成分具有局部解释,可以将其可视化并与体积中其他成像技术的结果以及神经生理学知识进行对比(例如[7,12])。随后,这些知识可以用来降低数据的复杂性。 例如,以前的研究结果可以用来选择一个与被分类的心理活动相对应的感兴趣区域,并将其他来源的活动排除在考虑范围之外(例如[7])。这是在贝叶斯建模中设置优先权的一种方法(参见示例[6]),即偏向于进一步的建模和分类,以偏好某些解释而不是其他解释。有了投资回报率优先权,一些来源就完全排除在进一步考虑之外3。 卷中ROI的设置非常重要。首先,对于已建立的范式,可以有一个合理的事先猜测。关于ROI的形状、范围和位置的研究。例如,在运动想象中,右手运动的动觉想象会影响运动皮层对侧的电活动[64]。但是对于新的范式,ROI在很大程度上是未知的,并且可能由遥远的皮质区域构成[24]。第二,虽然震源m的总数通常很大,但重建的有效分辨率通常较低[8]。重建的源活动与附近其它源的活动相融合。这种在体积中无意的混合源活动可以被视为重构源之间的串扰或点扩散[65],有时称为源泄漏[5]。这一现象如图1所示。数字如下。一个单一的偶极源被设置为单位值在所有3个方向(可视化为一个体素)。其他来源被设为零。该源向量用leadfield a投影到曲面上,然后用线性最小范数解进行重构。leadfield是从LORETA-KEY软件获得的(如[22])。该模型以三个同心球体为基础,共有2394个源,每个源有3个自由度,它们的位置限制在皮质灰质上,还有60个电极。在这些条件下,原激活源在MN重构中的强度并不最高。回收体积中的非零孔径(“泄漏”)比单个偶极子覆盖的面积要大得多。这种模糊效果反映了前向变换丢失的信息。模糊的形状和程度以及可能的误定位取决于活动偶极子的位置和激活方向、特定A的性质以及用于重建的约束条件。在我们的例子中,当偶极子的位置和激活方向改变时,源泄漏仍然存在,而对于深源来说,泄漏变得更严重。当然,在正常的大脑操作中,许多不同的皮层区域同时活跃,由此产生的电活动可能在体积传导过程中被抵消和干扰,使得精确重建更具挑战性(未显示)。源泄漏的后果是重建体中的roi可能需要调整以考虑泄漏效应。 因此,最佳ROI可能不为人所知,它可能是大的或断开的,并且源重建可以将活动扩展到重建体积中比预期更大的区域。如果ROI大于单个源,BCI管道必须指定如何组合这些重构的源来进行预测。 一般来说,在不查看数据的情况下强制执行严格的ROI会使某些信息在ROI之外被重构,从而无法用于分类。也许正因为如此,数据驱动的统计技术在实践中经常被用来回答投资回报率的选择问题。经典的机器学习方法是在重建的卷中进行特征选择[22]。也可以通过统计特征选择缩小手动选择的ROI[30]。有趣的是,有时ROI的选择是在应用逆变换之前对表面EEG数据进行有效的选择[18,31],这表明特征选择问题在高维体积中可能比在表面上更困难。Besserve等人使用整个体积而不是选择ROI,让支持向量机进行隐式特征选择[24]。 空间区域的选择并不是ROI需要考虑的唯一意义。ROI也可以是时间的或光谱的。例如,在P300中,需要通过反复试验(闪光)来学习和检测短时间模式[46],这表明相关体积ROI是一个具有某些先验未知空间孔径的时间段。对于运动图像,分类的最佳光谱功率带可能取决于用户[13,21,24]。即使使用基于体积的BCI,光谱特征选择问题最终还是通过统计方法(如[7,31])来解决。

6.3. Nonstationarity of EEG

在前面的章节中,我们已经考虑了在信号的生成过程是稳定的情况下可能已经出现的困难,但可能因用户而异。不幸的是,单个用户的生成属性在短时间和长时间内都会发生变化[11,66,67]。这些变化可能是由于疲劳、警觉、注意力、适应能力、可塑性、疾病等。在实践中,即使是短时间内的变化也会导致BCI中分类精度的下降,界面必须适应[66,67]。因此,通常使用从相关用户获得的新训练数据来估计每个BCI会话的新决策函数参数。 时间变化现象在机器学习中称为概念漂移,在统计学中称为非平稳性。因此,要么决策函数必须对这种变化保持不变,要么决策函数的最佳参数化可能需要随着时间的推移而改变,以考虑体积信号生成的变化。如果这些变化涉及产生辨别模式的大脑区域,那么源代码重建似乎不太可能避免对自适应模型的要求,只是这次是在体积上。另一方面,如果信号改变非相关区域或子空间,利用感兴趣区域重建源可以消除非平稳现象。然而,在这种情况下,适当拟合的统计模型也应该忽略线性子空间。 表面测量中观察到的非平稳性可归因于体积的非平稳性,除非测量设备向信号中添加非平稳分量。这是因为,如果假设体积传导是不变化的,并且用固定的a来适当地建模,它就不会导致非平稳性,因此非平稳性必须来自于生成源活动s的过程,如果这种非平稳性干扰了分类,则需要在卷中加以解决。表面方法自然也面临同样的挑战。

7. Comparing volume and surface BCIs

很难将经验结果归结为特定的方法。基于我们的讨论,在BCI中体积和曲面方法的公平比较应该保持信号处理管道的一致性,除非线性表示的参数化。这种做法有时会被遵循[21,30],但不幸的是并不总是[7,18,31]。有时可以半途而废。例如,Besserve等人[24]在一些伪影清理后,将变换W(x−E[x])用于体积和曲面方法。这里E[x]表示空间平均值,有时称为共同平均参考值。然而,对于曲面方法,它们强制W是一个恒等变换[24]。这样,曲面方法就可以避免——甚至在谱带功率计算的非线性和不可逆变换完成之前,在空间上或体积中隐式地进行局部化积分。在这种情况下,体积和曲面决策函数不再是同一函数类的成员。表面方法被迫在一个关于X的函数空间中工作,这种结构偏差可能解释了体积法的优势。 由于正演模型是用来重建震源的,因此体积法获得的精度可能会受到正演模型质量的影响。许多批量BCI解决方案使用球形、现成的leadfield模型[12、18、21、28]。其他研究使用了普通的大脑模型[30,31],少数研究依赖于用户特定的大脑模型[7,23,24]。一般来说,在源定位中,改进前向模型A的效果是众所周知的(例如[9,60]),但是在BCI环境下,除了Besserve等人[24]的研究外,很少有人对前向模型进行比较,他们发现提高体积分辨率可以提高信息传递率。有些论文认为这样的好处是理所当然的[18]。在同一管道中同时使用生理模型和统计模型(例如[18,24,30,31]),会混淆正向模型A质量的影响。如果曲面的可分辨信息仍保留在ˆS中,则通过体积中的统计方法可以补偿非最佳正向变换的影响。我们可以在线性变换中说明这一点。如果AˆS≈X(由于噪音而近似),则WAˆS=(WA)ˆS=VˆS≈WX。换言之,任何曲面变换W都可以通过体积变换V=WA来近似重构源。这样,体积中的进一步统计建模可能会发现一个V,通过隐式重建测量值来补偿不精确的正演模型或逆变换。这种可能性的先决条件是,重构源的处理方式没有防止通过统计方法优化的函数类(隐式地)恢复先前的步骤。例如,用于获得电机图像中使用的频带功率特性的典型平方或功率变换操作[43]就是这样一种不可逆和信息丢失的变换(对于符号数据)。另一个例子是选择ROI的一个子集。 最后,不同BCI解决方案的质量必须根据其复杂性和成本进行权衡。对于基于逆的脑机接口,如果需要密集电极脑电图硬件和用户特定的生理模型,这些成本可能会很高。最大的特定于用户的成本来自于获取一个自定义的leadfield。在这种情况下,必须对使用者进行解剖磁共振成像扫描。然后,必须对获得的体积模型进行分割、网格划分,并将其用作计算成本较高的leadfield矩阵估计的基础[8]。理想情况下,该引线字段应包含与用户实际电极放置相对应的投影。或者,可以构造额外的乘法矩阵或插值来映射模型和实际电极。在后一种情况下,应测量电极位置以计算映射。显然,leadfield收购的整个过程不是一个偶然的过程,但它并不完整。leadfield的估计需要一个组织电导率参数,而这一参数很难从现场用户处测量出来[8]。一个错误的猜测可能导致大表3。BCI分类的潜在挑战,预计在源重建后仍将存在。问题描述缺少信息即使是最优(未知)决策函数也会分类出一些不知道的错误分类器决策函数需要为用户选择和参数化,包括ROI和特征选择的非平稳最优决策函数可能会改变。

8. Future work

未来的实证研究表明体积法和表面法之间的差异应该更清楚地分离出报告结果的原因。特别是,应该使用相同的训练数据来构建两个结构相同的管道,其中体积法使用以生理学导联场作为字典获得的线性表示,而表面方法则使用适当的统计方法(如CSP)来学习字典。此外,如果体积法比表面法提供更好的结果,那么了解源重建解决了哪些统计拟合问题(见表1)。相反,表面法表现更好可能会暴露出反建模和所用假设的缺点。本文以单用户脑机接口为研究对象,建立在一个共同的假设基础上,即体积传导是由一个线性不变的变换来模拟的。应进一步研究允许非线性和自适应性的影响,同时记住曲面方法也可以类似地扩展。关于BCI分类问题的一般性质,应该更好地理解用于BCI的时空信号特性(例如P300中的ERP模式、SSVEP中的闪烁频率比功率效应和运动图像中的β带抑制)是如何受到体积传导的影响的。如果在不同的用户模型中,由于解剖结构的不同,这些特征在信噪比(SNR)方面受到了不同程度的抑制,这可能有助于解释不同用户获得的BCI精度的巨大变化。更好地了解脑机接口的信噪比和声源活动度分布也可以说明信源重建在脑机接口中的应用前景。

9. Conclusion

虽然信源重建经常被研究和提议用于脑机接口[7,12,16-31],但它仍然是一种外来的方法,仅在BCI评论和教科书[2,5]中粗略介绍过。我们认为生理信号源重建和脑机接口中使用的更常见的空间变换都是通过线性叠加模型来寻找脑电信号的替代表示的方法。不同的是,信号源重构方法依赖于生理学的导联场,而统计表面方法则是利用脑电数据和标签来估计相应的参数。我们已经讨论了获得这些表示及其预期性质的各种方法。最后,我们考虑了脑电分类中的三个主要困难,以说明源重构并不会使BCI问题变得微不足道。相反,源重建将表面分类问题转化为体积分类问题,而数据驱动技术仍然是解决重建体中仍然存在的挑战的必要技术。关于表面和体积的分类,似乎有上面的,但没有下面的:所有的脑电图分类都是对同一表面测量的分类。区别在于数据表示和旁观者的看法。使用特定于用户的leadfield来获得一个卷表示,除了分类问题之外,潜在的巨大成本和增加的复杂性,还有待于解决的分类问题(现在使用转换后的数据)。这种增加的建模复杂性是否值得付出代价,或者仅仅是Occam警告过的东西,仍有待观察。