Anwendungen und Grenzen des EEG-Elektroden-Pooling – Mittelung über Zeitreihen

Gibt es Literatur, die sich mit dem Elektroden-Pooling befasst? Gibt es insbesondere Standards dafür, welche Pools (z. B. frontal, zentral, posterior vs. Elektrodenpaare) verwendet werden könnten, oder irgendwelche besonderen Anwendungen und Einschränkungen?

BEARBEITEN : Mit "Pooling" beziehe ich mich auf das Verfahren, bei dem neue Kanäle basierend auf dem Poolen der Rohdaten von den ursprünglichen Datenelektroden erstellt werden. Dies ist ein Vorverarbeitungsschritt, der nicht mit dem Varianz-Pooling für statistische Tests verwechselt werden darf.

Was Sie „Pools“ nennen, werden oft als „Regions of Interest“ (ROIs) bezeichnet. (Statistisch gesehen ist dies natürlich eine Form des Poolings.) Haben Sie versucht, unter diesem Begriff zu suchen? Maris diskutiert in verschiedenen Artikeln Möglichkeiten, ROIs aus Daten (im Gegensatz zu a priori) zu bestimmen.
Ich bin mit den Fallstricken a priori-Definitionen von ROI im Kontext von fMRI vertraut (z. B. funktionaler ROI vs. anatomischer ROI), war mir aber nicht bewusst, dass dieser Begriff in der EEG-Forschung verwendet wird. Welches Maris-Papier meinst du? Ich konnte kein Papier von Maris finden, das sich mit ROIs befasst.
"Randomisierungstests für ERP-Topographien und ganze raumzeitliche Datenmatrizen" , aber Eric Maris hat mehrere Artikel zur Statistik in EEG und MEG veröffentlicht, insbesondere zu "fortgeschrittenen" (nicht traditionellen, zB nicht parametrischen ) Techniken sowie näheren Untersuchungen der Grundlagen .
"Topographie" könnte ein weiterer Suchbegriff sein, den Sie berücksichtigen sollten.
@Livius Bitte beachten Sie meine neueste Bearbeitung. Ich beziehe mich nicht auf statistische Tests. Es gibt auch nichts über ROIs in diesem Papier.
Natürlich gibt es in diesem Papier nichts über ROIs, der springende Punkt ist, wie man ROI-basierte Vergleiche beim Vergleichen von Untersuchungstopografien vermeidet. Der Prozess, auf den Sie sich beziehen, wird als Interpolation bezeichnet .
@Livius Interpolation für Topographien wird am häufigsten mit Spline-Interpolation basierend auf der Laplace-Oberflächentransformation durchgeführt. Auch hier handelt es sich um ein anderes Verfahren. Ich beziehe mich auf einen einfachen Durchschnitt zwischen Zeitreihen. Die in der Arbeit erwähnte Technik trifft auf meine Daten nicht zu, da meine Daten die Kriterien für die Verwendung von Hotellings T-Quadrat erfüllen.

Antworten (1)

Dies scheint ein ziemlich schmerzhaftes Terminologieproblem zu sein.

"Pooling" wird in der Statistik verwendet, um das Zusammenführen von Daten / verschiedenen Informationsquellen in einem einzigen Modell zu beschreiben. Es ist von besonderem Interesse bei hierarchischen Modellierungsansätzen (z. B. Mixed-Effects-Modellierung), und partielles Pooling – allgemein das Teilen von Informationen zwischen Gruppen in einem Modell, ohne die Struktur der Gruppen zu verwerfen – ist vielleicht eine der großen Innovationen des 20. Jahrhunderts Jahrhundert-Regressionstechniken. Zu diesem Thema siehe zB Gelman und Hill (2007) .

In diesem Sinne kann die Verwendung von Regions of Interest (ROIs) anstelle einzelner Elektroden als kategoriale Variable als eine Form des Poolings angesehen werden – Sie kombinieren Datenquellen, um mehr Informationen zu erhalten, verlieren dabei aber etwas Struktur. Aufgrund der begrenzten räumlichen Auflösung des EEG und der hohen Korrelation zwischen benachbarten Elektroden, Mittelung über einen ROI (und dies geschieht implizit, wenn wir den ROI als Faktor in ANOVA- oder Regressionsmodellen verwenden – hier wird der Begriff „Regression to the mean" kommt), kann unsere Fähigkeit verbessern, das Signal im Rauschen zu sehen und zu erkennen (dh die statistische Aussagekraft erhöhen). Die Vergröberung der räumlichen (genauer topografischen) Auflösung ist vielleicht nicht tragisch, weil wir derzeit keine präzisen räumlichen Vorhersagen treffen können. Maris (2004)schlägt einen alternativen Umgang mit der Topographie vor.

Dies scheint der Sinn zu sein, in dem BrainVision Analyzer das Wort "Pooling" verwendet. Sie kombinieren mehrere Datenkanäle (Elektroden) durch Mittelwertbildung zu einem einzigen (ROI). Dies ist einer der Orte, an denen Sie sehen, dass "Kanal" und "Elektrode" nicht vollständig synonym sind.

Übrigens gibt es noch andere Möglichkeiten, Informationen von Elektroden zu kombinieren. Das EEG misst die Spannung, die per Definition eine Potentialdifferenz ist . Die Frage ist natürlich "Unterschied zu was?" Bei herkömmlichen Aufzeichnungsaufbauten haben Sie eine einzelne Referenzelektrode (oder vielleicht ein paar verbundene Elektroden wie bei verbundenen Mastoiden) und Sie messen die Differenz im elektrischen Feld zwischen der Messelektrode und der Referenz – dies wird als „gemeinsame Referenz“ bezeichnet. Manchmal wird ein Elektrodenpaar als "bipolare Elektroden" relativ zueinander gemessen. Dies scheint beim Elektrookulogramm häufiger vorzukommen und hat dort den Vorteil, dass es Augenbewegungen deutlicher macht. Es hat den Nachteil, dass man aus zwei und effektiv einen Kanal gemacht hatkann die beiden Original-Elektroden nicht unterscheiden! Ein weiterer Nachteil besteht darin, dass Techniken wie die unabhängige Komponentenanalyse (ICA) von einer gemeinsamen Referenz abhängen, um ihre Wirkung zu entfalten, und daher sind bipolare Elektroden für die ICA problematisch. Eine fortgeschrittenere Variante der gemeinsamen Referenz ist die "durchschnittliche Referenz", bei der die Spannung an der durchschnittlichen Spannung aller gemeinsamen Referenzelektroden gemessen wird. Dies erscheint zunächst seltsam, hat aber seinen Nutzen und betont, wie sich die Elektroden voneinander unterscheiden (Topographie). Jede gemeinsame Referenz kann aus jeder anderen über eine relativ einfache lineare Transformation berechnet werden. Siehe dazu auch Luck ( 2005 , 2014 ).

All diese Dinge mit der Referenzierung sind wichtig, weil es möglich ist, bipolare Kanäle offline zu berechnen – sie sind einfach die Differenz von zwei gemeinsamen Referenzelektroden. (Je nachdem, von welcher Elektrode Sie abziehen, erhalten Sie ein anderes Vorzeichen.) Mit ERPLAB können Sie Kanäle auf recht beliebige Weise kombinieren, um neue Kanäle zu erhalten. Wenn Sie lineare Kombinationen von Kanälen durchführen, ist es ziemlich einfach zu berechnen, wie die Statistiken des kombinierten Kanals im Vergleich zu den Statistiken der Originale aussehen werden, aber für willkürliche Kombinationen kann dies ziemlich verwirrend werden. Als Sonderfall kann man übrigens die Konstruktion von ROIs oder „Pooling“ im Sinne des BrainVision Analyzers ansehen – man addiert mehrere Kanäle und dividiert durch eine Konstante (also Berechnung des Mittelwerts),

Schließlich können Sie auch vorhandene Kanäle verwenden, um fehlende oder schlechte Kanäle zu simulieren – dies wird als Interpolation bezeichnet. Eine gute Interpolation berücksichtigt Dinge wie die Krümmung der Kopfhaut und das elektrische Feld und ist daher rechnerisch komplexer, da häufig Techniken wie Splines verwendet werden. Eine einfachere Interpolationsmethode besteht darin, einfach den Durchschnitt benachbarter Elektroden zu nehmen (in gewissem Sinne einen Mini-ROI zu erstellen!), aber dies ist nicht nur numerisch weniger genau, sondern berücksichtigt auch Probleme mit der Art und Weise, wie sich elektrische Felder summieren(siehe auch: äquivalente Dipole). Trotz der Proteste von Scott Makeig vermute ich, dass die lineare Interpolation für eine einzelne Elektrode in einem Aufbau mit hoher Dichte recht gut funktionieren würde. Andererseits können Sie es sich bei einem Aufbau mit hoher Dichte im Allgemeinen leisten, eine Elektrode aus Ihrer Analyse herauszulassen!

In jedem der oben genannten Fälle – Erstellung von ROIs, willkürliche Kombination von Kanälen, Interpolation – „bündeln“ Sie in gewissem Sinne die Daten, die Sie haben. Sie gewinnen keine Informationen, die nicht vorhanden waren (z. B. fügt eine interpolierte Elektrode Ihrer Analyse nicht viel, wenn überhaupt, statistische Aussagekraft hinzu), aber Sie können die Informationen, die Sie hatten, effizienter nutzen. Und darum geht es beim Pooling in der Statistik.

BEARBEITEN (2015-07-07 05:51 UTC): ICA und gemeinsame vs. bipolare Referenz

Wie in den Kommentaren angegeben, basiert ICA tatsächlich auf relativ allgemeinen Annahmen, denen die Wahl der Referenz im Allgemeinen gleichgültig ist. In Bezug auf das Signal besteht die Hauptannahme darin, dass jeder gemessene Kanal die lineare Kombination (Summen und konstante Vielfache) einer Reihe von Komponenten ist, von denen typischerweise angenommen wird, dass sie unterschiedliche (neuerale) Generatoren oder (EEG-)Quellen darstellen. Mit anderen Worten, ICA ist eine Art von Blind Source Separation (BSS), die verwendet werden kann, um einen Satz von (direkt) gemessenen Signalen in einen Satz von beitragenden Quellen zu zerlegen, basierend auf einigen zusätzlichen Annahmen. Es gibt viele verschiedene BSS-Techniken, jede mit unterschiedlichen Annahmen / Zielen und daher jeweils leicht unterschiedliche Antworten auf Fragen. Zum Beispiel erfordert die Hauptkomponentenanalyse (PCA), dass Komponenten orthogonal sind, während ICA erfordert , dass die Komponenten unabhängig sind . Etwas vereinfacht versucht PCA, das Signal in Form von aufeinanderfolgenden "maximalen" Trends zu trennen, während ICA versucht, das Signal in eine Reihe von unterschiedlichen Beiträgen zu trennen.

Dies ist am besten in der folgenden Abbildung zu sehen:

PCA- und ICA-Zerlegung einer X-förmigen Sammlung von Punkten

(Bild reproduziert von Jung et al. (2001) .)

Die erste von PCA erzeugte Komponente ist eine größere Diagonale, was den allgemeinen Trend der Zunahme erklärt j zum Steigern x , während die zweite Komponente ein Maß für "Drift" oder eine Korrektur des allgemeinen Trends ist. Wichtig ist, dass die Komponenten im rechten Winkel ( orthogonal ) zueinander stehen. Durch Kombinieren der einzelnen Komponenten in unterschiedlichen Anteilen (dh Gewichten ) erhalten Sie die ursprünglichen zwei Messreihen. In ICA müssen die Komponenten nicht im rechten Winkel zueinander stehen, und das Ergebnis in diesem Beispiel ist eine Komponente für jede der visuell offensichtlichen Gruppen.

Wenn wir dies auf EEG-Daten anwenden, können wir die Wahl der Referenz als eine Art eingebauten „Offset“ für den Messkanal betrachten. Dadurch ändern sich die Gewichte in den zurückgewonnenen Komponenten, aber letztendlich nicht die Komponenten selbst. Es ist ziemlich trivial, die Daten von einer gemeinsamen Referenz in eine andere zu transformieren, und es ist auch ziemlich trivial, die Komponentengewichte von einer gemeinsamen Referenz in eine andere zu transformieren.

Wenn die Kanäle jetzt eine Mischung aus Referenzen haben, wird es etwas interessanter. Bipolare (Mess-)Kanäle sind immer noch lineare Kombinationen von EEG-Quellen, aber sie haben unbekannte Offsets.[ 1 , 2 ] Dies ist an und für sich kein Problem für ICA – wie @mmh in den Kommentaren betonte – und damit die Zerlegung in Quellen / Komponenten funktioniert. Das größere Problem ist, dass der Offset die Gewichte und damit die Rückprojektion ein wenig durcheinander bringt; d.h. die Generierung von Kopfhautkarten wird etwas schwieriger und die resultierenden Kopfhautkarten sind möglicherweise nicht interpretierbar und können nicht quellenlokalisiert werden.[ 1] (Außerdem packen bipolare Kanäle die Signaländerung von zwei diskreten räumlichen Orten effektiv in einen und verlieren somit einige der Topographieinformationen, die auch für Dinge wie Kopfhautkarten wichtig sind.)

Aus diesem Grund lautet der offizielle Rat des EEGLAB-Wikis, eine gemeinsame Referenz für alle Kanäle zu verwenden, einschließlich der Augenkanäle, da Sie immer bipolare Kanäle aus unipolaren Kanälen erstellen können, aber nicht umgekehrt:

Wir empfehlen, Augenkanäle (normalerweise vier Kanäle, zwei für die vertikale Augenbewegungserkennung und zwei für die horizontale Augenbewegungserkennung) unter Verwendung der gleichen Referenz wie andere Kanäle aufzuzeichnen, anstatt bipolare Montagen zu verwenden. Man kann die bipolare Montageaktivität immer wiedergewinnen, indem man die Aktivitäten der Elektrodenpaare subtrahiert.[ 2 ]

Für die Arbeit, die ich mache, ist ICA wirklich nur interessant, wenn man Kopfhautkarten generieren oder eine Quellenlokalisierung durchführen kann. Es ist immer noch möglich, (einige Arten von) problematischen Komponenten zu identifizieren und zu entfernen (z. B. eine einzelne verrauschte Elektrode, aber andererseits können Sie das oft ohne ICA identifizieren), aber wenn die Kopfhautkarten nicht interpretierbar sind, dann hätte ich es ernst Zweifel am Entfernen von Komponenten, die von Elektroden aus mehreren Referenzen abhängen - das Entfernen von Komponenten subtrahiert effektiv die komponentenassoziierte Kopfhautkarte von den messungsassoziierten Kopfhautkarten, und meiner Intuition nach ist der resultierende Unterschied nicht unbedingt die Korrektur, nach der Sie suchen .

Oder kurz gesagt, Arnaud Delorme, eine der Schlüsselfiguren in der Entwicklung und Anwendung von ICA auf EEG-Daten, sagt:

ICA zur bipolaren Montage ist nicht informativ. ICA versucht, jede Kanalreferenz so zu modellieren, dass gemeinsame Quellen linear auf alle Kanäle projiziert werden können. [ 3 ]

ICA wird mit einer Mischung aus bipolaren und gemeinsamen Referenzen arbeiten, aber es wird eine andere Frage beantworten als die, die wir gerne beantwortet hätten.

Diese Antwort enthält sachliche Fehler im Zusammenhang mit ICA. Es kümmert sich nicht um die Referenz. Es kommt nur darauf an, dass das Modell x = As gilt. Außerdem verwenden die meisten vernünftigen Neuroimaging-Software immer die durchschnittliche Referenz. Sie könnten auch erklären, warum die Signale an den Sensoren korrelieren (Volumenleitung).
Die Referenz beeinflusst, ob oder nicht x = EIN s gilt: ICA kümmert sich nicht darum, welche gemeinsame Referenz verwendet wird, aber es kümmert sich darum, ob eine gemeinsame Referenz verwendet wird oder nicht. Insbesondere das bipolare Elektrookulogramm ist problematisch und muss aus der ICA-Zerlegung des Kopfhaut-EEGs mit gemeinsamer Referenz (monopolar) ausgeschlossen werden. Zu diesem Zweck gab es mehrere Diskussionen zum EEGLAB-Listendienst. Intuitiv ist dies offensichtlich, da Sie bei bipolaren Elektroden nicht wissen, welche Elektrode welchen Teil des Signals beigetragen hat, und Sie zwei Elektroden effektiv zu einem einzigen Kanal zusammenfassen.
Während in einigen Teilbereichen die durchschnittliche Referenz bevorzugt wird, sind in anderen verbundene Mastoide (z. B. Neurolinguistik) oder das Nasion die am häufigsten verwendeten Referenzen. Die durchschnittliche Referenz hat Vorteile, aber auch Nachteile, wie z. B. das Reduzieren des Rangs der Daten, und ICA verhält sich nicht gut mit Daten mit ungenügendem Rang . Signale von benachbarten Elektroden werden nicht nur wegen der "Verschmierung" der Volumenleitung korreliert, sondern auch wegen der grundlegenden Physik elektrischer Felder - in typischen EEG-Einstellungen gibt es keine Diskontinuitäten im elektrischen Feld.
Nun, ICA geht davon aus EIN ist eine quadratische Matrix. Daher verhält es sich natürlich nicht gut mit rangdefizienten Daten. Tatsächlich besteht ein häufigeres Problem darin, zu viele Komponenten zu extrahieren: Die meisten Artikel wählen einfach die Anzahl der extrahierten Komponenten aus heiterem Himmel aus.
Aus der Annahme einer quadratischen Matrix folgt nicht, dass die Matrix vollrangig sein muss! Eine quadratische Matrix hat genau dann vollen Rang, wenn sie invertierbar ist, aber nicht alle quadratischen Matrizen sind invertierbar – ein triviales Beispiel ist die n x n Nullmatrix. Wie im Link aus meinem letzten Kommentar erwähnt, können numerische Probleme die Rangschätzung nicht trivial machen. Dies geht jedoch für diese Frage vom Thema ab, die sich auf das Bündeln von Kanälen und nicht auf die lineare Algebra hinter ICA und Referenzierung konzentrierte.
Das Problem des Rangmangels kann oft gelöst werden, indem einfach weniger Komponenten geschätzt werden (z. B. schätzt EEGLAB/runica standardmäßig 64 Komponenten für 64-Kanal-Daten, obwohl die intern durchgeführte durchschnittliche Referenzierung verwendet werden könnte, um einen 65. Kanal zu rekonstruieren). Empirisch gesehen funktioniert das bipolare EOG nicht allzu schlecht, nur um Augen zu entfernen - natürlich sind Karten usw., wie bereits erwähnt, nahezu nicht interpretierbar.
@mmh Die meisten Artikel legen die Anzahl der Komponenten als einen Bruchteil von (# der Kanäle) fest, oft 1. Da ICA bekanntermaßen elegant abgebaut wird, wenn einige seiner Annahmen (z. B. # Quellen > # Sensoren) verletzt werden, ist "zu viele" wirklich nicht In der Praxis kein Problem. Das Schlimmste, was Sie sehen werden, sind "geteilte Komponenten". Diese sind viel weniger beunruhigend, als viel zu wenige Komponenten zu schätzen.