Wie man visuelle Hervorhebung quantitativ misst

Salience lässt Objekte aus ihrer Umgebung auftauchen und sofort unsere Aufmerksamkeit auf sich ziehen. Ein hervorstechendes Objekt im visuellen Bereich wäre zB ein roter Punkt unter weißen. Wir können manchmal intuitiv sagen, dass ein Objekt auffälliger ist als das andere, z . B. könnte ein sich bewegender roter Punkt auffälliger sein als ein statischer.

Gibt es eine Möglichkeit zu quantifizieren, wie hervorstechend ein Objekt ist?


AKTUALISIEREN

Um die Frage ein wenig einzugrenzen, nehmen Sie an, Sie haben eine Reihe verschiedener Ausgabegeräte, die entweder visuelle oder akustische Hinweise liefern können (LEDs, Lautsprecher, Lampen, Bildschirme ...) und sich in der Nähe eines Zielobjekts befinden, auf das Sie die Aufmerksamkeit lenken möchten . Idealerweise würde man das Ausgabegerät wählen, das dem Zielobjekt am nächsten ist, um Aufmerksamkeit zu erregen, aber je nach Entfernung ist das Ausgabegerät möglicherweise nicht so auffällig. Ich möchte also wissen, welches Gerät bei einer bestimmten Entfernung am meisten Aufmerksamkeit erregen wird. Die Umgebung wäre größtenteils statisch und gut beleuchtet.

Die Frage ist unglaublich breit. Es hängt von der Art des Stimulus und dem Kontext (Ablenker) ab, wie hervorstechend etwas ist. Visuell gesehen ist bei einem statischen Hintergrund ein sich bewegender Stimulus wahrscheinlich auffälliger, aber derselbe Stimulus kann auf einem dynamischen Hintergrund nicht unterscheidbar sein. Könntest du deine Frage bitte eingrenzen? Sonst wäre die Antwort nicht befriedigender als „subjektive Hervorhebungsbewertungen“.
@RobinKramer Ich habe die Frage ein wenig eingegrenzt, wissen Sie, ob in diesem Bereich geforscht wurde?
Das ist schon besser. Es gibt noch viele Dinge, die eine Rolle spielen können, aber ich glaube, es ist verantwortbar. Meine anfänglichen Gedanken sind, dass auditive Stimuli eine Art emotionale (dh erschreckende) Reaktion hervorrufen können, die stärker ist als visuelle Hinweise und daher auffälliger sein können. Die auditiven Quellen sind jedoch im Vergleich zu visuellen Reizen schwieriger zu lokalisieren. Ich werde sehen, ob ich einige Referenzen finden kann, um dies zu untermauern, und sehen, ob es einige Maße für die Hervorhebung gibt, aber andere Leute können es auch gerne beantworten :)
Girauder, haben Sie sich mit der Theorie der Signalerkennung befasst? Kommentieren, weil anekdotisch, aber was ich getan habe, um die Hervorhebung zu messen, war eine einfache Ja / Nein (2AFC) -Erkennungsaufgabe und das Ändern des Ziels, z. B. Helligkeit / Größe. Ermitteln Sie daraus dann die Nachweisschwelle - vergleichen Sie diese dann für die verschiedenen Ziele. Bei auditiven Reizen bin ich mir allerdings nicht sicher.
@queenslug Ich habe mich damit noch nicht befasst, aber es hört sich so an, als könnte es wirklich hilfreich sein! Haben Sie Ihre Forschung veröffentlicht? Ich würde gerne genauer lesen, was du getan hast!
Nein, leider hat unsere Forschung keine Früchte getragen, dies ist eine andere Veröffentlichung meines Betreuers, obwohl sciencedirect.com/science/article/pii/S004269890300275X

Antworten (2)

Die Dauer der Augenfixierung wurde sowohl bei Säuglingen als auch bei Erwachsenen verwendet, um den Ort der Aufmerksamkeit zu messen. Dies kann mit einem Eyetracker erreicht werden. Ein primitiverer und weniger genauer Weg besteht darin, die Einzelbilder einer Videoaufnahme von Personen manuell zu zählen. Die Frames pro Sekunde (FPS) wären ein limitierender Faktor. Außerdem ist das zuerst beobachtete Item das hervorstechendere, vorausgesetzt, dass es keine sekundäre Verzerrung in der Aufgabe gibt (dh die Objekte sollten einen gleichen Abstand voneinander haben oder der Abstand könnte zufällig sein).

Für visuelle Such- und serielle Suchaufgaben werden Antworten gesammelt und individuelle Antwortkurven (Receiver Operator Characteristics, ROC) für Teilnehmer und Bedingungen können unter Verwendung der Signaldetektionstheorie (SDT) berechnet werden . Der Diskriminationsindex d prime (d') kann dann nur berechnet werden, wenn zwei explizite Antworten erforderlich sind.

Eine andere Möglichkeit besteht darin, die Präsentationszeit systematisch zu variieren, um die Verarbeitungsgeschwindigkeit zu quantifizieren, aber dies erfordert einen stärker rechnerischen Ansatz.

was meinst du mit: der Diskriminationsindex d' kann nur berechnet werden, wenn sowohl Match- als auch Non-Match-Bedingungen vorliegen? Übrigens vielen Dank für die Info. Sie erwähnten "Außerdem ist das zuerst beobachtete Element das auffälligere". Aber was ist, wenn man 2 Geräte hat, die einem Benutzer präsentiert werden können, kann man bestimmen, welches der beiden auffälliger ist, oder zumindest Welcher wird vom Benutzer in einer bestimmten Entfernung wahrgenommen, bevor er tatsächlich einen Stimulus ausgibt?
Um d' zu berechnen, müssen Sie auch eine Annäherung an die Schätzrate aufzeichnen. Dies wird oft als Voreingenommenheit bezeichnet, zum Beispiel Wahrnehmungsvoreingenommenheit. Angenommen, Sie haben zwei Bedingungen: Ziel vorhanden, Ziel nicht vorhanden. Anstatt dem Benutzer eine Antwortoption zum Drücken einer Schaltfläche zu geben, wenn der Benutzer das Ziel sieht, weisen Sie den Benutzer an, eine von zwei Schaltflächen zu drücken: Ziel vorhanden, Ziel nicht vorhanden. Daraus folgt, dass Sie vier verschiedene Antworttypen haben: Treffer, Fehlschläge, Fehlalarme und korrekte Zurückweisungen. (Eine gängige Aufgabe in der Gedächtnisforschung ist der verzögerte Match - daher "Matching"...). Forts.
Wenn Sie den Abstand des Benutzers zum Bildschirm kennen, können Sie den Blickwinkel entsprechend der Größe des Stimulus berechnen, aber wenn Sie diesen Abstand konstant halten können, müssen Sie nicht zu viele individuelle Werte berechnen. // Wenn Sie zwei verschiedene Stimuli vergleichen, können Sie sie in zufälliger Reihenfolge präsentieren und d' individuell für jede Bedingung (dh Stimulus) berechnen. Sie können dann die ROC-Kurven für beide Stimuli vergleichen, um den auffälligsten zu bestimmen - zumindest für die spezifischen Betrachtungsbedingungen. Sie müssen jedoch ein Kriterium angeben, zum Beispiel: 75 % richtig oder 95 % richtig.

Wie bei vielen dieser Fragen hängt dies von Ihrer Definition von (visueller) Hervorhebung ab. Ihre Frage legt nahe, dass Sie dies über sensorische Modalitäten (auditiv und visuell) hinweg vergleichen möchten, was mit erheblichen Schwierigkeiten verbunden ist.

Eine mögliche Definition von „Salience“ ist die Eigenschaft eines Stimulus, die ihn von seinem Hintergrund abhebt und unsere Aufmerksamkeit erregt (siehe http://www.scholarpedia.org/article/Visual_salience ). Sie könnten dies empirisch messen, indem Sie Beobachter bitten, den Gegenstand an verschiedenen Orten zu finden/zu beantworten. Sie sollten dies schneller tun, wenn dieser Gegenstand auffälliger ist (alle anderen Dinge sind gleich). Dies ist im Wesentlichen die Logik hinter den meisten Experimenten zu visueller Aufmerksamkeit und visueller Suche. Wie in einer anderen Antwort erwähnt, könnten Sie auch überwachen, wohin der Betrachter schaut, da auffällige Dinge früher und häufiger betrachtet werden sollten.

Es gibt jetzt eine Menge Forschung zur Modellierung von bildbasierter, visueller Hervorhebung. Theoretisch zielen solche Modelle darauf ab, ein Bild einer Szene aufzunehmen und vorherzusagen, welche Teile des Bildes Aufmerksamkeit erregen werden. Eine andere Möglichkeit, die Hervorhebung verschiedener Gegenstände zu quantifizieren, bestünde daher darin, den Kontrast oder die Aktivität in der Hervorhebungskarte für bestimmte Orte zu messen. Es gibt viel mehr darüber und viele Referenzen in der obigen Scholarpedia-Referenz.