Warum haben Mathematiker das Skalarprodukt im ersten Argument linear gewählt statt im zweiten?

Aus meiner begrenzten Erfahrung mit inneren Produkträumen scheint es, als würde das lineare innere Produkt im zweiten Argument eine glattere Notation ermöglichen. Zum Beispiel z X H , könnten wir definieren X H von

X j = X , j
Dann würde dies die Tatsache verallgemeinern, dass X T j = X , j An R N .

Führt die Linearität im ersten Argument zu einer glatteren Notation in einem anderen Aspekt der Hilbert-Raumtheorie?

Es ist nur eine Konvention. Ich verwende immer Linearität in der ersten Komponente.
Innere Produkte sind in beiden Argumenten linear.
@JohnDouma Nicht, wenn das Basisfeld ist C .
Nach meiner eigenen Erfahrung ist dies völlig willkürlich und ohne besondere Motivation dahinter, obwohl ich zustimme, dass Mathematiker dazu neigen, den ersten Eintrag im Gegensatz zum zweiten linear zu machen.
Ich kenne Quantenmechaniker wie ihre Linearität im zweiten Argument.
Über C , ist ein inneres Produkt als eine sesquilinearForm (= 1½ Linearform) auf einem komplexen Vektorraum definiert.
Wenn überhaupt, und dafür mag ich in manchen Kreisen als Ketzer bezeichnet werden, gefällt mir die Physikerschreibweise besser. Oft möchten wir verwenden X , als funktional, und es war für mich immer sinnvoller, dass dies standardmäßig linear ist. Mich würde interessieren, warum andere Mathematiker die linkslineare Konvention bevorzugen und woher dies historisch kommt.
Auch in Physik X ist ein Vektor, also haben wir es besser A X + B j = A X + B j ! Mathematiker müssen dem sicherlich zustimmen X kann unmöglich ein Vektor sein.
@Lars Für einen Mathematiker ist es nicht erforderlich, die Markierungen vom Typ "bra-ket" um einen Vektor herum zu haben, also die Tatsache, dass X | „kann unmöglich ein Vektor sein“ ist kein besonders überzeugendes Argument.
Hier ist eine Möglichkeit. Als Hamilton Quaternionen und ihre Skalarprodukte einführte, schrieb er | A | 2 = A A ¯ in dieser Reihenfolge (mit moderner Notation). Für Quaternionen spielte es keine Rolle, da sie mit ihren Konjugaten pendeln, aber vielleicht blieb die Konvention hängen, wenn innere/skalare Produkte zu komplexen Vektoren erweitert wurden.
Ein Mathematiker namens Hilbert definierte das Skalarprodukt erstmals um 1905. Um ehrlich zu sein, glaube ich jedoch, dass dies die Arbeit von von Neumann war, der ein Schüler von Hilbert war. Hilberts Konvention war praktisch in Stein gemeißelt, als Dirac die Braket-Notation definierte. Die Mathematiker haben sich also größtenteils an die Hilbert-Konvention gehalten. Ich denke, es ist besser, zwischen dem Leerzeichen und seinem Dual zu unterscheiden, was die Dirac-Notation tut. Der duale Raum war kaum formuliert, als Hilbert ein inneres Produkt definierte.

Antworten (1)

Ich habe lineare Algebra mit beiden Konventionen unterrichtet und stimme Ihrer Schlussfolgerung zu. Ich fand, dass die Konvention "Physiker" beim Überarbeiten mehr Vor- als Nachteile hat C (oder gleichzeitig arbeiten über F Wo F { R , C } ). Dazu gehören:

  1. Es ist jetzt Standard, dass Vektoren mit Spaltenvektoren identifiziert werden, während Covektoren mit Zeilenvektoren identifiziert werden. Somit fällt das Standard-Innenprodukt auf R N wird in Bezug auf das Matrixprodukt als geschrieben X T j (und kann nicht geschrieben werden als X j T ). Durch Ersetzen T mit erhält man ein Standard-Innenprodukt X j An C N was den realen Fall verallgemeinert und in der ersten Variablen natürlich antilinear ist. Um das Standard-Innereprodukt unter Verwendung einer Linear-in-der-ersten-Variablen-Konvention für Spaltenvektoren zu beschreiben, muss man definieren X , j = j X was umständlicher ist.
  2. Der Riesz-Antiisomorphismus v v wird von gegeben v v , . Dies steht im Einklang mit der Idee, dass " v wirkt auf einen Vektor w von v , w " und wird noch deutlicher mit der Klammerschreibweise, in der ein Vektor v v definiert eine lineare Funktion v | von v | ( w ) := v | w . Dies stellt die Anforderung, dass das Skalarprodukt in der zweiten Variablen linear ist.
  3. Die Erweiterung eines Vektors v auf orthonormaler Basis ( e 1 , , e N ) wird geschrieben als ich = 1 N e ich , v v was mit der Dual-Space-Notation übereinstimmt ich = 1 N e ich ( v ) v Wo e ich Ist ich -tes Element in der dualen Basis, die Ihnen das gibt ich -te Koordinate eines Vektors.
  4. Die Matrixkoeffizienten eines linearen Operators T in Bezug auf eine orthonormale Basis e 1 , , e N werden von gegeben A ich J = e ich , T ( e J ) (im Gegensatz zu A ich J = T ( e J ) , e ich was umständlicher ist), während der Matrixkoeffizient von T werden von gegeben e J , T ( e ich ) (im Gegensatz zu T ( e ich ) , e J ...).

Die einzige leicht ärgerliche Sache, die mir bei der "Physiker" -Konvention aufgefallen ist, ist, dass die definierende Eigenschaft für den adjungierten Operator natürlich als geschrieben wird T v , w = v , T w während ich an die Form gewöhnt war T v , w = v , T w . Beide Formen sind äquivalent, aber wenn man den Riesz-Antiisomorphismus verwenden will, um die Existenz von zu rechtfertigen T , die Form T v , w = v , T w ist natürlicher und gewöhnungsbedürftig.

Danke für die Diskussion dieser Punkte!