Die Definition der Determinante im Geiste der Algebra und Geometrie

Das Konzept der Determinante ist ein ziemlich unmotivierendes Thema, um es einzuführen. Lehrbücher verwenden solche "auseinandergezogenen" Einführungen wie axiomatische Definition, Laplace-Entwicklung, Leibniz'sche Permutationsformel oder so etwas wie signiertes Volumen.

Frage : ist folgendes eine Möglichkeit, die Determinante einzuführen?


Bei der Determinante geht es darum, zu bestimmen, ob ein gegebener Satz von Vektoren linear unabhängig ist, und eine direkte Möglichkeit, dies zu überprüfen, besteht darin, skalare Multiplikationen von Spaltenvektoren zu addieren, um die Diagonalform zu erhalten:

( A 11 A 12 A 13 A 14 A 21 A 22 A 23 A 24 A 31 A 32 A 33 A 34 A 41 A 42 A 43 A 44 ) ( D 1 0 0 0 0 D 2 0 0 0 0 D 3 0 0 0 0 D 4 ) .

Bei der Diagonalisierung fordern wir, dass die Information, also die Determinante, unverändert bleibt. Jetzt ist klar, dass die Vektoren linear unabhängig sind, wenn alle D ich ist ungleich Null, dh ich = 1 N D ich 0 . Es kann auch sein, dass zwei Spalten gleich sind und es keine Diagonalform gibt, also müssen wir eine Bedingung hinzufügen, die die Determinante vernichtet (dies ist konsistent mit ich = 1 N D ich = 0 ), da Spaltenvektoren nicht linear unabhängig sein können.

Wenn wir eine wirklich wertvolle Funktion haben wollen, die diese Informationen liefert, dann führen wir einfach eine Ad-hoc-Funktion ein det : R N × N R mit folgenden Eigenschaften:

  1. det ( A 1 , , A ich , , A J , , A N ) = det ( A 1 , , A ich , , k A ich + A J , , A N ) .

  2. det ( D 1 e 1 , , D N e N ) = ich = 1 N D ich .

  3. det ( A 1 , , A ich , , A J , , A N ) = 0 ,     Wenn     A ich = A J .


Aus der vorherigen Definition der Determinante können wir die Multilinearitätseigenschaft ableiten :

[ A 1 , , C 1 u + C 2 v , , A N ] D ich A G [ D 1 , , C 1 D ich ' + C 2 D ich , , D N ] ,
So
det [ A 1 , , C 1 u + C 2 v , , A N ] = J = 1 : J ich N D J ( C 1 D ich ' + C 2 D ich )
= C 1 det ( D ich A G [ D 1 , , D ich ' , , D N ] ) + C 2 det ( D ich A G [ D 1 , , D ich , , D N ] )
= C 1 det [ A 1 , , u , , A N ] + C 2 det [ A 1 , , v , , A N ] .

Beachten Sie, dass die vorherige Multilinearität zusammen mit der Eigenschaft ( 1 ) gibt das Eigentum ( 2 ) , daher wissen wir aus der Literatur, dass die Determinantenfunktion det : R N × N R existiert tatsächlich und ist einzigartig.


Offensichtlich gibt die Determinante Auskunft darüber, wie orthogonal eine Menge von Vektoren ist. Somit können wir mit dem Gram-Schmidt-Prozess einen orthogonalen Satz von Vektoren bilden ( A 1 , , A N ) , und durch Multilinearität und Eigenschaft ( 2 ) Der Absolutwert der Determinante ist das Volumen des Parallelepipeds, das von der Menge der Vektoren überspannt wird.

Bestimmung . Volumen eines Parallelepipeds, das durch eine Reihe von Vektoren gebildet wird ( A 1 , , A N ) Ist v Ö l ( A 1 , , A N ) = v Ö l ( A 1 , , A N 1 ) | A N | = | A 1 | | A N | , Wo A ich S P A N ( A 1 , , A ich 1 ) .


Dieser Ansatz zur Determinante funktioniert gleichermaßen gut, wenn wir mit dem Volumen eines Parallelepipeds (geometrischer Ansatz) oder mit der Suche nach Invertierbarkeit (algebraischer Ansatz) beginnen. Ich wurde durch das Buch Lineare Algebra und ihre Anwendungen von Lax zu Kapitel 5 motiviert:

Anstatt mit einer Formel für die Determinante zu beginnen, werden wir sie aus den Eigenschaften ableiten, die ihr durch die geometrischen Eigenschaften des vorzeichenbehafteten Volumens aufgezwungen werden. Diese Herangehensweise an Determinanten geht auf E. Artin zurück.

  1. det ( A 1 , , A N ) = 0 , Wenn A ich = A J , ich J .
  2. det ( A 1 , , A N ) ist eine multilineare Funktion seiner Argumente, in dem Sinne, dass, wenn alle A ich , ich J sind repariert, det ist eine lineare Funktion des verbleibenden Arguments A J .
  3. det ( e 1 , , e N ) = 1.
Kommentare sind nicht für längere Diskussionen gedacht; diese Konversation wurde in den Chat verschoben .

Antworten (5)

Das scheint ziemlich undurchsichtig: Es ist eine Art, eine Größe zu berechnen, anstatt zu sagen, was genau es ist oder sie sogar zu motivieren. Es lässt auch die Frage völlig offen, warum eine solche Funktion existiert und wohldefiniert ist. Die von Ihnen angegebenen Eigenschaften sind ausreichend, wenn Sie versuchen, eine Matrix in obere Dreiecksform zu bringen, aber was ist mit anderen Berechnungen? Es gibt auch keine Rechtfertigung für eine der wichtigsten Eigenschaften der Determinante, nämlich det ( A B ) = det A det B .

Ich denke, der beste Weg, die Determinante zu definieren, ist die Einführung des Keilprodukts Λ v eines endlichdimensionalen Raumes v . Angesichts dessen, jede Karte F : v v veranlasst eine Karte F ¯ : Λ N v Λ N v , Wo N = schwach v . Aber Λ N v ist ein 1 -dimensionaler Raum, also F ¯ ist nur eine Multiplikation mit einem Skalar (unabhängig von der Wahl der Basis); dieser Skalar ist per Definition exakt det F . Dann erhalten wir zum Beispiel die Bedingung that det F 0 iff F ist ein kostenloser Isomorphismus: Für eine Basis v 1 , , v N von v , wir haben det F 0 iff F ( v 1 v N ) = F ( v 1 ) F ( v N ) 0 ; das heißt, wenn die F ( v ich ) sind linear unabhängig. Außerdem seit H = F G hat H ¯ = F ¯ G ¯ , wir haben det ( F G ) = det F det G . Die anderen Eigenschaften folgen ähnlich. Es erfordert ein bisschen mehr Raffinesse, als normalerweise in einem linearen Algebra-Kurs angenommen wird, aber es ist die erste Konstruktion von det Ich habe gesehen, dass das motiviert und transparent erklärt ist, was sonst eine Liste willkürlicher Eigenschaften ist.

Ich bitte zu widersprechen. Dies ist wohl die raffinierteste , eleganteste oder sogar nützlichste Definition von Determinante, aber ich denke, dies ist auch die am wenigsten motivierte Definition. Warum um alles in der Welt ist es notwendig, äußere Algebra einzuführen, um das Volumen eines Parallelepipeds oder die proportionale Volumenänderung aufgrund der Anwendung einer linearen Abbildung zu definieren? Wie kann man gleich zu Beginn die Vorzüge einer solchen Definition erkennen? Motivationstechnisch macht diese Definition überhaupt keinen Sinn.
Die Motivation ist die Idee, dass det F = 0 ist gleichbedeutend mit Singularität, was viel interessanter und wichtiger ist als die Berechnung des Volumens eines Parallelepipeds (und über einem Feld immer noch sinnvoll ist). k R ). Die Volumenform auf einem Raum auf einer allgemeinen Mannigfaltigkeit wird in Bezug auf dasselbe äußere Produkt definiert, folgt also automatisch. (Dies erfordert mehr Analyse, als normalerweise in einer Einführungsklasse angenommen wird, aber es ist nicht so, als wäre die Berechnung des Volumens eines Parallelepipeds in beliebigen Dimensionen ohnehin eine zwingende oder interessante Motivation.)
... auch in der Volumendefinition stecken Sie immer noch fest und zeigen, dass die Determinante die Wäscheliste der Eigenschaften im OP hat, was nicht sofort ist. Wenn Sie davon ausgehen det wohldefiniert und unter Konjugation (oder ähnlichem Verhalten) unveränderlich ist, dann können Sie interpretieren det G für G oberes Dreieck wie das Volumen eines Parallelepipeds und von dort aus fortfahren. Aber es gibt keine offensichtliche Möglichkeit, die geometrische Bedeutung von zu zeigen det für eine beliebige Matrix, und es ist aus den gegebenen drei Bedingungen nicht klar, warum det sollte multiplikativ sein, eine seiner wichtigsten Eigenschaften.
Ich denke, wir sind nicht auf der gleichen Seite, was die Bedeutung des Wortes „Motivation“ angeht. Sie scheinen darüber zu sprechen, ob es sich lohnt, ein bestimmtes Ziel zu verfolgen, aber im Zusammenhang mit dem OP und meinem vorherigen Kommentar sprechen wir darüber, ob es von Anfang an überzeugend ist, dass eine bestimmte Definition oder ein bestimmtes Setup uns zu unserem Ziel führen würde Ziel. In diesem Sinne ist die Verwendung äußerer Algebra eher unmotiviert.
Wie Paul Halmos es ausdrückte (auf S. 53, Finite-Dimensional Vector Spaces ): „Der Leser könnte durchaus behaupten, dass die Diskussion nicht sehr stark motiviert war. Die vollständige Motivation kann in diesem Buch nicht enthalten sein; die Rechtfertigung für das Studium der multilinearen Algebra ist die weite Anwendbarkeit des Themas. Die einzige Anwendung, die wir machen werden, ist die Theorie der Determinanten (die sicherlich mit direkteren, aber weniger eleganten Methoden behandelt werden könnte, die eine viel größere Abhängigkeit von willkürlichen Wahlen von Basen beinhalten)".
@Juho: Na klar: Wenn man die Determinante für obere Dreiecks- oder Diagonalmatrizen definiert und auf diesen Fall reduziert, folgt die Multiplikativität leicht (wenn auch nicht eigentlich organisch). Der Punkt ist, dass Sie davon ausgehen, dass die drei Eigenschaften, die Sie angeben, den Wert der Determinante eindeutig und vollständig bestimmen, was nicht offensichtlich ist. Es ist auch weniger eine Definition der Determinante als ein Algorithmus zu ihrer Berechnung; das ist nicht unbedingt ein problem, aber zumindest keine große motivation.

Die Art und Weise, wie ich meinen Schülern Determinanten beibringe, ist, mit dem Fall zu beginnen N = 2 , und die komplexen Zahlen und/oder die Trigonometrie zu verwenden, um zu zeigen, dass z ( A , B ) , ( C , D ) Vektoren in der Ebene, die Menge

A D B C = | | ( A , B ) | | | | ( C , D ) | | Sünde θ
ist der vorzeichenbehaftete Bereich dazwischen ( A , B ) Und ( C , D ) (in dieser Reihenfolge).

Dann überprüfen wir das, indem wir das Vektorprodukt und seine Eigenschaften verwenden (wir haben es gesehen, bevor wir ganz allgemein zum Thema Determinanten kamen). 3 von 3 Determinanten tragen die Bedeutung von signierten Volumina.

Der nächste Schritt besteht darin, Determinanten als alternative multilineare Funktionen einzuführen. Wir haben Beispiele für bilineare Karten (innere Produkte), trilineare Karten wie z

( u , v , w ) ( u × v ) w
und die quadrilinearen Abbildungen
( A , B , C , D ) ( A C ) ( B D ) ( B C ) ( A D ) ,
( A , B , C , D ) ( A × B ) ( C × D ) .

Nun, bei der Erklärung der Multilinearität haben wir betont, dass die Tatsache, dass die letzten beiden Beispiele gleich sind, bewiesen werden kann, wenn wir nur die Gleichheit für den Fall prüfen, wo A , B , C , D sind Vektoren der kanonischen Basis.

Dann kommt die Zeit, die Determinante von zu definieren N Vektoren ein R N , das ist ein neues Beispiel für N lineare, alternierende Funktion. Sie überprüfen, ob der Vektorraum solcher Karten tatsächlich vorhanden ist ( N N ) . Die Schüler lernen so, dass die Determinante im Wesentlichen die einzig mögliche solche Funktion ist, bis auf ein Vielfaches, genauso wie sie gesehen haben, dass allgemeinere multilineare Abbildungen ausschließlich von ihren Werten auf Vektoren einer gewählten Basis abhängen (sagen wir, der kanonischen Basis in unserem Fall).

Obwohl ich gelernt habe, Sachen wie zu beweisen det ( A B ) = det ( A ) det ( B ) Durch strenge Funktorialität definieren wir im Unterricht die Karte

L ( X 1 , , X N ) = det ( A X 1 , , A X N ) ,
die aufgrund ihrer Eindeutigkeit ein konstantes Vielfaches der Determinantenfunktion ist T ( X 1 , , X N ) = det ( X 1 , , X N ) , und berechne die Konstante durch Auswerten auf der Identitätsmatrix, d.h X ich = e ich .

Daher det ( A B ) = det ( A ) det ( B ) .

In TW Korners Buch mit dem Titel Vectors, Pure and Applied kann man eine Konstruktion sehen, die elementare Matrizen verwendet und streng ist. Das OP kann in Korners Buch nachsehen, um eine nette, etwas bodenständigere Darstellung zu sehen.

In Op. cit. man sieht, wie Korner die Tatsache nutzt, dass eine invertierbare Matrix als Produkt elementarer Matrizen zerlegt werden kann, um die Formel zu erhalten det ( A B ) = det ( A ) det ( B ) .

Hinweis: Ich habe meine Darstellung absichtlich kurz gehalten, um nicht zu viel zu wiederholen, was bereits in anderen Antworten enthalten war.

det ist die einzige multilineare alternierende lineare Abbildung, die so ist det ICH = 1 . (2) und (3) kombiniert mit der folgenden Eigenschaft würden definieren det einzigartig.

det ( A 1 , , u , , A N ) + det ( A 1 , , λ v , , A N ) = det ( A 1 , , u + λ v , , A N )
Das einzige, was in Ihrer Definition fehlt, ist Linearität.

Danke für die Antwort. Glauben Sie, dass es unmöglich ist, Multilinearität aus Eigenschaften abzuleiten? ( 1 ) , ( 2 ) Und ( 3 ) ?
@Juho Ja, aber es ist schwer zu beweisen.
Aber wenn die Eigenschaften ( 1 ) , ( 2 ) Und ( 3 ) Geben Sie für jede Matrix die richtige Determinante an. Ist die Multilinearität dann nicht eine automatische zusätzliche Eigenschaft?
@Juho Die aktuelle Definition von det (1), (2) und (3) erfüllen, aber es gibt keine Garantie dafür, dass keine andere nichtlineare Funktion sie ebenfalls erfüllt.
@Juho Ich denke, Ihre Definition entspricht der von Artin, aber Artins Definition erleichtert den Beweis mehrerer Eigenschaften der Determinante erheblich.
@ user1551 Wahr. In meiner Definition finde ich das Volumen mit dem Gram-Schmidt-Prozess. Die Annahme von Multilinearität als Axiom erfordert eine gewisse geometrische Resonanz, ist aber dennoch offensichtlich.

Die geometrische Bedeutung der Determinante beispielsweise einer 3-mal-3-Matrix ist das (vorzeichenbehaftete) Volumen des Parallelepipeds, das von den drei Spaltenvektoren (alternativ den drei Zeilenvektoren) überspannt wird. Dies verallgemeinert den (vorzeichenbehafteten) Bereich des Parallelogramms, das von den zwei Spaltenvektoren einer 2-mal-2-Matrix aufgespannt wird.

Um der geometrischen Definition nachzugehen, müssten Sie im nächsten Schritt die Bedeutung von „signed“ oben klären. Die naive Definition von Volumen ist immer positiv, während die Determinante negativ sein könnte, daher gibt es einige Erklärungsbedarf in Bezug auf Orientierungen.

Der Weg, der sowohl von Lehrern als auch von Lehrbuchautoren am häufigsten gewählt wird, ist der algebraische Weg, bei dem man eine Zauberformel aufschreiben kann und, boom! Die Determinante wurde definiert. Dies ist in Ordnung, wenn Sie eine bestimmte Menge an Stoff durcharbeiten möchten, der für den Kurs erforderlich ist, aber aus pädagogischer Sicht ist dies möglicherweise nicht der beste Ansatz.

Letztendlich ist eine Kombination aus Geometrie und Algebra erforderlich, um dieses Konzept richtig zu erklären. Es verbindet sich mit fortgeschritteneren Themen wie äußere Algebren, aber das ist bereits die nächste Stufe.

Eine Begründung, die ich der Determinantenfunktion geben könnte, ist, die Eigenschaft der Potenz zu verallgemeinern, dh wir wissen das für alle Skalare X , A , B , C es hält: X A + B + C = X A X B X C

Aber gehen wir mal davon aus A , B , C sind eigentlich die diagonalen Einträge einer Matrix A dann hält es das X T R A C e ( A ) = D e T ( X A ) , mit X A die Matrix Exponential (von Basis X );

Was ist die Matrixleistung?