Angenommen, ich habe differenzierbare Funktionen (im Sinne der Frechet-Ableitung) Und , Wo ist ein linearer Operator und möchte die (frechet) Ableitung ihrer Zusammensetzung berechnen, dh . Unter Verwendung der Kettenregel für normierte Räume erhalte ich
Bearbeiten: Betrachten Sie die Funktion
woraus ich das geschlossen habe
Für die Zwecke dieser Art von multivariatem Kalkül (z. B. Frechet-Derivate) eine Domäne oder Kodomäne von reelle Matrizen wird mit identifiziert , nicht mit . Sie "glätten" Ihre Matrizen, bevor Sie Ableitungen und Kettenregeln auf sie anwenden. Zumindest wenn Sie möchten, dass Ihre Ableitung an einem bestimmten Punkt durch ein standardmäßiges rechteckiges Zahlengitter dargestellt wird.
Wenn Sie Ihre Matrizen nicht glätten möchten, bevor Sie mit ihnen rechnen, sind Ihre Ableitungen höherdimensionale Quader. Sie wagen sich jetzt in das, was ich als Tensorkalkülgebiet bezeichnen würde.
Bearbeiten: Nachdem ich mir Ihr Beispiel angesehen habe, passiert meiner Meinung nach Folgendes: ist eine Funktion , so wie du es beschreibst. Aber ist eine Funktion , und als solches kann sein Frechet-Derivat als realisiert werden Matrix. Sie haben die Matrix erhalten als dieses Derivat.
Die Frechet-Ableitung kann zwar für Abbildungen zwischen beliebigen normierten Räumen definiert werden, insbesondere für Abbildungen in den Raum von -Matrizen. Gegeben . das Frechet-Derivat von bei ist eine lineare Abbildung . Das sagt die Kettenregel
Ihre Frage enthält kein Dimensionsproblem: ist eine lineare Abbildung , somit . Auch ist eine lineare Abbildung und natürlich fügst du ein als Argument. In Bezug auf Matrizen: ist ein -Matrix, ist ein -Matrix (wo wir identifizieren mit um eine "Standard"-Matrix mit echten Einträgen zu erhalten) und ihr Produkt an -Matrix. Du schreibst , aber das ist falsch, da es darauf hindeutet, dass es ein ist -Matrix.
Bei deinem Beispiel sehe ich den Zusammenhang zur Kettenregel nicht. ist nicht die Zusammensetzung zweier Funktionen, wie sie in der Kettenregel benötigt wird. Aber sicher dein Fazit
Ein Matrix-für-Vektor-Gradient erzeugt einen Tensor dritter Ordnung, sodass er nicht bequem in die Standard-Matrixnotation passt.
Das Differential einer Matrix hat jedoch die Form einer Matrix und gehorcht allen Regeln der Matrizenalgebra. Ebenso gehorcht das Differential eines Vektors den bekannten Regeln der Vektoralgebra.
Betrachten Sie zunächst die Differentiale der konstituierenden Funktionen.
Jeff Cheng
Richard
Arthur
Paul Frost
Paul Frost