Zeigen, dass Funktional mit stetigen partiellen Ableitungen eine quadratische Form ist

Aus Serge Langs linearer Algebra:

Lassen F : R N R eine Funktion sein, die partielle Ableitungen der Ordnung hat 1 Und 2 , und dass die partiellen Ableitungen stetige Funktionen sind. Annehmen, dass:

F ( T X ) = T 2 F ( X )
für alle X R N . Dann F ist eine quadratische Form, dh es existiert eine symmetrische Matrix A = ( A ich J ) so dass F ( X ) = ich = 0 , J = 0 N X ich J A ich J X ich J .

Der Beweis erfordert natürlich die Berechnung mehrerer Variablen. Siehe zum Beispiel mein eigenes Buch zu diesem Thema.

Ich habe keine gründliche Erfahrung mit echter Analyse mehrerer Variablen, aber ich bin ziemlich neugierig, warum diese Funktion eine quadratische Form hat.

(1) Das Erste, was mir aufgefallen ist, ist, dass if T R , ist es durch axiomatische Definition offensichtlich, dass funktional F ( X ) ist nicht linear (aber ich bin mir nicht sicher, wie viel Bedeutung das hat).

(2) Die zweite (vielleicht etwas relevantere) Sache, die mir aufgefallen ist, ist, dass if F ( X ) hat partielle Ableitungen der Ordnung 1 die für alle durchgehend sind X R N , dann ab F können wir ableiten 1 × N Jacobi-Matrix J :

J ( F ) = [ F X 1 . . . F X N ]

Aber in diesem Fall ist die Jacobi-Matrix nicht symmetrisch, daher kann sie nicht mit einer quadratischen Form assoziiert werden.

(3) Wenn Jacobi-Matrix J existiert für F , Und F hat kontinuierliche partielle Ableitungen der Ordnung 2 , dann gibt es auch Hessisch H , Weil: H ( F ( X ) ) = J ( F ( X ) ) T . Aber die Hesse-Matrix ist im Gegensatz zur Jacobi-Matrix immer symmetrisch . Also haben wir eine Symmetrie H so dass:

H ich , J = 2 F X ich X J

was mit quadratischer Form in Verbindung gebracht werden könnte.

(4) Extra: Ich bin mir nicht sicher, wie relevant dies ist, aber ich habe auch den Satz von Clairaut berücksichtigt, der in diesem Fall in irgendeiner Nachbarschaft angewendet werden kann, da alle partiellen Ableitungen zweiter Ordnung kontinuierlich sind. (Aber das ist hier wohl vernachlässigbar).


Reicht meine "Analyse" aus, um das zu zeigen F ist eine quadratische Form mit symmetrischer Matrix damit verbunden? Gibt es eine Möglichkeit, dass Matrix damit verbunden ist F ist eigentlich hessisch? Wenn ja, warum genau?

Ihre Analyse ist sicherlich nicht ausreichend, weil Sie die Tatsache nicht genutzt haben F ( T X ) = T 2 F ( X ) . Aber ja, deine Intuition hat recht, die Matrix ist damit verbunden F ist in der Tat das hessische von F am Ursprung ausgewertet. Um dies zu beweisen, siehe meine Antwort auf diese Frage: math.stackexchange.com/questions/3297349/…
Meine Antwort dort geht jedoch davon aus F Ist C 3 , nicht nur C 2 , also muss ich sehen, ob das gleiche Argument mit dieser schwächeren Hypothese gilt (insbesondere sollten Sie die tatsächliche Menge an Regelmäßigkeit überprüfen, die bei der Anwendung des Satzes von Taylor erforderlich ist).
@peek-a-boo Danke für den Hinweis, hätte nie gedacht, dass dies mit Taylors Theorem zusammenhängt. Ich bin auch interessiert, ob Ihre Lösung vollständig mit dieser Frage kompatibel ist, insbesondere gibt es eine Annahme F ( Ö ) = 0 Und F ist eine Funktion von zwei Variablen (obwohl ich nicht sicher bin, ob das irgendetwas beeinflusst).
Schauen Sie sich die Verallgemeinerung an, die ich am Ende meiner Antwort geschrieben habe. Also, solange Sie davon ausgehen F Ist C 3 , dann gilt alles andere, was ich dort geschrieben habe, wortwörtlich für den Fall, der Sie interessiert, nämlich wann F : R N R erfüllt F ( T X ) = T 2 F ( X ) . (Beachten Sie das, indem Sie auswählen T = 0 , das impliziert schon F ( 0 ) = 0 ). (Übrigens war ich in meinem ersten Kommentar schlampig; die Matrix von F sollte doppelt hessisch am ursprung sein, da gibt's schon einen 1 / 2 aus dem Satz von Taylor)
@peek-a-boo Danke für die Verallgemeinerung! Ich denke, alles, was ich tun muss, ist einzustellen k = 2 was den Beweis erfüllen wird (aber natürlich sind auch Informationen davor sehr wichtig, wie es mit der Taylor-Erweiterung abgeleitet wird).
Ja, das stimmt, und tatsächlich habe ich gerade herausgefunden, dass es keine Notwendigkeit gibt, anzunehmen F Ist C 3 ; wir können eigentlich viel weniger annehmen. Ich kann eine Antwort schreiben, wenn Sie möchten
@peek-a-boo Klar, es wäre toll, wenn es so einen kompakten Beweis gäbe

Antworten (1)

In den Kommentaren war ich besorgt über die Menge der Regelmäßigkeitsannahmen F benötigt, damit die Aussage wahr ist, aber ich habe jetzt gemerkt, dass wir eigentlich nicht viel brauchen. Im Geiste der Verallgemeinerung, die ich in meiner anderen Antwort angeboten habe, können wir nun Folgendes sagen:

Lassen X R N gegeben und überlassen werden F : R N R eine gegebene Funktion sein, so dass für alle T R , F ( T X ) = T k F ( X ) . Nehmen wir das zusätzlich an F Ist k -mal Frechet-differenzierbar am Ursprung, 0 Dann

F ( X ) = 1 k ! D k F 0 ( X k )
wo ich benutze X k als Kurzschreibweise für das Element ( X , X ) R N × × R N k  mal

Nun, der Fall, an dem Sie interessiert sind, ist k = 2 , und in diesem Fall F Am Ursprung zweimal Frechet-differenzierbar zu sein, ist dasselbe wie das Hessische von zu sagen F (die Ableitung des Gradienten) existiert am Ursprung.

Der Beweis ist dem sehr ähnlich, den ich in der anderen Antwort gezeigt habe. Definieren G : R R von G ( T ) = F ( T X ) = T k F ( X ) . Beachte das G ist ein Abschluss k Polynom in Bezug auf die Variable T ; daher gleicht es seinem eigenen k Taylor-Polynom -ter Ordnung:

G ( T ) = G ( 0 ) + G ' ( 0 ) T + G ( 0 ) 2 ! T 2 + + G ( k ) ( 0 ) k ! T k
Aber beachte das G ( 0 ) = G ' ( 0 ) = G ( 0 ) = G ( k 1 ) ( 0 ) = 0 (weil die erste k 1 Derivate von T k am Ursprung verschwinden alle). Daher haben wir das
G ( T ) = G ( k ) ( 0 ) k ! T k .
Jetzt wählen T = 1 impliziert, dass
F ( X ) = G ( 1 ) = 1 k ! G ( k ) ( 0 )
Erinnern Sie sich jetzt daran, dass per Definition G ( T ) = F ( T X ) ; also wenn wir jetzt die multivariable Kettenregel verwenden k mal an G , dann finden wir das G ( k ) ( 0 ) = D k F 0 ( X k ) . Somit,
F ( X ) = 1 k ! D k F 0 ( X k ) .


Im konkreten Fall k = 2 , das sagt das natürlich aus F ( X ) = 1 2 D 2 F 0 ( X , X ) ; oder wenn Sie es in Bezug auf die hessische Matrix von schreiben F , und Matrixmultiplikation, dann

F ( X ) = 1 2 X T H F ( 0 ) X
( X T bedeutet transponieren, und H F ( 0 ) ist die hessische Matrix von F am Ursprung ausgewertet)


Ein Wort zu Hypothesen:

Übrigens setzt die hervorgehobene Aussage, die ich gemacht habe, weniger voraus als die Aussage in Langs Buch. Mit anderen Worten, wenn F hat kontinuierliche partielle Ableitungen bis zur Ordnung 2 (was Sie angenommen haben), dann die zweite Frechet-Ableitung von F am Ursprung, D 2 F 0 , existiert und daher kann der Satz, den ich angegeben habe, angewendet werden.

Vielen Dank für die tolle Antwort! Übrigens haben Sie nur angenommen, dass partielle Ableitungen existieren müssen und nur am Ursprung stetig sein sollten (oder äquivalent in endlichdimensionalen Fällen F sollte bei Frechet differenzierbar sein 0 ), richtig? Während Lang davon ausgegangen ist, dass partielle Ableitungen von F muss für alle stetig sein X .
@ShellRox Ich habe das nur vermutet F sollte sein k mal Frechet Differenzierbar am Ursprung (was eigentlich eine schwächere Annahme ist als die Kontinuität von k partielle Ableitungen -ter Ordnung am Ursprung). Der Beweis, den ich geliefert habe, verallgemeinert Wort für Wort, wenn wir die Domäne ersetzen R N zu einem beliebigen (sogar unendlichdimensionalen) reellen Banachraum v ; Das einzige, was in unendlichen Dimensionen ist, kann man nicht von hessischen Matrizen sprechen ... aber die Frechet-Ableitungen machen immer noch absolut Sinn. Ich denke, Lang hat diese Annahme nur gemacht, um die Aussage des Theorems zu straffen
... schließlich ist es ein Buch über lineare Algebra, kein Buch über Multivariablenrechnung
Meine Verwirrung kam von diesem Abschnitt , wo sie erwähnen, dass "Wenn alle partiellen Ableitungen von F existieren und sind dann stetig F ist Fréchet differenzierbar". Ich denke, Lang hat keine Eigenschaften und Strukturen des topologischen Raums spezifiziert R N wenn man bedenkt, dass dieses Buch nicht für wirkliche Analysen gedacht ist. Aber jetzt habe ich es verstanden, danke!