Ableitung einer Funktion dividiert durch ihre Norm, also ϕ(x)=f(x)∥f(x)∥ϕ(x)=f(x)‖f(x)‖\phi(x) = \frac{ f(x)}{\|f(x)\|}

Einstellung

F : R N R N Und sei die übliche euklidische Norm. Ich möchte die Ableitung nach berechnen X von

ϕ ( X ) = F ( X ) F ( X )

Mein Lösungsversuch

X F ( X ) | | F ( X ) | | = X F ( X ) | | F ( X ) | | + F ( X ) X ( F ( X ) F ( X ) ) 1 2 = X F ( X ) | | F ( X ) | | 1 2 F ( X ) | | F ( X ) | | 3 2 F ( X ) X F ( X ) = ( ICH F ( X ) F ( X ) | | F ( X ) | | 2 ) X F ( X ) | | F ( X ) | |
Allerdings bin ich mir da sehr unsicher. Insbesondere habe ich das Gefühl, dass die zweite Amtszeit wäre F ( X ) X F ( X ) und damit führen
X F ( X ) | | F ( X ) | | = X F ( X ) | | F ( X ) | | X F ( X ) | | F ( X ) | | = 0
Dies würde jedoch nicht viel Sinn machen, da der Gradient es sicherlich nicht ist 0 für jede Funktion.

hast du da irgendwelche vermutungen F ?
Ich nehme gerne an, was ich brauche, damit dies funktioniert. Zum Beispiel glücklich für G Lipschitz-stetig und/oder beschränkt sein. @NickCastillo
@NickCastillo Also in der Praxis G wird die Gradientenfunktion einer anderen Funktion sein F : R N R . Ich kenne auch die hessische Funktion H : R N R N × N ist wohldefiniert (dh die hessische H ( X ) = X G ( X ) existiert)

Antworten (3)

Getrennt F in zwei Komponenten: seine Länge ( λ ) und Richtung ( ϕ )

λ 2 = F 2 λ D λ = F T D F ϕ = λ 1 F
Berechnen Sie das Differential von ϕ
D ϕ = λ 1 D F λ 2 F D λ = λ 1 D F λ 3 F ( λ D λ ) = λ 1 ICH D F λ 3 F ( F T D F ) = λ 1 ( ICH ϕ ϕ T ) D F
Nun differenziere nach X
ϕ X = ( ICH ϕ ϕ T λ ) F X
Ihre ursprüngliche Lösung war also absolut richtig. Und Sie können das berühmte Ergebnis beweisen, dass Einheitsvektoren senkrecht zu ihren Gradienten stehen
ϕ T ( ϕ X ) = ( ϕ T ( 1 ) ϕ T λ ) F X = ( 0 λ ) F X = 0

Dies ist eine großartige Lösung. Eine Sache stört mich. Wie λ D λ = F T D F ? Vor allem warum“ F T ".
@ user550103, hast du λ 2 = λ λ = F 2 = F T F , So D ( λ λ ) = ( D λ ) λ + λ ( D λ ) = 2 λ D λ , das gleiche für D F T F = ( D F T ) F + F T D F = 2 F T D F , zurück zur Gleichheit: 2 λ D λ = 2 F T D F λ D λ = F T D F
@MathLearner Danke. In der Tat (das passiert, wenn Sie bald in den Urlaub fahren möchten ...)

Da die Einsätze für den Gradienten gering sind, berechnen wir die Gesamtableitung von ϕ folgendermaßen:

D P ϕ ( v ) = D P F ( v ) F ( P ) F ( P ) 1 2 F ( P ) 2 D P F ( v ) , F ( P F ( P ) 2 = 1 F ( P ) ( D P F ( v ) F ( P ) F ( P ) F ( P ) F ( P ) , D P F ( v ) , ) ,
was ein ziemlich angenehmes Ergebnis ist, da es die Senkrechte von ist D P F ( v ) Zu F ( P ) , skaliert durch die Länge von F ( P ) .

Ich werde die Berechnung in Standardkoordinaten darstellen. Dein ϕ ist die Zusammensetzung von u ( X ) = X / X Und F ( X ) , dh

ϕ ich ( X ) = u ich ( F ( X ) ) , u ich ( X ) = X ich X .
Für X weg vom Ursprung, wie u ich ( X ) = ich X , und da ( 1 / X ) ' = 1 / X 2 , Produkt und Kettenregel gibt
k u ich = δ ich k X X ich X k X 3 .
Oder, wenn Sie es vorziehen, u = 1 X ICH N 1 X 3 X X T . So lange wie F vermeidet den Ursprung, gibt Kettenregel
J ϕ ich = k = 1 N k u ich ( F ( X ) ) J F k ( X ) = J F ich ( X ) F ( X ) 1 F ( X ) 3 k = 1 N F ich ( X ) F k ( X ) J F k
dh der Jacobi ist
ϕ = F F 1 F 3 F F T F .


Zu Ihrer letzten Bemerkung zum Gefühl: Der Fehler in Ihrer Intuition ist, dass Sie ersetzt haben F F T R N × N mit dem Skalar F T F = F 2 . Dies ist tatsächlich (wie Sie im Grunde gesagt haben) der Unterschied zwischen den beiden Begriffen. Tatsächlich ergibt sich dies bereits aus der obigen Formel für u = ich J X .

Als X "skaliert" wie eine Potenz von X , zwei Ableitungen sollten wie "skalieren". X 1 2 = 1 / X . Das ist genau das, was wir sehen, außer im Fall der Dimension N = 1 wo die Ableitung tatsächlich genau steht 0 Wo immer definiert (!!) In höheren Dimensionen gibt es einfach mehr Funktionen, die die gleiche Skalierung haben, was zu Ihrem Fehler führt.