Wie funktioniert die Idee eines Differentials dxdx\text{d}x, wenn Ableitungen keine Brüche sind?

Ich ging einige alte Arbeiten durch und hatte eine Frage zu Differenzialen .

Ich kenne diese Derivate D j ( X ) D X sind keine Brüche, sondern ein Operator D D X auf die Funktion j ( X ) . (Lesen Sie dies ).

Aber wenn wir diese Definition haben: D j = D j D X D X , soll dies etwas sein, das wir einfach definiert haben, weil es funktioniert, oder können wir dies ausdrücken, ohne "den Bruch umzuordnen".

Wenn wir beispielsweise versucht haben, dasselbe mit multivariablen Funktionen zu tun, funktioniert diese „Abbruch“-Logik nicht unbedingt.

Ich habe diese Substitution viele Male verwendet, aber nie ganz verstanden, was das Differential selbst darstellt, daher wäre jede Erklärung dazu willkommen.

Wenn ich versuchen würde, es zu erklären, würde ich am Ende nur die ersten paar Kapitel dieses Textes wieder hervorwürgen . Ein Großteil der begrifflichen Verwirrung, der Sie in der Analysis begegnen, liegt daran, dass Sie nicht zuerst etwas über Vektoren und Co-Vektoren gelernt haben.
Ich denke, dy/dx ist ein Bruch. Es funktioniert auch gut mit multivariablen Gleichungen. Die Schwierigkeit sind Differentiale höherer Ordnung, aber sehen Sie in meinem Artikel "Extending the Algebraic Manipulability of Differentials" nach, wie man diese ebenfalls zum Laufen bringt.

Antworten (2)

Eine Möglichkeit, sie zu betrachten, ist als Eins-Formen. Siehe Hilfe zum Verständnis des Ausdrucks für die Ableitung einer Funktion für die Situation mit mehreren Variablen. Die Idee ist, dass (in einer einzigen Variablen) eine differenzierbare Funktion gegeben ist F : R R , und ein Punkt A R , Die Quantität F ' ( A ) R ist das, was wir uns geometrisch als Steigung am Punkt vorstellen ( A , F ( A ) ) des Diagramms von F (eigentlich sollte dies logischerweise eine Definition für den Begriff "Steigung an einem Punkt" sein).

Nun, was ich Ihnen vorschlage, ist, anstatt an die einzelne Zahl zu denken F ' ( A ) , betrachten wir die lineare Transformation L F , A : R R definiert als

L F , A ( H ) := F ' ( A ) H
Welche Bedeutung hat diese lineare Transformation? Durch Umschreiben der Definition der Ableitung F ' ( A ) = lim H 0 F ( A + H ) F ( A ) H , wir bekommen
F ( A + H ) F ( A ) = L F , A ( H ) + R A ( H )
Wo R A ( H ) ist der "Rest"-Begriff, der "klein" in dem Sinne ist, dass lim H 0 R A ( H ) H = 0 . Nun fordert die traditionelle Notation, dass die LHS als bezeichnet wird Δ F A ( H ) Und L F , A bezeichnet werden als D F A ( H ) oder D F A ( H ) . Daher erhalten wir die sehr einprägsame Gleichung
Δ F A ( H ) = D F A ( H ) + R A ( H )
"tatsächliche Änderung der Funktion an einem Punkt gleich einem linearen Term plus einem kleinen Fehlerterm". Beachten Sie, dass dies nichts anderes als eine einfache algebraische Umschreibung der Definition einer Ableitung ist, aber sehr mächtig ist, weil dieselbe Idee in höheren Dimensionen verwendet werden kann: Wir verschieben unsere primäre Perspektive von Steigungen zu linearer Annäherung, einfach weil lineare Algebra es ist ein sehr gut untersuchtes und leistungsfähiges Werkzeug, um all diese Informationen systematisch zu organisieren (in einer Dimension ist lineare Algebra fast trivial, weshalb wir diese Perspektive nicht betonen).

Nun also zu einer differenzierbaren Funktion F : R R , anstatt die Ableitung zu betrachten F ' : R R , betrachten wir stattdessen das Objekt D F , die für jeden Punkt A R ergibt eine lineare Transformation D F A : R R , wobei die Interpretation die für einen "Verschiebungsvektor vom Punkt ist A " H R , D F A ( H ) ist die lineare Näherung des tatsächlichen Fehlers Δ F A ( H ) .

Das ist alles, was zur Definition von gehört D F ; es ist nur eine einfache Neuinterpretation der Funktion F ' . Als nächstes, was bedeutet D X bedeuten? Nun, jetzt verstehen wir das D wirkt auf differenzierbare Funktionen, also was Funktion ist X ? Nun, es ist Tradition, es zu verwenden X : R R die Identitätsfunktion bedeuten, dh für jeden Punkt A R , legen wir fest X ( A ) := Ausweis R ( A ) := A . Das lässt sich nun leicht nachweisen D X A = Ausweis R (Alles, was dies sagt, ist das X ' ( A ) = 1 für alle A ). Deshalb,

D F A ( H ) = F ' ( A ) H = F ' ( A ) D X A ( H ) = ( F ' D X ) A ( H )
Aus diesem Grund schreiben wir die Verschiebung nicht H nirgendwo, noch der Punkt der Bewertung der Ableitung A , landen wir bei D F = F ' D X , wo jetzt beide Seiten eine richtige Definition haben.


Notiz:

Da wir uns in dieser Antwort nur mit Funktionen befassen, die in Vektorräumen definiert sind, wie z R (oder in meiner anderen verlinkten Antwort, R N ), habe ich eine sorgfältige Unterscheidung zwischen dem Vektorraum und seinem Tangentenraum an einem Punkt vermieden. Aber hoffentlich, mit dieser Einführung, zukünftige Begegnungen mit D F A am Tangentialraum bei definiert wird A würde nicht so zufällig erscheinen.

Und um noch etwas hinzuzufügen: Einmal angekommen D F = F ' D X es ist ganz natürlich, dies umschreiben zu lassen als F ' = D F D X (obwohl die fraktionsfreie Form überraschend nützlich ist).
@EikeSchulte vielleicht ist es natürlich, aber ich bin der Meinung, nur weil man kann, heißt das noch lange nicht, dass man sollte. Wie es in der linearen Algebra üblich ist, ist das Definieren von Quotienten immer eine knifflige Angelegenheit, die Sie möglichst vermeiden sollten. Hier würde ich es vorziehen, ein solches Umschreiben der Notation zu vermeiden, da eine korrekte Interpretation erfordern würde, dass wir alle Argumente wieder einsetzen: F ' ( A ) = D F A ( 1 ) D X A ( 1 ) , und plötzlich ist alle Einfachheit verloren. Und wenn wir uns mit mehreren Variablen befassen, gibt es keinen einfachen Weg F X ich ist ein Quotient von D F Und D X ich .
(Natürlich können wir sagen F X ich ( A ) = D F A ( e ich ) D X A ich ( e ich ) , Wo e ich = ( 0 , , 1 , 0 ) ist der ich T H Standard-Basisvektor ... aber all dies noch einmal in blutigen Details aufzuschreiben, nur um eine richtige Interpretation als Quotient zu liefern, nur um eine gewisse "Bruchheit" zu bewahren, scheint mir zu weit hergeholt)
Ich stimme dem irgendwie zu, aber die Erwähnung des Bruchs verbindet sich mit der ursprünglichen Frage. Vielleicht ist es am besten, wenn ich meinen Kommentar einfach stehen lasse, damit die Verbindung da ist, ohne zu einer Empfehlung zu werden. (Und wahr: Brüche für partielle Ableitungen sind (im Grunde) Unsinn.)

Nun, wir behandeln nicht wirklich D j D X als Brüche. Jedes Mal, wenn Sie sehen, dass es als Bruch manipuliert wird, erinnern Sie sich einfach daran, dass alles, was Sie tun, tatsächlich ein bewiesenes Theorem ist, das Sie noch nicht kennen. Die Leibniz-Notation wird verwendet, wenn Ableitungen definiert werden, und diese Notation ist so schön angelegt, dass sie in den meisten Fällen wie Brüche behandelt werden können.

Sie wissen zum Beispiel

D j / D T D X / D T = D j D T
Hier haben Sie nicht einfach abgesagt D T . Wenn Sie dies als Übung versuchen, verwenden Sie einfach die Grenzwertdefinition einer Ableitung und lösen Sie sie auf, Sie werden sehen, dass dies in der Art und Weise, wie Ableitungen definiert werden, tatsächlich wahr ist und sie dafür keine Brüche sein müssen.

Hier ist die Limitdefinition von Derivaten.

D j D X = lim Δ X 0 j ( X + Δ X ) j ( X ) Δ X

Nun, wenn die beiden Variablen X Und j parametrisch definiert sind und Sie die Rate finden möchten, mit der die Funktion j ändert sich hinsichtlich der Funktion X , müssen wir uns der Tatsache bewusst sein, dass diese beiden Funktionen von einer Variablen abhängig sind T . Wenn Sie nun die Änderungsrate finden möchten, müssen Sie herausfinden, wie sich diese beiden Funktionen ändern T . Deshalb wird die Schreibweise geändert in D j / D T D X / D T . Jetzt wird die Grenzdefinition davon,

D j / D T D X / D T = lim Δ T 0 ( j ( T + Δ T ) j ( T ) Δ T ) lim Δ T 0 ( X ( T + Δ T ) X ( T ) Δ T )

Sie würden sehen, dass das geschrieben werden kann als

D j / D T D X / D T = lim Δ T 0 ( j ( T + Δ T ) j ( T ) Δ T ) ( X ( T + Δ T ) X ( T ) Δ T )

Jetzt die Δ T Terme werden in den jeweiligen Nennern gestrichen und Sie haben übrig,

D j / D T D X / D T = lim Δ T 0 j ( T + Δ T ) j ( T ) X ( T + Δ T ) X ( T )

Jetzt behandeln Sie D j als j ( T + Δ T ) j ( T ) Und D X als X ( T + Δ T ) X ( T ) als Kleingeld rein j Und X bzw. Deshalb die Notation D j / D X . Ebenso wie Δ T 0 ist definiert als D T . Dies ist völlig zutreffend. Versuchen Sie, es für andere Theoreme zu beweisen, aber seien Sie vorsichtig D X / D j = 1 D j / D X um wahr zu sein, sollte die Funktion auch invertierbar sein.

Eine Intuition zu haben, dass sie wie Brüche funktionieren, hilft, aber Sie müssen sich dessen bewusst sein D D X ist ein Operator.