Wie behandelt man Differentiale und Infinitesimale?

In meinem Mathematikunterricht sagte mein Mathelehrer, dass Differentiale wie z d x sind keine Zahlen und sollten nicht als solche behandelt werden.

In meinem Physikunterricht scheinen wir Differentiale genau wie Zahlen zu behandeln, und mein Physiklehrer sagte sogar, dass sie im Wesentlichen sehr kleine Zahlen sind.

Kann mir jemand eine Erklärung geben, die beiden Klassen gerecht wird, oder muss ich einfach akzeptieren, dass die Differentiale in verschiedenen Kursen unterschiedlich behandelt werden?

PS Ich habe Calculus 2 genommen, also versuchen Sie bitte, die Antworten auf diesem Niveau zu halten.

PSS Fühlen Sie sich frei, die Tags zu bearbeiten, wenn Sie es für angemessen halten.

@dmckee Abhängig davon, was Sie unter "solchen Abkürzungen" verstehen, denke ich, dass sie entweder aus Gründen, die unter Anupams Link zu sehen sind, oder aufgrund der Formalisierungen der nicht standardmäßigen Analyse oder der glatten Infinitesimalanalyse vollkommen streng sind. (Für eine sehr kurze Demonstration, wie Kalkül mit ersterem ist, siehe math.stackexchange.com/a/623657/26369 )
@MarkS. Ja, es scheint, dass meine mündlichen Überlieferungsinformationen aus n-ter Hand sehr veraltet waren.
Als Nicht-Experte (obwohl in Physik ausgebildet) schien es mir zu genügen, um zu erkennen, dass Dinge wie davon ausgehen d j d x = x zu d j = x d x oder verwenden d j d x = d j d t d t d x sind keine algebraischen Operationen, wie sie auf den ersten Blick erscheinen mögen. Wir können das tun, aber es ist eine Menge komplizierter Mathematik erforderlich, um dies zu rechtfertigen (wie in diesen Antworten zu sehen ist). Also habe ich sie nicht als Zahlen betrachtet. Ich betrachtete das, was ich tat, einfach als eine Abkürzung, die es mir ermöglichte, den Überblick über das zu behalten, was ich tat, und ich stellte sicher, dass ich niemals versuchte, blindlings algebraische Operationen anzuwenden.
Wenn Ihnen jemand sagt, dass etwas keine Zahl ist, bedeutet das wahrscheinlich, dass es keine reelle Zahl ist oder dass es nicht zu den reellen Zahlen oder irgendeiner anderen Zahlenmenge gehört, die die sprechende Person im Sinn hat. Man kann zum Beispiel sagen, dass unendlich keine Zahl ist, aber es ist - zum Beispiel in der Riemann-Sphäre - aber keine reelle Zahl. Dasselbe gilt für Infinitesimale.
Da dies eine häufig gestellte Frage von Physikstudenten ist und in Physiksprache formuliert ist, scheint es eine gültige Frage zu Phys.SE zu sein. Beachten Sie auch, dass Math.SE bereits mehrere Beiträge zu Differenzialen und Infinitesimals hat.
@ jpmc26 Die Mathematik ist nicht so kompliziert. Siehe meine Antwort unten. Etwas komplizierter wird es, wenn man möglichst ohne Koordinaten auskommen möchte. Aber das ist für Calculus 2 nicht notwendig.
Es gibt keine Bemühungen, die Physik in diese Frage einzubeziehen, und sie muss trotz der Aussagen von QM migriert werden.
Das ist eine schöne Frage, denn die unterschiedliche Behandlung von Differentialen und Infinitesimalzahlen zwischen Physikkursen und Analysiskursen hat dazu geführt, dass Studenten, die im Analysisunterricht erfolgreich waren, schlecht auf ihren Physikunterricht vorbereitet sind! (Siehe journals.aps.org/prper/pdf/10.1103/PhysRevSTPER.9.020108 )
Es ist eher so, dass Physikkurse schlecht auf Studenten vorbereitet sind, die im Mathematikunterricht erfolgreich waren. ☺

Antworten (9)

Es gibt eine alte Tradition, die bis zu Leibniz selbst zurückreicht und in Physikfakultäten viel weitergeführt wird, Differentiale intuitiv als " Infinitesimalzahlen " zu betrachten. Im Laufe der Geschichte haben große Geister Leibniz dafür als informell und unwissenschaftlich kritisiert (zum Beispiel der ansonsten großartige Bertrand Russell in Kapitel XXXI von "A History of Western Philosophy" (1945)).

Aber dann geschah etwas Tiefgreifendes: William Lawvere , einer der tiefgründigsten Denker der Grundlagen der Mathematik und der Physik, lehrte die Welt die Topos-Theorie und darin die „ synthetische Differentialgeometrie “. Unter anderem ist dies ein völlig strenger mathematischer Kontext, in dem die alte Intuition von Leibniz und die Intuition vieler naiver Physiker eine volle formale Berechtigung findet. In der Synthetischen Differentialgeometrie existieren diese Differentiale explizit ("synthetisch") als infinitesimale Elemente der reellen Linie.

Eine grundlegende Darstellung, wie dies funktioniert, finden Sie im nLab unter

Beachten Sie, dass dies nicht nur eine große Maschine ist, um etwas zu produzieren, das Sie bereits kennen, wie einige unweigerlich denken werden. Im Gegenteil, dies führt zu den anspruchsvolleren Orten der modernen Physik. Die „abgeleitete“ oder „ höhere geometrische “ Version der synthetischen Differentialgeometrie umfasst nämlich die moderne D-Geometrie , die beispielsweise im Zentrum moderner Themen wie dem BV-BRST-Formalismus (siehe z . B. Paugams Übersicht ) zur Quantisierung von Eichtheorien steht, oder zum Beispiel geometrische Langlands-Korrespondenz , daher S-Dualität in der Stringtheorie .

+1 Nicht ganz auf dem von den OPs geforderten Niveau, aber in der Tat höchst interessant, und eine Sammlung dieser Art von Beiträgen dieser Art könnte dies zu einer Killerfrage und einer Reihe von Antworten machen. Sie haben mich ermutigt, Robinsons nicht standardmäßige Analyse zu schreiben, wenn ich mehr Zeit habe, wenn mir nicht jemand zuvorkommt.
Ist das infinitesimale Intervall D verwendet, um neue verallgemeinerte Elemente in unseren Raum zu schummeln X , die es in den klassischen Formulierungen nicht gibt? Einige der Links sprechen von D als Teilmenge eines Rings. Gibt es immer eine Ordnung im infinitesimalen Intervall und stellt man sich dies als eine Sammlung verschiedener kleiner Dinge vor, die mit einem Größenbegriff ausgestattet sind, um sie zu unterscheiden? Es scheint auch wie das Kock-Lawvere-Axiom (ein funktionales " ϵ 2 = 0 "?) scheint für die Erweiterung auf Infinitesimalkalküle wie den Ito-Kalkül usw. geeignet zu sein, ist das richtig? Machen wir Super-Sachen direkt, indem wir dieses Objekt hinzufügen?
Dazu gibt es zwei komplementäre Aspekte. Einerseits erlaubt die kategoriale Logik der Topos, formal von der Teilmenge der reellen Linie der Elemente zu sprechen, die zu 0 quadrieren. Genau das taten Leibniz-Anhänger ohnehin intuitiv, aber die kategoriale Logik zeigt, dass und wie genau dies konsistent ist. Anders Kock ( home.imf.au.dk/kock ) hat dann seine beiden Lehrbücher zur synthetischen Differentialgeometrie ( home.imf.au.dk/kock/SGM-final.pdf ) so geschrieben: er spricht von „synthetisch“. die Teilmenge D von R auf den Elementen, die zu 0 quadrieren, und leitet die gesamte Diff-Geometrie ab.
Andererseits kann man wählen, konkrete Modelle für die Axiome zu bauen, in denen insbesondere die Lehrbücher von Kock geschrieben sind, also für Topos, die die Kock-Lawvere-Axiome validieren. In den typischen solchen Modellen wird die Kategorie der glatten Mannigfaltigkeiten etwas erweitert durch Objekte, die als "glatte Orte" bekannt sind, die zum Beispiel den Raum umfassen, der formal dual zum "Ring der dualen Zahlen" ist, der nur der Ring ist, der die Gleichung "epsilon" verkörpert 2 = 0". Diese konkretere Inkarnation von SDG kann vollständig in klassischer Logik formuliert werden und zeigt somit, welche klassischen Begriffe die Idee der Infinitesimal verkörpern.
Hallo Urs, während ich zustimme, dass Lawveres Ansatz eine großartige Leistung ist, scheint die Darstellung der historischen Entwicklung, wie Sie es getan haben, Robinsons Beitrag zur Interpretation von Leibniz' infinitesimalen Verfahren zu kurz zu bringen. Robinsons Originalarbeit erschien 1961, was früher war als Lawveres Ansatz.
@Wet, ich würde Sie ermutigen, Ihren Plan auszuführen, eine Antwort in Bezug auf Robinsons Rahmen zu schreiben.

(Ich spreche dies aus Sicht der Standardanalyse an.)

Ich glaube nicht, dass Sie dies zufriedenstellend verstehen werden, bis Sie sich mit der Kalkül mit mehreren Variablen befassen, denn in Kalkül 2 ist es leicht, dies zu denken d d x ist alles, was Sie brauchen und was nicht nötig ist x (Das ist falsch und hat damit zu tun, warum sich Ableitungen im Allgemeinen nicht immer wie Brüche verhalten). Das ist also ein Grund, warum Differentiale nicht wie Zahlen sind. Es gibt jedoch einige Arten, in denen Differentiale wie Zahlen sind .

Ich denke, der grundlegendste Teil ist, wenn Ihnen das gesagt wird f d x = d j , das bedeutet, dass j kann angenähert werden als j ( x ) = j ( x 0 ) + f ( x x 0 ) + Ö ( ( x x 0 ) 2 ) nah dran x 0 (Dies wirft ein weiteres Problem auf*). Da dieser Term erster Ordnung wirklich alles ist, was zählt, nachdem man die einschränkenden Verfahren der Analysis angewendet hat, liefert dies ein Argument dafür, warum eine solche unangemessene Behandlung von Differentialen zulässig ist - Terme höherer Ordnung spielen keine Rolle. Dies ist eine Konsequenz aus dem Satz von Taylor und ermöglicht es Ihrem Physiklehrer, Differentiale als sehr kleine Zahlen zu behandeln, weil x x 0 ist wie dein "dx" und es IST eine reelle Zahl. Was Ihnen ermöglicht, Dinge zu tun, die Sie mit einer einzigen reellen Zahl nicht tun können, ist diese Formel für j ( x ) gilt für alle x , nicht nur irgendein x. Damit können Sie alle komplizierten Tricks der Analyse anwenden .

Wenn ich mich besonders über die unsachgemäße Behandlung von Differentialen ärgere und ich sehe, wie jemand ein Beispiel durcharbeitet, wo er schreibt: "Jetzt nehmen wir das Differential von x 2 + x geben uns ( 2 x + 1 ) d x “, kann ich mir vorstellen d x eine normale reelle Zahl ist, und dass es ein wenig gibt + Ö ( d x 2 ) zur Seite geheftet.

Ihr Mathematiklehrer könnte argumentieren: „Sie wissen nicht genug über diese Theoreme, um sie richtig anzuwenden, deshalb können Sie sich Differentiale nicht so ähnlich wie Zahlen vorstellen“, während Ihr Physiklehrer argumentieren könnte: „Die Intuition ist das Wirkliche wichtiger Teil, und Sie müssten komplizierte Mathematik lernen, um es so zu sehen Ö ( d x 2 ) . Konzentriere dich besser auf die Intuition."

Ich hoffe, ich habe die Dinge geklärt, anstatt sie komplizierter erscheinen zu lassen.

*(Die O-Notation ist ein weiterer Wurm und kann auch falsch verwendet werden. Mit der verlinkten Notation sage ich " j ( x ) j ( x 0 ) f ( x x 0 ) = Ö ( ( x x 0 ) 2 ) wie x x 0 ". Beachten Sie, dass dies als Widerspruch zu meinem Argument angesehen werden könnte - Es ist sinnlos zu sagen "ein Wert von x erfüllt diese Gleichung", also ist es, wenn es in dieser Form geschrieben wird (was Ihr Physikprofi vielleicht stumpfer und Ihr Mathematikprofi vielleicht sinnvoller findet), weniger eine Gleichung als vielmehr eine logische Aussage.)

Siehe auch: https://mathoverflow.net/questions/25054/different-ways-of-thinking-about-the-derivative

gute Antwort, aber nur an der Oberfläche kratzen. Abgesehen vom Quadrat eines Infinitesimal gibt es auch das 'Quadrat' eines Infinitesimal (das im Grunde eine Matrix ist, denken Sie an ds^2 in Landau-Lifshitz Band II). Und ds ist eigentlich keine Differentialform (soweit ich das beurteilen kann, da es nicht linear ist), es scheint ein Durcheinander zu sein.

Ich denke dein Mathelehrer hat recht. Eine Möglichkeit zu sehen, dass Differentiale keine normalen Zahlen sind, besteht darin, ihre Beziehung zu sogenannten 1-Formen zu betrachten. Ich weiß nicht, ob Sie bereits Formulare in Calculus 2 hatten, aber es ist einfach, im Internet nachzuschlagen.

Da Sie in Ihrer Frage ein Tag "Integrale" gewählt haben, möchte ich Ihnen ein Beispiel geben, das auf einem Integral basiert. Nehmen wir an, Sie haben eine Funktion f ( x 2 + j 2 ) und flächendeckend integrieren wollen EIN :

EIN f ( x 2 + j 2 ) d x d j

Das Wichtige, was hier zu erkennen ist, ist, dass die d x d j ist eigentlich nur eine Abkürzung für d x d j . Dies thingy ist eine Operation (Keilprodukt - ähnlich wie Multiplikation, aber mit etwas anderen Regeln), die Formen kombinieren kann (in diesem Fall kombiniert es zwei 1 -Formen zu a 2 -bilden). Eine wichtige Regel für Keilprodukte ist die Antikommutierung:

d x d j = d j d x

Das stellt sicher d x d x = 0 (wo ein Physiker schummeln könnte, indem er sagt, dass er alles Ordnungswidrige vernachlässigt Ö ( d x 2 ) , aber das ist wie das Mischen von Birnen und Äpfeln, ehrlich gesagt irreführend). Warum sollten sich Differentiale in Integralen so verhalten und wo ist die physikalische Bedeutung? Nun, hier können Sie über die „Händigkeit“ eines Koordinatensystems nachdenken. Zum Beispiel die Integrationsmaßnahme d x d j d z ist kartesisch „rechtshändig“. Sie können es "linkshändig" machen, indem Sie das pendeln d x mit d j erhalten d j d x d z , aber dann steht das Minuszeichen davor, was dafür sorgt, dass Ihre Integration in einem 'linkshändigen' Koordinatensystem immer noch das gleiche Ergebnis liefert wie das ursprüngliche 'rechtshändige'.

Um auf das obige Integralbeispiel zurückzukommen, nehmen wir auf jeden Fall an, Sie mögen Polarkoordinaten besser, um Ihre Integration durchzuführen. Sie führen also die folgende Substitution durch (vorausgesetzt, Sie wissen bereits, wie man totale Differentiale bildet):

x = r cos ϕ       ,       d x = d r cos ϕ d ϕ r Sünde ϕ
j = r Sünde ϕ       ,       d j = d r Sünde ϕ + d ϕ r cos ϕ

Multiplizieren Sie Ihre d x d j finden Sie, was Sie wahrscheinlich schon kennen und erwarten:

d x d j = ( d r cos ϕ d ϕ r Sünde ϕ ) ( d r Sünde ϕ + d ϕ r cos ϕ )
= d r d r = 0 Sünde ϕ cos ϕ + d r d ϕ r cos 2 ϕ d ϕ d r r Sünde 2 ϕ d ϕ d ϕ = 0 r 2 cos ϕ Sünde ϕ
= r ( d r d ϕ cos 2 ϕ d ϕ d r Sünde 2 ϕ )
= r ( d r d ϕ cos 2 ϕ + d r d ϕ Sünde 2 ϕ )
= r d r d ϕ ( cos 2 ϕ + Sünde 2 ϕ )
= r d r d ϕ

Damit lautet das oben in Polarkoordinaten ausgedrückte Integral korrekt:

EIN f ( r 2 ) r d r d ϕ

Wobei wir hier das Keilprodukt unterdrückt haben. Es ist wichtig zu erkennen, dass wenn wir die Differentiale hier nicht als 1-Formen behandelt hätten, die Transformation des Integrationsmaßes d x d j in die mit einbeziehen d r und d ϕ hätte nicht richtig geklappt!

Ich hoffe, dieses Beispiel war bodenständig genug und vermittelt ein Gefühl dafür, dass Differentiale nicht ganz sehr kleine Zahlen sind.

Interessante Interpretation von Differentialen. Aber es sollte gesagt werden, dass die Interpretation, bei der Differentiale so etwas wie kleine Zahlen sind, auch in Ihrem Beispiel gut funktioniert. In dieser traditionellen Sichtweise besteht keine Notwendigkeit, dies zu verlangen d x d j = r d r d ϕ , aber stattdessen verlangen wir, dass der letztere Ausdruck das Standard-Hypervolumen (das ist das Standardvolumen des entsprechenden Bereichs) bis zur ersten Ordnung in den Differentialen angibt. Dies führt dann zur Determinante der Jacobi-Matrix und zum Faktor r in r d r d ϕ .
Es ist irreführend zu interpretieren d x d x = 0 als Vernachlässigung von Begriffen Ö ( d x 2 ) . Ersteres ist eine geometrische Sache: Die Fläche eines Parallelogramms mit entarteten Seiten ist Null. Letzteres ist in der Theorie verankert.
@Ján: Ich bin mir nicht ganz sicher, ob ich verstehe, was du meinst, aber ich habe das Gefühl, dass, da Formen die Geometrie des Raums, über den integriert wird, effektiv codieren, wenn Sie sich wirklich dafür entscheiden, Differentiale einfach als sehr kleine Zahlen ohne Operator zu definieren -ähnlich wie die Natur, dann müssen Sie das Geometriebit auf andere Weise aufzwingen.
@Emilio: Ich stimme vollkommen zu. Deshalb habe ich darauf hingewiesen, dass es Betrug ist. Was schlecht ist. Ich habe es in keiner Weise befürwortet. Lassen Sie mich meinen Beitrag bearbeiten und deutlicher hervorheben, um solche Missverständnisse zu vermeiden.
@Kagaratsch: Wenn die Integration im euklidischen Raum erfolgt, können wir die Geometrie vergessen, es ist alles nur ein einfacher Austausch von Variablen. Vielleicht werden Formen in gekrümmten Räumen nützlicher.
@Ján: Ich persönlich bevorzuge es normalerweise, die Dinge allgemeiner zu halten. Fühlt sich in gewisser Weise strenger an.
Die Dinge sollten so einfach wie möglich gemacht werden ... obwohl ich Ihr Beispiel von Differentialformen mag, halte ich es nicht für sinnvoll, Differential durch Differentialformen zu erklären. Es sollte umgekehrt sein.
Nun, in meinem Analysis-Kurs wurden damals Differentiale per Definition als Elemente des dualen Raums und daher als 1-Form-bewertete Objekte eingeführt. Unser Prof. riet ausdrücklich von jedem „einfacheren“ Begriff für Differentiale ab. Also, ich weiß nicht...
Ich denke, dass diese Interpretation der Koordinatenänderung falsch ist. Das Integral von a n Form über ein n Kette c : [ 0 , 1 ] n R n ist definiert als
c ω = [ 0 , 1 ] n c ω ,
weil dies genau das Ergebnis einer Koordinatenänderung ergibt, wenn ω = f d x 1 d x n . Also wenn c ( [ 0 , 1 ] n ) = EIN , dürfen wir schreiben
EIN f = c ω
als Folge der Definition des Integrals von Formen. Mit anderen Worten, die Änderung der Koordinaten durch den Pullback stellt keinen Beweis für die Änderung der Formel der Variablen dar.
Dies aus einem anderen Licht zu sehen, seit dem Beweis dafür g f d x 1 = f g | det g ' | d j 1 Es ist überhaupt nicht schwierig, es würde keinen Sinn machen, all das Aufhebens zu machen, um die Formel für die Änderung der Variablen für Integrale durch komplizierte Dinge wie die Partition der Einheit zu beweisen.
Letzter Kommentar: Dies ist überhaupt keine Kritik an dem Vorschlag, Differentialformen zu studieren. Aber ich denke, dass Ron Maimons Antwort hier physical.stackexchange.com/questions/32296/… relevant ist.
Eigentlich ist dx dy die Abkürzung für den absoluten Wert von dx ^ dy! Sie können dies sehen, wenn Sie eine Koordinatentransformation mit umgekehrter Reihenfolge verwenden (z. B. Wechsel zu dphi dr statt zu dr dphi).
@pppqqq: Es tut mir leid, aber ich denke, Ihre Kommentare sind hier nebensächlich. Diese Antwort soll kein Beweis für irgendetwas sein, sondern ein Beispiel dafür, wie sehr sich Differentiale von einfachen kleinen Zahlen unterscheiden können.
@Toby: Wenn das wahr wäre, jedes Integral d x f ( x 2 ) wäre trivial Null, was eindeutig nicht der Fall ist. (Einfach ersetzen x j . Wenn d x im Integral steht die Abkürzung für | d x | , dann bekommst du f ( j 2 ) d j , ziehen Sie ein Minus heraus, indem Sie die Integrationsrichtung umkehren, und benennen Sie y wieder in x um. Sie würden erhalten, dass das Integral gleich plus oder minus selbst und daher Null sein muss. Offensichtlich kein korrektes Ergebnis im Allgemeinen.)
@Kagaratsch: Du siehst eine andere Art von Integral! Im a b f ( x ) d x , das d x ist wirklich die 1-Form d x , nicht seinen absoluten Wert (wie Sie sagen). Aber in EIN f ( x , j ) d x d j , das d x d j bedeutet nicht die 2-Form d x d j , sondern seinen absoluten Wert (wie gesagt). Diese Diskrepanz ist verwirrend, aber nur so kommen orientierungsumkehrende Substitutionen in beiden Fällen korrekt heraus.
Der Unterschied zwischen diesen liegt nicht wirklich in der Dimension, sondern eher darin, wie der Integrationsbereich spezifiziert wird. Im ersten Fall erhalten wir eine orientierte Integrationsregion, ausgehend von a zu b (selbst wenn a ist zufällig größer als b ). Im zweiten Fall ist uns lediglich ein nicht orientierter Bereich in der Ebene gegeben. Da es einfacher ist, mit Differentialformen zu arbeiten als mit ihren absoluten Werten, lernen die Leute schließlich, orientierte Regionen zu spezifizieren, aber das ist nicht die Art von Flächenintegralen, die in grundlegenden Analysis-Kursen auftaucht.
Wenn Sie sich die allgemeine Formel für die Änderung von Variablen in einem Flächenintegral in einem Analysis-Lehrbuch ansehen, sehen Sie einen Verweis auf den absoluten Wert der Jacobi-Zahl. Aber wenn Sie sich eine Beschreibung der u-Substitution für eindimensionale Integrale ansehen, dann gibt es keinen absoluten Wert. Dies ist das gleiche Problem. Auch hier kommt es nicht wirklich auf die Dimension an, sondern darauf, wie der Integrationsbereich spezifiziert wird. Schaut man sich die Formel für ein Flussintegral durch eine Fläche an, ist der Absolutwert wieder weg, weil man nun angewiesen ist, die Orientierung im Auge zu behalten.
@Toby: Der Jacobian ist nur eine bequeme Möglichkeit, den Vorfaktor zu schreiben, aber Sie nehmen nie den absoluten Wert der Differentialformen. Wiederholen Sie einfach das obige Substitutionsargument mit R N d x 1 d x 2 . . . d x N f ( x 1 2 + x 2 2 + . . . + x N 2 ) für einen der x ich um zu sehen, dass es in einer beliebigen Anzahl von Dimensionen auf die gleiche Weise funktioniert.
Ich habe es wiederholt. Ich brauchte einen absoluten Wert. Du solltest es versuchen! Eigentlich ist Ihr ursprüngliches Beispiel interessanter; versuch es mal mit EIN der Einheitskreis ist, f ( x 2 + j 2 ) = 1 (eine konstante Funktion), und parametrieren Sie sie mit 0 ϕ π und 1 r 1 (statt 0 ϕ 2 π und 0 r 1 ). Das fragliche Integral nimmt einfach die Fläche des Einheitskreises, also lautet die Antwort π . In der Tat, 0 π 1 1 | r | d r d ϕ = π . Jedoch, 0 π 1 1 r d r d ϕ = 0 .
Wenn Sie Differentialformen verwenden, müssen Sie die Ausrichtung des Koordinatensystems im Auge behalten ( r , ϕ ) , beachten Sie, dass es umgekehrt ist, teilen Sie die Region in zwei Regionen mit konsistenter Orientierung auf, richten Sie zwei Integrale ein, kehren Sie das Vorzeichen auf der einen mit umgekehrter Orientierung um und erhalten Sie die richtige Antwort als Summe. Aber die Methode in den Calculus-Büchern, die den absoluten Wert der Jacobi-Zahl verwendet, erhält die richtige Antwort, indem sie nur ein Integral verwendet, wie ich es oben getan habe. Und die Verwendung des Absolutwerts der Differentialformen reproduziert dasselbe Ergebnis.
Übrigens versuche ich nicht zu argumentieren, dass Ihre Antwort grundlegend falsch ist. Ich versuche zu korrigieren, was ich als geringfügigen Fehler sehe. Ihre Antwort ist gut, und ich habe dafür gestimmt, als ich sie zum ersten Mal sah.
Könnten Sie diese Diskussion in einen Chatroom verschieben, wenn sie fortgesetzt werden soll? Sie können den Physik-Chat verwenden oder einfach auf die Aufforderung klicken, um zum Chat zu wechseln, der erscheinen sollte, wenn Sie irgendwann versuchen, einen Kommentar zu posten.
@Toby Bartels und Kagaratsch: Soweit Ī verstanden hat, handelt es sich bei Ihrem Streit „Differenzialform vs. absoluter Wert“ eigentlich um die Sache Differenzialform vs. Dichte . Mathematiker haben sich darum gekümmert.
@Incnis Mrsi: Ja, in der Tat. Der Absolutwert einer hochrangigen äußeren Differentialform ist eine Dichte, und es gibt auch (weniger bekannte) niederrangige Dichten, die (unter anderem) als Absolutwerte von niederrangigen äußeren Differentialformen dienen. Mehr zu diesen Dichten bei MathOverflow hier: mathoverflow.net/a/90714

In der Mathematik die Notation d x ist eigentlich eine lineare Form , das heißt d x ist eine lineare Funktion, die einen Vektor a nimmt und einen Skalar ergibt.

Nehmen wir eine differenzierbare Funktion f definiert über R und bedenke es auf den Punkt a . Die Tangente an die Kurve von f am Punkt a hat eine Steigung f ' ( a ) . Der Punkt auf dieser Tangente der Abszisse b hat Ordinate f a ( b ) = f ( a ) + ( b a ) f ' ( a ) . f a ( b ) ist die lineare Näherung von f ( b ) wissen f am Punkt a .

Wir definieren dann d x ( b a ) = b a . Wir haben

(1) f a ( b ) f ( a ) = f ' ( a ) d x ( b a ) ,
und wir schreiben
d f a = f ' ( a ) d x
Das ist die Formel (1), die für lineare Formen geschrieben wurde . In der Tat die lineare Form d f a ist definiert durch
d f a ( ϵ ) = f ' ( a ) d x ( ϵ ) = f ' ( a ) ϵ .

In der Physik macht man oft die Verwechslung zwischen d x (die lineare Form) und ϵ (Das Argument von d x ). Ich hoffe, Sie verstehen warum, wenn Sie sich die letzte Gleichung ansehen.

HINWEIS . Dies mag ziemlich nutzlos erscheinen, aber in der Dimension n > 1 das wird interessanter. Sie haben in der Tat

d f a = f ( a ) d r = ( f ( a ) x 1 f ( a ) x n ) ( d x 1 d x n )
das heißt übersetzt z ϵ = ( ϵ 1 , , ϵ k ) R n ,
d f a ( ϵ ) = k = 1 n f ( a ) x k d x k ( ϵ ) = k = 1 n f ( a ) x k ϵ k ,
Weil d x k ( ϵ ) = ϵ k ( d x k ist der k t h Koordinatenformular).

Es gibt eine alte Tradition, die bis zu Leibniz selbst zurückreicht, Differentiale intuitiv als "unendlich kleine Zahlen" zu betrachten. Im Laufe der Geschichte haben große Geister Leibniz dafür kritisiert. Daher akzeptierte Russell Cantors Behauptung, dass Infinitesimale inkonsistent sind, und reproduzierte sie sogar in seinem Buch Principles of Mathematics im Jahr 1903.

Aber dann geschah 1961 etwas Tiefgreifendes: Abraham Robinson, einer der profundesten Denker der Grundlagen der Mathematik, lehrte die Welt eine rigorose Konstruktion von Infinitesimalzahlen im traditionellen Rahmen der Zermelo-Fraenkel-Mengentheorie, ausgedrückt in Begriffen der Theorie von Typen. Unter anderem ist dies ein völlig strenger mathematischer Kontext, in dem die alte Intuition von Leibniz und die Intuition vieler naiver Physiker eine volle formale Berechtigung findet. In Robinsons Rahmen existieren diese Differentiale explizit als infinitesimale Elemente eines geeigneten reellen abgeschlossenen Feldes.

Eine detaillierte Darstellung, wie dies funktioniert, befindet sich in Robinsons Buch von 1966, aber seitdem wurden einfachere Behandlungen entwickelt, wie die Bücher von Martin Davis oder Robert Goldblatt, einschließlich der Darstellung der Differenzierung über Infinitesimale.

Beachten Sie, dass dies nicht nur eine große Maschine ist, um etwas zu produzieren, das Sie bereits kennen, wie einige unweigerlich denken werden. Im Gegenteil, dies führt zu den anspruchsvolleren Orten der modernen Physik, wie sie im Buch von Albeverio et al. ausführlich entwickelt wurden:

Albeverio, Sergio; Hoegh-Krohn, Raphael; Fenstad, Jens-Erik; Lindström, Tom. Nichtstandardmethoden in der stochastischen Analysis und der mathematischen Physik . Pure and Applied Mathematics, 122. Academic Press, Inc., Orlando, FL, 1986. xii+514 S.

Anmerkung 1. Lawveres Beitrag im Rahmen der Kategorientheorie stammt aus den 1970er Jahren.

Anmerkung 2. (Als Antwort auf die Frage des Benutzers Ovi) Robinsons Rahmenwerk ist Teil der traditionellen Analyse in dem Sinne, dass es die traditionellen Zermelo-Fraenkel-Grundlagen und die klassische Logik verwendet (im Gegensatz zu Lawveres Ansatz, der sich in einem Bruch mit der klassischen Mathematik auf intuitionistische Logik stützt ). Robinsons Framework ist heute ein aktives Forschungsgebiet mit einer eigenen Zeitschrift: Journal of Logic and Analysis (siehe http://logicandanalysis.org/ ) und einer ständig wachsenden Zahl von Monographien; zuletzt von Loeb und Wolff (siehe http://www.springer.com/us/book/9789401773263 ).

Ich habe von Abraham Robinsons Analyse gehört, aber warum scheint sie nicht sehr oft verwendet zu werden? Ist sie der Mainstream-Analyse unterlegen?
@Ovi, das wäre eine schöne separate Frage .

Wie Sie an der Vielfalt der Antworten sehen, gibt es viele Möglichkeiten, Differentiale mathematisch exakt zu interpretieren.

Eine schöne einfache Interpretation ist als Koordinaten von Tangentialvektoren.

Betrachten Sie eine Gleichung

z = f ( x , j )
Beschreibung einer gekrümmten Fläche im dreidimensionalen Raum ( z ist die Höhe).

Dann die Gleichung

d z = x f ( x , j ) d x + j f ( x , j ) d j
beschreibt die Punkte ( x ¯ , j ¯ , z ¯ ) = ( x + d x , j + d j , z + d z ) der Tangentialebene am Punkt ( x , j , z ) an der Oberfläche. Diese Gleichung wird oft Tangentengleichung genannt .

Wenn Sie einen bestimmten Punkt haben ( x , j , z ) gegeben durch Koordinatenwerte als Zahlen und möchte auch einen bestimmten Punkt auf der Tangentialebene haben, für den einfach Zahlen eingegeben werden sollen d x , d j und d z . Somit können die Differenzen für Zahlen stehen. Warum nicht.

So weit, ist es gut. Nun, warum sollten die Zahlen klein sein? Wir gehen davon aus, dass die Oberfläche an der Stelle glatt ist ( x , j , z ) , bedeutet, dass f soll dort stetig differenzierbar sein. Dann

z + d z f ( x + d x , j + d j ) | ( d x , d j ) | 0  zum  | ( d x , d j ) | 0
wo d z erfüllt die obige Tangentengleichung. Hier | ( d x , d j ) | = d x 2 + d j 2 bezeichnet die euklidische Norm.

Die Teilung durch | ( d x , d j ) | lässt uns ein skaliertes Bild der Oberfläche um den Punkt herum betrachten ( x , j , z ) . Um die Winkel beizubehalten, skalieren wir das Bild gleichmäßig in alle Richtungen. Das Bild wird immer so skaliert, dass die Störung ( d x , d j ) von diesem Punkt ( x , j , z ) liegt in der Größenordnung von 1. Auch in diesem hochskalierten Bild die Höhe z + d z des gestörten Punktes ( x + d x , j + d j , z + d z ) auf der Tangentialebene passt die entsprechende Höhe immer besser f ( x + d x , j + d j ) auf der gekrümmten Fläche.

: Die Tangentialebene mit den lokalen Koordinaten d x , d j und d z Je besser die gekrümmte Oberfläche passt, desto geringer sind die Störungen d x , d j , d z sind.


Um die Dinge zu verdeutlichen, betrachten wir ein Beispiel. Lassen Sie die gekrümmte Oberfläche sein

z = x 2 j .
Wir holen den konkreten Punkt mit x = 1 und j = 2 nachgeben z = 1 2 2 = 1 . Die Tangentengleichung ist
d z = 2 x d x d j ,
und an unserem speziellen Punkt
d z = 2 d x d j .
Um einen bestimmten Punkt auf der Tangentialebene zu haben, betrachten wir die Differentiale d x = 1 4 und d j = 1 nachgeben
d z = 2 1 4 1 = 1 2 .

Die Position dieses Punktes auf der Tangentialebene im 3D-Raum ist ( x + d x , j + d j , z + d j ) = ( 1 + 1 4 , 2 + 1 , 1 1 2 ) = ( 5 4 , 3 , 3 2 ) .

Gleichzeitig x - und j -Koordinaten erhalten wir auf der gekrümmten Fläche die Höhe z ' mit

z ' = f ( x + d x , j + d j ) = f ( 5 4 , 3 ) = ( 5 4 ) 2 3 = 23 16 = 1.4375.
Es ist ein bisschen von der Höhe entfernt z + d z = 1.5 des entsprechenden Punktes auf der Tangentialebene.


Auch wenn ich hier ein numerisches Beispiel vorgestellt habe, werden in der Praxis die Differentiale häufiger als Variablen verwendet, um Beziehungen zwischen den Differentialen (mit ihrer Interpretation als Tangentenkoordinaten) zu bestimmen.

Im Zusammenhang mit Tangens koordiniert der Differentialquotient d j d x = f ' ( x ) ist das Verhältnis der Koordinaten d x und d j der Tangente am Graphen von f bei x .

Solange Sie die Division durch Null vermeiden, können Sie durch ein Differential dividieren d x (als Tangentenkoordinate).

Tobias: „ Dann die Gleichung d z = [ . . . ] beschreibt die Punkte ( x ¯ , j ¯ , z ¯ ) = ( x + d x , j + d j , z + d z ) der Tangentialebene am Punkt ( x , j , z ) an der Oberfläche. " -- Wie soll unterschieden werden, ob die angegebene Gleichung Punkte/Elemente einer Ebene beschreibt, und nicht (zum Beispiel) Elemente einer anderen Fläche, wie etwa einer "Schmiegekugel" zu der gegebenen Fläche, im Punkt ( x , j , z ) ; oder tatsächlich jede andere Oberfläche, die einen Punkt enthält ( x , j , z ) ? Oder spielt das gar keine Rolle?
Ich weiß, was du meinst. Aber nein! Alles, was ich geschrieben habe, wird wörtlich genommen. Vergessen Sie zum Lesen des Textes, was Sie in höheren Semestern über Tangentialvektoren an Mannigfaltigkeiten gelernt haben. Die obige Version funktioniert, wann immer Sie es für glatt halten m -dimensionale Untermannigfaltigkeiten von R n mit m n . Dieser Ansatz ist einfach und hilft bei praktischen Problemen, bei denen Sie einige kanonische Koordinaten haben (z. B. Hüllkurven, viele Probleme aus der Numerik, Mehrkörpermechanik in der Computersimulation usw.).
Ich habe ein Beispiel hinzugefügt, um zu zeigen, wie wörtlich man es sehen kann.
@ user12262 Eine gute Möglichkeit, die "Nichteindeutigkeit" zu verstehen, von der Sie sprechen, besteht darin, sich Tangentenvektoren als Äquivalenzklassen von vorzustellen C 1 Pfade - weil Sie zeigen können, dass diese Art der Diskussion unabhängig vom Klassenmitglied ist.
Tobias: " Ich weiß, was du meinst. " -- Fabelhaft. (Übrigens, in meinem obigen Kommentar hätte ich vielleicht besser von "Osculating ellipsoid" ("Schmiegeellipsoid") statt von Kugeln geschrieben.) " [...] wann immer Sie es für glatt halten m -dimensionale Untermannigfaltigkeiten von R n " -- Nun, ich muss noch Ihr hinzugefügtes Beispiel und den Kommentar von WSA-(RV) verdauen. Immer wenn ich " Krümmung " lese, schaue ich auf orbit.dtu.dk/en/publications/… ...
@WetSavannaAnimal alias Rod Vance: WetSavannaAnimal alias Rod Vance: „Betrachten Sie Tangentenvektoren als Äquivalenzklassen von C 1 Pfade “ -- Guter Punkt; „kommt mir bekannt vor“. (Diese Formulierung war mir in meinem ersten Kommentar zu Tobias einfach nicht eingefallen.) Also: Tobias sollte die angegebene Gleichung richtiger „Punkte der Tangentialfläche im Punkt beschreibend nennen ( x , j , z ) ", nicht wahr? Und wenn diese Frage nicht markiert calculuswäre, würde ich jetzt darauf bestehen, zu klären, wie 1. Welche Ereignisse einen " Pfad " (oder eine "Oberfläche") ausmachen? und 2. Welche davon gehören zu demselben " Äquivalenzklasse „?.
@user12262 Mit "Ich weiß, was du meinst" meinte ich eigentlich, dass ich das Zeug aus [Jänich:Vektoranalyse] oder [Abraham/Marsden:Tensor Analysis Manifolds Applications] oder [Abraham/Marsden:Math Foundations of Elasticity] kenne. Wenn Sie jedoch einen ausgezeichneten linearen euklidischen Raum haben (am besten ausgedrückt als R n ) Wenn Ihr interessantes Objekt eine Untermannigfaltigkeit ist, dann ist die obige Version ausreichend, korrekt und vor allem leicht verständlich. Wenn ich mich recht erinnere, kommt es dem sehr nahe, was Königsberger in seinem Buch „Analyse 2“ lehrt.
@ user12262 Beachten Sie, dass das Leerzeichen R n wo unsere Untermannigfaltigkeit eingebettet ist, ist ein Retter. Es vermeidet die Notwendigkeit der Äquivalenzklassen von Kurven für die Definition von Tangentenvektoren. Für eine gegebene Untermannigfaltigkeit von R n alle Kurven einer Tangentenvektor-Äquivalenzklasse an einem Punkt der Untermannigfaltigkeit haben an diesem Punkt denselben Geschwindigkeitsvektor. Dies ist der Tangentenvektor, wie in meiner Antwort definiert. (Beachten Sie, dass die Definition eines Geschwindigkeitsvektors nur mit der Umgebung sinnvoll ist R n .)
@Tobias: " [...] linearer euklidischer Raum (am besten ausgedrückt als R n ) "-- R n ist nicht "allein" euklidisch, sondern nur zusammen mit einer geeigneten "euklidischen/flachen" Abstandsfunktion " d f l a t : R n × R n R "." Für eine gegebene Untermannigfaltigkeit [...] haben alle Kurven einer Tangentenvektor-Äquivalenzklasse an irgendeinem Punkt [...] denselben Geschwindigkeitsvektor an diesem Punkt der Untermannigfaltigkeit. Dies ist der Tangentenvektor, wie in meiner Antwort definiert. " -- Es scheint ein schmaler Grat zwischen " Definition " und "einer weiteren Verschleierungsschicht" zu sein ...
@Tobias: ps Ich habe oben speziell auf SLKokkendorff verwiesen, um für die Berücksichtigung (wenn nicht in calculus, dann zumindest in physics) von metrischen Räumen (oder ihren Verallgemeinerungen) anstelle von Mannigfaltigkeiten zu werben; mit den entsprechenden Definitionen von "Krümmung" in Bezug auf Entfernungen (oder sogar nur in Bezug auf Entfernungsverhältnisse) durch Gram-Determinanten (und entsprechend von "Ebenheit" durch Cayley-Menger-Determinanten) anstelle von "etwas, das mit Koordinaten zu tun hat".
@ user12262 Entschuldigung, ich hätte schreiben sollen R n mit der euklidischen Norm ausgestattet. Danke für die Klarstellung.

Mit dem Ziel, die Komplexität auf einem Minimum zu halten, besteht die beste "vereinheitlichende" Lösung darin, Differentiale, Infinitesimale, Zahlen usw. als mathematische Symbole zu betrachten, auf die bestimmte Merkmale, Eigenschaften und mathematische Operationen (Regeln) anwendbar sind.

Da nicht alle Regeln auf alle Symbole anwendbar sind, müssen Sie lernen, welche Regeln auf einen bestimmten Satz von Symbolen anwendbar sind.

Egal, ob Sie Brüche, Dezimalzahlen, Differentiale usw. lernen, lernen Sie einfach die Symbole und ihre besonderen Regeln und Operationen, und das wird für 99 % der Zeit ausreichen.

Dies scheint die Frage zu "beantworten", indem es sagt: "Sie sollten die Regeln lernen, die Sie auf Differential- und Infinitesimale anwenden können" . So weit es geht, ist es richtig, aber es hilft nichts.

Die strenge mathematische Bedeutung von Infinitesimalen wird in der Analyse mit dem gegeben ϵ - δ Definition einer Grenze. Was die Physik betrifft ϵ bezieht sich im Allgemeinen auf experimentelle Genauigkeit oder Fehlerspanne. Das bedeutet es δ eine Zahl ist, die klein genug ist, dann macht eine Verkleinerung keinen praktischen Unterschied zu den Vorhersagen.

Das Formale ϵ - δ Die Definition einer Grenze bedeutet streng genommen nicht den Endpunkt eines unendlichen Prozesses, sondern bedeutet einfach, dass es empirisch bedeutungslos ist, den Prozess weiter fortzusetzen.

Den Grund werden Mathematiker nicht verwenden d x als Zahl ist das d x wird nur als Teil eines Ausdrucks definiert, nicht als etwas an sich. In der Physik d x kann gemeint sein δ x , eine Zahl, die ausreichend klein ist, dass die experimentelle Genauigkeit nicht beeinträchtigt wird.

Ich stimme den bereits geposteten Antworten zu, aber ich habe das Gefühl, dass ihnen ein wichtiger Aspekt fehlt: Differentiale sind mathematische Objekte , und für einen Physiker sind sie ein theoretisches Werkzeug (ein sehr wichtiges!), Aber immer noch ein Werkzeug und wie alles, was es nicht gibt Ein experimentelles Ergebnis (oder ein Versuch einer grundlegenden Theorie) darf nicht so verwendet werden, dass es nützlich ist, und nicht so, wie es "sein sollte".

Nimm einen Schraubenschlüssel. Wenn Sie einen Designer fragen, ob der Schraubenschlüssel ein Hammer ist, erhalten Sie höchstwahrscheinlich zu Recht ein Nein, denn das ist er nicht. Aber wenn Sie einen Nagel festnageln müssen und feststellen, dass Schraubenschlüssel gut funktionieren und aus irgendeinem Grund leichter erreichbar sind, dann verwenden Sie Schraubenschlüssel!

Differentiale werden in der Physik oft als etwas verwendet, was sie nicht sollen: In der Kettenregel können Sie sie als Bruch behandeln, in der Jacobi-Regel können Sie sie als winzige Längenelemente in Richtung der verschiedenen Koordinaten behandeln. Bedeutet dies, dass es sich um Bruchteile oder winzige Längen handelt? Absolut nicht! Aber wenn es funktioniert (das heißt, Sie erhalten ein Ergebnis, das experimentell korrekt ist), gibt es keinen Grund, warum Sie es nicht verwenden sollten. Es gibt Zeiten, in denen es nicht gehtArbeit: In diesen Fällen haben Sie Newtons Flaming Laser Sword nicht an Ihrer Seite und müssen die Dinge ausrechnen. Wenn Sie nicht wissen, was Differentiale wirklich sind, bleibt Ihr Wissen natürlich unvollständig, aber Ihre Berechnungen werden in den oben genannten Fällen immer noch richtig sein. Wie mein Lehrer für Analysis immer sagte: "Ingenieure verwenden Differentiale immer als Brüche, Mathematiker immer als Differentialformen, Physiker lernen, dass es sich um Differentialformen handelt, und verwenden sie dann als Brüche."