Wie man zeigt, dass f:Rn→R,f(x)=log[∑ni=1exi]f:Rn→R,f(x)=log⁡[∑i=1nexi]f:\mathbb{R}^n \to\mathbb{R},\quad f(x)=\log\big[\sum_{i=1}^{n}{e^{x_i}}\big] ist konvex auf domf=Rnf=Rnf= \mathbb{R}^n

Im Moment habe ich folgendes: set j ich = e X ich j ich X ich = j ich

X F = 1 ich = 1 N j ich [ j 1 j N ]

X 2 F ich J = { 1 ( k = 1 N j k ) 2 j ich ( k = 1 N j k j ich ) , ich = J 1 ( k = 1 N j k ) 2 j ich j J , ich J

Das muss ich jetzt zeigen X 2 F ist positiv semidefinit, aber ich stecke hier fest. Auch Bedingungen erster Ordnung und direkter Beweis per Definition der Konvexität versucht, aber auch dort hängengeblieben.

Was ist e ich X ? Meinten Sie e X ich ?
ja, habe das korrigiert.
Ich habe in Boyd gelesen, dass die Summe konvexer Funktionen konvex ist, ich meine, dass die Summation die Konvexität bewahrt, was leicht zu zeigen ist. Außerdem gibt es ein weiteres Merkmal, das besagt, dass log (eine konvexe Funktion) auch konvex ist. Sie können sie auf Boyd Book finden.
Das ist falsch, der Logarithmus einer konvexen Funktion ist nicht unbedingt konvex.
@Cardinal Einfaches Gegenbeispiel: F ( X ) = X ist konvex, aber ln ( X ) ist nicht. Sie scheinen an log-konvexe Funktionen zu denken .
@AG Du meinst, es ist konkav? f(x)=x ist in Ihrem Kontext jedoch nicht konvex und muss als affine Funktion betrachtet werden
@AG Ich meinte, konvex und konkav sind relativ. Ich meine - konvex = konkav
@Kardinal F ( X ) = X ist mit Sicherheit konvex. Es ist natürlich auch konkav und affin.
Aber gut, noch ein Gegenbeispiel: F ( X ) = X 2 . Sein Logarithmus ist nicht konvex.
OK du hast recht. vergiss niemals konvex und konkav unterscheiden sich nur durch ein einziges Minus. Konvexität lässt sich also leicht durch Konkavität beweisen. Lasst diese blöde Diskussion hier ausklingen
Der Beweis kann in einer Zeile geführt werden, wenn man annimmt, dass die Summe von log-konvex log-konvex ist. Beachten Sie das jeweils e X ich ist log-konvex. Die Aussage über die Summe zu beweisen ist etwas länger (dauert mehrere Zeilen). Siehe Satz 6.3.4., Teil (e) mit dem Beweis auf der nächsten Seite.
@AG-Seiten, auf die Sie verwiesen haben, werden nicht angezeigt
@hsydreba ok, Skizze: F , G log-konvex, dh F = e F , G = e G für konvex F , G . Wir müssen beweisen ln ( F + G ) = ln ( e F + e G ) konvex, aber es ist die Zusammensetzung von konvex und zunehmend in jedem Argument ln ( e X 1 + e X 2 ) und konvex F , G , also konvex (die Kompositionsregel).
Hier solltest du mal vorbeischauen

Antworten (3)

Definieren S = ich j ich ; Dann

2 F ( X ) = S 2 ( S diag ( j ) j j T )
Jetzt zeigen wir das 2 F ( X ) 0 ; oder äquivalent dazu v T ( 2 F ( X ) ) v 0 für alle v R N . Wir haben
S 2 v T ( 2 F ( X ) ) v = v T ( S diag ( j ) j j T ) v = ich j ich ich j ich v ich 2 ( ich j ich v ich ) 2
Diese Größe ist nichtnegativ. Um zu sehen, warum, definieren Sie z ich = j ich 1 / 2 Und w ich = j ich 1 / 2 v ich , ich = 1 , 2 , , N . Dann
ich j ich v ich = ich z ich w ich z 2 w 2
durch die Cauchy-Schwarz-Ungleichung. Wir haben beide Seiten quadriert
( ich j ich v ich ) 2 ( ich z ich 2 ) ( ich w ich 2 ) = ( ich j ich ) ( ich j ich v ich 2 )
Was das feststellt
ich j ich v ich 2 ( ich j ich v ich ) 2 0 v T ( 2 F ( X ) ) v 0
Das Hessische ist überall positiv semidefinit. Beachten Sie, dass es nicht positiv definit ist; 2 F ( X ) 1 = 0 für alle X . Diese Funktion ist also nicht streng konvex; nur "einfach alt" konvex. :-)

Belissimo! Danke!
Eine Anmerkung : D ich A G ( v ) v v T (der Fall S = 1 ) ist die Varianzmatrix der Multinomialverteilung.

Skizze: Let A , B R N . Zum Zeigen reicht es F ( A + T B ) ist eine konvexe Funktion von T R . Differenziere dies zweimal bzgl T dies zu sehen, läuft auf Zeigen hinaus

( k = 1 N e A k + T B k ) ( k = 1 N B k 2 e A k + T B k ) ( k = 1 N B k e A k + T B k ) 2 .

Diese Ungleichheit kann als angesehen werden

μ ( E ) E F 2 D μ ( E F D μ ) 2

für die richtige Auswahl dieser Symbole.

Noch ein weiterer Ansatz für diejenigen, die "schmutzige" Arbeit vermeiden möchten N × N Hessen. Zuerst machen wir eine Bemerkung

Anmerkung: Es ist leicht zu erkennen, dass die Funktion G ( T ) = ln ( e T + 1 ) ist konvex und zunehmend ( G ' ( T ) 0 Und G ( T ) 0 ). Also die Funktion G F ist konvex für jede konvexe F .

Beweisen wir die Konvexität durch Induktion über die Dimension.

Base N = 2 : die Funktion

H 2 ( X ) = ln ( e X 1 + e X 2 ) = ln ( ( e X 1 X 2 + 1 ) e X 2 ) = ln ( e X 1 X 2 + 1 ) + X 2
durch die obige Bemerkung wo konvex ist F ( X ) = X 1 X 2 .

Schritt N 1 Zu N : machen Sie den gleichen Trick mit X N

H N ( X ) = ln ( e X 1 + + e X N 1 + e X N ) = = ln ( e X 1 X N + + e X N 1 X N + 1 ) + X N = = ln ( e ln ( e X 1 X N + + e X N 1 X N ) + 1 ) + X N .
Nach der gleichen Bemerkung oben ist diese Funktion konvex, wenn ln ( e X 1 X N + + e X N 1 X N ) ist konvex. Aber letzteres ist H N 1 ( A X ) Wo
A = [ 1 0 0 1 0 1 0 1 0 0 1 1 ]
das ist eine Überlagerung von konvex und affin, was konvex ist.

Sehr sehr cool.
Überwältigender Ansatz! Danke!