So finden Sie die Ober- und Untergrenze

Lassen Σ S + + N sei eine symmetrische positive definte Matrix mit allen diagonalen Einträgen eins. Lassen U R N × k 1 , W R N × k 2 , Λ R k 1 × k 1 Und T R k 2 × k 2 , Wo Λ Und T sind beide Diagonalmatrix mit positiven Elementen, und N > k 2 > k 1 . Wir wissen es auch verfolgen ( Λ ) = μ × verfolgen ( T ) und Summe der Absolutwerte aller Elemente von U ist weniger als W . Wie kann ich dann die Ober- und Untergrenze finden?

Σ U T U F 2 Σ W Λ W F 2

bezüglich μ , W , Λ Und Σ . Annehmen, dass Σ F 2 U T U F 2 Und Σ F 2 W Λ W F 2

Antworten (2)

Wir werden also nach Extremen der Funktion suchen

F ( μ , W , Λ , Σ ) = Σ U T U F 2 Σ W Λ W F 2

Wir stellen fest, dass der Nenner vollständig durch die Parameter der Funktion definiert ist, also ist er für Optimierungszwecke nur eine Konstante, nennen wir ihn K . Wir können das auch explizit einfügen T diagonal ist, nämlich T ich J = T ich δ ich J . Wir können ein Optimierungsproblem wie folgt schreiben: Maximiere oder minimiere die L2-Norm einer Differenz

F ( μ , W , Λ , Σ ) = 1 K ich J ( Σ ich J k T k U ich k U k J ) 2 max Ö R Mindest

Einschränkungen unterliegen:

ich T ich = 1 μ ich Λ ich ich = a

Und

| U | 1 < | W | 1 = β

Wo a Und β sind bekannte Konstanten.

Dieses Problem ist effektiv eine Lasso- Regularisierung mit einer zusätzlichen Gleichheitsbeschränkung. AFAIK, Regularisierungsprobleme dieser Art werden typischerweise numerisch gelöst, was bedeutet, dass keine expliziten analytischen Lösungen verfügbar sind.

Ich suche nach Ober- und Untergrenze, die analytisch gefunden werden können, und die Grenzen müssen sehr streng sein.
@DushyantSahoo Ich verstehe. Tut mir leid, ich habe die Frage falsch verstanden. Ich bin fälschlicherweise davon ausgegangen, dass das Ziel darin besteht, den Maximal- und Minimalwert zu finden, der viel strenger ist als eine Ober- oder Untergrenze.
Keine Sorge, ich habe eine Lösung geschrieben, bin mir aber nicht sicher, wie richtig sie ist.

Wir finden zunächst eine obere Schranke für U T U F 2 bezüglich W Und Λ -

U T U F 2 U F 4 T F 2 1 μ W F 4 Λ F 2

Nun, davon ausgegangen Σ F 2 U T U F 2 Und Σ F 2 W Λ W F 2

Σ F 2 U T U F 2 Σ U T U F 2 Σ F 2 + U T U F 2 Σ F 2 1 μ W F 4 Λ F 2 Σ U T U F 2 Σ F 2 + 1 μ W F 4 Λ F 2 Σ F 2 1 μ W F 4 Λ F 2 Σ W Λ W F 2 Σ U T U F 2 Σ W Λ W F 2 Σ F 2 + 1 μ W F 4 Λ F 2 Σ W Λ W F 2 Σ F 2 1 μ W F 4 Λ F 2 Σ F 2 + W Λ W F 2 Σ U T U F 2 Σ W Λ W F 2 Σ F 2 + 1 μ W F 4 Λ F 2 Σ F 2 W Λ W F 2
Annehmen, dass C Σ F 2 = W Λ W F 2 Wo 0 C 1 , wir bekommen

Σ F 2 1 μ W F 4 Λ F 2 ( 1 + C ) Σ F 2 Σ U T U F 2 Σ W Λ W F 2 Σ F 2 + 1 μ W F 4 Λ F 2 ( 1 C ) Σ F 2
Als W , Λ Und Σ fest sind, lassen W F 4 Λ F 2 Σ F 2 = T , dann haben wir
1 T μ ( 1 + C ) Σ U T U F 2 Σ W Λ W F 2 1 + T μ ( 1 C )