Aufgabe 3.6: Partitionierungsungleichung
Die Kullback–Leibler–Distanz (kurz KLD) wird auch in der „Partitionierungsungleichung” (englisch: "Partition Unequality") verwendet:
- Wir gehen von der Menge X={x1,x2,...,xM} und den Wahrscheinlichkeitsfunktionen
- PX(X)=PX(x1,x2,...,xM),
- QX(X)=QX(x1,x2,...,xM),
- aus, die „in irgendeiner Form ähnlich” sein sollen.
- Die Menge X unterteilen wir in die Partitionen A1,...,AK, die zueinander disjunkt sind und ein vollständiges System ergeben:
- K⋃i=1=X,Ai∩Aj=ϕfür1≤i≠j≤K.
- Die Wahrscheinlichkeitsfunktionen bezüglich der Partitionierungen A1, A2,..., AK bezeichnen wir im Folgenden mit
- P(A)X=[PX(A1),...,PX(AK)],wobeiPX(Ai)=∑x∈AiPX(x),
- Q(A)X=[QX(A1),...,QX(AK)],wobeiQX(Ai)=∑x∈AiQX(x).
Bitte beachten Sie: Die Partitionierungsungleichung liefert hinsichtlich der Kullback–Leibler–Distanzen folgende Größenrelation:
- D(P(A)X||Q(A)X)≤D(PX||QX).
In Teilaufgabe (1) soll die Kullback–Leibler–Distanz der beiden Wahrscheinlichkeitsfunktionen PX(X) und QX(X) für X={0, 1, 2} ⇒ |X|=3 ermittelt werden.
- Danach soll die Menge X mit K=2 partitioniert werden entsprechend
- A={A1, A2} mit A1={0} und A2={1, 2} ,
- B={B1, B2} mit B1={1} und B2={0, 2},
- C={C1, C2} mit C1={2} und C2={0, 1},
- Anschließend sollen die jeweiligen Kullback–Leibler–Distanzen angegeben werden:
- D(P(A)X||Q(A)X),
- D(P(B)X||Q(B)X),
- D(P(C)X||Q(C)X).
- In der Teilaufgabe (5) wird schließlich nach den Bedingungen gefragt, die erfüllt sein müssen, damit in der obigen Ungleichung das Gleichheitszeichen zutrifft.
Hinweise:
- Die Aufgabe gehört zum Kapitel Einige Vorbemerkungen zu zweidimensionalen Zufallsgrößen.
- Insbesondere wird Bezug genommen auf die Seite Relative Entropie – Kullback-Leibler-Distanz.
- Die beiden Wahrscheinlichkeitsfunktionen können aus obiger Grafik wie folgt abgelesen werden:
- PX(X)=[1/4, 1/2, 1/4],QX(X)=[1/8, 3/4, 1/8].
Fragebogen
Musterlösung
(1) Für die Kullback–Leibler–Distanz der nicht partitionierten Mengen X und Y gilt:
- D(PX||PY)=E[log2PX(X)PY(X)]=∑x∈XPX(x)⋅log2PX(x)PY(x)
- ⇒D(PX||PY)=12⋅log21/23/4+2⋅14⋅log21/41/8=12⋅log223+12⋅log2(2)=1−12⋅log2(3)=0.2075(bit)_.
(2) Mit der Partitionierung A ⇒ A1={0} , A2={1,2} erhält man P(A)X(X)={1/4, 3/4} und Q(A)X(X)={1/8, 7/8}. Daraus folgt:
- D(P(A)X||Q(A)X)=14⋅log21/41/8+34⋅log23/47/8=14⋅log2(2)+34⋅log267=0.0832(bit)_.
(3) Mit Partitionierung B ⇒ B1={1} , B2={0, 2} lauten die Wahrscheinlichkeitsfunktionen P(B)X(X)={1/2, 1/2} und Q(B)X(X)={3/4, 1/4}.
- Analog zur Teilaufgabe (2) erhält man so:
- D(P(B)X||Q(B)X)=12⋅log21/23/4+12⋅log21/21/4=0.2075(bit)_.
- Das Ergebnis stimmt mit dem der Teilaufgabe (1) überein ⇒ Bei der Mit Partitionierung B gilt das Gleichheitszeichen.
(4) Mit der Mit Partitionierung C ⇒ C1={2} , C2={0, 1} erhält man P(C)X(X)={1/4, 3/4} , Q(C)X(X)={1/8, 7/8},
also die gleichen Funktionen wie bei der Partitionierung A ⇒ Lösungsvorschlag 1.
(5) DiePartitionierung B hat zum Ergebnis D(P(B)X||Q(B)X)=D(PX||QX) geführt.
- Für diesen Fall ist also
- PX(1)QX(1)=1/23/4=23, PX(B1)QX(B1)=1/23/4=2/3,
- PX(0)QX(0)=1/41/8=2, PX(B2)QX(B2)=1/21/4=2,
- PX(2)QX(2)=1/41/8=2, PX(B2)QX(B2)=1/21/4=2.
- Es muss demnach für alle x∈X gelten:
- PX(x)QX(x)=PX(B1)QX(B1),falls x∈B1,PX(x)QX(x)=PX(B2)QX(B2),falls x∈B2.
- Durch Verallgemeinerung erkennt man, dass beide Lösungsvorschläge richtig sind.