Aufgabe 3.6: Partitionierungsungleichung

Aus LNTwww
(Weitergeleitet von 3.6 Partitionierungsungleichung)
Wechseln zu:Navigation, Suche

Wahrscheinlichkeitsfunktionen  PXQX

Die  Kullback–Leibler–Distanz  (kurz KLD) wird auch in der „Partitionierungsungleichung”  (englisch:  "Partition Unequality")  verwendet:

  • Wir gehen von der Menge  X={x1,x2,...,xM}  und den Wahrscheinlichkeitsfunktionen
PX(X)=PX(x1,x2,...,xM),
QX(X)=QX(x1,x2,...,xM),
aus, die „in irgendeiner Form ähnlich” sein sollen.
  • Die Menge  X  unterteilen wir in die Partitionen  A1,...,AK, die zueinander  disjunkt  sind und ein  vollständiges System  ergeben:
Ki=1=X,AiAj=ϕfür1ijK.
  • Die Wahrscheinlichkeitsfunktionen bezüglich der Partitionierungen  A1, A2,..., AK  bezeichnen wir im Folgenden mit
P(A)X=[PX(A1),...,PX(AK)],wobeiPX(Ai)=xAiPX(x),
Q(A)X=[QX(A1),...,QX(AK)],wobeiQX(Ai)=xAiQX(x).

Bitte beachten Sie:  Die  Partitionierungsungleichung  liefert hinsichtlich der Kullback–Leibler–Distanzen folgende Größenrelation:

D(P(A)X||Q(A)X)D(PX||QX).


In Teilaufgabe  (1)  soll die Kullback–Leibler–Distanz der beiden Wahrscheinlichkeitsfunktionen  PX(X)  und  QX(X)  für  X={0, 1, 2}   ⇒   |X|=3  ermittelt werden.

  • Danach soll die Menge  X  mit  K=2  partitioniert werden entsprechend
  • A={A1, A2}  mit  A1={0}  und  A2={1, 2} ,
  • B={B1, B2}  mit  B1={1}  und  B2={0, 2},
  • C={C1, C2}  mit  C1={2}  und  C2={0, 1},
  • Anschließend sollen die jeweiligen Kullback–Leibler–Distanzen angegeben werden:
  • D(P(A)X||Q(A)X),
  • D(P(B)X||Q(B)X),
  • D(P(C)X||Q(C)X).
  • In der Teilaufgabe  (5)  wird schließlich nach den Bedingungen gefragt, die erfüllt sein müssen, damit in der obigen Ungleichung das Gleichheitszeichen zutrifft.





Hinweise:

  • Die beiden Wahrscheinlichkeitsfunktionen können aus obiger Grafik wie folgt abgelesen werden:
PX(X)=[1/4, 1/2, 1/4],QX(X)=[1/8, 3/4, 1/8].


Fragebogen

1

Berechnen Sie die Kullback–Leibler–Distanz allgemein.

D(PX||QX) = 

 bit

2

Welche Kullback–Leibler–Distanz ergibt sich für die Partitionierung  A1={0}, A2={1,2}?

D(P(A)X||Q(A)X) = 

 bit

3

Welche Kullback–Leibler–Distanz ergibt sich für die Partitionierung  B1={1}, B2={0,2}?

D(P(B)X||Q(B)X) = 

 bit

4

Welche Kullback–Leibler–Distanz ergibt sich für die Partitionierung  C1={2}, C2={0,1}?

Das gleiche Ergebnis wie für die Partitionierung  A.
Das gleiche Ergebnis wie für die Partitionierung  B.
Ein ganz anderes Ergebnis.

5

Unter welchen Bedingungen ergibt sich für allgemeines  K  die Gleichheit?

Es müssen  |X|  Gleichungen erfüllt sein.
Für alle Mengenelemente   xAi  muss gelten:   PX(x)/QX(x)=PX(Ai)/QX(Ai).


Musterlösung

(1)  Für die Kullback–Leibler–Distanz der nicht partitionierten Mengen  X  und  Y  gilt:

D(PX||PY)=E[log2PX(X)PY(X)]=xXPX(x)log2PX(x)PY(x)
D(PX||PY)=12log21/23/4+214log21/41/8=12log223+12log2(2)=112log2(3)=0.2075(bit)_.


(2)  Mit der Partitionierung  A   ⇒   A1={0}A2={1,2}  erhält man  P(A)X(X)={1/4, 3/4}  und  Q(A)X(X)={1/8, 7/8}.  Daraus folgt:

D(P(A)X||Q(A)X)=14log21/41/8+34log23/47/8=14log2(2)+34log267=0.0832(bit)_.


(3)  Mit Partitionierung  B   ⇒   B1={1}B2={0, 2}  lauten die Wahrscheinlichkeitsfunktionen  P(B)X(X)={1/2, 1/2}  und  Q(B)X(X)={3/4, 1/4}

  • Analog zur Teilaufgabe  (2)  erhält man so:
D(P(B)X||Q(B)X)=12log21/23/4+12log21/21/4=0.2075(bit)_.
  • Das Ergebnis stimmt mit dem der Teilaufgabe  (1)  überein   ⇒   Bei der Mit Partitionierung  B  gilt das Gleichheitszeichen.


(4)  Mit der Mit Partitionierung  C   ⇒   C1={2} , C2={0, 1}  erhält man  P(C)X(X)={1/4, 3/4} , Q(C)X(X)={1/8, 7/8},
also die gleichen Funktionen wie bei der Partitionierung  A   ⇒   Lösungsvorschlag 1.


(5)  DiePartitionierung  B  hat zum Ergebnis  D(P(B)X||Q(B)X)=D(PX||QX) geführt.

  • Für diesen Fall ist also
PX(1)QX(1)=1/23/4=23, PX(B1)QX(B1)=1/23/4=2/3,
PX(0)QX(0)=1/41/8=2, PX(B2)QX(B2)=1/21/4=2,
PX(2)QX(2)=1/41/8=2, PX(B2)QX(B2)=1/21/4=2.
  • Es muss demnach für alle  xX  gelten:
PX(x)QX(x)=PX(B1)QX(B1),falls xB1,PX(x)QX(x)=PX(B2)QX(B2),falls xB2.
  • Durch Verallgemeinerung erkennt man, dass  beide Lösungsvorschläge  richtig sind.