Aufgaben:Aufgabe 2.2Z: Mittlere Codewortlänge: Unterschied zwischen den Versionen

Aus LNTwww
Wechseln zu:Navigation, Suche
(4 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 3: Zeile 3:
 
}}
 
}}
  
[[Datei:P_ID2417__Inf_Z_2_2.png|right|Tabellen zur Quellencodierung]]
+
[[Datei:P_ID2417__Inf_Z_2_2.png|right|frame|Tabelle zur Quellencodierung]]
 
Ziel von Datenkomprimierung ist es, die Nachricht einer Quelle mit möglichst wenigen Binärzeichen darzustellen.
 
Ziel von Datenkomprimierung ist es, die Nachricht einer Quelle mit möglichst wenigen Binärzeichen darzustellen.
  
Wir betrachten hier eine wertdiskrete Nachrichtenquelle mit dem Symbolvorrat $\{ A, B, C, D\}$   ⇒   Symbolumfang $M = 4$ und den Auftrittswahrscheinlichkeiten
+
Wir betrachten hier eine wertdiskrete Nachrichtenquelle mit dem Symbolvorrat  $\rm \{ A, \ B, \ C, \ D\}$   ⇒   Symbolumfang  $M = 4$  und den Auftrittswahrscheinlichkeiten
*$p_{\rm A} = p_{\rm B} = p_{\rm C} = p_{\rm D} =  1/4$ (Teilaufgabe 1),
+
:*$p_{\rm A} = p_{\rm B} = p_{\rm C} = p_{\rm D} =  1/4$  (Teilaufgabe 1),
* $p_{\rm A} = 1/2, \,  p_{\rm B} = 1/4, \, p_{\rm C} = p_{\rm D} =  1/8$  (ab Teilaufgabe 2).
+
:* $p_{\rm A} = 1/2, \,  p_{\rm B} = 1/4, \, p_{\rm C} = p_{\rm D} =  1/8$  (ab Teilaufgabe 2).
  
  
 
Vorausgesetzt wird, dass es zwischen den einzelnen Quellensymbolen keine statistischen Bindungen gibt.
 
Vorausgesetzt wird, dass es zwischen den einzelnen Quellensymbolen keine statistischen Bindungen gibt.
  
Ein Maß für die Güte eines Komprimierungsverfahrens ist die mittlere Codewortlänge $L_{\rm M}$  mit der Zusatzeinheit „bit/Quellensymbol”. Vorgegeben sind drei Zuordnungen. Anzumerken ist:
+
Ein Maß für die Güte eines Komprimierungsverfahrens ist die mittlere Codewortlänge  $L_{\rm M}$  mit der Zusatzeinheit „bit/Quellensymbol”.  
* Jeder dieser Binärcodes C1, C2 und C3 ist für eine spezielle Quellenstatistik ausgelegt.
+
 
 +
Vorgegeben sind drei Zuordnungen. Anzumerken ist:
 +
* Jeder dieser Binärcodes  $\rm C1$,  $\rm C2$  und  $\rm C3$  ist für eine spezielle Quellenstatistik ausgelegt.
 
* Alle Codes sind präfixfrei und somit ohne weitere Angabe sofort decodierbar.
 
* Alle Codes sind präfixfrei und somit ohne weitere Angabe sofort decodierbar.
  
  
''Hinweise:''  
+
 
*Die Aufgabe gehört zum  Kapitel [[Informationstheorie/Allgemeine_Beschreibung|Allgemeine Beschreibung der Quellencodierung]].
+
 
*Sollte die Eingabe des Zahlenwertes „0” erforderlich sein, so geben Sie bitte „0.” ein.
+
 
 +
 
 +
 
 +
 
 +
''Hinweis:''  
 +
*Die Aufgabe gehört zum  Kapitel  [[Informationstheorie/Allgemeine_Beschreibung|Allgemeine Beschreibung der Quellencodierung]].
 +
  
  
Zeile 26: Zeile 34:
  
 
<quiz display=simple>
 
<quiz display=simple>
{Bestimmen Sie die mittlere Codewortlänge $L_{\rm M}$ für $p_{\rm A} = p_{\rm B} = p_{\rm C} = p_{\rm D} =  1/4$.
+
{Bestimmen Sie die mittlere Codewortlänge&nbsp; $L_{\rm M}$&nbsp; für&nbsp; $p_{\rm A} = p_{\rm B} = p_{\rm C} = p_{\rm D} =  1/4$.
 
|type="{}"}
 
|type="{}"}
$\text{C1:}\ \ L_{\rm M} \ = $  { 2 1% } $\ \rm bit/Quellensymbol$
+
$\text{C1:}\ \ L_{\rm M} \ = \ $  { 2 1% } $\ \rm bit/Quellensymbol$
$\text{C2:}\ \ L_{\rm M} \ = $  { 2.25 1% } $\ \rm bit/Quellensymbol$
+
$\text{C2:}\ \ L_{\rm M} \ = \ $  { 2.25 1% } $\ \rm bit/Quellensymbol$
$\text{C3:}\ \ L_{\rm M} \ = $  { 2.25 1% } $\ \rm bit/Quellensymbol$
+
$\text{C3:}\ \ L_{\rm M} \ = \ $  { 2.25 1% } $\ \rm bit/Quellensymbol$
  
  
{Welche Werte ergeben sich für $p_{\rm A} = 1/2, \,  p_{\rm B} = 1/4, \, p_{\rm C} = p_{\rm D} =  1/8$?
+
{Welche Werte ergeben sich für&nbsp; $p_{\rm A} = 1/2, \,  p_{\rm B} = 1/4, \, p_{\rm C} = p_{\rm D} =  1/8$?
 
|type="{}"}
 
|type="{}"}
$\text{C1:}\ \ L_{\rm M} \ = $  { 2 1% } $\ \rm bit/Quellensymbol$
+
$\text{C1:}\ \ L_{\rm M} \ = \ $  { 2 1% } $\ \rm bit/Quellensymbol$
$\text{C2:}\ \ L_{\rm M} \ = $  { 1.75 1% } $\ \rm bit/Quellensymbol$
+
$\text{C2:}\ \ L_{\rm M} \ = \ $  { 1.75 1% } $\ \rm bit/Quellensymbol$
$\text{C3:}\ \ L_{\rm M} \ = $  { 2.5 1% } $\ \rm bit/Quellensymbol$
+
$\text{C3:}\ \ L_{\rm M} \ = \ $  { 2.5 1% } $\ \rm bit/Quellensymbol$
  
  
Zeile 46: Zeile 54:
  
  
{Für die spezielle Quellensymbolfolge $\rm ADBDCBCBADCA$ ergibt sich die Codesymbolfolge $\rm 001101111001100100111000$.  
+
{Für die spezielle Quellensymbolfolge&nbsp; $\rm ADBDCBCBADCA$&nbsp; ergibt sich die Codesymbolfolge&nbsp; $\rm 001101111001100100111000$.  
 
<br>Welcher Code wurde verwendet?
 
<br>Welcher Code wurde verwendet?
|type="[]"}
+
|type="()"}
+ der Code '''C1''',
+
+ der Code&nbsp;  $\rm C1$,
- der Code '''C2'''.
+
- der Code&nbsp; $\rm C2$.
  
  
{Nach Codierung mit '''C3''' erhält man $\rm 001101111001100100111000$. Wie lautet die zugehörige Quellensymbolfolge?
+
{Nach Codierung mit&nbsp; $\rm C3$&nbsp; erhält man&nbsp; $\rm 001101111001100100111000$.&nbsp; Wie lautet die zugehörige Quellensymbolfolge?
|type="[]"}
+
|type="()"}
 
- $\rm AACDBACABADAAA$ ...
 
- $\rm AACDBACABADAAA$ ...
 
+ $\rm ACBCCCACAACCD$ ...
 
+ $\rm ACBCCCACAACCD$ ...
Zeile 67: Zeile 75:
 
:$$L_{\rm M} = p_{\rm A} \cdot L_{\rm A} + p_{\rm B} \cdot L_{\rm B}+ p_{\rm C} \cdot L_{\rm C} + p_{\rm D} \cdot L_{\rm D}
 
:$$L_{\rm M} = p_{\rm A} \cdot L_{\rm A} + p_{\rm B} \cdot L_{\rm B}+ p_{\rm C} \cdot L_{\rm C} + p_{\rm D} \cdot L_{\rm D}
 
\hspace{0.05cm}.$$
 
\hspace{0.05cm}.$$
Sind die vier Quellensymbole gleichwahrscheinlich (alle Wahrscheinlichkeiten genau 1/4), so kann dafür auch geschrieben werden:
+
Sind die vier Quellensymbole gleichwahrscheinlich&nbsp; $($alle Wahrscheinlichkeiten genau $1/4)$, so kann dafür auch geschrieben werden:
:$$L_{\rm M} = 1/4 \cdot [ L_{\rm A} + L_{\rm B}+ L_{\rm C} + L_{\rm D}]
+
:$$L_{\rm M} = 1/4 \cdot ( L_{\rm A} + L_{\rm B}+ L_{\rm C} + L_{\rm D})
 
\hspace{0.05cm}.$$
 
\hspace{0.05cm}.$$
 
* $\text{Code C1:}$&nbsp;&nbsp;&nbsp; $L_{\rm M} \hspace{0.15cm}\underline{= 2.00}\ \rm bit/Quellensymbol$,
 
* $\text{Code C1:}$&nbsp;&nbsp;&nbsp; $L_{\rm M} \hspace{0.15cm}\underline{= 2.00}\ \rm bit/Quellensymbol$,
Zeile 75: Zeile 83:
  
  
'''(2)'''&nbsp; Mit der Codetabelle C1 ergibt sich unabhängig von den Symbolwahrscheinlichkeiten stets die mittlere Codewortlänge $L_{\rm M} \hspace{0.15cm}\underline{= 2}\ \rm bit/Quellensymbol$. Für die beiden anderen Codes erhält man:
+
 
 +
'''(2)'''&nbsp; Mit der Codetabelle&nbsp; $\text{C1}$&nbsp; ergibt sich unabhängig von den Symbolwahrscheinlichkeiten stets die mittlere Codewortlänge&nbsp; $L_{\rm M} \hspace{0.15cm}\underline{= 2}\ \rm bit/Quellensymbol$.  
 +
 
 +
Für die beiden anderen Codes erhält man:
 
* $\text{Code C2:}$&nbsp;&nbsp;&nbsp; $L_{\rm M} = 1/2 \cdot 1 + 1/4 \cdot 2 + 1/8 \cdot 3 + 1/8 \cdot 3 \hspace{0.15cm}\underline{= 1.75}\ \rm bit/Quellensymbol$,
 
* $\text{Code C2:}$&nbsp;&nbsp;&nbsp; $L_{\rm M} = 1/2 \cdot 1 + 1/4 \cdot 2 + 1/8 \cdot 3 + 1/8 \cdot 3 \hspace{0.15cm}\underline{= 1.75}\ \rm bit/Quellensymbol$,
 
* $\text{Code C3:}$&nbsp;&nbsp;&nbsp; $L_{\rm M} = 1/2 \cdot 3 + 1/4 \cdot 2 + 1/8 \cdot 1 + 1/8 \cdot 3 \hspace{0.15cm}\underline{= 2.50}\ \rm bit/Quellensymbol$.
 
* $\text{Code C3:}$&nbsp;&nbsp;&nbsp; $L_{\rm M} = 1/2 \cdot 3 + 1/4 \cdot 2 + 1/8 \cdot 1 + 1/8 \cdot 3 \hspace{0.15cm}\underline{= 2.50}\ \rm bit/Quellensymbol$.
Zeile 81: Zeile 92:
  
 
Man erkennt aus dem Beispiel das Prinzip:  
 
Man erkennt aus dem Beispiel das Prinzip:  
*Wahrscheinliche Symbole werden durch wenige Binärsymbole dargestellt und unwahrscheinliche durch mehr.  
+
*Wahrscheinliche Symbole werden durch wenige Binärsymbole dargestellt, unwahrscheinliche durch mehr.  
 
*Bei gleichwahrscheinlichen Symbolen wählt man am besten auch die Codewortlängen gleich.
 
*Bei gleichwahrscheinlichen Symbolen wählt man am besten auch die Codewortlängen gleich.
  
  
'''(3)'''&nbsp; Richtig ist <u>Lösungsvorschlag 1</u>: Der Code '''C1''' mit einheitlicher Länge aller Codeworte ist zwar präfixfrei, aber auch andere Codes können präfixfrei sein, zum Beispiel die Codes  '''C2''' und  '''C3'''.
 
  
  
'''(4)'''&nbsp; Bereits aus &bdquo;00&rdquo; am Anfang erkennt man, dass der Code C2 hier nicht in Frage kommt, da sonst die Quellensymbolfolge mit &bdquo;AA&rdquo; beginnen müsste. Tatsächlich wurde der <u>Code C1</u> verwendet.
+
'''(3)'''&nbsp; Richtig ist <u>Lösungsvorschlag 1</u>:
 +
*Der Code&nbsp; $\text{C1}$&nbsp; mit einheitlicher Länge aller Codeworte ist präfixfrei,
 +
*aber auch andere Codes können präfixfrei sein, zum Beispiel die Codes&nbsp;  $\text{C2}$&nbsp; und&nbsp;  $\text{C3}$.
 +
 
 +
 
 +
 
 +
'''(4)'''&nbsp; Richtig ist <u>Lösungsvorschlag 1</u>:
 +
*Bereits aus &bdquo;00&rdquo; am Anfang erkennt man, dass der Code&nbsp; $\text{C2}$&nbsp; hier nicht in Frage kommt, da sonst die Quellensymbolfolge mit &bdquo;AA&rdquo; beginnen müsste.  
 +
*Tatsächlich wurde der Code&nbsp; $\text{C1}$&nbsp; verwendet.
 +
 
  
  
'''(5)'''&nbsp; Richtig ist der <u>Lösungsvorschlag 2</u>: Der erste Lösungsvorschlag gibt die Quellensymbolfolge für den Code C2 an, wenn die Codesymbolfolge $\rm 001101111001100100111000$ lauten würde.
+
'''(5)'''&nbsp; Richtig ist der <u>Lösungsvorschlag 2</u>:  
 +
*Der erste Lösungsvorschlag gibt dagegen die Quellensymbolfolge für den Code&nbsp; $\text{C2}$&nbsp; an, wenn die Codesymbolfolge&nbsp; $\rm 001101111001100100111000$&nbsp; lauten würde.
 
{{ML-Fuß}}
 
{{ML-Fuß}}
  

Version vom 21. Januar 2020, 19:35 Uhr

Tabelle zur Quellencodierung

Ziel von Datenkomprimierung ist es, die Nachricht einer Quelle mit möglichst wenigen Binärzeichen darzustellen.

Wir betrachten hier eine wertdiskrete Nachrichtenquelle mit dem Symbolvorrat  $\rm \{ A, \ B, \ C, \ D\}$   ⇒   Symbolumfang  $M = 4$  und den Auftrittswahrscheinlichkeiten

  • $p_{\rm A} = p_{\rm B} = p_{\rm C} = p_{\rm D} = 1/4$  (Teilaufgabe 1),
  • $p_{\rm A} = 1/2, \, p_{\rm B} = 1/4, \, p_{\rm C} = p_{\rm D} = 1/8$  (ab Teilaufgabe 2).


Vorausgesetzt wird, dass es zwischen den einzelnen Quellensymbolen keine statistischen Bindungen gibt.

Ein Maß für die Güte eines Komprimierungsverfahrens ist die mittlere Codewortlänge  $L_{\rm M}$  mit der Zusatzeinheit „bit/Quellensymbol”.

Vorgegeben sind drei Zuordnungen. Anzumerken ist:

  • Jeder dieser Binärcodes  $\rm C1$,  $\rm C2$  und  $\rm C3$  ist für eine spezielle Quellenstatistik ausgelegt.
  • Alle Codes sind präfixfrei und somit ohne weitere Angabe sofort decodierbar.





Hinweis:


Fragebogen

1

Bestimmen Sie die mittlere Codewortlänge  $L_{\rm M}$  für  $p_{\rm A} = p_{\rm B} = p_{\rm C} = p_{\rm D} = 1/4$.

$\text{C1:}\ \ L_{\rm M} \ = \ $

$\ \rm bit/Quellensymbol$
$\text{C2:}\ \ L_{\rm M} \ = \ $

$\ \rm bit/Quellensymbol$
$\text{C3:}\ \ L_{\rm M} \ = \ $

$\ \rm bit/Quellensymbol$

2

Welche Werte ergeben sich für  $p_{\rm A} = 1/2, \, p_{\rm B} = 1/4, \, p_{\rm C} = p_{\rm D} = 1/8$?

$\text{C1:}\ \ L_{\rm M} \ = \ $

$\ \rm bit/Quellensymbol$
$\text{C2:}\ \ L_{\rm M} \ = \ $

$\ \rm bit/Quellensymbol$
$\text{C3:}\ \ L_{\rm M} \ = \ $

$\ \rm bit/Quellensymbol$

3

Woran erkennt man präfixfreie Codes?

Kein Codewort ist der Beginn eines anderen Codewortes.
Alle Codeworte haben gleiche Länge.

4

Für die spezielle Quellensymbolfolge  $\rm ADBDCBCBADCA$  ergibt sich die Codesymbolfolge  $\rm 001101111001100100111000$.
Welcher Code wurde verwendet?

der Code  $\rm C1$,
der Code  $\rm C2$.

5

Nach Codierung mit  $\rm C3$  erhält man  $\rm 001101111001100100111000$.  Wie lautet die zugehörige Quellensymbolfolge?

$\rm AACDBACABADAAA$ ...
$\rm ACBCCCACAACCD$ ...


Musterlösung

(1)  Die mittlere Codewortlänge ergibt sich allgemein zu

$$L_{\rm M} = p_{\rm A} \cdot L_{\rm A} + p_{\rm B} \cdot L_{\rm B}+ p_{\rm C} \cdot L_{\rm C} + p_{\rm D} \cdot L_{\rm D} \hspace{0.05cm}.$$

Sind die vier Quellensymbole gleichwahrscheinlich  $($alle Wahrscheinlichkeiten genau $1/4)$, so kann dafür auch geschrieben werden:

$$L_{\rm M} = 1/4 \cdot ( L_{\rm A} + L_{\rm B}+ L_{\rm C} + L_{\rm D}) \hspace{0.05cm}.$$
  • $\text{Code C1:}$    $L_{\rm M} \hspace{0.15cm}\underline{= 2.00}\ \rm bit/Quellensymbol$,
  • $\text{Code C2:}$    $L_{\rm M} \hspace{0.15cm}\underline{= 2.25}\ \rm bit/Quellensymbol$
  • $\text{Code C3:}$    $L_{\rm M} \hspace{0.15cm}\underline{= 2.25}\ \rm bit/Quellensymbol$.


(2)  Mit der Codetabelle  $\text{C1}$  ergibt sich unabhängig von den Symbolwahrscheinlichkeiten stets die mittlere Codewortlänge  $L_{\rm M} \hspace{0.15cm}\underline{= 2}\ \rm bit/Quellensymbol$.

Für die beiden anderen Codes erhält man:

  • $\text{Code C2:}$    $L_{\rm M} = 1/2 \cdot 1 + 1/4 \cdot 2 + 1/8 \cdot 3 + 1/8 \cdot 3 \hspace{0.15cm}\underline{= 1.75}\ \rm bit/Quellensymbol$,
  • $\text{Code C3:}$    $L_{\rm M} = 1/2 \cdot 3 + 1/4 \cdot 2 + 1/8 \cdot 1 + 1/8 \cdot 3 \hspace{0.15cm}\underline{= 2.50}\ \rm bit/Quellensymbol$.


Man erkennt aus dem Beispiel das Prinzip:

  • Wahrscheinliche Symbole werden durch wenige Binärsymbole dargestellt, unwahrscheinliche durch mehr.
  • Bei gleichwahrscheinlichen Symbolen wählt man am besten auch die Codewortlängen gleich.



(3)  Richtig ist Lösungsvorschlag 1:

  • Der Code  $\text{C1}$  mit einheitlicher Länge aller Codeworte ist präfixfrei,
  • aber auch andere Codes können präfixfrei sein, zum Beispiel die Codes  $\text{C2}$  und  $\text{C3}$.


(4)  Richtig ist Lösungsvorschlag 1:

  • Bereits aus „00” am Anfang erkennt man, dass der Code  $\text{C2}$  hier nicht in Frage kommt, da sonst die Quellensymbolfolge mit „AA” beginnen müsste.
  • Tatsächlich wurde der Code  $\text{C1}$  verwendet.


(5)  Richtig ist der Lösungsvorschlag 2:

  • Der erste Lösungsvorschlag gibt dagegen die Quellensymbolfolge für den Code  $\text{C2}$  an, wenn die Codesymbolfolge  $\rm 001101111001100100111000$  lauten würde.