Distanzeigenschaften und Fehlerwahrscheinlichkeitsschranken

Inhaltsverzeichnis

1 Freie Distanz vs. Minimale Distanz
2 Pfadgewichtsfunktion (1)
3 Pfadgewichtsfunktion (2)
4 Erweiterte Pfadgewichtsfunktion
5 Pfadgewichtsfunktion aus Zustandsübergangsdiagramm (1)
6 Pfadgewichtsfunktion aus Zustandsübergangsdiagramm (2)
7 Pfadgewichtsfunktion aus Zustandsübergangsdiagramm (3)
8 Burstfehlerwahrscheinlichkeit und Bhattacharyya–Schranke (1)
9 Burstfehlerwahrscheinlichkeit und Bhattacharyya–Schranke (2)
10 Bitfehlerwahrscheinlichkeit und Viterbi–Schranke (1)
11 Bitfehlerwahrscheinlichkeit und Viterbi–Schranke (2)
12 Aufgaben

Freie Distanz vs. Minimale Distanz

Eine äußerst wichtige Kenngröße hinsichtlich der Fehlerwahrscheinlichkeit eines linearen Blockcodes ist die minimale Distanz zwischen zwei Codeworten:

\[d_{\rm min}(\mathcal{C}) = \min_{\substack{\underline{x},\hspace{0.05cm}\underline{x}' \hspace{0.05cm}\in \hspace{0.05cm} \mathcal{C} \\ {\underline{x}} \hspace{0.05cm}\ne \hspace{0.05cm} \underline{x}'}}\hspace{0.1cm}d_{\rm H}(\underline{x}, \hspace{0.05cm}\underline{x}') = \min_{\substack{\underline{x} \hspace{0.05cm}\in \hspace{0.05cm} \mathcal{C} \\ {\underline{x}} \hspace{0.05cm}\ne \hspace{0.05cm} \underline{0}}}\hspace{0.1cm}w_{\rm H}(\underline{x}) \hspace{0.05cm}.\]

Der zweite Gleichungsteil ergibt sich aus der Tatsache, dass jeder lineare Code auch das Nullwort (0) beinhaltet. Zweckmäßigerweise setzt man deshalb x' = 0, so dass die Hamming–Distanz d_H(x, 0) das gleiche Ergebnis liefert wie das Hamming–Gewicht w_H(x).

: Beispiel: Die nachfolgende Tabelle zeigt die 16 Codeworte des (7, 4, 3)–Hamming–Codes.

Alle Codeworte außer dem Nullwort (0) beinhalten mindestens drei Einsen ⇒ d_min = 3. Es gibt sieben Codeworte mit drei Einsen, sieben mit vier Einsen und je eines ohne Einsen bzw. mit sieben Einsen.

Die freie Distanz d_F eines Faltungscodes (Convolution Code ⇒ CC) unterscheidet sich formelmäßig nicht von der minimalen Distanz eines linearen Blockcodes:

\[d_{\rm F}(\mathcal{CC}) = \min_{\substack{\underline{x},\hspace{0.05cm}\underline{x}' \hspace{0.05cm}\in \hspace{0.05cm} \mathcal{CC} \\ {\underline{x}} \hspace{0.05cm}\ne \hspace{0.05cm} \underline{x}'}}\hspace{0.1cm}d_{\rm H}(\underline{x}, \hspace{0.05cm}\underline{x}') = \min_{\substack{\underline{x} \hspace{0.05cm}\in \hspace{0.05cm} \mathcal{CC} \\ {\underline{x}} \hspace{0.05cm}\ne \hspace{0.05cm} \underline{0}}}\hspace{0.1cm}w_{\rm H}(\underline{x}) \hspace{0.05cm}.\]

In der Literatur wird anstelle von d_F teilweise auch d_∞ verwendet.

Wesentlicher Unterschied zur minimalen Distanz ist, dass bei Faltungscodes nicht Informations– und Codeworte zu betrachten sind, sondern Sequenzen mit der Eigenschaft semi–infinite.

Jede Codesequenz x beschreibt einen Pfad durch das Trellis. Die freie Distanz ist dabei das kleinstmögliche Hamming–Gewicht eines solchen Pfades (mit Ausnahme des Nullpfades).

Die Grafik zeigt drei der unendlich vielen Pfade mit dem minimalen Hamming–Gewicht w_H(x) = d_F = 5.

Pfadgewichtsfunktion (1)

Für jeden linearen Blockcode lässt sich wegen der endlichen Anzahl an Codeworten x in einfacher Weise eine Gewichtsfunktion angeben. Für das Beispiel auf der letzten Seite lautet diese:

\[W(X) = 1 + 7 \cdot X^{3} + 7 \cdot X^{4} + X^{7}\hspace{0.05cm}.\]

Bei einem (nicht terminierten) Faltungscode kann keine solche Gewichtsfunktion angegegeben werden, da es unendlich viele, unendlich lange Codesequenzen x gibt, und damit auch unendlich viele Trellispfade. Um dieses Problem in den Griff zu bekommen, gehen wir nun von folgenden Voraussetzungen aus:

Als Bezugsgröße für das Trellisdiagramm wählen wir stets den Pfad der Codesequenz x = 0 und nennen diesen den Nullpfad φ₀.

Desweiteren betrachten wir nur noch solche Pfade φ_j ∈ Φ, die alle zu einer vorgegebenen Zeit t vom Nullpfad abweichen und irgendwann wieder zu diesem zurückkehren.

Obwohl nur ein Bruchteil aller Trellispfade zu dieser Menge Φ gehören, beinhaltet Φ = {φ₁, φ₂, φ₃, ...} noch immer eine unbegrenzte Menge an Pfaden. φ₀ gehört nicht zu dieser Menge.

Im obigen Trellis sind einige Pfade φ_j ∈ Φ eingezeichnet:

Der gelbe Pfad φ₁ gehört zur Sequenz x₁ = (11, 10, 11) mit dem Hamming–Gewicht w_H(x₁) = 5. Damit ist auch das Pfadgewicht w(φ₁) = 5. Aufgrund der Festlegung des Abzweigzeitpunktes t hat nur noch dieser einzige Pfad φ₁ die freie Distanz d_F = 5 zum Nullpfad ⇒ A₅ = 1.

Für die beiden grünen Pfade mit den korrespondierenden Sequenzen x₂ = (11, 01, 01, 11) bzw. x₃ = (11, 10, 00, 10, 11) gilt w(φ₂) = w(φ₃) = 6. Kein anderer Pfad weist das Pfadgewicht 6 auf. Wir berücksichtigen diese Tatsache durch den Koeffizienten A₆ = 2.

Eingezeichnet ist auch der graue Pfad φ₄, assoziiert mit der Sequenz x₄ = (11, 01, 10, 01, 11) ⇒ w(φ₄) = 7. Auch die Sequenzen x₅ = (11, 01, 01, 00, 10, 11), x₆ = (11, 10, 00, 01, 01, 11) und x₇ = (11, 10, 00, 10, 00, 10, 11) weisen jeweils das gleiche Pfadgewicht 7 auf ⇒ A₇ = 4.

Damit lautet die Pfadgewichtsfunktion (englisch: Path Weight Enumerator Function, PWEF):

\[T(X) = A_5 \cdot X^5 + A_6 \cdot X^6 + A_7 \cdot X^7 + ... \hspace{0.1cm}= X^5 + 2 \cdot X^6 + 4 \cdot X^7+ ... \hspace{0.1cm} \hspace{0.05cm}.\]

Die Definition dieser Funktion T(X) wird auf der nächsten Seite nachgeliefert.

Pfadgewichtsfunktion (2)

: Für die Pfadgewichtsfunktion (englisch: Path Weight Enumerator Function, PWEF) eines Faltungscodes gilt:

\[T(X) = \sum_{\varphi_j \in {\it \Phi}}\hspace{0.1cm} X^{w(\varphi_j)} \hspace{0.1cm}=\hspace{0.1cm} \sum_{w = d_{\rm F}}^{\infty}\hspace{0.1cm} A_w \cdot X^w \hspace{0.05cm}.\]

Φ bezeichnet die Menge aller Pfade an, die den Nullpfad φ₀ genau zum festgelegten Zeitpunkt t verlassen und (irgendwann) später zu diesem zurückkehren.

Gemäß der zweiten Gleichung sind die Summanden nach ihren Pfadgewichten w geordnet, wobei A_w die Anzahl der Pfade mit Pfadgewicht w bezeichnet. Die Summe beginnt mit w = d_F.

Das Pfadgewicht w(φ_j) ist gleich dem Hamming–Gewicht (also der Anzahl der Einsen) der zum Pfad φ_j assoziierten Codesequenz x_j:

\[w({\varphi_j) = w_{\rm H}(\underline {x}}_j) \hspace{0.05cm}.\]

Hinweis: Die für die linearen Blockcodes definierte Gewichtsfunktion W(X) und die hier definierte Pfadgewichtsfunktion T(X) weisen viele Gemeinsamkeiten auf, sie sind jedoch nicht identisch.

Betrachten wir nochmals die Gewichtsfunktion

\[W(X) = 1 + 7 \cdot X^{3} + 7 \cdot X^{4} + X^{7}\]

des (7, 4, 3)–Hamming–Codes und die Pfadgewichtsfunktion

\[T(X) = X^5 + 2 \cdot X^6 + 4 \cdot X^7+ 8 \cdot X^8+ ... \]

unseres Standard–Faltungscodierers, so fällt die „1” in der ersten Gleichung auf. Das heißt: Bei den linearen Blockcodes wird das Bezugs–Codewort x_i = 0 mitgezählt, wohingegen die Nullcodesequenz x_i = 0 bzw. der Nullpfad φ₀ bei den Faltungscodes ausgeschlossen wird. Nach Ansicht der Autoren hätte man auch W(X) ohne die „1” definieren können. Damit wäre unter anderem vermieden worden, dass sich die Bhattacharyya–Schranke für lineare Blockcodes und für Faltungscodes durch „–1” unterscheiden, wie aus den folgenden Gleichungen hervorgeht:

Bhattacharyya–Schranke für die linearen Blockcodes:

\[{\rm Pr(Blockfehler)} \le W(X = \beta) -1 \hspace{0.05cm},\]

Bhattacharyya–Schranke für die Faltungscodes:

\[{\rm Pr(Burstfehler)} \le T(X = \beta) \hspace{0.05cm},\]

Die Pfadgewichtsfunktion T(X) liefert nur Informationen hinsichtlich der Gewichte der Codesequenz x. Mehr Informationen erhält man, wenn zusätzlich auch die Gewichte der Informationssequenz u erfasst werden. Man benötigt dann zwei Formalparameter X und U, wie aus der Definition auf der folgenden Seite hervorgeht.

Erweiterte Pfadgewichtsfunktion

: Die erweiterte Pfadgewichtsfunktion (englisch: Enhanced Path Weight Enumerator Function, EPWEF) lautet:

\[T_{\rm enh}(X, U) = \sum_{\varphi_j \in {\it \Phi}}\hspace{0.1cm} X^{w(\varphi_j)} \cdot U^{{ u}(\varphi_j)} \hspace{0.1cm}=\hspace{0.1cm} \sum_{w} \sum_{u}\hspace{0.1cm} A_{w, \hspace{0.05cm}u} \cdot X^w \cdot U^{u} \hspace{0.05cm}.\]

Es gelten alle Angaben der Definition von T(X) auf der letzten Seite. Zusätzlich ist zu beachten:

Das Pfadeingangsgewicht u(φ_j) ist gleich dem Hamming–Gewicht der zum Pfad φ_j assoziierten Informationssequenz u_j. Es wird als Potenz des Formalparameters U ausgedrückt.

Der Koeffizient A_w, u bezeichnet die Anzahl der Pfade φ_j mit dem Pfadausgangsgewicht w(φ_j) und dem Pfadeingangsgewicht u(φ_j). Als Laufvariable für den zweiten Anteil wird u verwendet.

Setzt man in der erweiterten Pfadgewichtsfunktion den Formalparameter U = 1, so ergibt sich die ursprüngliche Gewichtsfunktion T(X) gemäß der Definition auf der letzten Seite.

Bei vielen (und allen relevanten) Faltungscodes lässt sich obere Gleichung noch vereinfachen:

\[T_{\rm enh}(X, U) =\hspace{0.1cm} \sum_{w = d_{\rm F}}^{\infty}\hspace{0.1cm} A_w \cdot X^w \cdot U^{u} \hspace{0.05cm}.\]

Die erweiterte Pfadgewichtsfunktion unseres Standardcodieres lautet somit:

\[T_{\rm enh}(X, U) = U \cdot X^5 + 2 \cdot U^2 \cdot X^6 + 4 \cdot U^3 \cdot X^7+ ... \hspace{0.1cm} \hspace{0.05cm}.\]

Vergleicht man dieses Ergebnis mit dem unten dargestellten Trellis, so erkennt man:

Der gelb hinterlegte Pfad – gekennzeichnet durch X⁵ – setzt sich aus einem blauen Pfeil (u_i = 1) und zwei roten Pfeilen (u_i = 0) zusammen. Somit wird aus X⁵ der erweiterte Term UX⁵.

Die Sequenzen der beiden grünen Pfade sind u₂ = (1, 1, 0, 0) ⇒ x₂ = (11, 01, 01, 11) sowie u₃ = (1, 0, 1, 0, 0) ⇒ x₃ = (11, 10, 00, 10, 11). Daraus ergibt sich der zweite Term 2 · U²X⁶.

Der graue Pfad (und die drei nicht gezeichneten Pfade) ergeben zusammen den Beitrag 4 · U³X⁷. Jeder dieser Pfade beinhaltet drei blaue Pfeile ⇒ drei Einsen in jeder Informationssequenz.

Pfadgewichtsfunktion aus Zustandsübergangsdiagramm (1)

Es gibt eine elegante Methode, um die Pfadgewichtsfunktion T(X) und deren Erweiterung direkt aus dem Zustandsübergangsdiagramm zu bestimmen. Dies soll hier und auf den folgenden Seiten am Beispiel unseres Standardcodes demonstriert werden.

Zunächst muss dazu das Zustandsübergangsdiagramm umgezeichnet werden. Die Grafik zeigt dieses links in der bisherigen Form als Diagramm (A), während rechts das neue Diagramm (B) angegeben ist.

Man erkennt:

Der Zustand S₀ wird aufgespalten in den Startzustand S₀ und den Endzustand S₀'. Damit lassen sich alle Pfade des Trellisdiagramms, die im Zustand S₀ beginnen und irgendwann zu diesem zurückkehren, auch im rechten Graphen (B) nachvollziehen. Ausgeschlossen sind dagegen direkte Übergänge von S₀ nach S₀′ und damit auch der Nullpfad (Dauer–S₀).

Im Diagramm (A) sind die Übergänge anhand der Farben Rot (für u_i = 0) und Blau (für u_i = 1) unterscheidbar, und die Codeworte x_i ∈ {00, 01, 10, 11} sind an den Übergängen vermerkt. Im neuen Diagramm (B) werden (00) durch X⁰ = 1 und (11) durch X² ausgedrückt. Die Codeworte (01) und (10) sind nun nicht mehr unterscheidbar, sondern werden einheitlich mit X bezeichnet.

Anders formuliert: Das Codewort x_i wird nun als X^w dargestellt, wobei X eine dem Ausgang (der Codesequenz) zugeordnete Dummy–Variable ist und w = w_H(x_i) das Hamming–Gewicht des Codewortes x_i angibt. Bei einem Rate–1/2–Code ist der Exponent w entweder 0, 1 oder 2.

Ebenfalls verzichtet wird im Diagramm (B) auf die Farbcodierung. Das Informationsbit u_i = 1 wird nun durch U¹ = U und das Informationsbit u_i = 0 durch U⁰ = 1 gekennzeichnet. Die Dummy–Variable U ist also der Eingangssequenz u zugeordnet.

Die Beschreibung wird auf den nächsten Seiten fortgesetzt.

Pfadgewichtsfunktion aus Zustandsübergangsdiagramm (2)

Ziel unserer Berechnungen wird es sein, den (beliebig komplizierten) Weg von S₀ nach S₀' durch die erweiterte Pfadgewichtsfunktion T_enh(X, U) zu charakterisieren. Dazu benötigen wir Regeln, um den Graphen schrittweise vereinfachen zu können.

Zusammenfassung zweier serieller Übergänge

Serielle Übergänge

Zwei serielle Verbindungen – gekennzeichnet durch A(X, U) und B(X, U) – können durch eine einzige Verbindung mit dem Produkt dieser Bewertungen ersetzt werden.

Zusammenfassung zweier paralleler Übergänge

Parallele Übergänge
Zwei parallele Verbindungen werden durch die Summe ihrer Bewertungsfunktionen zusammengefasst.

Ring Die nebenstehende Konstellation kann durch eine einzige Verbindung ersetzt werden, wobei für die Ersetzung gilt:

\[E(X, U) = \frac{A(X, U) \cdot B(X, U)}{1- C(X, U)} \hspace{0.05cm}.\]

Rückkopplung
Durch die Rückkopplung können sich hier zwei Zustände beliebig oft abwechseln. Für diese Konstellation gilt:

\[F(X, U) = \frac{A(X, U) \cdot B(X, U)\cdot C(X, U)}{1- C(X, U)\cdot D(X, U)} \hspace{0.05cm}.\]

Die hier angegebenen Gleichungen für Ring und Rückkopplung sind in Aufgabe Z3.12 zu beweisen.

Pfadgewichtsfunktion aus Zustandsübergangsdiagramm (3)

Die auf der letzten Seite genannten Regeln sollen nun auf unser Standardbeispiel angewendet werden. In der unteren Grafik sehen Sie links das modifizierte Zustandsübergangsdiagramm (B).

Zunächst ersetzen wir den rot hinterlegten Umweg von S₁ nach S₂ über S₃ im Diagramm (B) durch die im Diagramm (C) eingezeichnete rote Verbindung. Es handelt sich nach der Klassifizierung auf der letzten Seite um einen „Ring” mit den Beschriftungen A = C = U · X und B = X, und wir erhalten die erste Reduktionsfunktion:

\[T_1(X, U) = \frac{U \cdot X^2}{1- U \cdot X} \hspace{0.05cm}.\]

Nun fassen wir die parallelen Verbindungen entsprechend der blauen Hinterlegung im Diagramm (C) zusammen und ersetzen diese durch die blaue Verbindung im Diagramm (D). Die zweite Reduktionsfunktion lautet somit:

\[T_2(X, U) = T_1(X, U) + X = \frac{U X^2 + X \cdot (1-UX)}{1- U X} = \frac{X}{1- U X} \hspace{0.05cm}.\]

Der gesamte Graph (D) kann somit durch eine einzige Verbindung von S₀ nach S₀' ersetzt werden. Nach der Rückkopplungsregel erhält man für die erweiterte Pfadgewichtsfunktion:

\[T_{\rm enh}(X, U) = \frac{(U X^2) \cdot X^2 \cdot \frac{X}{1- U X}}{1- U \cdot \frac{X}{1- U X}} = \frac{U X^5}{1- U X- U X} = \frac{U X^5}{1- 2 \cdot U X} \hspace{0.05cm}.\]

Mit der Reihenentwicklung 1/(1 – x) = 1 + x + x² + x³ + ... lässt sich hierfür auch schreiben:

\[T_{\rm enh}(X, U) = U X^5 \cdot \left [ 1 + 2 \hspace{0.05cm}UX + (2 \hspace{0.05cm}UX)^2 + (2 \hspace{0.05cm}UX)^3 + ... \hspace{0.05cm} \right ] \hspace{0.05cm}.\]

Setzt man die formale Input–Variable U = 1, so erhält man die „einfache” Pfadgewichtsfunktion, die allein Aussagen über die Gewichtsverteilung der Ausgangssequenz x erlaubt:

\[T(X) = X^5 \cdot \left [ 1 + 2 X + 4 X^2 + 8 X^3 + ... \hspace{0.05cm} \right ] \hspace{0.05cm}.\]

Das gleiche Ergebnis haben wir bereits aus dem Trellisdiagramm auf Seite 2a abgelesen. Dort gab es einen grauen Pfad mit Gewicht 5, zwei gelbe Pfade mit Gewicht 6 und vier grüne Pfade mit Gewicht 7.

Burstfehlerwahrscheinlichkeit und Bhattacharyya–Schranke (1)

Das folgende einfache Modell gilt sowohl für lineare Blockcodes als auch für Faltungscodes.

Bei den Blockcodes bezeichnen u = (u₁, ..., u_i, ..., u_k) und υ = (υ₁, ..., υ_i, ..., υ_k) die Informationsblöcke am Eingang und Ausgang des Systems. Damit können folgende Beschreibungsgrößen definiert werden:

die Blockfehlerwahrscheinlichkeit Pr(υ ≠ u),

die Bitfehlerwahrscheinlichkeit Pr(υ_i ≠ u_i).

Bei realen Übertragungssystemen ist aufgrund des thermischen Rauschens die Bitfehlerwahrscheinlichkeit stets größer als 0. Weiter gilt:

\[{\rm Pr(Blockfehler)} > {\rm Pr(Bitfehler)} \hspace{0.05cm}.\]

Hierfür ein einfacher Erklärungsversuch: Entscheidet der Decoder in jedem Block der Länge k Bit genau ein Bit falsch, so beträgt die Bitfehlerwahrscheinlichkeit = 1/k und die Blockfehlerwahrscheinlichkeit ist 1.

Bei Faltungscodes ist dagegen die Blockfehlerwahrscheinlichkeit nicht angebbar, da hier u = (u₁, u₂, ...) und υ = (υ₁, υ₂, ...) Sequenzen darstellen. Selbst der kleinstmögliche Codeparameter k = 1 führt hier zur Sequenzlänge k′ → ∞, und die Blockfehlerwahrscheinlichkeit ergäbe sich stets zu 1, selbst wenn die Bitfehlerwahrscheinlichkeit extrem klein (aber ≠ 0) ist.

Deshalb definieren wir bei Faltungscodes stattdessen die Burstfehlerwahrscheinlichkeit:

\[{\rm Pr(Burstfehler)} = {\rm Pr}\big \{{\rm Decoder\hspace{0.15cm} verl\ddot{a}sst\hspace{0.15cm} zur\hspace{0.15cm} Zeit}\hspace{0.15cm}t \hspace{0.15cm}{\rm den \hspace{0.15cm}korrekten \hspace{0.15cm}Pfad}\big \} \hspace{0.05cm}.\]

Um für die folgende Herleitung die Schreibweise zu vereinfachen, gehen wir stets von der Nullsequenz (0) aus, die im gezeichneten Trellis als Nullpfad φ₀ rot dargestellt ist. Alle anderen eingezeichneten Pfade φ₁, φ₂, φ₃, ... (und noch viele mehr) verlassen φ₀ zur Zeit t. Sie alle gehören zur Pfadmenge Φ ⇒ „Viterbi–Decoder verlässt den korrekten Pfad zur Zeit t”, deren Wahrscheinlichkeit auf der nächsten Seite berechnet werden soll.

Burstfehlerwahrscheinlichkeit und Bhattacharyya–Schranke (2)

Wir gehen wie in Kapitel 1.6 von der paarweisen Fehlerwahrscheinlichkeit Pr[φ₀ → φ_i] aus, dass vom Decoder anstelle des Pfades φ₀ der Pfad φ_i ausgewählt werden könnte. Alle betrachteten Pfade φ_i haben gemein, dass sie den Nullpfad φ₀ zum Zeitpunkt t verlassen; sie gehören alle zur Pfadmenge Φ.

Die gesuchte Burstfehlerwahrscheinlichkeit ist gleich der folgenden Vereinigungsmenge:

\[{\rm Pr(Burstfehler)}= {\rm Pr}\left ([\varphi_{\hspace{0.02cm}0} \mapsto \varphi_{\hspace{0.02cm}1}] \hspace{0.05cm}\cup\hspace{0.05cm}[\varphi_{\hspace{0.02cm}0} \mapsto \varphi_{\hspace{0.02cm}2}]\hspace{0.05cm}\cup\hspace{0.05cm} ...\hspace{0.05cm} \right )= {\rm Pr} \left ( \cup_{\varphi_{\hspace{0.02cm}i} \in {\it \Phi}} \hspace{0.15cm} [\varphi_{\hspace{0.02cm}0} \mapsto \varphi_{\hspace{0.02cm}i}] \right )\hspace{0.05cm}.\]

Eine obere Schranke hierfür bietet die so genannte Union–Bound entsprechend Kapitel 1.6:

\[{\rm Pr(Burstfehler)} \le \sum_{\varphi_{\hspace{0.02cm}i} \in {\it \Phi}}\hspace{0.15cm} {\rm Pr}\left [\varphi_{\hspace{0.02cm}0} \mapsto \varphi_{\hspace{0.02cm}i}\right ] = {\rm Pr(Union \hspace{0.15cm}Bound)} \hspace{0.05cm}.\]

Die paarweise Fehlerwahrscheinlichkeit kann mit der Bhattacharyya–Schranke abgeschätzt werden:

\[{\rm Pr}\left [\underline {0} \mapsto \underline {x}_{\hspace{0.02cm}i}\right ] \le \beta^{w_{\rm H}({x}_{\hspace{0.02cm}i})}\hspace{0.3cm}\Rightarrow \hspace{0.3cm} {\rm Pr}\left [\varphi_{\hspace{0.02cm}0} \mapsto \varphi_{\hspace{0.02cm}i}\right ] \le \hspace{0.05cm} \beta^{w(\varphi_i)}\hspace{0.05cm}.\]

w_H(x_i) bezeichnet das Hamming–Gewicht der möglichen Codesequenz x_i, w(φ_i) das Pfadgewicht des entsprechenden Pfades φ_i ∈ Φ und β den so genannten Bhattacharyya–Kanalparameter.

Durch Summation über alle Pfade und einen Vergleich mit der (einfachen) Pfadgewichtsfunktion T(X) erhalten wir das Ergebnis:

\[{\rm Pr(Burstfehler)} \le T(X = \beta),\hspace{0.5cm}{\rm mit}\hspace{0.5cm} T(X) = \sum_{\varphi_{\hspace{0.02cm}i} \in {\it \Phi}}\hspace{0.15cm} \hspace{0.05cm} X^{w(\varphi_i)}\hspace{0.05cm}.\]

: Für unseren Standardcodierer ⇒ R = 1/2, m = 2, G(D) = (1 + D + D², 1 + D) haben wir folgende Pfadgewichtsfunktion erhalten, siehe Theorieteil, Seite 2a:

\[T(X) = X^5 + 2 \cdot X^6 + 4 \cdot X^7 + ... \hspace{0.1cm} = X^5 \cdot ( 1 + 2 \cdot X + 4 \cdot X^2+ ... \hspace{0.1cm}) \hspace{0.05cm}.\]

Mit der Reihenentwicklung 1/(1 – x) = 1 + x + x² + x³ + ... kann hierfür auch geschrieben werden:

\[T(X) = \frac{X^5}{1-2 \cdot X} \hspace{0.05cm}.\]

Das BSC–Modell liefert mit der Verfälschungswahrscheinlichkeit ε folgende Bhattacharyya–Schranke:

\[{\rm Pr(Burstfehler)} \le T(X = \beta) = T( X = 2 \cdot \sqrt{\varepsilon \cdot (1-\varepsilon)}) = \frac{(2 \cdot \sqrt{\varepsilon \cdot (1-\varepsilon)})^5}{1- 4\cdot \sqrt{\varepsilon \cdot (1-\varepsilon)}}\hspace{0.05cm}.\]

In Aufgabe A3.14 soll diese Gleichung numerisch ausgewertet werden.

Bitfehlerwahrscheinlichkeit und Viterbi–Schranke (1)

Abschließend wird eine obere Schranke für die Bitfehlerwahrscheinlichkeit angegeben. Entsprechend der Grafik gehen wir wie [Liv10] von folgenden Gegebenheiten aus:

Gesendet wurde die Nullsequenz x = 0 ⇒ Pfad φ₀.

Die Dauer einer Pfadabweichung (englisch: Error Burst Duration) wird mit L bezeichnet.

Den Abstand zweier Bursts (englisch: Inter–Burst Time) nennen wir N.

Das Hamming–Gewicht des Fehlerbündels sei H.

Für einen Rate–1/n–Faltungscode ⇒ k = 1, also einem Informationsbit pro Takt, lässt sich aus den Erwartungswerten E[L], E[N] und E[H] der oben definierten Zufallsgrößen eine obere Schranke für die Bitfehlerwahrscheinlichkeit angeben:

\[{\rm Pr(Bitfehler)} = \frac{{\rm E}[H]}{{\rm E}[L] + {\rm E}[N]}\hspace{0.15cm} \le \hspace{0.15cm} \frac{{\rm E}[H]}{{\rm E}[N]} \hspace{0.05cm}.\]

Hierbei ist vorausgesetzt, dass die (mittlere) Dauer eines Fehlerbündels in der Praxis sehr viel kleiner ist als der zu erwartende Abstand zweier Bündel. Weiter kann gezeigt werden, dass die mittlere Inter–Burst Time E[N] gleich dem Kehrwert der Burstfehlerwahrscheinlichkeit ist, während der Erwartungswert im Zähler wie folgt abgeschätzt:

\[{\rm E}[H] \le \frac{1}{\rm Pr(Burstfehler)}\hspace{0.1cm} \cdot \sum_{\varphi_{\hspace{0.02cm}i} \in {\it \Phi}}\hspace{0.05cm} \hspace{0.05cm} u(\varphi_i) \cdot \beta^{w(\varphi_i)} \hspace{0.05cm}.\]

Bei der Herleitung dieser Schranke in [Liv10] werden die paarweise Fehlerwahrscheinlichkeit Pr[φ₀ → φ_i] sowie die Bhattacharyya–Abschätzung verwendet. Damit erhält man mit

dem Pfadeingangsgewicht u(φ_i),

dem Pfadausgangsgewicht w(φ_i),

dem Bhattacharyya–Parameter β.

die folgende Abschätzung für die Bitfehlerwahrscheinlichkeit:

\[{\rm Pr(Bitfehler)} \hspace{0.05cm} \le \sum_{\varphi_{\hspace{0.02cm}i} \in {\it \Phi}}\hspace{0.05cm} \hspace{0.01cm} u(\varphi_i) \cdot \beta^{w(\varphi_i)} \hspace{0.05cm}.\]

Man nennt diese Abschätzung die Viterbi–Schranke.

Bitfehlerwahrscheinlichkeit und Viterbi–Schranke (2)

Wir erinnern uns an die erweiterte Pfadgewichtsfunktion

\[T_{\rm enh}(X, U) = \sum_{\varphi_j \in {\it \Phi}}\hspace{0.1cm} X^{w(\varphi_j)} \cdot U^{{ u}(\varphi_j)} \hspace{0.05cm}.\]

Leitet man diese Funktion nach der Dummy–Eingangsvariablen U ab, so erhält man

\[\frac {\rm d}{{\rm d}U}\hspace{0.2cm}T_{\rm enh}(X, U) = \sum_{\varphi_j \in {\it \Phi}}\hspace{0.1cm} { u}(\varphi_j) \cdot X^{w(\varphi_j)} \cdot U^{{ u}(\varphi_j)-1} \hspace{0.05cm}.\]

Schließlich setzen wir noch für die Dummy–Eingangsvariablen U = 1:

\[\left [ \frac {\rm d}{{\rm d}U}\hspace{0.2cm}T_{\rm enh}(X, U) \right ]_{\substack{ U=1}} = \sum_{\varphi_j \in {\it \Phi}}\hspace{0.1cm} { u}(\varphi_j) \cdot X^{w(\varphi_j)} \hspace{0.05cm}.\]

Man erkennt den Zusammenhang zum Ergebnis der letzten Seite.

Zusammenfassung: Die Bitfehlerwahrscheinlichkeit eines Faltungscodes kann mit der erweiterten Pfadgewichtsfunktion in geschlossener Form abgeschätzt werden:

\[{\rm Pr(Bitfehler)} \le {\rm Pr(Viterbi)} = \left [ \frac {\rm d}{{\rm d}U}\hspace{0.2cm}T_{\rm enh}(X, U) \right ]_{\substack{X=\beta \\ U=1}} \hspace{0.05cm}.\]

Man spricht von der Viterbi–Schranke. Dabei leitet man die erweiterte Pfadgewichtsfunktion nach dem zweiten Parameter U ab und setzt dann X = β und U = 1.

In Aufgabe A3.14 werden

die Viterbi–Schranke und
die Bhattacharyya–Schranke

für unseren Rate–1/2–Standardcode sowie das BSC–Modell numerisch ausgewertet.

Die roten Kreise kennzeichnen die Bitfehlerrate für den gleichen Code (m = 2) beim AWGN–Kanal.

Die grünen Kreuze markieren einen Faltungscode mit m = 6, den man oft Industriestandardcode nennt.

Die Grafik verdeutlicht die gute Korrekturfähigkeit der Faltungscodes. Insbesondere Codes mit großem Gedächtnis m führen zu großen Gewinnen gegenüber uncodierter Übertragung (gestrichelte Kurve).

Aufgaben

A3.12 Pfadgewichtsfunktion

Zusatzaufgaben:3.12 Ring und Rückkopplung

A3.13 Nochmals Tenh(X, U) und T(X)

A3.14 Faltungscodes: Schranken