Aufgabe 3.4: Verschiedene Sprach–Codecs

Narrow–Band und Wide–Band Audiosignale

Mit der Entwicklung des GSM–Standards nach 1990 ging die Standardisierung verschiedener Sprach–Codecs einher:

Mit dem ersten Full–Rate–Codec (FR) aus dem Jahr 1991 erreichte man eine Reduktion auf die Datenrate $13 \ \rm kbit/s$, ausreichend gering, um ein Sprachsignal über einen einzigen Verkehrskanal übertragen zu können.
1994 wurde der Half–Rate–Codec (HR) mit der Bitrate $5.6 \ \rm kbit/s$ entwickelt mit dem Ziel, bei Bedarf in einem Verkehrskanal zwei Gespräche gleichzeitig übertragen zu können. Die Qualität erreicht allerdings nicht ganz diejenige des Full–Rate–Codecs.
Der Enhanced Full–Rate Codec (EFR) von 1995 stellte eine erhebliche Weiterentwicklung dar, die auf dem Datenreduktionsverfahren ACELP (Algebraic Code Excited Linear Prediction) basiert. Der EFR–Codec liefert eine Datenrate von $12.2 \ \rm kbit/s$ und steht für den mittlerweile üblichen Qualitätsstandard im Mobilfunk.
1999 wurde von der ETSI der Adaptive Multi–Rate Codec (AMR) für GSM standardisiert. Dieser stellt acht verschiedene Modi mit Datenraten zwischen $4.75 \ \rm kbit/s$ und $12.2 \ \rm kbit/s$ bereit. Der AMR–Codec verwendet wie der EFR–Codec das ACELP–Verfahren.
Der Wideband–AMR (WB–AMR) ist eine Weiterentwicklung des ursprünglichen AMR. Er wurde 2001 vom 3GPP–Konsortium und 2002 von der ITU–T standardisiert und nutzt den Frequenzbereich von $50 \ \rm Hz$ bis $7 \ \rm kHz$. Hier liegt also ein „WideBand–Signal” zugrunde.

Hinweise:

Die Aufgabe bezieht sich auf Gemeinsamkeiten von GSM und UMTS.
Die Grafik zeigt das Betragsspektrum eines Audiosignals und definiert die Merkmale Narrowband und Wideband.
Wir weisen Sie auf das interaktive Applet Qualität verschiedener Sprachcodecs.

Fragebogen

Musterlösung

(1) Richtig sind die Lösungsvorschläge 1 und 3. Die erforderliche Datenrate wird reduziert, indem Redundanz und Irrelevanz aus dem Datensignal entfernt wird. Das Kunstwort „Codec” weist darauf hin, dass die gleiche Funktionseinheit sowohl für die Codierung als auch für die Decodierung verwendet wird.

(2) Richtig sind die Antworten 2 und 3. Der EFR–Codec aus dem Jahre 1995 ist eine erhebliche Weiterentwicklung des Full–Rate Codecs aus dem Jahr 1991, wobei unter anderem die Sprachqualität durch Hintergrundgeräusch weniger beeinträchtigt wird. Der EFR–Codec basiert ebenso wie der AMR auf dem Datenreduktionsverfahren ACELP („Algebraic Code Excited Linear Prediction”).

Der erste Lösungsvorschlag ist dagegen falsch. Der EFR–Codec ist wie der FR– und der AMR–Codec nur für den Telefonkanal ($0.3 – 3.4 \ \rm kHz$) ausgelegt. Zur besseren Verständlichkeit und Vermeidung eines dumpfen Klangs erfolgt zusätzlich eine Mittenanhebung und eine Tiefenabsenkung.

(3) Richtig ist nur der Lösungsvorschlag 2. Der Vorteil des AMR–Codecs gegenüber dem EFR liegt in seiner größeren Flexibilität. Wenn sich die Kanalqualität signifikant verschlechtert, kann fließend zu einem niederratigen Modus umgeschaltet werden, bei dem sich Übertragungsfehler weniger störend auswirken. Man kann zudem wie beim HR zwei Gespräche in einem Verkehrskanal führen.

Der höchste Modus mit $12.2 \ \rm kbit/s$ – und nicht der niedrigste – ist identisch mit dem EFR–Codec. Damit ist offensichtlich, dass der AMR keine bessere Sprachqualität als der EFR liefern kann.

(4) Hier sind alle Antworten richtig. Im Wideband–AMR werden neun Modi bereitgestellt, von denen allerdings für den Mobilfunk nur fünf genutzt werden, nämlich diejenigen mit den Datenraten $6.60, 8.85, 12.65, 15.85$ und $23.65 \ \rm kbit/s$. Die Modi bis $12.65 \ \rm kbit/s$ haben den Vorteil, dass ein so codiertes Sprachsignal in einem einzigen GSM–Verkehrskanal untergebracht werden kann. Für die höherratigen Modi benötigt man GSM/EDGE oder UMTS.

Die höherratigen Modi ($15.85$ und $23.65 \ \rm kbit/s$) liefern zwar bei Sprache nur noch eine geringe Verbesserung, allerdings aufgrund des größeren Frequenzbereichs eine merkliche Verbesserung bei der Übertragung von Musik. Sowohl der WB–AMR $12.65$ als auch die höheren Modi von (Narrowband–) AMR zeigen hier Schwächen. Eine noch niedrigere Datenrate liefert bei Musiksignalen äußerst dürftige Ergebnisse.

Der WB–AMR hat auch bei vergleichbarer Datenrate ($12.65 \ \rm kbit/s$) eine bessere Sprachqualität als der NB–AMR mit $12.2 \ \rm kbit/s$. Durch die höhere Bandbreite klingt die Sprache natürlicher und Zischlaute wie „s”, „f” und „sch” werden klarer übertragen.

	Er dient zur Ratenreduzierung von digitalisierter Sprache.
	Er ist aus Gründen der Fehlerkorrektur erforderlich.
	Er wird zur Codierung und auch zur Decodierung verwendet.

	Er ist für breitbandige Signale (Frequenzbereich: $200 \ \rm Hz$ bis $7 \ \rm kHz$) ausgelegt.
	Er bietet eine bessere Klangqualität.
	Die Verbesserung geht auf das ACELP–Verfahren zurück.

	Er liefert eine bessere Sprachqualität.
	Er stellt verschiedene Modi bereit und ist damit flexibler.
	Der niedrigste Modus ist identisch mit dem EFR–Standard.

	Der Audio–Frequenzbereich beträgt $50 \ \rm Hz$ bis $7 \ \rm kHz$.
	Er stellt Modi zwischen $6.60 \ \rm kHz$ und $23.85 \ \rm kHz$ bereit.
	Für die höherratigen Modi ist GSM nicht ausreichend.