Mobile Kommunikation/Gemeinsamkeiten von GSM und UMTS: Unterschied zwischen den Versionen
Zeile 175: | Zeile 175: | ||
== Geläufige Sprachcodierverfahren == | == Geläufige Sprachcodierverfahren == | ||
<br> | <br> | ||
− | Für die GSM–Sprachübertragung steht jedem Teilnehmer nur eine Netto–Datenrate von $13\ \rm kbit/s$ zur Verfügung $($mit Kanalcodierung $22.8\ \rm kbit/s)$, während die PCM–Übertragung mit $8\ \rm kHz$ Abtastung und $13\ \rm Bit$ Quantisierung eine Datenrate von $104\ \rm kbit/s$ erfordern würde. | + | Für die GSM–Sprachübertragung steht jedem Teilnehmer nur eine Netto–Datenrate von $13\ \rm kbit/s$ zur Verfügung $($mit Kanalcodierung $22.8\ \rm kbit/s)$, während die PCM–Übertragung mit $8\ \rm kHz$ Abtastung und $13\ \rm Bit$ Quantisierung eine Datenrate von $104\ \rm kbit/s$ erfordern würde. |
Um das Abtasttheorem mit einer gewissen Toleranz einzuhalten, wird das Audiosignal durch Filterung auf den Frequenzbereich von $300\ \rm Hz$ bis $3.4\ \rm kHz$ begrenzt.<br> | Um das Abtasttheorem mit einer gewissen Toleranz einzuhalten, wird das Audiosignal durch Filterung auf den Frequenzbereich von $300\ \rm Hz$ bis $3.4\ \rm kHz$ begrenzt.<br> | ||
− | Die nötige Komprimierung um den Faktor $8$ ist Aufgabe der | + | Die nötige Komprimierung um den Faktor $8$ ist Aufgabe der $\rm Sprachcodierung$ $($hierunter versteht man eine Sonderform der [[Informationstheorie/Allgemeine_Beschreibung|$\rm Quellencodierung)$]], wofür in den 1990er Jahren mehrere Standards definiert wurden: |
− | *Der [[Beispiele_von_Nachrichtensystemen/Sprachcodierung#GSM_Fullrate_Vocoder_.E2.80.93_Vollraten.E2.80.93Codec| | + | *Der [[Beispiele_von_Nachrichtensystemen/Sprachcodierung#GSM_Fullrate_Vocoder_.E2.80.93_Vollraten.E2.80.93Codec| $\text{GSM Fullrate Vocoder}$]] (zu deutsch: GSM–Vollraten–Sprachcoder) basiert auf den drei Kompressionsverfahren [[Beispiele_von_Nachrichtensystemen/Sprachcodierung#Linear_Predictive_Coding_.E2.80.93_Kurzzeitpr.C3.A4diktion|$\rm LPC$]] (<i>Linear Predictive Coding</i>), [[Beispiele_von_Nachrichtensystemen/Sprachcodierung#Long_Term_Prediction_.E2.80.93_Langzeitpr.C3.A4diktion| $\rm LTP$]] (<i>Long Term Prediction</i>) und [[Beispiele_von_Nachrichtensystemen/Sprachcodierung#Regular_Pulse_Excitation_.E2.80.93_RPE.E2.80.93Codierung |$\rm RPE$]] (<i>Regular Pulse Excitation</i>). Dieser Coder extrahiert aus jedem $20\ \rm ms$–Sprachrahmen $74$ Parameter mit einem Gesamtumfang von $260\ \rm Bit$, woraus sich die Datenrate $13\ \rm kbit/s$ ergibt. Beim Empfänger muss aus diesen $260\ \rm Bit$ das Sprachsignal wieder synthetisiert werden.<br> |
− | *Der [[Beispiele_von_Nachrichtensystemen/Sprachcodierung#Halfrate_Vocoder_und_Enhanced_Fullrate_Codec| | + | *Der [[Beispiele_von_Nachrichtensystemen/Sprachcodierung#Halfrate_Vocoder_und_Enhanced_Fullrate_Codec| $\text{GSM Halfrate Vocoder}$]] (deutsch: GSM–Halbraten–Sprachcoder) wurde 1994 spezifiziert und bietet die Möglichkeit, ein auf $4\ \rm kHz$ bandbegrenztes Audiosignal bei nahezu gleicher Qualität in einem halben Verkehrskanal zu übertragen. Heutzutage spielt dieser Sprachcodec nur noch eine untergeordnete Rolle.<br> |
− | *Der [[Beispiele_von_Nachrichtensystemen/Sprachcodierung#Halfrate_Vocoder_und_Enhanced_Fullrate_Codec| | + | *Der [[Beispiele_von_Nachrichtensystemen/Sprachcodierung#Halfrate_Vocoder_und_Enhanced_Fullrate_Codec| $\text{Enhanced Fullrate Codec}$]] (kurz ''EFR–Codec'') wurde 1995 für das US–amerikanische DCS 1900–System entwickelt. Er arbeitet nach dem Codierungsverfahren <i>Algebraic Code Excited Linear Prediction</i> $\rm (ACELP)$ und bietet gegenüber dem herkömmlichen Fullrate–Codec aufgrund des ACELP–Prinzips und wegen der verbesserten Fehlererkennung und –verschleierung eine deutlich höhere Sprachqualität.<br><br> |
Aus dem [[Beispiele_von_Nachrichtensystemen/Sprachcodierung#Algebraic_Code_Excited_Linear_Prediction| ACELP–Blockschaltbild]] im Buch „Beispiele von Nachrichtensystemen” erkennt man | Aus dem [[Beispiele_von_Nachrichtensystemen/Sprachcodierung#Algebraic_Code_Excited_Linear_Prediction| ACELP–Blockschaltbild]] im Buch „Beispiele von Nachrichtensystemen” erkennt man | ||
*die Segmentierung des digitalisierten Sprachsignals in Rahmen und Subblöcke,<br> | *die Segmentierung des digitalisierten Sprachsignals in Rahmen und Subblöcke,<br> | ||
*die LPC–Analyse durch ein digitales Filter $A(z)$ im rot hinterlegten Block,<br> | *die LPC–Analyse durch ein digitales Filter $A(z)$ im rot hinterlegten Block,<br> | ||
− | *die Langzeitprädiktion (LTP) mit Hilfe des adaptiven Codebuchs (blau umrahmt), und<br> | + | *die Langzeitprädiktion $\rm (LTP)$ mit Hilfe des adaptiven Codebuchs (blau umrahmt), und<br> |
*die Suche nach dem besten Eintrag im festen Codebuch (grün hervorgehoben).<br><br> | *die Suche nach dem besten Eintrag im festen Codebuch (grün hervorgehoben).<br><br> | ||
− | Im Kapitel [[Beispiele_von_Nachrichtensystemen/Sprachcodierung#Verschiedene_Sprachcodierverfahren|Verschiedene Sprachcodierverfahren]] des Buches „Beispiele von Nachrichtensystemen” wird unter anderem der EFR–Codec im Detail beschrieben. Die Datenrate von $12.2 \ \rm kbit/s$ ist identisch mit dem höchsten Modus des AMR–Codecs, der auf der nächsten Seite kurz vorgestellt wird. | + | Im Kapitel [[Beispiele_von_Nachrichtensystemen/Sprachcodierung#Verschiedene_Sprachcodierverfahren|Verschiedene Sprachcodierverfahren]] des Buches „Beispiele von Nachrichtensystemen” wird unter anderem der EFR–Codec im Detail beschrieben. Die Datenrate von $12.2 \ \rm kbit/s$ ist identisch mit dem höchsten Modus des AMR–Codecs, der auf der nächsten Seite kurz vorgestellt wird. |
== Adaptive Multi–Rate Codec == | == Adaptive Multi–Rate Codec == | ||
<br> | <br> | ||
− | Der aufgrund seiner Flexibilität am weitesten verbreitete Sprachcoder ist der AMR–Codec (<i>Adaptive Multi–Rate</i>), der niederfrequente Signale $($im Frequenzbereich zwischen $300\ \rm Hz$ und $3.4\ \rm kHz)$ nach dem ACELP–Prinzip verarbeitet. Dieser Codierer stellt acht verschiedene Modi zur Verfügung mit Datenraten | + | Der aufgrund seiner Flexibilität am weitesten verbreitete Sprachcoder ist der $\rm AMR–Codec$ (<i>Adaptive Multi–Rate</i>), der niederfrequente Signale $($im Frequenzbereich zwischen $300\ \rm Hz$ und $3.4\ \rm kHz)$ nach dem ACELP–Prinzip verarbeitet. Dieser Codierer stellt acht verschiedene Modi zur Verfügung mit Datenraten |
[[Datei:P ID2201 Mob T 3 2 S5.png|right|frame|Modi des AMR– und des Wideband–AMR–Codecs|class=fit]] | [[Datei:P ID2201 Mob T 3 2 S5.png|right|frame|Modi des AMR– und des Wideband–AMR–Codecs|class=fit]] | ||
Zeile 210: | Zeile 210: | ||
{{BlaueBox|TEXT= | {{BlaueBox|TEXT= | ||
$\text{Fazit:}$ | $\text{Fazit:}$ | ||
− | Der | + | Der $\rm AMR–Codec$ zeichnet sich durch folgende Eigenschaften aus: |
*Er passt sich flexibel an die aktuellen Gegebenheiten des Funkkanals und an die jeweilige Netzauslastung an, | *Er passt sich flexibel an die aktuellen Gegebenheiten des Funkkanals und an die jeweilige Netzauslastung an, | ||
:*indem er entweder im Vollraten–Modus $($höhere Sprachqualität ⇒ Modus $\ge 7.4 \ \rm kbit/s)$ | :*indem er entweder im Vollraten–Modus $($höhere Sprachqualität ⇒ Modus $\ge 7.4 \ \rm kbit/s)$ | ||
Zeile 221: | Zeile 221: | ||
Der AMR–Codec wird bei GSM und UMTS in gleicher Weise eingesetzt. | Der AMR–Codec wird bei GSM und UMTS in gleicher Weise eingesetzt. | ||
− | *Ausschließlich bei UMTS Anwendung findet dagegen der | + | *Ausschließlich bei UMTS Anwendung findet dagegen der $\rm Wideband–AMR$ $\rm (W–AMR)$ für breitbandigere Signale zwischen $50\ \rm Hz$ und $7\ \rm kHz$. |
* Die Abtastung erfolgt hier mit $16\ \rm kHz$ und die Quantisierung mit $14 \ \rm Bit$. | * Die Abtastung erfolgt hier mit $16\ \rm kHz$ und die Quantisierung mit $14 \ \rm Bit$. | ||
*Die neun definierten Modi des W–AMR sind in der unteren Zeile der obigen Tabelle angegeben, die häufiger genutzten sind wieder dunkel hinterlegt.<br> | *Die neun definierten Modi des W–AMR sind in der unteren Zeile der obigen Tabelle angegeben, die häufiger genutzten sind wieder dunkel hinterlegt.<br> |
Version vom 12. August 2020, 14:22 Uhr
Inhaltsverzeichnis
Zellulare Architektur
Charakteristisch für GSM und UMTS gleichermaßen ist die zellulare Netzstruktur, die man häufig durch Hexagone annähert (linke Grafik):
- Die Farben weiß, gelb und blau deuten unterschiedliche Frequenzen an $($hier: Reuse–Faktor $3)$, wodurch Interzellinterferenzen vermieden werden.
- Die rechte Grafik zeigt ein realistischeres Layout mit nicht hexagonalen und auch unterschiedlich großen Zellen, je nach erwarteter Teilnehmerdichte und Geländetopologie. Die Basisstation liegt auch nicht immer in der Zellenmitte.
Beim GSM–D–Netz $(f_{\rm T} = 900 \ \rm MHz)$ wird der Zellenradius mit maximal $\text{35 km}$ angegeben. Beim E–Netz ist der maximale Radius wegen der größeren Trägerfrequenz $(1800 \ \rm MHz)$ nur halb so groß.
Im UMTS–Netz $(f_{\rm T} \approx 2 \ \rm GHz)$ gibt es verschiedene Typen von Funkzellen:
- Makrozellen decken das komplette Versorgungsgebiet ab und folgen dem klassischen Design. Sowohl Überlappungen als auch „Löcher” zwischen den Zellen sollen minimiert werden. Eine Makrozelle hat meist viele Makro–Nachbarn: Bei exakt hexagonalen Zellen sechs, in Realität einige mehr. Die Basisstationen arbeiten mit hoher Leistung $\text{(20 bis 40 W)}$, sind sehr hoch aufgehängt und verwenden sektorisierte Antennen. In dünn besiedelten Regionen haben Makrozellen Durchmesser bis zu einigen Kilometern. In Innenstädten werden aber auch die Makrozellen zur Kapazitätssteigerung sehr klein gehalten, oft nur mit wenigen Hundert Meter Durchmesser.
- Mikrozellen decken einen kleinen Teil einer Makrozelle ab und dienen in erster Linie zur lokalen Kapazitätssteigerung (Ausleuchtung von Funklöchern). Sie haben meist nur einen Makro–Nachbarn, können aber auch andere Micro/Pico/Femto–Nachbarn haben. Die Leistung ist mit $\text{(5 bis 10 W)}$ etwas niedriger und die Geräte sind kleiner als in einer Makrozelle. Die meist nicht sektorisierten Antennen müssen aber ebenfalls ausreichend hoch (an Mast oder Hauswand) positioniert werden.
- Pikozellen versorgen kleine Gebiete $(d \approx 100 \ \rm m)$ mit sehr hohem Datenaufkommen (Beispiele: Flughäfen, Einkaufszentren, Stadien). Sie erlauben höhere Datenraten, allerdings zu Lasten der Bewegungsgeschwindigkeit. Die Geräte einer Pikozelle sind deutlich kleiner als die in einer Mikrozelle und arbeiten mit kleinerer Leistung von $\text{1 bis 5 W}$, sind aber flexibler bei der Montage.
- Femtozellen werden oft privat und unkoordiniert administriert (Beispiel: WLAN Access Point), teilweise mit privatem Backhaul (eigene DSL–Leitung). Man spricht auch von einer „Home Base Station”. Sie werden „Indoor” betrieben und arbeiten mit kleiner Leistung $\text{(< 1 W)}$ .
Interferenzleistung und Zellatmung
Benutzen mehrere Teilnehmer den gleichen Frequenzkanal, so kann es zu Interferenzen und damit zu einem sehr niedrigen Träger–zu–Interferenzabstand $($englisch: Carrier–to–Interference Ratio, $\rm CIR)$ kommen, wodurch die Übertragungsqualität erheblich beeinträchtigt wird. Gravierend ist das Problem bei UMTS, das auf dem Vielfachzugriffsverfahren $\rm CDMA$ (Code Division Multiple Access) basiert, da hier alle Teilnehmer den gleichen Frequenzkanal nutzen.
Man unterscheidet entsprechend der Grafik zwischen zwei Arten von Interferenzen:
- Intrazellinterferenz entsteht durch die Verwendung des gleichen Frequenzkanals von mehreren Teilnehmern innerhalb der gleichen Zelle. Im obigen Beispiel ergibt sich dieser Fall für $f_1 = f_2$.
- Zu Interzellinterferenz kommt es, wenn Teilnehmer benachbarter Zellen die gleiche Frequenz nutzen, im dargestellten Szenario beispielsweise dann, wenn $f_3 = f_4$ gilt.
Beide Interferenzarten führen zu einer Minderung der Übertragungsqualität.
Bei Intrazellinterferenz muss jeder Nutzer indivuell geregelt werden, zum Beispiel durch Reduzierung von Sendeleistung und/oder Datenrate.
Bei Interzellinterferenz (gleicher Frequenzkanal in benachbarten Zellen) lässt sich der störende Einfluss der Interferenzleistung auf die Übertragungsqualität begrenzen durch
- Zellatmung: Nimmt bei UMTS die Anzahl der aktiven Teilnehmer signifikant zu, so wird der Zellenradius und damit auch die aktuelle Interferenzleistung verkleinert. Für die Versorgung der Teilnehmer am Rande einer ausgelasteten Zelle springt eine weniger belastete Nachbarzelle ein.
- Leistungsregelung: Überschreitet die Gesamtinterferenzleistung innerhalb einer Funkzelle einen vorgegebenen Grenzwert, so wird die Sendeleistung aller Teilnehmer entsprechend herabgesetzt, was aber ebenfalls eine schlechtere Übertragungsqualität zur Folge hat.
Near–Far–Effekt
Der Near–Far–Effekt ist ausschließlich ein Problem des Uplinks, also der Übertragung von mobilen Teilnehmern zu einer Basisstation. Wir betrachten ein Szenario mit zwei unterschiedlich weit von der Basisstation (Node B) entfernten Nutzern entsprechend der folgenden Grafik.
- Senden beide Mobilstationen mit gleicher Leistung, so ist die Empfangsleistung des roten Nutzers $\rm A$ an der Basisstation aufgrund des Pfadverlustes deutlich kleiner als die des blauen Nutzers $\rm B$ (linkes Szenario). In großen Makrozellen kann der Unterschied bis zu $\text{100 dB}$ ausmachen. Dadurch wird das rote Signal weitgehend durch das blaue verdeckt.
- Man kann den Near–Far–Effekt weitgehend vermeiden, wenn der weiter entfernte Nutzer $\rm A$ mit höherer Leistung sendet als Nutzer $\rm B$, wie im rechten Szenario angedeutet. An der Basisstation ist dann die Empfangsleistung beider Mobilstationen (nahezu) gleich.
Anmerkung: Bei einem idealisierten System (Einwegekanal, ideale A/D–Wandler, vollständig lineare Verstärker) sind die übertragenen Daten der Nutzer orthogonal zueinander und man könnte die Nutzer auch bei sehr unterschiedlichen Empfangsleistungen einzeln detektieren. Diese Aussage gilt sowohl für GSM aufgrund der Mehrfachzugriffsverfahren FDMA und TDMA, aber auch für UMTS (CDMA) und für das 4G–System LTE (TDMA/OFDMA).
In der Realität ist jedoch die Orthogonalität aufgrund folgender Ursachen nicht immer gegeben:
- verschiedene Empfangspfade ⇒ Mehrwegekanal,
- nicht ideale Eigenschaften der Spreiz– und Scramblingcodes bei CDMA,
- Asynchronität der Nutzer im Zeitbereich (Grundlaufzeit der Pfade) und im Frequenzbereich (nicht ideale Oszillatoren, Dopplereffekt aufgrund der Mobilität der Nutzer).
Folglich sind die Nutzer nicht mehr orthogonal zueinander und der Störabstand des zu detektierenden Nutzers gegenüber den anderen Teilnehmern ist nicht beliebig hoch:
- Bei GSM und LTE kann man von Störabständen von $\text{25 dB}$ und mehr ausgehen,
- bei CDMA nur von ca. $\text{15 dB}$ ,
- bei hochratiger Datenübertragung eher noch von etwas weniger.
Leistungsregelung
Um den Near–Far–Effekt entsprechend der rechten Grafik auf der letzten Seite zu vermeiden, ist allerdings eine ausreichend gute Leistungsregelung erforderlich.
Hierzu ist anzumerken:
- Bei allen Systemen (GSM, UMTS und LTE) muss von einem Dynamikbereich an der Basisstation von $\text{80 dB}$ ausgegangen werden, wobei die Änderungen bezüglich Pfadverlust und Abschattung eher langsam erfolgen und für diese eine Regelung im Sekundenbereich um um $±\text{5 dB}$ ausreicht.
- Bei GSM und LTE ist eine Regelung im Sekundenbereich ausreichend, da der Störabstand des zu detektierenden Nutzers zu den anderen Nutzern aufgrund der guten Eigenschaften von FDMA/OFDMA $\text{25 dB}$ und mehr ist. Sehr schnelle Schwankungen des Fast–Fadings $($Dynamikbereich zwischen $\text{10 und 20 dB})$ müssen nicht ausgeglichen werden.
- Bei UMTS muss dagegen auch das Fast-Fading kompensiert werden, da der Störabstand der Nutzer zueinander geringer ist als die Schwankungen des Fast–Fadings. Für UMTS wurde Fast Power Control spezifiziert, wodurch die Sendeleistung alle $\text{0.67 ms}$ mit einer initialen Verzögerung von $\text{2 ms}$ um $±\text{1 dB}$ verändert werden kann.
- Andernfalls würde die Basisstation von einem Nutzer, der bei Fast–Fading innerhalb von etwa $\text{10 ms}$ von sehr schlechten auf eher gute Fadingbedingungen wechselt, plötzlich um $\text{10 bis 20 dB}$ mehr Leistung empfangen. Alle anderen Nutzer in der Zelle würden dadurch extrem gestört.
Wie bereits erwähnt ist der Near–Far–Effekt und damit auch die Leistungsregelung ausschließlich ein Problem des Uplinks.
- Für den Downlink ist eine ausgeklügelte Leistungsregelung weniger essentiell.
- Versorgt man aber die Nutzer nahe der Basisstation mit einer geringeren Leistung, so verringert sich dadurch auch die Interzellinterferenz.
- Das heißt: Alle anderen Nutzer in der betrachteten Zelle werden dann durch den Datenverkehr zu dem nahen Nutzer weniger stark beeinträchtigt.
Verschiedene Handover–Strategien
Ein zweites Problem neben dem Near–Far–Effekt tritt auf, wenn ein Mobilfunkteilnehmer von einer Zelle in eine andere wechselt. Um den Übergang zwischen verschiedenen Zellen für die Nutzer als möglichst unterbrechungsfrei erscheinen zu lassen, wird bei leitungsvermittelten UMTS–Diensten und bei GSM ein so genanntes Handover eingesetzt. Man unterscheidet zwei Arten:
- Hard Handover: Hierbei wird zu einem bestimmten Zeitpunkt die Verbindung schlagartig von der aktuellen Basisstation zu einer anderen Basisstation umgeleitet.
- Soft Handover: Die Übergabe eines Teilnehmers von einer Basisstation zu einer anderen erfolgt allmählich, bis dieser die erste Zelle endgültig verlassen hat. Durch die Kombination mehrerer Links – bei UMTS bis zu drei – lässt sich sogar ein Diversitätsgewinn erzielen.
$\text{Beispiel 1:}$ Die Grafik zeigt ein Downlink–Szenarien, wobei eine Mobilstation an gewissen Orten sein Signal von zwei verschiedenen Basisstationen $(\rm BS1$ und $\rm BS2)$ empfangen kann.
- Bei Hard Handover wertet die Mobilstation an Punkt $\rm A$ nur das Signal von $\rm BS1$ aus und an Punkt $\rm C$ nur das Signal von $\rm BS2$.
- ⇒ Die Umschaltung erfolgt schlagartig, wenn sich der Teilnehmer am Punkt $\rm B$ befindet.
- Verwendet man Soft Handover und Soft Combining, so profitiert die Mobilstation von beiden Signalen.
- ⇒ An jedem Ort $(\rm A, \ B, \ C)$ erhöht sich die Empfangsleistung. Es ergibt sich so ein vom Kanal–SNR abhängiger Diversitätsgewinn, zusätzlich ein Kohärenzgewinn von $\text{3 dB}$.
Diese Aussagen lassen sich auch auf das rechte Szenario übertragen, bei der die Basisstation mit gerichteten Antennen in drei Sektoren abstrahlt. Hierbei ist angenommen, dass der Abstrahlwinkel etwas größer ist als $120^\circ$, wovon in der Praxis ausgegangen werden kann.
Im UMTS–Downlink werden die Daten im Radio Network Controller (RNC) gesplittet, über verschiedene Basisstationen ausgestrahlt und in der Mobilstation wieder zusammengesetzt (Rake Processing).
Im UMTS–Uplink werden die gesendeten Daten von allen beteiligten Basisstationen empfangen. Die Zusammenlegung der Daten (Soft Combining) findet im RNC statt. Dieser leitet anschließend die Daten an das Core Network (CN) weiter.
Man unterscheidet hierbei:
- Softer Handover: Eine Basisstation (Node B) empfängt das Signal eines Teilnehmers über zwei Sektoren und macht „Soft Combining”. Es gibt einen Diversitätsgewinn sowie einen Kohärenzgewinn von $\text{3 dB}$.
- Intra–RNC Handover: Zwei Basisstationen decodieren das Signal, machen einen CRC–Check und melden ihr Ergebnis an den RNC (oder einen CRC–Fehler). Meldet nur eine Station einen CRC–Fehler, so verwendet man die anderen Daten. Es gibt keinen Kohärenzgewinn und der Diversitätsgewinn ist geringer als bei „Softer Handover”.
Typisches Mobilfunkübertragungssystem
Nun sollen einige Komponenten von Mobilfunksystemen erklärt werden, die sowohl bei GSM als auch bei UMTS nötig sind.
- Die Grafik zeigt die Komponenten des GSM–Senders; die angegebenen Raten gelten ebenfalls nur für GSM.
- Für die GSM–Erweiterung GPRS erhält man andere Zahlenwerte.
Für UMTS ergibt sich eine ähnliche Struktur, wenn auch nicht die exakt gleiche. Zudem sind die Bitraten der UMTS–Datenübertragung deutlich höher, während für die Sprachübertragung von vergleichbaren Raten wie für GSM ausgegangen werden kann.
Betrachten wir zunächst die $\rm GSM–Sprachübertragung$, also den oberen Zweig der Grafik:
- Die Datenrate eines auf $4\ \rm kHz$ begrenzten PCM–Sprachsignals ergibt sich bei Abtastung mit $8\ \rm kHz$ und Quantisierung mit $13\ \rm Bit$ zu $104 \ \rm kbit/s$. Durch die Sprachcodierung werden bei GSM für jeden $20\ \rm ms$–Rahmen genau $260\ \rm Bit$ extrahiert. Es wird also ein Bitstrom mit $13 \ \rm kbit/s$ erzeugt.
- Aufgabe der gestrichelt eingezeichneten „Voice Activity Detection” ist es zu entscheiden, ob der aktuelle Sprachrahmen tatsächlich ein Sprachsignal enthält oder eine Sprachpause, während der die Leistung des Sendeverstärkers heruntergefahren werden kann.
- Durch Kanalcodierung $\rm (CRC$ und Faltungscode$)$ wird gezielt Redundanz hinzugefügt, um eine Fehlerkorrektur beim Empfänger zu ermöglichen. Dadurch erhöht sich die Brutto–Datenrate auf $22.8 \ \rm kbit/s$, wobei die wichtigeren Bits des Sprachcoders besonders geschützt werden.
- Der „Interleaver” verwürfelt die Bitfolge des Kanalcoders und vermindert so den Einfluss von Bündelfehlern. Hierzu werden die $456$ Eingangsbit auf vier Zeitrahmen zu je $114\ \rm Bit$ aufgeteilt und verschachtelt. Aufeinanderfolgende Bits werden immer in acht verschiedenen Bursts übertragen.
Bei der $\rm GSM–Datenübertragung$ (unterer Zweig der Grafik) ist die Nutzdatenrate auf $9.6 \ \rm kbit/s$ beschränkt, um der Kanalcodierung mehr Raum zu geben. Hier ist die resultierende Coderate mit $192/456 = 0.421$ kleiner als im oberen Zweig $(260/456 = 0.57)$.
Auch das Interleaving ist für Daten anders organisiert als für Sprache. Einheitlich für beide Zweige ist aber die effektive Datenrate von $22.8 \ \rm kbit/s$ nach dem Interleaver. Die restliche Beschreibung gilt für Sprache und Daten gleichermaßen:
- Nach dem Interleaving folgt die „Verschlüsselung” zum Zwecke der Authentifizierung der Teilnehmer und zur Sicherung der Funkschnittstelle gegenüber „Abhören”. UMTS bietet noch einige weitere Sicherheitsmaßnahmen.
- Der nächste Block ist die „Burstbildung”: Die $456\ \rm Bit$ nach Kanalcodierung, Interleaving und Verschlüsselung werden durch Hinzufügen von Signalisierungsbits, „Guard Period”, usw. auf $625\ \rm Bit$ erweitert, die innerhalb von vier Zeitschlitzen $(4 \cdot T_{\rm Z})$ übertragen werden.
- Daraus resultiert die Gesamtdatenrate von $625/(4 · 5769\ \rm µs) \approx 270.833 \ \rm kbit/s$, so dass für jeden der acht per TDMA verschalteten GSM–Nutzer eine Bruttodatenrate von etwa $33.854 \ \rm kbit/s$ zur Verfügung steht.
- Bei Sprachübertragung sind davon allerdings nur $38.5\%$ Nutzdaten und bei der Datenübertragung sogar nur $28.4\%$.
Ein $\text{wesentlicher Unterschied zwischen GSM und UMTS}$ sind die unterschiedlichen Modulations– und Vielfachzugriffsverfahren:
- Bei GSM Gaussian Minimum Shift Keying $\rm (GMSK)$ zusammen mit $\rm FDMA$ und $\rm TDMA$,
- bei UMTS Quaternary Phase Shift Keying $\rm (QPSK)$ sowie $\rm CDMA$ und $\rm TDMA$.
Hierauf wird in den Kapiteln Systemarchitektur und Basiseinheiten von GSM bzw. Anforderungen an Mobilfunksysteme der dritten Generation noch genauer eingegangen. Weiter ist zu beachten:
- Das auf CDMA basierende $\rm UMTS$ ist durch die Chiprate von $R_{\rm C} = 3.84 \ \rm Mchip/s$ gekennzeichnet, woraus die Bitrate $R_{\rm B} = R_{\rm C}/J$ gemäß dem gewählten Spreizfaktor $J$ berechnet werden kann.
- Mit $J = 4$, ... , $512$ ergeben sich Bruttodatenraten zwischen $7.5 \ \rm kbit/s$ und $960 \ \rm kbit/s$, die abhängig von den aktuellen Kanalbedingungen ausgewählt werden.
- Aufgrund der verschiedenartigen Übertragungstechnik ist bei UMTS der Block „Burstbildung” anders organisiert. Diese basiert auf dem Transmission Time Interval $\rm (TTI)$. Ein solches „TTI” hatte in der ursprünglichen UMTS–Spezifikation eine Dauer zwischen $10\ \rm ms$ und $80\ \rm ms$.
- Um den Zeitverlust bei den erforderlichen Blockwiederholungen bei schlechten Kanalbedingungen zu verringern, wurde dieser TTI–Wert in späteren Releases bis auf $2\ \rm ms$ (für HSDPA) herabgesetzt.
$\text{Fazit:}$ Bei $\rm GSM$ und $\rm UMTS$ sind insbesondere folgende Probleme gemeinsam zu lösen:
- ein geeignetes Sprachcodierverfahren,
- eine geeignete Kanalschätzung und Rückmeldung an den Sender,
- eine funktionierende Trägerphasen– und Systemtakterkennung,
- die Rahmensynchronisation.
Geläufige Sprachcodierverfahren
Für die GSM–Sprachübertragung steht jedem Teilnehmer nur eine Netto–Datenrate von $13\ \rm kbit/s$ zur Verfügung $($mit Kanalcodierung $22.8\ \rm kbit/s)$, während die PCM–Übertragung mit $8\ \rm kHz$ Abtastung und $13\ \rm Bit$ Quantisierung eine Datenrate von $104\ \rm kbit/s$ erfordern würde.
Um das Abtasttheorem mit einer gewissen Toleranz einzuhalten, wird das Audiosignal durch Filterung auf den Frequenzbereich von $300\ \rm Hz$ bis $3.4\ \rm kHz$ begrenzt.
Die nötige Komprimierung um den Faktor $8$ ist Aufgabe der $\rm Sprachcodierung$ $($hierunter versteht man eine Sonderform der $\rm Quellencodierung)$, wofür in den 1990er Jahren mehrere Standards definiert wurden:
- Der $\text{GSM Fullrate Vocoder}$ (zu deutsch: GSM–Vollraten–Sprachcoder) basiert auf den drei Kompressionsverfahren $\rm LPC$ (Linear Predictive Coding), $\rm LTP$ (Long Term Prediction) und $\rm RPE$ (Regular Pulse Excitation). Dieser Coder extrahiert aus jedem $20\ \rm ms$–Sprachrahmen $74$ Parameter mit einem Gesamtumfang von $260\ \rm Bit$, woraus sich die Datenrate $13\ \rm kbit/s$ ergibt. Beim Empfänger muss aus diesen $260\ \rm Bit$ das Sprachsignal wieder synthetisiert werden.
- Der $\text{GSM Halfrate Vocoder}$ (deutsch: GSM–Halbraten–Sprachcoder) wurde 1994 spezifiziert und bietet die Möglichkeit, ein auf $4\ \rm kHz$ bandbegrenztes Audiosignal bei nahezu gleicher Qualität in einem halben Verkehrskanal zu übertragen. Heutzutage spielt dieser Sprachcodec nur noch eine untergeordnete Rolle.
- Der $\text{Enhanced Fullrate Codec}$ (kurz EFR–Codec) wurde 1995 für das US–amerikanische DCS 1900–System entwickelt. Er arbeitet nach dem Codierungsverfahren Algebraic Code Excited Linear Prediction $\rm (ACELP)$ und bietet gegenüber dem herkömmlichen Fullrate–Codec aufgrund des ACELP–Prinzips und wegen der verbesserten Fehlererkennung und –verschleierung eine deutlich höhere Sprachqualität.
Aus dem ACELP–Blockschaltbild im Buch „Beispiele von Nachrichtensystemen” erkennt man
- die Segmentierung des digitalisierten Sprachsignals in Rahmen und Subblöcke,
- die LPC–Analyse durch ein digitales Filter $A(z)$ im rot hinterlegten Block,
- die Langzeitprädiktion $\rm (LTP)$ mit Hilfe des adaptiven Codebuchs (blau umrahmt), und
- die Suche nach dem besten Eintrag im festen Codebuch (grün hervorgehoben).
Im Kapitel Verschiedene Sprachcodierverfahren des Buches „Beispiele von Nachrichtensystemen” wird unter anderem der EFR–Codec im Detail beschrieben. Die Datenrate von $12.2 \ \rm kbit/s$ ist identisch mit dem höchsten Modus des AMR–Codecs, der auf der nächsten Seite kurz vorgestellt wird.
Adaptive Multi–Rate Codec
Der aufgrund seiner Flexibilität am weitesten verbreitete Sprachcoder ist der $\rm AMR–Codec$ (Adaptive Multi–Rate), der niederfrequente Signale $($im Frequenzbereich zwischen $300\ \rm Hz$ und $3.4\ \rm kHz)$ nach dem ACELP–Prinzip verarbeitet. Dieser Codierer stellt acht verschiedene Modi zur Verfügung mit Datenraten
- zwischen $12.2\ \rm kbit/s$ $(244 \ \rm Bit$ pro $20\ \rm ms$–Sprachrahmen$)$
- und $4.75\ \rm kbit/s$ $(95 \ \rm Bit$ pro Sprachrahmen$)$.
Drei Modi spielen eine Sonderrolle (in der ersten Zeile der Tabelle dunkler hinterlegt), nämlich
- $12.2 \ \rm kbit/s$ – der verbesserte GSM–Vollraten–Codec (EFR–Codec),
- $7.4 \ \rm kbit/s$ – Kompression nach dem US–amerikanischen Standard IS–641,
- $6.7 \ \rm kbit/s$ – EFR–Sprachübertragung des japanischen PDC–Systems.
$\text{Fazit:}$ Der $\rm AMR–Codec$ zeichnet sich durch folgende Eigenschaften aus:
- Er passt sich flexibel an die aktuellen Gegebenheiten des Funkkanals und an die jeweilige Netzauslastung an,
- indem er entweder im Vollraten–Modus $($höhere Sprachqualität ⇒ Modus $\ge 7.4 \ \rm kbit/s)$
- oder im Halbraten–Modus $($also mit geringerer Datenrate ⇒ Modus $\le 6.7 \ \rm kbit/s)$ arbeitet.
- Daneben gibt es noch etliche Zwischenstufen.
- Der AMR–Codec bietet sowohl für den Vollraten– als auch für den Halbratenverkehrskanal eine verbesserte Sprachqualität.
- Dies ist insbesondere auf die flexibel handhabbare Aufteilung der verfügbaren Brutto–Kanaldatenrate zwischen Sprach– und Kanalcodierung zurückzuführen.
Der AMR–Codec wird bei GSM und UMTS in gleicher Weise eingesetzt.
- Ausschließlich bei UMTS Anwendung findet dagegen der $\rm Wideband–AMR$ $\rm (W–AMR)$ für breitbandigere Signale zwischen $50\ \rm Hz$ und $7\ \rm kHz$.
- Die Abtastung erfolgt hier mit $16\ \rm kHz$ und die Quantisierung mit $14 \ \rm Bit$.
- Die neun definierten Modi des W–AMR sind in der unteren Zeile der obigen Tabelle angegeben, die häufiger genutzten sind wieder dunkel hinterlegt.
Das interaktive Applet Qualität verschiedener Sprachcodecs demonstriert akustisch die erreichbare Sprachqualität der hier beschriebenen Sprachcodecs.
Aufgaben zum Kapitel
Aufgabe 3.2Z: Komponenten des GSM–Systems
Aufgabe 3.3: Zellulare Mobilfunksysteme
Aufgabe 3.4: Verschiedene Sprach–Codecs
3.4Z: GSM–Vollraten–Sprachcodec