Beim GSM–Vollraten-Codec (Full Rate Vocoder) wird das analoge Sprachsignal im Frequenzbereich zwischen 300 und 3400 Hz zunächst mit 8 kHz abgetastet und danach mit 13 Bit linear quantisiert (A/D–Wandlung), was eine Datenrate von 104 kbit/s ergibt. Die Sprachcodierung erfolgt bei diesem Verfahren in vier Schritten:
die Vorverarbeitung,
die Einstellung des Kurzzeitanalyse–Filters (Linear Predictive Coding, LPC),
die Steuerung des Langzeitanalyse–Filters (Long Term Prediction, LTP) und
die Codierung des Restsignals durch eine Folge von Pulsen (Regular Pulse Excitation, RPE).
In obigem Bild bezeichnet s(n) das im Abstand TA = 125 µs abgetastete und quantisierte Sprachsignal nach der kontinuierlich durchgeführten Vorverarbeitung, wobei
das digitalisierte Mikrofonsignal von einem eventuell vorhandenen Gleichsignalanteil (Offset) befreit wird, um bei der Decodierung einen störenden Pfeifton von ca. 2.6 kHz bei der Wiedergewinnung der höheren Frequenzanteile zu vermeiden, und
zusätzlich die höheren Spektralanteile von s(n) angehoben werden, um die Rechengenauigkeit und Effektivität der nachfolgenden LPC–Analyse zu verbessern.
Die nachfolgenden Verarbeitungsschritte (LPC, LTP, RPE) erfolgen jeweils in Blöcken von 20 ms Dauer entsprechend 160 Abtastwerten des vorverarbeiteten Sprachsignals, die man als GSM–Sprachrahmen bezeichnet. Beim Vollraten–Codec werden pro Sprachrahmen insgesamt 260 Bit erzeugt, woraus sich eine Datenrate von 13 kbit/s ergibt. Dies entspricht einer Kompression des Sprachsignals um den Faktor 8 (104 kbit/s bezogen auf 13 kbit/s).
In der Tabelle sind die 76 Parameter (260 Bit) der Funktionseinheiten LPC, LTP und RPE angegeben. Die Bedeutung der einzelnen Größen wird auf den nachfolgenden Seiten im Detail beschrieben.