Abschnitt: 3.3 Sprachcodierung
Seite: 4 a von 9

 
 

Long Term Prediction – Langzeitprädiktion (1)

Bei der Long Term Prediction (LTP) wird die Eigenschaft des Sprachsignals ausgenutzt, dass es auch periodische Strukturen (stimmhafte Abschnitte) besitzt. Dieser Umstand wird dazu verwendet, um die im Signal vorhandene Redundanz zu reduzieren. Die Langzeitprädiktion (LTP–Analyse und –Filterung) wird viermal pro Sprachrahmen, also alle 5 ms durchgeführt. Die einzelnen Subblöcke bestehen aus jeweils 40 Abtastwerten und werden mit i = 1, 2, 3, 4 nummeriert.

Es folgt eine Kurzbeschreibung der Langzeitprädiktion gemäß dem obigen Prinzipschaltbild – siehe [Kai05]. Das Eingangssignal ist das Ausgangssignal eLPC(n) der Kurzzeitprädiktion. Die Signale nach der Segmentierung in vier Subblöcken werden mit ei(l) bezeichnet, wobei jeweils l = 1, 2, ... , 40 gilt.
  • Zu dieser Analyse wird für jeden Subblock die Kreuzkorrelationsfunktion φee',i(k) des aktuellen Subblocks i des LPC–Prädiktionsfehlersignals ei(l) mit dem rekonstruierten LPC–Restsignal e'i(l) aus den drei vorherigen Teilrahmen berechnet. Das Gedächtnis dieses LTP–Prädiktors beträgt zwischen 5 und 15 Millisekunden und ist somit deutlich länger als das des LPC–Prädiktors (1 ms).
  • e'i(l) ist die Summe aus dem Signal yi(l) am Ausgang des LTP–Filters und einem Korrektursignal eRPE,i(l), das von der nachfolgenden Komponente (Regular Pulse Excitation) für den i–ten Subblock bereitgestellt wird.
  • Der Wert von k, für den die Kreuzkorrelationsfunktion φee',i(k) maximal wird, bestimmt die für jeden Subblock i optimale LTP–Verzögerung N(i). Die Verzögerungen N(1) bis N(4) werden jeweils mit 7 Bit quantisiert und zur Übertragung bereitgestellt.
  • Der zu N(i) gehörige Verstärkungsfaktor G(i) – auch LTP–Gain genannt – wird so bestimmt, dass der an der Stelle N(i) gefundene Subblock nach Multiplikation mit G(i) am besten zum aktuellen Teilrahmen ei(l) passt. Die Verstärkungsfaktoren G(1) bis G(4) werden jeweils mit 2 Bit quantisiert und ergeben zusammen mit N(1), ..., N(4) die 36 Bit für die acht LTP–Parameter.
  • Das Signal yi(l) nach LTP–Analyse und –Filterung ist ein Schätzsignal für das LPC–Signal ei(l) im i–ten Subblock. Die Differenz zwischen beiden ergibt das LTP–Restsignal eLTP,i(l), das an die nächste Funktionseinheit „RPE” weitergegeben wird.
 
 

Inhaltsverzeichnis
Seitenübersicht
Weiter: Nächste Seite
 
 
Persönliche Einstellungen
Downloads