Kwantowanie sygnałów analogowychcygnus.tele.pw.edu.pl/.../kwantowanie_pd_prez.pdf · Kwantowanie...
Transcript of Kwantowanie sygnałów analogowychcygnus.tele.pw.edu.pl/.../kwantowanie_pd_prez.pdf · Kwantowanie...
Kwantowanie sygnałów analogowych na przykładzie sygnału mowy
Przemysław Dymarski, Instytut Telekomunikacji Politechniki Warszawskiej
Treść wykładu:
Sygnał mowy i jego właściwości
Kwantowanie skalarne: kwantyzator równomierny,
nierównomierny, adaptacyjny
Zastosowanie w koderze PCM G.711
Kwantowanie wektorowe
Kodowanie różnicowe, predykcja, kodery ADPCM
Kodery telefonii komórkowej (CELP)
Wokoder predykcyjny
Literatura: K.Sayood “Kompresja danych – wprowadzenie”, Wyd. RM, W-wa 2002
A.Drozdek “Wprowadzenie do kompresji danych”
R.Tadeusiewicz "Sygnał mowy“
W.Skarbek ”MULTIMEDIA – algorytmy i standardy kompresji”
T.P.Zieliński « Cyfrowe przetwarzanie sygnałów – od teorii do zastosowań »,
WKiŁ, Warszawa 2005
T.P.Zieliński « Cyfrowe przetwarzanie sygnałów w telekomunikacji »,
PWN, Warszawa 2014
1. Sygnał mowy i jego modele
Badanie jakości sygnału mowy
Sygnał mowy
Próbkowanie sygnału analogowego
Tw. o próbkowaniu (Shannon, Nyquist, Kotelnikow):
Próbkowanie jest procesem bezstratnym (można odzyskać sygnał
analogowy bez zniekształceń), jeśli częstotliwość próbkowania (tzn.
liczba próbek na sekundę) jest większa niż 2B, gdzie B jest
szerokością pasma sygnału analogowego.
BfTs 21
Próbkowanie idealne
Próbkowanie chwilowe
Claude Shannon
1916 - 2001
Harry Nyquist
1889 - 1976
Vladimir Kotelnikov
1908 - 2005
Ocena jakości mowy: metody subiektywne (odsłuchowe)
• MOS – mean opinion score (oceny od 1 do 5)
• Wyrazistość logatomowa (%) = odtworzenie ze słuchu krótkich
słów pozbawionych semantycznego znaczenia, np. tra, bru
• zastosowanie zdań nieprzewidywalnych semantycznie
(SUS - Semantically Unpredictable Sentences),
np. Umysł ugrzązł podczas marsowego wiadra
Metody obiektywne:
SNR jako najprostszy obiektywny wskaźnik jakości
Metody obiektywne:
SNR w ujęciu segmentowym
Maskowanie szumu
widmo sygnału
widmo szumu
Metody obiektywne uwzględniające maskowanie:
- PESQ (ITU-T P.862)
- POLQA (ITU-T P.863)
Wynik: MOS w skali 1-5
Kwantyzacja skalarna
{xn} - zbiór próbek, {x*n} – próbki skwantowane
y1 y2,… yL
xn
x*n
Kwantyzacja skalarna
{xn} - zbiór próbek, {x*n} – próbki skwantowane
y1 y2,… yL
xn
x*n
Kwantyzacja jest procesem stratnym
Kwantyzacja równomierna
2
2
3122
1212
1212 )(
L
zLz
e
2
2
2
2
2
3 Lz
SNR x
e
x
21010
210 log10log20][3log10][ LzdBdBSNR x
(gdy nie ma przesterowania)
Zwiększenie rozdzielczości o 1 bit na próbkę:
-> podwojenie liczby poziomów
-> 2-krotne zmniejszenie amplitudy błędu kwantyzacji
-> 4-krotne zmniejszenie mocy błędu kwantyzacji
-> 4-krotne (o 6 dB) zwiększenie SNR
Zasada „6 dB/bit”
Charakterystyki kwantyzatora równomiernego
Kwantyzacja nierównomierna (logarytmiczna)
Zasady logarytmicznej nie można stosować dla x~0 gdyż wymagałoby to użycia
nieskończonej liczby poziomów kwantyzacji. Z tego względu dla sygnałów o małej amplitudzie
kwantyzator logarytmiczny przechodzi w równomierny (stosowane są dwa algorytmy:
A i µ). Pociąga to za sobą spadek SNR dla tych sygnałów.
Kwantyzatory logarytmiczne A i µ stosowane są w najpopularniejszym standardzie
PCM G.711 (pasmo sygnału mowy 300-3400 Hz, częstotliwość próbkowania 8 kHz, L=256
poziomów kwantyzacji, n=8 bitów na próbkę, przepływność binarna 64 kbit/s)
Zasada logarytmiczna: (x) proporcjonalne do x
Charakterystyki kwantyzatorów
a) równomierny
b) logarytmiczny typu A
c) logarytmiczny typu µ
d) optymalny dla sygnału o mocy -25 dB
Kwantyzacja adaptacyjna
1. Adaptacja w przód (MPEG Audio)
brak przesterowań
opóźnienie
przesyłanie z
Zakres pracy z podąża za amplitudą sygnału
Kwantyzacja adaptacyjna
2. Adaptacja wstecz (ADPCM)
np. kwantyzator 4-poziomowy
przesterowania
brak opóźnień
nie przesyła się z
Kwantyzator wektorowy
VQ - vector quantizer
P(f1),...,P(fL):
komórki Voronoi’a
Georgij Voronij
Kwantyzator wektorowy
VQ - vector quantizer
( ) *j jx P f x f
Przewaga VQ nad kwantyzatorem skalarnym:
- wykorzystanie korelacji między kolejnymi N próbkami
- wykorzystanie właściwości wielowymiarowej gęstości
prawdopodobieństwa próbek
ADPCM (adaptive differential pulse code modulation)
Modulator
Demodulator
nx
p
nx
p
nx
n*
n
*
n
*
nx
*
nx
-sygnał wejściowy
-sygnał różnicowy (błąd predykcji)
-sygnał predykcji
-skwantowany syg. różnicowy
-sygnał wyjściowy
-błąd kwantyzacji
nx
n
p
nx
*
n
*
nx
nnne *
nnnnnnnn exxxxe ***
qp
e
x
e
x SNRGSNR 2
2
2
2
2
2
-zysk predykcji (zależy od predyktora)
-SNR kwantyzatora (w kwantyzatorze adaptacyjnym
zależy głównie od liczby poziomów kwantyzacji L)
][][][ dBSNRdBGdBSNR qp
2
2
xpG
2
2
e
qSNR
ADPCM (adaptive differential pulse code modulation)
Kodery CELP (Code Excited Linear Prediction)
na przykładzie G.728
- Operacje na wektorach N=5 -wymiarowych
(stąd opóźnienie 0.625ms)
- Przesyła się indeks wybranego wektora (j) w 7 bitach
i wzmocnienie g w 3 bitach. Razem 10 bitów na N=5 próbek,
czyli 2 bity na próbkę, co daje przepływność binarną
2 • 8000=16000 bit/s
dekoder
koder
filtr syntezy (predykcyjny)
Wokodery od kilkuset do około 2400 bit/s
d=1: mowa dźwięczna
d=0: mowa bezdźwięczna
T0 - okres tonu krtaniowego (okres drgań strun głosowych)
Można wyróżnić więcej klas pobudzeń:
Porównanie standardów kodowania mowy