Kwantowanie sygnałów analogowychcygnus.tele.pw.edu.pl/.../kwantowanie_pd_prez.pdf · Kwantowanie...

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy

Przemysław Dymarski, Instytut Telekomunikacji Politechniki Warszawskiej

[email protected]

Treść wykładu:

Sygnał mowy i jego właściwości

Kwantowanie skalarne: kwantyzator równomierny,

nierównomierny, adaptacyjny

Zastosowanie w koderze PCM G.711

Kwantowanie wektorowe

Kodowanie różnicowe, predykcja, kodery ADPCM

Kodery telefonii komórkowej (CELP)

Wokoder predykcyjny

Literatura: K.Sayood “Kompresja danych – wprowadzenie”, Wyd. RM, W-wa 2002

A.Drozdek “Wprowadzenie do kompresji danych”

R.Tadeusiewicz "Sygnał mowy“

W.Skarbek ”MULTIMEDIA – algorytmy i standardy kompresji”

T.P.Zieliński « Cyfrowe przetwarzanie sygnałów – od teorii do zastosowań »,

WKiŁ, Warszawa 2005

T.P.Zieliński « Cyfrowe przetwarzanie sygnałów w telekomunikacji »,

PWN, Warszawa 2014

1. Sygnał mowy i jego modele

Badanie jakości sygnału mowy

Sygnał mowy

Próbkowanie sygnału analogowego

Tw. o próbkowaniu (Shannon, Nyquist, Kotelnikow):

Próbkowanie jest procesem bezstratnym (można odzyskać sygnał

analogowy bez zniekształceń), jeśli częstotliwość próbkowania (tzn.

liczba próbek na sekundę) jest większa niż 2B, gdzie B jest

szerokością pasma sygnału analogowego.

BfTs 21

Próbkowanie idealne

Próbkowanie chwilowe

Claude Shannon

1916 - 2001

Harry Nyquist

1889 - 1976

Vladimir Kotelnikov

1908 - 2005

Ocena jakości mowy: metody subiektywne (odsłuchowe)

• MOS – mean opinion score (oceny od 1 do 5)

• Wyrazistość logatomowa (%) = odtworzenie ze słuchu krótkich

słów pozbawionych semantycznego znaczenia, np. tra, bru

• zastosowanie zdań nieprzewidywalnych semantycznie

(SUS - Semantically Unpredictable Sentences),

np. Umysł ugrzązł podczas marsowego wiadra

Metody obiektywne:

SNR jako najprostszy obiektywny wskaźnik jakości

Metody obiektywne:

SNR w ujęciu segmentowym

Maskowanie szumu

widmo sygnału

widmo szumu

Metody obiektywne uwzględniające maskowanie:

- PESQ (ITU-T P.862)

- POLQA (ITU-T P.863)

Wynik: MOS w skali 1-5

Kwantyzacja skalarna

{xn} - zbiór próbek, {x*n} – próbki skwantowane

y1 y2,… yL

xn

x*n

Kwantyzacja skalarna

{xn} - zbiór próbek, {x*n} – próbki skwantowane

y1 y2,… yL

xn

x*n

Kwantyzacja jest procesem stratnym

Kwantyzacja równomierna

2

2

3122

1212

1212 )(

L

zLz

e

2

2

2

2

2

3 Lz

SNR x

e

x

21010

210 log10log20][3log10][ LzdBdBSNR x

(gdy nie ma przesterowania)

Zwiększenie rozdzielczości o 1 bit na próbkę:

-> podwojenie liczby poziomów

-> 2-krotne zmniejszenie amplitudy błędu kwantyzacji

-> 4-krotne zmniejszenie mocy błędu kwantyzacji

-> 4-krotne (o 6 dB) zwiększenie SNR

Zasada „6 dB/bit”

Charakterystyki kwantyzatora równomiernego

Kwantyzacja nierównomierna (logarytmiczna)

Zasady logarytmicznej nie można stosować dla x~0 gdyż wymagałoby to użycia

nieskończonej liczby poziomów kwantyzacji. Z tego względu dla sygnałów o małej amplitudzie

kwantyzator logarytmiczny przechodzi w równomierny (stosowane są dwa algorytmy:

A i µ). Pociąga to za sobą spadek SNR dla tych sygnałów.

Kwantyzatory logarytmiczne A i µ stosowane są w najpopularniejszym standardzie

PCM G.711 (pasmo sygnału mowy 300-3400 Hz, częstotliwość próbkowania 8 kHz, L=256

poziomów kwantyzacji, n=8 bitów na próbkę, przepływność binarna 64 kbit/s)

Zasada logarytmiczna: (x) proporcjonalne do x

Charakterystyki kwantyzatorów

a) równomierny

b) logarytmiczny typu A

c) logarytmiczny typu µ

d) optymalny dla sygnału o mocy -25 dB

Kwantyzacja adaptacyjna

1. Adaptacja w przód (MPEG Audio)

brak przesterowań

opóźnienie

przesyłanie z

Zakres pracy z podąża za amplitudą sygnału

Kwantyzacja adaptacyjna

2. Adaptacja wstecz (ADPCM)

np. kwantyzator 4-poziomowy

przesterowania

brak opóźnień

nie przesyła się z

Kwantyzator wektorowy

VQ - vector quantizer

P(f1),...,P(fL):

komórki Voronoi’a

Georgij Voronij

Kwantyzator wektorowy

VQ - vector quantizer

( ) *j jx P f x f

Przewaga VQ nad kwantyzatorem skalarnym:

- wykorzystanie korelacji między kolejnymi N próbkami

- wykorzystanie właściwości wielowymiarowej gęstości

prawdopodobieństwa próbek

ADPCM (adaptive differential pulse code modulation)

Modulator

Demodulator

nx

p

nx

p

nx

n*

n

*

n

*

nx

*

nx

-sygnał wejściowy

-sygnał różnicowy (błąd predykcji)

-sygnał predykcji

-skwantowany syg. różnicowy

-sygnał wyjściowy

-błąd kwantyzacji

nx

n

p

nx

*

n

*

nx

nnne *

nnnnnnnn exxxxe ***

qp

e

x

e

x SNRGSNR 2

2

2

2

2

2

-zysk predykcji (zależy od predyktora)

-SNR kwantyzatora (w kwantyzatorze adaptacyjnym

zależy głównie od liczby poziomów kwantyzacji L)

][][][ dBSNRdBGdBSNR qp

2

2

xpG

2

2

e

qSNR

ADPCM (adaptive differential pulse code modulation)

Kodery CELP (Code Excited Linear Prediction)

na przykładzie G.728

- Operacje na wektorach N=5 -wymiarowych

(stąd opóźnienie 0.625ms)

- Przesyła się indeks wybranego wektora (j) w 7 bitach

i wzmocnienie g w 3 bitach. Razem 10 bitów na N=5 próbek,

czyli 2 bity na próbkę, co daje przepływność binarną

2 • 8000=16000 bit/s

dekoder

koder

filtr syntezy (predykcyjny)

Wokodery od kilkuset do około 2400 bit/s

d=1: mowa dźwięczna

d=0: mowa bezdźwięczna

T0 - okres tonu krtaniowego (okres drgań strun głosowych)

Można wyróżnić więcej klas pobudzeń:

Porównanie standardów kodowania mowy

Kwantowanie sygnałów analogowychcygnus.tele.pw.edu.pl/.../kwantowanie_pd_prez.pdf · Kwantowanie...

Documents

Transcript of Kwantowanie sygnałów analogowychcygnus.tele.pw.edu.pl/.../kwantowanie_pd_prez.pdf · Kwantowanie...