Post on 21-Jul-2020
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 1
Przetwarzanie i transmisja danych multimedialnych
Wykład 6
Metody predykcyjne
Przemysław Sękalski
sekalski@dmcs.pl
Politechnika ŁódzkaKatedra Mikroelektroniki i Technik Informatycznych
DMCS
Wykład opracowano na podstawie materiałów udostępnionych przez dr hab. A. Przelaskowskiego
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 2
Plan wykładu
• Idea metod predykcyjnych
• Modulacja delta
• Dynamiczna modulacja delta
• Liniowa predykcja (Differential Pulse Code Modulation)
• Konteksty, skanowanie
• Omówienie współczesnych metod predykcji
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 3
Idea metod predykcyjnych
• Do tej pory przedstawione były metody kodowaniaentropijnego i słownikowego � zmiana sposobu reprezentacji informacji
• MoŜliwe jest zwiększenie efektywności poprzez wykorzystanie lokalnych i globalnych zaleŜności (korelacji).
• Modelowanie umoŜliwia przekształcenie ciągu wejściowego do reprezentacji pośredniej bardziej podatnej na kodowanie słownikowe i entropijne
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 4
Paradygmat kompresji - przypomnienie
Kodowanie Dekodowanie
ModelowanieModelowanie
Wiadomośćzakodowana
Wiadomośćwyjściowa
Wiadomośćwejściowa
Uaktualnianie modelu
Współczesny paradygmat kompresji
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 5
Modulacja delta
• Bazuje na kodowaniu róŜnicy wartości bieŜącej próbki xn oraz odtworzoną wartością poprzedniej próbki xn
• RóŜnica zostaje kwantowana zgodnie z równaniem:
…i przesłana do odbiorcy!• Otrzymana wartość po stronie odbiorcy jest odtwarzana jako:
1ˆn n ne x x −= −
n
n
1 jesli e 0ˆ ( )
1 jesli e 0n ne sign e>
= = − ≤
1ˆ ˆ ˆn n nx x e−= + ∆
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 6
Przykład
• Przykładowy ciąg wejściowy:
{3, 7, 10, 17, 22, 30, 40, 50, 49, 44, 48, 50, 49, 48, 45, 40, 38, 38, 43, 44, 48, 47, 48, 47, 48, 45, 40, 30, 20, 12, 8}
• Stała delta równa 5
• ZałoŜenie poprzedni symbol = 3
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 7
Modulacja delta
0
10
20
30
40
50
60
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31
5
dane wejściowe
∆ = 5
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 8
PrzeciąŜenie zbocza
0
10
20
30
40
50
60
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31
5
dane wejściowe
∆ = 5
PrzeciąŜenie zbocza
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 9
-10
0
10
20
30
40
50
60
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31
5
10
dane wejściowe
Granulacja
Granulacja
∆ = 5, ∆ = 10
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 10
Problemy
• Zwiększenie delty powoduje zmniejszenie przeciąŜenia zbocza w przypadku zmiany próbek wejściowych
• Zmniejszenie delty powoduje zmniejszenie granulacji w przypadku zbliŜonych lub stałych próbek wejściowych
• Wymagania redukujące przeciąŜenie oraz granulacje sąwzajemnie sprzeczne
• … a moŜe regulować deltę w zaleŜności od poprzednich próbek…
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 11
• Bazuje na kodowaniu róŜnicy wartości bieŜącej próbki xn oraz odtworzoną wartością poprzedniej próbki xn
• RóŜnica zostaje kwantowana zgodnie z równaniem:
• Otrzymana wartość po stronie odbiorcy jest odtwarzana jako:
Dynamiczna modulacja delta
1ˆ ˆ( ) ( )n n n ne sign e sign x x −= = −
min n-1 min
min n-1 min
11 12
jesli 0<
jesli 0>
ˆ ˆ w pozostaych przypadkachn
n n ne e− −
∆ ∆ < ∆
∆ = −∆ ∆ > −∆∆ +
1ˆ ˆ ˆn n nx x e−= + ∆
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 12
Dynamiczna modulacja delta
-10
0
10
20
30
40
50
60
70
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31
dyn
10
dane wejściowe
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 13
• Jak porównać, która modulacja jest lepsza ???
• Kumulatywny błąd predykcji:
• EMD ∆=5 = 211• EMD ∆=10 = 203• EMDD ∆0 = 5 = 234 !! chociaŜ wizualnie lepiej odpowiada
1
ˆn
i ii
E x x=
= −∑
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 14
• MoŜliwe jest wprowadzenie innych zaleŜności delty,
• MoŜliwe jest wprowadzenie szerszego kontekstu (uzaleŜnienie od większej liczby poprzedzających próbek), tzw. adaptacja wstecz
• MoŜliwe jest wprowadzenie zaleŜności od następnych próbek (niezbędny jest bufor – kodowanie/dekodowanie opóźnione),tzw. adaptacja w przód
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 15
Metoda DPCM
• Metoda róźnicowej modulacji kodowo-impulsowej DPCM (differential pulse code modulation)
• Przewidywana wartość próbki zaleŜy od kombinacji liniowej N poprzedników:
gdzie αi to współczynniki predykcji
• Błąd predykcji oznaczany jest jako:
gdzie Q() jest funkcją kwantyzująca(np. zaokrąglającą wynik do liczby całkowitej)
1
ˆ ˆN
n i n ii
x xα −=
=∑
ˆ ˆ( )n n ne Q x x= −
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 16
Modelowanie - Nadawanie
ˆneKodowanieKwantyzator
Wiadomośćzakodowana
Wiadomośćwejściowa +
-
en
z-1
z-1
z-1Z
aleŜ
ne o
d N
rzę
du
pred
ykto
raD
PC
M
α1
α2
αN
Predyktor liniowy
z-1
ke
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 17
Odbieranie
Dekodowanie
Wiadomośćzakodowana
Wiadomośćwyjściowa+
ˆnx+
z-1
z-1
Zal
eŜne
od
N r
zędu
pr
edyk
tora
DP
CM
α1
α2
αN
z-1
z-1
Predyktor liniowy
ke
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 18
Problem z DPCM
• Jak wyznaczyć optymalne wartości α1…αN ???
• Na przykład korzystając z metody najmniejszych kwadratów
naleŜy minimalizować σ
( )2
22 2
1 1 1 1
ˆ ˆt t t N
n n n n z i zi i i z
e x x x xσ α −= = = =
= = − = −
∑ ∑ ∑ ∑
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 19
• Aby to zrobić naleŜy wyznaczyć pochodne cząstkowe po wszystkich współczynnikach αi i przyrównać je do zera:
• W efekcie naleŜy rozwiązać układ N równań (zwane równaniami normalnymi, Wienera-Hopfa, Yule’a-Walkera)
2
11 1
ˆ2 0t N
i i z i zi zi
x x xσ αα − −
= =
∂ = − − = ∂ ∑ ∑
( )1 11 1 1
ˆt N t
i z i z i ii z i
x x x xα− − −= = =
=
∑ ∑ ∑Przy czym:
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 20
• Metoda najmniejszych kwadratów nie uwzględnia entropii
• Z doświadczeń wynika, Ŝe lepiej stosować kilka modeli uprzednio zdefiniowanych i umiejętnie je przełączać(najlepiej jeśli są to modele liniowe)
• Aby zwiększyć efektywność moŜna dzielić sygnał na bloki zbliŜone „wyglądem” do siebie (np. kodując sygnał dźwiękowy następujące po sobie frazy mają podobny charakter)
• MoŜna dynamicznie zmieniać współczynniki predykcji w zaleŜności od kontekstu (dynamiczny DPCM)
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 21
Dynamiczny DPCM
• MoŜliwość zmieniania współczynników DPCM
• MoŜliwość zmieniania poziomów kwantyzacji
• MoŜliwość zmieniania obu parametrów
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 22
• Metoda najszybszego spadku (gradient search method)
gdzie β jest współczynnikiem gradientu• Funkcje gradientu moŜna określić z metody LMS
2 21 1
1, 1, 1 1, 11 1
ˆn nn n n
e eα α β α βα α
− −− −
∂ ∂= − ≈ −∂ ∂
( )2
1 1 1 11
ˆ ˆ ˆ2 2nn n n n n
ex x x e xα
α − − −∂ = − − = −∂
1, 1, 1 1 2 1, 1 1 2ˆ ˆ ˆ2 2n n n n n n ne x e xα α β α β− − − − − −= + ≈ +
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 23
• Odpowiednio dobierając współczynnik β moŜliwe jest poprawienie efektywności metody DPCM
Źródło: dr hab. A. Przelaskowski
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 24
Modele kontekstów obrazów
Źródło: dr hab. A. Przelaskowski
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 25
RóŜne rodzaje skanowania
Źródło: dr hab. A. Przelaskowski
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 26
• RóŜne rodzaje predyktorów (przykłady):– Standard JPEG (bezstratny)– Standard PNG– MED/MAP– z gradientem GAP– CALIC
• MoŜliwość stosowania interpolacji i przeplotu
• JBIG (obrazy cz-b)
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 27
JPEG bezstratny
xa
bc
(a+b)/27
b+(a-c)/26
a+(b-c)/25
a+b-c4
c3
b2
a1
Sposób predykcjiNumer predyktora
http://www.multimedia.edu.pl/invocom/MultimediaPL/mm_6_9.htm (wymagany IE)
Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 28
Więcej informacji:Źródła elektroniczne oraz pozycje literaturowe