Przetwarzanie i transmisja danych multimedialnych...

28
Przemyslaw Sękalski, Przetwarzanie i transmisja danych multimedialnych, wyklad 6, 2006 1 Przetwarzanie i transmisja danych multimedialnych Wyklad 6 Metody predykcyjne Przemyslaw Sękalski [email protected] Politechnika Lódzka Katedra Mikroelektroniki i Technik Informatycznych DMCS Wyklad opracowano na podstawie materialów udostępnionych przez dr hab. A. Przelaskowskiego

Transcript of Przetwarzanie i transmisja danych multimedialnych...

Page 1: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 1

Przetwarzanie i transmisja danych multimedialnych

Wykład 6

Metody predykcyjne

Przemysław Sękalski

[email protected]

Politechnika ŁódzkaKatedra Mikroelektroniki i Technik Informatycznych

DMCS

Wykład opracowano na podstawie materiałów udostępnionych przez dr hab. A. Przelaskowskiego

Page 2: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 2

Plan wykładu

• Idea metod predykcyjnych

• Modulacja delta

• Dynamiczna modulacja delta

• Liniowa predykcja (Differential Pulse Code Modulation)

• Konteksty, skanowanie

• Omówienie współczesnych metod predykcji

Page 3: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 3

Idea metod predykcyjnych

• Do tej pory przedstawione były metody kodowaniaentropijnego i słownikowego � zmiana sposobu reprezentacji informacji

• MoŜliwe jest zwiększenie efektywności poprzez wykorzystanie lokalnych i globalnych zaleŜności (korelacji).

• Modelowanie umoŜliwia przekształcenie ciągu wejściowego do reprezentacji pośredniej bardziej podatnej na kodowanie słownikowe i entropijne

Page 4: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 4

Paradygmat kompresji - przypomnienie

Kodowanie Dekodowanie

ModelowanieModelowanie

Wiadomośćzakodowana

Wiadomośćwyjściowa

Wiadomośćwejściowa

Uaktualnianie modelu

Współczesny paradygmat kompresji

Page 5: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 5

Modulacja delta

• Bazuje na kodowaniu róŜnicy wartości bieŜącej próbki xn oraz odtworzoną wartością poprzedniej próbki xn

• RóŜnica zostaje kwantowana zgodnie z równaniem:

…i przesłana do odbiorcy!• Otrzymana wartość po stronie odbiorcy jest odtwarzana jako:

1ˆn n ne x x −= −

n

n

1 jesli e 0ˆ ( )

1 jesli e 0n ne sign e>

= = − ≤

1ˆ ˆ ˆn n nx x e−= + ∆

Page 6: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 6

Przykład

• Przykładowy ciąg wejściowy:

{3, 7, 10, 17, 22, 30, 40, 50, 49, 44, 48, 50, 49, 48, 45, 40, 38, 38, 43, 44, 48, 47, 48, 47, 48, 45, 40, 30, 20, 12, 8}

• Stała delta równa 5

• ZałoŜenie poprzedni symbol = 3

Page 7: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 7

Modulacja delta

0

10

20

30

40

50

60

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31

5

dane wejściowe

∆ = 5

Page 8: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 8

PrzeciąŜenie zbocza

0

10

20

30

40

50

60

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31

5

dane wejściowe

∆ = 5

PrzeciąŜenie zbocza

Page 9: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 9

-10

0

10

20

30

40

50

60

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31

5

10

dane wejściowe

Granulacja

Granulacja

∆ = 5, ∆ = 10

Page 10: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 10

Problemy

• Zwiększenie delty powoduje zmniejszenie przeciąŜenia zbocza w przypadku zmiany próbek wejściowych

• Zmniejszenie delty powoduje zmniejszenie granulacji w przypadku zbliŜonych lub stałych próbek wejściowych

• Wymagania redukujące przeciąŜenie oraz granulacje sąwzajemnie sprzeczne

• … a moŜe regulować deltę w zaleŜności od poprzednich próbek…

Page 11: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 11

• Bazuje na kodowaniu róŜnicy wartości bieŜącej próbki xn oraz odtworzoną wartością poprzedniej próbki xn

• RóŜnica zostaje kwantowana zgodnie z równaniem:

• Otrzymana wartość po stronie odbiorcy jest odtwarzana jako:

Dynamiczna modulacja delta

1ˆ ˆ( ) ( )n n n ne sign e sign x x −= = −

min n-1 min

min n-1 min

11 12

jesli 0<

jesli 0>

ˆ ˆ w pozostaych przypadkachn

n n ne e− −

∆ ∆ < ∆

∆ = −∆ ∆ > −∆∆ +

1ˆ ˆ ˆn n nx x e−= + ∆

Page 12: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 12

Dynamiczna modulacja delta

-10

0

10

20

30

40

50

60

70

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31

dyn

10

dane wejściowe

Page 13: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 13

• Jak porównać, która modulacja jest lepsza ???

• Kumulatywny błąd predykcji:

• EMD ∆=5 = 211• EMD ∆=10 = 203• EMDD ∆0 = 5 = 234 !! chociaŜ wizualnie lepiej odpowiada

1

ˆn

i ii

E x x=

= −∑

Page 14: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 14

• MoŜliwe jest wprowadzenie innych zaleŜności delty,

• MoŜliwe jest wprowadzenie szerszego kontekstu (uzaleŜnienie od większej liczby poprzedzających próbek), tzw. adaptacja wstecz

• MoŜliwe jest wprowadzenie zaleŜności od następnych próbek (niezbędny jest bufor – kodowanie/dekodowanie opóźnione),tzw. adaptacja w przód

Page 15: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 15

Metoda DPCM

• Metoda róźnicowej modulacji kodowo-impulsowej DPCM (differential pulse code modulation)

• Przewidywana wartość próbki zaleŜy od kombinacji liniowej N poprzedników:

gdzie αi to współczynniki predykcji

• Błąd predykcji oznaczany jest jako:

gdzie Q() jest funkcją kwantyzująca(np. zaokrąglającą wynik do liczby całkowitej)

1

ˆ ˆN

n i n ii

x xα −=

=∑

ˆ ˆ( )n n ne Q x x= −

Page 16: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 16

Modelowanie - Nadawanie

ˆneKodowanieKwantyzator

Wiadomośćzakodowana

Wiadomośćwejściowa +

-

en

z-1

z-1

z-1Z

aleŜ

ne o

d N

rzę

du

pred

ykto

raD

PC

M

α1

α2

αN

Predyktor liniowy

z-1

ke

Page 17: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 17

Odbieranie

Dekodowanie

Wiadomośćzakodowana

Wiadomośćwyjściowa+

ˆnx+

z-1

z-1

Zal

eŜne

od

N r

zędu

pr

edyk

tora

DP

CM

α1

α2

αN

z-1

z-1

Predyktor liniowy

ke

Page 18: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 18

Problem z DPCM

• Jak wyznaczyć optymalne wartości α1…αN ???

• Na przykład korzystając z metody najmniejszych kwadratów

naleŜy minimalizować σ

( )2

22 2

1 1 1 1

ˆ ˆt t t N

n n n n z i zi i i z

e x x x xσ α −= = = =

= = − = −

∑ ∑ ∑ ∑

Page 19: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 19

• Aby to zrobić naleŜy wyznaczyć pochodne cząstkowe po wszystkich współczynnikach αi i przyrównać je do zera:

• W efekcie naleŜy rozwiązać układ N równań (zwane równaniami normalnymi, Wienera-Hopfa, Yule’a-Walkera)

2

11 1

ˆ2 0t N

i i z i zi zi

x x xσ αα − −

= =

∂ = − − = ∂ ∑ ∑

( )1 11 1 1

ˆt N t

i z i z i ii z i

x x x xα− − −= = =

=

∑ ∑ ∑Przy czym:

Page 20: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 20

• Metoda najmniejszych kwadratów nie uwzględnia entropii

• Z doświadczeń wynika, Ŝe lepiej stosować kilka modeli uprzednio zdefiniowanych i umiejętnie je przełączać(najlepiej jeśli są to modele liniowe)

• Aby zwiększyć efektywność moŜna dzielić sygnał na bloki zbliŜone „wyglądem” do siebie (np. kodując sygnał dźwiękowy następujące po sobie frazy mają podobny charakter)

• MoŜna dynamicznie zmieniać współczynniki predykcji w zaleŜności od kontekstu (dynamiczny DPCM)

Page 21: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 21

Dynamiczny DPCM

• MoŜliwość zmieniania współczynników DPCM

• MoŜliwość zmieniania poziomów kwantyzacji

• MoŜliwość zmieniania obu parametrów

Page 22: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 22

• Metoda najszybszego spadku (gradient search method)

gdzie β jest współczynnikiem gradientu• Funkcje gradientu moŜna określić z metody LMS

2 21 1

1, 1, 1 1, 11 1

ˆn nn n n

e eα α β α βα α

− −− −

∂ ∂= − ≈ −∂ ∂

( )2

1 1 1 11

ˆ ˆ ˆ2 2nn n n n n

ex x x e xα

α − − −∂ = − − = −∂

1, 1, 1 1 2 1, 1 1 2ˆ ˆ ˆ2 2n n n n n n ne x e xα α β α β− − − − − −= + ≈ +

Page 23: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 23

• Odpowiednio dobierając współczynnik β moŜliwe jest poprawienie efektywności metody DPCM

Źródło: dr hab. A. Przelaskowski

Page 24: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 24

Modele kontekstów obrazów

Źródło: dr hab. A. Przelaskowski

Page 25: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 25

RóŜne rodzaje skanowania

Źródło: dr hab. A. Przelaskowski

Page 26: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 26

• RóŜne rodzaje predyktorów (przykłady):– Standard JPEG (bezstratny)– Standard PNG– MED/MAP– z gradientem GAP– CALIC

• MoŜliwość stosowania interpolacji i przeplotu

• JBIG (obrazy cz-b)

Page 27: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 27

JPEG bezstratny

xa

bc

(a+b)/27

b+(a-c)/26

a+(b-c)/25

a+b-c4

c3

b2

a1

Sposób predykcjiNumer predyktora

http://www.multimedia.edu.pl/invocom/MultimediaPL/mm_6_9.htm (wymagany IE)

Page 28: Przetwarzanie i transmisja danych multimedialnych …lux.dmcs.p.lodz.pl/ptda/wyklady/wyklad_6.pdfPrzemysław S ękalski , Przetwarzanie i transmisja danych multimedialnych , wykład

Przemysław Sękalski, Przetwarzanie i transmisja danych multimedialnych , wykład 6 , 2006 28

Więcej informacji:Źródła elektroniczne oraz pozycje literaturowe