WSTĘP DO GRAFIKI

90
WSTĘP DO GRAFIKI UCZELNIA WARSZAWSKA

description

WSTĘP DO GRAFIKI. UCZELNIA WARSZAWSKA. Obraz w pamięci komputera. 00000000 01111110 01000010 01000010 01000010 01000010 01111110 01000010 01000010 01000010 01000010 0 0 0000 0 0 00000000 00000000. Cała dyskietka. .bmp. - PowerPoint PPT Presentation

Transcript of WSTĘP DO GRAFIKI

Page 1: WSTĘP DO GRAFIKI

WSTĘP DO GRAFIKI

UCZELNIA WARSZAWSKA

Page 2: WSTĘP DO GRAFIKI

Obraz w pamięci komputera

Cała dyskietka

0000000001111110010000100100001001000010010000100111111001000010010000100100001001000010000000000000000000000000

Page 3: WSTĘP DO GRAFIKI

.bmp

• Cyfrowy zapis obrazu w postaci odzwierciedlającej każdy piksel, bez żadnych uproszczeń ani dodatków, nazywany jest zapisem bitmapowym. Jest on najdokładniejszy

• Pliki tego typu zapisywane są w postaci:

nazwa.bmp.

Page 4: WSTĘP DO GRAFIKI
Page 5: WSTĘP DO GRAFIKI
Page 6: WSTĘP DO GRAFIKI

500 x 328 125 x 82

62 x 41 31 x 20

Ilustracja obrazu w czterech różnych wielkościach rozdzielczości

Page 7: WSTĘP DO GRAFIKI

Zapis bitmapowy vs wektorowy

• bmp. format „wprost” - wyróżnionym fragmentom obrazu odpowiadają cyfrowe zapisy pikseli (duże rozmiary)

• Obraz wektorowy nie jest zbudowany z pikseli, tworzą go obiekty opisane matematycznie, np. równaniem prostej, łuku czy okręgu (b. małe rozmiary)

Page 8: WSTĘP DO GRAFIKI

STANDARDY PLIKÓW GRAFICZNYCH

BMP - format BMP jest standardowym formatem bitmap w środowisku Windows i w systemie DOS. Zachowując pliki w tym formacie, można wybrać odmianę Microsoft Windows lub OS/2 oraz głębię pikseli - od 1 do 24 bitów. W przypadku obrazków 4- i 8-bitowych można ponadto skorzystać z kompresji Run-Length-Encoding (RLE). Kompresja ta jest bezstratna.

Page 9: WSTĘP DO GRAFIKI

EPS (Encapsulated PostScript) - są rozpoznawane przez większość programów ilustracyjnych; w większości przypadków jest to format preferowany aplikacji.FILMSTRIP - jest używany w animacjach i plikach wideo utworzonych przez program Adobe Premiere.

Page 10: WSTĘP DO GRAFIKI

MACPAINT - jest powszechnie używany do przesyłania obrazków bitmapowych do aplikacji Macintosha. Aby obrazek bitmapowy mógł być zachowany w tym formacie, nie może być większy niż 576 x 720 pikseli.

IFF (Amiga Interchange File Format) - używa się do pracy z Video Toasterem oraz przenoszenia obrazków do komputera Commodore Amiga i wczytywania pochodzącej z niego grafiki. Ponadto format ten jest obsługiwany przez programy malarskie do komputerów PC, w tym DeluxePaint firmy Electronics Arts; IFF jest najlepszym formatem eksportu do tego programu.

Page 11: WSTĘP DO GRAFIKI

PCX - opracowany przez firmę Z-Soft dla programu PC Paintbrush jest powszechnie używany w komputerach PC. Większość programów do PC obsługuje wersję 5 tego formatu. Pliki w wersji 3 nie obsługują specjalnych palet kolorów; z tego względu przy otwieraniu plików PCX wersji 3 paleta zostaje zignorowana, a używa się standardowej palety VGA

Page 12: WSTĘP DO GRAFIKI

PDF- jest używany przez program Adobe Acrobat,

PICT - szeroko używany przez aplikacje graficzne i do

składu Macintosha jako format pośredni do przesyłania plików między aplikacjami. Format PICT wykazuje szczególną efektywność przy kompresowaniu obrazków zawierających duże obszary jednolitego koloru. Kompresja ta może okazać się wyjątkowo efektywna w przypadku obrazów zawierających duże obszary czerni i bieli. Zachowując obrazek RGB w formacie PICT, można zadeklarować rozdzielczość 16 bitów na piksel albo 32 bitów na piksel. Obrazki w skali szarości mogą mieć 2, 4 lub 8 bitów na piksel.

Page 13: WSTĘP DO GRAFIKI

PIXAR - został opracowany specjalnie do wymieniania plików z komputerami PIXAR. Stacje robocze PIXAR są używane w najbardziej zaawansowanych zastosowaniach graficznych, takich jak używane w obrazowaniu trójwymiarowym i animacjach.

PIXELPAINT - pozwala otwierać pliki w aplikacjach graficznych PixelPaint oraz PixelPaint Professional na Macintoshu. Format PixelPaint jest dostępny jedynie dla obrazków w kolorze indeksowanym i w skali szarości.

Page 14: WSTĘP DO GRAFIKI

SCITEX CONTINOUS TONE (CT) jest dostępny dla obrazków w trybie RGB, CMYK oraz w skali szarości. Komputerów Scitex używa się do zaawansowanego przetwarzania grafiki. Obrazki

w formacie Scitex CT są plikami CMYK, często o ogromnych rozmiarach. Takie pliki są generowane przez skanery firmy Scitex. Pliki zachowane w formacie Scitex CT przez Adobe Photoshopa mogą być użyte do naświetlania klisz za pomocą rasteryzatora Scitex, który tworzy rozbarwienia za pomocą systemu rastrów opatentowanego przez firmę Scitex. System ten daje bardzo niewielkie zniekształcenia typu mory i jest często wymagany w druku profesjonalnym, np. przy drukowaniu kolorowych reklam w wielkonakładowych czasopismach.

Page 15: WSTĘP DO GRAFIKI

TGA (Targa) został opracowany z myślą o

systemach z kartą TrueVision, jest on powszechnie obsługiwany przez aplikacje graficzne systemu MS-DOS. Zachowując obrazek RGB w tym formacie, można wybrać głębię koloru.

PNG (Portable Network Graphics - "ping") - 24-bitowy format opracowany jako alternatywa dla formatu GIF; podobnie jak ten ostatni, jest on używany do wyświetlania obrazków w sieci World Wide Web i w serwisach interaktywnych. Format PNG zachowuje całą informację o kolorze, w celu zmniejszenia rozmiaru plików posługuje się algorytmem kompresji bezstratnej. Oferuje większą możliwość kompresji od GIF'a. Zachowując plik w formacie PNG, można wybrać opcję sukcesywnego pojawiania się obrazków sprowadzanych z sieci (kolejne przybliżenia wnoszą coraz więcej szczegółów).

Page 16: WSTĘP DO GRAFIKI

GIF (Graphics Interchange Format) - definiuje protokół, który umożliwia niezależną sprzętowo, transmisję grafiki online. Obrazy są kompresowane metodą Lempela-Ziva. GIF definiuje strumienie danych, które składają się bloków i pod-bloków reprezentujących obraz wraz z niezbędnymi informacjami sterującymi pozwalającymi na dostarczenie obrazu na docelowe urządzenie wyjściowe. Nie ma on jednak możliwości wykrywania błędów.

Page 17: WSTĘP DO GRAFIKI

TIFF (Tagged Image File Format) - jest używany do wymieniania plików między aplikacjami i platformami komputerowymi. Format TIFF obsługuje kompresję LZW - algorytm kompresji bezstratnej, nie powodującej utraty szczegółów obrazka. TIFF oparty jest na koncepcji tagów. Tagi dostarczają informacji na temat obrazu, jeden z nich jest wskaźnikiem do całego obrazka. Są to informacje dotyczące typu kompresji, rozmiaru, kolejności bitów, oraz autora, daty i oprogramowania źródłowego. TIFF 5.0 definiuje 45 tagów. TIFF jest standardem szeroko używanym jednak zawiera wiele różnych wersji i tagów, co często stanowi problem.

PHOTOCD - format zdefiniowany przez Kodaka dla cyfrowego przechowywania obrazów o wysokiej jakości.

Page 18: WSTĘP DO GRAFIKI

JPEG (Joint Photographic Expert Group) - umożliwia zarówno stratną jak i bezstratną kompresję danych, jednak ta pierwsza daje dużo lepsze rezultaty. Stopień straty danych jest kontrolowany poprzez ustawienie parametrów zdefiniowanych w specyfikacji JPEG. Algorytm kompresji zastosowany w formacie JPEG to DCT (Discrete Cosinus Transformation). Standard JPEG został dokładnie opisany poniżej.

PLIKI BEZ FORMATU - można przenosić między aplikacjami i platformami komputerowymi. Plik bez formatu składa się ze strumienia bajtów opisujących informacje o kolorach. Każdy piksel jest opisany binarnie; 0 oznacza czerń, a 255 - biel.

Page 19: WSTĘP DO GRAFIKI
Page 20: WSTĘP DO GRAFIKI

DCT (Discrete Cosinus Transformation)

algorytm wykorzystujący kodowanie metodą JPEG i MPEG. Obraz dzielony jest na bloki o wielkości 8x8 pikseli. Każdy blok jest analizowany przez algorytm ze względu na zmianę kolorów. Jeśli początkowy blok składa się z jednobarwnej powierzchni, to można go opisać za pomocą jednej wartości. Jeśli barwa zmienia się tylko trochę w obrębie bloku, potrzeba już więcej wartości w celu opisania tego bloku itd. Ponieważ wiele bloków jednego obrazu cechują jedynie niewielkie zmiany koloru, ilość niezbędnych informacji będzie zredukowana.

Page 21: WSTĘP DO GRAFIKI

RLE (Run Length Encoding)

nadaje się jedynie do obrazów o niskiej intensywności zabarwienia. Dla jednokolorowych powierzchni nie będzie zapamiętany każdy piksel, lecz tylko wartość piksela i liczba następujących po sobie pikseli tego samego koloru, czyli jeśli np. czerwony kolor występuje 20 razy pod rząd to kodowany jest kolor czerwony raz razem z liczbą 20.

Page 22: WSTĘP DO GRAFIKI

HUFFMANAobraz jest analizowany ze względu na

częstość występowania poszczególnych kolorów.

Kolor występujący najczęściej otrzymuje najkrótszy kod, drugi otrzymuje drugi najkrótszy itd. Dzięki temu zmniejsza się ilość miejsca niezbędnego do zapamiętania.

Page 23: WSTĘP DO GRAFIKI

DELTA - do kodowania filmów

Dla wielu sekwencji filmowych zmienia się jedynie mały wycinek obrazu. Jeśli np. na filmie obserwujemy jadącego rowerzystę, to tło pozostaje niezmienione.

W metodzie kodowania Delta przesyła się jedynie różnice pomiędzy obrazem poprzednim a bieżącym. W tym przypadku jest tylko ten wycinek obrazu, który zmienił się z powodu jadącego rowerzysty.

Page 24: WSTĘP DO GRAFIKI

FRAKTALNA

Kompresja fraktalna nadaje się zarówno dla obrazów nieruchomych jak i obrazów ruchomych.

fraktal to twór podobny do samego siebie, to znaczy taki, że po jego dowolnym powiększeniu otrzymuje się zawsze podobny obraz, np. liście paproci albo płatka śniegu.

Page 25: WSTĘP DO GRAFIKI

Ideą fraktalnej kompresji obrazów jest znalezienie w danym obrazie fraktalnego wzorca i wyrażenie go za pomocą formuły matematycznej. W tym celu niezbędna jest gruntowna analiza obrazu, co sprawia że ten sposób kompresji jest wolniejszy niż kodowanie inną metodą. Jednak obrazy kodowane metodą fraktalną nawet przy wysokim współczynniku zagęszczenia rzędu 100, są bardzo dobre. Ze względu na jakość obrazu metoda ta znacznie przewyższa technologię JPEG.

Page 26: WSTĘP DO GRAFIKI

CCITT FAX - mechanizmy kompresujące do transmisji obrazów czarno-białych poprzez linie telefoniczne przy użyciu fax. Znane są następujące standardy: Grupy 3 i Grupy 4. CCITT posługuje się algorytmem kompresji Huffmana. Standard Grupy 4 jest bardziej wydajny i częściej używany szczególnie podczas wymiany aplikacji, natomiast standard Grupy 3 umożliwia wykrywanie błędów i jest używany przez większość maszyn typu fax.

Page 27: WSTĘP DO GRAFIKI

LEMPELA-ZIVA - kompresja bez straty danych. Algorytm szuka takich samych sekwencji bajtów w oryginalnym pliku. Przykładowo w zdaniu: "pije Kuba do Jakuba" jest nią sekwencja liter "uba". Drugie pojawienie się tego ciągu liter algorytm zakodowałby jako odnośnik do pierwszego wystąpienia.QUADTREES - obraz jest dzielony na kilka różnych obszarów, z których każdy reprezentuje pojedynczy kolor (lub odcień szarości). Każdy z tych obszarów dzielony jest na następne dopóki podział jest kompletny (reprezentuje pojedynczy kolor lub osiągnięty został predefiniowany poziom podziału).

Page 28: WSTĘP DO GRAFIKI

.jpg

• Dobry do publikacji zdjęć WWW

• Głębia barw do 24 bitów

• Małe rozmiary plików

Page 29: WSTĘP DO GRAFIKI

.gif• Bardzo małe rozmiary

plików

• Obsługują wszystkie przeglądarki

• Przezroczystość, animacje

• Głębia barw – tylko 8 bitów

Page 30: WSTĘP DO GRAFIKI

MPEG 1,2,4MPEG to skrót od Motion Picture

Experts Group. Jest to organizacja (komisja) mająca na celu opracowywanie otwartych standardów dla cyfrowego video.

Powołana została w 1988 jako oddział Międzynarodowej Komisji Normalizacyjnej ISO

(International Standards Organization). Od nazwy grupy pochodzą kolejne opracowane

przez nią standardy czyli MPEG-1,2 i 4. Definiują one metody kompresji, formaty

plików i inne parametry cyfrowego video. W trakcie opracowywania są standardy MPEG-7,

MPEG-21.

Page 31: WSTĘP DO GRAFIKI

MPEG-1

• Daje dosyć dobrą jakość przy transmisji 1 Mbps i rozmiarze kadru około 320 x 240 ale używany jest również przy innych prędkościach przesyłu (bitrate) chociaż inne kodeki dają znacznie lepsze parametry.

• Zapewnia tylko standardową z systemów video PAL i NTSC liczbę klatek na sekundę tzn.; 25 i 29,97 fps.

Page 32: WSTĘP DO GRAFIKI

MPEG-2

Opracowany w 1994 roku, najważniejszy ze standardów MPEG. Zrewolucjonizował cały świat cyfrowego video. Zapewnia międzyliniowość i znacznie większe rozdzielczości niż MPEG-1. Został opracowany jako format profesjonalny i stanowi kombinację dobrej kompresji i wysokiej jakości. Stosowany przede wszystkim przy transmisji obrazu, a obecnie również w rejestracji i edycji zastępując coraz częściej Motion-JPEG.

Page 33: WSTĘP DO GRAFIKI
Page 34: WSTĘP DO GRAFIKI

Format RAW

• dane zebrane z matrycy światłoczułej i zapisane bez żadnej obróbki.

• format RAW - "cyfrowy negatyw". • W komputerze, za pomocą specjalnego

programu dołączanego zawsze do aparatu, można te dane poddać obróbce, decydując, jaki ustawić balans bieli, tryb wyostrzania, nasycenie kolorów czy kontrast. Jeśli z jakichś powodów nie podoba nam się zdjęcie, można je poprawić i spróbować innych ustawień.

Page 35: WSTĘP DO GRAFIKI

Cyfrowe foto

• Typowa rozdzielczość: 2,048 (H) pikseli x 1,536 (V) = ponad 3.1 megapikseli;

• 2,560 x 1,920 = 4.9 megapikseli. • Przy druku A4 nie widać różnicy między 2, a 5 M

pikseli• Wyliczanki te nie dotyczą filmów 35-

milimetrowych gdzie rozdzielczość wynosi 20 - 30 megapikseli.

• Mamiya ZD – 22 Mpix• Gadżet: dane z GPS (gdzie zrobiono zdjęcie)

Page 36: WSTĘP DO GRAFIKI

Foto o największej rozdzielczości

• Matryca 111 Mpikseli

• 10 560 x 10 560

• Dla obserwatorium astronomicznego

Page 37: WSTĘP DO GRAFIKI

edytory graficzne

• specjalizowane programy służące do tworzenia i edycji map bitowych,

• najpopularniejsze: Photoshop, CorelDraw Suite, Corel PhotoPaint, Inkscape (wektory) oraz GIMP i PIXIA.

• Umożliwiają one edycję obrazów będących w postaci bitmapowej, podobnie jak zmiany nanoszone w tekście za pomocą edytora tekstowego.

Page 38: WSTĘP DO GRAFIKI

Inne programy do obróbki grafiki

• IrfanView (przeglądarka grafiki i zdjęć)

• RawShooter Essentials 2006• GIMP 2.4.4• Picasa 2.7 – darmowy• ThumbsPlus 7 – komercyjny• Corel Paint Shop Pro X2 -

komercyjny

Page 39: WSTĘP DO GRAFIKI

Zamiana na .pdf

• Create Adobe PDF Online, • PrimoPDF, • PDFCreator • Qprinter. • OpenOffice ma możliwość bezpośredniego

eksportu plików do formatu PDF• Microsoft udostępnia "wtyczkę" do eksportu do tego

formatu w najnowszym pakiecie Microsoft Office oraz konwerter – NOVAPDF - do każdej aplikacji generującej dokument pod Windows’ami

Page 40: WSTĘP DO GRAFIKI

edytory graficzne• specjalizowane programy służące do tworzenia i

edycji map bitowych, nazywanych także grafiką rastrową: Photoshop, CorelDraw Suite, Corel PhotoPaint oraz GIMP.

• Do obróbki grafiki wektorowej wykorzystuje się m.in: CorelDraw, PageMaker, którego obsługa (interfejs) jest zbliżona do programów desktopowych (DTP) i Adobe Illustrator będący jednym z najczęściej wykorzystywanych narzędzi do edycji obrazów w DTP.

• Online: www.splashup.com

Page 41: WSTĘP DO GRAFIKI

Typowe funkcje edytora graficznego

• Poprawianie kontrastu• Kompleksowy montaż• Sortowanie zbioru• Inne:

– Korekcja zdjęcia w jednym kroku– Korekta odcieni tonalnych skóry– Szczotka do zębów– Druk miniatur

Page 42: WSTĘP DO GRAFIKI

Microsoft Photo Story 3 for Windows XP

• Tworzenie multimedialnej (zdjęcia + dźwięk), w formie wideo, prezentacji do 300 zdjęć.

• Importuje foto w formatach: .bmp, .dib, .eps, .gif, .jhif, .jpe, .jpeg, .jpg, .pcd, .pcx, .png, .psd, .rle, .tga, and .tif

• Dostępne narzędzia do edycji zdjęć i całej prezentacji.

Page 43: WSTĘP DO GRAFIKI

DTP (ang. Desktop Publishing)

• zajmuje się profesjonalnym, kompletnym przygotowaniem materiałów do druku (tak zwanym „składem”).

• Programy DTP umożliwiają import kilkudziesięciu formatów dokumentów (eksport nie jest ich domeną).

• np. najstarszy na polskim rynku – Ventura Publisher, później Corel Ventura, Adobe PageMaker (wcześniej Aldus Adobe) i nieco nowszy, bardzo popularny - QuarkXpress, Scribus (open source)

Page 44: WSTĘP DO GRAFIKI

• Programy DTP umożliwiają import kilkudziesięciu formatów dokumentów (eksport nie jest ich domeną).

• Za pomocą DTP dokonuje się ostatecznego przygotowania tekstu – materiału poligraficznego gotowego do druku, który został wcześniej napisany niemal w dowolnym edytorze. Na przykład książkę napisaną w Wordzie, można przenieść (wyeksportować) do DTP, by za pomocą tego narzędzia zakończyć skład materiału.

Page 45: WSTĘP DO GRAFIKI

Darmowe do obróbki dźwięku

• BeSweet• Exact Audio Copy• LAME• Foobar2000• MPEG Audio

Collection• AccurateRip• FLAC

• Audacity

• WavePad

• Jamglue

• Splice

Page 46: WSTĘP DO GRAFIKI

Analiza/rozpoznawanie i synteza dźwięków mowy ludzkiej

• Możliwość ta znajduje szerokie zastosowanie w systemach nazywanych IVR (Interactive Voice Response)

• Systemy Call Center stosują technologię TTS (Text-To-Speech - zamiana tekstu na mowę) i ASR (Automatic Speech Recognition - rozpoznawanie mowy).

• Synteza dźwięków w tworzeniu muzyki.

Page 47: WSTĘP DO GRAFIKI

Rozpoznawanie głosu w komórkach

• Aplikacja Find (AT&T, Sprint) umożliwia zadanie np. pytania o piosenkę Mississippi John Hurt, lokalizację cukierni i informację o produkcie w Sieci.

• TellMe Networks – nabytek Mikrosofta, m.in. Darmowy dostęp do katalogów firm.

• Rynek wart $1.6 mld w 2007, roczny wzrost o 14.5%

• Zastosowania, np. G.P.S. lususowe samochody Cadillac i Lexus,

Page 48: WSTĘP DO GRAFIKI

Synteza dźwięków mowy

• Synteza pełna

• Synteza (unit selection) z rzeczywistych fragmentów mowy, np. Ivona. Serwis say – expressivo. www.ivo.pl

Page 49: WSTĘP DO GRAFIKI

samplery• Podstawowy materiał dźwiękowy samplerów

tworzony jest z próbek (samples) mogących być utrwalonymi brzmieniami naturalnych instrumentów (w tym głosu ludzkiego), innych syntezatorów, lub też całkowicie komputerowo wyliczanych fal.

• Dla odróżnienia, syntezatory działające na podobnej zasadzie – jednakże bez możliwości edycji próbek, nazywane są romplerami (ROM – Read Only Memory). Są to urządzenia w pełni cyfrowe (starsze instrumenty tego typu miały też analogowe komponenty – jak np. filtry).

Page 50: WSTĘP DO GRAFIKI
Page 51: WSTĘP DO GRAFIKI

Kamery cyfrowe

• CCD (Charge Coupled Device), dane odczytywane całymi wierszami lub kolumnami. Sensory są wolniejsze.

• CMOS Complementary Metal Oxide Silicon) – bezpośredni dostęp do każdego sensora.

Page 52: WSTĘP DO GRAFIKI

Standardy TV• PAL (576 linii x 720 linii – 0,4 M pikseli!)

i NTSC (720 x 486) ponad 40 lat!

• HDTV: – 1920x1080 (tryb 1080i - progresywny)– 1280x720 (tryb 720p – z przeplotem)– HDCP (High-bandwidth Digital Content

Protection)

Page 53: WSTĘP DO GRAFIKI

IPTV

• Sygnał przesyłany w postaci plików MPEG-2 lub MPEG-4

• Obecnie brak HDTV w ofertach IPTV (potrzeba minimum 10 – 11 Mb/s)

Page 54: WSTĘP DO GRAFIKI

Podstawowe formaty video

• AVI – Audio Video Interleave, MPEG-4

• MPEG-1 – przestarzały 352x288

• MPEG-2 – zmienny strumień

• MPEG-4 – skuteczny, do kodowania AVI

• DivX – komercyjna pochodna MPEG-4

• SVCD – zmienny strumień

• VCD – oparty na MPEG-1, stały strumień

Page 55: WSTĘP DO GRAFIKI

Formaty filmów w postaci cyfrowej

• MPEG4 - pliki AVI, pliki poręczne w przechowywaniu i archiwizacji, odtwarzanie tylko przy pomocy komputera

• MPEG2 i MPEG1 – płyta (S)VCD, możliwość nagrywania na CD-R(W). Możliwość odtwarzania stacjonarnymi odtwarzaczami DVD

Page 56: WSTĘP DO GRAFIKI

Video CD (VCD)

• Stały strumień wizji: 1150Kb/s i fonii: 224Kb/s

• Wizja w standardzie MPEG1 z rozdzielczością 352 x 288 pikseli

• Tylko jedna ścieżka dźwiękowa

Page 57: WSTĘP DO GRAFIKI

Super Video CD

• Kompresja MPEG 2• Zmienny strumień wizji (od 1150 do

2600 Kb/s. Bardzo dobra jakość obrazu – porównywalna z SVHS

• Dwie ścieżki dźwiękowe stereo lub cztery mono, kodowanie o 32 do 384Kb/s każda

Page 58: WSTĘP DO GRAFIKI

Wizja: VCD (MPEG-1), SVCD (MPEG-2)

Parametr VCD SVCD

Rozdzielczość (PAL) 352 x 258 480 x 576

Rozdzielczość (NTSC) 352 x 240 480 x 480

Kompresja wizji MPEG – 1 MPEG - 2

Strumień wizji [Kb/s] Stały: 1150 Zmienny: max: 2600

Jakość obrazu Porównywalna z VHS

Porównywalna z SVHS

Typ napisów Stałe Stałe lub wył.

Ścieżki z napisami Maks. 1 Maks. 4

Page 59: WSTĘP DO GRAFIKI

MPEG-2, MPEG-4

Rozdzielczość 352x258 do 1920x1152 (HDDV)

Do 1920x1088 (DivX 5.0)

Strumień danych 500 kb/s do 10 Mb/s do 80 Mb/s

20 Kb/s do 4 Mb/s do >1 Gb/s

Formaty filmów DVD DivX 5.1.1 Home Theater Profil

Rozdzielczość obrazu

720x576 (PAL) 720x576 (PAL)

Page 60: WSTĘP DO GRAFIKI

Fonia

Parametr VCD SVCD

Kompresja MPEG-1 layer 2 MPEG-1 layer 2

Strumień [Kb/s] Stały: 224 Zmienny:32-384

Częst. Próbk. 44,1 KHz 44 KHz

Kanały 1 stereo/2 mono 2stereo/4/mono

Dźwięk przestrz. - MPEG2(5+1)ext.

Page 61: WSTĘP DO GRAFIKI

Odtwarzanie

Parametr VCD SVCD

Nośnik 750 MB 80 min. Filmu 35-60 minut

Obciążenie procesora Małe Duże

Kompatybilność ze stacjonarnymi odtw. DVD

Duża średnia

Page 62: WSTĘP DO GRAFIKI

Video - codecs

• Compression/decompression algoritms

• MPEG-2 (Moving Picture Experts Group) w 1994 roku – standard dla cyfrowej TV,wymagania: 2 – 80 Mb/s

• MPEG-4, wymagania – 40 Kb/s

Page 63: WSTĘP DO GRAFIKI

Podstawowe formaty video

• AVI – Audio Video Interleave, MPEG-4

• MPEG-1 – format, protoplasta MPEG-2

• MPEG-2 – zmienny strumień

• MPEG-4 – skuteczny, do kodowania AVI

• SVCD – zmienny strumień

• VCD – oparty na MPEG-1, stały strumień

Page 64: WSTĘP DO GRAFIKI

Niektóre terminy kompresji video

• Bitrate – wielkość strumienia danych w Kb/s

• VBR/CBR – zmienny (variable) lub stały (constant) bitrate

• I-frames – ramki bazowe/kluczowe (jedna na kilkaset) pozostałe przekazują tylko zmiany

Page 65: WSTĘP DO GRAFIKI

Test kodeków

DivX 5.2.1.

DivX 6.0.2

XviD 1.1.0

3ivxD4 4.5.1

X.264 Windows Media Video9

% kompresji

90 91 93 89 92 91

jakość 3,5 3,5 4 3 2 2,5

Czas kompresji

12 15 20 12 32 53

Page 66: WSTĘP DO GRAFIKI

Darmowe do obróbki video

• http://www.youtube.com - podstawowa obróbka i łączenie wideo, zdjęć i muzyki

• Magix Films 40 on DVD 7 – rejestrowanie i nagrywanie na DVD przekazów wideo ze stron WWW

Page 67: WSTĘP DO GRAFIKI

Aplikacje DivX/XviD i DVD

• Gordian Knot• AutoGK• DVD Decrypter• Gspot• ffdshow

• DVD Decrypter• DVD Shrink• DVD ReBuolder• QuEnc• Cinema Craft

Encoder• TMGEnc

Page 68: WSTĘP DO GRAFIKI

Cyfrowe kina

• Standard Microsoft Windows Media 9

• Rozdzielczość: 4096x2160

• Zabezpieczenia (Digital Cinema Initiatives): każdy 5 minutowy fragment filmu musi zawierać 35-bitowy znak wodny (data, czas i miejsce wyświetlania filmu)

Page 69: WSTĘP DO GRAFIKI

Potęga komputerów

1997 roku mistrz Kasparow w sześciu partiach przegrał mecz szachowy z komputerem IBMa – Deep Blue. Warto zaznaczyć, iż

maszyna ta była w stanie przeanalizować 50 miliardów ruchów w czasie zaledwie trzech

minut. Ekspert nie jest w stanie, jak komputer, w tak krótkim czasie zwrócić

uwagę na miliony, trudnych do wyróżnienia/zauważenia, elementów dzieła

malarskiego.

Page 70: WSTĘP DO GRAFIKI

Autonomiczny kierowca komputerowy

• Czujniki ze wszystkich stron pojazdu, sterowanie wszystkimi funkcjami auta

• Zawody – DARPA

• Dep. Obr. USA, zakłada, że do 2015 roku co 3 pojazd wojskowy będzie jeździł bez załogi

Page 71: WSTĘP DO GRAFIKI

Poker

• Zawody w pokera: człowiek - maszyna (“First Man-Machine Poker Championship”, nagroda $50,000, gracze: Phil Laak i Ali Eslami)

• Program AI z Uniwesytetu Alberta - Polaris.• Komputer nieznacznie przegrał

Page 72: WSTĘP DO GRAFIKI

Identyfikacja/Ocena

• identyfikacja autorów tekstów, obrazów i muzyki. Czy komputer (a w zasadzie zainstalowany w nim stosowny program) potrafi wykonać te zadania?

• Jednym z frapujących zadań była, jest i zapewne pozostanie, kwestia identyfikacji tekstów pisanych przez ludzi tworzących historię polityki i kultury świata.

Page 73: WSTĘP DO GRAFIKI

Identyfikacja tekstów

• Pierwsze próby formalnej (ilościowej) identyfikacji autora tekstu polegały na obliczaniu częstotliwości występowania pojedynczych liter, par liter (aa, ab, ac, ad itp.), trójek liter (aaa, aab itp.) itd. Metoda ta okazała się najlepsza z bardziej wyszukanych (n. gramatyka, słownictwo).

• Zliczanie praktycznie wszystkich stosowanych przez autora kombinacji znaków. W ten sposób powstaje identyfikator porównywany do unikalnych linii papilarnych twórcy – linii papilarnych stylu pisarskiego.

Page 74: WSTĘP DO GRAFIKI

Przykłady

• Automatyczną identyfikację wykorzystano na przykład z powodzeniem do porównania dzieł dwóch dziewiętnastowiecznych pisarzy – Charles’a Dickens’a i Lewis’a Carroll’a.

• Identyfikując dzieła tych autorów – komputer „nie pomylił się” nigdy!

• Miary stylu Dicensa wynosiły od 0,0057 do 0,0217, a Carol’a 0.9998 – 0.09997 – przeciętna różnica ilościowej miary stylu tych dwóch mistrzów pióra jest ponad stukrotna.

Page 75: WSTĘP DO GRAFIKI

Identyfikacja - nauka

• Poza identyfikacją omawiane narzędzie pozwala na uczenia się wzorcowych stylów pisania. Wskazuje ono na rosnące, podczas nauki, lub malejące różnice w stylu pisania.

Page 76: WSTĘP DO GRAFIKI

Przykłady programów

OCP (Oxford Concordance Program) wykorzytujący cztery formy identyfikatorów: częstotliwość występowania słów, porównanie tej liczby do przeciętnego występowania słów w języku, tak zwanej miary kontekstów i stosowanego słownictwa. Inny tego typu program to WordCruncher, który bardziej akcentuje kontekst stosowanych słów, tzw. KWIC (keyword-in-context).

Page 77: WSTĘP DO GRAFIKI

DiscAn dedykowany jest do określania ilościowych miar podobieństw i różnic pomiędzy dwoma dowolnymi tekstami.

LitStats, który oblicza częstotliwość występowania słów, długość słów, częstotliwość pierwszych liter, długość zdań i frekwencje.

Page 78: WSTĘP DO GRAFIKI

Ocena tekstuWśród wielu parametrów, które

potencjalnie stanowią o czytelności tekstu, wyróżniono cztery najistotniejsze. Spojono je funkcją, której wartość odzwierciedla jakość formy tekstu.

można sformułować funkcję, której wartość stanowi ilościową ocenę tekstu – „wartość” jego czytelności. Innymi słowy komputer może automatycznie oceniać „jakość” tekstu.

Page 79: WSTĘP DO GRAFIKI

Parametry te są miarami długości słów, zdań i stosowania, w ocenianym tekście, słów znajdujących się wśród tysiąca najbardziej powszechnych w języku polskim.

średnia ocen ludzi i komputera była identyczna do drugiego miejsca po przecinku (w tradycyjnej skali ocen od 2 do 5).

Page 80: WSTĘP DO GRAFIKI

Ocena obrazu – DNA obrazu• ilościowa analiza obrazu – jego

konstrukcji (składowe grafiki) i kolorów.

• W holenderskim University of Maastricht prowadzone są prace na komputerową identyfikacją obrazów. Uruchomiony system potrafi szybko dokonać sprawdzenia setek obrazów wskazując kicze i te, które warto dokładniej obejrzeć.

Page 81: WSTĘP DO GRAFIKI

DNA obrazu• Idea polega na wyróżnianiu dużej liczby

niezależnych składowych obrazu. Analizując cyfrowe postacie obrazów van Gogh’a między innymi zwrócono uwagę na kontrast kolorów, strukturę nakładania farb oraz ślady pędzla. Wykorzystując te miary, do identyfikacji dzieł malarskich, program nie tylko podaje swój werdykt o autentyczności dzieła, ale także go uzasadnia.

Page 82: WSTĘP DO GRAFIKI

Obraz - badania1998 rok. Niemiecki zespół University of Bremen's

Center for Computing Technologies uczył komputer rozpoznawać dzieła Delacroix’a – trafność 87%.

Katolicki Uniwersyt w Rio de Janeiro system, który umożliwił ze stuprocentową dokładnością zidentyfikować dwadzieścia trzy dzieła popularnego Brazylijskiego malarza Candido Portinari’a i pięciu Enrico Bianco.

Inne badania nad identyfikacją mistrzów: van Gogh’a, Cézanne’a i Gauguin’a gwarantowały 95% powodzenie.

Page 83: WSTĘP DO GRAFIKI

Obraz na monitorze• próba stworzenia takiego narzędzia, które

ułatwia tworzenie obrazu na ekranie monitora w takiej formie by był on jak najszybciej rozpoznawalny

• metoda okien (1985) - w ogólności idea tej metody polega na tym, że oko ludzkie najszybciej odbiera obrazy, które mają określoną proporcję/rozkład liczby szczegółów stanowiących poziome fragmenty obrazów do szczegółów poziomych

Page 84: WSTĘP DO GRAFIKI

Aaron• Pierwszy robot w historii ludzkości, który

samodzielnie tworzy oryginalne obrazy • Łączy własne dzieła, nawet czyści pędzle i

korzysta z oferty farb PROCION. • Może tworzyć obrazy o wszystkim co zna –

obecnie dotyczy to ludzi, roślin doniczkowych, drzew oraz prostych obiektów – prostopadłościany, płaszczyzny, dekoracje.

• Napisany jest w języku C i rozwijany w LISPie. • Jest w pełni samodzielny – poświęca większość

czasu na własną interpretację tworzonego obrazu. Brak jakiejkolwiek formy sprzężenia zwrotnego.

• „Nie mówię mu co ma robić. Rozmawiam z nim o tym co wie i on decyduje co robić”

Page 85: WSTĘP DO GRAFIKI

Aaron - dzieła

http://www.viewingspace.com/genetics_culture/pages_genetics_culture/gc_w05/cohen_h.htm

Page 86: WSTĘP DO GRAFIKI

Muzyczna inteligencja

• Programy potrafiące wyróżnić/przewidzieć hity od przeciętnych utworów

• Programy wyróżniają „spectral deconvolution” – ok. 30 parametrów, które definiują fragmenty muzyki (sonic brilliance, octave, cadence, freeqency range, fulness of sound, chord progression itp.)

• Firma Platinum Blue ma dane o 3 mln utworów, które wykorzystuje program Music Science

Page 87: WSTĘP DO GRAFIKI

Music Science, Hit Song Science (HSS)

• Firmy świadczą usługi oceny materiałów, dają sugestie zmian. Pomagają w decyzji wyboru przez producenta. Roczna opłata – 100 000 USD.

• Music Science - wskazuje na podobieństwa np. U2 do niektórych dzieł Betowena

• Programy przewidziałysukcesy: Candy Shop, Be the Girl, Unwritten, She says, You’re Beautiful.

• Nikt nie chce wiedzieć, że decyzje podejmuje maszyna

Page 88: WSTĘP DO GRAFIKI

Zastosowania

• Dobór podobnych utworów w radiu• Pomoc w doborze muzyki do filmów

(Disney)• Prawnicy do wstępnej oceny praw

autorskich – plagiatów.• Obawy – promocja unifikacji.

Dotychczasowe doświadczenia przeczą temu.

Page 89: WSTĘP DO GRAFIKI

komputery potrafią tworzyć prozę

• Przykładem tego jest program Brutus.1, opracowany przez Selmer’a Bringsjord’a – naukowca z Rensselaer Polytechnic Institute i David’a A. Ferruci z IBM.

• Początek dzieła Brutus.1: „Dave Striver lubił uniwersytet – jego porośniętą bluszczem wieżę zegarową z mocnej starej cegły, jego zalaną promieniami słonecznymi zieleń i pełną entuzjazmu młodzież....”..

• Także teksty naukowe – kompilacja dostępnych: http://www.elsewhere.org:80/pomo/

Page 90: WSTĘP DO GRAFIKI

RGB

• Dominującym standardem zapisu barw jest RGB. R – red (czerwony), G – green (zielony) i B – blue (niebieski).

• W wyniku mieszania tych barw można uzyskać dowolną inną barwę dostrzeganą przez ludzkie oko. W związku z tym, że dane o barwie każdego piksela składają się z ośmiobitowych informacji o nasyceniu czerwieni, zieleni i barwy niebieskiej, piksele zapisywane są 24 bitami (dla każdej barwy osiem bitów).

• Istnieje wiele innych standardów cyfrowego tworzenia barw, są to m.in.: CMY, CMYK, LAB, HLS, HSI, HSV, sRGB.