im. Stanisława Staszica w...
Transcript of im. Stanisława Staszica w...
Akademia Górniczo-Hutnicza
im. Stanisława Staszica
w Krakowie
Sieci komputerowe i bazy danych
Sprawozdanie 4
Badanie protokołów WWW
Szymon Dziewic
Inżynieria Mechatroniczna
Rok: III
Grupa: L1
Zajęcia w środę 9:30
Zadania
1. Wyszukać w zasobach sieci dokumenty [RFC 1945] oraz [RFC 2616]. Zapoznać się z ich
zawartością.
RFC- zbiór dokumentów technicznych oraz organizacyjnych dotyczących Internetu
oraz sieci komputerowych.
RFC 1945 oraz RFC 2616 mówią o protokole przesyłania dokumentów
hipertekstowych (http). RFC 2616 jest nowszą wersją i definiuje ten protokół. Za jego
pomocą przesyła się żądanie dostępu dokumentów sieci WWW. Zadaniem http jest
umożliwienie stronom WWW spełniania ich funkcji, czyli publikowaniu informacji.
Ponadto http udostępnia znormalizowany sposób komunikacji między komputerami,
co jest bardzo użyteczne.
2. Badanie działania protokołu http
o uruchomić program putty
o ustawić:
i. connection type: raw
ii. Host name: mts.wibro.agh.edu.pl
iii. Port: 80
iv. Close window on exit: never
o w oknie putty wpisać polecenia żądania protokołu HTTP
i. GET /~sNrIndeks/ HTTP/1.1
GET /~s292496/ HTTP/1.1
ii. nacisnąć ENTER
iii. Host: mts.wibro.agh.edu.pl
iv. nacisnąć 2xENTER
o prześledzić i skomentować odpowiedź serwera
Początek stanowią informacje o dacie godzinie, ostatniej modyfikacji,
serwerze, o typie pliku i jego wielkości.
W dalszej części wyświetla się kod źródłowy strony.
o sprawdzić i skomentować odpowiedzi serwera na:
o
i. błędnie wpisany nagłówek
ii. niepoprawny adres strony
iii. niepoprawny adres hosta
Przy nie poprawnym wpisaniu adresu strony lub nagłówka dostajemy błąd. Przy
złym podaniu hosta otrzymujemy wynik poprawny. Jest tak ponieważ znajdujemy się
już na serwerze mts.wibro.agh.edu.pl podczas uruchamiania go w Putty.
3. Pod adresami: http://tools.pingdom.com/, http://test.watchscript.pl można znaleźć
narzędzia do testowania szybkości pobierania stron www. Sprawdzić na kilku (co
najmniej pięciu) przykładach dowolnych stron ich szybkość ładowania. Zaobserwuj
jak zachowują się i jak są pobierane strony wyposażone w grafikę, arkusze CSS,
dołączone skrypty, itp. Skomentuj wyniki obserwacji.
Używając http://tools.pingdom.com/ można m.in. zbadać czas pobierania stron
WWW.
Przykładowe strony:
- https://www.onet.pl/
-https://www.youtube.com/
-https://stackoverflow.com/
-http://www.kurshtmlcss.pl/jak-zrobic-strone-internetowa/szablon-strony.php
-http://szablony.freeware.info.pl/skrypty.html
Strony z większą ilością skryptów, zdjęć oraz Arkuszów CSS ładują się znacznie
dłużej.
4. Zdefiniować pojęcie URL. Wymienić i wskazać na przykładach jego podstawowe
składniki. Podać w jaki sposób odnieść się do:
o grafiki umieszczonej na stronie
o odnieść się do wybranego elementu (zakładki) na stronie
o odnieść się do programu pocztowego.
Adres URL (ang. Uniform Resource Locator) jest to „adres internetowy”, określa
lokalizację zasobu (np. strony internetowej) w Internecie. Został zaprojektowany w
celu zastąpienia adresów IP w postaci cyfr używanych przez komputery do
komunikacji z serwerami.
- odniesienie do grafiki umieszczonej na stronie: http://mts.wibro.agh.edu.pl/~s292496/agh.jpg
- wybranego elementu na stronie:
Do odnoszenia się do wybranych elementów wykorzystujemy hiperłącza. https://pl.wikipedia.org/wiki/Umowa_z_Malborka_(1454)
- programu pocztowego: za pomocą mailto
ogólna postać
mailto:[adresy][odwołania do elementów nagłówka lub tekstu]
np. mailto:[email protected]
Elementy adresu na przykładzie:
http://www.wikipedia.com/wiki/URL
| | |
| | ścieżka dostępu
| | do zasobu
| host (adres serwera)
protokół
5. Wyjaśnić co to znaczy że protokół HTTP jest bezstanowy. Jak objawia się jego
bezstanowość w trakcie wykonywania punktu 2 (sprawdzić zachowanie putty’ego po
dokonaniu zmian Close window on exit: na Always).
HTTP jest to protokół bezstanowy, tzn. ani serwer (ani klient) nie przechowuje
informacji o tym, jakie były wcześniej zapytania pomiędzy określonym serwerem i
klientem oraz nie posiada stanu wewnętrznego. Powoduje to, że każde zapytanie do
serwera traktowane jest jako ‚nowe’, z punktu widzenia serwera aplikacji niemożliwe
do powiązania z informacjami np. o zalogowanym użytkowniku.
Po dokonaniu zmian w Close window on exit na Always PuTTY zamknął się po
rozłączeniu z serwerem.
6. Wyjaśnić termin pliki cookie oraz celowość ich użycia. Na przykładzie kilku stron
zaobserwować czy i jak pliki cookies są używane. Zaobserwować jak zmienią się
zachowania stron po wyłączeniu akceptacji plików cookie.
Pliki cookies („ciasteczka”) to niewielkie pliki, zapisywane i przechowywane na
komputerze lokalnym lub innym urządzeniu podczas gdy odwiedzasz różne strony
WWW w sieci Internet.
Plik cookie zazwyczaj zawierają:
- podstawowe informacje na temat nazwy strony WWW, z której pochodzi,
- „długość życia” ciasteczka – czyli jaki ustawiony jest czas jego istnienia na Twoim
komputerze,
- przypadkowo wygenerowany unikalny numer służący do identyfikacji przeglądarki,
z jakiej następuje połączenie ze stroną WWW,
Pliki cookies stanowią dane informatyczne, w szczególności pliki tekstowe, które
przechowywane są w urządzeniu końcowym użytkownika strony WWW.
Pliki cookies mogą być stosowane w celu:
• dostosowania zawartości stron WWW do preferencji użytkownika oraz
optymalizacji procesu korzystania ze stron internetowych – w szczególności
pliki te pozwalają rozpoznać urządzenie użytkownika serwisu internetowego i
odpowiednio wyświetlić stronę internetową, dostosowaną do jego
indywidualnych potrzeb,
• tworzenia statystyk, które pomagają zrozumieć, w jaki sposób użytkownicy
serwisu korzystają ze stron internetowych, co umożliwia ulepszanie ich
struktury i zawartości,
• utrzymania sesji użytkownika serwisu internetowego (po zalogowaniu), dzięki
której użytkownik nie musi na każdej podstronie serwisu ponownie wpisywać
loginu i hasła (np. Panel Klienta home.pl, Poczta home.pl),
• dostarczania użytkownikom treści reklamowych bardziej dostosowanych do
ich zainteresowań
Po wyłączeniu akceptacji plików cookies strony internetowe nie będą pamiętały
ustawień języka, strefy czasowej czy obszaru licencyjnego praw autorskich, nie
zapamiętają preferencji użytkownika co do rozdzielczości ekranu, co utrudni
funkcjonalne z nich korzystanie, większość reklam będzie niedopasowana do
zainteresowań użytkownika, zwyczajów czy preferencji.
7. Na bazie wybranych kryteriów wyszukiwania przetestować kilka (co najmniej 5 np:
Google, DuckDuckGo, Bing, Yahoo, Ask) serwisów wyszukiwawczych. Skomentować
poprawność zwracanych rezultatów, ilość trafień, szybkość działania. Porównać
możliwości dodatkowe (np. wykorzystanie google jako kalkulatora, przelicznika walut
itp).
Wyszukiwane hasło: „ubuntu”:
Google: https://www.google.pl/
Około 165 000 000 wyników (0,30 s)
Pierwszy wynik: https://www.ubuntu.com/
DuckDuckGo: https://duckduckgo.com/
brak danych ilości wyników i czasu, jednak porównywalne z Google
Pierwszy wynik: https://www.ubuntu.com/
Bing: https://www.bing.com/
15 100 000 wyników, czas nie podany lecz zbliżony do pozostałych
Pierwszy wynik: https://www.ubuntu.com/
Yahoo: https://www.yahoo.com/
brak danych ilości wyników i czasu, porównywalne z pozostałymi
Pierwszy wynik: https://www.ubuntu.com/
Ask: https://www.ask.com/
brak danych ilości wyników i czasu, porównywalne z pozostałymi
Pierwszy wynik: https://en.wikipedia.org/wiki/Ubuntu
Czas i liczba wyników porównywalna w wyszukiwarkach. Pierwszy wynik różni się w
wyszukiwarce Ask. Funkcji kalkulatora nie posiada Ask, a w pozostałych
wyszukiwarkach jest kalkulator, z dużą dokładnością po przecinku.
8. Skomentować celowość wykorzystania serwerów proxy.
Serwery proxy to serwery pośredniczące w wymianie danych między komputerem a
serwerem, z którego te dane ściągamy. Dane przez proxy można ściągać za
pośrednictwem protokołów: http, ftp. Zalety użycia proxy to - szybszy dostęp do
WWW, - krótszy czas ściągania plików przez ftp, - oszczędność łącza, - ukrywają adres
IP komputera.
9. Na bazie materiałów znalezionych w internecie porównać działanie protokołów HTTP
oraz HTTPS [RFC 2818].
HTTPS jest szyfrowaną wersją protokołu HTTP. W protokole HTTPS dane są
szyfrowane za przy wykorzystywaniu protokołu SSL. Sprawia to, że szyfrowanie jest
bezpieczniejsze, więc informacje też są lepiej zabezpieczone. Ponadto w przypadku
protokołu http portem domyślnym wykorzystywanym do transmisji jest port 80 w
przypadku HTTPS jest to port 443.
10. Na bazie materiałów dostępnych w sieci internet, np:
o http://www.w3schools.com/html
o http://www.w3schools.com/css/ o https://www.w3.org/TR/html5/
o http://webmaster.helion.pl/
zapoznać się ze specyfikacją HTML oraz CSS.
HTML - hipertekstowy język znaczników, wykorzystywany do tworzenia
dokumentów hipertekstowych pozwalających opisać strukturę informacji wewnątrz
strony internetowej.
CSS (Kaskadowe arkusze stylów) - język służący do opisu formy wyświetlania stron
WWW.
11. Zmodyfikować swoją stronę internetową wprowadzając na niej różne elementy
formatowania, np: listy, tabele, formularze oraz nadać im różne formatowania za
pomocą stylów CSS.