ukryty.internet.pdf
-
Upload
cryptologiconaudyt -
Category
Documents
-
view
213 -
download
0
Transcript of ukryty.internet.pdf
-
7/27/2019 ukryty.internet.pdf
1/57
-
7/27/2019 ukryty.internet.pdf
2/57
Ukryte zasoby sieciowe - definicje,
typy, wielko Sposoby odkrywania niewidzialnych
zasobw sieci
Metody szukania ukrytych zasobwsieci
Plan
-
7/27/2019 ukryty.internet.pdf
3/57
zasoby sieci dostpne dla wyszukiwarek
Web/sie widoczna, pytka, indeksowana
ang. surface web, visible web, indexable web
zasoby sieci trudno dostpne dlawyszukiwarek
Web/sie - ukryta, niewidzialna, gboka
ang. hidden web, deep web, invisible web
Co to jest ukryty Web?
-
7/27/2019 ukryty.internet.pdf
4/57
Definicje
wg C. Hermana i G. Pricea, G. (2001) - InvisibleWeb dostpne w sieci i czsto bardzowartociowe strony tekstowe, pliki czy inneinformacje, ktrych z przyczyn technicznych bdinnych ogranicze nie indeksujoglnewyszukiwarki
wg M. K. Bergmana (2001) Deep web stronyweb tworzone dynamicznie jako wynikispecjalistycznych wyszukiwa w bazach danych
-
7/27/2019 ukryty.internet.pdf
5/57
W E B
Zasoby ukryte
Zasoby indeksowane przez wyszukiwarki (sie pytka)
Indeks wyszukiwarki A
Indeks wyszukiwarki B
Indeks wyszukiwarki C
Przydatne
zasoby sieci
Uwaga!Proporcje na rys.
sprzypadkowei nie szgodne zcytowanymi dalejliczbami!
-
7/27/2019 ukryty.internet.pdf
6/57
-
7/27/2019 ukryty.internet.pdf
7/57
Typy ukrytych zasobw Web
Tej publikacji - dostpnej w
Wydawnictwach penotekstowychPolitechniki witokrzyskiej - nieznajdziemy w Google
-
7/27/2019 ukryty.internet.pdf
8/57
Typy ukrytych zasobw Web
Opis tej publikacji - dostpnej w
bazie Biblioteki Narodowej -znajdziemy wprawdzie w Goolge,ale nie z tej bazy i nie tak peny
http://mak.bn.org.pl/w14.htm
-
7/27/2019 ukryty.internet.pdf
9/57
Typy ukrytych zasobw Web
Strona utworzona w technologii Flash. Wikszo tekstu nie jestindeksowana przez wyszukiwarki.
-
7/27/2019 ukryty.internet.pdf
10/57
Typy ukrytych zasobw Web
KPBC - Ksiga Adresowa Miasta Bydgoszczy : 1936/37 tre nie jestindeksowana przez Google
-
7/27/2019 ukryty.internet.pdf
11/57
Co jeszcze jest tak naprawdwidoczne, ale ukrywa si?
strony na dalszych miejscach na licie rezultatw
strony utracone z powodu le sformuowanegopytania
strony utracone z powodu niewykorzystania
wszystkich moliwoci wyszukiwarek (formularzezaawansowane!)
strony, ktre atwiej znale korzystajc zwyspecjalizowanych narzdzi, np. katalogwtematycznych, wyszukiwarek specjalnych (osb,multimediw, blogw, OA, itp.)
-
7/27/2019 ukryty.internet.pdf
12/57
Wielko zasobw ukrytych wporwnaniu z siecipytk Bright Planet (2001) M. K. Bergman
deep webjest ok. 400-550 razy wikszy nisurface webi liczy ok. 550 mlddokumentw (7.500 terabajtw)
60 najwikszych baz danych ukrytego Internetu zawiera 750 TB danych ok. 95% zasobw "ukrytych" jest dostpnych publicznie, bezpatnie ponad poowa to tematyczne bazy danych
zasoby deep websodwiedzane przez uytkownikw o 50% czciej
Badania How Much Information 2003: sie pytka - 167 terabajtw,gboka - 91,850 terabajtw
Gulli, A., Signorini, A. (2005) surface Web- 11,5 mld stron
ok. 9,36 mld stron w indeksach 4 najwikszych wyszukiwarek (Google, Yahoo, MSN,Ask) = ok. 70% zasobw surface web cz wsplna indeksw 4 w/w wyszukiwarek wynosi 2,7 mld stron (28,85%)
Google dzi - 1 bilion stron? http://googleblog.blogspot.com/2008/07/we-knew-web-was-big.html
-
7/27/2019 ukryty.internet.pdf
13/57
Wielko zasobw ukrytych
rdo http://www.press.umich.edu/jep/07-01/bergman.html
2001 r.
-
7/27/2019 ukryty.internet.pdf
14/57
Wielko zasobw ukrytych
rdo http://www.press.umich.edu/jep/07-01/bergman.html
2001 r.
-
7/27/2019 ukryty.internet.pdf
15/57
rdo: http://netforbeginners.about.com/library/diagrams/n4layers.htm
Wielko zasobw ukrytych
-
7/27/2019 ukryty.internet.pdf
16/57
Rodzaje informacji
publikacje i raporty naukowe, dysertacje (peneteksty lub abstrakty)
artykuy z gazet i czasopism (pene teksty lubabstrakty)
dokumenty rzdowe archiwa materiaw rdowych i referencyjnych zasoby biblioteczne (katalogi, biblioteki cyfrowe,
publikacje pracownikw uczelni)
repozytoria Open Access
szara literatura
dane, wzory, grafiki
sowniki i encyklopedie, bazy teleadresowe
zasoby graficzne, dwikowe, multimedialne i wiele, wiele innych
niektre
-
7/27/2019 ukryty.internet.pdf
17/57
Odkrywanie niewidzialnychzasobw sieci
specjalne usugi standardowych wyszukiwarek, wsppraca z
wydawcami czasopism oraz twrcami baz danych i katalogw stosowanie odpowiednich standardw (np. Z39.50, OAI-PMH)
przez twrcw specjalnych kolekcji, baz danych, repozytoriw
konwersja baz danych do stron HTML
tworzenie specjalistycznych wyszukiwarek i multiwyszukiwarek -zintegrowane przeszukiwanie wielu zasobw
tworzenie katalogw tematycznych i subject gateways
wykazy przydatnych linkw na stronach bibliotek
szkolenie uytkownikw sieci
-
7/27/2019 ukryty.internet.pdf
18/57
Specjalne funkcje standardowych wyszukiwarek
Google Scholar http://scholar.google.com
Dostp patny
Dostp patny
Dostp bezpatny
-
7/27/2019 ukryty.internet.pdf
19/57
Specjalne funkcje standardowych wyszukiwarek
Do tekstu tejpublikacjinatychmiastowydostp uzyskajsubskrybenci IEEE
Explore (posprawdzeniu przezsystem IP)
-
7/27/2019 ukryty.internet.pdf
20/57
Stosowanie standardw i innych rozwiza
technicznych przez twrcw kolekcji sieciowych
Publikacja dostpna w Kujawsko-Pomorskiej Bibliotece Cyfrowej i
-
7/27/2019 ukryty.internet.pdf
21/57
Stosowanie standardw i innych rozwiza
technicznych przez twrcw kolekcji sieciowych i ta sama
publikacjadostpna w:
Google
FBC
OAIster
-
7/27/2019 ukryty.internet.pdf
22/57
Stosowanie standardw i innych rozwiza
technicznych przez twrcw kolekcji sieciowychTa sama publikacja dostpna zbazy Amazon.com i poprzezYahoo! kady rekord ma innyadres URL!
Konwersja bazy danych do regularnych stron HTML
-
7/27/2019 ukryty.internet.pdf
23/57
Tworzenie specjalistycznych wyszukiwarek
i multiwyszukiwarek
Multiwyszukiwarka Goshme kieruje pytanie do ponad 2520 wyszukiwarekoglnych i specjalistycznych
-
7/27/2019 ukryty.internet.pdf
24/57
Tworzenie specjalistycznych wyszukiwarek
i multiwyszukiwarek
Rezultaty
pogrupowane swg typw narzdzi(np. SpecializedSearch Engines).
Kady rezultatmona podejrzena licie wynikw(preview)
Moliwowyboru typu
zasobu, np.wideo,wiadomoci
-
7/27/2019 ukryty.internet.pdf
25/57
-
7/27/2019 ukryty.internet.pdf
26/57
Tworzenie serwisw typu subject gateways
serwisy kierujce do zasobw sieciowych udoskonalonewykazy linkw
dobr rde jest twrczym procesem, zgodnym z przyjtymikryteriami jakoci
manualnie tworzone metadane dla kadego rda
opis rda (od adnotacji do recenzji) jest te procesemtwrczym
gboka struktura tematyczna / system klasyfikacji / dodawaniesw kluczowych lub deskryptorw
przegldania serwisu wg tematw (wyklucza si list linkw bezadnej struktury)
wyszukiwanie linki do zasobw tworzbaz danych
zarzdzanie kolekcjlinkw, np. aktualizacja
-
7/27/2019 ukryty.internet.pdf
27/57
Tworzenie serwisw typu subject gateways
http://www.intute.ac.uk/
-
7/27/2019 ukryty.internet.pdf
28/57
Tworzenie serwisw typu subject gateways
-
7/27/2019 ukryty.internet.pdf
29/57
-
7/27/2019 ukryty.internet.pdf
30/57
Szkolenie uytkownikw sieci
uwiadamianie istnienia deep Web
prezentowanie przykadowych stron WWW pozostajcych
poza zasigiem np. Google, w tym licencjonowanychzasobw prenumerowanych przez bibliotek!!!
wskazywanie sposobw poszukiwa tych rde w sieci
nauczanie precyzyjnego formuowania pyta i korzystania zformularzy wyszukiwania zaawansowanego
formy: prezentacje, wykady, formalne szkolenia,
indywidualne instruktae, informacje i instrukcje nastronach internetowych, notatki i artykuw w czasopismach
-
7/27/2019 ukryty.internet.pdf
31/57
Szkolenie uytkownikw sieci
http://www.intute.ac.uk/
Intute: virtual training suite- zestaw darmowych kursw online nt. wyszukiwaniainformacji w Internecie, dla rnych grup odbiorcw
-
7/27/2019 ukryty.internet.pdf
32/57
Jak szuka ukrytych zasobwsieci?
Owe zasoby [deep Web] swszak dostpne i widoczne,
tylko trzeba wiedzie, jak do nich dotrze. Spoprostu gbiej schowane. Szumilas, D. (2005)
Dlaczego warto nie poprzestawa naGoogle?
Jak szuka?
-
7/27/2019 ukryty.internet.pdf
33/57
Dlaczego warto nie poprzestawa na
Google?
standardowe wyszukiwarki pomijajwiele zasobw ukrytych
informacje w ramach jednego serwisu deep webrzadko sipowielaj, co w standardowych wyszukiwarkach jestpowszechne
ukryty web to rda o wysokiej jakoci
dane w serwisach deep websczsto pogrupowanetematycznie i wyszukiwane wg potrzeb uytkownika
wyszukiwanie specjalistycznych informacji (nawet tychwidzialnych) da lepsze rezultaty w bazach danych ni wstandardowych wyszukiwarkach
-
7/27/2019 ukryty.internet.pdf
34/57
Jak szuka?
zna przydatne bazy danych
zapyta Google, np. baza danych filmalbo
environment "search engine"albowyszukiwarka mp3
skorzysta z wyszukiwarek deep web
przeglda katalogi tematyczne, subjectgateways, portale tematyczne, wykazy linkw
korzysta z wyszukiwarek specjalistycznych
skorzysta z profesjonalnych baz danychprenumerowanych przez bibliotek
-
7/27/2019 ukryty.internet.pdf
35/57
Zna przydatne bazy danych
Polskie bibliografie i informatory w Internecie http://www.bj.uj.edu.pl/var/bibliogr1_pl.php
-
7/27/2019 ukryty.internet.pdf
36/57
Zapyta Google o bazy danych
-
7/27/2019 ukryty.internet.pdf
37/57
Wyszukiwarki deep web
http://www.deepdyve.com/
http://www.goshme.com/
-
7/27/2019 ukryty.internet.pdf
38/57
Katalogi tematyczne i subject gateways
http://infomine.ucr.edu/
-
7/27/2019 ukryty.internet.pdf
39/57
Katalogi tematyczne i subject gateways
Librarians Internet Index http://lii.org/
-
7/27/2019 ukryty.internet.pdf
40/57
Katalogi tematyczne i subject gateways
http://uidaho.edu/special-collections/Other.Repositories.html
-
7/27/2019 ukryty.internet.pdf
41/57
Katalogi tematyczne i subject gateways
http://kangurold.uek.krakow.pl/Biblioteka/Ekonomia/
K l i i
-
7/27/2019 ukryty.internet.pdf
42/57
Katalogi tematyczne i subject gateways
Wikidot Ekologiczny http://energia-odnawialna.wikidot.com/
-
7/27/2019 ukryty.internet.pdf
43/57
-
7/27/2019 ukryty.internet.pdf
44/57
K t l i b O A
-
7/27/2019 ukryty.internet.pdf
45/57
Katalogi zasobw Open Access
Directory of Open Access Journals http://www.doaj.org/
M t ki ki j li t
-
7/27/2019 ukryty.internet.pdf
46/57
Metawyszukiwarki specjalistyczne
http://Federacja Bibliotek Cyfrowych http://fbc.pionier.net.pl/owoc
M t ki ki j li t
-
7/27/2019 ukryty.internet.pdf
47/57
Metawyszukiwarki specjalistyczne
http://worldwidescience.org
Wyszukiwarki specjalistyczne
-
7/27/2019 ukryty.internet.pdf
48/57
Wyszukiwarki specjalistyczne
http://www.archive.org/
Wyszukiwarki specjalistyczne
-
7/27/2019 ukryty.internet.pdf
49/57
Wyszukiwarki specjalistyczne
ERIC http://www.eric.ed.gov
Wyszukiwarki specjalistyczne
-
7/27/2019 ukryty.internet.pdf
50/57
Wyszukiwarki specjalistyczne
WorldCat http://www.worldcat.org/
Wyszukiwarki specjalistyczne
-
7/27/2019 ukryty.internet.pdf
51/57
Wyszukiwarki specjalistyczne
pipl- The most comprehensive people search on the web http://www.pipl.com
Wyniki pogrupowane wkategoriach:
Personal Profiles
Photos
Videos
Quick Facts
Professional & Business
Publications
Web Pages
News Articles
Blog Posts
Documents
-
7/27/2019 ukryty.internet.pdf
52/57
-
7/27/2019 ukryty.internet.pdf
53/57
-
7/27/2019 ukryty.internet.pdf
54/57
Wyszukiwarki specjalistyczne
-
7/27/2019 ukryty.internet.pdf
55/57
Wyszukiwarki specjalistyczne
Delicious http://delicious.com/ - Zakadki i Ulubione uytkownikw sieci
Profesjonalne zasoby prenumerowane przez
-
7/27/2019 ukryty.internet.pdf
56/57
Profesjonalne zasoby prenumerowane przez
bibliotek
-
7/27/2019 ukryty.internet.pdf
57/57