ukryty.internet.pdf

download ukryty.internet.pdf

of 57

Transcript of ukryty.internet.pdf

  • 7/27/2019 ukryty.internet.pdf

    1/57

  • 7/27/2019 ukryty.internet.pdf

    2/57

    Ukryte zasoby sieciowe - definicje,

    typy, wielko Sposoby odkrywania niewidzialnych

    zasobw sieci

    Metody szukania ukrytych zasobwsieci

    Plan

  • 7/27/2019 ukryty.internet.pdf

    3/57

    zasoby sieci dostpne dla wyszukiwarek

    Web/sie widoczna, pytka, indeksowana

    ang. surface web, visible web, indexable web

    zasoby sieci trudno dostpne dlawyszukiwarek

    Web/sie - ukryta, niewidzialna, gboka

    ang. hidden web, deep web, invisible web

    Co to jest ukryty Web?

  • 7/27/2019 ukryty.internet.pdf

    4/57

    Definicje

    wg C. Hermana i G. Pricea, G. (2001) - InvisibleWeb dostpne w sieci i czsto bardzowartociowe strony tekstowe, pliki czy inneinformacje, ktrych z przyczyn technicznych bdinnych ogranicze nie indeksujoglnewyszukiwarki

    wg M. K. Bergmana (2001) Deep web stronyweb tworzone dynamicznie jako wynikispecjalistycznych wyszukiwa w bazach danych

  • 7/27/2019 ukryty.internet.pdf

    5/57

    W E B

    Zasoby ukryte

    Zasoby indeksowane przez wyszukiwarki (sie pytka)

    Indeks wyszukiwarki A

    Indeks wyszukiwarki B

    Indeks wyszukiwarki C

    Przydatne

    zasoby sieci

    Uwaga!Proporcje na rys.

    sprzypadkowei nie szgodne zcytowanymi dalejliczbami!

  • 7/27/2019 ukryty.internet.pdf

    6/57

  • 7/27/2019 ukryty.internet.pdf

    7/57

    Typy ukrytych zasobw Web

    Tej publikacji - dostpnej w

    Wydawnictwach penotekstowychPolitechniki witokrzyskiej - nieznajdziemy w Google

  • 7/27/2019 ukryty.internet.pdf

    8/57

    Typy ukrytych zasobw Web

    Opis tej publikacji - dostpnej w

    bazie Biblioteki Narodowej -znajdziemy wprawdzie w Goolge,ale nie z tej bazy i nie tak peny

    http://mak.bn.org.pl/w14.htm

  • 7/27/2019 ukryty.internet.pdf

    9/57

    Typy ukrytych zasobw Web

    Strona utworzona w technologii Flash. Wikszo tekstu nie jestindeksowana przez wyszukiwarki.

  • 7/27/2019 ukryty.internet.pdf

    10/57

    Typy ukrytych zasobw Web

    KPBC - Ksiga Adresowa Miasta Bydgoszczy : 1936/37 tre nie jestindeksowana przez Google

  • 7/27/2019 ukryty.internet.pdf

    11/57

    Co jeszcze jest tak naprawdwidoczne, ale ukrywa si?

    strony na dalszych miejscach na licie rezultatw

    strony utracone z powodu le sformuowanegopytania

    strony utracone z powodu niewykorzystania

    wszystkich moliwoci wyszukiwarek (formularzezaawansowane!)

    strony, ktre atwiej znale korzystajc zwyspecjalizowanych narzdzi, np. katalogwtematycznych, wyszukiwarek specjalnych (osb,multimediw, blogw, OA, itp.)

  • 7/27/2019 ukryty.internet.pdf

    12/57

    Wielko zasobw ukrytych wporwnaniu z siecipytk Bright Planet (2001) M. K. Bergman

    deep webjest ok. 400-550 razy wikszy nisurface webi liczy ok. 550 mlddokumentw (7.500 terabajtw)

    60 najwikszych baz danych ukrytego Internetu zawiera 750 TB danych ok. 95% zasobw "ukrytych" jest dostpnych publicznie, bezpatnie ponad poowa to tematyczne bazy danych

    zasoby deep websodwiedzane przez uytkownikw o 50% czciej

    Badania How Much Information 2003: sie pytka - 167 terabajtw,gboka - 91,850 terabajtw

    Gulli, A., Signorini, A. (2005) surface Web- 11,5 mld stron

    ok. 9,36 mld stron w indeksach 4 najwikszych wyszukiwarek (Google, Yahoo, MSN,Ask) = ok. 70% zasobw surface web cz wsplna indeksw 4 w/w wyszukiwarek wynosi 2,7 mld stron (28,85%)

    Google dzi - 1 bilion stron? http://googleblog.blogspot.com/2008/07/we-knew-web-was-big.html

  • 7/27/2019 ukryty.internet.pdf

    13/57

    Wielko zasobw ukrytych

    rdo http://www.press.umich.edu/jep/07-01/bergman.html

    2001 r.

  • 7/27/2019 ukryty.internet.pdf

    14/57

    Wielko zasobw ukrytych

    rdo http://www.press.umich.edu/jep/07-01/bergman.html

    2001 r.

  • 7/27/2019 ukryty.internet.pdf

    15/57

    rdo: http://netforbeginners.about.com/library/diagrams/n4layers.htm

    Wielko zasobw ukrytych

  • 7/27/2019 ukryty.internet.pdf

    16/57

    Rodzaje informacji

    publikacje i raporty naukowe, dysertacje (peneteksty lub abstrakty)

    artykuy z gazet i czasopism (pene teksty lubabstrakty)

    dokumenty rzdowe archiwa materiaw rdowych i referencyjnych zasoby biblioteczne (katalogi, biblioteki cyfrowe,

    publikacje pracownikw uczelni)

    repozytoria Open Access

    szara literatura

    dane, wzory, grafiki

    sowniki i encyklopedie, bazy teleadresowe

    zasoby graficzne, dwikowe, multimedialne i wiele, wiele innych

    niektre

  • 7/27/2019 ukryty.internet.pdf

    17/57

    Odkrywanie niewidzialnychzasobw sieci

    specjalne usugi standardowych wyszukiwarek, wsppraca z

    wydawcami czasopism oraz twrcami baz danych i katalogw stosowanie odpowiednich standardw (np. Z39.50, OAI-PMH)

    przez twrcw specjalnych kolekcji, baz danych, repozytoriw

    konwersja baz danych do stron HTML

    tworzenie specjalistycznych wyszukiwarek i multiwyszukiwarek -zintegrowane przeszukiwanie wielu zasobw

    tworzenie katalogw tematycznych i subject gateways

    wykazy przydatnych linkw na stronach bibliotek

    szkolenie uytkownikw sieci

  • 7/27/2019 ukryty.internet.pdf

    18/57

    Specjalne funkcje standardowych wyszukiwarek

    Google Scholar http://scholar.google.com

    Dostp patny

    Dostp patny

    Dostp bezpatny

  • 7/27/2019 ukryty.internet.pdf

    19/57

    Specjalne funkcje standardowych wyszukiwarek

    Do tekstu tejpublikacjinatychmiastowydostp uzyskajsubskrybenci IEEE

    Explore (posprawdzeniu przezsystem IP)

  • 7/27/2019 ukryty.internet.pdf

    20/57

    Stosowanie standardw i innych rozwiza

    technicznych przez twrcw kolekcji sieciowych

    Publikacja dostpna w Kujawsko-Pomorskiej Bibliotece Cyfrowej i

  • 7/27/2019 ukryty.internet.pdf

    21/57

    Stosowanie standardw i innych rozwiza

    technicznych przez twrcw kolekcji sieciowych i ta sama

    publikacjadostpna w:

    Google

    FBC

    OAIster

  • 7/27/2019 ukryty.internet.pdf

    22/57

    Stosowanie standardw i innych rozwiza

    technicznych przez twrcw kolekcji sieciowychTa sama publikacja dostpna zbazy Amazon.com i poprzezYahoo! kady rekord ma innyadres URL!

    Konwersja bazy danych do regularnych stron HTML

  • 7/27/2019 ukryty.internet.pdf

    23/57

    Tworzenie specjalistycznych wyszukiwarek

    i multiwyszukiwarek

    Multiwyszukiwarka Goshme kieruje pytanie do ponad 2520 wyszukiwarekoglnych i specjalistycznych

  • 7/27/2019 ukryty.internet.pdf

    24/57

    Tworzenie specjalistycznych wyszukiwarek

    i multiwyszukiwarek

    Rezultaty

    pogrupowane swg typw narzdzi(np. SpecializedSearch Engines).

    Kady rezultatmona podejrzena licie wynikw(preview)

    Moliwowyboru typu

    zasobu, np.wideo,wiadomoci

  • 7/27/2019 ukryty.internet.pdf

    25/57

  • 7/27/2019 ukryty.internet.pdf

    26/57

    Tworzenie serwisw typu subject gateways

    serwisy kierujce do zasobw sieciowych udoskonalonewykazy linkw

    dobr rde jest twrczym procesem, zgodnym z przyjtymikryteriami jakoci

    manualnie tworzone metadane dla kadego rda

    opis rda (od adnotacji do recenzji) jest te procesemtwrczym

    gboka struktura tematyczna / system klasyfikacji / dodawaniesw kluczowych lub deskryptorw

    przegldania serwisu wg tematw (wyklucza si list linkw bezadnej struktury)

    wyszukiwanie linki do zasobw tworzbaz danych

    zarzdzanie kolekcjlinkw, np. aktualizacja

  • 7/27/2019 ukryty.internet.pdf

    27/57

    Tworzenie serwisw typu subject gateways

    http://www.intute.ac.uk/

  • 7/27/2019 ukryty.internet.pdf

    28/57

    Tworzenie serwisw typu subject gateways

  • 7/27/2019 ukryty.internet.pdf

    29/57

  • 7/27/2019 ukryty.internet.pdf

    30/57

    Szkolenie uytkownikw sieci

    uwiadamianie istnienia deep Web

    prezentowanie przykadowych stron WWW pozostajcych

    poza zasigiem np. Google, w tym licencjonowanychzasobw prenumerowanych przez bibliotek!!!

    wskazywanie sposobw poszukiwa tych rde w sieci

    nauczanie precyzyjnego formuowania pyta i korzystania zformularzy wyszukiwania zaawansowanego

    formy: prezentacje, wykady, formalne szkolenia,

    indywidualne instruktae, informacje i instrukcje nastronach internetowych, notatki i artykuw w czasopismach

  • 7/27/2019 ukryty.internet.pdf

    31/57

    Szkolenie uytkownikw sieci

    http://www.intute.ac.uk/

    Intute: virtual training suite- zestaw darmowych kursw online nt. wyszukiwaniainformacji w Internecie, dla rnych grup odbiorcw

  • 7/27/2019 ukryty.internet.pdf

    32/57

    Jak szuka ukrytych zasobwsieci?

    Owe zasoby [deep Web] swszak dostpne i widoczne,

    tylko trzeba wiedzie, jak do nich dotrze. Spoprostu gbiej schowane. Szumilas, D. (2005)

    Dlaczego warto nie poprzestawa naGoogle?

    Jak szuka?

  • 7/27/2019 ukryty.internet.pdf

    33/57

    Dlaczego warto nie poprzestawa na

    Google?

    standardowe wyszukiwarki pomijajwiele zasobw ukrytych

    informacje w ramach jednego serwisu deep webrzadko sipowielaj, co w standardowych wyszukiwarkach jestpowszechne

    ukryty web to rda o wysokiej jakoci

    dane w serwisach deep websczsto pogrupowanetematycznie i wyszukiwane wg potrzeb uytkownika

    wyszukiwanie specjalistycznych informacji (nawet tychwidzialnych) da lepsze rezultaty w bazach danych ni wstandardowych wyszukiwarkach

  • 7/27/2019 ukryty.internet.pdf

    34/57

    Jak szuka?

    zna przydatne bazy danych

    zapyta Google, np. baza danych filmalbo

    environment "search engine"albowyszukiwarka mp3

    skorzysta z wyszukiwarek deep web

    przeglda katalogi tematyczne, subjectgateways, portale tematyczne, wykazy linkw

    korzysta z wyszukiwarek specjalistycznych

    skorzysta z profesjonalnych baz danychprenumerowanych przez bibliotek

  • 7/27/2019 ukryty.internet.pdf

    35/57

    Zna przydatne bazy danych

    Polskie bibliografie i informatory w Internecie http://www.bj.uj.edu.pl/var/bibliogr1_pl.php

  • 7/27/2019 ukryty.internet.pdf

    36/57

    Zapyta Google o bazy danych

  • 7/27/2019 ukryty.internet.pdf

    37/57

    Wyszukiwarki deep web

    http://www.deepdyve.com/

    http://www.goshme.com/

  • 7/27/2019 ukryty.internet.pdf

    38/57

    Katalogi tematyczne i subject gateways

    http://infomine.ucr.edu/

  • 7/27/2019 ukryty.internet.pdf

    39/57

    Katalogi tematyczne i subject gateways

    Librarians Internet Index http://lii.org/

  • 7/27/2019 ukryty.internet.pdf

    40/57

    Katalogi tematyczne i subject gateways

    http://uidaho.edu/special-collections/Other.Repositories.html

  • 7/27/2019 ukryty.internet.pdf

    41/57

    Katalogi tematyczne i subject gateways

    http://kangurold.uek.krakow.pl/Biblioteka/Ekonomia/

    K l i i

  • 7/27/2019 ukryty.internet.pdf

    42/57

    Katalogi tematyczne i subject gateways

    Wikidot Ekologiczny http://energia-odnawialna.wikidot.com/

  • 7/27/2019 ukryty.internet.pdf

    43/57

  • 7/27/2019 ukryty.internet.pdf

    44/57

    K t l i b O A

  • 7/27/2019 ukryty.internet.pdf

    45/57

    Katalogi zasobw Open Access

    Directory of Open Access Journals http://www.doaj.org/

    M t ki ki j li t

  • 7/27/2019 ukryty.internet.pdf

    46/57

    Metawyszukiwarki specjalistyczne

    http://Federacja Bibliotek Cyfrowych http://fbc.pionier.net.pl/owoc

    M t ki ki j li t

  • 7/27/2019 ukryty.internet.pdf

    47/57

    Metawyszukiwarki specjalistyczne

    http://worldwidescience.org

    Wyszukiwarki specjalistyczne

  • 7/27/2019 ukryty.internet.pdf

    48/57

    Wyszukiwarki specjalistyczne

    http://www.archive.org/

    Wyszukiwarki specjalistyczne

  • 7/27/2019 ukryty.internet.pdf

    49/57

    Wyszukiwarki specjalistyczne

    ERIC http://www.eric.ed.gov

    Wyszukiwarki specjalistyczne

  • 7/27/2019 ukryty.internet.pdf

    50/57

    Wyszukiwarki specjalistyczne

    WorldCat http://www.worldcat.org/

    Wyszukiwarki specjalistyczne

  • 7/27/2019 ukryty.internet.pdf

    51/57

    Wyszukiwarki specjalistyczne

    pipl- The most comprehensive people search on the web http://www.pipl.com

    Wyniki pogrupowane wkategoriach:

    Personal Profiles

    Photos

    Videos

    Quick Facts

    Professional & Business

    Publications

    Web Pages

    News Articles

    Blog Posts

    Documents

  • 7/27/2019 ukryty.internet.pdf

    52/57

  • 7/27/2019 ukryty.internet.pdf

    53/57

  • 7/27/2019 ukryty.internet.pdf

    54/57

    Wyszukiwarki specjalistyczne

  • 7/27/2019 ukryty.internet.pdf

    55/57

    Wyszukiwarki specjalistyczne

    Delicious http://delicious.com/ - Zakadki i Ulubione uytkownikw sieci

    Profesjonalne zasoby prenumerowane przez

  • 7/27/2019 ukryty.internet.pdf

    56/57

    Profesjonalne zasoby prenumerowane przez

    bibliotek

  • 7/27/2019 ukryty.internet.pdf

    57/57