Internet Niewidzialne Zasoby 1

4

Click here to load reader

Transcript of Internet Niewidzialne Zasoby 1

Page 1: Internet Niewidzialne Zasoby 1

NA CD NEWSY Z OKŁADKI FIRMA MAGAZYN PROGRAMY WARSZTAT

poradnik

INTERNET.sierpień.200560

Kiedyś moja siostra szukała dosyć dziw-nie brzmiących, jak dla zwykłego śmier-telnika, rzeczy z dziedziny mikrobiolo-

gii. Otworzyła stronę wyszukiwarki, wpisała słowa, które powinny się znaleźć w dokumen-tach. Wyszukiwarka nic nie znalazła. Nawet linki sponsorowane były ubogie i zupełnie nie na temat. Trzeba było zmienić taktykę po-szukiwania, by dostać się do zasobów inter-netu położonych nieco głębiej, niedostępnych dla wyszukiwarek, ale jak najbardziej dostęp-nych dla ludzi. Trzeba było tylko je znaleźć. I udało się.

Kop głębiej!Google to nie wszystkoWyszukiwarki globalne, konwencjonalne, czyli po prostu takie jak Google, znajdują wszystko. Taka panuje opinia. I rzeczywiście znajdują coraz więcej. Z jednej strony użyt-kownik gubi się w morzu wyników, z drugiej – szczególnie gdy wpisze specjalistyczne hasło – wyszukiwarka nic nie znajduje. Czy to oznacza, że tego nie ma w internecie? Prawdopodobnie jest, tylko dobrze schowane.

Dorota Szumilas

CompletePlanet (http://www.completeplanet.com) – w polu tekstowym „Find databases relevant to:” wpisz słowa, które powinny się znaleźć w szukanym dokumencie

Strona Bright Planet (http://www.brightplanet.com)

Mroki internetuZasoby internetu, które są trudno dostępne dla konwencjonalnych wyszukiwarek, zwykło się określać „Invisible Net”, „Invisible Web” (nie-widoczna sieć) lub „Deep Web” (głęboka sieć). Ostatnie określenie jest wymyślone i promo-wane przez Bright Planet. Specjaliści z tej fir-

Page 2: Internet Niewidzialne Zasoby 1

WARSZTAT NA CDNEWSYZ OKŁADKIFIRMAMAGAZYNPROGRAMY

poradnik

INTERNET.sierpień.2005 61

Bright Planet i Copernic AgentBright Planet (http://www.brightplanet.com) – firma, która zajmuje się zagadnieniem „DeepWeb”, szacuje, że zasoby głębokiego internetu są 500 razy większe od tego widocznego z poziomu konwencjonalnych wyszukiwarek. Firma oferuje narzędzie do przeszukiwania zasobów głębokiego internetu – Deep Query Manager (DQM).

Program Copernic Agent (wersja płatna), do pobrania ze strony http://www.copernic.com, również oferuje przeszukiwanie zasobów schowanej części internetu. Natomiast za pomocą wersji darmowej można przeszukać np. bazę danych użytkowników ICQ – to też należy do tzw. głębokiego internetu.

Kop głębiej!Google to nie wszystko

Możliwości wyszukiwania ProFusion (http://www.profusion.com)

Wyszukiwanie przez SearchEdu.com (http://www.searchedu.com)

Wyszukiwarka naukowa Scirus (http://www.scirus.com)

Wyszukiwarka Turbo10 (http://turbo10.com)

Co to jest „Deep Web”?Określenia typu głęboka sieć, głęboki czy też niewidzialny internet brzmią być może tajem-niczo, ale żadnej tajemnicy nie kryją. I praw-dopodobnie nieraz już z owego głębokiego in-ternetu korzystałeś. Bardzo prosty przykład: gdy chcesz znaleźć pociąg z Piły do Suwałk, co wpisujesz do wyszukiwarki? Nie piszesz słów: Piła, Suwałki, pociąg, a od razu szu-kasz rozkładu jazdy PKP, czyli strony PKP, bo należy przypuszczać, że stamtąd będzie dostęp do rozkładu jazdy pociągów. Intuicyj-nie wiesz, co robić. I oczywiście taki rozkład znajduje się na stronie PKP. Żeby znaleźć po-łączenie Piła – Suwałki, musisz w odpowied-nie pola wpisać dane i kliknąć przycisk Szu-kanie połączeń. Po chwili zostaną wyświetlo-ne szukane połączenia.

Inny przykład. Chcesz stworzyć drzewo genealogiczne swojej rodziny. Wyszukiwanie po nazwisku w wyszukiwarce konwencjonal-nej może okazać się bezowocne. Lepiej zacząć od baz danych serwisów genealogicznych, re-

jestrów pasażerów statków z emigrantami itd. Tego konwencjonalna wyszukiwarka nie znaj-dzie. Takie informacje są ukryte głębiej.

Bazy danychZasoby głębokiego internetu to głównie bazy danych, z których możesz skorzystać, jeśli wiesz, gdzie one się znajdują. Wyszukiwarki pomijają wiadomości w nich zawarte, ponie-waż do takich zasobów można się dostać do-piero po wpisaniu konkretnego zapytania.

Na pewno wiesz, jak wygląda indeksowa-nie adresów stron przez wyszukiwarki. Wy-obraź sobie, że robot wchodzi na stronę, na której znajduje się baza danych, nie ma na-tomiast odnośników. Robot zapamięta adres główny, ale nie poinformuje, że na tej stronie, którą właśnie odwiedził, jest mnóstwo przy-datnych informacji. Tam jest cenna baza da-nych, tylko robot jej przecież nie używa, trze-ba bowiem w odpowiednich polach wpisać to, czego się szuka, by uzyskać informacje. Cza-sem, by skorzystać z pewnych zasobów, trze-

my twierdzą, że najlepiej oddaje istotę rzeczy. Owe zasoby są wszak dostępne i widoczne, tyl-ko trzeba wiedzieć, jak do nich dotrzeć. Są po prostu głębiej schowane.

Natomiast określenia „Invisible Web” użył po raz pierwszy dr Jill Ellsworth w 1994 r. Określił w ten sposób zasoby nieindeksowa-ne przez globalne wyszukiwarki.

Page 3: Internet Niewidzialne Zasoby 1

NA CD NEWSY Z OKŁADKI FIRMA MAGAZYN PROGRAMY WARSZTAT

poradnik

INTERNET.sierpień.200562

Potężna baza artykułów (http://www.findarticles.com)

Library Spot (http://www.libraryspot.com) – imponująca kolekcja przydatnych odsyłaczy

ba się zarejestrować i dopiero po zalogowaniu można z nich korzystać. Ta część również bę-dzie niewidoczna dla wyszukiwarek.

Wśród stron indeksowanych przez wyszu-kiwarki znajdą się też strony amatorskie i nie-aktualizowane. Bazy danych głębokiego inter-netu są zazwyczaj pod kontrolą. Są sprawdzane przez specjalistów i uzupełniane. Takie, któ-rym można zaufać. Warto ich poszukać i do nich sięgać, gdy potrzebujesz materiałów na sprecyzowany temat.

Co oprócz baz danych znajdzie się w głę-bokiej strefie internetu, do której wyszuki-warkom trudno sięgnąć? Strony, których za-wartość się zmienia niemal co dnia, np. wia-domości, pogoda, ogłoszenia, notowania gieł-dowe, a także archiwa, słowniki, książki tele-foniczne itp.

Gdzie szukać?Przeszukaj w internecie, co kryją ośrodki aka-demickie, biblioteki, archiwa, stowarzyszenia naukowe. Tutaj niestety lepiej przedstawiają się ośrodki zagraniczne niż polskie. Stworze-

nie takich baz to praca żmudna, mało efektow-na, niewdzięczna, choć niezmiernie przydat-na, bo z tej pracy każdego dnia korzystają ty-siące osób. I może się okazać, że aby dotrzeć do owej głębokiej warstwy internetu, i tak naj-pierw musisz użyć konwencjonalnej wyszuki-warki, aby w ogóle owe bazy danych znaleźć. Nie wszystkie zasoby ukryte w bazach danych są udostępniane bezpłatnie.

Katalog stron głębokiego internetu i możli-wości przeszukiwania go znajdziesz na stronie CompletePlanet (http://www.completeplanet.com). Ze-brano tam ponad 70 tys. odnośników. Katalog ułożony jest tematycznie. Możesz od razu wy-brać dziedzinę, która cię interesuje.

Dobierz wyszukiwarkęInnym sposobem, by dotrzeć do tego, co głę-biej, jest wybór wyszukiwarki – czy to specja-

Page 4: Internet Niewidzialne Zasoby 1

WARSZTAT NA CDNEWSYZ OKŁADKIFIRMAMAGAZYNPROGRAMY

poradnik

INTERNET.sierpień.2005 63

Zasoby głębokiego internetu http://www.freepint.com/gary/direct.htm – strona Gary’ego Price’a i jego imponująca kolekcja http://www.libraryspot.com – odnośniki do ponad 2500 bibliotek na świecie http://www.thebighub.com – odnośniki do baz danych w ponad 300 kategoriach http://infomine.ucr.edu – wyszukiwarka dla studentów i nauczycieli http://www.infoplease.com – wyszukiwanie w kilkunastu kategoriach http://oaister.umdl.umich.edu/o/oaister – OAIster to dzieło The Digital Library Production Service Uniwersytetu Michigan. Skatalogowali ponad pięć milionów zasobów z ponad 450 instytucji http://lii.org – Librarians’ Index to the Internet – przejrzane i wybrane źródła http://www.humbul.ac.uk/help/subjects.html – projekt Humbul dla studentów, nauczycieli i badaczy w UK http://deepwebresearch.blogspot.com – Marcus P. Zillman podaje mnóstwo odnośników dotyczących „Deep Web” http://www.invisible-web.net – The Invisible Web Directory – wskazuje, gdzie kryją się ciekawe bazy danych. Katalog powstał jako dopełnienie książki o głębokich zasobach internetu, zatytułowanej „The Invisible Web”, a napisanej przez Chrisa Shermana i Gary’ego Price’a http://www.findarticles.com – baza ponad 5 milionów artykułów http://magportal.com – artykuły z ponad 200 gazet http://highwire.stanford.edu – archiwum tekstów naukowych http://bubl.ac.uk – katalog zasobów internetowych przydatny dla studentów i badaczy

Nie tylko Google...Strony, na których znajdują się łącza do różnych wyszukiwarek: Beaucoup – http://www.beaucoup.com – łącza do ponad 2500 baz danych i katalogów SearchBug – http://www.searchbug.com – ponad 500 wyszukiwarek w 15 kategoriach Freeality Internet Search – http://www.freeality.com – przewodnik po wyszukiwarkach Search Engine Guide – http://www.searchengineguide.com – ponad 1000 wyszukiwarek w 25 kategoriach

Informacje o wyszukiwarkach: http://www.pandia.com http://searchenginewatch.com http://www.searchengineguide.com http://www.searchengines.pl

listycznej, czy np. regionalnej. To, czego kon-wencjonalna wyszukiwarka nie znajdzie (albo nie pokaże w pierwszej kolejności), może od-naleźć od razu odpowiednia wyszukiwarka specjalistyczna.

Wyszukiwarką, która przeszukuje głęboką sieć, jest ProFusion (http://www.profusion.com). Zo-stała utworzona w 1995 roku na Uniwersyte-cie Kansas. Wyszukiwarka Turbo10 (http://turbo- 10.com) również chwali się, że potrafi zaglądać

do głębokich warstw internetu.Ponad 20 milionów zindeksowanych stron

ma wyszukiwarka na stronie http://www.searche-du.com. Na stronie odnośnik m.in. do słowni-ków http://www.yourdictionary.com – słowniki w po-nad 280 językach.

Wyszukiwarkę artykułów dotyczących in-formatyki znajdziesz np. na stronie http://search.internet.com, a cenioną wyszukiwarkę stron i tek-stów naukowych, która ma zindeksowanych ponad 200 milionów odnośników, na stronie http://www.scirus.com.

Jeśli szukasz pliku w formacie PDF, wy-korzystaj wyszukiwarkę na stronie http://se-archpdf.adobe.com.

Czasem lepiej odnaleźć regionalną wyszu-kiwarkę danego kraju i za jej pomocą szukać informacji. Łącza do wyszukiwarek z różnych krajów świata znajdziesz na stronie http://www.searchenginecolossus.com.

Rezygnować z Google?Oczywiście, że nie. Wyszukiwarki takie jak Google są bardzo dobre. Mają miliony zin-deksowanych stron. Ale która z tych stron będzie rzeczywiście wartościowa dla cie-bie? Otworzysz po kolei tysiąc lub więcej stron? Jeśli potrzebna ci krótka informacja na jakiś temat, to pewnie wystarczy. A jeśli nie, to warto poszukać głębiej, by mieć pod ręką inne źródła informacji, przede wszyst-kim wtedy, gdy szukasz szczegółowej in-formacji, czy to związanej z pracą, szkołą, czy też z hobby.

Czy określenia „głęboki”, „niewidoczny” internet mają jeszcze sens? Wszak i wyszu-kiwarki są coraz sprytniejsze, i ludzie po-trafią efektywniej korzystać z internetu.Wielu z nich intuicyjnie korzysta z owych baz danych głębokiego internetu i pewnie do głowy im nie przyjdzie, że korzystają z czegoś „ukrytego”. A i głęboki internet coraz częściej wypływa na powierzchnię za sprawą ulepszanych wyszukiwarek global-nych. Czy zostanie całkowicie odsłonięty? Czy może wtedy przyjdzie czas na odsła-nianie jeszcze głębszego internetu? Ile lalek w tej Matrioszce?

Projekt Humbul (http://www.humbul.ac.uk)