Internet Niewidzialne Zasoby 1
Click here to load reader
Transcript of Internet Niewidzialne Zasoby 1
NA CD NEWSY Z OKŁADKI FIRMA MAGAZYN PROGRAMY WARSZTAT
poradnik
INTERNET.sierpień.200560
Kiedyś moja siostra szukała dosyć dziw-nie brzmiących, jak dla zwykłego śmier-telnika, rzeczy z dziedziny mikrobiolo-
gii. Otworzyła stronę wyszukiwarki, wpisała słowa, które powinny się znaleźć w dokumen-tach. Wyszukiwarka nic nie znalazła. Nawet linki sponsorowane były ubogie i zupełnie nie na temat. Trzeba było zmienić taktykę po-szukiwania, by dostać się do zasobów inter-netu położonych nieco głębiej, niedostępnych dla wyszukiwarek, ale jak najbardziej dostęp-nych dla ludzi. Trzeba było tylko je znaleźć. I udało się.
Kop głębiej!Google to nie wszystkoWyszukiwarki globalne, konwencjonalne, czyli po prostu takie jak Google, znajdują wszystko. Taka panuje opinia. I rzeczywiście znajdują coraz więcej. Z jednej strony użyt-kownik gubi się w morzu wyników, z drugiej – szczególnie gdy wpisze specjalistyczne hasło – wyszukiwarka nic nie znajduje. Czy to oznacza, że tego nie ma w internecie? Prawdopodobnie jest, tylko dobrze schowane.
Dorota Szumilas
CompletePlanet (http://www.completeplanet.com) – w polu tekstowym „Find databases relevant to:” wpisz słowa, które powinny się znaleźć w szukanym dokumencie
Strona Bright Planet (http://www.brightplanet.com)
Mroki internetuZasoby internetu, które są trudno dostępne dla konwencjonalnych wyszukiwarek, zwykło się określać „Invisible Net”, „Invisible Web” (nie-widoczna sieć) lub „Deep Web” (głęboka sieć). Ostatnie określenie jest wymyślone i promo-wane przez Bright Planet. Specjaliści z tej fir-
WARSZTAT NA CDNEWSYZ OKŁADKIFIRMAMAGAZYNPROGRAMY
poradnik
INTERNET.sierpień.2005 61
Bright Planet i Copernic AgentBright Planet (http://www.brightplanet.com) – firma, która zajmuje się zagadnieniem „DeepWeb”, szacuje, że zasoby głębokiego internetu są 500 razy większe od tego widocznego z poziomu konwencjonalnych wyszukiwarek. Firma oferuje narzędzie do przeszukiwania zasobów głębokiego internetu – Deep Query Manager (DQM).
Program Copernic Agent (wersja płatna), do pobrania ze strony http://www.copernic.com, również oferuje przeszukiwanie zasobów schowanej części internetu. Natomiast za pomocą wersji darmowej można przeszukać np. bazę danych użytkowników ICQ – to też należy do tzw. głębokiego internetu.
Kop głębiej!Google to nie wszystko
Możliwości wyszukiwania ProFusion (http://www.profusion.com)
Wyszukiwanie przez SearchEdu.com (http://www.searchedu.com)
Wyszukiwarka naukowa Scirus (http://www.scirus.com)
Wyszukiwarka Turbo10 (http://turbo10.com)
Co to jest „Deep Web”?Określenia typu głęboka sieć, głęboki czy też niewidzialny internet brzmią być może tajem-niczo, ale żadnej tajemnicy nie kryją. I praw-dopodobnie nieraz już z owego głębokiego in-ternetu korzystałeś. Bardzo prosty przykład: gdy chcesz znaleźć pociąg z Piły do Suwałk, co wpisujesz do wyszukiwarki? Nie piszesz słów: Piła, Suwałki, pociąg, a od razu szu-kasz rozkładu jazdy PKP, czyli strony PKP, bo należy przypuszczać, że stamtąd będzie dostęp do rozkładu jazdy pociągów. Intuicyj-nie wiesz, co robić. I oczywiście taki rozkład znajduje się na stronie PKP. Żeby znaleźć po-łączenie Piła – Suwałki, musisz w odpowied-nie pola wpisać dane i kliknąć przycisk Szu-kanie połączeń. Po chwili zostaną wyświetlo-ne szukane połączenia.
Inny przykład. Chcesz stworzyć drzewo genealogiczne swojej rodziny. Wyszukiwanie po nazwisku w wyszukiwarce konwencjonal-nej może okazać się bezowocne. Lepiej zacząć od baz danych serwisów genealogicznych, re-
jestrów pasażerów statków z emigrantami itd. Tego konwencjonalna wyszukiwarka nie znaj-dzie. Takie informacje są ukryte głębiej.
Bazy danychZasoby głębokiego internetu to głównie bazy danych, z których możesz skorzystać, jeśli wiesz, gdzie one się znajdują. Wyszukiwarki pomijają wiadomości w nich zawarte, ponie-waż do takich zasobów można się dostać do-piero po wpisaniu konkretnego zapytania.
Na pewno wiesz, jak wygląda indeksowa-nie adresów stron przez wyszukiwarki. Wy-obraź sobie, że robot wchodzi na stronę, na której znajduje się baza danych, nie ma na-tomiast odnośników. Robot zapamięta adres główny, ale nie poinformuje, że na tej stronie, którą właśnie odwiedził, jest mnóstwo przy-datnych informacji. Tam jest cenna baza da-nych, tylko robot jej przecież nie używa, trze-ba bowiem w odpowiednich polach wpisać to, czego się szuka, by uzyskać informacje. Cza-sem, by skorzystać z pewnych zasobów, trze-
my twierdzą, że najlepiej oddaje istotę rzeczy. Owe zasoby są wszak dostępne i widoczne, tyl-ko trzeba wiedzieć, jak do nich dotrzeć. Są po prostu głębiej schowane.
Natomiast określenia „Invisible Web” użył po raz pierwszy dr Jill Ellsworth w 1994 r. Określił w ten sposób zasoby nieindeksowa-ne przez globalne wyszukiwarki.
NA CD NEWSY Z OKŁADKI FIRMA MAGAZYN PROGRAMY WARSZTAT
poradnik
INTERNET.sierpień.200562
Potężna baza artykułów (http://www.findarticles.com)
Library Spot (http://www.libraryspot.com) – imponująca kolekcja przydatnych odsyłaczy
ba się zarejestrować i dopiero po zalogowaniu można z nich korzystać. Ta część również bę-dzie niewidoczna dla wyszukiwarek.
Wśród stron indeksowanych przez wyszu-kiwarki znajdą się też strony amatorskie i nie-aktualizowane. Bazy danych głębokiego inter-netu są zazwyczaj pod kontrolą. Są sprawdzane przez specjalistów i uzupełniane. Takie, któ-rym można zaufać. Warto ich poszukać i do nich sięgać, gdy potrzebujesz materiałów na sprecyzowany temat.
Co oprócz baz danych znajdzie się w głę-bokiej strefie internetu, do której wyszuki-warkom trudno sięgnąć? Strony, których za-wartość się zmienia niemal co dnia, np. wia-domości, pogoda, ogłoszenia, notowania gieł-dowe, a także archiwa, słowniki, książki tele-foniczne itp.
Gdzie szukać?Przeszukaj w internecie, co kryją ośrodki aka-demickie, biblioteki, archiwa, stowarzyszenia naukowe. Tutaj niestety lepiej przedstawiają się ośrodki zagraniczne niż polskie. Stworze-
nie takich baz to praca żmudna, mało efektow-na, niewdzięczna, choć niezmiernie przydat-na, bo z tej pracy każdego dnia korzystają ty-siące osób. I może się okazać, że aby dotrzeć do owej głębokiej warstwy internetu, i tak naj-pierw musisz użyć konwencjonalnej wyszuki-warki, aby w ogóle owe bazy danych znaleźć. Nie wszystkie zasoby ukryte w bazach danych są udostępniane bezpłatnie.
Katalog stron głębokiego internetu i możli-wości przeszukiwania go znajdziesz na stronie CompletePlanet (http://www.completeplanet.com). Ze-brano tam ponad 70 tys. odnośników. Katalog ułożony jest tematycznie. Możesz od razu wy-brać dziedzinę, która cię interesuje.
Dobierz wyszukiwarkęInnym sposobem, by dotrzeć do tego, co głę-biej, jest wybór wyszukiwarki – czy to specja-
WARSZTAT NA CDNEWSYZ OKŁADKIFIRMAMAGAZYNPROGRAMY
poradnik
INTERNET.sierpień.2005 63
Zasoby głębokiego internetu http://www.freepint.com/gary/direct.htm – strona Gary’ego Price’a i jego imponująca kolekcja http://www.libraryspot.com – odnośniki do ponad 2500 bibliotek na świecie http://www.thebighub.com – odnośniki do baz danych w ponad 300 kategoriach http://infomine.ucr.edu – wyszukiwarka dla studentów i nauczycieli http://www.infoplease.com – wyszukiwanie w kilkunastu kategoriach http://oaister.umdl.umich.edu/o/oaister – OAIster to dzieło The Digital Library Production Service Uniwersytetu Michigan. Skatalogowali ponad pięć milionów zasobów z ponad 450 instytucji http://lii.org – Librarians’ Index to the Internet – przejrzane i wybrane źródła http://www.humbul.ac.uk/help/subjects.html – projekt Humbul dla studentów, nauczycieli i badaczy w UK http://deepwebresearch.blogspot.com – Marcus P. Zillman podaje mnóstwo odnośników dotyczących „Deep Web” http://www.invisible-web.net – The Invisible Web Directory – wskazuje, gdzie kryją się ciekawe bazy danych. Katalog powstał jako dopełnienie książki o głębokich zasobach internetu, zatytułowanej „The Invisible Web”, a napisanej przez Chrisa Shermana i Gary’ego Price’a http://www.findarticles.com – baza ponad 5 milionów artykułów http://magportal.com – artykuły z ponad 200 gazet http://highwire.stanford.edu – archiwum tekstów naukowych http://bubl.ac.uk – katalog zasobów internetowych przydatny dla studentów i badaczy
Nie tylko Google...Strony, na których znajdują się łącza do różnych wyszukiwarek: Beaucoup – http://www.beaucoup.com – łącza do ponad 2500 baz danych i katalogów SearchBug – http://www.searchbug.com – ponad 500 wyszukiwarek w 15 kategoriach Freeality Internet Search – http://www.freeality.com – przewodnik po wyszukiwarkach Search Engine Guide – http://www.searchengineguide.com – ponad 1000 wyszukiwarek w 25 kategoriach
Informacje o wyszukiwarkach: http://www.pandia.com http://searchenginewatch.com http://www.searchengineguide.com http://www.searchengines.pl
listycznej, czy np. regionalnej. To, czego kon-wencjonalna wyszukiwarka nie znajdzie (albo nie pokaże w pierwszej kolejności), może od-naleźć od razu odpowiednia wyszukiwarka specjalistyczna.
Wyszukiwarką, która przeszukuje głęboką sieć, jest ProFusion (http://www.profusion.com). Zo-stała utworzona w 1995 roku na Uniwersyte-cie Kansas. Wyszukiwarka Turbo10 (http://turbo- 10.com) również chwali się, że potrafi zaglądać
do głębokich warstw internetu.Ponad 20 milionów zindeksowanych stron
ma wyszukiwarka na stronie http://www.searche-du.com. Na stronie odnośnik m.in. do słowni-ków http://www.yourdictionary.com – słowniki w po-nad 280 językach.
Wyszukiwarkę artykułów dotyczących in-formatyki znajdziesz np. na stronie http://search.internet.com, a cenioną wyszukiwarkę stron i tek-stów naukowych, która ma zindeksowanych ponad 200 milionów odnośników, na stronie http://www.scirus.com.
Jeśli szukasz pliku w formacie PDF, wy-korzystaj wyszukiwarkę na stronie http://se-archpdf.adobe.com.
Czasem lepiej odnaleźć regionalną wyszu-kiwarkę danego kraju i za jej pomocą szukać informacji. Łącza do wyszukiwarek z różnych krajów świata znajdziesz na stronie http://www.searchenginecolossus.com.
Rezygnować z Google?Oczywiście, że nie. Wyszukiwarki takie jak Google są bardzo dobre. Mają miliony zin-deksowanych stron. Ale która z tych stron będzie rzeczywiście wartościowa dla cie-bie? Otworzysz po kolei tysiąc lub więcej stron? Jeśli potrzebna ci krótka informacja na jakiś temat, to pewnie wystarczy. A jeśli nie, to warto poszukać głębiej, by mieć pod ręką inne źródła informacji, przede wszyst-kim wtedy, gdy szukasz szczegółowej in-formacji, czy to związanej z pracą, szkołą, czy też z hobby.
Czy określenia „głęboki”, „niewidoczny” internet mają jeszcze sens? Wszak i wyszu-kiwarki są coraz sprytniejsze, i ludzie po-trafią efektywniej korzystać z internetu.Wielu z nich intuicyjnie korzysta z owych baz danych głębokiego internetu i pewnie do głowy im nie przyjdzie, że korzystają z czegoś „ukrytego”. A i głęboki internet coraz częściej wypływa na powierzchnię za sprawą ulepszanych wyszukiwarek global-nych. Czy zostanie całkowicie odsłonięty? Czy może wtedy przyjdzie czas na odsła-nianie jeszcze głębszego internetu? Ile lalek w tej Matrioszce?
Projekt Humbul (http://www.humbul.ac.uk)