Badanie efektywnosci wyszukiwarek

Post on 24-Jun-2015

676 views 0 download

Transcript of Badanie efektywnosci wyszukiwarek

GOOGLE SCHOLAR GOOGLE BOOKS

COMPLETEPLANET

BADANIE EFEKTYWNOŚCI WYSZUKIWAREK

CEL BADANIA

Celem badania jest sprawdzenie efektywności wyszukiwarek poprzez kwerendy wyszukiwawcze dotyczące Web 2.0.

Kwerendy: kanał RSS, video blog, Wikipedia

Badaniu poddano wyszukiwarki specjalistyczne, które pozwalają odnaleźć zasoby „ukrytego Internetu”

OPIS BADANIA

O ile było to możliwe (nie wszędzie uzyskano oczekiwaną ilość wyników) przeanalizowano pierwsze 30 wyników wyszukiwania mających odniesienie do zagadnienia Web 2.0.

Kryteria podziału stron na kategorie: Adekwatne - wyniki wyszukiwania odpowiadają naszym

potrzebom (np. definicje, przykłady blogów, strony pośrednio nawiązujące do tematu)

Nieadekwatne - wyniki wyszukiwania nie odpowiadające naszym potrzebom (np. strony niezwiązane z tematyką, strony, których nie można otworzyć)

Oferty reklamowe

GOOGLE SCHOLAR

1. KANAŁ RSS

WYNIK WYSZUKIWANIA:

30 STRON: 10 ADEKWATNYCH , 20 NIEADEKWATNYCH, 0 REKLAM

GOOGLE SCHOLAR

2. VIDEOBLOG

WYNIK WYSZUKIWANIA:

30 STRON: 8 ADEKWATNYCH, 21 NIEADEKWATNYCH, 1 REKLAMA

GOOGLE SCHOLAR

3. WIKIPEDIA

WYNIK WYSZUKIWANIA:

30 STRON: 19 ADEKWATNYCH , 2 NIEADEKWATNE , 9 REKLAM

COMPLETE PLANET

1. RSS

WYNIK WYSZUKIWANIA:

30 STRON: 1 ADEKWATNA, 29 NIEADEKWATNYCH, 0 REKLAM

COMPLETE PLANET

2. VIDEO BLOG

WYNIK WYSZUKIWANIA:

30 STRON: 5 ADEKWATNYCH, 25 NIEADEKWATNYCH, 0 REKLAM

17%

83%

0%Video blog

Adekwatne

Nieadekwatne

Reklama

COMPLETE PLANET

3. WIKIPEDIA

WYNIK WYSZUKIWANIA

24 STRONY: 0 ADEKWATNYCH, 24 NIEADEKWATNE, 0 REKLAM

GOOGLE BOOKS

1. KANAŁ RSS

WYNIK WYSZUKIWANIA:

30 STRON: 2 ADEKWATNE , 24 NIEADEKWATNE, 4 WYGASŁE

STRONY/REKLAMY

GOOGLE BOOKS

2. VIDEOBLOG

WYNIK WYSZUKIWANIA:

30 STRON: 23 ADEKWATNE, 5 NIEADEKWATNYCH, 2

WYGASŁE STRONY/REKLAMY

GOOGLE BOOKS

3. WIKIPEDIA

WYNIK WYSZUKIWANIA:

30 STRON: 25 ADEKWATNYCH , 4 NIEADEKWATNE , 1

WYGASŁA STRONA/REKLAMA

CO TO JEST UKRYTY INTERNET?

PODZIAŁ ZASOBÓW W SIECI

WSKAZÓWKI

PRZYKŁADY WYSZUKIWAREK DEEP WEB

CIEKAWE INFORMACJE O DEEP WEB

TERMIN „GŁĘBOKI INTERNET” POWSTAŁ W 2001 ROKU

Badania przeprowadzone przez amerykańską firmę internetową BrightPlanet (to właśnie tam zaproponowano nazwę „głęboki Internet„) pozwoliły przynajmniej po części oszacować z jakimi liczbami mamy do czynienia:

Liczbę zasobów określono jako 400-550 razy przekraczającą te dostępne przez powierzchniowe WWW,

Zbadana pojemność danych wyniosła 7,500 terabajtów przy jedynie 19 terabajtach tradycyjnego Internetu,

Głęboki Internet ma zawierać 550 miliardów niepowtarzalnych dokumentów w porównaniu do 1 miliarda Internetu powierzchniowego,

CIEKAWE INFORMACJE O DEEP WEB

Ponad 200,000 działających w głębokim Internecie stron,

Sześćdziesiąt z pośród największych stron w głębokim Internecie zawiera ponad 750 terabajtów informacji, co przekracza zawartość całego Internetu powierzchniowego czterdzieści razy,

Na stronach głębokiego Internetu odnotowuje się o 50% większy ruch, niż na powierzchni oraz są one częściej linkowane,

Poszczególne strony głębokiego Internetu poświęcone są węższej liczbie zagadnień, jednak są o wiele bardziej szczegółowe,

PODSUMOWANIE

Podczas używania wyszukiwarki Google Scholar zaobserwowaliśmy (zapytanie – kanał RSS) dużo powtarzających się wyników w postaci strony wiedzaiedukacja.eu

W przypadku zapytania video blog w wyszukiwarce Google Scholar postarzała się strona computer.org

Wyszukiwarka Complete Planet przy zapytaniu RSS nie wyświetlała wielu stron oraz nie działała angielska fraza Canal RSS. Wyszukiwarka szukała jedyne słowa RSS.

Wyszukiwarka Complete Planet zupełnie nie sprawdziła się podczas tego testu.