HiVe Prezentacja Na Seminarium 2008.05

39
BYŁ: HiVe

Transcript of HiVe Prezentacja Na Seminarium 2008.05

Page 1: HiVe Prezentacja Na Seminarium 2008.05

BYŁ: HiVe

Page 2: HiVe Prezentacja Na Seminarium 2008.05

JEST: Szuku-Szuku.pl

Page 3: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku.pl

• Szuku-Szuku co to jest?

Page 4: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku.pl

• Szuku-Szuku co to jest?

• Co planowałem zrobić...

Page 5: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku.pl

• Szuku-Szuku co to jest?

• Co planowałem zrobić...

• Co zostało zrobione...

Page 6: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku.pl

• Szuku-Szuku co to jest?

• Co planowałem zrobić...

• Co zostało zrobione...

• Zmiany niektórych założeń...

Page 7: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku.pl

• Szuku-Szuku co to jest?

• Co planowałem zrobić...

• Co zostało zrobione...

• Zmiany niektórych założeń...

• Szczegóły...

Page 8: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku.pl

• Szuku-Szuku co to jest?

• Co planowałem zrobić...

• Co zostało zrobione...

• Zmiany niektórych założeń...

• Szczegóły...

• Plany na przyszłość...

Page 9: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Co to jest?

• Oficjalnie:Projekt i wykonanie systemu do rozproszonego wyszukiwania na przykładzie danych osobowych

Page 10: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Co to jest?

• Oficjalnie:Projekt i wykonanie systemu do rozproszonego wyszukiwania na przykładzie danych osobowych

• Nieoficjalnie:Wyszukiwarka pomagająca znaleźć informacje o naszych znajomych, kontaktach w pracy

Page 11: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Co miało być?

• Wersja private beta

Page 12: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Co miało być?

• Wersja private beta

• Interfejs użytkownika

Page 13: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Co zrobiłem?

• Wersja private beta

Page 14: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Co zrobiłem?

• Wersja private beta

• Interfejs użytkownika

Page 15: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Co zrobiłem?

• Wersja private beta

• Interfejs użytkownika

• Algorytmy klastrujące wyniki

Page 16: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Co zrobiłem?

• Wersja private beta

• Interfejs użytkownika

• Algorytmy klastrujące wyniki

• Zaawansowany crawler

Page 17: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - XI.2007

Page 18: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - III.2008

Page 19: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - IV.2008

Page 20: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Private Beta

Page 21: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Interfejs

Page 22: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Interfejs

Page 23: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Interfejs

Page 24: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Interfejs

Page 25: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Interfejs

Page 26: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Private Beta

Page 27: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Zmiany

• Zaskakująco dobre możliwości klastrowania wyników

Page 28: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Zmiany

• Zaskakująco dobre możliwości klastrowania wyników

• Dobudowanie modułu crawlera

Page 29: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Zmiany

• Zaskakująco dobre możliwości klastrowania wyników

• Dobudowanie modułu crawlera

• Tworzenie własnej bazy danych na podstawie materiałów dostępnych w sieci

Page 30: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Infrastruktura

• Do crawlowania / przetwarzania danych potrzeba dużo mocy

Page 31: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Infrastruktura

• Do crawlowania / przetwarzania danych potrzeba dużo mocy

• Wirtualne serwery

Page 32: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Infrastruktura

• Do crawlowania / przetwarzania danych potrzeba dużo mocy

• Wirtualne serwery

• Amazon Web Services

Page 33: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Infrastruktura

• Do crawlowania / przetwarzania danych potrzeba dużo mocy

• Wirtualne serwery

• Amazon Web Services

• Linux Ubuntu Server Edition

Page 34: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Crawler

0

2250

4500

6750

9000

08:00 10:00 12:00 14:00 16:00 18:00 20:00 22:00 00:00 02:00 04:00 06:00 08:00 10:00 12:00

Crawl szkół z portalu nasza-klasa.pl

Pobranych stron na godzinę

Teraz:•Anonimowa sieć TOR•Sterowanie przez:•telnet•bazę danych

•Cachowanie wyników

W przyszłości:•Rozproszony•Dużo szybszy

Page 35: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Węzeł

Agenty

Silnik wyszukiwarki

Serwer HTTP

Przeglądarka

Zdarzenia

Web Crawler

Agenty Zewnętrzne

Page 36: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Plany

• Dokumentacja i stworzenie “właściwej pracy magisterskiej”

Page 37: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Plany

• Dokumentacja i stworzenie “właściwej pracy magisterskiej”

• Uruchomienie działającej “komercyjnej” wyszukiwarki na podstawie konceptów i algorytmów

Page 38: HiVe Prezentacja Na Seminarium 2008.05

Szuku-Szuku - Plany

• Dokumentacja i stworzenie “właściwej pracy magisterskiej”

• Uruchomienie działającej “komercyjnej” wyszukiwarki na podstawie konceptów i algorytmów

• Szukamy chętnych do pracy nad systemem :)