Monitoring sieci

Post on 31-Jul-2015

127 views 0 download

Transcript of Monitoring sieci

Monitoring sieciKamil Grabowski

e-mail: k.grabowski@plix.pl

PLIX Tech Talks 09.06.2010, Warszawa

Dlaczego *KONIECZNIE*

trzeba monitorować swoją sieć?

PLIX Tech Talks 09.06.2010, Warszawa

Istnieje kilka powodów:• Awarie• Anomalie• Ataki• Rozwój• Testy• Rozliczania z klientami (SLA)

PLIX Tech Talks 09.06.2010, Warszawa

Dwie szkoły monitoringu• Aktywny monitoring

Okresowo (np. co minutę) odpytujemy nasze urządzenia w celu pobrania interesujących nas informacji.

• Pasywny monitoring Urządzenie samo wysyła nam informacje o wszystkich interesujących nas informacjach - nie musimy tego robić sami.

PLIX Tech Talks 09.06.2010, Warszawa

Aktywny monitoring• Zalety

• Zazwyczaj dużo prostszy niż aktywny• Wykryjemy poważne awarie

• Wady• Duży narzut• Wielokrotnie pytamy o to samo• Problem flappowania

PLIX Tech Talks 09.06.2010, Warszawa

Pasywny monitoring• Zalety

• Wysoka wydajność• Brak problemu „przegapienia” zdarzenia

• Wady• Nie dowiemy się o poważnej awarii

urządzenia takiej jak brak prądu itp.

PLIX Tech Talks 09.06.2010, Warszawa

... od czego więc zacząć?

PLIX Tech Talks 09.06.2010, Warszawa

Statystyki ruchu• Ile ruchu generuje Twoja sieć?• Ile ruchu generują Twoi klienci?• Jak ten ruch rozkłada się w ciągu dnia?• Piki?• Brak ruchu na porcie?• Wysycenie łącza?• 95-ty percentyl

PLIX Tech Talks 09.06.2010, Warszawa

W jaki sposób je pozyskać?• Aktywnie (snmp)

• wiele gotowych narzędzi• prosta instalacja• uniwersalność

• Pasywnie (sFlow, netFlow)• dużo większa szczegółowość• ogromna ilość danych

PLIX Tech Talks 09.06.2010, Warszawa

Jak działają countery?

PLIX Tech Talks 09.06.2010, Warszawa

1 godzina60 kilometrów

Jak działają countery?

PLIX Tech Talks 09.06.2010, Warszawa

3 godziny180 kilometrów

Jak działają countery?

PLIX Tech Talks 09.06.2010, Warszawa

3 godziny180 kilometrów

180 km - 60 km = 120 km

Jak działają countery?

PLIX Tech Talks 09.06.2010, Warszawa

3 godziny180 kilometrów3 godz. - 1 godz. = 2 godz.

Jak działają countery?

PLIX Tech Talks 09.06.2010, Warszawa

3 godziny180 kilometrów

180 km - 60 km 120 km -------------------- = ---------3 godz. - 1 godz. 2 godz.

Jak działają countery?

PLIX Tech Talks 09.06.2010, Warszawa

3 godziny180 kilometrów

180 km - 60 km 120 km -------------------- = --------- = 60 km/h3 godz. - 1 godz. 2 godz.

Świadomość ogromnej ilości danych• 10 przełączników po 48 portów każdy• statystyki zbierane co minutę• interesują nas dane z roku (365 dni)

... policzmy ile to jest danych!

PLIX Tech Talks 09.06.2010, Warszawa

Świadomość ogromnej ilości danych

10 * 48 = 480 próbek co minutę

PLIX Tech Talks 09.06.2010, Warszawa

Świadomość ogromnej ilości danych

10 * 48 = 480 próbek co minutę480 * 60 = 28 800 próbek na godzinę

PLIX Tech Talks 09.06.2010, Warszawa

Świadomość ogromnej ilości danych

10 * 48 = 480 próbek co minutę480 * 60 = 28 800 próbek na godzinę28 800 * 24 = 691 200 próbek dziennie

PLIX Tech Talks 09.06.2010, Warszawa

Świadomość ogromnej ilości danych

10 * 48 = 480 próbek co minutę480 * 60 = 28 800 próbek na godzinę28 800 * 24 = 691 200 próbek dziennie691 200 * 31 = 2 142 7200 próbek miesięcznie

PLIX Tech Talks 09.06.2010, Warszawa

Świadomość ogromnej ilości danych

10 * 48 = 480 próbek co minutę480 * 60 = 28 800 próbek na godzinę28 800 * 24 = 691 200 próbek dziennie691 200 * 31 = 2 142 7200 próbek miesięcznie28 800 * 365 = 252 288 000 próbek rocznie

PLIX Tech Talks 09.06.2010, Warszawa

Jak przechowywać tak dużą ilość danych?

... np. w bazie danych (MySQL, PostgreSQL)• przy dużej ilości danych operacje

insert/update/delete stanowią problem• przeliczanie (counter -> wartość)• wizualizacja danych (wykres)

PLIX Tech Talks 09.06.2010, Warszawa

Panaceum -> Round Robin Database• Wydajna i prosta baza danych• Wbudowana obsługa danych typu Counter• Funkcje agregujące (MIN, MAX, AVG)• Odporność na nieprawidłowe dane• Archiwa i konsolidacja danych• API do wszystkich popularnych języków• RrdGraph - rysowanie wykresów

PLIX Tech Talks 09.06.2010, Warszawa

RRD posiada też drobne wady• Brak replikacji• Przenośność (i386, amd64)• Zmiana struktury bazy danych• I/O hell (rrd daemon)• Skomplikowana obsługa (rrdgraph)

PLIX Tech Talks 09.06.2010, Warszawa

RRD Graph - przykładrrdtool graph example.png \DEF:obs=monitor.rrd:ifOutOctets:AVERAGE \DEF:pred=monitor.rrd:ifOutOctets:HWPREDICT \DEF:dev=monitor.rrd:ifOutOctets:DEVPREDICT \DEF:fail=monitor.rrd:ifOutOctets:FAILURES \TICK:fail#ffffa0:1.0:"Failures\: Average bits out" \CDEF:scaledobs=obs,8,* \CDEF:upper=pred,dev,2,*,+ \CDEF:lower=pred,dev,2,*,- \CDEF:scaledupper=upper,8,* \CDEF:scaledlower=lower,8,* \LINE2:scaledobs#0000ff:"Average bits out" \LINE1:scaledupper#ff0000:"Upper Confidence Bound: Average bits out" \LINE1:scaledlower#ff0000:"Lower Confidence Bound: Average bits out"

PLIX Tech Talks 09.06.2010, Warszawa

Gotowe narzędzia - Cacti

PLIX Tech Talks 09.06.2010, Warszawa

• Pobieranie z urządzeń counterów• Wizualizacja danych (wykresy statystyk)• Duże możliwości konfiguracyjne• Łatwa instalacja

http://www.cacti.net

Co dalej?

PLIX Tech Talks 09.06.2010, Warszawa

- legenda monitoringu

PLIX Tech Talks 09.06.2010, Warszawa

• Znane, sprawdzone i cenione narzędzie• Ogromne możliwości konfiguracyjne• Ogromna ilość pluginów • Społeczność użytkowników• Prosta instalacja• Prosty i przejrzysty interface www

- jak działa?

PLIX Tech Talks 09.06.2010, Warszawa

• Hosty oraz usługi• Pluginy, które zwracają status• Metody odpytywania

• Bezpośrednie zapytanie do usługi• SNMP• SSH• NRPE

- rodzaje notyfikacji

PLIX Tech Talks 09.06.2010, Warszawa

• Sygnał dźwiękowy w przeglądarce• Wysłanie wiadomości e-mail• Przy odpowiedniej konfiguracji wysłanie

wiadomości SMS• Wykonanie zdefiniowanej akcji np.

odpalenie wskazanego skryptu

Co warto monitorować na serwerze?

PLIX Tech Talks 09.06.2010, Warszawa

• Obciążenie: CPU, RAM, Load• Ruch in/out na interface’ach sieciowych• Zużycie dysków• Dostępność usług (ssh, bgpd, snmpd itp.)• Czy na serwerze jest prawidłowy czas?• Aktualizacje oprogramowania• Temperatura

Co warto monitorować na switchu?

PLIX Tech Talks 09.06.2010, Warszawa

• Obciążenie: CPU, RAM, Load• Stany interface’ów sieciowych (UP/DOWN)• Temperatura

Jak monitorować sesje BGP?

PLIX Tech Talks 09.06.2010, Warszawa

• Plugin do nagiosa: check_openbgpd lub

• NRPE Server + własny skrypt• cache’owanie

Wady naszego rozwiązania?

PLIX Tech Talks 09.06.2010, Warszawa

• Jest kilka wad takiego rozwiązania• nie zauważamy flappowania sesji• wydajność: okresowo musimy pytać

o wszystkie sesje BGP co przy dużej ilości sesji może powodować problemy.

Istnieje dużo dokładniejsze oraz wydajniejsze

rozwiązanie!

PLIX Tech Talks 09.06.2010, Warszawa

SNMP TRAPS

PLIX Tech Talks 09.06.2010, Warszawa

SNMP TRAPS - jak to działa?

PLIX Tech Talks 09.06.2010, Warszawa

Urządzenie

SNMP TRAPS - jak to działa?

PLIX Tech Talks 09.06.2010, Warszawa

Urządzenie

!Zdarzenie

SNMP TRAPS - jak to działa?

PLIX Tech Talks 09.06.2010, Warszawa

Urządzenie

!SNMP TRAP

SNMP tt

SNMP TRAPS - jak to działa?

PLIX Tech Talks 09.06.2010, Warszawa

Urządzenie

!SNMP TRAP

SNMP tt

DB

sql inse

rt

SNMP TRAPS - możliwości

PLIX Tech Talks 09.06.2010, Warszawa

• Passive nagios• Uruchomienie skryptu• Wyświetlanie listy trapów na stronie www

lub aplikacji desktopowej• Dokładne czasy zdarzeń - niezbędne

do generowania raportów oraz liczenia SLA• SNMP Traps jest wspierane przez wiele

urządzeń np. przełączniki oraz routery

SNMP TRAPS + OpenBGPd

PLIX Tech Talks 09.06.2010, Warszawa

• OpenBGPd zapisuje wszystkie zdarzenia w dzienniku np. /var/log/daemon

• swatch obserwuje dzienniki logów w poszukiwaniu nowych zdarzeń

• gdy OpenBGPd zapisze zdarzenie do pliku swatch wykona odpowiedni skrypt

• skrypt wygeneruje trapa i wyśle go do naszego serwera SNMP TT

Inne narzędzia warte uwagi

PLIX Tech Talks 09.06.2010, Warszawa

• monit• collectd• munin

collectd

Wskazówki dotyczące monitoringu

PLIX Tech Talks 09.06.2010, Warszawa

• warto umieć programować :)• najlepsze garnitury szyje się na miarę• staraj się pisać testy• automatyczny deploy• centralizacja, wspólne API

Zapraszam do zadawania pytań :)

PLIX Tech Talks 09.06.2010, Warszawa

Port w PLIX promocja dla uczestników Tech Talks

PLIX Tech Talks 09.06.2010, Warszawa

• Port 1GE• instalacja: 1 PLN• pierwsze 3 miesiące: 1 PLN/m-c

• możliwość zrezygnowania z usługi w trakcie pierwszego miesiąca

Dziękuję za uwagę :)

PLIX Tech Talks 09.06.2010, Warszawa

Kamil Grabowski kontakt: k.grabowski@plix.pl

http://blog.y3ti.pl