Informatyk Bydgoszcz

MONITOROWANIE


Informatyk Bydgoszcz – Monitorowanie serwerów i sieci

Monitorowanie jest procesem stałym i w jego skład wchodzi sprawdzanie parametrów serwera jak i jego dostępność z zewnątrz. W szczegółach wygląda to tak, że monitorowane są:

 • dostępna przestrzeń dyskowa na wybranych partycjach
 • dostępna i zajęta pamięć podręczna RAM
 • obecność zadeklarowanego tekstu na danej podstronie (monitoring Deface)
 • stan kopii zapasowych
 • czas wygasania zaimplementowanych certyfikatów SSL
 • stan dysków i macierzy RAID
 • obciążenie CPU
 • czas wczytywania się strony głównej oraz wybranych podstron
 • liczba uruchomionych procesów i ich stan
 • obecność IPv4 serwera na listach RBL (monitoring anty spam)
 • logi poszczególnych aplikacji oraz wyczulenie na konkretne błędy (np. http 500)
 • parametry systemu SMART (stan dysku twardego)
 • stan serwera bazodanowego (MySQL/MariaDB, PostgreSQL)
 • czasy i wartości odpowiedzi serwerów DNS dla domen obsługiwanych przez serwer
 • liczba zalogowanych użytkowników
 • czas oczekiwania na odpowiedź ping
 • liczba działających procesów
 • synchronizacja czasu serwera NTP
 • czas odpowiedzi serwera www HTTP / HTTPS
 • status (200/301) odpowiedzi serwera www HTTP / HTTPS
 • dostępność aktualizacji systemu i stan repozytoriów
 • status odpowiedzi serwera pocztowego SMTP, POP3, IMAP
 • stan macierzy RAID (mdadm, Adaptec, LSI)
 • dostępność zarządzania IPMI / KVM
 • wpisanie IP serwera na listach RBL

Należy zaznaczyć, że monitorowany może być praktycznie każdy dowolny parametr serwera. Zależy to wyłącznie od potrzeb i charakteru pracy usług. Naszym systemem monitorowania jest Nagios. Każda zmiana stanu któregokolwiek ze sprawdzanych parametrów jest natychmiast zgłaszana poprzez sms do dyżurującego administratora.

W zależności od charakteru pracy serwera i uruchomionych usług, możemy monitorować każdy inny parametr serwera czy aplikacji. Powyższe punkty monitorowania są zapewniane jako standardowe usługi.
Dzięki rozbudowanemu monitorowaniu jesteśmy w stanie reagować na symptomy mogące prowadzić do awarii czy przestojów, a co za tym idzie – zapobiegamy problemom zanim one powstaną.