Informatyk Bydgoszcz

MONITOROWANIE


Informatyk Bydgoszcz – Monitorowanie serwerów i sieci

Monitorowanie jest procesem stałym i w jego skład wchodzi sprawdzanie parametrów serwera jak i jego dostępność z zewnątrz. W szczegółach wygląda to tak, że monitorowane są:

  • dostępna przestrzeń dyskowa na wybranych partycjach
  • dostępna i zajęta pamięć podręczna RAM
  • obecność zadeklarowanego tekstu na danej podstronie (monitoring Deface)
  • stan kopii zapasowych
  • czas wygasania zaimplementowanych certyfikatów SSL
  • stan dysków i macierzy RAID
  • obciążenie CPU
  • czas wczytywania się strony głównej oraz wybranych podstron
  • liczba uruchomionych procesów i ich stan
  • obecność IPv4 serwera na listach RBL (monitoring anty spam)
  • logi poszczególnych aplikacji oraz wyczulenie na konkretne błędy (np. http 500)
  • parametry systemu SMART (stan dysku twardego)
  • stan serwera bazodanowego (MySQL/MariaDB, PostgreSQL)
  • czasy i wartości odpowiedzi serwerów DNS dla domen obsługiwanych przez serwer
  • liczba zalogowanych użytkowników
  • czas oczekiwania na odpowiedź ping
  • liczba działających procesów
  • synchronizacja czasu serwera NTP
  • czas odpowiedzi serwera www HTTP / HTTPS
  • status (200/301) odpowiedzi serwera www HTTP / HTTPS
  • dostępność aktualizacji systemu i stan repozytoriów
  • status odpowiedzi serwera pocztowego SMTP, POP3, IMAP
  • stan macierzy RAID (mdadm, Adaptec, LSI)
  • dostępność zarządzania IPMI / KVM
  • wpisanie IP serwera na listach RBL

Należy zaznaczyć, że monitorowany może być praktycznie każdy dowolny parametr serwera. Zależy to wyłącznie od potrzeb i charakteru pracy usług. Naszym systemem monitorowania jest Nagios. Każda zmiana stanu któregokolwiek ze sprawdzanych parametrów jest natychmiast zgłaszana poprzez sms do dyżurującego administratora.

W zależności od charakteru pracy serwera i uruchomionych usług, możemy monitorować każdy inny parametr serwera czy aplikacji. Powyższe punkty monitorowania są zapewniane jako standardowe usługi.
Dzięki rozbudowanemu monitorowaniu jesteśmy w stanie reagować na symptomy mogące prowadzić do awarii czy przestojów, a co za tym idzie – zapobiegamy problemom zanim one powstaną.