Długo zbieraliśmy informacje (i długo zbieraliśmy się też w sobie) do tego artykułu, bowiem temat jest bardzo… teoretyczny i filozoficzny. Nie zmienia to jednak faktu, iż jest równie ważny, zwłaszcza na tle zeszłotygodniowych problemów w home.pl oraz na Facebooku. Awaria to rzecz, która spędza sen z powiek wszelkich administratorów (zwłaszcza jeśli wystąpi w nocy 😉). Równie źle działa niestety na właścicieli stron internetowych, bowiem często wiąże się z problematycznym działaniem ich witryny. To z kolei wprost można przeliczyć na straty finansowe.
Najczęściej jest tak, że wszystko przestaje funkcjonować jak należy w najmniej odpowiednim i spodziewanym momencie. Czasami powód leży po naszej stronie, innym razem po stronie usługodawcy, a jeszcze niekiedy przyczyną są osoby trzecie albo zewnętrzne rzeczy, na które nie mamy bezpośrednio wpływu. Należy zatem nauczyć się cierpliwości, bo bez tego nie można nawet zaczynać mówić o awariach.
Awaria. Znowu?
Przedostatni tydzień października był nieco bolesny dla użytkowników sieci. Najpierw w poniedziałek 24 września spora część polskiego internetu stała się niedostępna przez awarię w home.pl. Oficjalnym komunikatem HOME.pl poinformowało, że doznało ataku DDoS, co spowodowało liczne problemy w dostępie do usług. Zatem zarówno strony, domeny jak i poczta były zupełnie niedostępne w godzinach porannych. Tutaj można wyraźnie zauważyć, iż przyczyna była zewnętrzna. Nie można było wcześniej zapobiec temu atakowi (przynajmniej teoretycznie). Każdy, kto w zeszły poniedziałek rwał włosy z głowy już zapewne wie co się stało i dlaczego. W wypadku jak u HOME.pl nie pozostało klientom nic ponad cierpliwe czekanie, aż administratorzy uporają się z problemem.
To, czego doznał Facebook w czwartek 27 września to nie awaria, a raczej “błąd”. Około 50 milionów (później nawet do 90 milionów) użytkowników zostało automatycznie wylogowanych. Miało to na celu zresetowanie tokenów sesji zagrożonych kont. Tokeny te bowiem od około roku wyciekały przez dziurę bezpieczeństwa w funkcji “Pokaż jako”. Na całe szczęście nie nastąpił wyciek haseł. Faktem jest jednak, iż od około roku każdy kto znał błąd mógł mieć wgląd w informacje prywatne, również te ukryte, a nawet w wiadomości. Jeśli również twoje konto zostało wylogowane rozpatrz przeanalizowanie swojego profilu. Czy ktoś może wykorzystać zdobyte od Ciebie informacje przeciwko Tobie?
W wypadku Facebooka awaria polegała na wycieku danych. Reakcja korporacji była jednak zaskakująco poprawna, choć nieco spóźniona. I choć w oficjalnym oświadczeniu dane logowania użytkowników nie zostały uzyskane przez atakujących, warto rozważyć zmianę hasła. Oto jak stworzyć doskonałe hasło i jak nim zarządzać.
Co robić, jak żyć
Skoro już wiadomo, że nie zawsze ma się wpływ na działanie (bądź nie) usług oraz nauczyliśmy się cierpliwości, to co dalej? Co zrobić, gdy zauważymy, iż nasza usługa nie działa? Oczywiście przede wszystkim: nie panikować. Następne kroki zależą od tego, ile i jakie rzeczy przestały współpracować. Jeśli to strona internetowa – spróbuj odświeżyć przeglądarkę. Warto również skasować jej pamięć podręczną i ciasteczka (najczęściej jest to kombinacja CTRL+SHIFT+R). Jeśli nie pomogło lub doświadczasz również problemów w działaniu poczty lub innych usług sprawdź innymi kanałami komunikacji, czy awaria nie jest szersza. Oczywiście należy też upewnić się, że sami mamy połączenie z internetem. Dostawcy usług internetowych bardzo często mają swoje profile na portalach społecznościowych. Tam należy w pierwszej chwili szukać odpowiedzi, czy serwery działają i czy wszystko jest w porządku. W wypadku home.pl informacja pojawiła się z rana w poniedziałek, w wypadku Facebooka chwilę po wylogowaniu kont (a sprawa nadal się toczy).
Bardzo często należy też poszukać pomocnej dłoni. Telefon do przyjaciela, do swojego administratora lub znajomego informatyka może nas nieco uspokoić. Nie należy być przy tym jednak natarczywym ani agresywnym! Najczęściej Twój admin wie o takiej awarii dużo wcześniej (o ile posiada specjalny system monitoringu) i bardzo często jest już w trakcie rozwiązywania problemu (o ile ma taką możliwość).
Bardzo ważnym zagadnieniem w wypadku awarii jest kopia zapasowa. Pewne stare, informatyczne przysłowie mówi
Ludzie dzielą się na dwa typy: tych co robią kopie zapasowe i tych, co będą je robić.
Nasi klienci nie muszą się tym oczywiście martwić. Wykonywanie backupu to jeden z podstawowych sposobów zabezpieczenia się przed awarią. Możliwe jest, iż to serwer uruchamiający usługę zostanie uszkodzony. Brak kopii zapasowej oznacza, że jeśli utracimy dane w wyniku błędu (ludzkiego, sprzętowego czy po prostu przez atak hakerski), nie odzyskamy ich. Nie wykonywanie backupów to “życie na krawędzi“. Taka kopia po prostu musi być wykonywana. Jak podejść do tematu wykonywania kopii zapasowych? Zapraszamy niedługo, na pewno pojawi się taki wpis 😉
…ale to tyle trwa
Niestety współcześnie ciężko jest prowadzić biznes bez pomocy sieci web. Czy to będzie witryna, czy sklep internetowy, czy tylko i wyłącznie poczta służbowa – wszystko potrzebuje wielu elementów technicznych. Niekiedy awaria jednego z nich może spowodować, iż cała infrastruktura będzie niedostępna. Rozwiązywanie takich problemów leży w gestii administratorów oraz dostawców serwerów (jak np. OVH). To oni zajmują się tym, aby ich urządzenia były ciągle i nieprzerwanie dostępne. Jeśli jednak awaria już wystąpiła możesz być spokojny: drugi raz się ten problem zwykle nie pojawi. Jeśli to był atak – firmy outsourcingowe zazwyczaj wprowadzą kolejne zabezpieczenia chroniące przed tego typu problemem. Gdy serwery DNS przestały odpowiadać (jak w wypadku home.pl) dostawca naprawi błąd, a później zabezpieczy się przed tego typu problemem na przyszłość. Bardzo często nie można przewidzieć wszystkiego, więc dobrym nawykiem będzie cierpliwe oczekiwanie na rozwiązanie problemu. Wiele z awarii można powstrzymać nim jeszcze wystąpią, niestety czasami jest to niezależne od administratorów.
Zatem jeśli awaria wystąpi przez nas, bądź też z przyczyn zewnętrznych nie można oddać się agresji. Telefon do administratora lub informatyka w wielu wypadkach załatwi sprawę. Informacje od nich oraz z innych źródeł pomogą ustalić co nie działa i dlaczego. Niestety: wypadki się zdarzają. Nie mamy na wszystko wpływu. Każdy może się pomylić. W finalnym rozrachunku dana wrażliwość zostanie naprawiona, co przyczyni się do większej dostępności i odporności usług w przyszłości.