Συνεχης ενημερωση

    Δευτέρα, 22-Ιουλ-2024 00:03

    Η μπλε Παρασκευή και τα πράσινα άλογα!

    • Εκτύπωση
    • Αποστολή με email
    • Προσθήκη στη λίστα ανάγνωσης
    • Μεγαλύτερο μέγεθος κειμένου
    • Μικρότερο μέγεθος κειμένου

    Το περιστατικό

    Τη νύχτα της Πέμπτης προς Παρασκευή, ο κολοσσός παραγωγής cybersecurity software (λογισμικό κυβερνοασφάλειας) CrowdStrike προώθησε προς τους μεγάλους πελάτες της ένα update (ενημέρωση) του EDR (Endpoint Detection and Response) που χρησιμοποιούν μόνο τα πολύ μεγάλα δίκτυα. Μιλάμε για ενημέρωση που απευθυνόταν σε πελάτες με δεκάδες χιλιάδες σταθμούς εργασίας έκαστος.

    Την εγκατάσταση ξεκίνησε μια Αυστραλιανή αεροπορική εταιρεία, πρώτα από τις θέσεις εργασίας στην Ωκεανία και (κατά συνήθη πρακτική) συνέχισε προς τα Ανατολικά. Το ίδιο έκαναν και δεκάδες άλλες μεγάλες εταιρείες, καθώς ο πλανήτης "ξυπνούσε"!

    Με αποτέλεσμα να βγουν εκτός λειτουργίας περί τα 4.000.000 συστήματα υπολογιστών που "τρέχουν" κάποια έκδοση του λειτουργικού Windows (κυρίως τις Server και 10 ή 11), μέσα σε λίγες ώρες! Ο γίγαντας που δημιούργησαν ο Bill Gates  και ο Paul Alen ανακοίνωσε ως συνολικό αριθμό PCs που αδρανοποιήθηκαν από το πρόβλημα, τα 8.500.000! Εάν ληφθεί υπόψη ότι οι ηλεκτρονικοί υπολογιστές που "τρέχουν" Windows είναι πολλές δεκάδες (αν όχι εκατοντάδες) εκατομμύρια, η ζημιά, ήταν εξαιρετικά περιορισμένη. 

    Δυστυχώς μόνο ποσοτικά και όχι ποιοτικά ή… σημειολογικά! Διότι, π.χ. μιας και οι τρεις μεγαλύτερες αεροπορικές εταιρείες των ΗΠΑ (American, Delta, United) αντιμετώπισαν πρόβλημα και αναγκάστηκαν να κρατήσουν όλα τα αεροπλάνα τους στην γη, σε ολόκληρο τον πλανήτη, για πολλές ώρες, υπήρξαν σοβαρότατες καθυστερήσεις σε όλα τα διεθνή αεροδρόμια του πλανήτη. 

    Αντίστοιχες περιπτώσεις είχαμε σε Εθνικά Συστήματα Υγείας, μεγάλες πολυεθνικές, αλυσίδες λιανικής κ.ο.κ. Προβλήματα υπήρξαν και στην Ελλάδα αλλά περιορισμένης έκτασης (Ελ. Βενιζέλος, 2 τουλάχιστον αλυσίδες λιανικής, τράπεζες κ.ά.) Χωρίς όμως κάποιον κίνδυνο πέρα από τον χρόνο που απαιτήθηκε για την διαδικασία της επαναφοράς σε κανονική λειτουργία). Η ποιότητα των Ελλήνων ΙΤ Directors και των outsourcers που λειτουργούν στην χώρα είναι εξαιρετικά υψηλή, οπότε τα πολλά παρατράγουδα αποφεύχθηκαν, μάλλον… αναίμακτα.
     

    Τι συνέβη;

    Το λάθος/πρόβλημα ήταν απλό: η CrowdStrike έχει ήδη παραδεχθεί ότι πιο πρόσφατη ενημέρωση στο πλέον εξελιγμένο και ευρείας δράσης της λογισμικό, είχε προβλήματα στο κώδικα. Προβλήματα που επηρέαζαν σε κρίσιμο βαθμό την λειτουργία των Windows, με αποτέλεσμα όποιος σταθμός εργασίας ή Server αναβαθμιζόταν στο νέο CrowdStrike software, να εμφανίζει την περίφημη "Μπλε Οθόνη Του Θανάτου" (BSOD- Blue Screen Of Death, εξ ου και η ονομασία "Μπλε Παρασκευή- Blue Friday) και να τίθεται εκτός λειτουργίας, χωρίς ελπίδα επαναφοράς αν δεν ακολουθείτο ειδική διαδικασία… καθαρισμού από το update.

    Η ακριβής τεχνική διαδικασία και εξέλιξη της προβληματικής κατάστασης και πολλές τεχνικές λεπτομέρειες δεν έχουν γίνει γνωστά έως τώρα και πιθανόν να μην γίνουν ποτέ, λόγω επιχειρηματικού απορρήτου. Τα όσα όμως γνωρίζουμε, είναι αρκετά για να μπορούμε να απαντήσουμε τα δύο κυριότερα ερωτήματα:
     

    Α. Μπορούσε να αποφευχθεί το φιάσκο-χάος;

    Φυσικά. Όλοι οι σοβαροί σχεδιαστές - δημιουργοί software διαθέτουν προετοιμασμένα συστήματα εταιρικών πολιτικών και διαδικασιών (company policies and procedures) που εφαρμόζουν πιστά και απαρέγκλιτα. Πολιτικές και διαδικασίες σχεδιασμένα ειδικά για να αποφεύγονται τέτοια περιστατικά. Θεωρητικά τουλάχιστον…

    Π.χ. κάθε update ΠΡΕΠΕΙ να περνά από δοκιμαστική λειτουργία σε πολυμορφικά περιβάλλοντα που πλησιάζουν στον πλησιέστερο δυνατό βαθμό αυτά των πελατών, για ημέρες. 

    Το ίδιο, επίσης θεωρητικά, ισχύει και για τις εταιρείες - πελάτες τους. Κανένας σοβαρός IT Director δεν κάνει roll out (διανομή) μιας νέας έκδοσης στο δίκτυο που διευθύνει εάν δεν τη δοκιμάσει πρώτα σε ένα πολύ μικρό μέρος, το οποίο συνήθως έχει ίσως και τη δυνατότητα να απομονώσει.

    Προφανώς στην περίπτωση της Παρασκευής, πολλοί δεν τήρησαν τα όσα θα έπρεπε να τηρούν ευλαβικά. Επίσης, για την ορθή απόδοση ευθυνών, θα πρέπει να ληφθεί υπόψιν ότι τα testing environments έχουν υψηλό κόστος και ότι οι ομάδες ΙΤ πιέζονται, ασφυκτικά πολλές φορές, από χρονικά όρια και στόχους.

    Β. Υπάρχει περίπτωση να ξανασυμβεί;

    Εδώ η απάντηση είναι εύκολη: οπωσδήποτε. Και οι πιθανότητες να συμβεί και πάλι είναι υψηλότατες. Το πράγμα μοιάζει με τον οδηγό που παραβιάζει κόκκινους σηματοδότες. Όσο περισσότερους περνά χωρίς σεβασμό των κανόνων, τόσο πιθανότερο θα γίνεται το ατύχημα ή το δυστύχημα.

    Όμοια, όσο θα υπάρχει η δυνατότητα να πραγματοποιούνται ενέργειες πληροφορικής που μπορούν να επηρεάσουν τα δίκτυα υπολογιστών, χωρίς να έχουν τηρηθεί οι ειδικά προσδιορισμένες πολιτικές και διαδικασίες ασφαλείας, τόσο πιθανότερο θα γίνεται να έχουμε ένα εκτεταμένο πρόβλημα λειτουργίας, με απρόβλεπτες και ανυπολόγιστες συνέπιες.

    Τα πράσινα άλογα

    Από το σημείο αυτό όμως, μέχρι του σημείου να ακούμε και να διαβάζουμε τις ανοησίες που ακούσαμε και διαβάσαμε από την Παρασκευή, υπάρχει τεράστια διαφορά.

    Υπήρξε ένα εκτεταμένο πρόβλημα και αντιμετωπίστηκε. Θα πρέπει να δοθούν εξηγήσεις; Φυσικά και απαραίτητα! Πρέπει να υπάρξει συντονισμός και προσπάθεια να μην ξανασυμβεί κάτι παρόμοιο; Με κάθε δυνατό τρόπο και κόστος!

    Η πρόκληση πανικού όμως που ακριβώς βοηθά; Εκτός από το γέμισμα της τσέπης αυτών που προσπαθούν να τον προκαλέσουν; Χωρίς μάλιστα να έχουν ιδέα για ποιο πράγμα μιλούν και μπουρδολογόντας ασύστολα;

    Πέτρος Λάζος
    petros.lazos@capital.gr

    ΣΑΣ ΑΡΕΣΕ ΤΟ ΑΡΘΡΟ;

    ΣΧΕΤΙΚΑ ΑΡΘΡΑ