Αλγόριθμος επιχειρεί να προβλέψει την «επόμενη κίνηση» του κορονοϊού
Έναν αλγόριθμο που χρησιμοποιεί δεδομένα από αναζητήσεις και social media για να προβαίνει σε προβλέψεις ξεσπασμάτων και εξάρσεων Covid-19 πριν λάβουν χώρα αναπτύσσει διεθνής ομάδα ερευνητών, όπως αναφέρεται σε δημοσίευμα των New York Times.
Ένας τέτοιος αλγόριθμος θα βοηθούσε σημαντικά στην αντιμετώπιση της πανδημίας, καθώς θα επέτρεπε πιο ασφαλή άρση μέτρων, δεδομένου πως, με τα παρόντα δεδομένα, όταν ο κορονοϊός βρει ένα «άνοιγμα» σε έναν πληθυσμό, αποκτά προβάδισμα δύο εβδομάδων έναντι των αρχών μέχρι η επανεμφάνισή του να γίνει ευρέως αντιληπτή σε νοσοκομεία κ.α.
Το μοντέλο- για την ακρίβεια το σχέδιο του μοντέλου- θα μπορούσε να προβλέψει ξεσπάσματα περίπου δύο εβδομάδες πριν λάβουν χώρα, προκειμένου να τεθούν σε ισχύ αποτελεσματικά μέτρα περιορισμού.
Σε paper που δημοσιεύτηκε την Πέμπτη στο arXiv.org, η ομάδα, υπό τους Μαουρίτσιο Σαντιλάνα και Νικόλ Κόγκαν του Χάρβαρντ, παρουσίασε έναν αλγόριθμο που κατέγραφε τον κίνδυνο 14 ημέρες και άνω πριν αρχίσει η αύξηση των κρουσμάτων. Το σύστημα χρησιμοποποιεί δεδομένα πραγματικού χρόνου από το Twitter, τις αναζητήσεις στο Google και mobility data (δεδομένα μετακινήσεων) από smartphones, μεταξύ άλλων data streams.
Σύμφωνα με τους ερευνητές ο αλγόριθμος θα μπορούσε να λειτουργεί ως «θερμοστάτης» σε ένα σύστημα θέρμανσης ή κλιματισμού για να καθοδηγεί την ενεργοποίηση ή χαλάρωση μέτρων δημόσιας υγείας.
«Στα περισσότερα μοντέλα μολυσματικών ασθενειών, προβάλλεις διαφορετικά σενάρια με βάση υποθέσεις που έχουν γίνει εκ των προτέρων» είπε ο Σαντιλάνα, διευθυντής του Machine Intelligence Lab στο Boston Children’s Hospital και επίκουρος καθηγητής Παιδιατρικής και Επιδημιοογίας στο Χάρβαρντ. «Αυτό που κάνουμε εδώ είναι να παρατηρούμε, χωρίς να κάνουμε υποθέσεις. Η διαφορά είναι πως οι μέθοδοί μας αντιδρούν σε άμεσες αλλαγές στη συμπεριφορά και μπορούμε να τις ενσωματώσουμε αυτές».
Άλλοι ειδικοί που είδαν τη νέα αυτή ανάλυση- η οποία δεν έχει αξιολογηθεί ακόμα- είπαν πως επιδεικνύει την αυξανόμενη αξία των δεδομένων πραγματικού χρόνου, όπως τα social media, στη βελτίωση υπαρχόντων μοντέλων.
Στο πλαίσιο του εν λόγω επιστημονικού άρθρου η ομάδα ανέλυσε δεδομένα πραγματικού χρόνου από τις εξής πηγές: Το Google, αναρτήσεις στο Twitter σχετικά με την Covid-19, αναζητήσεις γιατρών σε μια πλατφόρμα ονόματι UpToDate, ανώνυμα δεδομένα μετακίνησης από smartphone και στοιχεία από το Kinsa Smart Thermometer, που ανεβαίνουν σε μια εφαρμογή. Αυτά τα data streams ενσωματώθηκαν σε ένα προηγμένο μοντέλο πρόγνωσης του Northeastern University, με βάση το πώς οι άνθρωποι κινούνται και αλληλεπιδρούν σε κοινότητες. Η ομάδα δοκίμασε την αξία που έχουν για προβλέψεις οι τάσεις στο data stream εξετάζοντας πώς η καθεμία συσχετιζόταν με τους αριθμούς κρουσμάτων και θανάτων τον Μάρτιο και τον Απρίλιο σε κάθε πολιτεία. Εν τέλει, συνδυάζοντας όλες τις πηγές δεδομένων, ο αλγόριθμος ήταν σε θέση να προβλέψει ξεσπάσματα σε 21 ημέρες κατά μέσο όρο, όπως διαπίστωσαν οι ερευνητές.
Παρόλα αυτά, όπως τονίζεται στο δημοσίευμα, τα big data analytics δεν είναι σε θέση να προβλέψουν απότομες αλλαγές στη μαζική συμπεριφορά καλύτερα από άλλα, πιο παραδοσιακά μοντέλα- πχ κανένας αλγόριθμος δεν θα μπορούσε να προβλέψει αυτό που συνέβη με τον θάνατο του Τζορτζ Φλόιντ, με τις μεφάλες συγκεντρώσεις που προκάλεσαν νέες εξάρσεις του ιού. Επίσης τα social media και οι μηχανές αναζήτησης μπορούν να γίνουν λιγότερο ακριβή με το πέρασμα του χρόνου, καθώς όσο πιο «οικείος» γίνεται στους χρήστες ένας παθογόνος οργανισμός, τόσο λιγότερο θα κάνουν αναζητήσεις με συγκεκριμένες λέξεις- κλειδιά.