Μιχάλης Μπλέτσας: Τι πραγματικά σημαίνει «πρωτοπορία στην Τεχνητή Νοημοσύνη»

Μιχάλης Μπλέτσας: Τι πραγματικά σημαίνει «πρωτοπορία στην Τεχνητή Νοημοσύνη»

Πρόσφατα, το Ευρωπαϊκό Κοινοβούλιο ενέκρινε τις τελικές συστάσεις της ειδικής επιτροπής του για την Τεχνητή Νοημοσύνη στην Ψηφιακή Εποχή (AIDA). Στο κείμενο που εγκρίθηκε, η AIDA συνιστά η δημόσια συζήτηση γύρω από τη χρήση της τεχνητής νοημοσύνης να επικεντρωθεί στις τεράστιες δυνατότητές της να συμπληρώνει παραγωγικά την ανθρώπινη εργασία. Σημειώνοντας ότι η ΕΕ έχει μείνει πίσω στον παγκόσμιο αγώνα για την ηγεσία της τεχνολογίας, η AIDA σχολιάζει ότι υπάρχει κίνδυνος να αναπτυχθούν πρότυπα για τη χρήση της τεχνητής νοημοσύνης (ΤΝ) εκτός ΕΕ μέσω λιγότερο δημοκρατικών επιρροών. 

Ένα πολύ υποσχόμενο πεδίο εφαρμογής των αλγορίθμων ΤΝ είναι η ιατρική. Σε ένα κλινικό περιβάλλον, οι αλγόριθμοι μπορούν να μας βοηθήσουν να αποφασίσουμε εάν ένας ασθενής είναι υποψήφιος για χημειοθεραπεία, να ανιχνεύσουν κακοήθειες στις διαγνωστικές εικόνες, να προτείνουν προτεραιότητες στη φροντίδα των ασθενών ή να αποφασίσουν εάν είναι απαραίτητη η μετακίνηση στη ΜΕΘ. 

Η κακή εκπαίδευση των αλγορίθμων είναι ένα κρίσιμο πρόβλημα. Όταν η ΤΝ αντικατοπτρίζει τις ασυνείδητες σκέψεις, τον ρατσισμό και τις προκαταλήψεις των ανθρώπων που δημιούργησαν αυτούς τους αλγόριθμους, μπορεί να προκαλέσει σοβαρή βλάβη. Για παράδειγμα, προγράμματα ΤΝ, έχουν επισημάνει λανθασμένα τους μαύρους κατηγορούμενους ως έχοντες διπλάσιες πιθανότητες να επαναλάβουν τα αδικήματα από κάποιον λευκό. Όταν ένα μοντέλο ΤΝ χρησιμοποίησε το κόστος περίθαλψης σαν ένδειξη για τις ανάγκες υγείας, θεώρησε λανθασμένα τους μαύρους ασθενείς ως πιο υγιείς από τους εξίσου άρρωστους λευκούς, επειδή δαπανήθηκαν λιγότερα χρήματα για αυτούς. 

Η εξάλειψη ευαίσθητων δεδομένων από το σύνολο των δεδομένων που χρησιμοποιούνται για την εκπαίδευση των μοντέλων ΤΝ (ο όρος «μοντέλο» είναι πιο σωστός από τον «αλγόριθμο» δεδομένης της στατιστικής φύσης της κυρίαρχης σήμερα μορφής ΤΝ) προβάλλεται συνήθως σαν ή πιο εύκολη λύση για την εξάλειψη των ανεπιθύμητων πολώσεων. Τι γίνεται όμως όταν αυτό δεν είναι αρκετό;

Τα παραδείγματα μεροληψίας στην επεξεργασία της φυσικής γλώσσας είναι απεριόριστα - αλλά επιστήμονες του MIT έχουν ερευνήσει μια άλλη σημαντική, σε μεγάλο βαθμό ανεξερεύνητη μέθοδο: τις ιατρικές εικόνες. Χρησιμοποιώντας τόσο ιδιωτικά όσο και δημόσια σύνολα δεδομένων, η ομάδα διαπίστωσε ότι η τεχνητή νοημοσύνη μπορεί να προβλέψει με ακρίβεια τη φυλή των ασθενών μόνο από ιατρικές εικόνες. Χρησιμοποιώντας δεδομένα απεικόνισης από ακτινογραφίες θώρακα, ακτινογραφίες άκρων, αξονική τομογραφία θώρακα και μαστογραφίες, η ομάδα εκπαίδευσε ένα μοντέλο βαθιάς μάθησης για να αναγνωρίσει τη φυλή ως λευκή, μαύρη ή ασιατική - παρόλο που οι ίδιες οι εικόνες δεν περιείχαν καμία ρητή αναφορά της φυλής των ασθενών. Αυτό είναι κάτι που δεν μπορούν να κάνουν ακόμη και οι πιο έμπειροι γιατροί και δεν είναι ξεκάθαρο πώς το μοντέλο μπόρεσε να το κάνει αυτό.

Σε μια προσπάθεια να ξεγελάσουν το μοντέλο και να κατανοήσουν το αινιγματικό «πώς» της επιτυχίας του, οι ερευνητές πραγματοποίησαν μια σειρά από πειράματα.

Για να διερευνήσουν πιθανούς μηχανισμούς ανίχνευσης φυλής, εξέτασαν μεταβλητές όπως διαφορές στην ανατομία, την οστική πυκνότητα, την ανάλυση των εικόνων - και πολλά άλλα, και τα μοντέλα εξακολουθούσαν να έχουν υψηλή ικανότητα ανίχνευσης φυλής από ακτινογραφίες θώρακα. «Αυτά τα αποτελέσματα ήταν αρχικά μπερδεμένα, επειδή τα μέλη της ερευνητικής μας ομάδας δεν μπορούσαν να βρουν μια καλή ένδειξη για αυτήν την εργασία (αναγνώριση φυλής)», λέει η συν-συγγραφέας της εργασίας Marzyeh Ghassemi, επίκουρη καθηγήτρια στο Τμήμα Ηλεκτρολόγων Μηχανικών και Επιστήμης Υπολογιστών του MIT και του Ινστιτούτου Ιατρικής Μηχανικής και Επιστήμης (IMES). «Ακόμη και όταν φιλτράρετε ιατρικές εικόνες πέραν του σημείου όπου οι εικόνες είναι αναγνωρίσιμες ως ιατρικές εικόνες, τα μοντέλα βαθιάς μάθησης διατηρούν πολύ υψηλή απόδοση. Αυτό είναι ανησυχητικό γιατί οι υπεράνθρωπες ικανότητες είναι γενικά πολύ πιο δύσκολο να ελεγχθούν, να ρυθμιστούν και να αποτραπούν από το να βλάψουν ανθρώπους».

Παραδείγματα σαν το παραπάνω δείχνουν πόσο σημαντική αλλά και πόσο δύσκολη υπόθεση είναι η ρύθμιση της ΤΝ. Η σημερινή τεχνολογική πρωτοπορία ΗΠΑ και Κίνας στην ΤΝ χτίστηκε πάνω στη χωρίς κανένα περιορισμό συλλογή προσωπικών δεδομένων και στη δημιουργία ενός περιβάλλοντος συνεχούς παρακολούθησης της ανθρώπινης δραστηριότητας. Οι διαδικτυακοί κολοσσοί σε Δύση και Ανατολή συλλέγουν και επεξεργάζονται τεράστιους όγκους συμπεριφορικών δεδομένων. Στη Δύση τα δεδομένα αυτά τροφοδοτούν τα μεγαλύτερα και πιο επικερδή μοντέλα ΤΝ που έχουν σαν στόχο τη μεγιστοποίηση της ενασχόλησης μας με τα μέσα κοινωνικής δικτύωσης (ΜΚΔ). Αυτά αποτελούν τους κύριους χρηματοδότες της έρευνας γύρω από την ΤΝ και έχουν δημιουργήσει και τα περισσότερα εργαλεία τα οποία χρησιμοποιούνται για έρευνα ΤΝ, ακόμα και στα ακαδημαϊκά εργαστήρια.

Δεδομένης της διαβρωτικής επίδρασης των ΜΚΔ στο θεσμικό υπόβαθρο της Δύσης, καθώς και των Οργουελικών εφαρμογών της ΤΝ στην Ανατολή («κοινωνικό σκορ»), θα πρέπει να σκεφτούμε προσεκτικά, το τι πραγματικά σημαίνει «πρωτοπορία στην ΤΝ».

Η Ευρώπη έχει μια μεγάλη ευκαιρία μπροστά της. Μια καλή αρχή μπορεί να γίνει αλλάζοντας τον όρο «Τεχνητή Νοημοσύνη» σε «Εκτεταμένη Νοημοσύνη». Τα μοντέλα ΤΝ συμπληρώνουν και ενδυναμώνουν τον άνθρωπο, δεν τον αντικαθιστούν.

* Ο Μιχάλης Μπλέτσας είναι διευθυντής Πληροφορικής στο Media Lab του ΜΙΤ