Τι καθυστερεί την ανάπτυξη της Τεχνητής Νοημοσύνης

Τι καθυστερεί την ανάπτυξη της Τεχνητής Νοημοσύνης

Λέγοντας ανθρώπινη νοημοσύνη εννοούμε την ικανότητα ενός ατόμου να επιτυγχάνει καινούργιους στόχους αξιοποιώντας αντιληπτικές και γνωστικές διεργασίες. Η Τεχνητή Νοημοσύνη περιγράφεται συνήθως ως η δυνατότητα των μηχανών να αναλαμβάνουν εργασίες που παραδοσιακά απαιτούν ανθρώπινη νοημοσύνη – για παράδειγμα μάθηση, επίλυση προβλημάτων, λήψη αποφάσεων, πρόβλεψη, κλπ.

Η Τεχνητή Νοημοσύνη χαρακτηρίζεται ως υπολογιστική έννοια, καθώς προκύπτει από την προσπάθεια αναπαράστασης της ανθρώπινης σκέψης και της διαδικασίας λήψης αποφάσεων μέσω επεξεργασίας δεδομένων, μηχανικής μάθησης και αλγοριθμικών μεθόδων. Η Τεχνητή Νοημοσύνη αναπτύχθηκε στο πλαίσιο της επιστήμης των υπολογιστών και της μηχανικής, αποτέλεσμα ανθρώπινης παρέμβασης και τεχνολογικής καινοτομίας.

Η ραγδαία ανάπτυξη της Τεχνητής Νοημοσύνης (ΤΝ) τα τελευταία χρόνια έχει αλλάξει δραστικά τον τρόπο με τον οποίο προσεγγίζονται προβλήματα πρόβλεψης και λήψης αποφάσεων. Η είσοδος μοντέλων βαθιάς μάθησης (Deep Learning) έχει ενισχύσει τη δυνατότητα εντοπισμού μη γραμμικών προτύπων σε πολύπλοκα δεδομένα, καθιστώντας εφικτή την πρόβλεψη τιμών μετοχών, συναλλάγματος, την ανάλυση επενδυτικών χαρτοφυλακίων με πρωτοφανή ακρίβεια.

Ο πρωταρχικός σκοπός της έρευνας στην ΤΝ είναι η αυτοματοποίηση συμπεριφορών που θεωρούνται ευφυείς, οι οποίες εντοπίζονται σε έξι θεμελιώδεις περιοχές: μηχανική γνώση, συλλογιστική επεξεργασία, τεχνικές σχεδιασμού, διαδραστική επικοινωνία, αισθητηριακή αντίληψη και κινητική λειτουργία.

Η μηχανική γνώσης αφορά την αναπαράσταση και μοντελοποίηση γνώσης. Η συλλογιστική επεξεργασία επικεντρώνεται σε αλγοριθμικές μεθόδους επίλυσης προβλημάτων. Οι τεχνικές σχεδιασμού επιτρέπουν τον καθορισμό και την υλοποίηση στόχων. Η διαδραστική επικοινωνία περιλαμβάνει την επεξεργασία φυσικής γλώσσας. Η αισθητηριακή αντίληψη σχετίζεται με την εξαγωγή πληροφορίας από εικόνες/ήχο. Η κινητική λειτουργία περιλαμβάνει την πραγματοποίηση φυσικών χειρισμών των μηχανών.

Ωστόσο, τα περισσότερα από αυτά τα μοντέλα (ιδιαίτερα τα βαθιά νευρωνικά δίκτυα -deep neural networks), λειτουργούν ως «μαύρα κουτιά» (black box models), περιορίζοντας τη δυνατότητα ερμηνείας των αποτελεσμάτων των μοντέλων ΤΝ. Δηλαδή ο χρήστης δεν μπορεί να κατανοήσει πως το μοντέλο ΤΝ δημιούργησε το αποτέλεσμα. Αυτό αποτελεί σημαντικό πρόβλημα, ιδίως σε εφαρμογές, όπου η διαφάνεια και η εμπιστοσύνη είναι απαραίτητες για τη λήψη αποφάσεων, με αποτέλεσμα να υπήρχε αποστροφή στην υιοθέτηση της ΤΝ.

Η επεξήγηση/ερμηνευσιμότητα του τρόπου λήψης της απόφασης των μοντέλων της ΤΝ, αποτελεί θεμελιώδες χαρακτηριστικό της Τεχνητής Νοημοσύνης, καθώς συνδέεται άμεσα με την εμπιστοσύνη, τη διαφάνεια και τη λογοδοσία.  Η έλλειψη ερμηνευσιμότητας μπορεί να οδηγήσει σε έλλειψη εμπιστοσύνης, περιορίζοντας την αποδοχή και υιοθέτηση των συστημάτων ΤΝ από τους χρήστες και τις κοινωνίες. Παράλληλα, η κατανόηση των εσωτερικών λειτουργιών ενός μοντέλου επιτρέπει τον εντοπισμό προκαταλήψεων (bias), σφαλμάτων ή παραπλανητικών μοτίβων στα δεδομένα εκπαίδευσης, βελτιώνοντας έτσι την ηθική χρήση και την αξιοπιστία των συστημάτων. Η ερμηνευσιμότητα είναι μια απαραίτητη προϋπόθεση για την υπεύθυνη ανάπτυξη και χρήση της Τεχνητής Νοημοσύνης.

Η Επεξηγηματική Τεχνητή Νοημοσύνη (Explainable Artificial Intelligence – ΕΤΝ) συνιστά έναν ταχέως αναπτυσσόμενο τομέα της μηχανικής μάθησης, ο οποίος επιδιώκει την κατανόηση και διαφάνεια των αποτελεσμάτων που παράγονται από αλγοριθμικά μοντέλα ΤΝ. Η ΕΤΝ συχνά περιγράφεται ως ένας επεξηγηματικός μηχανισμός που αποσκοπεί στην αποσαφήνιση της λογικής με την οποία τα μοντέλα Τεχνητής Νοημοσύνης παράγουν τα αποτελέσματα. 

Οι μέθοδοι ΕΤΝ περιλαμβάνουν μετα-ερμηνευτικές τεχνικές που εφαρμόζονται μετά την παραγωγή των αποτελεσμάτων των μοντέλων της ΤΝ για να ερμηνεύσουν τη λογική μεταξύ των μεταβλητών των εισόδων και των αποτελεσμάτων, π.χ. η Local Interpretable model-agnostic explanation (LIME) και η SHapley Additive exPlanations (SHAP). Η προσέγγιση αυτή αξιολογεί τη συμβολή κάθε χαρακτηριστικού στο αποτέλεσμα πρόβλεψης ενός μοντέλου μηχανικής μάθησης, αντικαθρεπτίζοντας  τον βαθμό επιρροής του στην τελική απόφαση του μοντέλου.

Εκτός από μετα-ερμηνευτικές τεχνικές, όμως, υπάρχουν τα εγγενώς ερμηνεύσιμα μοντέλα ΤΝ, όπως τα δέντρα απόφασης, τα γραμμικά μοντέλα, τα συστήματα βασισμένα σε κανόνες, των οποίων η λειτουργία είναι άμεσα κατανοητή. Σε αυτό το πλαίσιο, το Adaptive Neuro-Fuzzy Inference System (ANFIS) είναι μια εγγενώς ερμηνεύσιμη τεχνική για το πως αποφασίζει το μοντέλο, και  αναδεικνύεται ως ιδιαίτερα σημαντική, καθώς αποτελεί ένα υβριδικό υπολογιστικό πλαίσιο που συνδυάζει τις δυνατότητες μάθησης των τεχνητών νευρωνικών δικτύων με τη διαφάνεια και την ερμηνευσιμότητα των κανόνων της ασαφούς λογικής, εκφράζοντας γνώση με μορφή κανόνων IF–THEN.

Από τη μια, τα Τεχνητά Νευρωνικά Δίκτυα (ΤΝΔ) αποτελούν μια κατηγορία αλγορίθμων μηχανικής μάθησης που εμπνέονται από τη λειτουργία του ανθρώπινου εγκεφάλου. Σχεδιάστηκαν για να μιμούνται τον τρόπο με τον οποίο οι βιολογικοί νευρώνες λαμβάνουν, επεξεργάζονται και μεταδίδουν σήματα. Ένα ΤΝΔ αποτελείται από διασυνδεδεμένους κόμβους (νευρώνες) οργανωμένους σε επίπεδα: το επίπεδο εισόδου, ένα ή περισσότερα κρυφά επίπεδα και το επίπεδο εξόδου. Κάθε σύνδεση μεταξύ νευρώνων φέρει ένα «βάρος» που προσαρμόζεται μέσω διαδικασιών εκπαίδευσης, ώστε το δίκτυο να μαθαίνει από τα δεδομένα και να βελτιώνει την απόδοσή του.

Από την άλλη, η Ασαφής Λογική (Fuzzy Logic) αποτελεί μια μαθηματική προσέγγιση συλλογιστικής με στόχο την αναπαράσταση της αβεβαιότητας και της ασαφούς πληροφορίας. Σε αντίθεση με την κλασική δυαδική λογική, όπου οι μεταβλητές μπορούν να λάβουν μόνο δύο τιμές (0 ή 1), η Ασαφής Λογική επιτρέπει συνεχείς βαθμούς συμμετοχής σε ένα σύνολο, χρησιμοποιώντας τιμές μεταξύ 0 και 1. Έτσι, μπορεί να περιγράψει έννοιες όπως «λίγο», «πολύ» ή «πάρα πολύ» με μαθηματική ακρίβεια, αντανακλώντας πιο πιστά τον τρόπο με τον οποίο οι άνθρωποι αντιλαμβάνονται και περιγράφουν τον κόσμο.

Βασικό στοιχείο της Ασαφούς Λογικής είναι οι συναρτήσεις συμμετοχής (membership functions), που καθορίζουν τον βαθμό στον οποίο μια τιμή ανήκει σε ένα ασαφές σύνολο. Η συλλογιστική στηρίζεται σε κανόνες της μορφής IF–THEN, οι οποίοι μετατρέπουν τις ασαφείς εισόδους σε συμπεράσματα μέσω ενός συστήματος συμπερασμού (inference system). 

Η ευελιξία και η ερμηνευσιμότητα της Ασαφούς Λογικής την καθιστούν ιδιαίτερα χρήσιμη σε περιβάλλοντα όπου η αβεβαιότητα και η ατελής πληροφόρηση είναι αναπόφευκτες, προσφέροντας ανθρώπινα κατανοητούς κανόνες και διαφανή διαδικασία λήψης αποφάσεων.

Η βάση ασαφών κανόνων, ένα κρίσιμο στοιχείο ενός συστήματος Ασαφούς Λογικής, αποτελείται από λογικούς ασαφείς κανόνες. Ένας ασαφής κανόνας είναι μια αποτελεσματική αναπαράσταση της ανθρώπινης γνώσης που παρέχεται από έναν ειδικό ή εξάγεται από δεδομένα. 

Το μέρος IF (εάν) ενός ασαφούς κανόνα αποτελεί την προϋπόθεση (condition) και το μέρος THEN (τότε) είναι το consequent (συνέπεια), το οποίο προκύπτει από τις προϋποθέσεις. Π.χ. για την πρόβλεψη της τιμής του χρυσού μπορεί να γίνει με μια σειρά κανόνων, όπου η συλλογιστική είναι: 

ΕΑΝ το δολάριο διολισθαίνει  «ελαφρώς » ΚΑΙ το χρηματιστήριο βρίσκεται «πολύ υψηλά», ΚΑΙ τα επιτόκια μειώνονται «λίγο», ΤΟΤΕ η τιμή του χρυσού θα είναι  «λίγο ανοδική». 

Αυτή η γλωσσική αναπαράσταση της λογικής με όρους όπως IF, AND, THEN, OR έχει ενσωματωθεί στους ασαφείς κανόνες των συστημάτων Ασαφούς Λογικής.

Το ANFIS είναι ικανό να προσφέρει εγγενή ερμηνευσιμότητα (interpretability), χωρίς να χρειάζεται μετά-ερμηνευτικές τεχνικές, συμβάλλοντας έτσι στη διαφάνεια των αποφάσεων και στην ενίσχυση της εμπιστοσύνης προς τα συστήματα Τεχνητής Νοημοσύνης καθώς προσφέρει το πλεονέκτημα της τεκμηριωμένης και διαφανούς υποστήριξης των αποφάσεων μέσα από κανόνες λογικής που διαμορφώθηκαν από τα δεδομένα με τα οποία εκπαιδεύτηκε. 

Η σύγκρισή του με τα κλασικά βαθιάς μάθησης (deep learning) μοντέλα δείχνει ότι, παρόλο που το ANFIS δεν μπορεί πάντα να επιτύχει την ίδια ακρίβεια σε μεγάλης κλίμακας δεδομένα, υπερτερεί στην ερμηνευσιμότητα και στην αξιοπιστία, ειδικά σε εφαρμογές που απαιτούν την κατανόηση της διαδικασίας λήψης αποφάσεων. Αυτό το χαρακτηριστικό το καθιστά ιδανικό εργαλείο σε τομείς όπως η ιατρική διάγνωση, η ενεργειακή πρόβλεψη  οι χρηματοοικονομικές αναλύσεις, κλπ., όπου η εμπιστοσύνη των χρηστών είναι καθοριστική για την υιοθέτηση των μοντέλων ΤΝ.

Η θεμελιώδης διαφορά σε σχέση με τα black-box μοντέλα έγκειται στο ότι το ANFIS παράγει εγγενώς κανόνες τύπου IF–THEN από τα δεδομένα, οι οποίοι μπορούν να διαβαστούν και να ελεγχθούν από ειδικούς του πεδίου συμβάλλοντας  στην εγκυρότητα αποφάσεων σε περιβάλλοντα υψηλού ρίσκου καθώς ερμηνεύουν τον τρόπο απόφασης τους, με αποτέλεσμα να διευκολύνουν τους χρήστες στην υιοθέτηση των μοντέλων ΤΝ. 


* Γιώργος Ατσαλάκης είναι Οικονομολόγος, Αναπληρωτής Καθηγητής Πολυτεχνείου Κρήτης Εργαστήριο Επιστημονικών Δεδομένων