Μια αυξανόμενη μερίδα ερευνητών της Τεχνητής Νοημοσύνης εκτιμά ότι η εμμονή της βιομηχανίας με τα μεγάλα γλωσσικά μοντέλα έχει οδηγήσει σε ένα τεχνολογικό αδιέξοδο, απομακρύνοντας το πεδίο από τον στόχο της πραγματικά ευφυούς μηχανής.
Κεντρική μορφή αυτής της κριτικής είναι ο Yann LeCun, ένας από τους πρωτοπόρους της σύγχρονης Τεχνητής Νοημοσύνης και βασικός αρχιτέκτονας τεχνολογιών που αξιοποιούνται σήμερα σε συστήματα όπως το ChatGPT.
Τον Νοέμβριο, ο LeCun αποχώρησε από τη Meta, όπου για περισσότερα από δέκα χρόνια κατείχε τη θέση του επικεφαλής επιστήμονα Τεχνητής Νοημοσύνης.
Η αποχώρησή του ήρθε σε μια περίοδο κατά την οποία η εταιρεία επένδυε μαζικά στην ανάπτυξη «υπερνοημοσύνης» μέσω της κλιμάκωσης μεγάλων γλωσσικών μοντέλων - μια στρατηγική για την οποία ο ίδιος εξέφραζε ολοένα και μεγαλύτερες επιφυλάξεις.
Αντί να παραμείνει σε έναν ρόλο συμβολικής παρουσίας, επέλεξε να ιδρύσει το Advanced Machine Intelligence Labs, διατυπώνοντας εξαρχής ένα διαφορετικό όραμα: η νοημοσύνη δεν γεννιέται στη γλώσσα, αλλά στη βιωματική κατανόηση του κόσμου.
Σύμφωνα με τον LeCun, τα σημερινά συστήματα δεν «κατανοούν» πραγματικά την πραγματικότητα. Τα μεγάλα γλωσσικά μοντέλα εκπαιδεύονται να προβλέπουν την επόμενη λέξη σε μια ακολουθία και, παρότι επιτυγχάνουν εντυπωσιακά αποτελέσματα σε κείμενο, κώδικα ή εξετάσεις γνώσεων, στερούνται εσωτερικών αναπαραστάσεων του φυσικού κόσμου.
Αυτό αποτυπώνεται σε αδυναμίες όπως η έλλειψη «μονιμότητας αντικειμένου»: σε συνθετικά βίντεο, ένα αντικείμενο μπορεί να αλλάζει μορφή ή να εξαφανίζεται, επειδή το σύστημα δεν αντιλαμβάνεται σταθερούς κανόνες φυσικής συνέχειας.
Η εναλλακτική που προτείνεται είναι τα λεγόμενα «μοντέλα κόσμου»: συστήματα που διαθέτουν εσωτερικές προσομοιώσεις της πραγματικότητας και μπορούν να προβλέπουν συνέπειες πράξεων, να σχεδιάζουν και να μαθαίνουν μέσω αλληλεπίδρασης.
Σε αυτή την κατεύθυνση κινούνται πρωτοβουλίες όπως της Φέι-Φέι Λι με την World Labs και της DeepMind με συστήματα δημιουργίας εικονικών κόσμων, ενώ η Nvidia προωθεί τα παγκόσμια μοντέλα ως θεμέλιο για τη «φυσική» Τεχνητή Νοημοσύνη σε ρομπότ και αυτόνομα οχήματα.
Παρά το αυξανόμενο ενδιαφέρον, τα μοντέλα κόσμου παραμένουν δευτερεύον στοίχημα έναντι της κυρίαρχης επένδυσης στα γλωσσικά μοντέλα. Η ανάπτυξή τους είναι δαπανηρή και η μεταφορά γνώσης από προσομοιωμένα περιβάλλοντα στον πραγματικό κόσμο παραμένει αβέβαιη.
Ωστόσο, η ιστορία δείχνει ότι ιδέες εκτός «μόδας» συχνά δικαιώνονται εκ των υστέρων. Αν το όραμα του LeCun επιβεβαιωθεί, η επόμενη μεγάλη στροφή στην Τεχνητή Νοημοσύνη ίσως έρθει όχι από περισσότερες λέξεις, αλλά από βαθύτερη κατανόηση του ίδιου του κόσμου.
