Έρχονται τα ρομπότ που θα μας κρατούν το χέρι;

Έρχονται τα ρομπότ που θα μας κρατούν το χέρι;

06/11/2021 • 17:18

06/11/2021 • 17:18

Σφυρηλατούν χαλύβδινες δοκούς ακούραστα. Συγκολλούν αμαξώματα με ακρίβεια χιλιοστού. Ξεναγούν τους επισκέπτες των μουσείων, μιλώντας άπταιστα δεκάδες γλώσσες. Άλλα όλα αυτά τα κάνουν μηχανικά, κατόπιν επακριβούς προγραμματισμού με χιλιάδες γραμμές κώδικα. Ακόμη και το πιο εξελιγμένο ρομπότ δεν μπορεί να πραγματοποιήσει βασικές κοινωνικές αλληλεπιδράσεις που είναι κρίσιμες για την καθημερινή ανθρώπινη ζωή. Ευτυχώς, για ορισμένους, δυστυχώς σύμφωνα με κάποιους άλλους.

Αυτό το αποστειρωμένο πλαίσιο λειτουργίας των ρομπότ επιχειρούν να διαρρήξουν ερευνητές του MIT που ενσωμάτωσαν ορισμένες κοινωνικές αλληλεπιδράσεις σε μηχανές, επιτρέποντάς τους να «κατανοήσουν» τι σημαίνει να βοηθάς ή να εμποδίζεις αλλά και να μάθουν να εκτελούν αυτές τις κοινωνικές συμπεριφορές μόνα τους.

Η εκπαίδευση έλαβε χώρα σε ένα προσομοιωμένο, δισδιάστατο, περιβάλλον, όπου τα ρομπότ παρακολουθούν τον σύντροφό τους, μαντεύουν ποια εργασία θέλει να ολοκληρώσει και στη συνέχεια βοηθούν ή εμποδίζουν με βάση τους δικούς του στόχους.

Στο περιβάλλον προσομοίωσης τα ρομπότ επιδιώκουν φυσικούς και κοινωνικούς στόχους. Για παράδειγμα, ο φυσικός στόχος ενός ρομπότ μπορεί να είναι να πλοηγηθεί γύρω από ένα εμπόδιο. Ο κοινωνικός στόχος, από την άλλη, είναι να μαντέψει τι προσπαθεί να κάνει ένα άλλο ρομπότ και στη συνέχεια να ενεργήσει με βάση αυτή την εκτίμηση.

Φυσικά, τα παραπάνω δεν είναι αποτέλεσμα κάποιας έμφυτης ικανότητας. Καμία μηχανή δεν κατανοεί την έννοια της βοήθειας, με ανθρώπινα σταθμά. Ένας αλγόριθμος φροντίζει να κωδικοποιήσει και να αποκωδικοποιήσει τον όρο «βοήθεια».

Το ρομπότ ανταμείβεται για τις ενέργειες που εκτελεί και το φέρνουν πιο κοντά στην επίτευξη των στόχων του. Εάν ένα ρομπότ προσπαθεί να βοηθήσει τον σύντροφό του, ο αλγόριθμος προσαρμόζει την ανταμοιβή, με τη μορφή εντολών. Το αντίστροφο, αν προσπαθεί να εμποδίσει. Ο αλγόριθμος που αποφασίζει ποιες ενέργειες πρέπει να κάνει το ρομπότ, χρησιμοποιεί την ανταμοιβή για να καθοδηγήσει το ρομπότ στην πραγματοποίηση ενός μείγματος φυσικών και κοινωνικών στόχων.

Για να ελέγξουν αυτό το μοντέλο σε σύγκριση με τις ανθρώπινες κοινωνικές αλληλεπιδράσεις, οι ερευνητές δημιούργησαν 98 διαφορετικά σενάρια. Δώδεκα άνθρωποι παρακολούθησαν 196 βίντεο κλιπ αλληλεπίδρασης των ρομπότ και στη συνέχεια κλήθηκαν να εκτιμήσουν τη φυσική και κοινωνική αλληλεπίδραση αυτών των ρομπότ.

Στις περισσότερες περιπτώσεις, οι άνθρωποι - παρατηρητές εντόπισαν κοινωνικές αλληλεπιδράσεις στις ενέργειες των ρομπότ.

Το επόμενο στάδιο εξέλιξης αφορά την ανάπτυξη ενός τρισδιάστατου συστήματος δοκιμών, σε ένα περιβάλλον που επιτρέπει πολλούς περισσότερους τύπους αλληλεπιδράσεων, όπως ο χειρισμός οικιακών αντικειμένων. Οι ερευνητές του ΜΙΤ θέλουν, επίσης, να ενσωματώσουν στο μοντέλο έναν αλγόριθμο βασισμένο σε νευρωνικό δίκτυο, ο οποίος μαθαίνει από την εμπειρία και αποδίδει ταχύτερα. Όπως ένα μικρό παιδί που αφού του δείξεις για πρώτη φορά πως να κρατά το κουτάλι, ανοίγεις μπροστά του μια ζωή... γευστικών εξερευνήσεων.