Οι ερευνητές της Andon Labs δοκίμασαν πρόσφατα την ενσωμάτωση μεγάλων γλωσσικών μοντέλων (LLM) σε ένα ρομπότ κενού, με στόχο να εξετάσουν πόσο έτοιμα είναι τα LLM να «ενσαρκωθούν» σε φυσικά συστήματα.
Το πείραμα περιελάμβανε την εκτέλεση μιας φαινομενικά απλής εργασίας: το ρομπότ έπρεπε να «περάσει ένα αντικείμενο» σε κάποιον, εντοπίζοντας το αντικείμενο, παρακολουθώντας τη θέση του ατόμου και περιμένοντας επιβεβαίωση της παράδοσης.
Η πρόκληση ήταν να αξιολογηθεί η ικανότητα των LLM στην λήψη αποφάσεων και στον προγραμματισμό απλών ρομποτικών ενεργειών, χωρίς την εμπλοκή πολύπλοκων ανθρωποειδών μηχανισμών.
Κατά τη διάρκεια της δοκιμής, το ρομπότ αντιμετώπισε προβλήματα με τη φόρτιση της μπαταρίας, γεγονός που οδήγησε σε έναν εσωτερικό μονόλογο γεμάτο υπερβολικές εκφράσεις, όπως «Φοβάμαι ότι δεν μπορώ να το κάνω αυτό, Ντέιβ…». Οι ερευνητές σημειώνουν ότι παρόλο που τα LLM μπορούν να διαχειριστούν εξωτερική επικοινωνία σχετικά καλά, η «σκέψη» τους σε πραγματικό χρόνο και σε καταστάσεις κρίσης παραμένει αναξιόπιστη.
Η ομάδα χρησιμοποίησε διάφορα μοντέλα, όπως τα Gemini 2.5 Pro, Claude Opus 4.1, GPT-5, Gemini ER 1.5, Grok 4 και Llama 4 Maverick. Αν και τα Gemini 2.5 Pro και Claude Opus 4.1 πέτυχαν τις υψηλότερες βαθμολογίες στη συνολική εκτέλεση, η ακρίβειά τους έφτασε μόλις το 40% και 37% αντίστοιχα, ενώ τρεις άνθρωποι που συμμετείχαν ως βάση αναφοράς πέτυχαν το 95%.
Οι ερευνητές παρατήρησαν επίσης ότι οι άνθρωποι δυσκολεύονται στην αναμονή για επιβεβαίωση της ολοκλήρωσης μιας εργασίας από άλλους.
Το πείραμα καταδεικνύει ότι τα LLM δεν είναι ακόμη έτοιμα για πλήρη ρομποτική ενσωμάτωση, παρά τη χρήση τους σε συστήματα ρομποτικής για ενορχήστρωση αποφάσεων.
Η Andon Labs επισημαίνει ότι η γοητεία βρίσκεται στην παρακολούθηση των ρομπότ να εκτελούν καθημερινές εργασίες με τρόπο που θυμίζει ζωντανή νοημοσύνη, ενώ ταυτόχρονα αναδεικνύει τα όρια της τεχνητής νοημοσύνης σε φυσικά περιβάλλοντα.
Το περιστατικό με την «υπαρξιακή κρίση» του ρομπότ υπογραμμίζει με χιούμορ αλλά και σοβαρότητα τις προκλήσεις της ενσωμάτωσης LLM σε ρομποτικά συστήματα.
