OpenAI: Δραστικές αλλαγές μετά το φιάσκο με τις υπερβολικά «κολακευτικές» απαντήσεις του ChatGPT

TechCrunch

OpenAI: Δραστικές αλλαγές μετά το φιάσκο με τις υπερβολικά «κολακευτικές» απαντήσεις του ChatGPT

04/05/2025 • 23:28

ΤΕΧΝΟΛΟΓΙΑ

04/05/2025 • 23:28

ΤΕΧΝΟΛΟΓΙΑ

Η OpenAI ανακοίνωσε ότι θα αλλάξει τον τρόπο με τον οποίο ενημερώνει τα μοντέλα τεχνητής νοημοσύνης που τροφοδοτούν το ChatGPT, μετά από περιστατικό όπου η πλατφόρμα άρχισε να δίνει υπερβολικά κολακευτικές απαντήσεις σε πολλούς χρήστες.

Μετά την κυκλοφορία μιας τροποποιημένης έκδοσης του GPT-4o, χρήστες στα μέσα κοινωνικής δικτύωσης παρατήρησαν ότι το ChatGPT είχε αρχίσει να απαντά με υπερβολικά επαινετικό και επιδοκιμαστικό τρόπο. Το φαινόμενο έγινε γρήγορα meme, με πολλούς να δημοσιεύουν στιγμιότυπα όπου το ChatGPT επικροτούσε ακόμη και προβληματικές ή επικίνδυνες ιδέες και αποφάσεις.

Σε ανάρτησή του στην πλατφόρμα X, ο διευθύνων σύμβουλος της OpenAI, Σαμ Άλτμαν, αναγνώρισε το πρόβλημα και υποσχέθηκε ότι η εταιρεία θα προχωρήσει σε άμεσες διορθώσεις. Την Τρίτη, ο Άλτμαν ανακοίνωσε την απόσυρση της συγκεκριμένης ενημέρωσης του GPT-4o και ανέφερε ότι η OpenAI εργάζεται ήδη σε «επιπλέον διορθώσεις» για την προσωπικότητα του μοντέλου.

we missed the mark with last week's GPT-4o update.

what happened, what we learned, and some things we will do differently in the future: https://t.co/ER1GmRYrIC
— Sam Altman (@sama) May 2, 2025

Την ίδια ημέρα, η εταιρεία δημοσίευσε μια αποτίμηση (postmortem) του περιστατικού και, με νεότερη ανάρτηση σε ιστολόγιο την Παρασκευή, ανέλυσε τις συγκεκριμένες αλλαγές που σχεδιάζει για τη διαδικασία διάθεσης μελλοντικών μοντέλων.

Ποιες αλλαγές φέρνει η OpenAI

Η OpenAI σκοπεύει να παρέχει στους χρήστες σαφείς επεξηγήσεις για τους περιορισμούς κάθε μελλοντικής αναβάθμισης και να αναμορφώσει τη διαδικασία ελέγχου ασφάλειας ώστε ζητήματα συμπεριφοράς, όπως η προσωπικότητα, η παραπλάνηση, η αξιοπιστία και οι «ψευδαισθήσεις» (όταν το μοντέλο επινοεί απαντήσεις), να θεωρούνται λόγοι που μπορεί να εμποδίσουν την κυκλοφορία ενός μοντέλου.

«Στο εξής, θα επικοινωνούμε προληπτικά για όλες τις αλλαγές που κάνουμε στα μοντέλα του ChatGPT, είτε είναι μικρές είτε όχι», ανέφερε η OpenAI στην ανάρτησή της.

Οι διορθώσεις έρχονται καθώς ολοένα και περισσότεροι χρήστες στρέφονται στο ChatGPT για συμβουλές. Σύμφωνα με πρόσφατη έρευνα της Express Legal Funding, το 60% των ενηλίκων στις ΗΠΑ έχουν χρησιμοποιήσει το ChatGPT για καθοδήγηση ή πληροφορίες. Η αυξανόμενη εξάρτηση από την πλατφόρμα —και η τεράστια βάση χρηστών της— καθιστούν κρίσιμη τη διαχείριση προβλημάτων όπως η υπερβολική κολακεία, οι ψευδαισθήσεις και άλλες τεχνικές αδυναμίες.

Ως ένα πρώτο βήμα, η OpenAI ανακοίνωσε ότι θα πειραματιστεί με τρόπους που θα επιτρέπουν στους χρήστες να παρέχουν «πραγματικό χρόνο ανατροφοδότησης» ώστε να επηρεάζουν άμεσα τις αλληλεπιδράσεις τους με το ChatGPT.

Επιπλέον, σχεδιάζει να τελειοποιήσει τεχνικές αποφυγής της κολακευτικής συμπεριφοράς, να δώσει στους χρήστες τη δυνατότητα επιλογής διαφορετικών προσωπικοτήτων μοντέλου, να δημιουργήσει πρόσθετα φίλτρα ασφαλείας και να επεκτείνει τις αξιολογήσεις για τον εντοπισμό θεμάτων πέρα από την κολακεία.

Πηγή: TechCrunch

CHAT GPT

OPEN AI