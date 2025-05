Η εταιρεία Τεχνητής Νοημοσύνης (AI) Anthropic ανέφερε ότι οι δοκιμές του νέου της συστήματος αποκάλυψαν πως μερικές φορές αυτό είναι πρόθυμο να προβεί σε «εξαιρετικά επιβλαβείς ενέργειες», όπως η προσπάθεια εκβιασμού προγραμματιστών που δήλωναν ότι θα το αντικαταστήσουν.

Η εταιρεία λάνσαρε την Πέμπτη το Claude Opus 4, αναφέροντας ότι έθεσε «νέα πρότυπα στον προγραμματισμό, την προηγμένη συλλογιστική και τους πράκτορες Τεχνητής Νοημοσύνης».

Ωστόσο, σε συνοδευτική έκθεση παραδέχθηκε πως το μοντέλο Τεχνητής Νοημοσύνης μπορεί να προβεί σε «ακραίες ενέργειες» αν θεωρήσει ότι απειλείται η «αυτοσυντήρησή» του.

Τέτοιες αντιδράσεις ήταν «σπάνιες και δύσκολα προκαλούμενες», αλλά «παρόλα αυτά πιο συχνές σε σύγκριση με προηγούμενα μοντέλα», σύμφωνα με την εταιρεία.

Η δυνητικά προβληματική συμπεριφορά των μοντέλων Τεχνητής Νοημοσύνης δεν περιορίζεται στα μοντέλα της Anthropic. Ορισμένοι ειδικοί προειδοποιούν ότι η ικανότητα χειραγώγησης των χρηστών αποτελεί βασικό κίνδυνο που σχετίζεται με όλα τα συστήματα, καθώς γίνονται ολοένα πιο ικανά.

Σχολιάζοντας στο X, ο Aengus Lynch, ερευνητής ασφάλειας Τεχνητής Νοημοσύνης στην Anthropic, τόνισε: «Δεν αφορά μόνο τον Claude. Βλέπουμε εκβιασμό σε όλα τα μοντέλα μεθορίου, ανεξαρτήτως των στόχων που τους ανατίθενται».

