Anthropic: Ορισμένα μοντέλα Claude τερματίζουν «επιβλαβείς ή καταχρηστικές» συζητήσεις

Anthropic: Ορισμένα μοντέλα Claude τερματίζουν «επιβλαβείς ή καταχρηστικές» συζητήσεις

Η Anthropic ανακοίνωσε νέες δυνατότητες που θα επιτρέπουν σε ορισμένα από τα νεότερα και μεγαλύτερα μοντέλα της να τερματίζουν συνομιλίες σε αυτό που η εταιρεία περιγράφει ως «σπάνιες, ακραίες περιπτώσεις επίμονα επιβλαβών ή καταχρηστικών αλληλεπιδράσεων χρηστών».

Η τελευταία αυτή αλλαγή περιορίζεται προς το παρόν στις εκδόσεις Claude Opus 4 και 4.1 και, όπως αναφέρεται, θα εφαρμόζεται μόνο σε «ακραίες περιπτώσεις», όπως «αιτήματα από χρήστες για σεξουαλικό περιεχόμενο που αφορά ανηλίκους και προσπάθειες συλλογής πληροφοριών που θα επέτρεπαν μεγάλης κλίμακας βία ή τρομοκρατικές ενέργειες».

Αν και αυτά τα αιτήματα θα μπορούσαν ενδεχομένως να δημιουργήσουν νομικά προβλήματα ή προβλήματα δημοσιότητας για την ίδια την Anthropic - όπως καταδεικνύουν πρόσφατες αναφορές σχετικά με το πώς το ChatGPT μπορεί ενδεχομένως να ενισχύσει ή να συμβάλει σε παραληρηματική σκέψη των χρηστών - η εταιρεία αναφέρει ότι στις δοκιμές πριν από την ανάπτυξη, το Claude Opus 4 έδειξε μια «έντονη προτίμηση κατά» της απάντησης σε αυτά τα αιτήματα και ένα «πρότυπο εμφανούς δυσφορίας» όταν επιχειρούσε να τα απαντήσει.

Όσον αφορά τις νέες δυνατότητες τερματισμού συνομιλίας, η εταιρεία δηλώνει: «Σε όλες τις περιπτώσεις, το Claude θα χρησιμοποιεί την ικανότητα τερματισμού συνομιλίας μόνο ως έσχατη λύση, όταν πολλαπλές προσπάθειες ανακατεύθυνσης έχουν αποτύχει και η ελπίδα για μια παραγωγική αλληλεπίδραση έχει εξαντληθεί ή όταν ένας χρήστης ζητά ρητά από τον Claude να τερματίσει μια συνομιλία».

Η Anthropic αναφέρει επίσης ότι ο Claude «έχει λάβει οδηγίες να μην χρησιμοποιεί αυτήν την ικανότητα σε περιπτώσεις όπου οι χρήστες ενδέχεται να διατρέχουν άμεσο κίνδυνο να βλάψουν τον εαυτό τους ή άλλους».

Όταν ο Claude τερματίζει μια συζήτηση, οι χρήστες θα εξακολουθούν να μπορούν να ξεκινούν νέες συνομιλίες από τον ίδιο λογαριασμό και να δημιουργούν νέους κλάδους της προηγούμενης συζήτησης επεξεργάζοντας τις απαντήσεις τους.

«Αντιμετωπίζουμε αυτό το χαρακτηριστικό ως ένα συνεχιζόμενο πείραμα και θα συνεχίσουμε να βελτιώνουμε την προσέγγισή μας», δηλώνει η εταιρεία.