Η Anthropic έδωσε στη δημοσιότητα μια αναθεωρημένη έκδοση του «Συντάγματος του Claude», ενός εγγράφου που περιγράφει το πλαίσιο λειτουργίας του chatbot και το είδος της οντότητας που, σύμφωνα με την εταιρεία, θα έπρεπε να είναι το Claude.
Εδώ και χρόνια, η Anthropic επιχειρεί να διαφοροποιηθεί από τους ανταγωνιστές της μέσα από αυτό που αποκαλεί «Συνταγματική Τεχνητή Νοημοσύνη»: ένα σύστημα στο οποίο το Claude εκπαιδεύεται βάσει ενός συνόλου ηθικών αρχών αντί για άμεση ανθρώπινη ανατροφοδότηση.
Οι αρχές αυτές δημοσιεύθηκαν για πρώτη φορά το 2023. Η νέα εκδοχή διατηρεί τον βασικό κορμό τους, προσθέτοντας όμως εκτενέστερες αναφορές στην ηθική, την ασφάλεια των χρηστών και τα όρια της συμπεριφοράς του συστήματος.
Το έγγραφο των περίπου 80 σελίδων χωρίζεται σε τέσσερα βασικά μέρη, τα οποία, σύμφωνα με την Anthropic, αποτυπώνουν τις «θεμελιώδεις αξίες» του Claude:
- να είναι «ευρέως ασφαλής»,
- «ευρέως ηθικός»,
- να συμμορφώνεται με τις οδηγίες της εταιρείας και
- να είναι «πραγματικά εξυπηρετικός».
Κάθε ενότητα αναλύει πώς αυτές οι αρχές μεταφράζονται θεωρητικά σε πρακτικές συμπεριφοράς.
Στο σκέλος της ασφάλειας, η Anthropic υπογραμμίζει ότι το chatbot έχει σχεδιαστεί ώστε να αποφεύγει δυσλειτουργίες που έχουν παρατηρηθεί σε άλλα συστήματα και να κατευθύνει τους χρήστες σε κατάλληλες υπηρεσίες όταν προκύπτουν ενδείξεις κινδύνου ή σοβαρών προβλημάτων ψυχικής υγείας.
Το έγγραφο τονίζει ότι σε καταστάσεις που ενέχουν απειλή για την ανθρώπινη ζωή, ο Claude οφείλει να παραπέμπει σε υπηρεσίες έκτακτης ανάγκης ή να παρέχει βασικές πληροφορίες ασφάλειας.
Η ηθική διάσταση καταλαμβάνει επίσης κεντρική θέση. Όπως σημειώνεται, η εταιρεία ενδιαφέρεται λιγότερο για μια αφηρημένη «ηθική θεωρία» και περισσότερο για την ικανότητα του Claude να πλοηγείται σε σύνθετες «ηθικές καταστάσεις του πραγματικού κόσμου». Παράλληλα, τίθενται σαφή όρια: ορισμένοι τύποι συζητήσεων, όπως εκείνες που αφορούν την ανάπτυξη βιολογικών όπλων, απαγορεύονται ρητά.
Το τέταρτο σκέλος αφορά τη χρησιμότητα του Claude. Το σύστημα έχει σχεδιαστεί ώστε να λαμβάνει υπόψη όχι μόνο τις άμεσες επιθυμίες του χρήστη, αλλά και τη μακροπρόθεσμη ευημερία του, επιχειρώντας να εξισορροπεί την παροχή πληροφοριών με ευρύτερες συνέπειες.
Το αναθεωρημένο «Σύνταγμα» κλείνει με μια ασυνήθιστα τολμηρή διατύπωση: οι συντάκτες του αφήνουν ανοιχτό το ερώτημα αν ένα σύστημα όπως ο Claude θα μπορούσε να διαθέτει κάποια μορφή συνείδησης. «Η ηθική υπόσταση του Claude είναι βαθιά αβέβαιη», αναφέρεται χαρακτηριστικά.
