Τη Δευτέρα, η Anthropic ανακοίνωσε το Opus 4.5, την πιο πρόσφατη έκδοση του κορυφαίου της μοντέλου. Πρόκειται για το τελευταίο μοντέλο της σειράς 4.5 της Anthropic, μετά την κυκλοφορία των Sonnet 4.5 τον Σεπτέμβριο και Haiku 4.5 τον Οκτώβριο.
Σύμφωνα με το TechCrunch, όπως αναμενόταν, η νέα έκδοση του Opus παρουσιάζει κορυφαία απόδοση σε μια σειρά από ορόσημα, συμπεριλαμβανομένων των coding benchmarks (SWE-Bench και Terminal-bench), της χρήσης εργαλείων (tau2-bench και MCP Atlas) και της γενικής επίλυσης προβλημάτων (ARC-AGI 2, GPQA Diamond).
Αξιοσημείωτο είναι ότι το Opus 4.5 είναι το πρώτο μοντέλο που ξεπέρασε το 80% στο SWE-Bench Verified, ένα από τα πιο αξιόπιστα ορόσημα προγραμματισμού.
Η Anthropic τόνισε επίσης τις δυνατότητες του Opus στη χρήση υπολογιστή και υπολογιστικών φύλλων, και παρουσίασε παράλληλα μια σειρά προϊόντων για να δείξει πώς αποδίδει σε αυτά τα περιβάλλοντα. Μαζί με το Opus 4.5, η εταιρεία θα διαθέσει ευρύτερα τα προϊόντα Claude for Chrome και Claude for Excel — που βρίσκονταν προηγουμένως σε πιλοτική φάση.
Η επέκταση Chrome θα είναι διαθέσιμη σε όλους τους χρήστες Max, ενώ η έκδοση για Excel θα είναι διαθέσιμη σε χρήστες Max, Team και Enterprise.
Το Opus 4.5 έρχεται επίσης με βελτιώσεις στη μνήμη για εργασίες μεγάλης διάρκειας, κάτι που απαιτούσε σημαντικές αλλαγές στον τρόπο διαχείρισης της μνήμης από το μοντέλο.
«Έχουμε κάνει βελτιώσεις στην ποιότητα της μακράς μνήμης κατά την εκπαίδευση με το Opus 4.5», δήλωσε η Dianne Na Penn, υπεύθυνη διαχείρισης προϊόντων έρευνας στην Anthropic, στο TechCrunch.
Αυτές οι αλλαγές επέτρεψαν επίσης τη λειτουργία «απεριόριστης συνομιλίας» για τους επί πληρωμή χρήστες του Claude, επιτρέποντας στις συνομιλίες να συνεχίζονται χωρίς διακοπή όταν το μοντέλο φτάνει το όριο του παραθύρου συμφραζομένων. Αντί για διακοπή, το μοντέλο συμπιέζει τη μνήμη του χωρίς να ειδοποιεί τον χρήστη.
