OpenAI: Ο Σαμ Άλτμαν ποντάρει σε νέα μοντέλα ήχου Τεχνητής Νοημοσύνης
Shutterstock
Shutterstock
Techcrunch

OpenAI: Ο Σαμ Άλτμαν ποντάρει σε νέα μοντέλα ήχου Τεχνητής Νοημοσύνης

Η OpenAI ποντάρει δυναμικά στην Tεχνητή Nοημοσύνη ήχου και ο στόχος της δεν περιορίζεται απλώς στο να κάνει το ChatGPT να ακούγεται πιο φυσικό. Σύμφωνα με νέο ρεπορτάζ του The Information, η εταιρεία τους τελευταίους δύο μήνες έχει ενοποιήσει ομάδες μηχανικών, προϊόντων και έρευνας, προχωρώντας σε μια συνολική αναδιάρθρωση των audio μοντέλων της.

Όλα αυτά γίνονται ενόψει της παρουσίασης μιας προσωπικής συσκευής με επίκεντρο τον ήχο, η οποία αναμένεται να κυκλοφορήσει περίπου σε έναν χρόνο.

Η στρατηγική αυτή αποτυπώνει μια ευρύτερη τάση στον κλάδο της τεχνολογίας: ένα μέλλον όπου οι οθόνες περνούν στο παρασκήνιο και ο ήχος αποκτά κεντρικό ρόλο. Οι έξυπνοι βοηθοί φωνής έχουν ήδη εγκατασταθεί σε περισσότερα από τα ένα τρίτο των αμερικανικών νοικοκυριών.

Η Meta πρόσφατα παρουσίασε νέα λειτουργία για τα έξυπνα γυαλιά Ray-Ban, αξιοποιώντας συστοιχία πέντε μικροφώνων ώστε να βελτιώνεται η ακρόαση συνομιλιών σε θορυβώδη περιβάλλοντα, μετατρέποντας ουσιαστικά το πρόσωπο του χρήστη σε «κατευθυντικό δέκτη».

Η Google, από την πλευρά της, πειραματίζεται με τα λεγόμενα «Audio Overviews», τα οποία μετατρέπουν τα αποτελέσματα αναζήτησης σε προφορικές, συνομιλιακές περιλήψεις. Παράλληλα, η Tesla ενσωματώνει το chatbot Grok της xAI στα οχήματά της, δημιουργώντας έναν φωνητικό βοηθό που χειρίζεται από την πλοήγηση μέχρι τον κλιματισμό μέσω φυσικού διαλόγου.

Δεν είναι όμως μόνο οι τεχνολογικοί κολοσσοί που επενδύουν σε αυτή την κατεύθυνση. Πολλές νεοφυείς εταιρείες ακολουθούν την ίδια λογική, με ανάμεικτα αποτελέσματα.

Το Humane AI Pin κατέληξε σε αποτυχία αφού «έκαψε» εκατοντάδες εκατομμύρια δολάρια, ενώ το Friend AI pendant, ένα κολιέ που υπόσχεται να καταγράφει τη ζωή του χρήστη και να προσφέρει «συντροφικότητα», έχει προκαλέσει έντονες ανησυχίες για την ιδιωτικότητα.

Την ίδια στιγμή, τουλάχιστον δύο εταιρείες, μεταξύ αυτών η Sandbar και μία υπό την καθοδήγηση του ιδρυτή της Pebble, Έρικ Μιγκόβσκι, αναπτύσσουν έξυπνα δαχτυλίδια Τεχνητής Νοημοσύνης που αναμένεται να παρουσιαστούν το 2026.

Παρότι οι μορφές των συσκευών διαφέρουν, η βασική ιδέα είναι κοινή: ο ήχος αποτελεί τη διεπαφή του μέλλοντος. Το σπίτι, το αυτοκίνητο, ακόμη και το ίδιο το σώμα μετατρέπονται σε επιφάνειες ελέγχου.

Το νέο audio μοντέλο της OpenAI, που προγραμματίζεται για τις αρχές του 2026, φέρεται να προσφέρει πιο φυσική φωνή, να διαχειρίζεται διακοπές όπως ένας πραγματικός συνομιλητής και να μιλά ακόμη και ταυτόχρονα με τον χρήστη - κάτι που τα σημερινά μοντέλα δεν μπορούν να κάνουν.

Παράλληλα, η εταιρεία φέρεται να εξετάζει μια ολόκληρη οικογένεια συσκευών, όπως γυαλιά ή έξυπνα ηχεία χωρίς οθόνη, που θα λειτουργούν περισσότερο ως «σύντροφοι» παρά ως απλά εργαλεία.

Όπως σημειώνει το The Information, ο Τζόνι Άιβ, πρώην επικεφαλής σχεδιασμού της Apple, ο οποίος εντάχθηκε στις προσπάθειες hardware της OpenAI μετά την εξαγορά της εταιρείας του io έναντι 6,5 δισ. δολαρίων, θεωρεί τον σχεδιασμό με επίκεντρο τον ήχο ευκαιρία να διορθωθούν τα λάθη του παρελθόντος και να μειωθεί η εξάρτηση από τις συσκευές.