Κάθε φορά που ένας χρήστης απευθύνει μια ερώτηση στο ChatGPT, ενεργοποιείται μια αλυσίδα επεξεργασίας δεδομένων που περιλαμβάνει μεταφορά πληροφοριών από τη μνήμη, προεπεξεργασία σε CPU, βαριές υπολογιστικές διεργασίες σε GPU και επιστροφή του αποτελέσματος. Η διαδικασία αυτή επαναλαμβάνεται για κάθε νέο token που παράγει το μοντέλο, δημιουργώντας σημαντικό υπολογιστικό και ενεργειακό κόστος.
Το πρόβλημα αυτό, σύμφωνα με ειδικούς του κλάδου, είναι δομικό. Απαιτείται συνεχής δρομολόγηση δεδομένων ανάμεσα σε διαφορετικά υπολογιστικά επίπεδα και ακριβά chips, γεγονός που αυξάνει την κατανάλωση ενέργειας και το κόστος υποδομών. Σε αυτό το πλαίσιο δρα η XCENA, μια νεοφυής εταιρεία με παρουσία στη Νότια Κορέα και τις ΗΠΑ, η οποία επιχειρεί να αναδιαμορφώσει την αρχιτεκτονική επεξεργασίας.
Η εταιρεία έχει αναπτύξει ένα chip που φέρνει τις υπολογιστικές λειτουργίες πιο κοντά στη DRAM, τη μνήμη βραχείας διάρκειας υψηλής ταχύτητας που χρησιμοποιεί ενεργά ένας επεξεργαστής. Με αυτόν τον τρόπο, επιτρέπει την εκτέλεση βασικών λειτουργιών μέσα στη μνήμη, μειώνοντας την ανάγκη συνεχούς μεταφοράς δεδομένων μεταξύ CPU, GPU και μνήμης.
Η προσέγγιση αυτή, αν κλιμακωθεί, θα μπορούσε να μειώσει σημαντικά το κόστος υποδομών Τεχνητής Νοημοσύνης, γεγονός που έχει προσελκύσει το ενδιαφέρον επενδυτών. Η XCENA συγκέντρωσε πρόσφατα 135 εκατομμύρια δολάρια σε γύρο χρηματοδότησης Series B, με αποτίμηση 570 εκατομμυρίων δολαρίων, ανεβάζοντας τη συνολική χρηματοδότηση στα 185 εκατομμύρια.
Η εταιρεία ιδρύθηκε το 2022 από τον CEO Τζιν Κιμ, τον CTO Ντοχούν Κιμ και τον CPO Χάρι Τζουχιουν Κιμ, πρώην στελέχη των Samsung και SK Hynix. Το βασικό της chip, το MX1, συνδέεται με την CPU μέσω του CXL (Compute Express Link), επιτρέποντας επεξεργασία δεδομένων απευθείας στη μνήμη πριν μεταφερθούν σε άλλες μονάδες.
Η XCENA υποστηρίζει ότι λειτουργίες που απαιτούσαν έως και δέκα servers θα μπορούσαν να εκτελούνται σε έναν, εστιάζοντας σε διεργασίες όπως προεπεξεργασία δεδομένων και διαχείριση KV cache, που συνήθως επιβαρύνουν τις CPU. Το MX1 βρίσκεται ακόμη σε πρωτότυπη μορφή, με μαζική παραγωγή να αναμένεται στα τέλη του 2026 μέσω Samsung και εμπορικά έσοδα από το 2027.
Στους ανταγωνιστές της περιλαμβάνονται οι Astera Labs και Marvell, που δραστηριοποιούνται στη διασύνδεση μνήμης επόμενης γενιάς. Η XCENA βασίζεται σε αρχιτεκτονική RISC-V και αναπτύσσει εσωτερικά κρίσιμα υποσυστήματα, επιχειρώντας υψηλό βαθμό κάθετης ολοκλήρωσης.
