TurboQuant: Ο αλγόριθμος της Google που υπόσχεται επανάσταση στη μνήμη της Τεχνητής Νοημοσύνης

Techcrunch

TurboQuant: Ο αλγόριθμος της Google που υπόσχεται επανάσταση στη μνήμη της Τεχνητής Νοημοσύνης

26/03/2026 • 13:07

ΤΕΧΝΟΛΟΓΙΑ

26/03/2026 • 13:07

ΤΕΧΝΟΛΟΓΙΑ

Σε μια κίνηση που πολλοί αναλυτές παραλληλίζουν με το φανταστικό startup «Pied Piper» της σειράς Silicon Valley, η Google Research ανακοίνωσε το TurboQuant, έναν πρωτοποριακό αλγόριθμο συμπίεσης μνήμης που υπόσχεται να λύσει ένα από τα μεγαλύτερα προβλήματα στην ανάπτυξη της Τεχνητής Νοημοσύνης.

Η νέα τεχνολογία, η οποία θα παρουσιαστεί επίσημα στο συνέδριο ICLR 2026 τον επόμενο μήνα, στοχεύει στον περιορισμό της «μνήμης εργασίας» (KV cache) των μοντέλων AI. Σύμφωνα με τους ερευνητές της Google, το TurboQuant μπορεί να συρρικνώσει τις απαιτήσεις μνήμης κατά τουλάχιστον έξι φορές (6x), χωρίς να θυσιάσει την ακρίβεια ή την ταχύτητα επεξεργασίας.

Introducing TurboQuant: Our new compression algorithm that reduces LLM key-value cache memory by at least 6x and delivers up to 8x speedup, all with zero accuracy loss, redefining AI efficiency. Read the blog to learn how it achieves these results: https://t.co/CDSQ8HpZoc pic.twitter.com/9SJeMqCMlN
— Google Research (@GoogleResearch) March 24, 2026

Η ανακοίνωση προκάλεσε αίσθηση στην τεχνολογική κοινότητα, με στελέχη όπως ο CEO της Cloudflare, Matthew Prince, να κάνουν λόγο για τη «στιγμή DeepSeek» της Google. Ο παραλληλισμός αφορά το κινεζικό μοντέλο που κατάφερε να ανταγωνιστεί τους κολοσσούς του κλάδου χρησιμοποιώντας ένα κλάσμα των υπολογιστικών πόρων.

Στην καρδιά του TurboQuant βρίσκονται δύο καινοτόμες μέθοδοι, το PolarQuant, μια προηγμένη τεχνική διανυσματικής κβαντοποίησης (vector quantization) και το QJL (Quantized Johnson-Lindenstrauss), μια μέθοδος βελτιστοποίησης που επιτρέπει στα δεδομένα να «συμπιέζονται» σε χαμηλότερες διαστάσεις, διατηρώντας όμως τις κρίσιμες μαθηματικές τους σχέσεις.

Αν και ο ενθουσιασμός είναι διάχυτος, οι ειδικοί συστήνουν ψυχραιμία, καθώς σε αντίθεση με το τηλεοπτικό «Pied Piper» που άλλαξε τα πάντα στο computing, το TurboQuant εστιάζει αποκλειστικά στο στάδιο της εκτέλεσης (inference) και όχι στην εκπαίδευση (training) των μοντέλων.

Αυτό σημαίνει ότι ενώ το AI θα γίνει φθηνότερο και ταχύτερο στη χρήση του, οι τεράστιες ανάγκες σε RAM για τη δημιουργία νέων μοντέλων παραμένουν ως έχουν.

Παρόλα αυτά, η δυνατότητα να τρέχουν ισχυρά μοντέλα AI σε λιγότερο ακριβό υλικό θα μπορούσε να εκδημοκρατίσει την πρόσβαση στην τεχνολογία, μειώνοντας δραστικά το λειτουργικό κόστος για τις επιχειρήσεις.

Προς το παρόν, το TurboQuant παραμένει σε εργαστηριακό στάδιο και η πραγματική δοκιμασία θα έρθει με την ευρύτερη εφαρμογή του σε πραγματικές συνθήκες, όπου θα φανεί αν η Google κατάφερε όντως να ξεκλειδώσει το «ιερό δισκοπότηρο» της συμπίεσης δεδομένων.

TurboQuant

GOOGLE RESEARCH

ΕΙΔΗΣΕΙΣ ΤΩΡΑ