Η Google παρουσίασε μια νέα λειτουργία στο Gemini API που, όπως υποστηρίζει, θα μειώσει σημαντικά το κόστος χρήσης των τελευταίων μοντέλων Τεχνητής Νοημοσύνης για τους εξωτερικούς προγραμματιστές.

Όπως αναφέρει το TechCrunch, η λειτουργία ονομάζεται «implicit caching» (έμμεση προσωρινή αποθήκευση) και έχει σχεδιαστεί για να προσφέρει έως και 75% εξοικονόμηση κόστους σε περιπτώσεις επαναλαμβανόμενου περιεχομένου (context) που αποστέλλεται στα μοντέλα μέσω του API.

Η λειτουργία είναι συμβατή με τα μοντέλα Gemini 2.5 Pro και 2.5 Flash, και ενεργοποιείται αυτόματα, χωρίς να απαιτείται ρύθμιση από τον χρήστη.

We just shipped implicit caching in the Gemini API, automatically enabling a 75% cost savings with the Gemini 2.5 models when your request hits a cache 🚢



We also lowered the min token required to hit caches to 1K on 2.5 Flash and 2K on 2.5 Pro!