«Το κενό της ενίσχυσης»: Γιατί κάποιες δεξιότητες της Τεχνητής Νοημοσύνης βελτιώνονται πιο γρήγορα από άλλες
Shutterstock
Shutterstock
Techcrunch

«Το κενό της ενίσχυσης»: Γιατί κάποιες δεξιότητες της Τεχνητής Νοημοσύνης βελτιώνονται πιο γρήγορα από άλλες

Η πρόοδος της Τεχνητής Νοημοσύνης δεν είναι ομοιόμορφη σε όλα τα πεδία. Τα εργαλεία προγραμματισμού με AI, όπως τα GPT-5, Gemini 2.5 και Sonnet 2.4, βελτιώνονται ραγδαία χάρη στην ενισχυτική μάθηση (reinforcement learning - RL), που βασίζεται σε δισεκατομμύρια αυτοματοποιημένες, επαναλήψιμες δοκιμές με σαφή κριτήρια επιτυχίας ή αποτυχίας. Αυτό επιτρέπει στα μοντέλα να μαθαίνουν γρήγορα πώς να παράγουν λειτουργικό κώδικα υψηλής ποιότητας.

Αντίθετα, άλλες δεξιότητες, όπως η συγγραφή emails ή οι συνομιλίες μέσω chatbot, εξελίσσονται πολύ πιο αργά, επειδή η ποιότητα αυτών των εργασιών είναι πιο υποκειμενική και δύσκολα μετρήσιμη σε μεγάλη κλίμακα. Αυτή η διαφορά δημιούργησε το λεγόμενο «κενό ενίσχυσης» (reinforcement gap), το οποίο διαχωρίζει τις ικανότητες που μπορούν να αξιολογηθούν και βελτιωθούν μέσω RL από αυτές που δεν μπορούν.

Ο προγραμματισμός αποτελεί ιδανικό πεδίο για την εφαρμογή της ενισχυτικής μάθησης, καθώς ήδη πριν από την έλευση της AI βασιζόταν σε πολλές και αυστηρές δοκιμές (unit testing, integration testing, δοκιμές ασφάλειας κ.ά.), που βοηθούν τους προγραμματιστές να διασφαλίσουν τη σωστή λειτουργία του κώδικα. Αυτές οι δοκιμές διευκολύνουν επίσης την εκπαίδευση και την αξιολόγηση των AI συστημάτων με επαναληπτικό και αποτελεσματικό τρόπο.

Ωστόσο, ορισμένες διαδικασίες που παλαιότερα θεωρούνταν δύσκολες στην αξιολόγηση, όπως η παραγωγή ρεαλιστικού βίντεο με AI, αποδεικνύεται ότι είναι πιο εφικτές. Η μεγάλη πρόοδος του μοντέλου Sora 2 της OpenAI δείχνει ότι αντικείμενα στο βίντεο δεν εμφανίζονται και εξαφανίζονται ξαφνικά, τα πρόσωπα διατηρούν την ταυτότητά τους και οι νόμοι της φυσικής τηρούνται με ακρίβεια. Πιθανότατα, πίσω από αυτές τις βελτιώσεις κρύβονται ισχυρά συστήματα ενισχυτικής μάθησης, που αξιολογούν και βελτιώνουν μεμονωμένες πτυχές της παραγωγής βίντεο.

Καθώς η RL παραμένει το βασικό εργαλείο για την ανάπτυξη προϊόντων AI, το ποια καθήκοντα μπορούν να αξιολογηθούν μαζικά θα καθορίσει ποιες εργασίες και επαγγέλματα θα αυτοματοποιηθούν. Το ερώτημα για το ποιοι τομείς, όπως η υγειονομική περίθαλψη ή η λογιστική, μπορούν να εκπαιδευτούν με RL έχει τεράστιες συνέπειες για το μέλλον της οικονομίας. Με εκπλήξεις όπως το Sora 2, ίσως δεν θα χρειαστεί να περιμένουμε πολύ για να δούμε τις απαντήσεις.