Η OpenAI, δημιουργός του ChatGPT, παρουσίασε μια νέα αξιολόγηση με την ονομασία GDPval, που μετρά την ικανότητα των μοντέλων Τεχνητής Νοημοσύνης να εκτελούν οικονομικά πολύτιμες, πραγματικές εργασίες σε 44 επαγγέλματα.

Στόχος, όπως αναφέρει η εταιρεία, είναι να προσφέρει μια τεκμηριωμένη εικόνα για το τι μπορούν ήδη να κάνουν τα μοντέλα, ώστε οι συζητήσεις για τη μελλοντική πρόοδο της Τεχνητής Νοημοσύνης να βασίζονται σε στοιχεία και όχι σε εικασίες.

Η αξιολόγηση θεωρείται μία από τις πιο άμεσες προσπάθειες της OpenAI να αποδείξει την πρακτική και οικονομική αξία των μοντέλων της, σε μια περίοδο έντονης αμφισβήτησης για το κατά πόσο η τεχνολογία μπορεί να αποδειχθεί βιώσιμη. Ειδικοί έχουν επικρίνει στο παρελθόν τις υπερβολικές διακηρύξεις της εταιρείας, όπως τη δήλωση του διευθύνοντος συμβούλου Σαμ Άλτμαν ότι το GPT-5 έχει «νοημοσύνη επιπέδου διδακτορικού».

Η OpenAI πάντως τονίζει ότι η Τεχνητή Νοημοσύνη δεν στοχεύει στην αντικατάσταση ανθρώπων, αλλά στη στήριξη της εργασίας τους. Ωστόσο, παραδέχεται ότι τα μοντέλα έχουν ακόμη σημαντικούς περιορισμούς, όπως λανθασμένες απαντήσεις (hallucinations) και αδυναμία διαχείρισης περίπλοκων, απρόβλεπτων εργασιών.

Σύμφωνα με την εταιρεία, τα σημερινά μοντέλα μπορούν να εκτελούν επαναλαμβανόμενα, καλά ορισμένα καθήκοντα ταχύτερα και φθηνότερα από τους ανθρώπους, αλλά η πλειονότητα των πραγματικών εργασιών παραμένει πιο σύνθετη.

Αυτά είναι τα 44 επαγγέλματα: