Σε μια σημαντική αναβάθμιση της πλατφόρμας ChatGPT προχώρησε η OpenAI, παρουσιάζοντας το μοντέλο Images 2.0. Η νέα γεννήτρια εικόνων υπόσχεται να λύσει «χρόνια προβλήματα» της Tεχνητής Nοημοσύνης, προσφέροντας βελτιωμένη απόδοση κειμένου και δυνατότητα διαχείρισης σύνθετων εντολών που μέχρι πρότινος δυσκόλευαν τα υπάρχοντα μοντέλα.
Η καινοτομία του «Thinking Mode»
Η ειδοποιός διαφορά στη νέα έκδοση είναι η εισαγωγή του «thinking mode» (λειτουργία σκέψης).
Πρόκειται για ένα σύστημα ενσωματωμένης συλλογιστικής που επιτρέπει στο μοντέλο να «επεξεργάζεται» βαθύτερα το αίτημα του χρήστη πριν δημιουργήσει το τελικό αποτέλεσμα. Αν και η διαδικασία αυτή απαιτεί περισσότερο χρόνο, το αποτέλεσμα είναι ακριβέστερο και πιο λεπτομερές.
Η βασική έκδοση είναι διαθέσιμη σε όλους τους χρήστες, ενώ το «thinking mode» προορίζεται αποκλειστικά για τους συνδρομητές, ενώ υποστηρίζονται πλέον πολλαπλές αναλογίες διαστάσεων (aspect ratios), διευκολύνοντας τους επαγγελματίες.
Από τη viral διασκέδαση στην επαγγελματική χρήση
Παρόλο που η OpenAI προσδοκά νέα «viral» κύματα στα social media —αντίστοιχα με το περσινό στυλ Studio Ghibli— ο πραγματικός στόχος είναι η επαγγελματική αγορά. Η Adele Li, product manager της εταιρείας, τόνισε πως το μοντέλο είναι πλέον ένας «δημιουργικός βοηθός» ικανός να παράγει διαφημιστικό υλικό, αφίσες και mock-ups υψηλών προδιαγραφών.
Η κίνηση αυτή έρχεται ως απάντηση στον έντονο ανταγωνισμό, καθώς η πρωτοκαθεδρία στον χώρο της παραγωγικής ΤΝ (Generative AI) αλλάζει χέρια ταχύτατα. Με το Nano Banana της Google να έχει κερδίσει σημαντικό έδαφος το προηγούμενο έτος, η OpenAI επιχειρεί να ανακτήσει τα ηνία, ποντάροντας στη σύνδεση της δημιουργικότητας με τη λογική.
