H κινεζική DeepSeek παρουσίασε αναβαθμισμένο μοντέλο Τεχνητής Νοημοσύνης
AP Photo/Andy Wong
AP Photo/Andy Wong

H κινεζική DeepSeek παρουσίασε αναβαθμισμένο μοντέλο Τεχνητής Νοημοσύνης

Η κινεζική DeepSeek κυκλοφόρησε την Πέμπτη το DeepSeek-V3.1, ένα αναβαθμισμένο μοντέλο Τεχνητής Νοημοσύνης με υβριδική δομή συμπερασμού, ταχύτερη ταχύτητα σκέψης και ισχυρότερη ικανότητα πράξης, σύμφωνα με δήλωση της εταιρείας που δημοσιεύθηκε στο WeChat.

Η εταιρεία θα προσαρμόσει επίσης το κόστος χρήσης του API του μοντέλου, μιας πλατφόρμας που επιτρέπει στους προγραμματιστές άλλων εφαρμογών και διαδικτυακών προϊόντων να ενσωματώνουν τα μοντέλα Τεχνητής Νοημοσύνης της, από τις 6 Σεπτεμβρίου.

Όπως υπενθύμισε το Reuters, η DeepSeek ταράξε τον κόσμο της τεχνολογίας φέτος όταν κυκλοφόρησε μοντέλα Τεχνητής Τοημοσύνης που ανταγωνίζονται τα αντίστοιχα της Δύσης, όπως το ChatGPT της OpenAI, προσφέροντας ταυτόχρονα χαμηλότερο λειτουργικό κόστος.

Η αναβάθμιση του μοντέλου V3 της DeepSeek ακολουθεί δύο άλλες πρόσφατες ενημερώσεις των βασικών μοντέλων της: μια ενημέρωση του μοντέλου R1 τον Μάιο και μια προηγούμενη βελτίωση του V3 τον Μάρτιο.

Για την υποστήριξη εγχώριων τσιπ, η DeepSeek ανέφερε σε μια ανάρτηση στο WeChat ότι η μορφή ακρίβειας UE8M0 FP8 του μοντέλου DeepSeek-V3.1 είναι βελτιστοποιημένη για «εγχώρια τσιπ επόμενης γενιάς που θα κυκλοφορήσουν σύντομα».

Η εταιρεία δεν προσδιόρισε ποια συγκεκριμένα μοντέλα τσιπ ή κατασκευαστές θα υποστηρίζονται.

Το FP8, ή 8-bit floating point, είναι μια μορφή επεξεργασίας δεδομένων που επιτρέπει στα μοντέλα AI να λειτουργούν πιο αποτελεσματικά, χρησιμοποιώντας λιγότερη μνήμη και τρέχοντας ταχύτερα από τις παραδοσιακές μεθόδους.

Το DeepSeek-V3.1 διαθέτει μια υβριδική δομή συμπερασμού που επιτρέπει στο μοντέλο να λειτουργεί τόσο σε λειτουργία συλλογιστικής όσο και σε λειτουργία μη συλλογιστικής, ανέφερε η εταιρεία σε ανάρτηση στο WeChat την Πέμπτη.

Οι χρήστες μπορούν να εναλλάσσονται μεταξύ αυτών των λειτουργιών χρησιμοποιώντας ένα κουμπί «βαθιάς σκέψης» στην επίσημη εφαρμογή και την πλατφόρμα web της εταιρείας, οι οποίες τώρα λειτουργούν με την έκδοση V3.1.