OpenAI: Οι κυβερνοεπιθέσεις prompt injection είναι ένας μόνιμος κίνδυνος για τους AI browsers
Shutterstock
Shutterstock
TechCrunch

OpenAI: Οι κυβερνοεπιθέσεις prompt injection είναι ένας μόνιμος κίνδυνος για τους AI browsers

Καθώς η OpenAI εργάζεται για να ενισχύσει την ασφάλεια του AI browser Atlas απέναντι σε κυβερνοεπιθέσεις, η εταιρεία παραδέχεται ότι οι επιθέσεις τύπου prompt injection — μια τεχνική που χειραγωγεί πράκτορες Τεχνητής Νοημοσύνης ώστε να ακολουθούν κακόβουλες εντολές, συχνά κρυμμένες σε ιστοσελίδες ή emails — αποτελούν έναν κίνδυνο που δεν πρόκειται να εξαλειφθεί σύντομα.

Όπως αναφέρει το TechCrunch, το γεγονός αυτό εγείρει σοβαρά ερωτήματα για το πόσο με ασφάλεια μπορούν να λειτουργούν οι AI agents στο ανοιχτό διαδίκτυο.

«Το prompt injection, όπως και οι απάτες και η κοινωνική μηχανική στο διαδίκτυο, είναι απίθανο να “λυθεί” ποτέ πλήρως», έγραψε η OpenAI σε ανάρτηση στο blog της τη Δευτέρα, όπου περιγράφει πώς ενισχύει την «πανοπλία» του Atlas απέναντι στις αδιάκοπες επιθέσεις. Η εταιρεία παραδέχθηκε επίσης ότι η λειτουργία «agent mode» στο ChatGPT Atlas «διευρύνει την επιφάνεια απειλών».

Η OpenAI λάνσαρε τον browser ChatGPT Atlas τον Οκτώβριο και σχεδόν άμεσα ερευνητές ασφάλειας έσπευσαν να δημοσιεύσουν δοκιμές, δείχνοντας ότι αρκούσαν λίγες λέξεις σε ένα Google Docs για να αλλάξουν τη συμπεριφορά του υποκείμενου browser.

Την ίδια ημέρα, η Brave δημοσίευσε ανάρτηση εξηγώντας ότι το έμμεσο prompt injection αποτελεί συστημική πρόκληση για τους AI-powered browsers, συμπεριλαμβανομένου του Comet της Perplexity.

Η OpenAI δεν είναι η μόνη που αναγνωρίζει ότι οι επιθέσεις μέσω prompt δεν πρόκειται να εξαφανιστούν. Το Εθνικό Κέντρο Κυβερνοασφάλειας του Ηνωμένου Βασιλείου (NCSC) προειδοποίησε νωρίτερα αυτόν τον μήνα ότι οι επιθέσεις prompt injection κατά εφαρμογών γενετικής AI «ενδέχεται να μην μπορέσουν ποτέ να μετριαστούν πλήρως», εκθέτοντας ιστοσελίδες στον κίνδυνο παραβιάσεων δεδομένων.

Η βρετανική κυβερνητική υπηρεσία συνέστησε στους επαγγελματίες κυβερνοασφάλειας να επικεντρωθούν στη μείωση του κινδύνου και των επιπτώσεων των επιθέσεων, αντί να θεωρούν ότι αυτές μπορούν να «σταματήσουν».

Από την πλευρά της, η OpenAI δήλωσε: «Αντιμετωπίζουμε το prompt injection ως μια μακροπρόθεσμη πρόκληση ασφάλειας στην AI και θα χρειαστεί να ενισχύουμε διαρκώς τις άμυνές μας απέναντί του».

Η απάντηση της εταιρείας σε αυτό το σισύφειο έργο είναι ένας προληπτικός κύκλος ταχείας απόκρισης, ο οποίος — όπως υποστηρίζει — δείχνει ήδη πρώιμα ενθαρρυντικά αποτελέσματα, βοηθώντας στον εντοπισμό νέων στρατηγικών επίθεσης εσωτερικά, πριν αυτές αξιοποιηθούν «στο φυσικό περιβάλλον».