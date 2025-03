Το κοινωνικό δίκτυο Bluesky δημοσίευσε πρόσφατα μια πρόταση στο GitHub περιγράφοντας νέες επιλογές που θα μπορούσε να δώσει στους χρήστες του, για να δηλώσουν αν θέλουν να γίνεται απόσπαση των αναρτήσεων και των δεδομένων τους για διαδικασίες όπως η γενετική εκπαίδευση AI και η δημόσια αρχειοθέτηση, σύμφωνα με το TechCrunch.

Ο διευθύνων σύμβουλος Jay Graber συζήτησε την πρόταση νωρίτερα αυτή την εβδομάδα, ενώ βρισκόταν στη σκηνή του South by Southwest, αλλά προσέλκυσε νέα προσοχή το βράδυ της Παρασκευής, αφού δημοσίευσε σχετικά στο Bluesky.



Ορισμένοι χρήστες αντέδρασαν με ανησυχία για τα σχέδια της εταιρείας, τα οποία είδαν ως αντιστροφή της προηγούμενης επιμονής της Bluesky ότι δε θα πουλήσει δεδομένα χρηστών σε διαφημιστές και δε θα εκπαιδεύσει Τεχνητή Νοημοσύνη σε αναρτήσεις χρηστών.

«Ω, διάολε, όχι!» έγραψε ο χρήστης Sketchette. «Η ομορφιά αυτής της πλατφόρμας ήταν η ΜΗ ανταλλαγή πληροφοριών. Ιδιαίτερα η γενική Τεχνητή Νοημοσύνη. Μην υποκύψετε τώρα».

Ο Graber απάντησε ότι οι εταιρείες γεννητικής AI «ήδη ξύνουν δημόσια δεδομένα από όλο τον ιστό», μεταξύ άλλων και από το Bluesky, αφού «τα πάντα στο Bluesky είναι δημόσια, όπως ένας ιστότοπος είναι δημόσιος». Είπε λοιπόν ότι η Bluesky προσπαθεί να δημιουργήσει ένα «νέο πρότυπο» για να ρυθμίσει αυτό το scraping, παρόμοιο με το αρχείο robots.txt που χρησιμοποιούν οι ιστότοποι για να κοινοποιούν τα δικαιώματά τους στους web crawlers.

Οι συζητήσεις σχετικά με την εκπαίδευση της Τεχνητής Νοημοσύνης και τα πνευματικά δικαιώματα έχουν φέρει το robots.txt στο προσκήνιο, τονίζοντας μεταξύ άλλων το γεγονός ότι δεν είναι νομικά εκτελεστή. Η Bluesky διαμορφώνει το προτεινόμενο πρότυπό της ως ένα πρότυπο που θα έχει παρόμοιο «μηχανισμό και προσδοκίες», παρέχοντας «μια μορφή αναγνώσιμη από μηχανήματα, την οποία οι καλοί φορείς αναμένεται να τηρούν, και έχει ηθικό βάρος, αλλά δεν είναι νομικά εκτελεστή».

Σύμφωνα με την πρόταση, οι χρήστες της εφαρμογής Bluesky ή άλλων εφαρμογών που χρησιμοποιούν το υποκείμενο πρωτόκολλο ATProtocol, θα μπορούσαν να εισέρχονται στις ρυθμίσεις τους και να επιτρέπουν ή να απαγορεύουν τη χρήση των δεδομένων τους Bluesky σε τέσσερις κατηγορίες: γεννητική Τεχνητή Νοημοσύνη, γεφύρωση πρωτοκόλλων (δηλαδή σύνδεση διαφορετικών κοινωνικών οικοσυστημάτων), μαζικά σύνολα δεδομένων και αρχειοθέτηση στο διαδίκτυο (όπως το Wayback Machine του Internet Archive).

Εάν ένας χρήστης δηλώσει ότι δεν επιθυμεί τα δεδομένα του να χρησιμοποιηθούν για την εκπαίδευση της γενεσιουργού ΤΝ, η πρόταση αναφέρει: «Οι εταιρείες και οι ερευνητικές ομάδες που δημιουργούν σύνολα εκπαίδευσης ΤΝ αναμένεται να σέβονται αυτή την πρόθεση όταν τη βλέπουν, είτε κατά την απόξεση ιστότοπων, είτε κατά τη μαζική μεταφορά δεδομένων με χρήση του ίδιου του πρωτοκόλλου».

Η Molly White, η οποία γράφει το ενημερωτικό δελτίο Citation Needed και το ιστολόγιο Web3 is Going Just Great, περιέγραψε αυτή την πρόταση ως «μια καλή πρόταση» και δήλωσε ότι είναι «περίεργο να βλέπεις τους ανθρώπους να κατακεραυνώνουν την BlueSky γι' αυτό», αφού δεν είναι τόσο «ευπρόσδεκτη στην απόξεση AI», αλλά μάλλον «προσπαθεί να προσθέσει ένα σήμα συναίνεσης για να επιτρέψει στους χρήστες να επικοινωνήσουν τις προτιμήσεις τους για την απόξεση που ήδη συμβαίνει».



«Νομίζω ότι η αδυναμία αυτής της πρότασης και της παρόμοιας πρότασης [της Creative Commons] για «σήματα προτίμησης» είναι ότι βασίζονται στους scrapers να σέβονται αυτά τα σήματα από κάποια επιθυμία να είναι καλοί παράγοντες», συνέχισε ο White. «Έχουμε ήδη δει κάποιες από αυτές τις εταιρείες να προσπερνούν το robots.txt ή να παραβιάζουν πειρατικό υλικό για να το σαρώσουν».