Ένα νέο εργαλείο Τεχνητής Νοημοσύνης (που χρησιμοποιεί μηχανική μάθηση) εντόπισε περισσότερες από 250.000 επιστημονικές δημοσιεύσεις για τον καρκίνο που ενδέχεται να έχουν παραχθεί από τα λεγόμενα «paper mills», δηλαδή εταιρείες συγγραφής ψεύτικων ή χαμηλής ποιότητας ερευνών κατά παραγγελία.

Το εργαλείο αναπτύχθηκε από τον καθηγητή Άντριαν Μπαρνέτ του Πανεπιστημίου Τεχνολογίας του Κουίνσλαντ, από τη Σχολή Δημόσιας Υγείας και Κοινωνικής Εργασίας, και το Αυστραλιανό Κέντρο Καινοτομίας Υπηρεσιών Υγείας, σε συνεργασία με διεθνή ομάδα ερευνητών.

Η ερευνητική ομάδα εκπαίδευσε ένα γλωσσικό μοντέλο που ονομάζεται BERT, ώστε να αναγνωρίζει τα λεπτά «κειμενικά αποτυπώματα» που εμφανίζονται επανειλημμένα σε δημοσιεύσεις που προέρχονται από paper mills. Όταν δοκιμάστηκε σε επαληθευμένα παραδείγματα, το μοντέλο αναγνώρισε σωστά ύποπτες εργασίες στο 91% των περιπτώσεων.

Στη μελέτη, που δημοσιεύθηκε στο επιστημονικό περιοδικό «The BMJ», αναλύθηκαν 2,6 εκατομμύρια επιστημονικές εργασίες για τον καρκίνο της περιόδου 1999-2024. Εντοπίστηκαν περισσότερες από 250.000 εργασίες με μοτίβα συγγραφής παρόμοια με άρθρα που ήδη έχουν ανακληθεί λόγω υποψιών κατασκευασμένων δεδομένων.

Επίσης, διαπιστώθηκε ότι οι ύποπτες δημοσιεύσεις έχουν αυξηθεί ραγδαία τις τελευταίες δύο δεκαετίες, από περίπου 1% στις αρχές της δεκαετίας του 2000 σε πάνω από 16% το 2022. Το ζήτημα επηρεάζει χιλιάδες επιστημονικά περιοδικά μεγάλων εκδοτικών οίκων, συμπεριλαμβανομένων τίτλων υψηλού κύρους.

Το πρόβλημα είναι εντονότερο σε τομείς όπως η μοριακή βιολογία του καρκίνου και η εργαστηριακή έρευνα σε πρώιμο στάδιο. Ορισμένοι τύποι καρκίνου, όπως του στομάχου, του ήπατος, των οστών και των πνευμόνων, εμφανίζουν ιδιαίτερα υψηλά ποσοστά ύποπτων μελετών.

Ήδη, όπως σημειώνεται, τρία επιστημονικά περιοδικά δοκιμάζουν πιλοτικά το εργαλείο στο πλαίσιο του συντακτικού ελέγχου τους, ώστε να εντοπίζονται πιθανώς κατασκευασμένα άρθρα πριν σταλούν για αξιολόγηση από ομότιμους κριτές.

Η ερευνητική ομάδα σκοπεύει να επεκτείνει τη χρήση του εργαλείου και σε άλλους επιστημονικούς κλάδους και να βελτιώσει το μοντέλο, καθώς θα γίνονται διαθέσιμα περισσότερα επιβεβαιωμένα περιστατικά δραστηριότητας paper mills. Τέλος, διευκρινίζει ότι τα ευρήματα δεν αποτελούν οριστική απόδειξη απάτης και θα πρέπει να ελέγχονται από ειδικούς επιστήμονες.