Η τεχνητή νοημοσύνη βοηθά τους τυφλούς να «βλέπουν» φωτογραφίες στο Facebook

Η τεχνητή νοημοσύνη βοηθά τους τυφλούς να «βλέπουν» φωτογραφίες στο Facebook

Κάθε μέρα οι χρήστες του Facebook, του Instagram και του WhatsApp μοιράζονται περισσότερες από δύο δισεκατομμύρια φωτογραφίες. Εκατομμύρια χρήστες του κοινωνικού δικτύου, όμως, δεν μπορούν να τις δουν.

39 εκατομμύρια άνθρωποι σε όλο τον πλανήτη είναι τυφλοί, ενώ περισσότεροι από 246 εκατομμύρια υποφέρουν από σοβαρά προβλήματα υγείας που τους εμποδίζουν να δουν σωστά. Κι όμως πολλοί από αυτούς μπορούν να χρησιμοποιούν ηλεκτρονικούς υπολογιστές και να πλοηγούνται στο Internet, μέσω ειδικών λογισμικών και εφαρμογών.

Το Facebook έχει προ πολλού μεριμνήσει ώστε να επιτρέπει την πλοήγηση σε πολυάριθμους συνανθρώπους μας με προβλήματα όρασης. Μέχρι σήμερα όμως, είχαν τη δυνατότητα να ακούν τα όσα δημοσιεύονται στο δημοφιλές κοινωνικό δίκτυο, αλλά όχι και να «βλέπουν» τις φωτογραφίες που μοιράζονται οι φίλοι τους.

Σύμφωνα με μια πρόσφατη έρευνα του Πανεπιστημίου Cornell, η επαφή με το οπτικό υλικό που ανεβαίνει online αποτελεί βασική προτεραιότητα των τυφλών που χρησιμοποιούν τα κοινωνικά δίκτυα.

Ηχητική περιγραφή

Η ομάδα του Zuckerberg επιστρατεύει την τεχνητή νοημοσύνη προκειμένου να επιτρέψει στους τυφλούς να συμμετέχουν ακόμη πιο ενεργά και να μην αισθάνονται αποκομμένοι από τις δραστηριότητες συγγενών και φίλων. Η νέα υπηρεσία ηχητικής περιγραφής των φωτογραφιών, Automatic Alt Text είναι το πρώτο βήμα προς αυτή την κατεύθυνση. Το νευρωνικό δίκτυο που έχει αναπτύξει η υπερδραστήρια ομάδα μηχανικών της Facebook έχει τη δυνατότητα αναγνώρισης προσώπων, αντικειμένων, τοπίων κ.λπ. και αυτόματης εξαγωγής της «λεζάντας».

Για παράδειγμα το λογισμικό μπορεί να αντιληφθεί ότι σε μια φωτογραφία απεικονίζονται χαμογελαστοί άνθρωποι με γυαλιά ηλίου, σε μια άλλη η εικόνα μιας πίτσας, σε άλλη φοίνικες και ουρανός κ.λπ. και στη συνέχεια μέσω της ηχητικής περιγραφής να δώσει στους ανθρώπους με προβλήματα όρασης μια ιδέα περί τίνος πρόκειται.

Η τεχνολογία οπτικής αναγνώρισης αντικειμένων βρίσκεται σε πειραματικό στάδιο, αλλά το πρώτα δείγματα είναι άκρως ενθαρρυντικά και μπορούν ήδη να τη δοκιμάσουν χρήστες που διαθέτουν συσκευή με iOS λειτουργικό και χρησιμοποιούν το app του Facebook.

Το βίντεο είναι ενδεικτικό του τρόπου που λειτουργεί η νέα υπηρεσία Automatic Alt Text: https://vimeo.com/161532965


Τα μέλη της ομάδας προσβασιμότητας του Facebook που ανέλαβαν την ανάπτυξη της εφαρμογής: Matt King, Jeff Wieland και Shaomei Wu.

Πώς λειτουργεί;

Η οπτική αναγνώριση αντικειμένων βασίζεται σε μια ιδιαίτερα εξελιγμένη και απαιτητική τεχνολογία, αφού όπως γίνεται αντιληπτό κάθε αντικείμενο μπορεί να απεικονιστεί με εκατομμύρια διαφορετικούς τρόπους. Γι' αυτό και στην εφαρμογή του Facebook αρχικά θα μπορούν να αναγνωριστούν 100 αντικείμενα (π.χ. δημοφιλή φαγητά, οχήματα), ανθρώπινα χαρακτηριστικά (π.χ. γυαλιά, μουστάκια, χαμόγελα), τοπία, δραστηριότητες (όπως σπορ, παιχνίδια) και πολλά ακόμη. Ναι, ακόμη και αν πρόκειται για selfie.

Οι δοκιμές των τεχνικών της εταιρείας έχουν επιτυχία σε ποσοστό άνω του 50%, αλλά και αυτοί με τη σειρά τους υπόσχονται να βελτιώσουν την «ευστοχία» τους και να προσθέσουν ακόμη περισσότερες περιγραφές στη συλλογή τους.

Το «αυτοματοποιημένο εναλλακτικό κείμενο» προς το παρόν είναι συμβατό μόνο με αγγλικές ηχητικές περιγραφές, αλλά η ομάδα προσβασιμότητας της εταιρείας υποσχέθηκε την άμεση επέκταση της υπηρεσίας και σε άλλες γλώσσες. Επίσης, κατά τη δοκιμαστική περίοδο θα λειτουργεί σε συσκευές της Apple –αξιοποιώντας το iOS screen reader– αλλά σύντομα αναμένεται η επέκταση της υποστήριξης και σε Android, Windows και Mac.

Περισσότερες πληροφορίες για την τεχνολογία στο παρακάτω βίντεο: https://vimeo.com/161529744 αλλά και στο site των προγραμματιστών του Facebook: https://code.facebook.com/posts/457605107772545