Πρωτοποριακό σύστημα ψηφιακής ανάγνωσης για άτομα με προβλήματα όρασης

Τη δυνατότητα σε τυφλούς να «διαβάζουν» αντικείμενα πέρα από λέξεις – όπως γραφήματα και γραφικά- παρέχει ένα σύστημα ψηφιακής ανάγνωσης που ανέπτυξαν ερευνητές του Curtin University.

Το σύστημα συνδυάζει έναν αριθμό τεχνολογιών αναγνώρισης μοτίβων σε μια ενιαία πλατφόρμα και για πρώτη φορά – σύμφωνα με σχετική ανακοίνωση του πανεπιστημίου- δίνει τη δυνατότητα «απόδοσης» μαθηματικού και γραφικού υλικού χωρίς τη χρήση όρασης.
Αναπτύχθηκε από τον Δρα Ιέιν Μάρεϊ και την φοιτήτρια PhD Αζαντέ Ναζέμι, ακριβώς για να διαχειρίζεται τα σύνθετα προβλήματα που αντιμετωπίζουν οι άνθρωποι με προβλήματα όρασης όταν έρχονται αντιμέτωποι με γραφικά, γραφήματα, λογαριασμούς κ.α.

«Πολλοί από εμάς λαμβάνουν ως δεδομένο τον μεγάλο αριθμό γραφικών και γραφημάτων που βλέπουμε στις καθημερινές μας ζωές, ειδικά στη δουλειά. Λατρεύουμε να έχουμε γραφικά και διαγράμματα για τη μετάδοση πληροφοριών, για παράδειγμα δείτε πόσα στατιστικά και γραφήματα χρησιμοποιούνται στις αθλητικές σελίδες μιας εφημερίδας» αναφέρει ο Δρ. Μάρεϊ. «Οι τυφλοί συχνά εμποδίζονται να ακολουθήσουν συγκεκριμένες επαγγελματικές κατευθύνσεις και εκπαιδευτικές ευκαιρίες όπου τα γραφήματα και τα γραφικά παίζουν σημαντικό ρόλο. Ελπίζουμε ότι αυτή η συσκευή θα ανοίξει νέες ευκαιρίες για ανθρώπους με προβλήματα όρασης- το θέμα είναι να παρέχουμε περισσότερη ανεξαρτησία και να μην πρέπει να βασίζονται σε βοήθεια όρασης για να μπορούν να διαβάσουν γραφικό και μαθηματικό υλικό».

Η συσκευή λειτουργεί μέσω της χρήσης τεχνολογίας αναγνώρισης μοτίβων (pattern recognition) και άλλων μεθόδων πάνω σε έγγραφα/ αρχεία για να αντιλαμβάνεται εικόνες, γραφήματα, μαθηματικά σύμβολα ή κείμενα. Από εκεί και πέρα μετατρέπεται σε audio με ειδική καθοδήγηση πλοήγησης.

Κατά τον Δρα Μάρεϊ, το σύστημα «τρέχει» σε πολύ φθηνές πλατφόρμες, με αναμενόμενο κόστος παραγωγής περίπου 100 δολάρια ανά συσκευή, κάτι που την καθιστά αρκετά φθηνή για πολλούς ανθρώπους ανά τον κόσμο- ακόμα και σε χώρες του τρίτου κόσμου. «Το σύστημά μας είναι εύκολο στη χρήση από ανθρώπους κάθε ηλικίας και δυνατοτήτων και είναι open source, που σημαίνει ότι οποιοσδήποτε με τις απαιτούμενες δεξιότητες μπορεί να χρησιμοποιήσει και να τροποποιήσει το λογισμικό» αναφέρει σχετικά. Σημειώνεται ότι διαθέτει ενσωματωμένες οδηγίες και μία speech engine που λειτουργεί σε άνω των 120 διαφορετικών γλωσσών.

Κατά βάση, αυτό που κάνει το σύστημα είναι να παίρνει ένα έγγραφο/ αρχείο (pdf, λογαριασμό, σκαναρισμένο έγγραφο), να εντοπίζει «μπλοκ» κειμένων ή εικόνων, να τα κατανέμει σε κατηγορίες και στη συνέχεια να τα κατατάσσει στη σωστή σειρά ανάγνωσης. Στη συνέχεια τα μπλοκ αυτά αναγνωρίζονται ως εικόνες, γραφήματα μαθηματικά ή κείμενο και «διαβάζονται» χάρη σε οπτική τεχνολογία αναγνώρισης χαρακτήρων ή το Mathspeak (ειδικό utility για μαθηματικά). Ακολουθεί μετατροπή σε audio format. Η συσκευή έχει μήκος 20 εκατοστά, πλάτος 15 και πάχος 3. Ο χειρισμός του παραπέμπει σε κασετόφωνο, συν κάποια επιπλέον χαρακτηριστικά για πλοήγηση.

naftemporiki.gr


Δημοσίευση σχολίου

0 Σχόλια