Πρόγραμμα τεχνητής νοημοσύνης που «διαβάζει» τα χείλη πολύ καλύτερα από ανθρώπους

Οι κωφοί, αλλά και οι απανταχού κατάσκοποι, θα βρουν χρήσιμο ένα νέο
πρόγραμμα τεχνητής νοημοσύνης που «διαβάζει» τα χείλη των ανθρώπων εξ
αποστάσεως με μεγαλύτερη ακρίβεια όχι μόνο από κάθε άλλο μέχρι σήμερα,
αλλά και από τους ανθρώπους με τη σχετική εξειδίκευση.

Το πρόγραμμα ανέπτυξαν ερευνητές της Google και της
βρετανικής θυγατρικής της Deep Mind, η οποία πρωτοπορεί διεθνώς στην
τεχνητή νοημοσύνη, με επικεφαλής ένα νεαρό ελληνικής καταγωγής ειδικό
της πληροφορικής, τον Γιάννη Ασσαέλ.

Για τα εκατομμύρια των ανθρώπων που δεν μπορούν να ακούσουν, η
ανάγνωση των χειλιών των άλλων αποτελεί ένα «παράθυρο» για την
επικοινωνία, πέρα από τη νοηματική γλώσσα. Όμως το «διάβασμα» των
χειλιών δεν είναι εύκολο και συχνά είναι ανακριβές, όπως αναφέρει το
Αθηναϊκό Πρακτορείο Ειδήσεων.

Το νέο «έξυπνο» σύστημα εμφανίζει μέσο ποσοστό λαθών 41% στην ορθή
κατανόηση των λέξεων που σχηματίζουν τα χείλη. Μπορεί να φαίνεται υψηλό
αυτό το ποσοστό, αλλά η καλύτερη μέχρι σήμερα υπολογιστική μέθοδος είχε
ποσοστό αποτυχίας 77%, συνεπώς το νέο πρόγραμμα έχει περιορίσει σχεδόν
στο μισό τα λάθη.

Οι ερευνητές, με επικεφαλής τον Ασσαέλ και τον Μπρένταν Σίλινγκφορντ,
οι οποίοι έκαναν τη σχετική προδημοσίευση στο arXiv, σύμφωνα με το
«Science», δημιούργησαν αλγόριθμους καλύτερους από κάθε άλλους στο
παρελθόν, που τα καταφέρνουν αποτελεσματικότερα και από επαγγελματίες
αναγνώστες χειλιών. Αν το νέο σύστημα τελειοποιηθεί και ενσωματωθεί σε
ηλεκτρονικές συσκευές, όπως τα «έξυπνα» κινητά τηλέφωνα, μπορεί
μελλοντικά να προσφέρει τη δυνατότητα ανάγνωσης των χειλιών στον καθένα
(κάτι που μάλλον δεν θα αρέσει σε όλους).

Έως τώρα η δημιουργία αλγορίθμων που να μπορούν να διαβάσουν χείλη
ήταν τρομερά δύσκολη. Οι ερευνητές τροφοδότησαν το σύστημά τους με
140.000 ώρες βίντεο από το You Tube που έδειχναν ανθρώπους να μιλάνε στα
αγγλικά, μαζί με τα αντίστοιχα απομαγνητοφωνημένα κείμενα. Στη
συνέχεια, άφησαν το σύστημα μηχανικής μάθησης μόνο του να μάθει να
«παντρεύει» τις διαφορετικές κινήσεις των χειλιών με τα αντίστοιχα
φωνήματα και τελικά με τις αντίστοιχες λέξεις.

Το σύστημα βασίζεται στα τεχνητά νευρωνικά δίκτυα, δηλαδή σε μια
ομάδα αλγόριθμων που ο καθένας εκτελεί ένα διαφορετικό και απλούστερο
έργο, ενώταυτόχρονα όλοι μαζί συνδέονται και συνεργάζονται για να
επεξεργασθούν τις πληροφορίες, περίπου όπως κάνουν οι νευρώνες του
ανθρώπινου εγκεφάλου.

Αφού το σύστημα «αυτο-εκπαιδεύθηκε», δοκιμάσθηκε από τους ερευνητές
στην ανάγνωση των χειλιών των ανθρώπων ενός 37λεπτου βίντεο, που ποτέ
πριν το σύστημα δεν είχε «δει». Το πρόγραμμα έσφαλε στο 41% των λέξεων,
αλλά οι άνθρωποι -ακόμη και οι ειδικοί στο διάβασμα του στόματος- που
είδαν το ίδιο βίντεο, είχαν μέσο ποσοστό αποτυχίας 93% (πάντως σε
πραγματικές συνθήκες και όχι παρακολούθησης βίντεο, το ποσοστό
ανθρώπινης αποτυχίας είναι κάπως μικρότερο, καθώς ο ανθρώπινος εγκέφαλος
μπορεί να αξιοποιήσει και άλλα στοιχεία, όπως η γλώσσα του σώματος
αυτού που μιλάει).

Είναι σαφές ωστόσο ότι ένα ποσοστό αποτυχίας της τάξης του 40% στην
αναγνώριση των λέξεων σημαίνει ότι το σύστημα χρειάζεται ακόμη
ουσιαστική βελτίωση, αν και σε κάθε περίπτωση η εξέλιξη αυτή συνιστά
πραγματική πρόοδο. Όταν η βελτίωση υπάρξει, το σύστημα μπορεί να
αξιοποιηθεί ευρύτερα και στην καθημερινότητα. Για παράδειγμα, όταν θα
βλέπουμε στην τηλεόραση έναν ποδοσφαιριστή να βρίζει ένα διαιτητή ή έναν
αντίπαλο παίκτη, αλλά φυσικά δεν ακούμε τι λέει, θα ξέρουμε πια τι
είπε!

Ο Γιάννης Ασσαέλ υπήρξε μαθητής του Κολλεγίου Ανατόλια της
Θεσσαλονίκης και σπούδασε εφαρμοσμένη πληροφορική στο Πανεπιστήμιο
Μακεδονίας (2008-2013). Στη συνέχεια, έκανε μεταπτυχιακά (μάστερ) στην
επιστήμη των υπολογιστών στο Πανεπιστήμιο της Οξφόρδης, όπου σήμερα
ολοκληρώνει το διδακτορικό του πάνω στη μηχανική μάθηση, ενώ παράλληλα
εργάζεται για τη Deep Mind της Google.

Δείτε εδώ την επιστημονική προδημοσίευση

https://www.newsbeast.gr/technology/arthro/3865616/programma-technitis-noimosynis-poy-diavazei-ta-cheili-poly-kalytera-apo-anthropoys

Share:

Facebook
Twitter
WhatsApp
Email

ΔΕΙΤΕ ΑΚΟΜΑ

Εντοπίστηκε το ναυάγιο του Σπερχειού – Η μεγάλη ναυτική τραγωδία που συγκλόνισε το πανελλήνιο τη Μεγάλη Τετάρτη του 1945

Ένα από τα πλέον τραγικά ναυάγια των ελληνικών θαλασσών εντόπισε η ομάδα υποβρυχίων ερευνών του Κώστα Θωκταρίδη σε βάθος 153 μέτρων βορειοανατολικά της Ύδρας: Το ναρκαλιευτικό ΣΠΕΡΧΕΙΟΣ που βυθίστηκε Μεγάλη Τετάρτη, τον Μάιο του 1945, και έγινε υγρός τάφος 98 ανθρώπων. «Το

Τραγωδία στη Λαμία: Στρατιωτικός αυτοπυροβολήθηκε με καραμπίνα

Νεκρός μέσα στο σπίτι του, στο κέντρο της Λαμίας, βρέθηκε 70χρονος συνταξιούχος στρατιωτικός. Τις τελευταίες ώρες, σύμφωνα με το ρεπορτάζ του LamiaReport, ο 70χρονος δεν απαντούσε στις κλήσεις των συγγενών του, με αποτέλεσμα η αδερφή του να ανησυχήσει και να βρεθεί το απόγευμα

Η ακρίβεια αναγκάζει τους πολίτες να τρώνε από τα έτοιμα – «Χάθηκαν» καταθέσεις άνω των €4,5 δισ. το α’ 3μηνο

Η παρατεταμένη ακρίβεια και οι περιορισμένες αυξήσεις που έχουν δοθεί στους εργαζομένους τα τελευταία χρόνια έχουν ως αποτέλεσμα να περιοριστεί σημαντικά το διαθέσιμο εισόδημα και αυτό περιγράφεται περίτρανα από την πορεία των καταθέσεων, ειδικά τους τελευταίους μήνες, όπου και καταγράφεται σημαντική πτώση. Οι πολίτες,

Χ. Στυλιανίδης: Η ασφάλεια των ακτοπλοϊκών συγκοινωνιών είναι για μας, πρώτη προτεραιότητα

«Η ασφάλεια των ακτοπλοϊκών συγκοινωνιών είναι για μας, πρώτη προτεραιότητα» δήλωσε το πρωί ο υπουργός Ναυτιλίας και Νησιωτικής Πολιτικής Χρήστος Στυλιανίδης, ο οποίος επισκέφθηκε το λιμάνι του Πειραιά και συγκεκριμένα την πύλη Ε-7, ενόψει της εξόδου των εκδρομέων του Πάσχα.

Μετάβαση στο περιεχόμενο