7η SciFY Academy “Οι τεχνολογίες σύνθεσης και αναγνώρισης ομιλίας” “Χωρίς… οθόνη & πληκτρολόγιο!”

Την Τετάρτη 20 Ιανουαρίου η ομάδα της SciFY, διοργάνωσε στο χώρο του INNOVATHENS Κόμβου Καινοτομίας και Επιχειρηματικότητας της Τεχνόπολης του Δήμου Αθηναίων, ένα σεμινάριο, αφιερωμένο στις Τεχνολογίες σύνθεσης και αναγνώρισης ομιλίας.

Αιμίλιος Χαλαμανδάρης- Νάσος Κατσαμάνης

Σχεδόν 100 άτομα, παρακολούθησαν τον Αιμίλιο Χαλαμανδάρη, συνιδρυτή και διευθυντή της εταιρίας INNOETICS, και τoν Νάσο Κατσαμάνη, ερευνητή του Ε.Κ. Αθηνά και συνιδρυτή της εταιρίας beenotes  να αναλύουν στις τεχνολογίες της σύνθεσης ομιλίας (text-to-speech) και αναγνώρισης ομιλίας (speech-to-text).

Βασίλης Σαλαπάτας

Την εκδήλωση άνοιξε ο Βασίλης Σαλαπάτας, ένας εκ των συνιδρυτών της SciFY, παρουσιάζοντας την νέα βελτιωμένη έκδoση της καινοτόμας εφαρμογής ICSee, με χρηματοδότηση από το Ίδρυμα Λάτση. Συγκεκριμένα ανέφερε ότι: “με το ICSee (I Can See), άτομα με χαμηλή όραση μπορούν να διαβάσουν ένα μικρό κείμενο, όπως ο κατάλογος ενός εστιατορίου ή η τιμή σε μια απόδειξη, κάτι που ειδάλλως θα ήταν πολύ δύσκολο ή ακόμα και αδύνατον να το κάνουν. Έτσι, η καθημερινότητά τους βελτιώνεται σημαντικά.” Όσοι έχετε android συσκευές (smartphone ή tablet), σας προτείνουμε να καταβάσετε την εφαρμογή από το google play δωρεάν

ICSEE

“Κοίτα, μπορώ και χωρίς οθόνη!”

Στην συνέχεια το λόγο πήρε, ο Αιμίλιος Χαλαμανδάρης ο οποίος αναφέρθηκε στη Μίμηση του τρόπου παραγωγής ομιλίας (παραμετρική, μίμηση φωνής ως σήμα και υβριδική), καθώς και στα συστήματα που χρησιμοποιεί η σύνθεση ομιλίας , όπως το Text normalization και Unit selection. Επιπλέον μας περιέγραψε σε ποιους τομείς της καθημερινότητας βρίσκει εφαρμογή η συγκεκριμένη τεχνολογία. Ενδεικτικά αναφέρεται η Εκπαίδευση (audio books, κούκλες που μιλούν), τα GPS πλοήγησης, οι ανακοινώσεις των ΜΜΜ, η διεπαφή ανθρώπου μηχανής, καθώς και η διατήρηση γλωσσών που τείνουν να εξαφανιστούν!
Όσοι επιθυμείτε να δείτε και στη πράξη μία εκ των εφαρμογών της INNOETICS, δηλαδή να γράψετε ένα κείμενο και να ακούσετε τον υπολογιστή σας να το διαβάζει πατήστε εδώ.

 “Κοίτα, μπορώ και χωρίς πληκτρολόγιο!”

Στο δεύτερο μέρος της εκδήλωσης ο Νάσος Κατσαμάνης, ανέλυσε την τεχνολογία της αναγνώρισης ομιλίας, τη μετατροπή δηλαδή του προφορικού λόγου σε κείμενο. Χαρακτηριστικά παραδείγματα χρήσης της συγκεκριμένης τεχνολογίας είναι ο υποτιτλισμός των video στο youtube, το google voice input καθώς και η τηλεφωνική παρακολούθηση.
Στη συνέχεια μας εξήγησε ότι για τη δημιουργία μίας εφαρμογής όπου θα γίνεται χρήση της τεχνολογίας αναγνώριση ομιλίας απαιτούνται: δεδομένα, μία λίστα φωνημάτων, ακουστικά μοντέλα και εργαλεία για αναγνώριση φωνής όπως τα : KALDI & CMU Sphinx

Επιπλέον ενημερωθήκαμε ότι σε ορισμένες περιπτώσεις είναι καλό όταν και οι …“Τοίχοι να έχουν αυτιά”. Πιο συγκεκριμένα έγινε αναφορά στο πως μπορούν οι συμπολίτες μας με κάποια μορφή αναπηρίας να μπορούν να χρησιμοποιούν τις ηλεκτρικές συσκευές του σπιτιού τους δίνοντας απλές φωνητικές εντολές . Το όνομα του project αυτού: DIRHA

Απολαύστε το σχετικό βίντεο: “Σπιτάκι μου…άκουσε!” Greek DIRHA

Μελισσοκομία

Και τελειώνοντας για όσους αναρωτιούνται, τι σχέση έχει η μελισσοκομία με όλα τα παραπάνω, στο SciFY Academy , πληροφορηθήκαμε ότι η τεχνολογία  αναγνώρισης ομιλίας, χρησιμοποιείται από τους μελισσοκόμους ώστε να μπορούν να κρατούν φωνητικές σημειώσεις κάνοντας την απογραφή των μελισσιών τους καθώς δεν μπορούν να κρατήσουν γραπτές σημειώσεις λόγω του ενδύματός τους!

Τελειώνοντας θα θέλαμε να ευχαριστήσουμε τους εισηγητές της ομιλίας Αιμίλιο Χαλαμανδάρη και Νάσο Κατσαμάνη, το Ίδρυμα Λάτση για τη χορηγία που μας πρόσφερε ώστε να καταφέρουμε να αναβαθμίσουμε την εφαρμογή ICSee, καθώς και όλους εσάς που παρευρεθήκατε στην εκδήλωση..
Θα τα ξαναπούμε σύντομα..

Κατεβάστε την παρουσίαση του κ. Χαλαμανδάρη εδώ.

Κατεβάστε την παρουσίαση του κ. Κατσαμάνη εδώ.

Μπορείτε να παρακολουθήσετε όλη την εκδήλωση της 7ης SciFY Academy εδώ.
Για να ενημερώνεστε για τις επόμενες εκδηλώσεις της SciFY Academy μπορείτε να γραφτείτε εδώ.

SciFY Academy