20 Οκτ 2015

Δωρητές φωνών

 

















Γράφει η Ιωάννα Μπαλάφα

Οι περισσότεροι έχουμε ακούσει την ηλεκτρονική/εικονική φωνή του Stephen Hawking. Η ίδια φωνή μέσω της σχετικής εφαρμογής, χρησιμοποιείται από χιλιάδες ανθρώπους με ανάλογες νευρολογικές παθήσεις ανά τον κόσμο. Ποια θα ήταν όμως τα οφέλη εάν η επιστήμη δημιουργούσε μέσω της τεχνολογίας μια μοναδική/εξατομικευμένη φωνή για τον κάθε χρήστη;

Την απάντηση μας τη δίνει η καθηγήτρια επιστήμης υπολογιστών Rupal Patel του Πανεπιστημίου του Northeastern, η οποία μαζί με την ομάδα της ερευνητικής της οργάνωσης VocaliD αναζητά τρόπους προκειμένου να δώσει φωνή σε όσους δεν έχουν. Ως ιδρύτρια και διευθύντρια του Εργαστηρίου Ανάλυσης, Σχεδιασμού και Επικοινωνίας (CadLab), ανέπτυξε μια καινοτόμο τεχνολογία που συνδυάζει την πραγματική ανθρώπινη φωνή με χαρακτηριστικά επιμέρους τύπων ομιλίας. Τα αποτελέσματα είναι εντυπωσιακά με απεριόριστες δυνατότητες καθώς όσοι δεν έχουν εκ γενετής ή λόγω κάποιας ασθένειας την ικανότητα ομιλίας, μπορούν πλέον να δημιουργήσουν τη δική τους εικονική φωνή με όλα τα πρακτικά και ψυχολογικά οφέλη που κάτι τέτοιο μπορεί να προσφέρει.

Η VocaliD, ιδρύθηκε βασισμένη στο σκεπτικό ότι ακόμη και όσοι έχουν περιορισμένη ομιλία μπορούν να παράγουν ήχους οι οποίοι συνδυασμένοι με την τεχνολογία οδηγούν στις μοναδικές φωνητικές ταυτότητες. Μετά από πολυετή έρευνα του πεδίου της επιστήμης του Λόγου και της Θεωρίας και ένα δίπλωμα ευρεσιτεχνίας, η καθηγήτρια Rupal Patel και η ομάδα της, συνθέτουν τα χαρακτηριστικά της φωνής του παραλήπτη με τη βάση δεδομένων των εγγραφών ομιλίας από ένα συμβατό δότη. Το αποτέλεσμα είναι η δημιουργία μιας ‘’υβριδικής φωνής’’ που διατηρεί τα χαρακτηριστικά σημεία της εγγραφής του δότη αλλά αποτυπώνει όσο το δυνατόν πιο ξεκάθαρα τα στοιχεία της φωνητικής ταυτότητας του παραλήπτη. Η δημιουργία μιας προσαρμοσμένης συνθετικής φωνής περιλαμβάνει την καταγραφή και την ανάμειξη φωνών. Δηλαδή, η επιστημονική ομάδα βασίζεται στην ‘’κοινωνική συνεργασία’’ προκειμένου να συλλέξει ηχογραφήσεις από ‘’δωρητές ομιλίας’’ , οι οποίες συνδυασμένες με την κατάλληλη τεχνολογία (τεχνολογία αιχμής) δημιουργούν μια αυθεντική φωνητική ταυτότητα.

Έτσι λοιπόν, χρησιμοποιούνται προηχογραφημένα δείγματα λόγου για όσους έχασαν στην πορεία της ζωής τους τη φωνητική ικανότητα αλλά και για όσους γεννήθηκαν με διαταραχές ομιλίας όπου κατά περίπτωση αποτυπώθηκαν έστω και κάποιοι άναρθροι ήχοι προκειμένου να καταγραφεί το ηχητικό τους αποτύπωμα κι έτσι να ανακατασκευαστεί η φωνή τους. Από τη βάση δεδομένων επιλέγεται εκείνη η φωνή δότη (ή αλλιώς ‘’παρένθετου ομιλητή’’) που μοιάζει περισσότερο με τη φωνή του παραλήπτη, λαμβάνοντας υπόψη, χαρακτηριστικά όπως το φύλο και η ηλικία. Ο παρένθετος ομιλητής ηχογραφεί για κάποιες ώρες διάφορες λέξεις και φράσεις με στόχο την κάλυψη όλων των διαφορετικών συνδυασμών των γλωσσικών ήχων. Στη συνέχεια οι ηχογραφήσεις αναλύονται σε μικρότερα κομμάτια λόγου με συνδυασμούς ήχων και έτσι δημιουργείται μια τράπεζα φωνής σύνθεσης λόγου.

Η Patel συμφωνεί με τα λόγια του ποιητή Henry Wadsworth Longfellow ότι: «H ανθρώπινη φωνή είναι το όργανο της ψυχής» και κατ’ επέκταση ότι η φωνή αποτελεί το μοναδικό ηχητικό αποτύπωμα του καθενός που αντικατοπτρίζει από την ηλικία έως τον τρόπο ζωής μας. Η έως τώρα έλλειψη ποικιλίας των εικονικών/συνθετικών φωνών έκαναν όλους όσους έχουν τη δυνατότητα χρήσης της τεχνολογίας να έχουν την ίδια φωνή. Χαρακτηριστικά αναφέρει η Patel ότι ένας ενήλικας και ένα μικρό κορίτσι για παράδειγμα δεν μπορούν να χρησιμοποιούν την ίδια εικονική φωνή όπως ακριβώς ένας γιατρός δεν θα τοποθετούσε ένα προσθετικό άκρο ενήλικα σε ένα μικρό κορίτσι. Αυτή η συνειδητοποίηση μετά από ένα συνέδριο βοηθητικών τεχνολογιών, η έλλειψη δηλαδή εξατομίκευσης της συνθετικής φωνής την έκανε να προχωρήσει στην έρευνα και μετέπειτα στην ίδρυση της VocaliD.

Οι παρένθετοι ομιλητές στις Η.Π.Α. είναι πολύ λίγοι την ίδια στιγμή που εκατομμύρια άνθρωποι ανά τον κόσμο επιθυμούν να αποκτήσουν τη δική τους μοναδικά προσωποποιημένη φωνή. Η Patel παραδέχεται ότι οραματίζεται μέσω του VocaliD, έναν κόσμο με παρένθετους δωρητές σε παγκόσμια κλίμακα, από όλα τα κοινωνικά και ηλικιακά μεγέθη, με τη δημιουργία μιας πολύχρωμης βάσης δεδομένων που θα αντικατοπτρίζει εξίσου τις πολύχρωμες και διαφορετικές προσωπικότητες εκατομμυρίων ανθρώπων.

Η κοινωνική προσφορά αυτού του εγχειρήματος είναι ξεκάθαρη όταν ωφελούμενοι παραλήπτες περιγράφουν τη μοναδική εμπειρία του να αποκτήσει κάποιος τη δική του φωνή ως κομβική για τη βελτίωση όλων των παραμέτρων της κοινωνικής και προσωπικής ζωής. Για άλλη μια φορά αποδεικνύεται ότι η καλή χρήση της επιστήμης είναι ανεξάντλητη και ικανή να αλλάζει ζωές προς το καλύτερο.
(στο independent.gr & στο Hit&Run)
Related Posts Plugin for WordPress, Blogger...