
Όταν σκεφτόμαστε τι κάνει ένα ηχητικό βιβλίο αξέχαστο, είναι πάντα οι ανθρώπινες στιγμές: η ανάσα ενός δακρύου ή τα λόγια που λέγονται με ένα γνήσιο χαμόγελο.
Η ηθοποιός και αναγνώστρια ηχητικών βιβλίων Άναμπελ Τούντορ, με έδρα τη Μελβούρνη, λέει ότι το ανθρώπινο ένστικτο για αφήγηση ιστοριών είναι αυτό που καθιστά την ανάγνωση ηχητικών βιβλίων τόσο πρωτόγονη και πολύτιμη δεξιότητα. «Οι φωνές μας αντανακλούν τα συναισθήματά μας τόσο εύκολα», λέει.
Ωστόσο, ως μορφή τέχνης, ενδέχεται να απειλείται. Τον Μάιο, η Audible, η εταιρεία ηχητικών βιβλίων που ανήκει στην Amazon, ανακοίνωσε ότι θα επέτρεπε σε συγγραφείς και εκδότες να επιλέγουν από περισσότερες από 100 φωνές που δημιουργούνται από τεχνητή νοημοσύνη για να διαβάζουν ηχητικά βιβλία στα αγγλικά, τα ισπανικά, τα γαλλικά και τα ιταλικά. Η μετάφραση ηχητικών βιβλίων με τεχνητή νοημοσύνη αναμένεται επίσης να κυκλοφορήσει αργότερα φέτος - μια εξέλιξη που έχει προκαλέσει κριτική και περιέργεια στον εκδοτικό κλάδο.
Στην Αυστραλία –όπου υπάρχουν λιγότερες εταιρείες παραγωγής ηχητικών βιβλίων και εκκολαπτόμενοι ηθοποιοί όπως οι Tudor βασίζονται σε αυτήν την εργασία για να τα βγάλουν πέρα– οι ανησυχίες για την απώλεια θέσεων εργασίας, τη διαφάνεια και την ποιότητα αυξάνονται.
Ενώ η Τούντορ, η οποία έχει διαβάσει 48 βιβλία, δεν είναι πεπεισμένη ότι η Τεχνητή Νοημοσύνη μπορεί να κάνει αυτό που κάνει αυτή, ανησυχεί ότι η κακή ποιότητα θα μπορούσε να απομακρύνει το κοινό από τη μορφή.
Έκρηξη ηχητικών βιβλίων
Σύμφωνα με την έκθεση Bookdata 2024 της NielsenIQ, περισσότεροι από τους μισούς Αυστραλούς ακροατές ηχητικών βιβλίων έχουν αυξήσει τον χρόνο ακρόασης τα τελευταία πέντε χρόνια. Σε παγκόσμιο επίπεδο, οι πωλήσεις ηχητικών βιβλίων στις ΗΠΑ αναμένεται να αυξηθούν κατά 13% από το 2023 έως το 2024. Στο Ηνωμένο Βασίλειο, οι πωλήσεις ηχητικών βιβλίων αναμένεται να φτάσουν σε νέο υψηλό των 268 εκατομμυρίων λιρών, αυξημένες κατά 31% από το 2023, σύμφωνα με την Ένωση Βρετανών Εκδοτών.
Καθώς η ζήτηση αυξανόταν, οι εταιρείες προσπάθησαν να τα παράγουν ταχύτερα και φθηνότερα. Τον Ιανουάριο του 2023, η Apple παρουσίασε έναν νέο κατάλογο ηχητικών βιβλίων με φωνές που δημιουργούνται από τεχνητή νοημοσύνη. Αργότερα την ίδια χρονιά, η Amazon επέτρεψε σε αυτοεκδοθέντες συγγραφείς στις ΗΠΑ με βιβλία Kindle να μετατρέψουν τα ηλεκτρονικά τους βιβλία σε ηχητικά βιβλία χρησιμοποιώντας τεχνολογία «εικονικής φωνής» τεχνητής νοημοσύνης — και δεκάδες χιλιάδες ηχητικά βιβλία που δημιουργούνται από υπολογιστή διανέμονται πλέον μέσω του Audible.
Το Spotify ανακοίνωσε επίσης τον Φεβρουάριο ότι θα δεχόταν ηχητικά βιβλία που διαβάζονται μέσω τεχνητής νοημοσύνης, με στόχο να «μειώσει το εμπόδιο εισόδου» για τους συγγραφείς που θέλουν να προσεγγίσουν περισσότερους αναγνώστες. Η Audible αναφέρει ότι ο στόχος της είναι παρόμοιος: να συμπληρώσει και όχι να αντικαταστήσει τις ανθρώπινες φωνές, επιτρέποντας σε περισσότερους συγγραφείς και τίτλους να προσεγγίσουν ένα ευρύτερο κοινό. Στις ΗΠΑ, η Audible δοκιμάζει επίσης μια λειτουργία κλωνοποίησης φωνής που επιτρέπει στους αναγνώστες να δημιουργούν εκδοχές των δικών τους φωνών για να επεκτείνει την ικανότητά της να παράγει ηχητικά βιβλία υψηλής ποιότητας.
«Το 2023 και το 2024, τα Audible Studios θα προσλάβουν περισσότερους αναγνώστες από ποτέ», δήλωσε εκπρόσωπος της Audible στον Guardian. «Συνεχίζουμε να λαμβάνουμε αιτήματα από συγγραφείς που θέλουν να φέρουν το έργο τους σε ήχο, προσεγγίζοντας νέο κοινό σε πολλές γλώσσες».
Αλλά οι φωνές ρομπότ θα είναι πάντα φθηνότερες από τις ανθρώπινες φωνές — και οι επαγγελματίες της αφήγησης φωνής και των εκδόσεων ανησυχούν ότι η τάση της τεχνητής νοημοσύνης θα απειλήσει τις δουλειές τους.
Μαζική παραγωγή ή διασφάλιση ποιότητας;
Η καριέρα του Ντόρτζε Σουάλοου ως ηχητικό βιβλίο απογειώθηκε αφότου χάρισε τις φωνές σε μυθιστορήματα του Αυστραλού συγγραφέα αστυνομικών βιβλίων best-seller Chris Hammer, από τα οποία έχει διαβάσει περίπου 70. Ο Σουάλοου λέει ότι τα ηχητικά βιβλία με τεχνητή νοημοσύνη είναι ένα εργαλείο για άτομα που «δεν κατανοούν την αξία, τις τεχνικές, τις δεξιότητες» που απαιτούνται για τη δημιουργία ενός ποιοτικού ηχητικού βιβλίου.
«Έχουμε δουλέψει τόσο σκληρά και έχουμε θυσιάσει τόσα πολλά για να φτάσουμε εδώ που είμαστε σήμερα, και το να νομίζεις ότι μπορείς απλώς να πατήσεις ένα κουμπί και να πάρεις κάτι ισοδύναμο, ή αρκετά καλό - αυτό είναι γελοίο», είπε.
Ο Simon Kennedy, πρόεδρος της Αυστραλιανής Ένωσης Ηθοποιών Φωνής, λέει ότι υπάρχει εδώ και καιρό μια συζήτηση σχετικά με το πόσο πρέπει να πληρώνονται οι αναγνώστες ηχητικών βιβλίων. Συχνά οι ηθοποιοί χρειάζονται δύο ή τρεις φορές περισσότερο χρόνο για να ολοκληρώσουν μια ώρα ηχητικού βιβλίου, για να μην αναφέρουμε τον χρόνο που χρειάζεται για να διαβάσουν εκ των προτέρων για να κατανοήσουν το περιεχόμενο και τους χαρακτήρες. «Κατά τη γνώμη μου, η χρήση φωνών μέσω τεχνητής νοημοσύνης δίνει προτεραιότητα στην ποσότητα έναντι της ποιότητας - και υποβαθμίζει τη διαδικασία», λέει.
Ο Κένεντι ίδρυσε την Ένωση Αυστραλιανών Ηθοποιών Φωνής το 2024 για να αντιμετωπίσει την απειλή της αντικατάστασης της Τεχνητής Νοημοσύνης. Σε έκθεση που υπέβαλε σε κοινοβουλευτική επιτροπή πέρυσι, η οργάνωση ανέφερε ότι 5.000 θέσεις εργασίας στον τομέα της φωνητικής υποκριτικής στην Αυστραλία κινδύνευαν.
«Αν θέλετε απλώς μια επίπεδη, μονότονη φωνή από την αρχή μέχρι το τέλος και την χαρακτηρίζετε ως «υψηλής ποιότητας», δεν πειράζει», λέει. «Αλλά αν θέλετε μια ιστορία που είναι συναρπαστική, που είναι συναρπαστική, που σας κρατά σε εγρήγορση — μην περιμένετε από την Τεχνητή Νοημοσύνη να σας το δώσει αυτό».
Φέτος, η Χάνα Κεντ, η καταξιωμένη συγγραφέας των «Burial Rites» και «Devotion», ήταν ανάμεσα σε αρκετές Αυστραλές συγγραφείς που σοκαρίστηκαν όταν ανακάλυψαν ότι το έργο της είχε υποκλαπεί για την εκπαίδευση του συστήματος τεχνητής νοημοσύνης της Meta. Είπε ότι η αρχική της αντίδραση στην εισβολή της τεχνητής νοημοσύνης στον δημιουργικό χώρο ήταν συνήθως «οργή και διαμαρτυρία», αλλά την ενδιέφερε επίσης η ανακοίνωση της Audible - ειδικά τα σχέδιά της να δοκιμάσει τις μεταφράσεις τεχνητής νοημοσύνης σε άλλες γλώσσες.
«Νομίζω ότι είναι σαφές σε όλους ότι ο κύριος λόγος χρήσης της Τεχνητής Νοημοσύνης είναι η μείωση του κόστους, και αυτό θα κάνει τα πράγματα φθηνά — τόσο κυριολεκτικά όσο και δημιουργικά, πράγμα που σημαίνει ότι δεν τιμούμε πλέον το πνεύμα της αφήγησης ιστοριών και της καλλιτεχνικής έμπνευσης όπως πριν», μοιράστηκε ο Κεντ.
Οι Tudor και Swallow πιστεύουν ότι θα είναι δύσκολο για τις μεγάλες εταιρείες να αντικαταστήσουν πλήρως τις ανθρώπινες φωνές, εν μέρει επειδή πολλοί Αυστραλοί συγγραφείς θα αντισταθούν σε αυτό.
Αλλά το αν οι ακροατές μπορούν πραγματικά να διακρίνουν τη διαφορά παραμένει ένα ανοιχτό ερώτημα.
(Σύμφωνα με την εφημερίδα The Guardian)
Πηγή: https://vietnamnet.vn/noi-lo-ai-lam-giam-chat-luong-sach-noi-2419249.html
Σχόλιο (0)