Per la seconda puntata della rubrica “Non solo traduzione” di Studio Moretto Group, vorrei portare oggi una piccola riflessione sul mondo del doppiaggio, visto il clamore causato da alcune notizie circolate sul tema intelligenza artificiale e voci di personaggi famosi, attori e doppiatori.
Il doppiaggio è un servizio linguistico audiovisivo che tramite la sostituzione o la modifica dell’audio originale rende fruibili contenuti audio-video realizzati in una lingua diversa da quelle parlate nel Paese di destinazione.
“Doppiaggio” in italiano viene utilizzato per riferirsi a tutti i servizi che vengono realizzati in questi termini, seppur, in realtà, tra essi vi sono tecniche di realizzazione e ambiti di utilizzo molto diversi.
Prima di affrontare il cuore del discorso, è quindi bene specificare tali differenze in modo che sia per tutti più chiaro quali servizi saranno maggiormente interessati dall’introduzione delle nuove tecnologie e quali meno, secondo gli esperti.
Nello specifico, tra i principali servizi a cui si fa riferimento parlando di “doppiaggio” ci sono:
- Il doppiaggio con sincronizzazione labiale (lip-sync dubbing), che può essere fatto sulla base di uno script fornito dal cliente o in seguito alla traduzione e all’adattamento dei contenuti originali. Viene raccomandato per il broadcasting (film, serie TV e spot pubblicitari).
- Il Voice Over, che a sua volta è un termine ombrello che comprende diversi servizi come:
- UN-style Voice Over, in cui la voce del doppiatore si sovrappone in oversound all’audio originale, che resta udibile in sottofondo. Questa tecnica è riservata a notiziari, discorsi, interviste e alcuni specifici programmi TV.
- Voice Off, in cui l’audio originale non è più udibile ed è raccomandato per podcast, spot radiofonici e documentari.
- Lektoring, servizio di nicchia popolare soprattutto in Polonia che consiste nella lettura da parte di una sola persona di tutti i dialoghi tradotti, senza trasmettere emozioni.
Fatte queste doverose distinzioni, affrontiamo l’elefante nella stanza: l’intelligenza artificiale nel mondo dei servizi audiovisivi e in particolare nel mondo del doppiaggio.
Ora che è prepotentemente entrata a far parte del mondo dei servizi linguistici, l’IA sta trovando un impiego sempre maggiore anche nella nicchia che comprende il doppiaggio e che, in un primo momento, si pensava che invece sarebbe stata preservata dal dilagare delle nuove tecnologie.
Nell’immaginario comune, infatti, è difficile che un algoritmo possa replicare le sfaccettature della voce umana, sia dal punto di vista espressivo, che dal punto di vista dell’intonazione, della cadenza e della pronuncia; ed in effetti è tutt’ora così.
Ciò che, però, ha maggiormente spaventato i professionisti del settore è stata la capacità mostrata da alcuni software di riuscire a replicare la voce degli stessi attori in lingua originale e dei doppiatori con un’inaspettata fedeltà, pur presentando evidenti lacune rispetto al doppiaggio d’autore.
Per esempio Christian Iansante, storico doppiatore di Rick nella serie “Rick e Morty”, ha denunciato di aver visto alcune clip della serie da lui mai doppiate, in cui la voce del suo personaggio era stata replicata mediante l’IA e aggiunta nella versione italiana. Lo stesso è stato constatato da David Chevalier, voce dell’altro protagonista del programma TV.
L’attività umana nel mondo dei servizi linguistici è quindi destinata in futuro a soccombere ed essere rimpiazzata da software e algoritmi, oppure questo è solo un periodo di transizione momentaneo, una moda passeggera data dall’hype del momento?
Secondo il mio modesto parere, nessuna delle due ipotesi, che rappresentano rispettivamente il worst e il best case scenario per i lavoratori del settore, è corretta.
Da un lato, seppur ci sia ormai la ragionevole certezza che con il progredire della tecnica l’IA diventerà un importante strumento in diversi ambiti e settori, si deve definire quale sia il campo di utilizzo di questi tool: mezzi a supporto dell’attività umana e acceleratori dei processi o direttamente sostituti del servizio prestato dall’essere umano?
Ricordiamo nel settore editoriale l’impatto dell’e-book: inizialmente pubblicizzato come bene succedaneo al libro cartaceo, è stato in seguito riconosciuto come strumento utile per sostenere l’intero settore in seguito alla crisi del 2008. Venne infatti adottato dalle case editrici per espandere il proprio pubblico andando ad acquisire nuovi utenti attratti da questo supporto innovativo, mentre, contestualmente, la maggior parte dei clienti fidelizzati rimaneva leale al cartaceo. In questo modo l’industria è rimasta a galla durante il periodo difficile, al termine del quale ha addirittura presentato una piccola crescita.
La stessa cosa potrebbe accadere oggi con il mondo dei servizi linguistici: per esempio, l’IA potrebbe rendere accessibili doppiaggio e sottotitolazione anche a utenti che, per questioni di prezzo o di tempistiche, fino ad oggi hanno rinunciato ad acquistare questi servizi per la propria comunicazione.
Dall’altro lato, è importante capire sul piano economico se il vantaggio competitivo dell’IA possa portare a un concreto risparmio nel medio-lungo periodo rispetto al costo sostenuto per i servizi “human made”, o se tale risparmio sarebbe solo apparente e legato al breve periodo, a fronte di un futuro allineamento dei prezzi ai livelli attuali per il servizio qualitativo svolto dall’essere umano.
Se non ci fosse questo risparmio, tutta la questione ritornerebbe nuovamente al piano qualitativo che non abbiamo ancora volutamente affrontato.
Questi ragionamenti, infatti, hanno senso solo nel caso in cui si dia per assodato che il livello qualitativo che l’IA potrà offrire in futuro possa davvero raggiungere l’attuale standard umano… e ciò è tutt’altro che scontato. Al momento, infatti, lo state of the art vede il doppiaggio umano ancora ad un livello molto superiore e, inoltre, come dice il famoso doppiatore Luca Ward: “l’immedesimazione e l’empatia non sono riproducibili artificialmente, semplicemente perché alle macchine manca il cuore” e quindi, stando alla sua previsione, questo traguardo difficilmente verrà raggiunto in futuro.
Personalmente sono piuttosto d’accordo col pensiero di Ward e questo, a mio modo di vedere, rimane vero in tutti i settori in cui è stato e verrà diffuso l’utilizzo dell’IA e di altre tecnologie simili.
Senz’altro questi strumenti che già oggi sono molto utili, in futuro aiuteranno ancor di più ad aumentare la produzione e tagliare le tempistiche di realizzazione di servizi standard.
Per esempio, aiuteranno a velocizzare la realizzazione dei Voice Over soprattutto per contenuti semplici, brevi e replicabili, come nel caso di tutorial e videocorsi.
Per altri servizi, soprattutto per quelli di intrattenimento in cui la componente attoriale e umana è caratterizzata da una forte emozionalità (è il caso del doppiaggio per le grandi produzioni cinematografiche), invece sarà sempre necessario che tale apporto provenga da un interprete umano che, nel caso, potrà essere supportato dall’intelligenza artificiale soprattutto nella fase di post-produzione.
La questione, quindi, si sposta dal piano concorrenziale al piano del reciproco vantaggio: l’IA procura per alcuni specifici servizi a basso profilo un indubbio vantaggio economico e di rapidità; la traduzione umana, dal canto suo, consente di mantenere livelli qualitativi alti e non solo: infatti i vantaggi principali della traduzione umana rimarranno sempre l’efficacia comunicativa e la profondità emozionale.
Perché, quindi, rinunciare necessariamente ad uno dei due, quando è possibile trarre il massimo beneficio dalle loro rispettive qualità e rendere i servizi accessibili a un maggior numero di utenti?
Siete d’accordo con questa mia analisi o, al contrario, ritenete più probabile che si verifichino gli scenari sopraindicati o addirittura ulteriori ipotesi che non ho preso in considerazione?
Per altri approfondimenti mi trovi anche su Linkedin: @Luca Moretto