AI Microsoft ti copia la voce. L’utilizzo dell’intelligenza artificiale per riprodurre sempre più fedelmente la voce umana sembra, con il nuovo modello svelato da Microsoft, arrivato ad avvicinarsi ad una sorta di perfezione. A VALL-E (questo il nome del modello IA) bastano tre secondi di ascolto audio per riprodurre la voce di una persona, imitandone anche tono, cadenza e timbro. Il modello può essere utilizzato per applicazioni text-to-speech, per l’editing di conversazioni e per la creazione di contenuti audio.
Tutto molto bello, ma lato privacy?
Se da una parte è innegabilmente affascinante l’idea che attraverso la tecnologia si possa arrivare a risultati così sorprendenti, dall’altra le impressionanti capacità di questo nuovo sistema sollevano, o meglio risollevano, le preoccupazioni relative a sicurezza e privacy.
Nelle mani sbagliate
È lapalissiano che tale tecnologia nelle mani sbagliate possa essere utilizzata per scopi illeciti, in particolare facendo da veicolo per i cosidetti deepfake audio (ma anche video) in cui la simulazione di una voce può essere utilizzata per scopi illegali di vario tipo. Facciamo un esempio: Cosa potrebbe succedere se, e non con intento scherzoso, utilizzando la voce di un’alta personalità politica qualcuno riuscisse ad ottenere informazioni riservate dalla segreteria di un Ministero? Con l’IA sviluppata da Microsoft, ad un malintenzionato basterebbero tre minuti di registrazione di un intervento in tv, in radio o su youtube di un personaggio pubblico per, di fatto, rubargli la voce.
Le indicazioni del Garante
VALL-E riaccende i riflettori su un tema già caldo di per sé. È, infatti, datata Dicembre 2020 questa scheda informativa fornita dal Garante italiano per sensibilizzare gli utenti sui rischi connessi agli usi malevoli di questa nuova tecnologia, sempre più frequenti, anche a causa della diffusione di app e software che rendono possibile realizzare deepfake, anche molto ben elaborati e sofisticati, utilizzando un comune smartphone.
L’ultimo caso
L’ultimo caso, su cui il Garante è intervenuto (qui il nostro approfondimento), è quello di Fakeyou, app scaricabile da qualsiasi dispositivo e molto utilizzata dagli utenti più giovani di Tik Tok per creare video divertenti. Applicazione che ha portato il Garante a chiedere delucidazioni su molti aspetti: modalità di costruzione della voce, tipo di dati trattati, ubicazione dei data center, misure tecniche ed organizzative adottate per garantire sicurezza adeguata al rischio. La voce è un dato, un dato importante. Sembra scontato, ma ogni tanto va ribadito, così come ha fatto il Garante.
Le rassicurazioni di Microsoft
È importante sottolineare che la tecnologia alla base di VALL-E è ancora in fase sperimentale, non disponibile su larga scala (non esiste alcuna app acquistabile in nessun appstore), ed accessibile soltanto da un ristretto gruppo di ricercatori selezionati da Microsoft. L’azienda, in ogni caso, sta pensando di creare un modello per mitigare i rischi, un sistema che riconosca un audio sintetizzato da VALLE-E in modo da poter scovare eventuali utilizzatori non autorizzati.