Video generati dal testo, OpenAI apre una nuova frontiera IA che ci mette nei guai
La società californiana ha annunciato Sora, le cui clip impressionano per qualità e durata. Ma così chiunque può creare filmati dannosi o compromettenti, totalmente falsi
Dopo testo e immagini è l'ora dei video creati dall'intelligenza artificiale generativa. La novità arriva da OpenAI, che ha annunciato il lancio di Sora, modello in grado di produrre una clip partendo da una descrizione testuale. Come già avviene per la generazioni di testi e immagini, anche per i video il risultato finale è più ricco di dettaglio in relazione all'accuratezza della richiesta iniziale. Ciò che stupisce da quanto mostrato da OpenAI, però, è l'alto livello del prodotto, perché nei 48 filmati disponibili sul sito dell'azienda spicca la qualità dei frame creati e la loro congruità nella sequenza delle azioni demandate in origine. In sostanza, il realismo e la fluidità della scena riprodotta impressionano, anche e soprattutto se paragonata a quanto c'era di disponibile finora sul mercato.
In attesa di scoprire Lumiere, il modello text-to-video di Google, una clip di Runway tramite il modello Gen-2, il generatore di video considerato più avanzato al momento, appare ben distante dalle abilità di Sora. Qui si possono vedere tutte le clip mostrate da OpenAI, insieme ai prompt di partenza: dalla “donna elegante che cammina di notte in una strada di Tokyo piena di neon caldi e luminosi e di insegne animate della città” al “SUV vintage che sfreccia su una strada sterrata”, fino al “dalmata che guarda dalla finestra di un edificio di Burano”, il confronto con Runway e tutti gli altri modelli disponibili è nettamente dalla parte di OpenAI. Che fa meglio degli altri non solo per la qualità del prodotto ma anche per la sua durata. Ai 18 secondi di Runway, Sora risponde con clip lunghe fino a 60 secondi.
A proposito della potenzialità del modello che genera video, OpenAI spiega che può “creare scene complesse con più personaggi, specifici tipi di movimento e dettagli accurati sia dei soggetti, sia dello sfondo”. E per sottolineare i risultati sbalorditivi la società guidata da Sam Altman aggiunge che Sora va oltre le richieste dell'utente, poiché “comprende anche come i diversi elementi coesistono nel mondo reale". Essendo ancora all'inizio dello sviluppo, ci sono ancora dei limiti, come “la difficoltà a simulare in maniera accurata i movimenti di una scena complessa e la comprensione della relazione causa-effetto”. Chi voglia provarlo dovrà aspettare, perché Sora al momento non è aperta al pubblico ma disponibile solo per il “red team” individuato dalla società californiana per indagare eventuali problemi o falle per la sicurezza, mentre a una cerchia ristretta di filmmaker è stata data la possibilità di testare il modello per fornire riscontri utili in tema di cambiamenti e migliorie.
La diffusione di tool così semplici e immediati da utilizzare per qualsiasi persona a prescindere dalla sua competenza digitale e tecnologica apre un nuovo fronte sull'utilizzo dei modelli di intelligenza artificiale generativa. Se l'allarme era già scattato con i testi per i limiti dei software e la false informazioni che fanno girare, per ripetersi con i modelli che generano immagini per la semplicità di creare pose dannose o controproducenti per le persone immortalate (a partire da politici e vip), con i video bisogna agire subito prima che la situazione possa sfuggire di mano. Poter produrre video senza limitazioni, al di là del buonsenso ormai sopraffatto dalla ricerca della gloria via social, renderà ancor più facile generare e diffondere deepfake, cioè clip false create proprio tramite tecniche di IA per far dire a una persona qualcosa mai detto o effettuare un'azione mai eseguita.
L'annuncio di Sora da parte di OpenAI segue a distanza di pochi giorni il lancio di Memory, funzione con cui ChatGpt sarà in grado di ricordare le informazioni sull'utente che la utilizza e sulle conversazioni avvenute in passato. La mancanza di memoria a lungo termine era una delle lacune principali dei modelli di IA generativa, che invece ora potrà immagazzinare i dati sia se comunicati in maniera diretta, sia deducendoli nel tempo grazie ai vari dialoghi avuti con l'utente. Per ora circoscritta a un numero ristretto di utenti durante la prima fase, anche Memory ripresenta l'abituale dilemma tra vantaggi pratici e rischi per la privacy: alla possibilità di sfruttare un assistente che già conosce dettagli ottenuti nelle precedenti conversazioni invece che dover ripartire ogni volta da zero, fa da contraltare la necessità di concedere a chi sta dietro il software altre informazioni personali oltre quelle già cedute per l’uso del servizio. Per quanto non ci sia dubbio che per salire di livello ed essere più ‘intelligenti’ le IA devono poter conoscere bene il suo interlocutore, OpenAI ha detto che la funzione non registra dati sensibili e che ogni utente può chiedere all'intelligenza artificiale di dimenticare le informazioni personali e disattivare Memory.