Il 15 febbraio 2024 OpenAI ha svelato Sora, un modello di intelligenza artificiale (AI) rivoluzionario in grado di generare video realistici a partire da semplici descrizioni testuali. Si tratta di un modello generalista di dati visivi il quale può generare video e immagini con durate, rapporti di aspetto e risoluzioni diverse, fino a un minuto intero di video ad alta definizione. Sora è un modello di diffusione, il che significa che genera un video partendo da una sequenza di immagini e le trasforma gradualmente in un video realistico.

FINANZA & AI/ La vera "rivoluzione" possibile dietro i record di Nvidia

La novità risiede nel modo in cui questa trasformazione viene attuata. Piuttosto che lavorare sull’intero video in una volta sola, Sora suddivide il video in piccole unità chiamate “patch” spazio-temporali le quali rappresentano una porzione di spazio (ad esempio, una specifica area dell’inquadratura) e di tempo (ad esempio, un decimo di secondo).

Apple Vision Pro, molte persone lo stanno restituendo: perchè?/ Colpa della cinetosi

Il processo di generazione inizia con una sequenza di “patch” casuali che fungono da punto di partenza, poi Sora utilizza una rete neurale per prevedere come dovrebbe apparire ogni patch in un video realistico le quali vengono aggiornate per avvicinarsi alle previsioni formulate dalla rete neurale. Questi passi vengono continuamente ripetuti fino a quando il video non raggiunge un livello di realismo soddisfacente.

L’utilizzo di “patch” spazio-temporali offre diversi vantaggi poiché permette di generare video in maniera più efficiente rispetto all’elaborazione dell’intero video in una volta sola, così come consente di modificare e correggere specificatamente determinate porzioni del video. Il risultato finale è quello di ottenere video di alta qualità con una maggiore attenzione ai dettagli.

"Instagram, genitori di baby influencer assecondavano pedofili"/ WSJ: “Meta sapeva del problema”

Per quel che riguarda, invece, l’allenamento del modello, OpenAI non ha indicato né il numero dei video e neppure da dove essi provengano, salvo sostenere che l’addestramento ha incluso sia video disponibili su fonti aperte che video proprietari. Non è da escludere che tali affermazioni trovino un fondamento nelle recenti citazioni in giudizio, formulate nei confronti della società, per aver utilizzato materiale protetto da copyright.

In ultimo, OpenAI non ha rilasciato Sora al pubblico in quanto ancora al lavoro per avere una ragionevole contezza dei pericoli insiti nel modello stesso cosicché ha deciso di condividere la nuova tecnologia solo con un ristretto gruppo di accademici e altri ricercatori esterni. L’obiettivo è quello di sottoporre il modello ad attività di “red teaming”, vale a dire la ricerca e la successiva mitigazione di modalità improprie di utilizzo e di eventuali falle nella sicurezza.

In conclusione, Sora rappresenta l’ennesima prova delle potenzialità attuali dell’AI generativa e, dal punto di vista degli aspetti più problematici legati al suo utilizzo, ciò non può che far ingenerare timori diffusi sugli aspetti legati alla veridicità dei contenuti diffusi in rete. In questo caso, viene confermato ancora una volta, quanto sostenuto da William Fielding Ogburn, nel suo testo “Social Change with Respect to Culture and Original Nature”, del 1922, riferendosi al concetto di “ritardo culturale”.

Con quest’ultimo, egli metteva in evidenza che la cultura umana e le istituzioni sociali evolvono più lentamente delle tecnologie, il che può portare a conflitti e persistenti problemi nella società: vale a dire, un crescente divario tra il possibile a livello tecnologico e il desiderabile a livello sociale. Per evitare tale inevitabile iato, Ogburn suggeriva di agire sulla leva di un cambiamento culturale più rapido, basato su una maggiore alfabetizzazione tecnologica. Ciò vale, evidentemente, ancor di più oggigiorno, nel caso dell’AI generativa, sicché gli stessi decisori politici dovrebbero tenerne conto e procedere all’implementazione di standard regolatori a livello globale.

La situazione attuale è tanto più urgente in quanto tali progressi tecnologici rischiano di alimentare a dismisura la disinformazione e la nascita di teorie cospirative, le quali vengono sempre più utilizzate per alimentare la frammentazione del corpo sociale e generare ampie divisioni politiche. La conseguenza di ciò è che si accelera l’erosione della fiducia, da parte dei comuni cittadini, nei media, nel Governo, nei rappresentanti istituzionali e, in definitiva, nell’intera società.

— — — —

Abbiamo bisogno del tuo contributo per continuare a fornirti una informazione di qualità e indipendente.

SOSTIENICI. DONA ORA CLICCANDO QUI











© RIPRODUZIONE RISERVATA