Google sta rivoluzionando il modo in cui gli utenti possono generare e modificare contenuti video attraverso la nuova versione del suo modello di intelligenza artificiale, Veo 2. Le funzionalità, disponibili in anteprima sulla piattaforma Google Cloud Vertex AI, mirano a semplificare la creazione di video dal look cinematografico, introducendo strumenti innovativi per migliorare l’esperienza di editing e generazione di contenuti. Inoltre, queste novità si affiancano agli aggiornamenti al generatore di immagini AI, Imagen 3, e ai modelli audio.

Le nuove funzionalità di Veo 2

Le recenti innovazioni di Veo 2 includono una funzione di “inpainting“, attraverso la quale gli utenti possono rimuovere automaticamente elementi di disturbo dai loro video, come immagini di sfondo indesiderate o loghi. Questa capacità rappresenta un grande passo avanti per chi desidera un risultato finale pulito e professionale. Inoltre, è stata introdotta la funzione di “outpainting“, che consente di estendere il formato di un video oltre i suoi limiti originali. In questo caso, il software riempirà lo spazio vuoto con sequenze video generate dall’intelligenza artificiale, adattandole per integrarsi perfettamente con il clip originale, simile alla funzionalità “Generative Expand” di Adobe per le immagini.

Quando Veo 2 amplia un video, lo spazio creato viene riempito da filmati generati, garantendo una coesione visiva. Il modello offre anche preset di tecniche cinematografiche, permettendo agli utenti di selezionare il tipo di inquadratura, angolazioni di ripresa e ritmi, facilitando la composizione finale. Tra gli esempi di preset disponibili ci sono effetti time-lapse e simulazioni di panoramiche della camera in diverse direzioni.

Un’altra novità interessante è la funzione di interpolazione, che consente di generare una transizione video tra due immagini fisse. Gli utenti possono semplicemente dare un punto di inizio e uno di fine, e Veo 2 restituirà un video che collega i due momenti.

Confronto con i modelli concorrenti

Adobe, un grande concorrente di Google in questo settore, ha recentemente introdotto il suo modello video Firefly con funzionalità analoghe, tra cui un’estensione generativa per Premiere Pro. Google differenzia i suoi servizi aggiungendo i watermark per l’attribuzione digitale chiamati SynthID, in modo simile al sistema di Credenziali dei Contenuti di Adobe. Tuttavia, Adobe si impegna a garantire che i propri strumenti siano completamente sicuri per l’uso commerciale poiché sono addestrati esclusivamente su contenuti pubblicati e autorizzati, un aspetto su cui Google mostra ancora delle lacune a causa della modalità di addestramento dei suoi modelli AI.

Aggiornamenti per Imagen 3 e novità audio

Non solo Veo 2 ha ricevuto aggiornamenti significativi; anche la tecnologia di Google per il testo in immagini, Imagen 3, ha visto miglioramenti notevoli nella rimozione automatica di oggetti, promettendo risultati più naturali e soddisfacenti. Diverse aziende del calibro di L’Oreal e Kraft Heinz stanno già utilizzando queste tecnologie per la produzione di contenuti marketing. Justin Thomas, leader dell’esperienza digitale di Kraft Heinz, ha dichiarato che attività che un tempo richiedevano otto settimane, ora possono essere completate in sole otto ore.

Sul fronte audio, Google ha lanciato il suo modello di testo in musica, Lyria, in anteprima privata, e ha introdotto una funzionalità chiamata “Voce Personalizzata Istantanea” per il suo modello di sintesi vocale, Chirp 3. Questa innovazione offre la possibilità di generare voci personalizzate realistiche da soli dieci secondi di input audio. Inoltre, è previsto anche un nuovo strumento di trascrizione che può identificare e separare i singoli interlocutori durante le chiamate affollate, rendendo le trascrizioni più chiare.

Futuro delle tecnologie AI di Google

Queste recenti innovazioni fanno parte di una serie di annunci legati all’intelligenza artificiale che Google ha presentato. Sorprendentemente, Gemini 2.5 Flash, l’ultima versione del modello Flash ottimizzato per l’efficienza, sarà presto disponibile su Vertex AI. Google assicura che Gemini 2.5 Flash adegua automaticamente i tempi di elaborazione in base alla complessità del compito, promettendo risultati più rapidi per richieste semplici.

Inoltre, i tool Agentic AI, focalizzati sulle esigenze aziendali, stanno per ricevere un aggiornamento, consentendo agli agenti AI di comunicare tra loro e di eseguire compiti su piattaforme come PayPal e Salesforce. Intanto, Google sta lanciando una nuova sezione nel proprio Cloud Marketplace dedicata alla navigazione e all’acquisto di agenti AI sviluppati da partner terzi. Queste innovazioni pongono Google in una posizione competitiva nel settore della tecnologia AI, puntando a un futuro sempre più integrato e dinamico.