Il nuovo modello di immagini AI "Banana" di Google fa impazzire gli utenti con il "Vibe Photoshoping"

MarsBit2025/08/30 06:53

Mostra l'originale

Per:TechFlow

Google AI Studio ha rilasciato Gemini 2.5 Flash Image (nome in codice nano-banana), il modello più avanzato di Google per la generazione e modifica di immagini, caratterizzato da alta velocità e prestazioni eccellenti in numerose classifiche. Riassunto generato da Mars AI Questo riassunto è stato prodotto dal modello Mars AI e l'accuratezza e completezza del contenuto generato sono ancora in fase di aggiornamento iterativo.

Ricordi il misterioso modello di editing di immagini AI "nano-banana" di cui tutti parlavano qualche tempo fa? All’epoca, nell’arena dei modelli linguistici LMArena, aveva attirato grande attenzione grazie alle sue prestazioni eccezionali. Anche i principali esperti tecnici di Google Gemini si sono alternati sui social media, alimentando la curiosità degli utenti, tanto che per un periodo è stato persino considerato il leggendario Gemini 3.0 Pro.

Ora, Google ha finalmente svelato il suo mistero.

Alle prime ore del 27 agosto (fuso orario GMT+8), Google AI Studio ha ufficialmente lanciato Gemini 2.5 Flash Image (nome in codice nano banana) 🍌.

Gemini 2.5 Flash Image, atteso da tempo, finalmente debutta | Fonte immagine: GeekPark

Questo è il modello di generazione ed editing di immagini più avanzato mai realizzato da Google: non solo è incredibilmente veloce, offrendo un’esperienza quasi "fulminea", ma ha anche raggiunto risultati SOTA in diverse classifiche, distaccando nettamente gli altri su LMArena.

Gemini 2.5 Flash Image raggiunge subito capacità SOTA | Fonte immagine: LMarena.ai

Nel blog tecnico, Google ha menzionato che Gemini 2.0 Flash aveva già conquistato gli sviluppatori grazie alla bassa latenza e all’elevato rapporto qualità-prezzo, ma gli utenti desideravano immagini di qualità superiore e un controllo creativo più potente. Gemini 2.5 Flash Image arriva proprio con questi importanti aggiornamenti: la coerenza dei personaggi è finalmente ben mantenuta, l’editing delle immagini basato su prompt è più preciso, la fusione di più immagini è naturale e fluida, e la comprensione della conoscenza del mondo reale lo rende non solo un modello, ma una "pietra miliare" per la prossima generazione di applicazioni di successo.

Anche GeekPark lo ha provato subito. Inaspettatamente, non si tratta solo di un aggiornamento del modello: per la prima volta si percepisce davvero che il futuro dell’editing fotografico AI è ormai alle porte.

Attualmente disponibile per la prova su Google AI Studio | Fonte immagine: GeekPark

All’inizio, mi sono avvicinato con l’atteggiamento di una prova standard, "vediamo quanto è più veloce il nuovo modello". Ma non mi aspettavo che poche ore di utilizzo mi avrebbero fatto intravedere in anticipo il volto delle prossime killer app.

In passato eravamo abituati a strumenti come MeituPic: bastava cliccare qualche pulsante, applicare un filtro e la foto diventava subito più bella. Ma la sensazione che dà Gemini 2.5 Flash Image è completamente diversa. È incredibilmente veloce, intelligente come un designer che capisce i tuoi desideri: basta dire l’effetto che vuoi e in pochi secondi il risultato appare davanti a te.

Oltre agli effetti, la velocità è un’altra differenza evidente rispetto ai precedenti prodotti di generazione immagini | Fonte immagine: GeekPark

01 Generazione ultra-rapida, risultati in pochi secondi

L’aspetto più immediato dell’esperienza nano banana è la velocità. In passato, anche usando modelli open source su computer potenti, dalla richiesta al risultato passavano decine di secondi o più. Per gli utenti mobile, l’attesa era ancora più snervante.

Ma Gemini 2.5 Flash Image abbassa questa soglia a pochi secondi. È il modello multimodale nativo "più nuovo, veloce ed efficiente" secondo Google, che ha chiaramente investito molto nell’ottimizzazione. Nei miei test, bastavano tre o quattro secondi per ottenere un’immagine chiara e dettagliata dopo aver inserito un prompt. (UTC+8)

Questa esperienza ricorda l’uso quotidiano di MeituPic: clicchi su "bellezza" e l’effetto è immediato. La differenza è che MeituPic applica filtri preimpostati, mentre Gemini 2.5 Flash Image costruisce un’immagine da zero o trasforma radicalmente una foto secondo le tue richieste. Questa sensazione di "colpire dove vuoi" è impensabile con i tradizionali processi di fotoritocco.

Richieste come "rimuovi i passanti dallo sfondo" si risolvono con un solo prompt | Fonte immagine: GeekPark

Se la velocità migliora l’esperienza degli utenti tradizionali di fotoritocco, la "nativa multimodalità" amplia i confini delle capacità AI sulle immagini.

Gemini 2.5 Flash Image non solo genera immagini, ma comprende anche input testuali e visivi. Significa che posso dargli una foto e un prompt testuale insieme, e lui combinerà le informazioni per capire cosa desidero davvero.

Per esempio, ho caricato una foto scattata in strada e gli ho chiesto "cambia lo sfondo con una scena notturna di Shinjuku a Tokyo". Ha riconosciuto il soggetto della foto, lo ha ritagliato con precisione e ha sostituito lo sfondo con le luci al neon di Shinjuku. Ancora meglio, ha mantenuto la coerenza delle luci e delle ombre sul soggetto, evitando quell’effetto "incollato" tipico dei ritagli manuali.

Questa capacità mi ricorda una funzione spesso citata negli ultimi anni nelle gallerie delle app di smartphone: "cambia sfondo con un click". Ma allora i bordi erano sfocati, le luci sbagliate, il risultato poco realistico. Ora, Gemini 2.5 Flash Image integra conoscenza del mondo e comprensione visiva per migliorare questi dettagli, ottenendo risultati molto più naturali e precisi rispetto ai tradizionali strumenti text-to-image/image-to-image.

Immagine originale & risultato generato da Gemini 2.5 Flash Image | Fonte immagine: GeekPark

Ecco perché penso che ridefinirà l’esperienza di fotoritocco: non più affidarsi a tanti aggiustamenti manuali, ma lasciare che la comprensione semantica naturale del modello completi il compito, soprattutto in scenari come il ritocco di ritratti dove i dettagli sono fondamentali.

Per esigenze di editing di ritratti, la coerenza dei personaggi di Gemini 2.5 Flash Image offre davvero un’esperienza di "Vibe Photoshoping" mai vista prima.

Un secondo per "salvare la faccia" a un programmatore | Fonte immagine: GeekPark

Questa esperienza rompe molti pregiudizi sull’AI generativa di immagini, spesso considerata "esoterica": se il prompt è scritto bene, il risultato è sorprendente; se è mediocre, l’immagine generata può essere completamente fuori tema.

Ma con Gemini 2.5 Flash Image, questa "sensazione di esoterismo" è molto ridotta. Comprende i prompt in modo più preciso e vicino all’intuizione dell’utente: ecco perché molti lo trovano improvvisamente molto più utile.

Per esempio, gli dico "sfoca lo sfondo, metti in risalto il soggetto in primo piano" e in pochi secondi ottengo esattamente ciò che volevo; gli chiedo "cambia l’espressione della persona in foto con un sorriso" e non solo la bocca si incurva, ma anche lo sguardo viene modificato, con grande attenzione ai dettagli; ho persino provato a "colorare una foto in bianco e nero" e il risultato non è stato casuale, ma il più possibile vicino all’atmosfera cromatica delle foto storiche.

Questa capacità di "dire e ottenere" mi ricorda quando usavo MeituPic: volevo solo levigare la pelle, ma finivo con una faccia da "bellezza livello 10" completamente finta. Ora, le operazioni di Gemini 2.5 Flash Image sono precise e misurate: capisce davvero cosa vuoi e cerca di riprodurlo fedelmente.

02 Capacità potenziate, difficile tornare indietro

Per essere più diretto, l’ho confrontato con gli strumenti di fotoritocco mobile che uso di solito.

Su Snapseed, per sfocare lo sfondo devo selezionare manualmente l’area in primo piano e regolare il livello di sfocatura, impiegando uno o due minuti anche se sono esperto.

Su MeituPic, esiste la funzione di sfocatura automatica dello sfondo, ma spesso sfoca anche i bordi del soggetto, con un effetto poco naturale.

Su Gemini 2.5 Flash Image, basta una frase: riconosce automaticamente i confini tra soggetto e sfondo, l’effetto è naturale e non serve alcuna correzione.

Questo confronto dimostra una cosa: Gemini 2.5 Flash Image libera l’utente dalle operazioni complesse, affidando più lavoro al modello. Per le persone comuni, abbassa la soglia del fotoritocco; per i professionisti, fa risparmiare molto tempo.

Dopo averlo provato, la mia sensazione principale è che Gemini 2.5 Flash Image non sia più solo uno strumento di fotoritocco, ma si avvicini a un "assistente intelligente".

In passato, con MeituPic, si usava una raccolta di funzioni preimpostate: filtri, bellezza, mosaico, ogni pulsante corrispondeva a una funzione. Dovevi scegliere e regolare passo dopo passo fino a essere soddisfatto.

Ora, la logica di Gemini 2.5 Flash Image è completamente diversa. Non devi più imparare la logica dello strumento: capisce direttamente le tue esigenze. Basta dirlo e lui lo fa per te.

Questo cambiamento sembra sottile, ma in realtà rivoluziona il processo di fotoritocco: prima eravamo noi ad adattarci allo strumento, ora è lo strumento ad adattarsi a noi. Questo tipo di interazione è già il prototipo delle applicazioni di prossima generazione.

Guardando adesso, Gemini 2.5 Flash Image è ancora in una fase iniziale e le sue funzionalità hanno dei limiti. Ma la velocità, la comprensione e la fedeltà che mostra fanno già immaginare un futuro promettente.

Cosa succederebbe se lo combinassimo con MeituPic? Forse aprirai l’app, dirai al telefono "migliora questa foto, rendi la pelle più naturale" e in pochi secondi otterrai il risultato (UTC+8); magari durante un viaggio, dirai "cambia il tempo in soleggiato" e la foto diventerà subito luminosa; o ancora, nell’editing video, potrai cambiare l’atmosfera di una scena con una sola frase.

Questo metodo potrebbe presto diventare la funzione principale di editing immagini nei sistemi operativi mobili | Fonte immagine: Twitter

Ecco perché penso che rivoluzionerà rapidamente i flussi di lavoro degli attuali strumenti di fotoritocco, definendo la prossima generazione di "MeituPic": non solo editing, ma una nuova modalità di interazione per l’elaborazione delle immagini, con l’AI come partner per il post-processing fotografico.

Tuttavia, al momento Gemini 2.5 Flash Image non può ancora essere un’app di fotoritocco di massa pronta all’uso: non solo perché il suo scopo principale resta la generazione di immagini piuttosto che il ritocco su base esistente, ma anche perché tutte le immagini create o modificate con Gemini 2.5 Flash Image includeranno una filigrana digitale SynthID, per il riconoscimento dei contenuti AI sulle piattaforme social.

03 Il punto di svolta per le killer app

Ripensandoci, MeituPic è diventata un’app universale perché ha risolto nel modo più semplice il problema che tutti volevano risolvere: rendere le foto più belle.

Gemini 2.5 Flash Image fa un passo avanti: trasforma le complesse capacità AI in un’esperienza di "immagine pronta in un secondo" accessibile a tutti.

Quando per la prima volta gli ho detto "sfoca lo sfondo", e in pochi secondi l’immagine era pronta in modo naturale, ho capito subito: questo è il punto di partenza di una killer app. Non è solo un modello, ma la base per innumerevoli nuovi prodotti futuri.

La funzione AI "cambia cielo con un click" che ha spopolato tra gli utenti mobile negli ultimi anni | Fonte immagine: vivo community

Forse tra qualche anno ci dimenticheremo del nome in codice Banana, ma vedremo sempre più strumenti di editing immagini che ti permettono di "dire ciò che vuoi e ottenerlo subito", e forse diventeranno, come MeituPic, un ricordo condiviso da una generazione di utenti.

Solo che questa volta, l’AI porterà l’immaginazione ancora più lontano.

Esclusione di responsabilità: il contenuto di questo articolo riflette esclusivamente l’opinione dell’autore e non rappresenta in alcun modo la piattaforma. Questo articolo non deve essere utilizzato come riferimento per prendere decisioni di investimento.

PoolX: Blocca per guadagnare

Almeno il 12% di APR. Sempre disponibile, ottieni sempre un airdrop.

Blocca ora!

Ti potrebbe interessare anche

Solo 3 punti per il vantaggio competitivo delle blockchain pubbliche? I commenti del fondatore di Alliance DAO accendono il dibattito nella comunità crypto

Il dibattito sulla domanda "La barriera della blockchain pubblica è solo 3/10?" ha messo in luce la contraddizione di fondo nell’industria delle criptovalute: il conflitto sistemico tra idealismo e realtà, liquidità e fiducia, modelli di business e fondamenta dell’ecosistema.

BlockBeats•2025/12/12 08:23

Solo 3 punti per il vantaggio competitivo delle blockchain pubbliche? I commenti del fondatore di Alliance DAO accendono il dibattito nella comunità crypto

x402 V2 Release - Quali sono i punti salienti principali? 1. **Prestazioni migliorate**: Il rilascio di x402 V2 porta notevoli miglioramenti delle prestazioni, consentendo

x402 V2 non è più soltanto un'API di pagamento on-chain, ma ha unificato identità, pagamenti cross-chain, riutilizzo delle sessioni e consumo autonomo in un nuovo livello di Protocollo Economico di Internet.

BlockBeats•2025/12/12 08:23

x402 V2 Release - Quali sono i punti salienti principali?

1. **Prestazioni migliorate**: Il rilascio di x402 V2 porta notevoli miglioramenti delle prestazioni, consentendo

Dall’aggregazione dei bridge cross-chain al mercato della liquidità universale, LI.FI riceve un ulteriore finanziamento di 29 milioni di dollari

Perché un'infrastruttura cross-chain che è stata “hackerata due volte” ha ricevuto nuovamente investimenti di capitale?

ForesightNews 速递•2025/12/12 07:53

Dall’aggregazione dei bridge cross-chain al mercato della liquidità universale, LI.FI riceve un ulteriore finanziamento di 29 milioni di dollari

Come farsi davvero strada nel settore delle criptovalute?

Non puoi vivere la vita che desideri semplicemente "copiare e incollare".

ForesightNews 速递•2025/12/12 07:53

Come farsi davvero strada nel settore delle criptovalute?

In tendenza

Altro

Solo 3 punti per il vantaggio competitivo delle blockchain pubbliche? I commenti del fondatore di Alliance DAO accendono il dibattito nella comunità crypto

x402 V2 Release - Quali sono i punti salienti principali? 1. **Prestazioni migliorate**: Il rilascio di x402 V2 porta notevoli miglioramenti delle prestazioni, consentendo