Bitget App
Trade smarter
Acquista CryptoMercatiTradingFuturesEarnWeb3PlazaAltro
Trading
Spot
Acquista e vendi crypto
Margine
Amplifica il tuo capitale e l'efficienza dei fondi
Onchain
Going Onchain, without going Onchain!
Convert
Zero commissioni di transazione e nessuno slippage
Esplora
Launchhub
Ottieni il vantaggio in anticipo e inizia a vincere
Copy Trading
Copia un trader d'élite con un solo clic
Bot
Trading bot IA semplice, veloce e affidabile
Trading
Futures USDT-M
Futures regolati in USDT
Futures USDC-M
Futures regolati in USDC
Futures Coin-M
Futures regolati in criptovalute
Esplora
Guida ai futures
Un percorso da nuovo utente ad avanzato nel trading sui futures
Promozioni sui Futures
Ti aspettano generosi bonus
Bitget Earn
Una varietà di prodotti per far crescere i tuoi asset
Earn Semplice
Deposita e preleva in qualsiasi momento per ottenere rendimenti flessibili a rischio zero
On-chain Earn
Guadagna profitti ogni giorno senza mettere a rischio il tuo capitale iniziale
Earn Strutturato
Un'innovazione finanziaria solida per gestire le oscillazioni del mercato
VIP e Gestione Patrimoniale
Servizi premium per una gestione patrimoniale smart
Prestiti
Prestiti flessibili con elevata sicurezza dei fondi
Il nuovo modello di immagini AI "Banana" di Google fa impazzire gli utenti con il "Vibe Photoshoping"

Il nuovo modello di immagini AI "Banana" di Google fa impazzire gli utenti con il "Vibe Photoshoping"

MarsBitMarsBit2025/08/30 06:53
Mostra l'originale
Per:TechFlow

Google AI Studio ha rilasciato Gemini 2.5 Flash Image (nome in codice nano-banana), il modello più avanzato di Google per la generazione e modifica di immagini, caratterizzato da alta velocità e prestazioni eccellenti in numerose classifiche. Riassunto generato da Mars AI Questo riassunto è stato prodotto dal modello Mars AI e l'accuratezza e completezza del contenuto generato sono ancora in fase di aggiornamento iterativo.

Il nuovo modello di immagini AI

Ricordi il misterioso modello di editing di immagini AI "nano-banana" di cui tutti parlavano qualche tempo fa? All’epoca, nell’arena dei modelli linguistici LMArena, aveva attirato grande attenzione grazie alle sue prestazioni eccezionali. Anche i principali esperti tecnici di Google Gemini si sono alternati sui social media, alimentando la curiosità degli utenti, tanto che per un periodo è stato persino considerato il leggendario Gemini 3.0 Pro.

Ora, Google ha finalmente svelato il suo mistero.

Alle prime ore del 27 agosto (fuso orario GMT+8), Google AI Studio ha ufficialmente lanciato Gemini 2.5 Flash Image (nome in codice nano banana) 🍌.

Il nuovo modello di immagini AI

Gemini 2.5 Flash Image, atteso da tempo, finalmente debutta | Fonte immagine: GeekPark

Questo è il modello di generazione ed editing di immagini più avanzato mai realizzato da Google: non solo è incredibilmente veloce, offrendo un’esperienza quasi "fulminea", ma ha anche raggiunto risultati SOTA in diverse classifiche, distaccando nettamente gli altri su LMArena.

Il nuovo modello di immagini AI

Gemini 2.5 Flash Image raggiunge subito capacità SOTA | Fonte immagine: LMarena.ai

Nel blog tecnico, Google ha menzionato che Gemini 2.0 Flash aveva già conquistato gli sviluppatori grazie alla bassa latenza e all’elevato rapporto qualità-prezzo, ma gli utenti desideravano immagini di qualità superiore e un controllo creativo più potente. Gemini 2.5 Flash Image arriva proprio con questi importanti aggiornamenti: la coerenza dei personaggi è finalmente ben mantenuta, l’editing delle immagini basato su prompt è più preciso, la fusione di più immagini è naturale e fluida, e la comprensione della conoscenza del mondo reale lo rende non solo un modello, ma una "pietra miliare" per la prossima generazione di applicazioni di successo.

Anche GeekPark lo ha provato subito. Inaspettatamente, non si tratta solo di un aggiornamento del modello: per la prima volta si percepisce davvero che il futuro dell’editing fotografico AI è ormai alle porte.

Il nuovo modello di immagini AI

Attualmente disponibile per la prova su Google AI Studio | Fonte immagine: GeekPark

All’inizio, mi sono avvicinato con l’atteggiamento di una prova standard, "vediamo quanto è più veloce il nuovo modello". Ma non mi aspettavo che poche ore di utilizzo mi avrebbero fatto intravedere in anticipo il volto delle prossime killer app.

In passato eravamo abituati a strumenti come MeituPic: bastava cliccare qualche pulsante, applicare un filtro e la foto diventava subito più bella. Ma la sensazione che dà Gemini 2.5 Flash Image è completamente diversa. È incredibilmente veloce, intelligente come un designer che capisce i tuoi desideri: basta dire l’effetto che vuoi e in pochi secondi il risultato appare davanti a te.

Il nuovo modello di immagini AI

Oltre agli effetti, la velocità è un’altra differenza evidente rispetto ai precedenti prodotti di generazione immagini | Fonte immagine: GeekPark


01 Generazione ultra-rapida, risultati in pochi secondi

L’aspetto più immediato dell’esperienza nano banana è la velocità. In passato, anche usando modelli open source su computer potenti, dalla richiesta al risultato passavano decine di secondi o più. Per gli utenti mobile, l’attesa era ancora più snervante.

Ma Gemini 2.5 Flash Image abbassa questa soglia a pochi secondi. È il modello multimodale nativo "più nuovo, veloce ed efficiente" secondo Google, che ha chiaramente investito molto nell’ottimizzazione. Nei miei test, bastavano tre o quattro secondi per ottenere un’immagine chiara e dettagliata dopo aver inserito un prompt. (UTC+8)

Questa esperienza ricorda l’uso quotidiano di MeituPic: clicchi su "bellezza" e l’effetto è immediato. La differenza è che MeituPic applica filtri preimpostati, mentre Gemini 2.5 Flash Image costruisce un’immagine da zero o trasforma radicalmente una foto secondo le tue richieste. Questa sensazione di "colpire dove vuoi" è impensabile con i tradizionali processi di fotoritocco.

Il nuovo modello di immagini AI

Richieste come "rimuovi i passanti dallo sfondo" si risolvono con un solo prompt | Fonte immagine: GeekPark

Se la velocità migliora l’esperienza degli utenti tradizionali di fotoritocco, la "nativa multimodalità" amplia i confini delle capacità AI sulle immagini.

Gemini 2.5 Flash Image non solo genera immagini, ma comprende anche input testuali e visivi. Significa che posso dargli una foto e un prompt testuale insieme, e lui combinerà le informazioni per capire cosa desidero davvero.

Per esempio, ho caricato una foto scattata in strada e gli ho chiesto "cambia lo sfondo con una scena notturna di Shinjuku a Tokyo". Ha riconosciuto il soggetto della foto, lo ha ritagliato con precisione e ha sostituito lo sfondo con le luci al neon di Shinjuku. Ancora meglio, ha mantenuto la coerenza delle luci e delle ombre sul soggetto, evitando quell’effetto "incollato" tipico dei ritagli manuali.

Questa capacità mi ricorda una funzione spesso citata negli ultimi anni nelle gallerie delle app di smartphone: "cambia sfondo con un click". Ma allora i bordi erano sfocati, le luci sbagliate, il risultato poco realistico. Ora, Gemini 2.5 Flash Image integra conoscenza del mondo e comprensione visiva per migliorare questi dettagli, ottenendo risultati molto più naturali e precisi rispetto ai tradizionali strumenti text-to-image/image-to-image.

Il nuovo modello di immagini AI

Immagine originale & risultato generato da Gemini 2.5 Flash Image | Fonte immagine: GeekPark

Ecco perché penso che ridefinirà l’esperienza di fotoritocco: non più affidarsi a tanti aggiustamenti manuali, ma lasciare che la comprensione semantica naturale del modello completi il compito, soprattutto in scenari come il ritocco di ritratti dove i dettagli sono fondamentali.

Il nuovo modello di immagini AI

Per esigenze di editing di ritratti, la coerenza dei personaggi di Gemini 2.5 Flash Image offre davvero un’esperienza di "Vibe Photoshoping" mai vista prima.

Il nuovo modello di immagini AI

Un secondo per "salvare la faccia" a un programmatore | Fonte immagine: GeekPark

Questa esperienza rompe molti pregiudizi sull’AI generativa di immagini, spesso considerata "esoterica": se il prompt è scritto bene, il risultato è sorprendente; se è mediocre, l’immagine generata può essere completamente fuori tema.

Ma con Gemini 2.5 Flash Image, questa "sensazione di esoterismo" è molto ridotta. Comprende i prompt in modo più preciso e vicino all’intuizione dell’utente: ecco perché molti lo trovano improvvisamente molto più utile.

Per esempio, gli dico "sfoca lo sfondo, metti in risalto il soggetto in primo piano" e in pochi secondi ottengo esattamente ciò che volevo; gli chiedo "cambia l’espressione della persona in foto con un sorriso" e non solo la bocca si incurva, ma anche lo sguardo viene modificato, con grande attenzione ai dettagli; ho persino provato a "colorare una foto in bianco e nero" e il risultato non è stato casuale, ma il più possibile vicino all’atmosfera cromatica delle foto storiche.

Questa capacità di "dire e ottenere" mi ricorda quando usavo MeituPic: volevo solo levigare la pelle, ma finivo con una faccia da "bellezza livello 10" completamente finta. Ora, le operazioni di Gemini 2.5 Flash Image sono precise e misurate: capisce davvero cosa vuoi e cerca di riprodurlo fedelmente.


02 Capacità potenziate, difficile tornare indietro

Per essere più diretto, l’ho confrontato con gli strumenti di fotoritocco mobile che uso di solito.

Su Snapseed, per sfocare lo sfondo devo selezionare manualmente l’area in primo piano e regolare il livello di sfocatura, impiegando uno o due minuti anche se sono esperto.

Su MeituPic, esiste la funzione di sfocatura automatica dello sfondo, ma spesso sfoca anche i bordi del soggetto, con un effetto poco naturale.

Su Gemini 2.5 Flash Image, basta una frase: riconosce automaticamente i confini tra soggetto e sfondo, l’effetto è naturale e non serve alcuna correzione.

Il nuovo modello di immagini AI

Questo confronto dimostra una cosa: Gemini 2.5 Flash Image libera l’utente dalle operazioni complesse, affidando più lavoro al modello. Per le persone comuni, abbassa la soglia del fotoritocco; per i professionisti, fa risparmiare molto tempo.

Dopo averlo provato, la mia sensazione principale è che Gemini 2.5 Flash Image non sia più solo uno strumento di fotoritocco, ma si avvicini a un "assistente intelligente".

In passato, con MeituPic, si usava una raccolta di funzioni preimpostate: filtri, bellezza, mosaico, ogni pulsante corrispondeva a una funzione. Dovevi scegliere e regolare passo dopo passo fino a essere soddisfatto.

Ora, la logica di Gemini 2.5 Flash Image è completamente diversa. Non devi più imparare la logica dello strumento: capisce direttamente le tue esigenze. Basta dirlo e lui lo fa per te.

Questo cambiamento sembra sottile, ma in realtà rivoluziona il processo di fotoritocco: prima eravamo noi ad adattarci allo strumento, ora è lo strumento ad adattarsi a noi. Questo tipo di interazione è già il prototipo delle applicazioni di prossima generazione.

Guardando adesso, Gemini 2.5 Flash Image è ancora in una fase iniziale e le sue funzionalità hanno dei limiti. Ma la velocità, la comprensione e la fedeltà che mostra fanno già immaginare un futuro promettente.

Cosa succederebbe se lo combinassimo con MeituPic? Forse aprirai l’app, dirai al telefono "migliora questa foto, rendi la pelle più naturale" e in pochi secondi otterrai il risultato (UTC+8); magari durante un viaggio, dirai "cambia il tempo in soleggiato" e la foto diventerà subito luminosa; o ancora, nell’editing video, potrai cambiare l’atmosfera di una scena con una sola frase.

Il nuovo modello di immagini AI

Questo metodo potrebbe presto diventare la funzione principale di editing immagini nei sistemi operativi mobili | Fonte immagine: Twitter

Ecco perché penso che rivoluzionerà rapidamente i flussi di lavoro degli attuali strumenti di fotoritocco, definendo la prossima generazione di "MeituPic": non solo editing, ma una nuova modalità di interazione per l’elaborazione delle immagini, con l’AI come partner per il post-processing fotografico.

Tuttavia, al momento Gemini 2.5 Flash Image non può ancora essere un’app di fotoritocco di massa pronta all’uso: non solo perché il suo scopo principale resta la generazione di immagini piuttosto che il ritocco su base esistente, ma anche perché tutte le immagini create o modificate con Gemini 2.5 Flash Image includeranno una filigrana digitale SynthID, per il riconoscimento dei contenuti AI sulle piattaforme social.


03 Il punto di svolta per le killer app

Ripensandoci, MeituPic è diventata un’app universale perché ha risolto nel modo più semplice il problema che tutti volevano risolvere: rendere le foto più belle.

Gemini 2.5 Flash Image fa un passo avanti: trasforma le complesse capacità AI in un’esperienza di "immagine pronta in un secondo" accessibile a tutti.

Quando per la prima volta gli ho detto "sfoca lo sfondo", e in pochi secondi l’immagine era pronta in modo naturale, ho capito subito: questo è il punto di partenza di una killer app. Non è solo un modello, ma la base per innumerevoli nuovi prodotti futuri.

Il nuovo modello di immagini AI

La funzione AI "cambia cielo con un click" che ha spopolato tra gli utenti mobile negli ultimi anni | Fonte immagine: vivo community

Forse tra qualche anno ci dimenticheremo del nome in codice Banana, ma vedremo sempre più strumenti di editing immagini che ti permettono di "dire ciò che vuoi e ottenerlo subito", e forse diventeranno, come MeituPic, un ricordo condiviso da una generazione di utenti.

Solo che questa volta, l’AI porterà l’immaginazione ancora più lontano.

0

Esclusione di responsabilità: il contenuto di questo articolo riflette esclusivamente l’opinione dell’autore e non rappresenta in alcun modo la piattaforma. Questo articolo non deve essere utilizzato come riferimento per prendere decisioni di investimento.

PoolX: Blocca per guadagnare
Almeno il 12% di APR. Sempre disponibile, ottieni sempre un airdrop.
Blocca ora!

Ti potrebbe interessare anche

AiCoin Quotidiano (30 agosto)

AICoin2025/08/30 17:46

Hotcoin Research | Il mercato scommette su una probabilità di oltre l'80% di un taglio dei tassi a settembre: analisi delle tempistiche dei tagli dei tassi della Federal Reserve nel quarto trimestre e prospettive sugli impatti

Questo articolo analizzerà le basi delle decisioni sui tassi di interesse della Federal Reserve, i canali attraverso cui una riduzione dei tassi influisce sugli asset cripto e le esperienze storiche, e fornirà una simulazione di scenari sulla probabilità di un taglio dei tassi a settembre e sul ritmo dei tagli nel quarto trimestre.

深潮2025/08/30 17:29
Hotcoin Research | Il mercato scommette su una probabilità di oltre l'80% di un taglio dei tassi a settembre: analisi delle tempistiche dei tagli dei tassi della Federal Reserve nel quarto trimestre e prospettive sugli impatti

Il favorito alla presidenza della Federal Reserve, Waller: Ethereum e le stablecoin sono il prossimo passo nello sviluppo dei pagamenti, le istituzioni dovrebbero adottarli.

Il candidato favorito come prossimo presidente della Federal Reserve, Waller, ha espresso pubblicamente un atteggiamento ottimista nei confronti degli asset digitali (in particolare Ethereum e le stablecoin), esortando le istituzioni finanziarie ad accettare le criptovalute come il naturale prossimo passo nello sviluppo dei pagamenti.

深潮2025/08/30 17:27