Google ha ufficializzato l’arrivo dell’anteprima del suo nuovo modello di intelligenza artificiale, Gemini 2.5 Flash, disponibile attraverso la Gemini API, Google AI Studio e Vertex AI. L'annuncio segue quanto anticipato durante l'evento Cloud Next, dove si erano già intravisti i significativi passi avanti compiuti rispetto alla versione precedente. Gemini 2.5 Flash rappresenta un'evoluzione importante nella famiglia già molto completa e degna di nota di modelli Gemini, offrendo maggiore efficienza, velocità e soprattutto un nuovo approccio al ragionamento.

Questa nuova versione mantiene lo spirito del predecessore Gemini 2.0 Flash, ma lo supera per capacità di elaborazione e flessibilità. Il modello è stato progettato per fornire prestazioni elevate a costi contenuti e competitivi, e per adattarsi facilmente alle esigenze degli sviluppatori. Una delle principali novità introdotte è la possibilità di attivare o disattivare le funzioni di ragionamento, rendendolo così il primo modello ibrido nel suo genere. Questo consente di bilanciare in modo preciso la qualità delle risposte, i tempi di latenza e i costi computazionali. Si tratta di una scelta molto interessante che mira ad una maggiore personalizzazione dell’esperienza dell’utente.

Dal punto di vista economico, i costi sono strutturati in base al tipo di utilizzo: l’elaborazione degli input ha un prezzo di 0,15 dollari ogni milione di token, mentre gli output si distinguono tra risposte semplici e risposte con ragionamento avanzato. Nel primo caso, il costo è di 0,60 dollari per milione di token, mentre per risposte complesse si sale a 3,50 dollari. È comunque possibile disattivare il “pensiero” per utilizzare il modello in modo analogo a Gemini 2.0 Flash, mantenendo così performance rapide e convenienti. Chiaramente, disattivando questa funzione si avrà accesso ad un’esperienza meno completa e meno profonda ma sicuramente più lenta e costosa.

Un nuovo modello già integrato

Il nuovo modello è già integrato nell’ambiente di sviluppo Gemini e disponibile nell’app ufficiale attraverso il selettore di modelli. Inoltre, può essere usato anche con la funzione Canvas per perfezionare contenuti testuali o blocchi di codice. Nonostante si tratti di una versione ancora in fase di anteprima, Gemini 2.5 Flash si mostra già altamente competitivo, riuscendo a rivaleggiare con modelli di punta come quelli di Anthropic e Grok. Sebbene il recente o4-mini di OpenAI abbia ottenuto risultati leggermente migliori nei benchmark, il vantaggio di Gemini 2.5 Flash resta nel suo prezzo più accessibile.

Con questo aggiornamento, Google punta a offrire agli sviluppatori uno strumento potente, versatile e altamente personalizzabile per ogni tipo di applicazione basata sull’intelligenza artificiale. Inoltre, questo annuncio di Google arriva a poche ore di distanza dal precedente annuncio e dalla precedente presentazione di OpenAI dei nuovi modelli di ChatGPT. Si tratta di una sfida aperta sia con OpenAI e sia con le altre aziende che stanno investendo sui loro sistemi di intelligenza artificiale. Staremo a vedere quale sarà l’impatto sull’utenza di questa nuova versione di Gemini e in particolar modo come verrà accolta la capacità ibrida di questo modello.