Questa pagina documenta gli aggiornamenti dell'API Gemini.
5 giugno 2025
- Abbiamo rilasciato
gemini-2.5-pro-preview-06-05
, una nuova versione del nostro modello più potente, ora con il pensiero adattivo. Per scoprire di più, consulta Anteprima di Gemini 2.5 Pro e Pensare.gemini-2.5-pro-preview-05-06
punterà automaticamente alla nuova versione del modello.
20 maggio 2025
Aggiornamenti dell'API:
- È stato lanciato il supporto per la preelaborazione video personalizzata tramite intervalli di clip e campionamento della frequenza fotogrammi configurabile.
- È stato lanciato l'utilizzo di più strumenti, che supporta la configurazione dell'esecuzione di codice e del grounding con la Ricerca Google nella stessa richiesta
generateContent
. - È stato lanciato il supporto per le chiamate di funzioni asincrone nell'API Live.
- È stato lanciato un strumento per il contesto dell'URL sperimentale per fornire gli URL come contesto aggiuntivo ai prompt.
Aggiornamenti del modello:
- È stato rilasciato
gemini-2.5-flash-preview-05-20
, un modello di anteprima Gemini ottimizzato per il rapporto prezzo/prestazioni e il pensiero adattivo. Per scoprire di più, consulta Anteprima di Gemini 2.5 Flash e Thinking. - Sono stati rilasciati i modelli
gemini-2.5-pro-preview-tts
egemini-2.5-flash-preview-tts
in grado di generare voce con uno o due altoparlanti. - È stato rilasciato il modello
lyria-realtime-exp
, che genera musica in tempo reale. - Sono stati rilasciati
gemini-2.5-flash-preview-native-audio-dialog
egemini-2.5-flash-exp-native-audio-thinking-dialog
, nuovi modelli Gemini per l'API Live con funzionalità di output audio native. Per scoprire di più, consulta la guida all'API Live e Audio nativo Gemini 2.5 Flash. - Anteprima
gemma-3n-e4b-it
rilasciata, disponibile su AI Studio e tramite l'API Gemini, nell'ambito del lancio di Gemma 3n.
7 maggio 2025
- È stato rilasciato
gemini-2.0-flash-preview-image-generation
, un modello di anteprima per la generazione e la modifica delle immagini. Per scoprire di più, consulta Generazione di immagini e Generazione di immagini di anteprima di Gemini 2.0 Flash.
6 maggio 2025
- È stata rilasciata
gemini-2.5-pro-preview-05-06
, una nuova versione del nostro modello più potente, con miglioramenti al codice e alle chiamate di funzione.gemini-2.5-pro-preview-03-25
riferirà automaticamente alla nuova versione del modello.
17 aprile 2025
- È stato rilasciato
gemini-2.5-flash-preview-04-17
, un modello di anteprima Gemini ottimizzato per il rapporto prezzo/prestazioni e il pensiero adattivo. Per scoprire di più, consulta Anteprima di Gemini 2.5 Flash e Thinking.
16 aprile 2025
- È stata lanciata la memorizzazione nella cache del contesto per Gemini 2.0 Flash.
9 aprile 2025
Aggiornamenti del modello:
- È stato rilasciato
veo-2.0-generate-001
, un modello di conversione di testo e immagini in video disponibile a livello generale (GA), in grado di generare video dettagliati e artisticamente sfumati. Per scoprire di più, consulta la documentazione di Veo. È stata rilasciata
gemini-2.0-flash-live-001
, una versione di anteprima pubblica del modello dell'API Live con la fatturazione abilitata.Maggiore affidabilità e gestione delle sessioni
- Ripristino della sessione:mantieni attive le sessioni in caso di interruzioni temporanee della rete. L'API ora supporta lo stato di archiviazione della sessione lato server (per un massimo di 24 ore) e fornisce handle (session_resumption) per riconnettersi e riprendere da dove avevi interrotto.
- Sessioni più lunghe tramite compressione del contesto:consentono di estendere le interazioni oltre i limiti di tempo precedenti. Configura la compressione della finestra di contesto con un meccanismo a finestra scorrevole per gestire automaticamente la lunghezza del contesto, impedendo interruzioni improvvise a causa di limiti di contesto.
- Notifica di disconnessione graduale:ricevi un messaggio del server
GoAway
che indica quando una connessione sta per chiudersi, consentendo una gestione graduale prima dell'interruzione.
Maggiore controllo sulle dinamiche di interazione
Rilevamento dell'attività vocale (VAD) configurabile: scegli i livelli di sensibilità o disattiva completamente il VAD automatico e utilizza i nuovi eventi client (
activityStart
,activityEnd
) per il controllo manuale delle svolte.Gestione delle interruzioni configurabile:decidi se l'input dell'utente deve interrompere la risposta del modello.
Copertura dei turni configurabile:scegli se l'API deve elaborare continuamente tutti gli input audio e video o se deve acquisirli solo quando viene rilevato che l'utente finale sta parlando.
Risoluzione dei contenuti multimediali configurabile:ottimizza per la qualità o l'utilizzo dei token selezionato la risoluzione per i contenuti multimediali di input.
Output e funzionalità più completi
Opzioni di voci e lingue ampliate:scegli tra due nuove voci e 30 nuove lingue per l'output audio. La lingua di output è ora configurabile in
speechConfig
.Streaming di testo:ricevi le risposte di testo in modo incrementale man mano che vengono generate, consentendo una visualizzazione più rapida per l'utente.
Report sull'utilizzo dei token: ottieni informazioni sull'utilizzo con conteggi dettagliati dei token forniti nel campo
usageMetadata
dei messaggi del server, suddivisi per modalità e fasi di prompt o risposta.
4 aprile 2025
- È stata rilasciata
gemini-2.5-pro-preview-03-25
, una versione di Gemini 2.5 Pro in anteprima pubblica con la fatturazione abilitata. Puoi continuare a utilizzaregemini-2.5-pro-exp-03-25
nel livello senza costi.
25 marzo 2025
- È stato rilasciato
gemini-2.5-pro-exp-03-25
, un modello Gemini sperimentale pubblico con la modalità di pensiero sempre attiva per impostazione predefinita. Per saperne di più, consulta Gemini 2.5 Pro Experimental.
12 marzo 2025
Aggiornamenti del modello:
- Abbiamo lanciato un modello Gemini 2.0 Flash sperimentale in grado di generare e modificare immagini.
- Rilasciato il giorno
gemma-3-27b-it
, disponibile su AI Studio e tramite l'API Gemini, nell'ambito del lancio di Gemma 3.
Aggiornamenti dell'API:
- È stato aggiunto il supporto per gli URL di YouTube come origine multimediale.
- È stato aggiunto il supporto per l'inclusione di un video in linea di dimensioni inferiori a 20 MB.
11 marzo 2025
Aggiornamenti dell'SDK:
- È stato rilasciato in anteprima pubblica il Google Gen AI SDK per TypeScript e JavaScript.
7 marzo 2025
Aggiornamenti del modello:
- Rilasciato
gemini-embedding-exp-03-07
, un modello di incorporamenti basato su Gemini sperimentale in anteprima pubblica.
28 febbraio 2025
Aggiornamenti dell'API:
- Il supporto della ricerca come strumento è stato aggiunto a
gemini-2.0-pro-exp-02-05
, un modello sperimentale basato su Gemini 2.0 Pro.
25 febbraio 2025
Aggiornamenti del modello:
- È stata rilasciata
gemini-2.0-flash-lite
, una versione di disponibilità generale (GA) di Gemini 2.0 Flash-Lite, che è ottimizzata per velocità, scalabilità ed efficienza in termini di costi.
19 febbraio 2025
Aggiornamenti di AI Studio:
- Supporto per altre regioni (Kosovo, Groenlandia e Isole Fær Øer).
Aggiornamenti dell'API:
- Supporto per altre regioni (Kosovo, Groenlandia e Isole Fær Øer).
18 febbraio 2025
Aggiornamenti del modello:
- Gemini 1.0 Pro non è più supportato. Per l'elenco dei modelli supportati, consulta Modelli Gemini.
11 febbraio 2025
Aggiornamenti dell'API:
- Aggiornamenti sulla compatibilità delle librerie OpenAI.
6 febbraio 2025
Aggiornamenti del modello:
- È stata rilasciata
imagen-3.0-generate-002
, una versione di Imagen 3 nell'API Gemini disponibile a livello generale (GA).
Aggiornamenti dell'SDK:
- È stato rilasciato l'SDK Google Gen AI per Java per l'anteprima pubblica.
5 febbraio 2025
Aggiornamenti del modello:
- È stata rilasciata
gemini-2.0-flash-001
, una versione di disponibilità generale (GA) di Gemini 2.0 Flash che supporta l'output solo di testo. - È stata rilasciata
gemini-2.0-pro-exp-02-05
, una versione di anteprima pubblica sperimentale di Gemini 2.0 Pro. - È stato rilasciato
gemini-2.0-flash-lite-preview-02-05
, un modello di anteprima pubblica sperimentale ottimizzato per l'efficienza dei costi.
Aggiornamenti dell'API:
- È stato aggiunto il supporto per l'input del file e l'output del grafico all'esecuzione del codice.
Aggiornamenti dell'SDK:
- È stato rilasciato l'SDK Google Gen AI per Python in disponibilità generale (GA).
21 gennaio 2025
Aggiornamenti del modello:
- È stata rilasciata
gemini-2.0-flash-thinking-exp-01-21
, l'ultima versione di anteprima del modello alla base del modello di ragionamento Gemini 2.0 Flash.
19 dicembre 2024
Aggiornamenti del modello:
È stata rilasciata la modalità Gemini 2.0 Flash Thinking per l'anteprima pubblica. La modalità di pensiero è un modello di calcolo in fase di test che ti consente di vedere il processo di pensiero del modello mentre genera una risposta e produce risposte con capacità di ragionamento più efficaci.
Scopri di più sulla modalità di pensiero Gemini 2.0 Flash nella nostra pagina di panoramica.
11 dicembre 2024
Aggiornamenti del modello:
- È stato rilasciato Gemini 2.0 Flash Experimental per l'anteprima pubblica. L'elenco parziale delle funzionalità di Gemini 2.0 Flash Experimental include:
- Due volte più veloce di Gemini 1.5 Pro
- Streaming bidirezionale con la nostra API Live
- Generazione di risposte multimodali sotto forma di testo, immagini e parlato
- Utilizzo dello strumento integrato con ragionamento multi-turno per utilizzare funzionalità come l'esecuzione del codice, la ricerca, la chiamata di funzioni e altro ancora
Scopri di più su Gemini 2.0 Flash nella nostra pagina di panoramica.
21 novembre 2024
Aggiornamenti del modello:
- È stato rilasciato
gemini-exp-1121
, un modello dell'API Gemini sperimentale ancora più potente.
Aggiornamenti del modello:
- Sono stati aggiornati gli alias dei modelli
gemini-1.5-flash-latest
egemini-1.5-flash
per l'utilizzo digemini-1.5-flash-002
.- Modifica del parametro
top_k
: il modellogemini-1.5-flash-002
supporta valoritop_k
compresi tra 1 e 41 (esclusi). I valori superiori a 40 verranno modificati in 40.
- Modifica del parametro
14 novembre 2024
Aggiornamenti del modello:
- È stato rilasciato
gemini-exp-1114
, un potente modello sperimentale dell'API Gemini.
8 novembre 2024
Aggiornamenti dell'API:
- È stato aggiunto il supporto di Gemini nelle librerie OpenAI / API REST.
31 ottobre 2024
Aggiornamenti dell'API:
- È stato aggiunto il supporto per il grounding con la Ricerca Google.
3 ottobre 2024
Aggiornamenti del modello:
- È stata rilasciata
gemini-1.5-flash-8b-001
, una versione stabile del nostro modello dell'API Gemini più piccolo.
24 settembre 2024
Aggiornamenti del modello:
- Sono state rilasciate
gemini-1.5-pro-002
egemini-1.5-flash-002
, due nuove versioni stabili di Gemini 1.5 Pro e 1.5 Flash, disponibili a livello generale. - È stato aggiornato il codice del modello
gemini-1.5-pro-latest
in modo da utilizzaregemini-1.5-pro-002
e il codice del modellogemini-1.5-flash-latest
in modo da utilizzaregemini-1.5-flash-002
. - È stata rilasciata la versione
gemini-1.5-flash-8b-exp-0924
per sostituiregemini-1.5-flash-8b-exp-0827
. - È stato rilasciato il filtro di sicurezza per l'integrità civica per l'API Gemini e AI Studio.
- È stato rilasciato il supporto di due nuovi parametri per Gemini 1.5 Pro e 1.5 Flash in Python e NodeJS:
frequencyPenalty
epresencePenalty
.
19 settembre 2024
Aggiornamenti di AI Studio:
- Sono stati aggiunti i pulsanti Mi piace e Non mi piace per modellare le risposte, in modo che gli utenti possano fornire feedback sulla qualità di una risposta.
Aggiornamenti dell'API:
- È stato aggiunto il supporto per i crediti Google Cloud, che ora possono essere utilizzati per l'utilizzo dell'API Gemini.
17 settembre 2024
Aggiornamenti di AI Studio:
- È stato aggiunto un pulsante Apri in Colab che esporta un prompt e il codice per eseguirlo in un blocco note di Colab. La funzionalità non supporta ancora i prompt con gli strumenti (modalità JSON, chiamata di funzioni o esecuzione di codice).
13 settembre 2024
Aggiornamenti di AI Studio:
- È stato aggiunto il supporto per la modalità di confronto, che consente di confrontare le risposte tra modelli e prompt per trovare la soluzione più adatta al tuo caso d'uso.
30 agosto 2024
Aggiornamenti del modello:
- Gemini 1.5 Flash supporta la fornitura dello schema JSON tramite la configurazione del modello.
27 agosto 2024
Aggiornamenti del modello:
- Sono stati rilasciati i seguenti
modelli sperimentali:
gemini-1.5-pro-exp-0827
gemini-1.5-flash-exp-0827
gemini-1.5-flash-8b-exp-0827
9 agosto 2024
Aggiornamenti dell'API:
- È stato aggiunto il supporto per l'elaborazione dei PDF.
5 agosto 2024
Aggiornamenti del modello:
- È stato rilasciato il supporto per il perfezionamento di Gemini 1.5 Flash.
1° agosto 2024
Aggiornamenti del modello:
- È stata rilasciata
gemini-1.5-pro-exp-0801
, una nuova versione sperimentale di Gemini 1.5 Pro.
12 luglio 2024
Aggiornamenti del modello:
- Il supporto di Gemini 1.0 Pro Vision è stato rimosso dai servizi e dagli strumenti di Google AI.
27 giugno 2024
Aggiornamenti del modello:
- Rilascio della disponibilità generale per la finestra contestuale di 2 milioni di token di Gemini 1.5 Pro.
Aggiornamenti dell'API:
- È stato aggiunto il supporto per l'esecuzione di codice.
18 giugno 2024
Aggiornamenti dell'API:
- È stato aggiunto il supporto della cache del contesto.
12 giugno 2024
Aggiornamenti del modello:
- Gemini 1.0 Pro Vision è stato ritirato.
23 maggio 2024
Aggiornamenti del modello:
- Gemini 1.5 Pro
(
gemini-1.5-pro-001
) è disponibile in versione generale (GA). - Gemini 1.5 Flash
(
gemini-1.5-flash-001
) è disponibile pubblicamente (GA).
14 maggio 2024
Aggiornamenti dell'API:
- È stata introdotta una finestra contestuale di 2 milioni di token per Gemini 1.5 Pro (lista d'attesa).
- È stata introdotta la fatturazione a consumo per Gemini 1.0 Pro. La fatturazione di Gemini 1.5 Pro e Gemini 1.5 Flash sarà disponibile a breve.
- Sono stati introdotti limiti di frequenza più elevati per il prossimo livello a pagamento di Gemini 1.5 Pro.
- È stato aggiunto il supporto video integrato all'API File.
- È stato aggiunto il supporto del testo normale all'API File.
- È stato aggiunto il supporto per le chiamate di funzioni parallele, che restituiscono più di una chiamata alla volta.
10 maggio 2024
Aggiornamenti del modello:
- È stato rilasciato Gemini 1.5 Flash
(
gemini-1.5-flash-latest
) in anteprima.
9 aprile 2024
Aggiornamenti del modello:
- È stato rilasciato Gemini 1.5 Pro
(
gemini-1.5-pro-latest
) in anteprima. - È stato rilasciato un nuovo modello di embedding del testo,
text-embeddings-004
, che supporta dimensioni di embedding elastico inferiori a 768.
Aggiornamenti dell'API:
- È stata rilasciata l'API File per l'archiviazione temporanea dei file multimediali da utilizzare nei prompt.
- È stato aggiunto il supporto dei prompt con dati di testo, immagini e audio, noti anche come prompt multimodali. Per scoprire di più, consulta Prompt con contenuti multimediali.
- Sono state rilasciate le istruzioni di sistema in versione beta.
- È stata aggiunta la modalità di chiamata delle funzioni, che definisce il comportamento di esecuzione per la chiamata delle funzioni.
- È stato aggiunto il supporto per l'opzione di configurazione
response_mime_type
, che consente di richiedere risposte in formato JSON.
19 marzo 2024
Aggiornamenti del modello:
- È stato aggiunto il supporto per l'ottimizzazione di Gemini 1.0 Pro in Google AI Studio o con l'API Gemini.
13 dicembre 2023
Aggiornamenti del modello:
- gemini-pro: nuovo modello di testo per un'ampia gamma di attività. Equilibra funzionalità ed efficienza.
- gemini-pro-vision: nuovo modello multimodale per un'ampia gamma di attività. Equilibra capacità ed efficienza.
- embedding-001: nuovo modello di embedding.
- aqa: un nuovo modello appositamente ottimizzato che è addestrato a rispondere alle domande utilizzando passaggi di testo per fondare le risposte generate.
Per ulteriori dettagli, consulta la sezione Modelli Gemini.
Aggiornamenti delle versioni dell'API:
- v1: il canale API stabile.
- v1beta: canale beta. Questo canale include funzionalità che potrebbero essere in fase di sviluppo.
Per ulteriori dettagli, consulta l'argomento sulle versioni dell'API.
Aggiornamenti dell'API:
GenerateContent
è un unico endpoint unificato per chat e messaggi.- Streaming disponibile tramite il metodo
StreamGenerateContent
. - Funzionalità multimodale: l'immagine è una nuova modalità supportata
- Nuove funzionalità beta:
- Chiamata di funzione
- Semantic Retriever
- Ricerca di risposte alle domande con attribuzione (AQA)
- Conteggio dei candidati aggiornato: i modelli Gemini restituiscono un solo candidato.
- Diverse categorie di Impostazioni di sicurezza e SafetyRating. Per ulteriori dettagli, consulta le impostazioni di sicurezza.
- L'ottimizzazione dei modelli non è ancora supportata per i modelli Gemini (in fase di elaborazione).