Auf dieser Seite werden Updates für die Gemini API dokumentiert.
5. Juni 2025
gemini-2.5-pro-preview-06-05
, eine neue Version unseres leistungsstärksten Modells, jetzt mit adaptivem Denken Weitere Informationen finden Sie unter Gemini 2.5 Pro-Vorabversion und Thinking.gemini-2.5-pro-preview-05-06
verweist dann automatisch auf die neue Version des Modells.
20. Mai 2025
API-Änderungen:
- Unterstützung für die benutzerdefinierte Videovorverarbeitung mit Schneidenintervallen und konfigurierbarer Framerate-Stichprobenerhebung.
- Einführung der Verwendung mehrerer Tools, mit denen die Codeausführung und die Fundierung mit der Google Suche für dieselbe
generateContent
-Anfrage konfiguriert werden können. - Unterstützung für asynchrone Funktionsaufrufe in der Live API
- Wir haben ein experimentelles URL-Kontexttool eingeführt, mit dem URLs als zusätzlicher Kontext für Prompts angegeben werden können.
Modellaktualisierungen:
gemini-2.5-flash-preview-05-20
: Vorabversion eines Gemini-Modells, das für Preis-Leistungs-Verhältnis und adaptives Denken optimiert ist. Weitere Informationen finden Sie unter Gemini 2.5 Flash Preview und Thinking.- Die Modelle
gemini-2.5-pro-preview-tts
undgemini-2.5-flash-preview-tts
wurden veröffentlicht, die Sprache mit einem oder zwei Sprechern generieren können. lyria-realtime-exp
-Modell veröffentlicht, mit dem Musik in Echtzeit generiert wird- Am
gemini-2.5-flash-preview-native-audio-dialog
undgemini-2.5-flash-exp-native-audio-thinking-dialog
wurden neue Gemini-Modelle für die Live API mit nativer Audioausgabe veröffentlicht. Weitere Informationen finden Sie im Live API-Leitfaden und unter Gemini 2.5 Flash Native Audio. gemma-3n-e4b-it
-Vorabversion veröffentlicht, verfügbar in AI Studio und über die Gemini API, im Rahmen der Einführung von Gemma 3n.
7. Mai 2025
gemini-2.0-flash-preview-image-generation
als Vorschaumodell für die Generierung und Bearbeitung von Bildern veröffentlicht. Weitere Informationen finden Sie unter Bildgenerierung und Bildgenerierung für Gemini 2.0-Flash-Vorschau.
6. Mai 2025
gemini-2.5-pro-preview-05-06
, eine neue Version unseres leistungsstärksten Modells mit Verbesserungen beim Code- und Funktionsaufruf, wurde veröffentlicht.gemini-2.5-pro-preview-03-25
verweist dann automatisch auf die neue Version des Modells.
17. April 2025
gemini-2.5-flash-preview-04-17
: Vorabversion eines Gemini-Modells, das für Preis-Leistungs-Verhältnis und adaptives Denken optimiert ist. Weitere Informationen finden Sie unter Gemini 2.5 Flash Preview und Thinking.
16. April 2025
- Einführung des Kontext-Cachings für Gemini 2.0 Flash
9. April 2025
Modellaktualisierungen:
veo-2.0-generate-001
wurde veröffentlicht, ein allgemein verfügbares (GA) Modell für die Umwandlung von Text und Bildern in Videos, mit dem detaillierte und künstlerisch nuancierte Videos erstellt werden können. Weitere Informationen finden Sie in den Veo-Dokumenten.Am
gemini-2.0-flash-live-001
wurde eine öffentliche Vorabversion des Live API-Modells mit aktivierter Abrechnung veröffentlicht.Verbesserte Sitzungsverwaltung und Zuverlässigkeit
- Sitzungswiederaufnahme:Sitzungen bei vorübergehenden Netzwerkunterbrechungen aufrechterhalten. Die API unterstützt jetzt den serverseitigen Speichern des Sitzungsstatus (bis zu 24 Stunden) und bietet Handles (session_resumption), um eine Verbindung wiederherzustellen und dort fortzufahren, wo Sie aufgehört haben.
- Längere Sitzungen durch Kontextkomprimierung:Ermöglicht erweiterte Interaktionen über die bisherigen Zeitlimits hinaus. Konfigurieren Sie die Komprimierung des Kontextfensters mit einem Schiebefenstermechanismus, um die Kontextlänge automatisch zu verwalten und abrupte Beendigungen aufgrund von Kontextlimits zu verhindern.
- Benachrichtigung über die ordnungsgemäße Verbindungsunterbrechung:Sie erhalten eine
GoAway
-Servernachricht, die angibt, wann eine Verbindung geschlossen wird. So kann die Verbindung vor der Beendigung ordnungsgemäß verarbeitet werden.
Mehr Kontrolle über die Interaktionsdynamik
Konfigurationsfähige Sprachaktivitätserkennung (VAD): Sie können Empfindlichkeitsstufen auswählen oder die automatische VAD vollständig deaktivieren und neue Client-Ereignisse (
activityStart
,activityEnd
) für die manuelle Abbiegeverwaltung verwenden.Konfiguration der Unterbrechungsbehandlung:Legen Sie fest, ob Nutzereingaben die Antwort des Modells unterbrechen sollen.
Konfiguration der Abdeckung von Abbiegeversuchen:Wählen Sie aus, ob die API alle Audio- und Videoeingaben kontinuierlich verarbeitet oder nur erfasst, wenn der Endnutzer spricht.
Konfigurierbare Medienauflösung:Sie können die Auflösung der Eingabemedien auswählen, um die Qualität oder Tokennutzung zu optimieren.
Umfangreichere Ausgabe und Funktionen
Erweiterte Optionen für Stimme und Sprache:Sie können zwischen zwei neuen Stimmen und 30 neuen Sprachen für die Audioausgabe wählen. Die Ausgabesprache kann jetzt in
speechConfig
konfiguriert werden.Textstreaming:Textantworten werden nach und nach empfangen, sobald sie generiert werden, sodass sie dem Nutzer schneller angezeigt werden können.
Berichte zur Tokennutzung:Sie erhalten Statistiken zur Nutzung mit detaillierten Tokenzahlen im Feld
usageMetadata
von Servernachrichten, aufgeschlüsselt nach Modalität und Prompt- oder Antwortphase.
4. April 2025
- Am
gemini-2.5-pro-preview-03-25
wurde eine öffentliche Vorschauversion von Gemini 2.5 Pro mit aktivierter Abrechnung veröffentlicht. Sie könnengemini-2.5-pro-exp-03-25
weiterhin im kostenlosen Tarif nutzen.
25. März 2025
gemini-2.5-pro-exp-03-25
: Veröffentlichung eines öffentlichen experimentellen Gemini-Modells, bei dem der Denkmodus standardmäßig immer aktiviert ist. Weitere Informationen finden Sie unter Gemini 2.5 Pro Experimental.
12. März 2025
Modellaktualisierungen:
- Einführung eines experimentellen Gemini 2.0 Flash-Modells zur Bildgenerierung und ‑bearbeitung.
- Veröffentlicht am
gemma-3-27b-it
, verfügbar in AI Studio und über die Gemini API, im Rahmen der Einführung von Gemma 3.
API-Änderungen:
- Unterstützung für YouTube-URLs als Medienquelle hinzugefügt.
- Es ist jetzt möglich, ein Inline-Video mit einer Größe von weniger als 20 MB einzufügen.
11. März 2025
SDK-Updates:
- Das Google Gen AI SDK für TypeScript und JavaScript wurde als öffentliche Vorabversion veröffentlicht.
7. März 2025
Modellaktualisierungen:
gemini-embedding-exp-03-07
, ein experimentelles Gemini-basiertes Einbettungsmodell in der öffentlichen Vorschau, wurde veröffentlicht.
28. Februar 2025
API-Änderungen:
- Unterstützung für die Suche als Tool für
gemini-2.0-pro-exp-02-05
hinzugefügt, ein experimentelles Modell, das auf Gemini 2.0 Pro basiert.
25. Februar 2025
Modellaktualisierungen:
- Am
gemini-2.0-flash-lite
wurde eine allgemein verfügbare Version von Gemini 2.0 Flash-Lite veröffentlicht, die für Geschwindigkeit, Skalierbarkeit und Kosteneffizienz optimiert ist.
19. Februar 2025
AI Studio-Updates:
- Unterstützung für weitere Regionen (Kosovo, Grönland und Färöer).
API-Änderungen:
- Unterstützung für weitere Regionen (Kosovo, Grönland und Färöer).
18. Februar 2025
Modellaktualisierungen:
- Gemini 1.0 Pro wird nicht mehr unterstützt. Eine Liste der unterstützten Modelle finden Sie unter Gemini-Modelle.
11. Februar 2025
API-Änderungen:
- Aktuelle Informationen zur Kompatibilität von OpenAI-Bibliotheken
6. Februar 2025
Modellaktualisierungen:
imagen-3.0-generate-002
wurde veröffentlicht, eine allgemein verfügbare (GA) Version von Bild 3 in der Gemini API.
SDK-Updates:
- Google Gen AI SDK für Java als öffentliche Vorabversion veröffentlicht
5. Februar 2025
Modellaktualisierungen:
- Am
gemini-2.0-flash-001
wurde eine allgemein verfügbare Version (GA) von Gemini 2.0 Flash veröffentlicht, die nur Textausgaben unterstützt. - Am
gemini-2.0-pro-exp-02-05
wurde eine experimentelle öffentliche Vorabversion von Gemini 2.0 Pro veröffentlicht. gemini-2.0-flash-lite-preview-02-05
wurde veröffentlicht, ein experimentelles öffentliches Modell in der Vorabversion, das für eine kosteneffiziente Nutzung optimiert ist.
API-Änderungen:
- Die Codeausführung unterstützt jetzt Dateieingaben und Diagrammausgaben.
SDK-Updates:
- Das Google Gen AI SDK for Python ist jetzt allgemein verfügbar.
21. Januar 2025
Modellaktualisierungen:
- Am
gemini-2.0-flash-thinking-exp-01-21
wurde die neueste Vorabversion des Modells veröffentlicht, das dem Gemini 2.0 Flash Thinking-Modell zugrunde liegt.
19. Dezember 2024
Modellaktualisierungen:
Der Gemini 2.0 Flash Thinking-Modus wurde in der öffentlichen Vorschau veröffentlicht. Der Thinking-Modus ist ein Berechnungsmodell für den Testzeitraum, mit dem Sie den Denkprozess des Modells sehen können, während es eine Antwort generiert. Außerdem werden Antworten mit stärkeren Schlussfolgerungsfunktionen generiert.
Weitere Informationen zum Gemini 2.0 Flash Thinking-Modus finden Sie auf unserer Übersichtsseite.
11. Dezember 2024
Modellaktualisierungen:
- Gemini 2.0 Flash Experimental wurde als öffentliche Vorschau veröffentlicht. Zu den Funktionen von Gemini 2.0 Flash Experimental gehören:
- Doppelt so schnell wie Gemini 1.5 Pro
- Bidirektionales Streaming mit der Live API
- Generierung multimodaler Antworten in Form von Text, Bildern und Sprache
- Verwendung des integrierten Tools mit mehrstufiger Argumentation, um Funktionen wie Codeausführung, Suche und Funktionsaufruf zu nutzen
Weitere Informationen zu Gemini 2.0 Flash finden Sie auf unserer Übersichtsseite.
21. November 2024
Modellaktualisierungen:
gemini-exp-1121
wurde ein noch leistungsstärkeres experimentelles Gemini API-Modell veröffentlicht.
Modellaktualisierungen:
- Die Aliasse der Modelle
gemini-1.5-flash-latest
undgemini-1.5-flash
wurden aufgemini-1.5-flash-002
aktualisiert.- Parameter
top_k
ändern: Das Modellgemini-1.5-flash-002
unterstützttop_k
-Werte zwischen 1 und 41 (exklusiv). Werte über 40 werden auf 40 geändert.
- Parameter
14. November 2024
Modellaktualisierungen:
gemini-exp-1114
, ein leistungsstarkes experimentelles Gemini API-Modell, wurde veröffentlicht.
8. November 2024
API-Änderungen:
- Unterstützung für Gemini in den OpenAI-Bibliotheken und der REST API hinzugefügt.
31. Oktober 2024
API-Änderungen:
3. Oktober 2024
Modellaktualisierungen:
gemini-1.5-flash-8b-001
wurde eine stabile Version unseres kleinsten Gemini API-Modells veröffentlicht.
24. September 2024
Modellaktualisierungen:
gemini-1.5-pro-002
undgemini-1.5-flash-002
sind zwei neue stabile Versionen von Gemini 1.5 Pro und 1.5 Flash, die allgemein verfügbar sind.- Der Code des
gemini-1.5-pro-latest
-Modells wurde aufgemini-1.5-pro-002
und der Code desgemini-1.5-flash-latest
-Modells aufgemini-1.5-flash-002
aktualisiert. gemini-1.5-flash-8b-exp-0924
wurde veröffentlicht, umgemini-1.5-flash-8b-exp-0827
zu ersetzen.- Der Filter für die Integrität öffentlicher Aussagen wurde für die Gemini API und AI Studio veröffentlicht.
- Unterstützung für zwei neue Parameter für Gemini 1.5 Pro und 1.5 Flash in Python und NodeJS:
frequencyPenalty
undpresencePenalty
19. September 2024
AI Studio-Updates:
- Es wurden Schaltflächen für „Mag ich“ und „Mag ich nicht“ zu Modellantworten hinzugefügt, damit Nutzer Feedback zur Qualität einer Antwort geben können.
API-Änderungen:
- Unterstützung für Google Cloud-Guthaben hinzugefügt, das jetzt für die Nutzung der Gemini API verwendet werden kann.
17. September 2024
AI Studio-Updates:
- Die Schaltfläche In Colab öffnen wurde hinzugefügt. Damit können Sie einen Prompt und den Code zum Ausführen in ein Colab-Notebook exportieren. Die Funktion unterstützt noch keine Prompts mit Tools (JSON-Modus, Funktionsaufrufe oder Codeausführung).
13. September 2024
AI Studio-Updates:
- Unterstützung für den Vergleichsmodus hinzugefügt, mit dem Sie Antworten verschiedener Modelle und Prompts vergleichen können, um die beste Lösung für Ihren Anwendungsfall zu finden.
30. August 2024
Modellaktualisierungen:
- Gemini 1.5 Flash unterstützt das Angeben eines JSON-Schemas über die Modellkonfiguration.
27. August 2024
Modellaktualisierungen:
- Die folgenden experimentellen Modelle wurden veröffentlicht:
gemini-1.5-pro-exp-0827
gemini-1.5-flash-exp-0827
gemini-1.5-flash-8b-exp-0827
9. August 2024
API-Änderungen:
- Unterstützung für die PDF-Verarbeitung hinzugefügt.
5. August 2024
Modellaktualisierungen:
- Unterstützung für die Feinabstimmung für Gemini 1.5 Flash
1. August 2024
Modellaktualisierungen:
- Am
gemini-1.5-pro-exp-0801
wurde eine neue experimentelle Version von Gemini 1.5 Pro veröffentlicht.
12. Juli 2024
Modellaktualisierungen:
- Die Unterstützung für Gemini 1.0 Pro Vision wurde aus den Google AI-Diensten und ‑Tools entfernt.
27. Juni 2024
Modellaktualisierungen:
- Allgemeine Verfügbarkeit des Kontextfensters von 2 Millionen Tokens für Gemini 1.5 Pro
API-Änderungen:
- Unterstützung für die Codeausführung hinzugefügt.
18. Juni 2024
API-Änderungen:
- Unterstützung für Kontext-Caching hinzugefügt.
12. Juni 2024
Modellaktualisierungen:
- Gemini 1.0 Pro Vision wurde eingestellt.
23. Mai 2024
Modellaktualisierungen:
- Gemini 1.5 Pro (
gemini-1.5-pro-001
) ist allgemein verfügbar. - Gemini 1.5 Flash (
gemini-1.5-flash-001
) ist allgemein verfügbar.
14. Mai 2024
API-Änderungen:
- Einführung eines Kontextfensters von 2 Millionen Tokens für Gemini 1.5 Pro (Warteliste).
- Einführung der Pay-as-you-go-Abrechnung für Gemini 1.0 Pro. Die Abrechnung für Gemini 1.5 Pro und Gemini 1.5 Flash wird bald verfügbar sein.
- Einführung erhöhter Preislimits für die kommende kostenpflichtige Stufe von Gemini 1.5 Pro.
- Die File API unterstützt jetzt integrierte Videos.
- Die File API unterstützt jetzt auch Nur-Text.
- Unterstützung für parallele Funktionsaufrufe hinzugefügt, bei denen mehr als ein Aufruf gleichzeitig zurückgegeben wird.
10. Mai 2024
Modellaktualisierungen:
- Gemini 1.5 Flash (
gemini-1.5-flash-latest
) als Vorabversion veröffentlicht.
9. April 2024
Modellaktualisierungen:
- Gemini 1.5 Pro (
gemini-1.5-pro-latest
) als Vorabversion veröffentlicht. - Neues Texteinbettungsmodell
text-embeddings-004
veröffentlicht, das elastische Einbettungen mit einer Größe unter 768 unterstützt.
API-Änderungen:
- Die File API zum vorübergehenden Speichern von Mediendateien für Prompts wurde veröffentlicht.
- Unterstützung für Prompts mit Text-, Bild- und Audiodaten hinzugefügt, auch als multimodal bezeichnet Weitere Informationen finden Sie unter Prompts mit Medien.
- Systemanweisungen in Betaversion veröffentlicht.
- Der Modus für Funktionsaufrufe wurde hinzugefügt, der das Ausführungsverhalten für Funktionsaufrufe definiert.
- Unterstützung für die Konfigurationsoption
response_mime_type
hinzugefügt, mit der Antworten im JSON-Format angefordert werden können.
19. März 2024
Modellaktualisierungen:
- Es wurde Unterstützung für das Anpassen von Gemini 1.0 Pro in Google AI Studio oder mit der Gemini API hinzugefügt.
13. Dezember 2023
Modellaktualisierungen:
- gemini-pro: Neues Textmodell für eine Vielzahl von Aufgaben. Sie bietet eine gute Balance zwischen Leistung und Effizienz.
- gemini-pro-vision: Neues multimodales Modell für eine Vielzahl von Aufgaben. Sie bietet eine gute Balance zwischen Funktionalität und Effizienz.
- embedding-001: Neues Einbettungsmodell.
- aqa: Ein neues speziell abgestimmtes Modell, das trainiert wurde, Fragen anhand von Textpassagen zu beantworten, um generierte Antworten zu fundieren.
Weitere Informationen finden Sie unter Gemini-Modelle.
Änderungen an der API-Version:
- v1: Der stabile API-Kanal.
- v1beta: Betaversion. Dieser Kanal bietet Funktionen, die sich möglicherweise noch in der Entwicklungsphase befinden.
Weitere Informationen finden Sie im Thema API-Versionen.
API-Änderungen:
GenerateContent
ist ein einheitlicher Endpunkt für Chat und SMS.- Streaming ist über die Methode
StreamGenerateContent
verfügbar. - Multimodale Funktion: Bilder sind eine neue unterstützte Modalität
- Neue Betafunktionen:
- Funktionsaufrufe
- Semantic Retriever
- Attribierte Fragebeantwortung (AQA)
- Aktualisierte Kandidatenanzahl: Gemini-Modelle geben nur einen Kandidaten zurück.
- Unterschiedliche Kategorien für Sicherheitseinstellungen und Altersfreigaben. Weitere Informationen finden Sie unter Sicherheitseinstellungen.
- Die Modellabstimmung wird für Gemini-Modelle noch nicht unterstützt (wird derzeit entwickelt).