Diese Seite wurde von der Cloud Translation API übersetzt.

Versionshinweise

Auf dieser Seite werden Updates für die Gemini API dokumentiert.

5. Juni 2025

gemini-2.5-pro-preview-06-05, eine neue Version unseres leistungsstärksten Modells, jetzt mit adaptivem Denken Weitere Informationen finden Sie unter Gemini 2.5 Pro-Vorabversion und Thinking. gemini-2.5-pro-preview-05-06 verweist dann automatisch auf die neue Version des Modells.

20. Mai 2025

API-Änderungen:

Unterstützung für die benutzerdefinierte Videovorverarbeitung mit Schneidenintervallen und konfigurierbarer Framerate-Stichprobenerhebung.
Einführung der Verwendung mehrerer Tools, mit denen die Codeausführung und die Fundierung mit der Google Suche für dieselbe generateContent-Anfrage konfiguriert werden können.
Unterstützung für asynchrone Funktionsaufrufe in der Live API
Wir haben ein experimentelles URL-Kontexttool eingeführt, mit dem URLs als zusätzlicher Kontext für Prompts angegeben werden können.

Modellaktualisierungen:

gemini-2.5-flash-preview-05-20: Vorabversion eines Gemini-Modells, das für Preis-Leistungs-Verhältnis und adaptives Denken optimiert ist. Weitere Informationen finden Sie unter Gemini 2.5 Flash Preview und Thinking.
Die Modelle gemini-2.5-pro-preview-tts und gemini-2.5-flash-preview-tts wurden veröffentlicht, die Sprache mit einem oder zwei Sprechern generieren können.
lyria-realtime-exp-Modell veröffentlicht, mit dem Musik in Echtzeit generiert wird
Am gemini-2.5-flash-preview-native-audio-dialog und gemini-2.5-flash-exp-native-audio-thinking-dialog wurden neue Gemini-Modelle für die Live API mit nativer Audioausgabe veröffentlicht. Weitere Informationen finden Sie im Live API-Leitfaden und unter Gemini 2.5 Flash Native Audio.
gemma-3n-e4b-it-Vorabversion veröffentlicht, verfügbar in AI Studio und über die Gemini API, im Rahmen der Einführung von Gemma 3n.

7. Mai 2025

gemini-2.0-flash-preview-image-generation als Vorschaumodell für die Generierung und Bearbeitung von Bildern veröffentlicht. Weitere Informationen finden Sie unter Bildgenerierung und Bildgenerierung für Gemini 2.0-Flash-Vorschau.

6. Mai 2025

gemini-2.5-pro-preview-05-06, eine neue Version unseres leistungsstärksten Modells mit Verbesserungen beim Code- und Funktionsaufruf, wurde veröffentlicht. gemini-2.5-pro-preview-03-25 verweist dann automatisch auf die neue Version des Modells.

17. April 2025

gemini-2.5-flash-preview-04-17: Vorabversion eines Gemini-Modells, das für Preis-Leistungs-Verhältnis und adaptives Denken optimiert ist. Weitere Informationen finden Sie unter Gemini 2.5 Flash Preview und Thinking.

16. April 2025

Einführung des Kontext-Cachings für Gemini 2.0 Flash

9. April 2025

Modellaktualisierungen:

veo-2.0-generate-001 wurde veröffentlicht, ein allgemein verfügbares (GA) Modell für die Umwandlung von Text und Bildern in Videos, mit dem detaillierte und künstlerisch nuancierte Videos erstellt werden können. Weitere Informationen finden Sie in den Veo-Dokumenten.
Am gemini-2.0-flash-live-001 wurde eine öffentliche Vorabversion des Live API-Modells mit aktivierter Abrechnung veröffentlicht.
- Verbesserte Sitzungsverwaltung und Zuverlässigkeit
  - Sitzungswiederaufnahme:Sitzungen bei vorübergehenden Netzwerkunterbrechungen aufrechterhalten. Die API unterstützt jetzt den serverseitigen Speichern des Sitzungsstatus (bis zu 24 Stunden) und bietet Handles (session_resumption), um eine Verbindung wiederherzustellen und dort fortzufahren, wo Sie aufgehört haben.
  - Längere Sitzungen durch Kontextkomprimierung:Ermöglicht erweiterte Interaktionen über die bisherigen Zeitlimits hinaus. Konfigurieren Sie die Komprimierung des Kontextfensters mit einem Schiebefenstermechanismus, um die Kontextlänge automatisch zu verwalten und abrupte Beendigungen aufgrund von Kontextlimits zu verhindern.
  - Benachrichtigung über die ordnungsgemäße Verbindungsunterbrechung:Sie erhalten eine GoAway-Servernachricht, die angibt, wann eine Verbindung geschlossen wird. So kann die Verbindung vor der Beendigung ordnungsgemäß verarbeitet werden.
- Mehr Kontrolle über die Interaktionsdynamik
- Konfigurationsfähige Sprachaktivitätserkennung (VAD): Sie können Empfindlichkeitsstufen auswählen oder die automatische VAD vollständig deaktivieren und neue Client-Ereignisse (activityStart, activityEnd) für die manuelle Abbiegeverwaltung verwenden.
- Konfiguration der Unterbrechungsbehandlung:Legen Sie fest, ob Nutzereingaben die Antwort des Modells unterbrechen sollen.
- Konfiguration der Abdeckung von Abbiegeversuchen:Wählen Sie aus, ob die API alle Audio- und Videoeingaben kontinuierlich verarbeitet oder nur erfasst, wenn der Endnutzer spricht.
- Konfigurierbare Medienauflösung:Sie können die Auflösung der Eingabemedien auswählen, um die Qualität oder Tokennutzung zu optimieren.
- Umfangreichere Ausgabe und Funktionen
- Erweiterte Optionen für Stimme und Sprache:Sie können zwischen zwei neuen Stimmen und 30 neuen Sprachen für die Audioausgabe wählen. Die Ausgabesprache kann jetzt in speechConfig konfiguriert werden.
- Textstreaming:Textantworten werden nach und nach empfangen, sobald sie generiert werden, sodass sie dem Nutzer schneller angezeigt werden können.
- Berichte zur Tokennutzung:Sie erhalten Statistiken zur Nutzung mit detaillierten Tokenzahlen im Feld usageMetadata von Servernachrichten, aufgeschlüsselt nach Modalität und Prompt- oder Antwortphase.

4. April 2025

Am gemini-2.5-pro-preview-03-25 wurde eine öffentliche Vorschauversion von Gemini 2.5 Pro mit aktivierter Abrechnung veröffentlicht. Sie können gemini-2.5-pro-exp-03-25 weiterhin im kostenlosen Tarif nutzen.

25. März 2025

gemini-2.5-pro-exp-03-25: Veröffentlichung eines öffentlichen experimentellen Gemini-Modells, bei dem der Denkmodus standardmäßig immer aktiviert ist. Weitere Informationen finden Sie unter Gemini 2.5 Pro Experimental.

12. März 2025

Modellaktualisierungen:

Einführung eines experimentellen Gemini 2.0 Flash-Modells zur Bildgenerierung und ‑bearbeitung.
Veröffentlicht am gemma-3-27b-it, verfügbar in AI Studio und über die Gemini API, im Rahmen der Einführung von Gemma 3.

API-Änderungen:

Unterstützung für YouTube-URLs als Medienquelle hinzugefügt.
Es ist jetzt möglich, ein Inline-Video mit einer Größe von weniger als 20 MB einzufügen.

11. März 2025

SDK-Updates:

Das Google Gen AI SDK für TypeScript und JavaScript wurde als öffentliche Vorabversion veröffentlicht.

7. März 2025

Modellaktualisierungen:

gemini-embedding-exp-03-07, ein experimentelles Gemini-basiertes Einbettungsmodell in der öffentlichen Vorschau, wurde veröffentlicht.

28. Februar 2025

API-Änderungen:

Unterstützung für die Suche als Tool für gemini-2.0-pro-exp-02-05 hinzugefügt, ein experimentelles Modell, das auf Gemini 2.0 Pro basiert.

25. Februar 2025

Modellaktualisierungen:

Am gemini-2.0-flash-lite wurde eine allgemein verfügbare Version von Gemini 2.0 Flash-Lite veröffentlicht, die für Geschwindigkeit, Skalierbarkeit und Kosteneffizienz optimiert ist.

19. Februar 2025

AI Studio-Updates:

Unterstützung für weitere Regionen (Kosovo, Grönland und Färöer).

API-Änderungen:

Unterstützung für weitere Regionen (Kosovo, Grönland und Färöer).

18. Februar 2025

Modellaktualisierungen:

Gemini 1.0 Pro wird nicht mehr unterstützt. Eine Liste der unterstützten Modelle finden Sie unter Gemini-Modelle.

11. Februar 2025

API-Änderungen:

Aktuelle Informationen zur Kompatibilität von OpenAI-Bibliotheken

6. Februar 2025

Modellaktualisierungen:

imagen-3.0-generate-002 wurde veröffentlicht, eine allgemein verfügbare (GA) Version von Bild 3 in der Gemini API.

SDK-Updates:

Google Gen AI SDK für Java als öffentliche Vorabversion veröffentlicht

5. Februar 2025

Modellaktualisierungen:

Am gemini-2.0-flash-001 wurde eine allgemein verfügbare Version (GA) von Gemini 2.0 Flash veröffentlicht, die nur Textausgaben unterstützt.
Am gemini-2.0-pro-exp-02-05 wurde eine experimentelle öffentliche Vorabversion von Gemini 2.0 Pro veröffentlicht.
gemini-2.0-flash-lite-preview-02-05 wurde veröffentlicht, ein experimentelles öffentliches Modell in der Vorabversion, das für eine kosteneffiziente Nutzung optimiert ist.

API-Änderungen:

Die Codeausführung unterstützt jetzt Dateieingaben und Diagrammausgaben.

SDK-Updates:

Das Google Gen AI SDK for Python ist jetzt allgemein verfügbar.

21. Januar 2025

Modellaktualisierungen:

Am gemini-2.0-flash-thinking-exp-01-21 wurde die neueste Vorabversion des Modells veröffentlicht, das dem Gemini 2.0 Flash Thinking-Modell zugrunde liegt.

19. Dezember 2024

Modellaktualisierungen:

Der Gemini 2.0 Flash Thinking-Modus wurde in der öffentlichen Vorschau veröffentlicht. Der Thinking-Modus ist ein Berechnungsmodell für den Testzeitraum, mit dem Sie den Denkprozess des Modells sehen können, während es eine Antwort generiert. Außerdem werden Antworten mit stärkeren Schlussfolgerungsfunktionen generiert.

Weitere Informationen zum Gemini 2.0 Flash Thinking-Modus finden Sie auf unserer Übersichtsseite.

11. Dezember 2024

Modellaktualisierungen:

Gemini 2.0 Flash Experimental wurde als öffentliche Vorschau veröffentlicht. Zu den Funktionen von Gemini 2.0 Flash Experimental gehören:
- Doppelt so schnell wie Gemini 1.5 Pro
- Bidirektionales Streaming mit der Live API
- Generierung multimodaler Antworten in Form von Text, Bildern und Sprache
- Verwendung des integrierten Tools mit mehrstufiger Argumentation, um Funktionen wie Codeausführung, Suche und Funktionsaufruf zu nutzen

Weitere Informationen zu Gemini 2.0 Flash finden Sie auf unserer Übersichtsseite.

21. November 2024

Modellaktualisierungen:

gemini-exp-1121 wurde ein noch leistungsstärkeres experimentelles Gemini API-Modell veröffentlicht.

Modellaktualisierungen:

Die Aliasse der Modelle gemini-1.5-flash-latest und gemini-1.5-flash wurden auf gemini-1.5-flash-002 aktualisiert.
- Parameter top_k ändern: Das Modell gemini-1.5-flash-002 unterstützt top_k-Werte zwischen 1 und 41 (exklusiv). Werte über 40 werden auf 40 geändert.

14. November 2024

Modellaktualisierungen:

gemini-exp-1114, ein leistungsstarkes experimentelles Gemini API-Modell, wurde veröffentlicht.

8. November 2024

API-Änderungen:

Unterstützung für Gemini in den OpenAI-Bibliotheken und der REST API hinzugefügt.

31. Oktober 2024

API-Änderungen:

Unterstützung für die Fundierung mit der Google Suche hinzugefügt.

3. Oktober 2024

Modellaktualisierungen:

gemini-1.5-flash-8b-001 wurde eine stabile Version unseres kleinsten Gemini API-Modells veröffentlicht.

24. September 2024

Modellaktualisierungen:

gemini-1.5-pro-002 und gemini-1.5-flash-002 sind zwei neue stabile Versionen von Gemini 1.5 Pro und 1.5 Flash, die allgemein verfügbar sind.
Der Code des gemini-1.5-pro-latest-Modells wurde auf gemini-1.5-pro-002 und der Code des gemini-1.5-flash-latest-Modells auf gemini-1.5-flash-002 aktualisiert.
gemini-1.5-flash-8b-exp-0924 wurde veröffentlicht, um gemini-1.5-flash-8b-exp-0827 zu ersetzen.
Der Filter für die Integrität öffentlicher Aussagen wurde für die Gemini API und AI Studio veröffentlicht.
Unterstützung für zwei neue Parameter für Gemini 1.5 Pro und 1.5 Flash in Python und NodeJS: frequencyPenalty und presencePenalty

19. September 2024

AI Studio-Updates:

Es wurden Schaltflächen für „Mag ich“ und „Mag ich nicht“ zu Modellantworten hinzugefügt, damit Nutzer Feedback zur Qualität einer Antwort geben können.

API-Änderungen:

Unterstützung für Google Cloud-Guthaben hinzugefügt, das jetzt für die Nutzung der Gemini API verwendet werden kann.

17. September 2024

AI Studio-Updates:

Die Schaltfläche In Colab öffnen wurde hinzugefügt. Damit können Sie einen Prompt und den Code zum Ausführen in ein Colab-Notebook exportieren. Die Funktion unterstützt noch keine Prompts mit Tools (JSON-Modus, Funktionsaufrufe oder Codeausführung).

13. September 2024

AI Studio-Updates:

Unterstützung für den Vergleichsmodus hinzugefügt, mit dem Sie Antworten verschiedener Modelle und Prompts vergleichen können, um die beste Lösung für Ihren Anwendungsfall zu finden.

30. August 2024

Modellaktualisierungen:

Gemini 1.5 Flash unterstützt das Angeben eines JSON-Schemas über die Modellkonfiguration.

27. August 2024

Modellaktualisierungen:

Die folgenden experimentellen Modelle wurden veröffentlicht:
- gemini-1.5-pro-exp-0827
- gemini-1.5-flash-exp-0827
- gemini-1.5-flash-8b-exp-0827

9. August 2024

API-Änderungen:

Unterstützung für die PDF-Verarbeitung hinzugefügt.

5. August 2024

Modellaktualisierungen:

Unterstützung für die Feinabstimmung für Gemini 1.5 Flash

1. August 2024

Modellaktualisierungen:

Am gemini-1.5-pro-exp-0801 wurde eine neue experimentelle Version von Gemini 1.5 Pro veröffentlicht.

12. Juli 2024

Modellaktualisierungen:

Die Unterstützung für Gemini 1.0 Pro Vision wurde aus den Google AI-Diensten und ‑Tools entfernt.

27. Juni 2024

Modellaktualisierungen:

Allgemeine Verfügbarkeit des Kontextfensters von 2 Millionen Tokens für Gemini 1.5 Pro

API-Änderungen:

Unterstützung für die Codeausführung hinzugefügt.

18. Juni 2024

API-Änderungen:

Unterstützung für Kontext-Caching hinzugefügt.

12. Juni 2024

Modellaktualisierungen:

Gemini 1.0 Pro Vision wurde eingestellt.

23. Mai 2024

Modellaktualisierungen:

Gemini 1.5 Pro (gemini-1.5-pro-001) ist allgemein verfügbar.
Gemini 1.5 Flash (gemini-1.5-flash-001) ist allgemein verfügbar.

14. Mai 2024

API-Änderungen:

Einführung eines Kontextfensters von 2 Millionen Tokens für Gemini 1.5 Pro (Warteliste).
Einführung der Pay-as-you-go-Abrechnung für Gemini 1.0 Pro. Die Abrechnung für Gemini 1.5 Pro und Gemini 1.5 Flash wird bald verfügbar sein.
Einführung erhöhter Preislimits für die kommende kostenpflichtige Stufe von Gemini 1.5 Pro.
Die File API unterstützt jetzt integrierte Videos.
Die File API unterstützt jetzt auch Nur-Text.
Unterstützung für parallele Funktionsaufrufe hinzugefügt, bei denen mehr als ein Aufruf gleichzeitig zurückgegeben wird.

10. Mai 2024

Modellaktualisierungen:

Gemini 1.5 Flash (gemini-1.5-flash-latest) als Vorabversion veröffentlicht.

9. April 2024

Modellaktualisierungen:

Gemini 1.5 Pro (gemini-1.5-pro-latest) als Vorabversion veröffentlicht.
Neues Texteinbettungsmodell text-embeddings-004 veröffentlicht, das elastische Einbettungen mit einer Größe unter 768 unterstützt.

API-Änderungen:

Die File API zum vorübergehenden Speichern von Mediendateien für Prompts wurde veröffentlicht.
Unterstützung für Prompts mit Text-, Bild- und Audiodaten hinzugefügt, auch als multimodal bezeichnet Weitere Informationen finden Sie unter Prompts mit Medien.
Systemanweisungen in Betaversion veröffentlicht.
Der Modus für Funktionsaufrufe wurde hinzugefügt, der das Ausführungsverhalten für Funktionsaufrufe definiert.
Unterstützung für die Konfigurationsoption response_mime_type hinzugefügt, mit der Antworten im JSON-Format angefordert werden können.

19. März 2024

Modellaktualisierungen:

Es wurde Unterstützung für das Anpassen von Gemini 1.0 Pro in Google AI Studio oder mit der Gemini API hinzugefügt.

13. Dezember 2023

Modellaktualisierungen:

gemini-pro: Neues Textmodell für eine Vielzahl von Aufgaben. Sie bietet eine gute Balance zwischen Leistung und Effizienz.
gemini-pro-vision: Neues multimodales Modell für eine Vielzahl von Aufgaben. Sie bietet eine gute Balance zwischen Funktionalität und Effizienz.
embedding-001: Neues Einbettungsmodell.
aqa: Ein neues speziell abgestimmtes Modell, das trainiert wurde, Fragen anhand von Textpassagen zu beantworten, um generierte Antworten zu fundieren.

Weitere Informationen finden Sie unter Gemini-Modelle.

Änderungen an der API-Version:

v1: Der stabile API-Kanal.
v1beta: Betaversion. Dieser Kanal bietet Funktionen, die sich möglicherweise noch in der Entwicklungsphase befinden.

Weitere Informationen finden Sie im Thema API-Versionen.

API-Änderungen:

GenerateContent ist ein einheitlicher Endpunkt für Chat und SMS.
Streaming ist über die Methode StreamGenerateContent verfügbar.
Multimodale Funktion: Bilder sind eine neue unterstützte Modalität
Neue Betafunktionen:
- Funktionsaufrufe
- Semantic Retriever
- Attribierte Fragebeantwortung (AQA)
Aktualisierte Kandidatenanzahl: Gemini-Modelle geben nur einen Kandidaten zurück.
Unterschiedliche Kategorien für Sicherheitseinstellungen und Altersfreigaben. Weitere Informationen finden Sie unter Sicherheitseinstellungen.
Die Modellabstimmung wird für Gemini-Modelle noch nicht unterstützt (wird derzeit entwickelt).