このページには、Gemini API の更新内容が記載されています。
2025 年 6 月 5 日
gemini-2.5-pro-preview-06-05
をリリースしました。これは、Google の最も強力なモデルの新しいバージョンで、適応型思考を備えています。詳細については、Gemini 2.5 Pro プレビューと思考をご覧ください。gemini-2.5-pro-preview-05-06
は、モデルの新しいバージョンに自動的にポイントします。
2025 年 5 月 20 日
API の更新:
- クリッピング間隔と設定可能なフレームレート サンプリングを使用したカスタム動画前処理のサポートを開始しました。
- マルチツールの使用を開始しました。これにより、同じ
generateContent
リクエストでコード実行と Google 検索によるグラウンディングの構成が可能になりました。 - Live API で非同期関数呼び出しのサポートを開始しました。
- プロンプトに追加のコンテキストとして URL を提供する試験運用版の URL コンテキスト ツールをリリースしました。
モデルの更新:
- 価格とパフォーマンス、適応型思考を最適化した Gemini プレビュー モデル
gemini-2.5-flash-preview-05-20
をリリースしました。詳細については、Gemini 2.5 Flash プレビューとThinking をご覧ください。 - 1 人または 2 人のスピーカーで音声を生成できる
gemini-2.5-pro-preview-tts
モデルとgemini-2.5-flash-preview-tts
モデルをリリースしました。 - リアルタイムで音楽を生成する
lyria-realtime-exp
モデルをリリースしました。 - ネイティブ音声出力機能を備えた Live API 向けの新しい Gemini モデルである
gemini-2.5-flash-preview-native-audio-dialog
とgemini-2.5-flash-exp-native-audio-thinking-dialog
をリリースしました。詳細については、Live API ガイドと Gemini 2.5 Flash ネイティブ音声をご覧ください。 - Gemma 3n リリースの一環として、
gemma-3n-e4b-it
プレビューをリリースしました。AI Studio と Gemini API で利用できます。
2025 年 5 月 7 日
- 画像の生成と編集用のプレビュー モデルである
gemini-2.0-flash-preview-image-generation
をリリースしました。詳細については、画像生成と Gemini 2.0 Flash プレビュー版の画像生成をご覧ください。
2025 年 5 月 6 日
- コードと関数呼び出しが改善された、最も強力なモデルの新しいバージョンである
gemini-2.5-pro-preview-05-06
をリリースしました。gemini-2.5-pro-preview-03-25
は、新しいバージョンのモデルに自動的にポイントします。
2025 年 4 月 17 日
- 価格とパフォーマンス、適応型思考を最適化した Gemini プレビュー モデル
gemini-2.5-flash-preview-04-17
をリリースしました。詳細については、Gemini 2.5 Flash プレビューとThinking をご覧ください。
2025 年 4 月 16 日
- Gemini 2.0 Flash のコンテキスト キャッシュ保存をリリースしました。
2025 年 4 月 9 日
モデルの更新:
veo-2.0-generate-001
をリリースしました。これは、詳細で芸術的なニュアンスのある動画を生成できる、テキストと画像から動画への一般提供(GA)モデルです。詳細については、Veo のドキュメントをご覧ください。課金が有効な Live API モデルの公開プレビュー版である
gemini-2.0-flash-live-001
をリリースしました。セッション管理と信頼性の強化
- セッションの再開: 一時的なネットワークの中断でセッションが維持されるようにします。この API は、サーバーサイドのセッション状態の保存(最大 24 時間)をサポートし、再接続して中断したところから再開するためのハンドル(session_resumption)を提供します。
- コンテキスト圧縮によるセッションの長時間化: 以前の制限時間を超えて、やり取りを延長できます。スライディング ウィンドウ メカニズムを使用してコンテキスト ウィンドウ圧縮を構成し、コンテキストの長さを自動的に管理して、コンテキストの上限による突然の終了を防ぎます。
- 正常な切断通知: 接続が終了するタイミングを示す
GoAway
サーバー メッセージを受信し、終了前に正常な処理を行うことができます。
インタラクション ダイナミクスをより細かく制御
構成可能な音声アクティビティ検出(VAD): 感度レベルを選択するか、自動 VAD を完全に無効にして、新しいクライアント イベント(
activityStart
、activityEnd
)を使用して手動でオン / オフを切り替えます。構成可能な中断処理: ユーザー入力でモデルの応答を中断するかどうかを決定します。
構成可能なターンカバレッジ: API がすべての音声と動画の入力を継続的に処理するか、エンドユーザーが話しているときにのみキャプチャするかを選択します。
設定可能なメディア解像度: 入力メディアの解像度を選択して、品質またはトークンの使用量を最適化します。
より豊富な出力と機能
音声と言語のオプションの拡張: 音声出力に 2 つの新しい音声と 30 の新しい言語から選択できます。出力言語は
speechConfig
内で構成できるようになりました。テキスト ストリーミング: テキスト レスポンスが生成されるたびに段階的に受信し、ユーザーへの表示を高速化します。
トークン使用状況レポート: サーバー メッセージの
usageMetadata
フィールドに、モダリティ、プロンプト、レスポンス フェーズ別に詳細なトークン数が表示されます。これにより、使用状況に関する分析情報を得ることができます。
2025 年 4 月 4 日
- 請求が有効になっている一般公開プレビュー版 Gemini 2.5 Pro バージョンである
gemini-2.5-pro-preview-03-25
をリリースしました。無料 tier ではgemini-2.5-pro-exp-03-25
を引き続き使用できます。
2025 年 3 月 25 日
gemini-2.5-pro-exp-03-25
をリリースしました。これは、デフォルトで思考モードが常にオンになっている一般公開の試験運用版 Gemini モデルです。詳細については、Gemini 2.5 Pro(試験運用版)をご覧ください。
2025 年 3 月 12 日
モデルの更新:
- 画像の生成と編集が可能な試験運用版の Gemini 2.0 Flash モデルをリリースしました。
- Gemma 3 のリリースの一環として、AI Studio と Gemini API で利用可能な
gemma-3-27b-it
をリリースしました。
API の更新:
- メディアソースとして YouTube URL のサポートを追加しました。
- 20 MB 未満のインライン動画の埋め込みをサポートしました。
2025 年 3 月 11 日
SDK の更新:
- TypeScript と JavaScript 用の Google Gen AI SDK を公開プレビューとしてリリースしました。
2025 年 3 月 7 日
モデルの更新:
2025 年 2 月 28 日
API の更新:
- Gemini 2.0 Pro に基づく試験運用版モデルである
gemini-2.0-pro-exp-02-05
に、ツールとしての検索のサポートが追加されました。
2025 年 2 月 25 日
モデルの更新:
- Gemini 2.0 Flash-Lite の一般提供(GA)バージョンである
gemini-2.0-flash-lite
をリリースしました。速度、スケール、費用対効果が最適化されています。
2025 年 2 月 19 日
AI Studio の更新:
- 追加のリージョン(コソボ、グリーンランド、フェロー諸島)のサポート。
API の更新:
- 追加のリージョン(コソボ、グリーンランド、フェロー諸島)のサポート。
2025 年 2 月 18 日
モデルの更新:
- Gemini 1.0 Pro のサポートは終了しました。サポートされているモデルの一覧については、Gemini モデルをご覧ください。
2025 年 2 月 11 日
API の更新:
- OpenAI ライブラリの互換性に関する更新。
2025 年 2 月 6 日
モデルの更新:
- Gemini API の Imagen 3 の一般提供(GA)バージョンである
imagen-3.0-generate-002
をリリースしました。
SDK の更新:
- Google Gen AI SDK for Java の公開プレビューをリリースしました。
2025 年 2 月 5 日
モデルの更新:
- テキストのみの出力をサポートする Gemini 2.0 Flash の一般提供(GA)バージョンである
gemini-2.0-flash-001
をリリースしました。 - Gemini 2.0 Pro の試験運用版公開プレビュー版である
gemini-2.0-pro-exp-02-05
をリリースしました。 - 費用対効果を重視して最適化された試験運用版の公開プレビュー モデルである
gemini-2.0-flash-lite-preview-02-05
をリリースしました。
API の更新:
- コード実行にファイル入力とグラフ出力のサポートを追加しました。
SDK の更新:
- Google Gen AI SDK for Python を一般提供(GA)としてリリースしました。
2025 年 1 月 21 日
モデルの更新:
- Gemini 2.0 Flash Thinking モデルの基盤となるモデルの最新プレビュー バージョンである
gemini-2.0-flash-thinking-exp-01-21
をリリースしました。
2024 年 12 月 19 日
モデルの更新:
Gemini 2.0 Flash Thinking モードの公開プレビューをリリースしました。思考モードは、回答の生成中にモデルの思考プロセスを確認できるテスト時の計算モデルです。より強力な推論機能を使用して回答を生成します。
Gemini 2.0 Flash Thinking モードの詳細については、概要ページをご覧ください。
2024 年 12 月 11 日
モデルの更新:
- Gemini 2.0 Flash Experimental を公開プレビューとしてリリースしました。Gemini 2.0 Flash Experimental の機能の一部は次のとおりです。
- Gemini 1.5 Pro の 2 倍の速度
- Live API を使用した双方向ストリーミング
- テキスト、画像、音声の形でマルチモーダル レスポンスを生成する
- マルチターン推論を伴う組み込みツールの使用。コード実行、検索、関数呼び出しなどの機能を使用する
Gemini 2.0 Flash の詳細については、概要ページをご覧ください。
2024 年 11 月 21 日
モデルの更新:
- より強力な試験運用版 Gemini API モデルである
gemini-exp-1121
をリリースしました。
モデルの更新:
gemini-1.5-flash-002
を使用するようにgemini-1.5-flash-latest
モデル エイリアスとgemini-1.5-flash
モデル エイリアスを更新しました。top_k
パラメータへの変更:gemini-1.5-flash-002
モデルは、1 ~ 41 のtop_k
値をサポートしています(両端は含みません)。40 より大きい値は 40 に変更されます。
2024 年 11 月 14 日
モデルの更新:
- 強力な試験運用版 Gemini API モデルである
gemini-exp-1114
をリリースしました。
2024 年 11 月 8 日
API の更新:
- OpenAI ライブラリ / REST API に Gemini のサポートを追加しました。
2024 年 10 月 31 日
API の更新:
- Google 検索によるグラウンディングのサポートを追加しました。
2024 年 10 月 3 日
モデルの更新:
- 最も小規模な Gemini API モデルの安定版である
gemini-1.5-flash-8b-001
をリリースしました。
2024 年 9 月 24 日
モデルの更新:
- Gemini 1.5 Pro と 1.5 Flash の 2 つの新しい安定版である
gemini-1.5-pro-002
とgemini-1.5-flash-002
を一般提供としてリリースしました。 gemini-1.5-pro-002
を使用するようにgemini-1.5-pro-latest
モデルコードを更新し、gemini-1.5-flash-002
を使用するようにgemini-1.5-flash-latest
モデルコードを更新しました。gemini-1.5-flash-8b-exp-0827
に代わるgemini-1.5-flash-8b-exp-0924
をリリースしました。- Gemini API と AI Studio の市民の誠実性に関する安全フィルタをリリースしました。
- Python と NodeJS で Gemini 1.5 Pro と 1.5 Flash の 2 つの新しいパラメータ(
frequencyPenalty
とpresencePenalty
)のサポートをリリースしました。
2024 年 9 月 19 日
AI Studio の更新:
- モデルのレスポンスに高評価ボタンと低評価ボタンを追加し、ユーザーがレスポンスの品質に関するフィードバックを送信できるようにしました。
API の更新:
- Google Cloud クレジットのサポートを追加しました。これにより、Gemini API の使用にクレジットを使用できるようになりました。
2024 年 9 月 17 日
AI Studio の更新:
- プロンプトとその実行コードを Colab ノートブックにエクスポートする [Colab で開く] ボタンを追加しました。この機能では、ツール(JSON モード、関数呼び出し、コード実行)によるプロンプトはまだサポートされていません。
2024 年 9 月 13 日
AI Studio の更新:
- 比較モードのサポートを追加しました。これにより、モデルとプロンプト間でレスポンスを比較して、ユースケースに最適なものを見つけることができます。
2024 年 8 月 30 日
モデルの更新:
- Gemini 1.5 Flash は、モデル構成による JSON スキーマの提供をサポートしています。
2024 年 8 月 27 日
モデルの更新:
- 次の試験運用版モデルをリリースしました。
gemini-1.5-pro-exp-0827
gemini-1.5-flash-exp-0827
gemini-1.5-flash-8b-exp-0827
2024 年 8 月 9 日
API の更新:
- PDF 処理のサポートを追加しました。
2024 年 8 月 5 日
モデルの更新:
- Gemini 1.5 Flash のファインチューニング サポートがリリースされました。
2024 年 8 月 1 日
モデルの更新:
- Gemini 1.5 Pro の新しい試験運用版である
gemini-1.5-pro-exp-0801
をリリースしました。
2024 年 7 月 12 日
モデルの更新:
- Google AI サービスとツールから Gemini 1.0 Pro Vision のサポートを削除しました。
2024 年 6 月 27 日
モデルの更新:
- Gemini 1.5 Pro の 200 万のコンテキスト ウィンドウの一般提供リリース。
API の更新:
- コード実行のサポートを追加しました。
2024 年 6 月 18 日
API の更新:
- コンテキストのキャッシュ保存のサポートを追加しました。
2024 年 6 月 12 日
モデルの更新:
- Gemini 1.0 Pro Vision のサポートが終了しました。
2024 年 5 月 23 日
モデルの更新:
- Gemini 1.5 Pro(
gemini-1.5-pro-001
)が一般提供(GA)になりました。 - Gemini 1.5 Flash(
gemini-1.5-flash-001
)が一般提供(GA)になりました。
2024 年 5 月 14 日
API の更新:
- Gemini 1.5 Pro に 200 万のコンテキスト ウィンドウを導入しました(順番待ち)。
- Gemini 1.0 Pro に従量課金制の課金を導入しました。Gemini 1.5 Pro と Gemini 1.5 Flash の課金は近日提供予定です。
- 今後リリースされる Gemini 1.5 Pro の有料ティアで、レートの上限を引き上げました。
- File API に組み込み動画のサポートを追加しました。
- File API に書式なしテキストのサポートを追加しました。
- 一度に複数の呼び出しを返す並列関数呼び出しのサポートを追加しました。
2024 年 5 月 10 日
モデルの更新:
- Gemini 1.5 Flash(
gemini-1.5-flash-latest
)をプレビュー版としてリリースしました。
2024 年 4 月 9 日
モデルの更新:
- Gemini 1.5 Pro(
gemini-1.5-pro-latest
)をプレビュー版としてリリースしました。 - 768 未満の弾性エンベディング サイズをサポートする新しいテキスト エンベディング モデル
text-embeddings-004
をリリースしました。
API の更新:
- プロンプトで使用するメディア ファイルを一時的に保存するための File API をリリースしました。
- テキスト、画像、音声データによるプロンプトのサポートを追加しました。これはマルチモーダル プロンプトとも呼ばれます。詳細については、メディアによるプロンプトをご覧ください。
- ベータ版のシステム指示をリリースしました。
- 関数呼び出しの実行動作を定義する関数呼び出しモードを追加しました。
response_mime_type
構成オプションのサポートを追加しました。これにより、JSON 形式でレスポンスをリクエストできるようになりました。
2024 年 3 月 19 日
モデルの更新:
- Google AI Studio または Gemini API で Gemini 1.0 Pro のチューニングのサポートを追加しました。
2023 年 12 月 13 日
モデルの更新:
- gemini-pro: さまざまなタスクに対応する新しいテキストモデル。機能と効率のバランスを取る。
- gemini-pro-vision: さまざまなタスクに対応した新しいマルチモーダル モデル。機能と効率のバランスを取る。
- embedding-001: 新しいエンベディング モデル。
- aqa: 生成された回答の根拠としてテキスト パラグラフを使用して質問に回答するようにトレーニングされた、特別にチューニングされた新しいモデル。
詳細については、Gemini モデルをご覧ください。
API バージョンの更新:
- v1: 安定版 API チャンネル。
- v1beta: ベータ版チャネル。このチャンネルには、開発中の機能が含まれている場合があります。
詳細については、API バージョンのトピックをご覧ください。
API の更新:
GenerateContent
は、チャットとテキスト用の単一の統合エンドポイントです。StreamGenerateContent
メソッドを介してストリーミングを利用できます。- マルチモーダル機能: 画像が新たにサポートされるモダリティ
- 新しいベータ版機能:
- 関数呼び出し
- セマンティック レトリーバー
- 属性付き質問応答(AQA)
- 候補数を更新: Gemini モデルは 1 つの候補のみを返します。
- 安全性設定と安全性評価のカテゴリが異なります。詳しくは、安全設定をご覧ください。
- Gemini モデルではモデルのチューニングはまだサポートされていません(現在開発中)。