このページは Cloud Translation API によって翻訳されました。

リリースノート

このページには、Gemini API の更新内容が記載されています。

2025 年 6 月 5 日

gemini-2.5-pro-preview-06-05 をリリースしました。これは、Google の最も強力なモデルの新しいバージョンで、適応型思考を備えています。詳細については、Gemini 2.5 Pro プレビューと思考をご覧ください。gemini-2.5-pro-preview-05-06 は、モデルの新しいバージョンに自動的にポイントします。

2025 年 5 月 20 日

API の更新:

クリッピング間隔と設定可能なフレームレートサンプリングを使用したカスタム動画前処理のサポートを開始しました。
マルチツールの使用を開始しました。これにより、同じ generateContent リクエストでコード実行と Google 検索によるグラウンディングの構成が可能になりました。
Live API で非同期関数呼び出しのサポートを開始しました。
プロンプトに追加のコンテキストとして URL を提供する試験運用版の URL コンテキストツールをリリースしました。

モデルの更新:

価格とパフォーマンス、適応型思考を最適化した Gemini プレビューモデル gemini-2.5-flash-preview-05-20 をリリースしました。詳細については、Gemini 2.5 Flash プレビューとThinking をご覧ください。
1 人または 2 人のスピーカーで音声を生成できる gemini-2.5-pro-preview-tts モデルと gemini-2.5-flash-preview-tts モデルをリリースしました。
リアルタイムで音楽を生成する lyria-realtime-exp モデルをリリースしました。
ネイティブ音声出力機能を備えた Live API 向けの新しい Gemini モデルである gemini-2.5-flash-preview-native-audio-dialog と gemini-2.5-flash-exp-native-audio-thinking-dialog をリリースしました。詳細については、Live API ガイドと Gemini 2.5 Flash ネイティブ音声をご覧ください。
Gemma 3n リリースの一環として、gemma-3n-e4b-it プレビューをリリースしました。AI Studio と Gemini API で利用できます。

2025 年 5 月 7 日

画像の生成と編集用のプレビューモデルである gemini-2.0-flash-preview-image-generation をリリースしました。詳細については、画像生成と Gemini 2.0 Flash プレビュー版の画像生成をご覧ください。

2025 年 5 月 6 日

コードと関数呼び出しが改善された、最も強力なモデルの新しいバージョンである gemini-2.5-pro-preview-05-06 をリリースしました。gemini-2.5-pro-preview-03-25 は、新しいバージョンのモデルに自動的にポイントします。

2025 年 4 月 17 日

価格とパフォーマンス、適応型思考を最適化した Gemini プレビューモデル gemini-2.5-flash-preview-04-17 をリリースしました。詳細については、Gemini 2.5 Flash プレビューとThinking をご覧ください。

2025 年 4 月 16 日

Gemini 2.0 Flash のコンテキストキャッシュ保存をリリースしました。

2025 年 4 月 9 日

モデルの更新:

veo-2.0-generate-001 をリリースしました。これは、詳細で芸術的なニュアンスのある動画を生成できる、テキストと画像から動画への一般提供（GA）モデルです。詳細については、Veo のドキュメントをご覧ください。
課金が有効な Live API モデルの公開プレビュー版である gemini-2.0-flash-live-001 をリリースしました。
- セッション管理と信頼性の強化
  - セッションの再開: 一時的なネットワークの中断でセッションが維持されるようにします。この API は、サーバーサイドのセッション状態の保存（最大 24 時間）をサポートし、再接続して中断したところから再開するためのハンドル（session_resumption）を提供します。
  - コンテキスト圧縮によるセッションの長時間化: 以前の制限時間を超えて、やり取りを延長できます。スライディングウィンドウメカニズムを使用してコンテキストウィンドウ圧縮を構成し、コンテキストの長さを自動的に管理して、コンテキストの上限による突然の終了を防ぎます。
  - 正常な切断通知: 接続が終了するタイミングを示す GoAway サーバーメッセージを受信し、終了前に正常な処理を行うことができます。
- インタラクションダイナミクスをより細かく制御
- 構成可能な音声アクティビティ検出（VAD）: 感度レベルを選択するか、自動 VAD を完全に無効にして、新しいクライアントイベント（activityStart、activityEnd）を使用して手動でオン / オフを切り替えます。
- 構成可能な中断処理: ユーザー入力でモデルの応答を中断するかどうかを決定します。
- 構成可能なターンカバレッジ: API がすべての音声と動画の入力を継続的に処理するか、エンドユーザーが話しているときにのみキャプチャするかを選択します。
- 設定可能なメディア解像度: 入力メディアの解像度を選択して、品質またはトークンの使用量を最適化します。
- より豊富な出力と機能
- 音声と言語のオプションの拡張: 音声出力に 2 つの新しい音声と 30 の新しい言語から選択できます。出力言語は speechConfig 内で構成できるようになりました。
- テキストストリーミング: テキストレスポンスが生成されるたびに段階的に受信し、ユーザーへの表示を高速化します。
- トークン使用状況レポート: サーバーメッセージの usageMetadata フィールドに、モダリティ、プロンプト、レスポンスフェーズ別に詳細なトークン数が表示されます。これにより、使用状況に関する分析情報を得ることができます。

2025 年 4 月 4 日

請求が有効になっている一般公開プレビュー版 Gemini 2.5 Pro バージョンである gemini-2.5-pro-preview-03-25 をリリースしました。無料 tier では gemini-2.5-pro-exp-03-25 を引き続き使用できます。

2025 年 3 月 25 日

gemini-2.5-pro-exp-03-25 をリリースしました。これは、デフォルトで思考モードが常にオンになっている一般公開の試験運用版 Gemini モデルです。詳細については、Gemini 2.5 Pro（試験運用版）をご覧ください。

2025 年 3 月 12 日

モデルの更新:

画像の生成と編集が可能な試験運用版の Gemini 2.0 Flash モデルをリリースしました。
Gemma 3 のリリースの一環として、AI Studio と Gemini API で利用可能な gemma-3-27b-it をリリースしました。

API の更新:

メディアソースとして YouTube URL のサポートを追加しました。
20 MB 未満のインライン動画の埋め込みをサポートしました。

2025 年 3 月 11 日

SDK の更新:

TypeScript と JavaScript 用の Google Gen AI SDK を公開プレビューとしてリリースしました。

2025 年 3 月 7 日

モデルの更新:

公開プレビュー版の gemini-embedding-exp-03-07（Gemini ベースのエンベディングモデルの試験運用版）をリリースしました。

2025 年 2 月 28 日

API の更新:

Gemini 2.0 Pro に基づく試験運用版モデルである gemini-2.0-pro-exp-02-05 に、ツールとしての検索のサポートが追加されました。

2025 年 2 月 25 日

モデルの更新:

Gemini 2.0 Flash-Lite の一般提供（GA）バージョンである gemini-2.0-flash-lite をリリースしました。速度、スケール、費用対効果が最適化されています。

2025 年 2 月 19 日

AI Studio の更新:

追加のリージョン（コソボ、グリーンランド、フェロー諸島）のサポート。

API の更新:

追加のリージョン（コソボ、グリーンランド、フェロー諸島）のサポート。

2025 年 2 月 18 日

モデルの更新:

Gemini 1.0 Pro のサポートは終了しました。サポートされているモデルの一覧については、Gemini モデルをご覧ください。

2025 年 2 月 11 日

API の更新:

OpenAI ライブラリの互換性に関する更新。

2025 年 2 月 6 日

モデルの更新:

Gemini API の Imagen 3 の一般提供（GA）バージョンである imagen-3.0-generate-002 をリリースしました。

SDK の更新:

Google Gen AI SDK for Java の公開プレビューをリリースしました。

2025 年 2 月 5 日

モデルの更新:

テキストのみの出力をサポートする Gemini 2.0 Flash の一般提供（GA）バージョンである gemini-2.0-flash-001 をリリースしました。
Gemini 2.0 Pro の試験運用版公開プレビュー版である gemini-2.0-pro-exp-02-05 をリリースしました。
費用対効果を重視して最適化された試験運用版の公開プレビューモデルである gemini-2.0-flash-lite-preview-02-05 をリリースしました。

API の更新:

コード実行にファイル入力とグラフ出力のサポートを追加しました。

SDK の更新:

Google Gen AI SDK for Python を一般提供（GA）としてリリースしました。

2025 年 1 月 21 日

モデルの更新:

Gemini 2.0 Flash Thinking モデルの基盤となるモデルの最新プレビューバージョンである gemini-2.0-flash-thinking-exp-01-21 をリリースしました。

2024 年 12 月 19 日

モデルの更新:

Gemini 2.0 Flash Thinking モードの公開プレビューをリリースしました。思考モードは、回答の生成中にモデルの思考プロセスを確認できるテスト時の計算モデルです。より強力な推論機能を使用して回答を生成します。

Gemini 2.0 Flash Thinking モードの詳細については、概要ページをご覧ください。

2024 年 12 月 11 日

モデルの更新:

Gemini 2.0 Flash Experimental を公開プレビューとしてリリースしました。Gemini 2.0 Flash Experimental の機能の一部は次のとおりです。
- Gemini 1.5 Pro の 2 倍の速度
- Live API を使用した双方向ストリーミング
- テキスト、画像、音声の形でマルチモーダルレスポンスを生成する
- マルチターン推論を伴う組み込みツールの使用。コード実行、検索、関数呼び出しなどの機能を使用する

Gemini 2.0 Flash の詳細については、概要ページをご覧ください。

2024 年 11 月 21 日

モデルの更新:

より強力な試験運用版 Gemini API モデルである gemini-exp-1121 をリリースしました。

モデルの更新:

gemini-1.5-flash-002 を使用するように gemini-1.5-flash-latest モデルエイリアスと gemini-1.5-flash モデルエイリアスを更新しました。
- top_k パラメータへの変更: gemini-1.5-flash-002 モデルは、1 ～ 41 の top_k 値をサポートしています（両端は含みません）。40 より大きい値は 40 に変更されます。

2024 年 11 月 14 日

モデルの更新:

強力な試験運用版 Gemini API モデルである gemini-exp-1114 をリリースしました。

2024 年 11 月 8 日

API の更新:

OpenAI ライブラリ / REST API に Gemini のサポートを追加しました。

2024 年 10 月 31 日

API の更新:

Google 検索によるグラウンディングのサポートを追加しました。

2024 年 10 月 3 日

モデルの更新:

最も小規模な Gemini API モデルの安定版である gemini-1.5-flash-8b-001 をリリースしました。

2024 年 9 月 24 日

モデルの更新:

Gemini 1.5 Pro と 1.5 Flash の 2 つの新しい安定版である gemini-1.5-pro-002 と gemini-1.5-flash-002 を一般提供としてリリースしました。
gemini-1.5-pro-002 を使用するように gemini-1.5-pro-latest モデルコードを更新し、gemini-1.5-flash-002 を使用するように gemini-1.5-flash-latest モデルコードを更新しました。
gemini-1.5-flash-8b-exp-0827 に代わる gemini-1.5-flash-8b-exp-0924 をリリースしました。
Gemini API と AI Studio の市民の誠実性に関する安全フィルタをリリースしました。
Python と NodeJS で Gemini 1.5 Pro と 1.5 Flash の 2 つの新しいパラメータ（frequencyPenalty と presencePenalty）のサポートをリリースしました。

2024 年 9 月 19 日

AI Studio の更新:

モデルのレスポンスに高評価ボタンと低評価ボタンを追加し、ユーザーがレスポンスの品質に関するフィードバックを送信できるようにしました。

API の更新:

Google Cloud クレジットのサポートを追加しました。これにより、Gemini API の使用にクレジットを使用できるようになりました。

2024 年 9 月 17 日

AI Studio の更新:

プロンプトとその実行コードを Colab ノートブックにエクスポートする [Colab で開く] ボタンを追加しました。この機能では、ツール（JSON モード、関数呼び出し、コード実行）によるプロンプトはまだサポートされていません。

2024 年 9 月 13 日

AI Studio の更新:

比較モードのサポートを追加しました。これにより、モデルとプロンプト間でレスポンスを比較して、ユースケースに最適なものを見つけることができます。

2024 年 8 月 30 日

モデルの更新:

Gemini 1.5 Flash は、モデル構成による JSON スキーマの提供をサポートしています。

2024 年 8 月 27 日

モデルの更新:

次の試験運用版モデルをリリースしました。
- gemini-1.5-pro-exp-0827
- gemini-1.5-flash-exp-0827
- gemini-1.5-flash-8b-exp-0827

2024 年 8 月 9 日

API の更新:

PDF 処理のサポートを追加しました。

2024 年 8 月 5 日

モデルの更新:

Gemini 1.5 Flash のファインチューニングサポートがリリースされました。

2024 年 8 月 1 日

モデルの更新:

Gemini 1.5 Pro の新しい試験運用版である gemini-1.5-pro-exp-0801 をリリースしました。

2024 年 7 月 12 日

モデルの更新:

Google AI サービスとツールから Gemini 1.0 Pro Vision のサポートを削除しました。

2024 年 6 月 27 日

モデルの更新:

Gemini 1.5 Pro の 200 万のコンテキストウィンドウの一般提供リリース。

API の更新:

コード実行のサポートを追加しました。

2024 年 6 月 18 日

API の更新:

コンテキストのキャッシュ保存のサポートを追加しました。

2024 年 6 月 12 日

モデルの更新:

Gemini 1.0 Pro Vision のサポートが終了しました。

2024 年 5 月 23 日

モデルの更新:

Gemini 1.5 Pro（gemini-1.5-pro-001）が一般提供（GA）になりました。
Gemini 1.5 Flash（gemini-1.5-flash-001）が一般提供（GA）になりました。

2024 年 5 月 14 日

API の更新:

Gemini 1.5 Pro に 200 万のコンテキストウィンドウを導入しました（順番待ち）。
Gemini 1.0 Pro に従量課金制の課金を導入しました。Gemini 1.5 Pro と Gemini 1.5 Flash の課金は近日提供予定です。
今後リリースされる Gemini 1.5 Pro の有料ティアで、レートの上限を引き上げました。
File API に組み込み動画のサポートを追加しました。
File API に書式なしテキストのサポートを追加しました。
一度に複数の呼び出しを返す並列関数呼び出しのサポートを追加しました。

2024 年 5 月 10 日

モデルの更新:

Gemini 1.5 Flash（gemini-1.5-flash-latest）をプレビュー版としてリリースしました。

2024 年 4 月 9 日

モデルの更新:

Gemini 1.5 Pro（gemini-1.5-pro-latest）をプレビュー版としてリリースしました。
768 未満の弾性エンベディングサイズをサポートする新しいテキストエンベディングモデル text-embeddings-004 をリリースしました。

API の更新:

プロンプトで使用するメディアファイルを一時的に保存するための File API をリリースしました。
テキスト、画像、音声データによるプロンプトのサポートを追加しました。これはマルチモーダルプロンプトとも呼ばれます。詳細については、メディアによるプロンプトをご覧ください。
ベータ版のシステム指示をリリースしました。
関数呼び出しの実行動作を定義する関数呼び出しモードを追加しました。
response_mime_type 構成オプションのサポートを追加しました。これにより、JSON 形式でレスポンスをリクエストできるようになりました。

2024 年 3 月 19 日

モデルの更新:

Google AI Studio または Gemini API で Gemini 1.0 Pro のチューニングのサポートを追加しました。

2023 年 12 月 13 日

モデルの更新:

gemini-pro: さまざまなタスクに対応する新しいテキストモデル。機能と効率のバランスを取る。
gemini-pro-vision: さまざまなタスクに対応した新しいマルチモーダルモデル。機能と効率のバランスを取る。
embedding-001: 新しいエンベディングモデル。
aqa: 生成された回答の根拠としてテキストパラグラフを使用して質問に回答するようにトレーニングされた、特別にチューニングされた新しいモデル。

詳細については、Gemini モデルをご覧ください。

API バージョンの更新:

v1: 安定版 API チャンネル。
v1beta: ベータ版チャネル。このチャンネルには、開発中の機能が含まれている場合があります。

詳細については、API バージョンのトピックをご覧ください。

API の更新:

GenerateContent は、チャットとテキスト用の単一の統合エンドポイントです。
StreamGenerateContent メソッドを介してストリーミングを利用できます。
マルチモーダル機能: 画像が新たにサポートされるモダリティ
新しいベータ版機能:
- 関数呼び出し
- セマンティックレトリーバー
- 属性付き質問応答（AQA）
候補数を更新: Gemini モデルは 1 つの候補のみを返します。
安全性設定と安全性評価のカテゴリが異なります。詳しくは、安全設定をご覧ください。
Gemini モデルではモデルのチューニングはまだサポートされていません（現在開発中）。