本頁面說明 Gemini API 的更新內容。
2025 年 6 月 5 日
- 我們已發布
gemini-2.5-pro-preview-06-05
,這是我們最強大模型的新版本,現在已具備自適應思考功能。詳情請參閱 Gemini 2.5 Pro 預覽版和 Thinking。gemini-2.5-pro-preview-05-06
會自動指向模型的新版本。
2025 年 5 月 20 日
API 更新:
- 推出支援使用剪輯間隔和可設定的畫面更新率取樣功能,進行自訂影片預先處理。
- 推出多工具使用功能,可在同一個
generateContent
要求中設定程式碼執行和利用 Google 搜尋建立基準。 - 推出 Live API 中的非同步函式呼叫支援功能。
- 推出實驗性的網址內容工具,可將網址做為提示的額外內容提供。
模型更新:
- 發布
gemini-2.5-flash-preview-05-20
,這是 Gemini 預先發布版模型,可針對價格效益和自適應思考進行最佳化。詳情請參閱 Gemini 2.5 Flash 預覽和「思考」一文。 - 發布
gemini-2.5-pro-preview-tts
和gemini-2.5-flash-preview-tts
模型,可透過一或兩位說話者產生語音。 - 發布
lyria-realtime-exp
模型,可即時產生音樂。 - 發布
gemini-2.5-flash-preview-native-audio-dialog
和gemini-2.5-flash-exp-native-audio-thinking-dialog
,這是 Live API 的新 Gemini 模型,具有原生音訊輸出功能。如需更多資訊,請參閱 Live API 指南和 Gemini 2.5 Flash 原生音訊。 - Gemma 3n 推出的
gemma-3n-e4b-it
預先發布版,可透過 AI Studio 和 Gemini API 取得。
2025 年 5 月 7 日
- 發布
gemini-2.0-flash-preview-image-generation
,這是用於產生及編輯圖片的預覽模型。詳情請參閱「圖片產生」和「Gemini 2.0 Flash 預覽圖片產生」。
2025 年 5 月 6 日
- 我們已發布
gemini-2.5-pro-preview-05-06
,這是我們最強大模型的新版本,其中改善了程式碼和函式呼叫功能。gemini-2.5-pro-preview-03-25
會自動指向新版模型。
2025 年 4 月 17 日
- 發布
gemini-2.5-flash-preview-04-17
,這是 Gemini 預先發布版模型,可針對價格效益和自適應思考進行最佳化。詳情請參閱 Gemini 2.5 Flash 預覽和「思考」一文。
2025 年 4 月 16 日
- 為 Gemini 2.0 Flash 推出了內容快取功能。
2025 年 4 月 9 日
模型更新:
- 發布
veo-2.0-generate-001
,這是一般可用 (GA) 的文字和圖像轉影片模型,可生成精細且富含藝術細節的影片。詳情請參閱 Veo 說明文件。 發布
gemini-2.0-flash-live-001
,這是啟用結帳功能的 Live API 模型公開預先發布版。強化工作階段管理和穩定性
- 工作階段恢復:在暫時性網路中斷期間維持工作階段運作。此 API 現在支援伺服器端工作階段狀態儲存空間 (最多 24 小時),並提供句柄 (session_resumption),以便重新連線並從上次中斷處繼續執行。
- 透過情境壓縮功能延長工作階段:啟用延長互動時間的功能,以便延長工作階段。使用滑動視窗機制設定情境視窗壓縮功能,自動管理情境長度,避免因情境限制而突然終止。
- 優雅中斷通知:接收
GoAway
伺服器訊息,指出連線即將關閉,以便在終止前妥善處理。
進一步掌控互動動態
可設定的語音活動偵測 (VAD):選擇敏感度等級,或完全停用自動 VAD,並使用新的用戶端事件 (
activityStart
、activityEnd
) 手動控制轉向。可設定的中斷處理:決定是否應中斷模型的回應,以便使用者輸入內容。
可設定的轉向覆蓋率:選擇 API 是否要持續處理所有音訊和視訊輸入內容,或是只在偵測到使用者說話時擷取。
可設定的媒體解析度:選取輸入媒體的解析度,以便針對品質或符記使用量進行最佳化。
更豐富的輸出內容和功能
擴充的語音和語言選項:選擇兩種新語音和 30 種新語言的音訊輸出。輸出語言現在可以在
speechConfig
中設定。文字串流:逐漸接收文字回應,以便更快向使用者顯示。
符記使用率回報:透過伺服器訊息的
usageMetadata
欄位提供的詳細符記數量,深入瞭解使用情形,並按模式和提示或回應階段細分。
2025 年 4 月 4 日
- 發布
gemini-2.5-pro-preview-03-25
,這是啟用帳單功能的 Gemini 2.5 Pro 公開預先發布版。您可以繼續在免費方案中使用gemini-2.5-pro-exp-03-25
。
2025 年 3 月 25 日
- 發布
gemini-2.5-pro-exp-03-25
,這是公開實驗性的 Gemini 模型,預設情況下會一律啟用思考模式。如需瞭解詳情,請參閱 Gemini 2.5 Pro 實驗版。
2025 年 3 月 12 日
模型更新:
- 推出可產生及編輯圖片的 Gemini 2.0 Flash 實驗模型。
- 發布
gemma-3-27b-it
,可透過 AI Studio 和 Gemini API 取得,也是 Gemma 3 推出的一部分。
API 更新:
- 開始支援YouTube 網址做為媒體來源。
- 新增支援功能,可納入小於 20 MB 的內嵌影片。
2025 年 3 月 11 日
SDK 更新:
- 將 適用於 TypeScript 和 JavaScript 的 Google Gen AI SDK 發布至公開預覽階段。
2025 年 3 月 7 日
模型更新:
- 發布
gemini-embedding-exp-03-07
,這是一項實驗性 Gemini 版嵌入模型,目前處於公開測試階段。
2025 年 2 月 28 日
API 更新:
- 搜尋做為工具功能已加入
gemini-2.0-pro-exp-02-05
,這是以 Gemini 2.0 Pro 為基礎的實驗性模型。
2025 年 2 月 25 日
模型更新:
- 發布
gemini-2.0-flash-lite
,這是 Gemini 2.0 Flash-Lite 的一般可用 (GA) 版本,經過最佳化處理,可提升速度、規模和成本效益。
2025 年 2 月 19 日
AI Studio 更新:
- 支援更多地區 (科索沃、格陵蘭和法羅群島)。
API 更新:
- 支援更多地區 (科索沃、格陵蘭和法羅群島)。
2025 年 2 月 18 日
模型更新:
- 我們已停止支援 Gemini 1.0 Pro。如需支援的型號清單,請參閱「Gemini 型號」。
2025 年 2 月 11 日
API 更新:
2025 年 2 月 6 日
模型更新:
- 發布
imagen-3.0-generate-002
,這是 Gemini API 中的 Imagen 3 的一般可用 (GA) 版本。
SDK 更新:
- 發布 Java 適用的 Google Gen AI SDK 供公開預先發布。
2025 年 2 月 5 日
模型更新:
- 發布
gemini-2.0-flash-001
,這是 Gemini 2.0 Flash 的正式發布版 (GA),支援純文字輸出。 - 發布
gemini-2.0-pro-exp-02-05
,這是 Gemini 2.0 Pro 的實驗性公開預覽版。 - 發布
gemini-2.0-flash-lite-preview-02-05
,這是一項實驗性的公開預覽模型,可針對成本效益進行最佳化。
API 更新:
- 為程式碼執行作業新增檔案輸入和圖表輸出支援功能。
SDK 更新:
- 發布 Python 適用的 Google Gen AI SDK 正式版 (GA)。
2025 年 1 月 21 日
模型更新:
- 發布
gemini-2.0-flash-thinking-exp-01-21
,這是 Gemini 2.0 Flash Thinking 模型背後模型的最新預先發布版。
2024 年 12 月 19 日
模型更新:
發布 Gemini 2.0 Flash Thinking 模式的公開預先發布版。思考模式是一種測試時間運算模型,可讓您在模型產生回覆時查看模型的思考過程,並產生具有更強推理能力的回覆。
如要進一步瞭解 Gemini 2.0 Flash Thinking 模式,請參閱總覽頁面。
2024 年 12 月 11 日
模型更新:
- 發布 Gemini 2.0 Flash Experimental 公開預先發布版。Gemini 2.0 Flash Experimental 的部分功能包括:
- 速度是 Gemini 1.5 Pro 的兩倍
- 使用 Live API 進行雙向串流
- 以文字、圖像和語音形式產生多模態回覆
- 使用內建工具搭配多輪推理,以便使用程式碼執行、搜尋、函式呼叫等功能
如要進一步瞭解 Gemini 2.0 Flash,請參閱總覽頁面。
2024 年 11 月 21 日
模型更新:
- 發布
gemini-exp-1121
,這是更強大的 Gemini API 實驗模型。
模型更新:
- 更新
gemini-1.5-flash-latest
和gemini-1.5-flash
模型別名,以便使用gemini-1.5-flash-002
。- 變更為
top_k
參數:gemini-1.5-flash-002
模型支援 1 到 41 (不含) 之間的top_k
值。大於 40 的值會變更為 40。
- 變更為
2024 年 11 月 14 日
模型更新:
- 發布
gemini-exp-1114
,這是功能強大的 Gemini API 實驗模型。
2024 年 11 月 8 日
API 更新:
- 在 OpenAI 程式庫 / REST API 中新增Gemini 支援。
2024 年 10 月 31 日
API 更新:
2024 年 10 月 3 日
模型更新:
- 發布
gemini-1.5-flash-8b-001
,這是 Gemini API 最小模型的穩定版。
2024 年 9 月 24 日
模型更新:
- 發布
gemini-1.5-pro-002
和gemini-1.5-flash-002
,這是 Gemini 1.5 Pro 和 1.5 Flash 的兩個新穩定版本,供一般使用者使用。 - 更新
gemini-1.5-pro-latest
模型程式碼,以便使用gemini-1.5-pro-002
,並更新gemini-1.5-flash-latest
模型程式碼,以便使用gemini-1.5-flash-002
。 - 發布
gemini-1.5-flash-8b-exp-0924
取代gemini-1.5-flash-8b-exp-0827
。 - 為 Gemini API 和 AI Studio 發布公民誠信安全篩選器。
- 為 Python 和 NodeJS 中的 Gemini 1.5 Pro 和 1.5 Flash 推出兩個新參數:
frequencyPenalty
和presencePenalty
。
2024 年 9 月 19 日
AI Studio 更新:
- 在模型回覆中新增「喜歡」和「不喜歡」按鈕,讓使用者針對回覆品質提供意見回饋。
API 更新:
- 新增 Google Cloud 抵免額支援功能,現在可用於 Gemini API 用量。
2024 年 9 月 17 日
AI Studio 更新:
- 新增「在 Colab 中開啟」按鈕,可將提示訊息和執行提示訊息的程式碼匯出至 Colab 筆記本。這項功能尚不支援使用工具提示 (JSON 模式、函式呼叫或程式碼執行)。
2024 年 9 月 13 日
AI Studio 更新:
- 新增比較模式支援功能,讓您比較各模型和提示的回覆,找出最適合用途的模型。
2024 年 8 月 30 日
模型更新:
- Gemini 1.5 Flash 支援透過模型設定提供 JSON 結構定義。
2024 年 8 月 27 日
模型更新:
- 發布下列實驗模型:
gemini-1.5-pro-exp-0827
gemini-1.5-flash-exp-0827
gemini-1.5-flash-8b-exp-0827
2024 年 8 月 9 日
API 更新:
- 新增PDF 處理支援功能。
2024 年 8 月 5 日
模型更新:
- 為 Gemini 1.5 Flash 發布精細調整支援功能。
2024 年 8 月 1 日
模型更新:
- 發布
gemini-1.5-pro-exp-0801
,這是 Gemini 1.5 Pro 的新實驗版。
2024 年 7 月 12 日
模型更新:
- 從 Google AI 服務和工具中移除 Gemini 1.0 Pro Vision 的支援。
2024 年 6 月 27 日
模型更新:
- Gemini 1.5 Pro 的 200 萬個詞元脈絡窗口正式版。
API 更新:
- 新增程式碼執行支援功能。
2024 年 6 月 18 日
API 更新:
- 新增內容快取支援功能。
2024 年 6 月 12 日
模型更新:
- 已淘汰 Gemini 1.0 Pro Vision。
2024 年 5 月 23 日
模型更新:
- Gemini 1.5 Pro (
gemini-1.5-pro-001
) 已正式發布 (GA)。 - Gemini 1.5 Flash (
gemini-1.5-flash-001
) 正式推出 (GA)。
2024 年 5 月 14 日
API 更新:
- 推出 Gemini 1.5 Pro 的 200 萬個詞元脈絡窗口 (等候名單)。
- 為 Gemini 1.0 Pro 推出即付即用帳單,Gemini 1.5 Pro 和 Gemini 1.5 Flash 的帳單功能即將推出。
- 為即將推出的 Gemini 1.5 Pro 付費等級,引進更高的速率限制。
- 在 File API 中新增內建影片支援功能。
- 為 File API 新增純文字支援功能。
- 新增對並行函式呼叫的支援,可一次傳回多個呼叫。
2024 年 5 月 10 日
模型更新:
- 發布 Gemini 1.5 Flash (
gemini-1.5-flash-latest
) 預先發布版。
2024 年 4 月 9 日
模型更新:
- 發布 Gemini 1.5 Pro (
gemini-1.5-pro-latest
) 預先發布版。 - 發布新的文字嵌入模型
text-embeddings-004
,可支援 768 以下的彈性嵌入大小。
API 更新:
- 發布 File API,可暫時儲存用於提示的媒體檔案。
- 新增支援使用文字、圖片和音訊資料的提示,也稱為多模態提示。詳情請參閱「使用媒體提示」。
- 在 Beta 版中發布系統指令。
- 新增函式呼叫模式,用於定義函式呼叫的執行行為。
- 新增對
response_mime_type
設定選項的支援,讓您以 JSON 格式要求回應。
2024 年 3 月 19 日
模型更新:
- 新增支援在 Google AI Studio 中或使用 Gemini API 調整 Gemini 1.0 Pro。
2023 年 12 月 13 日
模型更新:
- gemini-pro:新推出的文字模型,可執行多種工作。平衡能力和效率。
- gemini-pro-vision:適用於多種任務的新多模態模型。平衡能力和效率。
- embedding-001:新嵌入模型。
- aqa:這是一種全新的專屬調整模型,經過訓練後可使用文字片段回答問題,並根據產生的答案提供依據。
詳情請參閱「Gemini 模型」。
API 版本更新:
- v1:穩定版 API 管道。
- v1beta:Beta 版。這個管道可能包含尚在開發中的功能。
詳情請參閱 API 版本主題。
API 更新:
GenerateContent
是對話和文字的單一整合式端點。- 可透過
StreamGenerateContent
方法進行串流。 - 多模態功能:圖像是新支援的模態
- 新的 Beta 版功能:
- 函式呼叫
- Semantic Retriever
- 歸因問題回答 (AQA)
- 更新候選人數:Gemini 模型只會傳回 1 位候選人。
- 不同的安全性設定和 SafetyRating 類別。詳情請參閱安全設定。
- Gemini 模型目前不支援調整模型 (正在進行中)。