Google Gemini 支持哪些模型？最全Gemini 模型版本介紹

作者: LoRA 時間: 2025年04月16日

Gemini 支持多種模型，這些模型根據其功能和目標應用場景而有所不同。以下是一些主要的Gemini 模型：

Gemini 2.5 Proexperiment

最強大的思考型模型，具有最高的回答準確性和最先進的性能

功能特色

輸入音頻、圖片、視頻和文本，獲取文本回复

解決棘手問題、分析大型數據庫等

最適合處理複雜的編碼、推理和多模態理解

Gemini 2.0 Flashspark

我們最新的多模態模型，具有新一代功能和增強型功能

功能特色

輸入音頻、圖片、視頻和文本，獲取文本回复

生成代碼和圖片、提取數據、分析文件、生成圖表等

低延遲、高性能，專為打造代理式體驗而打造

Gemini 2.0 Flash-Lite

一款針對性價比和低延遲時間進行了優化的Gemini 2.0 Flash 模型

功能特色

輸入音頻、圖片、視頻和文本，獲取文本回复

在大多數基準測試中都優於1.5 Flash

100 萬個token 的上下文窗口和多模態輸入（如Flash 2.0）

模型變體

Gemini API 提供針對特定用例進行了優化的不同模型。下面簡要介紹了可用的Gemini 變體：

模型變體	輸入	輸出	優化目標
Gemini 2.5 Pro 預覽版 `gemini-2. 5-pro-preview-03-25`	音頻、圖片、視頻和文本	文字	增強型思考和推理能力、多模態理解、高級編碼等
Gemini 2.0 Flash `gemini-2. 0-flash`	音頻、圖片、視頻和文本	文本、圖片（實驗性功能）和音頻（即將推出）	新一代功能、速度、思考、實時串流和多模式生成
Gemini 2.0 Flash-Lite `gemini-2. 0-flash-lite`	音頻、圖片、視頻和文本	文字	成本效益高且延遲時間短
Gemini 1.5 Flash `gemini-1. 5-flash`	音頻、圖片、視頻和文本	文字	在各種任務中提供快速、多樣化的性能
Gemini 1.5 Flash-8B `gemini-1. 5-flash-8b`	音頻、圖片、視頻和文本	文字	量大且智能程度較低的任務
Gemini 1.5 Pro `gemini-1. 5-pro`	音頻、圖片、視頻和文本	文字	需要更高智能的複雜推理任務
Gemini 嵌入 `gemini-embedding-exp`	文字	文本嵌入	衡量文本字符串的相關性
Imagen 3 `imagen-3. 0-generate-002`	文字	圖片	我們最先進的圖片生成模型
Veo 2 `veo-2. 0-generate-001`	文字、圖片	影片	生成高畫質視頻
Gemini 2.0 Flash 直播 `gemini-2. 0-flash-live-001`	音頻、視頻和文本	文字、音頻	低延遲的雙向語音和視頻互動

←Gemini是什麼 Gemini Developer API 價格→