中文(繁體)

目前位置: 首頁> Gemini 教學> Google Gemini 支持哪些模型?最全Gemini 模型版本介紹

Google Gemini 支持哪些模型?最全Gemini 模型版本介紹

作者: LoRA 時間:

Gemini 支持多種模型,這些模型根據其功能和目標應用場景而有所不同。以下是一些主要的Gemini 模型:

Gemini 2.5 Proexperiment

最強大的思考型模型,具有最高的回答準確性和最先進的性能

功能特色

輸入音頻、圖片、視頻和文本,獲取文本回复

解決棘手問題、分析大型數據庫等

最適合處理複雜的編碼、推理和多模態理解

Gemini 2.0 Flashspark

我們最新的多模態模型,具有新一代功能和增強型功能

功能特色

輸入音頻、圖片、視頻和文本,獲取文本回复

生成代碼和圖片、提取數據、分析文件、生成圖表等

低延遲、高性能,專為打造代理式體驗而打造

Gemini 2.0 Flash-Lite

一款針對性價比和低延遲時間進行了優化的Gemini 2.0 Flash 模型

功能特色

輸入音頻、圖片、視頻和文本,獲取文本回复

在大多數基準測試中都優於1.5 Flash

100 萬個token 的上下文窗口和多模態輸入(如Flash 2.0)

模型變體

Gemini API 提供針對特定用例進行了優化的不同模型。下面簡要介紹了可用的Gemini 變體:

模型變體輸入輸出優化目標
Gemini 2.5 Pro 預覽版
gemini-2. 5-pro-preview-03-25
音頻、圖片、視頻和文本文字增強型思考和推理能力、多模態理解、高級編碼等
Gemini 2.0 Flash
gemini-2. 0-flash
音頻、圖片、視頻和文本文本、圖片(實驗性功能)和音頻(即將推出)新一代功能、速度、思考、實時串流和多模式生成
Gemini 2.0 Flash-Lite
gemini-2. 0-flash-lite
音頻、圖片、視頻和文本文字成本效益高且延遲時間短
Gemini 1.5 Flash
gemini-1. 5-flash
音頻、圖片、視頻和文本文字在各種任務中提供快速、多樣化的性能
Gemini 1.5 Flash-8B
gemini-1. 5-flash-8b
音頻、圖片、視頻和文本文字量大且智能程度較低的任務
Gemini 1.5 Pro
gemini-1. 5-pro
音頻、圖片、視頻和文本文字需要更高智能的複雜推理任務
Gemini 嵌入
gemini-embedding-exp
文字文本嵌入衡量文本字符串的相關性
Imagen 3
imagen-3. 0-generate-002
文字圖片我們最先進的圖片生成模型
Veo 2
veo-2. 0-generate-001
文字、圖片影片生成高畫質視頻
Gemini 2.0 Flash 直播
gemini-2. 0-flash-live-001
音頻、視頻和文本文字、音頻低延遲的雙向語音和視頻互動