Manus邀請碼申請攻略
Character.AI 推出AvatarFX:AI 視頻生成模型讓靜態圖片“開口說話”
Manychat完成1.4億美元B輪融資,借AI加速全球社交電商佈局
谷歌AI概覽嚴重衝擊SEO點擊率:Ahrefs研究顯示流量下降超34%
Gemini 支持多種模型,這些模型根據其功能和目標應用場景而有所不同。以下是一些主要的Gemini 模型:
Gemini 2.5 Proexperiment
最強大的思考型模型,具有最高的回答準確性和最先進的性能
功能特色
輸入音頻、圖片、視頻和文本,獲取文本回复
解決棘手問題、分析大型數據庫等
最適合處理複雜的編碼、推理和多模態理解
Gemini 2.0 Flashspark
我們最新的多模態模型,具有新一代功能和增強型功能
功能特色
輸入音頻、圖片、視頻和文本,獲取文本回复
生成代碼和圖片、提取數據、分析文件、生成圖表等
低延遲、高性能,專為打造代理式體驗而打造
Gemini 2.0 Flash-Lite
一款針對性價比和低延遲時間進行了優化的Gemini 2.0 Flash 模型
功能特色
輸入音頻、圖片、視頻和文本,獲取文本回复
在大多數基準測試中都優於1.5 Flash
100 萬個token 的上下文窗口和多模態輸入(如Flash 2.0)
模型變體
Gemini API 提供針對特定用例進行了優化的不同模型。下面簡要介紹了可用的Gemini 變體:
模型變體 | 輸入 | 輸出 | 優化目標 |
---|---|---|---|
Gemini 2.5 Pro 預覽版gemini-2. 5-pro-preview-03-25 | 音頻、圖片、視頻和文本 | 文字 | 增強型思考和推理能力、多模態理解、高級編碼等 |
Gemini 2.0 Flashgemini-2. 0-flash | 音頻、圖片、視頻和文本 | 文本、圖片(實驗性功能)和音頻(即將推出) | 新一代功能、速度、思考、實時串流和多模式生成 |
Gemini 2.0 Flash-Litegemini-2. 0-flash-lite | 音頻、圖片、視頻和文本 | 文字 | 成本效益高且延遲時間短 |
Gemini 1.5 Flashgemini-1. 5-flash | 音頻、圖片、視頻和文本 | 文字 | 在各種任務中提供快速、多樣化的性能 |
Gemini 1.5 Flash-8Bgemini-1. 5-flash-8b | 音頻、圖片、視頻和文本 | 文字 | 量大且智能程度較低的任務 |
Gemini 1.5 Progemini-1. 5-pro | 音頻、圖片、視頻和文本 | 文字 | 需要更高智能的複雜推理任務 |
Gemini 嵌入gemini-embedding-exp | 文字 | 文本嵌入 | 衡量文本字符串的相關性 |
Imagen 3imagen-3. 0-generate-002 | 文字 | 圖片 | 我們最先進的圖片生成模型 |
Veo 2veo-2. 0-generate-001 | 文字、圖片 | 影片 | 生成高畫質視頻 |
Gemini 2.0 Flash 直播gemini-2. 0-flash-live-001 | 音頻、視頻和文本 | 文字、音頻 | 低延遲的雙向語音和視頻互動 |