OpenAI API 模型在「純文字 vs 視覺(能處理影像輸入)」能力與價格比較。資料來自官方文檔與社群觀察。請當作參考,實際以官方最新文件為主。
模型分群與特性比較(文字 vs 視覺輸入能力)
模型/系列 | 是否支援影像輸入 | 主要用途 / 限制 | 補充說明 |
---|---|---|---|
GPT-3 / GPT-3.5 系列(如 gpt-3.5-turbo 等) | 不支援 | 純文字生成、對話、補完 | 這些模型只接受文字輸入,不處理圖片 |
GPT-4(文字版) | 有特定變體支援 | 若版本為多模態(vision)則可處理影像 + 文字 | GPT-4V / GPT-4 with vision 支援圖像輸入 |
GPT-4o / GPT-4o mini | 支援(multimodal) | 可處理文字、影像、音訊(部分能力) | GPT-4o 是 omni 模型,支援視覺 + 聲音 + 文本 維基百科+2OpenAI 平台+2 |
GPT-Image-1 | 是(主要為影像) | 圖像生成與部分影像理解 | 可接受文字 + 圖像輸入 / 輸出圖像 OpenAI+2OpenAI 平台+2 |
GPT-4.1 / 系列(含 mini / nano) | 支援多模態 | 用於複雜任務、長上下文 | 官方文檔指出它屬於 vision-enabled 模型系列 Microsoft Learn+2OpenAI+2 |
o-series reasoning models | 支援視覺 | 用以多模態分析與推理 | Azure 文檔指出 o 系列與 GPT-4.1、GPT-4o 等皆為 vision-enabled 模型 Microsoft Learn |
價格概況(文字 token 與影像 token / 輸出成本)
以下是各模型在文字與影像/多模態情境下的典型價格比較(若公開可查)。
模型 | 文字輸入/輸出價格 | 影像輸入 / 處理價格 | 備註 /特殊規則 |
---|---|---|---|
GPT-Image-1 | 文字輸入 $5 / 1M tokens OpenAI | 圖像輸入 $10 / 1M image tokens;圖像輸出 $40 / 1M image tokens OpenAI | |
GPT-4o / GPT-4o mini | GPT-4o:文字輸入 $2.50 / 1M tokens,輸出 $10 / 1M tokens 維基百科+2OpenAI 平台+2 GPT-4o mini:輸入 $0.15 / 1M,輸出 $0.60 / 1M Reuters+1 | 使用影像輸入時,影像會被轉換為 token 或 tiles 處理,產生額外成本。實際被收費的 token 數可能乘以放大係數(社群中有報告影像 token 被放大)OpenAI 社區+2OpenAI 社區+2 | |
GPT-4.1 / 系列 | 在 OpenAI 平台上標示:輸入 $2 / 1M tokens,輸出 $8 / 1M tokens OpenAI+1 | 若有影像輸入,其 token 計費邏輯與 GPT-4o 類似(影像拆片、映射 token) | |
GPT-4(多模態版) | 傳統文字定價(取決於版本) | 處理影像輸入時會額外計算 token / tiles 處理成本 |
關鍵觀察與警示
-
影像 token 被放大/計算方式複雜
使用影像輸入時,OpenAI 會將影像拆成 tiles 或塊(tile tokens),並對每塊計算輸入 token 數。這會導致影像輸入的 token 成本遠高於純文字輸入。社群中有使用者指出 GPT-4o-mini 的影像 token 被乘以大係數後計費。OpenAI 社區 -
價格動態調整與未公開部分
OpenAI 不定期推出新模型(如 GPT-4.1, GPT-5)或淘汰舊模型(如 GPT-4.5),定價與支援能力會變。
有些模型功能(特別是多模態、影像處理)在不同地域/計畫中可能受限或尚未開放。 -
效率 vs 成本取捨
若任務主要是文字處理,選純文字模型(如 GPT-3.5 / GPT-4.1 的文字版本)通常成本最低。
如果包含影像理解,必須選支援 vision 的模型,但要預估影像 token 成本可能遠高。
模型與標準定價表
模型名稱 | 是否多模態(可處理影像/視覺輸入) | 輸入 token 價格(USD/1M tokens) | 輸出 token 價格(USD/1M tokens) | 備註 /來源 /不確定處 |
---|---|---|---|---|
gpt-3.5-turbo | 否 | 約 $0.0015 | 約 $0.0020 | 此為舊資料推估(官方定價頁未明確列) |
GPT-4 Turbo / GPT-4 (Turbo 版本含 vision preview) | 有(視具體版本) | $10.00 | $10.00 | GPT-4 Turbo / vision Preview 定價為 $10 input + $10 output apidog |
GPT-4(標準) | 有部分版本支援 | $30.00 | $60.00 | 官方定價頁提及 gpt-4 輸入 $30 / 輸出 $60 apidog+1 |
GPT-4 32k 上下文版本 | 同上 | $60.00 | $120.00 | 翻倍於標準版本 apidog |
gpt-4o (omni 多模態) | 是 | $2.50 | $10.00 | Wikipedia 上有此價格說明 維基百科 |
gpt-4o mini | 是 | $0.15 | $0.60 | 同 Wikipedia 描述 維基百科 |
GPT-5 | 多模態(假設) | $1.25 | $10.00 | OpenAI “Compare models” 頁面有此定價 OpenAI 平台 |
GPT-5 mini / nano | (可能支援) | $0.25 / $0.05 | $2.00 / $0.40 | 同上頁面資料 OpenAI 平台 |
o1-pro | 多模態或高能力模型 | $150.00 | $600.00 | TechRepublic 報導 o1-pro 的高價格 TechRepublic |
GPT-4.5 | 多模態 | $75.00 | $150.00 | 在 Wikipedia 有此資料(不過有標示可能已退場) 維基百科 |
沒有留言:
張貼留言