2025年10月12日 星期日

OpenAI API 模型在「純文字 vs 視覺(能處理影像輸入)」能力與價格比較

 OpenAI API 模型在「純文字 vs 視覺(能處理影像輸入)」能力與價格比較。資料來自官方文檔與社群觀察。請當作參考,實際以官方最新文件為主。


模型分群與特性比較(文字 vs 視覺輸入能力)

模型/系列是否支援影像輸入主要用途 / 限制補充說明
GPT-3 / GPT-3.5 系列(如 gpt-3.5-turbo 等)不支援純文字生成、對話、補完這些模型只接受文字輸入,不處理圖片
GPT-4(文字版)有特定變體支援若版本為多模態(vision)則可處理影像 + 文字GPT-4V / GPT-4 with vision 支援圖像輸入
GPT-4o / GPT-4o mini支援(multimodal)可處理文字、影像、音訊(部分能力)GPT-4o 是 omni 模型,支援視覺 + 聲音 + 文本 維基百科+2OpenAI 平台+2
GPT-Image-1是(主要為影像)圖像生成與部分影像理解可接受文字 + 圖像輸入 / 輸出圖像 OpenAI+2OpenAI 平台+2
GPT-4.1 / 系列(含 mini / nano)支援多模態用於複雜任務、長上下文官方文檔指出它屬於 vision-enabled 模型系列 Microsoft Learn+2OpenAI+2
o-series reasoning models支援視覺用以多模態分析與推理Azure 文檔指出 o 系列與 GPT-4.1、GPT-4o 等皆為 vision-enabled 模型 Microsoft Learn

價格概況(文字 token 與影像 token / 輸出成本)

以下是各模型在文字與影像/多模態情境下的典型價格比較(若公開可查)。

模型文字輸入/輸出價格影像輸入 / 處理價格備註 /特殊規則
GPT-Image-1文字輸入 $5 / 1M tokens OpenAI圖像輸入 $10 / 1M image tokens;圖像輸出 $40 / 1M image tokens OpenAI
GPT-4o / GPT-4o miniGPT-4o:文字輸入 $2.50 / 1M tokens,輸出 $10 / 1M tokens 維基百科+2OpenAI 平台+2
GPT-4o mini:輸入 $0.15 / 1M,輸出 $0.60 / 1M Reuters+1
使用影像輸入時,影像會被轉換為 token 或 tiles 處理,產生額外成本。實際被收費的 token 數可能乘以放大係數(社群中有報告影像 token 被放大)OpenAI 社區+2OpenAI 社區+2
GPT-4.1 / 系列在 OpenAI 平台上標示:輸入 $2 / 1M tokens,輸出 $8 / 1M tokens OpenAI+1若有影像輸入,其 token 計費邏輯與 GPT-4o 類似(影像拆片、映射 token)
GPT-4(多模態版)傳統文字定價(取決於版本)處理影像輸入時會額外計算 token / tiles 處理成本

關鍵觀察與警示

  1. 影像 token 被放大/計算方式複雜
    使用影像輸入時,OpenAI 會將影像拆成 tiles 或塊(tile tokens),並對每塊計算輸入 token 數。這會導致影像輸入的 token 成本遠高於純文字輸入。社群中有使用者指出 GPT-4o-mini 的影像 token 被乘以大係數後計費。OpenAI 社區

  2. 價格動態調整與未公開部分
    OpenAI 不定期推出新模型(如 GPT-4.1, GPT-5)或淘汰舊模型(如 GPT-4.5),定價與支援能力會變。
    有些模型功能(特別是多模態、影像處理)在不同地域/計畫中可能受限或尚未開放。

  3. 效率 vs 成本取捨
    若任務主要是文字處理,選純文字模型(如 GPT-3.5 / GPT-4.1 的文字版本)通常成本最低。
    如果包含影像理解,必須選支援 vision 的模型,但要預估影像 token 成本可能遠高。


模型與標準定價表

模型名稱是否多模態(可處理影像/視覺輸入)輸入 token 價格(USD/1M tokens)輸出 token 價格(USD/1M tokens)備註 /來源 /不確定處
gpt-3.5-turbo約 $0.0015約 $0.0020此為舊資料推估(官方定價頁未明確列)
GPT-4 Turbo / GPT-4 (Turbo 版本含 vision preview)有(視具體版本)$10.00$10.00GPT-4 Turbo / vision Preview 定價為 $10 input + $10 output apidog
GPT-4(標準)有部分版本支援$30.00$60.00官方定價頁提及 gpt-4 輸入 $30 / 輸出 $60 apidog+1
GPT-4 32k 上下文版本同上$60.00$120.00翻倍於標準版本 apidog
gpt-4o (omni 多模態)$2.50$10.00Wikipedia 上有此價格說明 維基百科
gpt-4o mini$0.15$0.60同 Wikipedia 描述 維基百科
GPT-5多模態(假設)$1.25$10.00OpenAI “Compare models” 頁面有此定價 OpenAI 平台
GPT-5 mini / nano(可能支援)$0.25 / $0.05$2.00 / $0.40同上頁面資料 OpenAI 平台
o1-pro多模態或高能力模型$150.00$600.00TechRepublic 報導 o1-pro 的高價格 TechRepublic
GPT-4.5多模態$75.00$150.00在 Wikipedia 有此資料(不過有標示可能已退場) 維基百科

沒有留言:

張貼留言