황현동 블로그 개발, 인생, 유우머

260321 AI LLM API 가격 완전 비교 (2025-2026)

Tags:

260321 AI LLM API 가격 완전 비교 (2025-2026)

🗓️ 작성일: 2026-03-21 | ⏰ 기준: 2026년 3월 기준 최신 가격
📌 Google Gemini / Anthropic Claude / OpenAI GPT / Alibaba Qwen 4대 제공사 종합 비교


📋 목차

  1. 전체 요약 비교표
  2. Google Gemini 계열
  3. Anthropic Claude 계열
  4. OpenAI GPT 계열
  5. Alibaba Qwen 계열
  6. 가격대별 포지셔닝 분석
  7. 선택 가이드
  8. 참고 자료

1. 전체 요약 비교표

💡 가격 단위: USD per 1M tokens (100만 토큰당 달러)

🏆 모든 제공사 통합 비교

제공사 모델명 Input ($/1M) Output ($/1M) Context Window 무료 티어 상태
🔵 Google gemini-2.0-flash-lite $0.075 $0.30 1M ⚠️ Deprecated (26.06.01)
🔵 Google gemini-2.0-flash $0.10 $0.40 1M ⚠️ Deprecated (26.06.01)
🔵 Google gemini-1.5-flash ~$0.075 ~$0.30 1M ❌ 서비스 종료 (404)
🔵 Google gemini-1.5-pro ~$1.25 ~$5.00 2M ❌ 서비스 종료 (404)
🔵 Google gemini-2.5-flash $0.30 $2.50 1M ✅ 현재 권장
🔵 Google gemini-2.5-pro $1.25~$2.50 $10.00~$15.00 2M ✅ 현재 권장
🟠 Anthropic claude-3-haiku $0.25 $1.25 200K ⚠️ Deprecated
🟠 Anthropic claude-3.5-haiku $0.80 $4.00 200K ✅ 현재 운영
🟠 Anthropic claude-3.5-sonnet $3.00 $15.00 200K ✅ 현재 운영
🟠 Anthropic claude-3.7-sonnet $3.00 $15.00 200K ⚠️ Deprecated
🟠 Anthropic claude-3-opus $15.00 $75.00 200K ⚠️ Deprecated
🟢 OpenAI gpt-4o-mini $0.15 $0.60 128K ✅ 현재 권장
🟢 OpenAI gpt-4o $2.50 $10.00 128K ✅ 현재 운영
🟢 OpenAI gpt-4-turbo $10.00 $30.00 128K ⚠️ 구세대
🟢 OpenAI o1-mini $3.00 $12.00 128K ✅ 현재 운영
🟢 OpenAI o3-mini $1.10 $4.40 200K ✅ 현재 권장 추론모델
🔴 Alibaba qwen-turbo $0.065 $0.26 1M ⚠️ 업데이트 중단
🔴 Alibaba qwen-plus $0.40~$1.20 $1.20~$3.60 1M ✅ 현재 운영
🔴 Alibaba qwen-max $1.20~$3.00 $6.00~$15.00 1M ✅ 현재 운영
🔴 Alibaba qwen3-max (최신) $1.20~$3.00 $6.00~$15.00 252K ✅ 최신 세대

2. Google Gemini 계열

🌐 공식 가격 페이지: ai.google.dev/gemini-api/docs/pricing

📊 Gemini 모델 가격 상세

모델명 Input ($/1M) Output ($/1M) Context Window 무료 티어 비고
gemini-2.0-flash-lite $0.075 $0.30 1M tokens ✅ 있음 ⚠️ 2026.06.01 종료 예정
gemini-2.0-flash $0.10 $0.40 1M tokens ✅ 있음 ⚠️ 2026.06.01 종료 예정
gemini-1.5-flash ~$0.075 ~$0.30 1M tokens ✅ 있음 ❌ 이미 404 서비스 종료
gemini-1.5-pro $1.25 (≤128K)
$2.50 (>128K)
$5.00 (≤128K)
$10.00 (>128K)
2M tokens ❌ 없음 ❌ 이미 404 서비스 종료
gemini-2.5-flash $0.30 $2.50 1M tokens ✅ 있음 ✅ 현재 권장 Flash 모델
gemini-2.5-pro $1.25 (≤200K)
$2.50 (>200K)
$10.00 (≤200K)
$15.00 (>200K)
2M tokens ✅ 있음 ✅ 현재 최상위 모델

🔑 Gemini 주요 특징

  • 무료 티어: 대부분 모델에서 분당 요청 제한 내 무료 사용 가능 (Google AI Studio)
  • Long Context 할인: 컨텍스트 캐싱 기능으로 반복 요청 시 비용 절감
  • Batch API: 약 50% 할인 제공
  • 멀티모달: 텍스트, 이미지, 오디오, 비디오 지원 (오디오 입력은 별도 가격)
  • 2.5 Pro: 코드 생성, 복잡한 추론에 강점, 2M 토큰 컨텍스트 윈도우

⚠️ 중요 알림: Gemini 1.5 시리즈는 이미 서비스 종료되어 404 오류 반환. 신규 프로젝트는 반드시 2.5 시리즈 사용 권장.


3. Anthropic Claude 계열

🌐 공식 가격 페이지: platform.claude.com/docs/en/about-claude/pricing

📊 Claude 모델 가격 상세

모델명 Input ($/1M) Output ($/1M) Context Window 무료 티어 비고
claude-3-haiku $0.25 $1.25 200K tokens ❌ 없음 ⚠️ Deprecated
claude-3.5-haiku $0.80 $4.00 200K tokens ❌ 없음 ✅ 현재 저가형 권장
claude-3.5-sonnet $3.00 $15.00 200K tokens ❌ 없음 ✅ 현재 운영
claude-3.7-sonnet $3.00 $15.00 200K tokens ❌ 없음 ⚠️ Deprecated (3.7은 3.x 계열로 분류)
claude-3-opus $15.00 $75.00 200K tokens ❌ 없음 ⚠️ Deprecated

🆕 Claude 최신 세대 (2026 기준 현재 활성 모델)

모델명 Input ($/1M) Output ($/1M) Context Window 비고
claude-haiku-4.5 $1.00 $5.00 200K tokens 현재 경량 최신
claude-sonnet-4.5 $3.00 $15.00 200K~1M tokens 현재 중형 권장
claude-opus-4.5 $5.00 $25.00 200K tokens 현재 최상위

🔑 Claude 주요 특징

  • 무료 티어: API 없음 (신규 계정 소액 크레딧 제공)
  • Prompt Caching: Cache Hit 시 기본 가격의 10%만 과금 (최대 90% 절약)
    • 5분 캐시 쓰기: 기본가 × 1.25
    • 1시간 캐시 쓰기: 기본가 × 2.0
    • 캐시 읽기: 기본가 × 0.1
  • Batch API: 50% 할인 제공 (비동기 처리)
  • 1M 토큰 컨텍스트: Sonnet 4.5/4.6 이상에서 1M 컨텍스트 지원 (200K 초과분 추가 과금)
  • Claude 3 Opus: 현재 Deprecated되어 신규 사용 비권장

💡 참고: claude-3.7-sonnet은 Claude 3.x 마지막 세대로, 현재는 Claude Sonnet 4 계열로 전환 권장


4. OpenAI GPT 계열

🌐 공식 가격 페이지: openai.com/api/pricing

📊 GPT 모델 가격 상세

모델명 Input ($/1M) Output ($/1M) Context Window 무료 티어 비고
gpt-4o-mini $0.15 $0.60 128K tokens ❌ 없음 ✅ 저가형 범용 권장
gpt-4o $2.50 $10.00 128K tokens ❌ 없음 ✅ 현재 범용 플래그십
gpt-4-turbo $10.00 $30.00 128K tokens ❌ 없음 ⚠️ 구세대 (4.1로 대체)
o1-mini $3.00 $12.00 128K tokens ❌ 없음 ✅ 경량 추론 모델
o3-mini $1.10 $4.40 200K tokens ❌ 없음 ✅ 현재 권장 추론 모델

🆕 OpenAI 최신 세대 (2026 기준 참고)

모델명 Input ($/1M) Output ($/1M) Context Window 비고
gpt-4.1 ~$2.00 ~$8.00 1M+ tokens 2026 신규, GPT-4-Turbo 대체
o3 $2.00 $8.00 200K tokens 강화된 추론 모델
o4-mini $1.10 $4.40 200K tokens o3-mini 후속

🔑 OpenAI 주요 특징

  • 무료 티어: API 없음 (신규 계정 소액 크레딧 제공)
  • Cached Input: gpt-4o-mini 캐시 입력 $0.075/1M (50% 할인)
  • Batch API: 50% 할인 (비동기 처리)
  • 추론 모델 (o 시리즈): 복잡한 수학, 코딩, 과학 문제에 특화 — 일반 GPT보다 추론 품질 우수
  • gpt-4-turbo: 2026년 기준 사실상 구세대, GPT-4.1으로 대체 권장
  • o3-mini: 200K 컨텍스트 + 추론 특화 + 가성비 추론 모델로 현재 가장 인기

5. Alibaba Qwen 계열

🌐 공식 가격 페이지: alibabacloud.com/help/en/model-studio/model-pricing

📊 Qwen 모델 가격 상세

모델명 Input ($/1M) Output ($/1M) Context Window 무료 티어 비고
qwen-turbo $0.065 $0.26 1M tokens ✅ 있음 ⚠️ 업데이트 중단 → qwen-flash 권장
qwen-plus $0.40~$1.20 $1.20~$3.60 1M tokens ✅ 있음 ✅ 현재 운영 (중간 등급)
qwen-max $2.08 $8.32 32K tokens ✅ 있음 ✅ 현재 최고 등급
qwen-flash (신규) $0.05~$0.25 $0.40~$2.00 1M tokens ✅ 있음 ✅ qwen-turbo 대체 권장
qwen3-max (최신) $1.20~$3.00 $6.00~$15.00 252K tokens ✅ 있음 ✅ 2026 최신 최상위
qwen3.5-plus (최신) $0.40~$0.50 $2.40~$3.00 1M tokens ✅ 있음 ✅ 2026 최신 중간 등급

🔑 Qwen 주요 특징

  • 무료 티어: 대부분 모델에서 무료 쿼터 제공 (모델별 상이)
  • Batch API: 실시간 가격의 50% 할인
  • 1M 토큰 컨텍스트: qwen-plus, qwen-flash 등 대부분 모델에서 지원
  • 가격 경쟁력: USD 기준 타 제공사 대비 최저가 수준
  • 지역 제한: 국제 사용자는 싱가포르 데이터센터 경유, 중국 본토가 더 저렴
  • 환율 주의: 공식가는 CNY(위안), USD 환산 시 변동 있음
  • qwen-turbo 단종: 신규 프로젝트는 qwen-flash로 마이그레이션 권장

6. 가격대별 포지셔닝 분석

💰 가격대별 모델 분류

[초저가 < $0.5/1M input]
├── Qwen-turbo        $0.065 input
├── Qwen-flash        $0.05~$0.25 input
├── Gemini 2.0 Flash-Lite  $0.075 input
├── Gemini 2.0 Flash   $0.10 input
├── GPT-4o-mini       $0.15 input
└── Claude 3 Haiku    $0.25 input

[저가 $0.5~$2/1M input]
├── Claude 3.5 Haiku  $0.80 input
├── Gemini 2.5 Flash  $0.30 input
├── Qwen-plus         $0.40~$1.20 input
└── o3-mini           $1.10 input

[중가 $2~$5/1M input]
├── GPT-4o            $2.50 input
├── Gemini 2.5 Pro    $1.25~$2.50 input
├── Claude 3.5 Sonnet $3.00 input
├── Claude Sonnet 4.5 $3.00 input
└── o1-mini           $3.00 input

[고가 > $5/1M input]
├── Claude Opus 4.5   $5.00 input
├── Claude Haiku 4.5  $1.00 input
├── GPT-4-Turbo       $10.00 input
└── Claude 3 Opus     $15.00 input  ← 사실상 구세대

📈 Output 비용 배율 분석

대부분의 LLM은 Output이 Input보다 4~8배 비쌈:

제공사/모델 Output/Input 배율
Gemini 2.0 Flash-Lite 4x
Gemini 2.0 Flash 4x
Gemini 2.5 Pro 8x
GPT-4o-mini 4x
GPT-4o 4x
GPT-4-Turbo 3x
Claude 3 Haiku 5x
Claude Sonnet 계열 5x
Claude Opus 계열 5x
Qwen-turbo 4x
Qwen-max 4x

7. 선택 가이드

🎯 사용 목적별 추천 모델

목적 추천 모델 이유
💸 최저가 대화/분류 Qwen-flash or Gemini 2.0 Flash-Lite $0.05~$0.075/1M, 무료 티어
⚡ 고속 범용 API GPT-4o-mini or Gemini 2.5 Flash 빠른 응답, 합리적 가격
🧠 고급 추론/코딩 o3-mini or Gemini 2.5 Pro 추론 특화, 가성비 우수
📝 고품질 장문 생성 Claude Sonnet 4.5 or GPT-4o 품질 × 가격 균형 최적
🔬 최고 품질 필요 Claude Opus 4.5 or Gemini 2.5 Pro 최상위 성능
📦 대량 배치 처리 Gemini 2.5 Flash or Claude Haiku Batch 50% 할인 + 낮은 기본가
🌏 한국어/아시아어 Qwen-plus or Claude Sonnet 다국어 지원 우수

⚠️ 사용 지양 모델 (2026 기준)

모델 이유
gemini-1.5-flash 서비스 종료 (404 오류)
gemini-1.5-pro 서비스 종료 (404 오류)
gemini-2.0-flash / flash-lite 2026.06.01 종료 예정
claude-3-opus Deprecated, 극도로 비쌈
claude-3.7-sonnet Deprecated
gpt-4-turbo 구세대, 비용 대비 성능 낮음
qwen-turbo 업데이트 중단, qwen-flash로 대체

8. 참고 자료

🔗 공식 가격 페이지

🔗 리서치에 활용한 참고 URL


📝 작성 시 사용한 프롬프트

2025-2026년 기준 주요 AI LLM 모델별 API 가격을 비교해주세요. 다음 모델들을 포함해주세요:

1. Google Gemini 계열
   - gemini-2.0-flash-lite
   - gemini-2.0-flash
   - gemini-1.5-flash
   - gemini-1.5-pro
   - gemini-2.5-pro (있다면)

2. Anthropic Claude 계열
   - claude-3-haiku
   - claude-3.5-haiku
   - claude-3.5-sonnet
   - claude-3.7-sonnet (있다면)
   - claude-3-opus

3. OpenAI GPT 계열
   - gpt-4o-mini
   - gpt-4o
   - gpt-4-turbo
   - o1-mini
   - o3-mini (있다면)

4. Alibaba Qwen 계열
   - qwen-turbo
   - qwen-plus
   - qwen-max
   - qwen2.5 시리즈 (있다면)

각 모델별로:
- Input token 가격 ($/1M tokens)
- Output token 가격 ($/1M tokens)
- 무료 티어 여부
- 특징 (context window, 특이사항)

표 형태로 정리해주세요. 가장 최신 정보를 기준으로 해주세요.