260321 AI LLM API 가격 완전 비교 (2025-2026)
21 Mar 2026
260321 AI LLM API 가격 완전 비교 (2025-2026)
🗓️ 작성일: 2026-03-21 | ⏰ 기준: 2026년 3월 기준 최신 가격
📌 Google Gemini / Anthropic Claude / OpenAI GPT / Alibaba Qwen 4대 제공사 종합 비교
📋 목차
- 전체 요약 비교표
- Google Gemini 계열
- Anthropic Claude 계열
- OpenAI GPT 계열
- Alibaba Qwen 계열
- 가격대별 포지셔닝 분석
- 선택 가이드
- 참고 자료
1. 전체 요약 비교표
💡 가격 단위: USD per 1M tokens (100만 토큰당 달러)
🏆 모든 제공사 통합 비교
| 제공사 | 모델명 | Input ($/1M) | Output ($/1M) | Context Window | 무료 티어 | 상태 |
|---|---|---|---|---|---|---|
| gemini-2.0-flash-lite | $0.075 | $0.30 | 1M | ✅ | ⚠️ Deprecated (26.06.01) | |
| gemini-2.0-flash | $0.10 | $0.40 | 1M | ✅ | ⚠️ Deprecated (26.06.01) | |
| gemini-1.5-flash | ~$0.075 | ~$0.30 | 1M | ✅ | ❌ 서비스 종료 (404) | |
| gemini-1.5-pro | ~$1.25 | ~$5.00 | 2M | ❌ | ❌ 서비스 종료 (404) | |
| gemini-2.5-flash | $0.30 | $2.50 | 1M | ✅ | ✅ 현재 권장 | |
| gemini-2.5-pro | $1.25~$2.50 | $10.00~$15.00 | 2M | ✅ | ✅ 현재 권장 | |
| 🟠 Anthropic | claude-3-haiku | $0.25 | $1.25 | 200K | ❌ | ⚠️ Deprecated |
| 🟠 Anthropic | claude-3.5-haiku | $0.80 | $4.00 | 200K | ❌ | ✅ 현재 운영 |
| 🟠 Anthropic | claude-3.5-sonnet | $3.00 | $15.00 | 200K | ❌ | ✅ 현재 운영 |
| 🟠 Anthropic | claude-3.7-sonnet | $3.00 | $15.00 | 200K | ❌ | ⚠️ Deprecated |
| 🟠 Anthropic | claude-3-opus | $15.00 | $75.00 | 200K | ❌ | ⚠️ Deprecated |
| 🟢 OpenAI | gpt-4o-mini | $0.15 | $0.60 | 128K | ❌ | ✅ 현재 권장 |
| 🟢 OpenAI | gpt-4o | $2.50 | $10.00 | 128K | ❌ | ✅ 현재 운영 |
| 🟢 OpenAI | gpt-4-turbo | $10.00 | $30.00 | 128K | ❌ | ⚠️ 구세대 |
| 🟢 OpenAI | o1-mini | $3.00 | $12.00 | 128K | ❌ | ✅ 현재 운영 |
| 🟢 OpenAI | o3-mini | $1.10 | $4.40 | 200K | ❌ | ✅ 현재 권장 추론모델 |
| 🔴 Alibaba | qwen-turbo | $0.065 | $0.26 | 1M | ✅ | ⚠️ 업데이트 중단 |
| 🔴 Alibaba | qwen-plus | $0.40~$1.20 | $1.20~$3.60 | 1M | ✅ | ✅ 현재 운영 |
| 🔴 Alibaba | qwen-max | $1.20~$3.00 | $6.00~$15.00 | 1M | ✅ | ✅ 현재 운영 |
| 🔴 Alibaba | qwen3-max (최신) | $1.20~$3.00 | $6.00~$15.00 | 252K | ✅ | ✅ 최신 세대 |
2. Google Gemini 계열
🌐 공식 가격 페이지: ai.google.dev/gemini-api/docs/pricing
📊 Gemini 모델 가격 상세
| 모델명 | Input ($/1M) | Output ($/1M) | Context Window | 무료 티어 | 비고 |
|---|---|---|---|---|---|
| gemini-2.0-flash-lite | $0.075 | $0.30 | 1M tokens | ✅ 있음 | ⚠️ 2026.06.01 종료 예정 |
| gemini-2.0-flash | $0.10 | $0.40 | 1M tokens | ✅ 있음 | ⚠️ 2026.06.01 종료 예정 |
| gemini-1.5-flash | ~$0.075 | ~$0.30 | 1M tokens | ✅ 있음 | ❌ 이미 404 서비스 종료 |
| gemini-1.5-pro | $1.25 (≤128K) $2.50 (>128K) |
$5.00 (≤128K) $10.00 (>128K) |
2M tokens | ❌ 없음 | ❌ 이미 404 서비스 종료 |
| gemini-2.5-flash | $0.30 | $2.50 | 1M tokens | ✅ 있음 | ✅ 현재 권장 Flash 모델 |
| gemini-2.5-pro | $1.25 (≤200K) $2.50 (>200K) |
$10.00 (≤200K) $15.00 (>200K) |
2M tokens | ✅ 있음 | ✅ 현재 최상위 모델 |
🔑 Gemini 주요 특징
- 무료 티어: 대부분 모델에서 분당 요청 제한 내 무료 사용 가능 (Google AI Studio)
- Long Context 할인: 컨텍스트 캐싱 기능으로 반복 요청 시 비용 절감
- Batch API: 약 50% 할인 제공
- 멀티모달: 텍스트, 이미지, 오디오, 비디오 지원 (오디오 입력은 별도 가격)
- 2.5 Pro: 코드 생성, 복잡한 추론에 강점, 2M 토큰 컨텍스트 윈도우
⚠️ 중요 알림: Gemini 1.5 시리즈는 이미 서비스 종료되어 404 오류 반환. 신규 프로젝트는 반드시 2.5 시리즈 사용 권장.
3. Anthropic Claude 계열
🌐 공식 가격 페이지: platform.claude.com/docs/en/about-claude/pricing
📊 Claude 모델 가격 상세
| 모델명 | Input ($/1M) | Output ($/1M) | Context Window | 무료 티어 | 비고 |
|---|---|---|---|---|---|
| claude-3-haiku | $0.25 | $1.25 | 200K tokens | ❌ 없음 | ⚠️ Deprecated |
| claude-3.5-haiku | $0.80 | $4.00 | 200K tokens | ❌ 없음 | ✅ 현재 저가형 권장 |
| claude-3.5-sonnet | $3.00 | $15.00 | 200K tokens | ❌ 없음 | ✅ 현재 운영 |
| claude-3.7-sonnet | $3.00 | $15.00 | 200K tokens | ❌ 없음 | ⚠️ Deprecated (3.7은 3.x 계열로 분류) |
| claude-3-opus | $15.00 | $75.00 | 200K tokens | ❌ 없음 | ⚠️ Deprecated |
🆕 Claude 최신 세대 (2026 기준 현재 활성 모델)
| 모델명 | Input ($/1M) | Output ($/1M) | Context Window | 비고 |
|---|---|---|---|---|
| claude-haiku-4.5 | $1.00 | $5.00 | 200K tokens | 현재 경량 최신 |
| claude-sonnet-4.5 | $3.00 | $15.00 | 200K~1M tokens | 현재 중형 권장 |
| claude-opus-4.5 | $5.00 | $25.00 | 200K tokens | 현재 최상위 |
🔑 Claude 주요 특징
- 무료 티어: API 없음 (신규 계정 소액 크레딧 제공)
- Prompt Caching: Cache Hit 시 기본 가격의 10%만 과금 (최대 90% 절약)
- 5분 캐시 쓰기: 기본가 × 1.25
- 1시간 캐시 쓰기: 기본가 × 2.0
- 캐시 읽기: 기본가 × 0.1
- Batch API: 50% 할인 제공 (비동기 처리)
- 1M 토큰 컨텍스트: Sonnet 4.5/4.6 이상에서 1M 컨텍스트 지원 (200K 초과분 추가 과금)
- Claude 3 Opus: 현재 Deprecated되어 신규 사용 비권장
💡 참고: claude-3.7-sonnet은 Claude 3.x 마지막 세대로, 현재는 Claude Sonnet 4 계열로 전환 권장
4. OpenAI GPT 계열
🌐 공식 가격 페이지: openai.com/api/pricing
📊 GPT 모델 가격 상세
| 모델명 | Input ($/1M) | Output ($/1M) | Context Window | 무료 티어 | 비고 |
|---|---|---|---|---|---|
| gpt-4o-mini | $0.15 | $0.60 | 128K tokens | ❌ 없음 | ✅ 저가형 범용 권장 |
| gpt-4o | $2.50 | $10.00 | 128K tokens | ❌ 없음 | ✅ 현재 범용 플래그십 |
| gpt-4-turbo | $10.00 | $30.00 | 128K tokens | ❌ 없음 | ⚠️ 구세대 (4.1로 대체) |
| o1-mini | $3.00 | $12.00 | 128K tokens | ❌ 없음 | ✅ 경량 추론 모델 |
| o3-mini | $1.10 | $4.40 | 200K tokens | ❌ 없음 | ✅ 현재 권장 추론 모델 |
🆕 OpenAI 최신 세대 (2026 기준 참고)
| 모델명 | Input ($/1M) | Output ($/1M) | Context Window | 비고 |
|---|---|---|---|---|
| gpt-4.1 | ~$2.00 | ~$8.00 | 1M+ tokens | 2026 신규, GPT-4-Turbo 대체 |
| o3 | $2.00 | $8.00 | 200K tokens | 강화된 추론 모델 |
| o4-mini | $1.10 | $4.40 | 200K tokens | o3-mini 후속 |
🔑 OpenAI 주요 특징
- 무료 티어: API 없음 (신규 계정 소액 크레딧 제공)
- Cached Input: gpt-4o-mini 캐시 입력 $0.075/1M (50% 할인)
- Batch API: 50% 할인 (비동기 처리)
- 추론 모델 (o 시리즈): 복잡한 수학, 코딩, 과학 문제에 특화 — 일반 GPT보다 추론 품질 우수
- gpt-4-turbo: 2026년 기준 사실상 구세대, GPT-4.1으로 대체 권장
- o3-mini: 200K 컨텍스트 + 추론 특화 + 가성비 추론 모델로 현재 가장 인기
5. Alibaba Qwen 계열
🌐 공식 가격 페이지: alibabacloud.com/help/en/model-studio/model-pricing
📊 Qwen 모델 가격 상세
| 모델명 | Input ($/1M) | Output ($/1M) | Context Window | 무료 티어 | 비고 |
|---|---|---|---|---|---|
| qwen-turbo | $0.065 | $0.26 | 1M tokens | ✅ 있음 | ⚠️ 업데이트 중단 → qwen-flash 권장 |
| qwen-plus | $0.40~$1.20 | $1.20~$3.60 | 1M tokens | ✅ 있음 | ✅ 현재 운영 (중간 등급) |
| qwen-max | $2.08 | $8.32 | 32K tokens | ✅ 있음 | ✅ 현재 최고 등급 |
| qwen-flash (신규) | $0.05~$0.25 | $0.40~$2.00 | 1M tokens | ✅ 있음 | ✅ qwen-turbo 대체 권장 |
| qwen3-max (최신) | $1.20~$3.00 | $6.00~$15.00 | 252K tokens | ✅ 있음 | ✅ 2026 최신 최상위 |
| qwen3.5-plus (최신) | $0.40~$0.50 | $2.40~$3.00 | 1M tokens | ✅ 있음 | ✅ 2026 최신 중간 등급 |
🔑 Qwen 주요 특징
- 무료 티어: 대부분 모델에서 무료 쿼터 제공 (모델별 상이)
- Batch API: 실시간 가격의 50% 할인
- 1M 토큰 컨텍스트: qwen-plus, qwen-flash 등 대부분 모델에서 지원
- 가격 경쟁력: USD 기준 타 제공사 대비 최저가 수준
- 지역 제한: 국제 사용자는 싱가포르 데이터센터 경유, 중국 본토가 더 저렴
- 환율 주의: 공식가는 CNY(위안), USD 환산 시 변동 있음
- qwen-turbo 단종: 신규 프로젝트는 qwen-flash로 마이그레이션 권장
6. 가격대별 포지셔닝 분석
💰 가격대별 모델 분류
[초저가 < $0.5/1M input]
├── Qwen-turbo $0.065 input
├── Qwen-flash $0.05~$0.25 input
├── Gemini 2.0 Flash-Lite $0.075 input
├── Gemini 2.0 Flash $0.10 input
├── GPT-4o-mini $0.15 input
└── Claude 3 Haiku $0.25 input
[저가 $0.5~$2/1M input]
├── Claude 3.5 Haiku $0.80 input
├── Gemini 2.5 Flash $0.30 input
├── Qwen-plus $0.40~$1.20 input
└── o3-mini $1.10 input
[중가 $2~$5/1M input]
├── GPT-4o $2.50 input
├── Gemini 2.5 Pro $1.25~$2.50 input
├── Claude 3.5 Sonnet $3.00 input
├── Claude Sonnet 4.5 $3.00 input
└── o1-mini $3.00 input
[고가 > $5/1M input]
├── Claude Opus 4.5 $5.00 input
├── Claude Haiku 4.5 $1.00 input
├── GPT-4-Turbo $10.00 input
└── Claude 3 Opus $15.00 input ← 사실상 구세대
📈 Output 비용 배율 분석
대부분의 LLM은 Output이 Input보다 4~8배 비쌈:
| 제공사/모델 | Output/Input 배율 |
|---|---|
| Gemini 2.0 Flash-Lite | 4x |
| Gemini 2.0 Flash | 4x |
| Gemini 2.5 Pro | 8x |
| GPT-4o-mini | 4x |
| GPT-4o | 4x |
| GPT-4-Turbo | 3x |
| Claude 3 Haiku | 5x |
| Claude Sonnet 계열 | 5x |
| Claude Opus 계열 | 5x |
| Qwen-turbo | 4x |
| Qwen-max | 4x |
7. 선택 가이드
🎯 사용 목적별 추천 모델
| 목적 | 추천 모델 | 이유 |
|---|---|---|
| 💸 최저가 대화/분류 | Qwen-flash or Gemini 2.0 Flash-Lite | $0.05~$0.075/1M, 무료 티어 |
| ⚡ 고속 범용 API | GPT-4o-mini or Gemini 2.5 Flash | 빠른 응답, 합리적 가격 |
| 🧠 고급 추론/코딩 | o3-mini or Gemini 2.5 Pro | 추론 특화, 가성비 우수 |
| 📝 고품질 장문 생성 | Claude Sonnet 4.5 or GPT-4o | 품질 × 가격 균형 최적 |
| 🔬 최고 품질 필요 | Claude Opus 4.5 or Gemini 2.5 Pro | 최상위 성능 |
| 📦 대량 배치 처리 | Gemini 2.5 Flash or Claude Haiku | Batch 50% 할인 + 낮은 기본가 |
| 🌏 한국어/아시아어 | Qwen-plus or Claude Sonnet | 다국어 지원 우수 |
⚠️ 사용 지양 모델 (2026 기준)
| 모델 | 이유 |
|---|---|
| gemini-1.5-flash | 서비스 종료 (404 오류) |
| gemini-1.5-pro | 서비스 종료 (404 오류) |
| gemini-2.0-flash / flash-lite | 2026.06.01 종료 예정 |
| claude-3-opus | Deprecated, 극도로 비쌈 |
| claude-3.7-sonnet | Deprecated |
| gpt-4-turbo | 구세대, 비용 대비 성능 낮음 |
| qwen-turbo | 업데이트 중단, qwen-flash로 대체 |
8. 참고 자료
🔗 공식 가격 페이지
- 🔵 Google Gemini: ai.google.dev/gemini-api/docs/pricing
- 🟠 Anthropic Claude: platform.claude.com/docs/en/about-claude/pricing
- 🟢 OpenAI GPT: openai.com/api/pricing
- 🔴 Alibaba Qwen: alibabacloud.com/help/en/model-studio/model-pricing
🔗 리서치에 활용한 참고 URL
- Gemini API Pricing (March 2026) — TLDL
- Google Gemini API Pricing 2026 — MetaCTO
- Gemini API Pricing 2026 — AI Free API
- Gemini 2.0 Flash API Pricing 2026 — PricePerToken
- Anthropic API Pricing 2026 — MetaCTO
- Claude API Pricing 2026 — CostGoat
- Anthropic API Pricing 2026 — PE Collective
- OpenAI API Pricing (Updated 2026) — PricePerToken
- GPT 4o mini API Pricing 2026 — PricePerToken
- o3 Mini API Pricing 2026 — PricePerToken
- OpenAI API Pricing Guide 2026 — Curlscape
- Qwen API Pricing Guide 2026 — DeepInfra
- Alibaba Cloud Model Studio Pricing
- Qwen Pricing 2025 Guide — Eesel AI
- LLM API Pricing Comparison (2025) — IntuitionLabs
📝 작성 시 사용한 프롬프트
2025-2026년 기준 주요 AI LLM 모델별 API 가격을 비교해주세요. 다음 모델들을 포함해주세요:
1. Google Gemini 계열
- gemini-2.0-flash-lite
- gemini-2.0-flash
- gemini-1.5-flash
- gemini-1.5-pro
- gemini-2.5-pro (있다면)
2. Anthropic Claude 계열
- claude-3-haiku
- claude-3.5-haiku
- claude-3.5-sonnet
- claude-3.7-sonnet (있다면)
- claude-3-opus
3. OpenAI GPT 계열
- gpt-4o-mini
- gpt-4o
- gpt-4-turbo
- o1-mini
- o3-mini (있다면)
4. Alibaba Qwen 계열
- qwen-turbo
- qwen-plus
- qwen-max
- qwen2.5 시리즈 (있다면)
각 모델별로:
- Input token 가격 ($/1M tokens)
- Output token 가격 ($/1M tokens)
- 무료 티어 여부
- 특징 (context window, 특이사항)
표 형태로 정리해주세요. 가장 최신 정보를 기준으로 해주세요.