260321 AI LLM API 가격 완전 비교 (2025-2026)

21 Mar 2026 Tags:

ai, llm, api, 가격비교

260321 AI LLM API 가격 완전 비교 (2025-2026)

🗓️ 작성일: 2026-03-21 | ⏰ 기준: 2026년 3월 기준 최신 가격
📌 Google Gemini / Anthropic Claude / OpenAI GPT / Alibaba Qwen 4대 제공사 종합 비교

📋 목차

전체 요약 비교표
Google Gemini 계열
Anthropic Claude 계열
OpenAI GPT 계열
Alibaba Qwen 계열
가격대별 포지셔닝 분석
선택 가이드
참고 자료

1. 전체 요약 비교표

💡 가격 단위: USD per 1M tokens (100만 토큰당 달러)

🏆 모든 제공사 통합 비교

제공사	모델명	Input ($/1M)	Output ($/1M)	Context Window	무료 티어	상태
🔵 Google	gemini-2.0-flash-lite	$0.075	$0.30	1M	✅	⚠️ Deprecated (26.06.01)
🔵 Google	gemini-2.0-flash	$0.10	$0.40	1M	✅	⚠️ Deprecated (26.06.01)
🔵 Google	gemini-1.5-flash	~$0.075	~$0.30	1M	✅	❌ 서비스 종료 (404)
🔵 Google	gemini-1.5-pro	~$1.25	~$5.00	2M	❌	❌ 서비스 종료 (404)
🔵 Google	gemini-2.5-flash	$0.30	$2.50	1M	✅	✅ 현재 권장
🔵 Google	gemini-2.5-pro	$1.25~$2.50	$10.00~$15.00	2M	✅	✅ 현재 권장
🟠 Anthropic	claude-3-haiku	$0.25	$1.25	200K	❌	⚠️ Deprecated
🟠 Anthropic	claude-3.5-haiku	$0.80	$4.00	200K	❌	✅ 현재 운영
🟠 Anthropic	claude-3.5-sonnet	$3.00	$15.00	200K	❌	✅ 현재 운영
🟠 Anthropic	claude-3.7-sonnet	$3.00	$15.00	200K	❌	⚠️ Deprecated
🟠 Anthropic	claude-3-opus	$15.00	$75.00	200K	❌	⚠️ Deprecated
🟢 OpenAI	gpt-4o-mini	$0.15	$0.60	128K	❌	✅ 현재 권장
🟢 OpenAI	gpt-4o	$2.50	$10.00	128K	❌	✅ 현재 운영
🟢 OpenAI	gpt-4-turbo	$10.00	$30.00	128K	❌	⚠️ 구세대
🟢 OpenAI	o1-mini	$3.00	$12.00	128K	❌	✅ 현재 운영
🟢 OpenAI	o3-mini	$1.10	$4.40	200K	❌	✅ 현재 권장 추론모델
🔴 Alibaba	qwen-turbo	$0.065	$0.26	1M	✅	⚠️ 업데이트 중단
🔴 Alibaba	qwen-plus	$0.40~$1.20	$1.20~$3.60	1M	✅	✅ 현재 운영
🔴 Alibaba	qwen-max	$1.20~$3.00	$6.00~$15.00	1M	✅	✅ 현재 운영
🔴 Alibaba	qwen3-max (최신)	$1.20~$3.00	$6.00~$15.00	252K	✅	✅ 최신 세대

2. Google Gemini 계열

🌐 공식 가격 페이지: ai.google.dev/gemini-api/docs/pricing

📊 Gemini 모델 가격 상세

모델명	Input ($/1M)	Output ($/1M)	Context Window	무료 티어	비고
gemini-2.0-flash-lite	$0.075	$0.30	1M tokens	✅ 있음	⚠️ 2026.06.01 종료 예정
gemini-2.0-flash	$0.10	$0.40	1M tokens	✅ 있음	⚠️ 2026.06.01 종료 예정
gemini-1.5-flash	~$0.075	~$0.30	1M tokens	✅ 있음	❌ 이미 404 서비스 종료
gemini-1.5-pro	$1.25 (≤128K) $2.50 (>128K)	$5.00 (≤128K) $10.00 (>128K)	2M tokens	❌ 없음	❌ 이미 404 서비스 종료
gemini-2.5-flash	$0.30	$2.50	1M tokens	✅ 있음	✅ 현재 권장 Flash 모델
gemini-2.5-pro	$1.25 (≤200K) $2.50 (>200K)	$10.00 (≤200K) $15.00 (>200K)	2M tokens	✅ 있음	✅ 현재 최상위 모델

🔑 Gemini 주요 특징

무료 티어: 대부분 모델에서 분당 요청 제한 내 무료 사용 가능 (Google AI Studio)
Long Context 할인: 컨텍스트 캐싱 기능으로 반복 요청 시 비용 절감
Batch API: 약 50% 할인 제공
멀티모달: 텍스트, 이미지, 오디오, 비디오 지원 (오디오 입력은 별도 가격)
2.5 Pro: 코드 생성, 복잡한 추론에 강점, 2M 토큰 컨텍스트 윈도우

⚠️ 중요 알림: Gemini 1.5 시리즈는 이미 서비스 종료되어 404 오류 반환. 신규 프로젝트는 반드시 2.5 시리즈 사용 권장.

3. Anthropic Claude 계열

🌐 공식 가격 페이지: platform.claude.com/docs/en/about-claude/pricing

📊 Claude 모델 가격 상세

모델명	Input ($/1M)	Output ($/1M)	Context Window	무료 티어	비고
claude-3-haiku	$0.25	$1.25	200K tokens	❌ 없음	⚠️ Deprecated
claude-3.5-haiku	$0.80	$4.00	200K tokens	❌ 없음	✅ 현재 저가형 권장
claude-3.5-sonnet	$3.00	$15.00	200K tokens	❌ 없음	✅ 현재 운영
claude-3.7-sonnet	$3.00	$15.00	200K tokens	❌ 없음	⚠️ Deprecated (3.7은 3.x 계열로 분류)
claude-3-opus	$15.00	$75.00	200K tokens	❌ 없음	⚠️ Deprecated

🆕 Claude 최신 세대 (2026 기준 현재 활성 모델)

모델명	Input ($/1M)	Output ($/1M)	Context Window	비고
claude-haiku-4.5	$1.00	$5.00	200K tokens	현재 경량 최신
claude-sonnet-4.5	$3.00	$15.00	200K~1M tokens	현재 중형 권장
claude-opus-4.5	$5.00	$25.00	200K tokens	현재 최상위

🔑 Claude 주요 특징

무료 티어: API 없음 (신규 계정 소액 크레딧 제공)
Prompt Caching: Cache Hit 시 기본 가격의 10%만 과금 (최대 90% 절약)
- 5분 캐시 쓰기: 기본가 × 1.25
- 1시간 캐시 쓰기: 기본가 × 2.0
- 캐시 읽기: 기본가 × 0.1
Batch API: 50% 할인 제공 (비동기 처리)
1M 토큰 컨텍스트: Sonnet 4.5/4.6 이상에서 1M 컨텍스트 지원 (200K 초과분 추가 과금)
Claude 3 Opus: 현재 Deprecated되어 신규 사용 비권장

💡 참고: claude-3.7-sonnet은 Claude 3.x 마지막 세대로, 현재는 Claude Sonnet 4 계열로 전환 권장

4. OpenAI GPT 계열

🌐 공식 가격 페이지: openai.com/api/pricing

📊 GPT 모델 가격 상세

모델명	Input ($/1M)	Output ($/1M)	Context Window	무료 티어	비고
gpt-4o-mini	$0.15	$0.60	128K tokens	❌ 없음	✅ 저가형 범용 권장
gpt-4o	$2.50	$10.00	128K tokens	❌ 없음	✅ 현재 범용 플래그십
gpt-4-turbo	$10.00	$30.00	128K tokens	❌ 없음	⚠️ 구세대 (4.1로 대체)
o1-mini	$3.00	$12.00	128K tokens	❌ 없음	✅ 경량 추론 모델
o3-mini	$1.10	$4.40	200K tokens	❌ 없음	✅ 현재 권장 추론 모델

🆕 OpenAI 최신 세대 (2026 기준 참고)

모델명	Input ($/1M)	Output ($/1M)	Context Window	비고
gpt-4.1	~$2.00	~$8.00	1M+ tokens	2026 신규, GPT-4-Turbo 대체
o3	$2.00	$8.00	200K tokens	강화된 추론 모델
o4-mini	$1.10	$4.40	200K tokens	o3-mini 후속

🔑 OpenAI 주요 특징

무료 티어: API 없음 (신규 계정 소액 크레딧 제공)
Cached Input: gpt-4o-mini 캐시 입력 $0.075/1M (50% 할인)
Batch API: 50% 할인 (비동기 처리)
추론 모델 (o 시리즈): 복잡한 수학, 코딩, 과학 문제에 특화 — 일반 GPT보다 추론 품질 우수
gpt-4-turbo: 2026년 기준 사실상 구세대, GPT-4.1으로 대체 권장
o3-mini: 200K 컨텍스트 + 추론 특화 + 가성비 추론 모델로 현재 가장 인기

5. Alibaba Qwen 계열

🌐 공식 가격 페이지: alibabacloud.com/help/en/model-studio/model-pricing

📊 Qwen 모델 가격 상세

모델명	Input ($/1M)	Output ($/1M)	Context Window	무료 티어	비고
qwen-turbo	$0.065	$0.26	1M tokens	✅ 있음	⚠️ 업데이트 중단 → qwen-flash 권장
qwen-plus	$0.40~$1.20	$1.20~$3.60	1M tokens	✅ 있음	✅ 현재 운영 (중간 등급)
qwen-max	$2.08	$8.32	32K tokens	✅ 있음	✅ 현재 최고 등급
qwen-flash (신규)	$0.05~$0.25	$0.40~$2.00	1M tokens	✅ 있음	✅ qwen-turbo 대체 권장
qwen3-max (최신)	$1.20~$3.00	$6.00~$15.00	252K tokens	✅ 있음	✅ 2026 최신 최상위
qwen3.5-plus (최신)	$0.40~$0.50	$2.40~$3.00	1M tokens	✅ 있음	✅ 2026 최신 중간 등급

🔑 Qwen 주요 특징

무료 티어: 대부분 모델에서 무료 쿼터 제공 (모델별 상이)
Batch API: 실시간 가격의 50% 할인
1M 토큰 컨텍스트: qwen-plus, qwen-flash 등 대부분 모델에서 지원
가격 경쟁력: USD 기준 타 제공사 대비 최저가 수준
지역 제한: 국제 사용자는 싱가포르 데이터센터 경유, 중국 본토가 더 저렴
환율 주의: 공식가는 CNY(위안), USD 환산 시 변동 있음
qwen-turbo 단종: 신규 프로젝트는 qwen-flash로 마이그레이션 권장

6. 가격대별 포지셔닝 분석

💰 가격대별 모델 분류

[초저가 < $0.5/1M input]
├── Qwen-turbo        $0.065 input
├── Qwen-flash        $0.05~$0.25 input
├── Gemini 2.0 Flash-Lite  $0.075 input
├── Gemini 2.0 Flash   $0.10 input
├── GPT-4o-mini       $0.15 input
└── Claude 3 Haiku    $0.25 input

[저가 $0.5~$2/1M input]
├── Claude 3.5 Haiku  $0.80 input
├── Gemini 2.5 Flash  $0.30 input
├── Qwen-plus         $0.40~$1.20 input
└── o3-mini           $1.10 input

[중가 $2~$5/1M input]
├── GPT-4o            $2.50 input
├── Gemini 2.5 Pro    $1.25~$2.50 input
├── Claude 3.5 Sonnet $3.00 input
├── Claude Sonnet 4.5 $3.00 input
└── o1-mini           $3.00 input

[고가 > $5/1M input]
├── Claude Opus 4.5   $5.00 input
├── Claude Haiku 4.5  $1.00 input
├── GPT-4-Turbo       $10.00 input
└── Claude 3 Opus     $15.00 input  ← 사실상 구세대

📈 Output 비용 배율 분석

대부분의 LLM은 Output이 Input보다 4~8배 비쌈:

제공사/모델	Output/Input 배율
Gemini 2.0 Flash-Lite	4x
Gemini 2.0 Flash	4x
Gemini 2.5 Pro	8x
GPT-4o-mini	4x
GPT-4o	4x
GPT-4-Turbo	3x
Claude 3 Haiku	5x
Claude Sonnet 계열	5x
Claude Opus 계열	5x
Qwen-turbo	4x
Qwen-max	4x

7. 선택 가이드

🎯 사용 목적별 추천 모델

목적	추천 모델	이유
💸 최저가 대화/분류	Qwen-flash or Gemini 2.0 Flash-Lite	$0.05~$0.075/1M, 무료 티어
⚡ 고속 범용 API	GPT-4o-mini or Gemini 2.5 Flash	빠른 응답, 합리적 가격
🧠 고급 추론/코딩	o3-mini or Gemini 2.5 Pro	추론 특화, 가성비 우수
📝 고품질 장문 생성	Claude Sonnet 4.5 or GPT-4o	품질 × 가격 균형 최적
🔬 최고 품질 필요	Claude Opus 4.5 or Gemini 2.5 Pro	최상위 성능
📦 대량 배치 처리	Gemini 2.5 Flash or Claude Haiku	Batch 50% 할인 + 낮은 기본가
🌏 한국어/아시아어	Qwen-plus or Claude Sonnet	다국어 지원 우수

⚠️ 사용 지양 모델 (2026 기준)

모델	이유
gemini-1.5-flash	서비스 종료 (404 오류)
gemini-1.5-pro	서비스 종료 (404 오류)
gemini-2.0-flash / flash-lite	2026.06.01 종료 예정
claude-3-opus	Deprecated, 극도로 비쌈
claude-3.7-sonnet	Deprecated
gpt-4-turbo	구세대, 비용 대비 성능 낮음
qwen-turbo	업데이트 중단, qwen-flash로 대체

8. 참고 자료

🔗 공식 가격 페이지

🔵 Google Gemini: ai.google.dev/gemini-api/docs/pricing
🟠 Anthropic Claude: platform.claude.com/docs/en/about-claude/pricing
🟢 OpenAI GPT: openai.com/api/pricing
🔴 Alibaba Qwen: alibabacloud.com/help/en/model-studio/model-pricing

🔗 리서치에 활용한 참고 URL

📝 작성 시 사용한 프롬프트

2025-2026년 기준 주요 AI LLM 모델별 API 가격을 비교해주세요. 다음 모델들을 포함해주세요:

1. Google Gemini 계열
   - gemini-2.0-flash-lite
   - gemini-2.0-flash
   - gemini-1.5-flash
   - gemini-1.5-pro
   - gemini-2.5-pro (있다면)

2. Anthropic Claude 계열
   - claude-3-haiku
   - claude-3.5-haiku
   - claude-3.5-sonnet
   - claude-3.7-sonnet (있다면)
   - claude-3-opus

3. OpenAI GPT 계열
   - gpt-4o-mini
   - gpt-4o
   - gpt-4-turbo
   - o1-mini
   - o3-mini (있다면)

4. Alibaba Qwen 계열
   - qwen-turbo
   - qwen-plus
   - qwen-max
   - qwen2.5 시리즈 (있다면)

각 모델별로:
- Input token 가격 ($/1M tokens)
- Output token 가격 ($/1M tokens)
- 무료 티어 여부
- 특징 (context window, 특이사항)

표 형태로 정리해주세요. 가장 최신 정보를 기준으로 해주세요.

황현동 블로그 개발, 인생, 유우머

260321 AI LLM API 가격 완전 비교 (2025-2026)

260321 AI LLM API 가격 완전 비교 (2025-2026)

📋 목차

1. 전체 요약 비교표

🏆 모든 제공사 통합 비교

2. Google Gemini 계열

📊 Gemini 모델 가격 상세

🔑 Gemini 주요 특징

3. Anthropic Claude 계열

📊 Claude 모델 가격 상세

🆕 Claude 최신 세대 (2026 기준 현재 활성 모델)

🔑 Claude 주요 특징

4. OpenAI GPT 계열

📊 GPT 모델 가격 상세

🆕 OpenAI 최신 세대 (2026 기준 참고)

🔑 OpenAI 주요 특징

5. Alibaba Qwen 계열

📊 Qwen 모델 가격 상세

🔑 Qwen 주요 특징

6. 가격대별 포지셔닝 분석

💰 가격대별 모델 분류

📈 Output 비용 배율 분석

7. 선택 가이드

🎯 사용 목적별 추천 모델

⚠️ 사용 지양 모델 (2026 기준)

8. 참고 자료

🔗 공식 가격 페이지

🔗 리서치에 활용한 참고 URL

📝 작성 시 사용한 프롬프트

Related Posts

11 Apr 2026

260408 미국주식 데이터API 서비스비교 08 Apr 2026

260404 QMD Firestore PydanticAI 가이드 04 Apr 2026