260319 AI API 가격 비교 (2026년 3월 기준)

19 Mar 2026 Tags:

AI API 가격 비교 (2026년 3월 기준)

각 회사별 주요 LLM API 모델의 토큰 단가 비교. Claude, OpenAI, Gemini, Grok, Qwen 5개사를 중심으로 정리.

1. Claude (Anthropic)

모델	입력 ($/1M 토큰)	출력 ($/1M 토큰)	캐시 쓰기	캐시 읽기
Opus 4.6	$5.00	$25.00	$6.25	$0.50
Sonnet 4.6	$3.00	$15.00	$3.75	$0.30
Haiku 4.5	$1.00	$5.00	$1.25	$0.10
Opus 4.1 (레거시)	$15.00	$75.00	$18.75	$1.50
Sonnet 4 (레거시)	$3.00	$15.00	$3.75	$0.30
Haiku 3 (레거시)	$0.25	$1.25	$0.30	$0.03

Batch 처리 시 50% 할인
출처: https://claude.com/pricing#api

2. OpenAI

주력 모델 (Flagship)

모델	입력	캐시 입력	출력
gpt-5.4	$2.50	$0.25	$15.00
gpt-5.4-mini	$0.75	$0.075	$4.50
gpt-5.4-nano	$0.20	$0.02	$1.25
gpt-5.4-pro	$30.00	—	$180.00

파인튜닝 가능 모델

모델	입력	출력
gpt-4.1	$3.00	$12.00
gpt-4.1-mini	$0.80	$3.20
gpt-4.1-nano	$0.20	$0.80
gpt-4o (레거시)	$3.75	$15.00
gpt-4o-mini (레거시)	$0.30	$1.20

추론 / 전문 모델

모델	입력	출력
o4-mini (deep research)	$2.00	$8.00
o3 (deep research)	$10.00	$40.00

Batch / Flex 처리 시 50% 할인
출처: https://platform.openai.com/docs/pricing

3. Gemini (Google Cloud)

Gemini 2.5 (Standard)

모델	입력 (≤200K)	출력	비고
Gemini 2.5 Pro	$1.25	$10.00	>200K: 입력 $2.50, 출력 $15
Gemini 2.5 Flash	$0.30	$2.50	—
Gemini 2.5 Flash Lite	$0.10	$0.40	—

Gemini 2.0

모델	입력	출력
Gemini 2.0 Flash	$0.15	$0.60
Gemini 2.0 Flash Lite	$0.075	$0.30

Gemini 3 (최신 Preview)

모델	입력 (≤200K)	출력
Gemini 3.1 Pro Preview	$2.00	$12.00
Gemini 3 Flash Preview	$0.50	$3.00
Gemini 3.1 Flash-Lite Preview	$0.25	$1.50

Batch / Flex 처리 시 ~50% 할인
출처: https://cloud.google.com/vertex-ai/generative-ai/pricing

4. Grok (xAI)

모델	입력	캐시 입력	출력
grok-4	$3.00	$0.75	$15.00
grok-4-fast	$0.20	$0.05	$0.50
grok-4-1-fast	$0.20	$0.05	$0.50
grok-4.20-beta	$2.00	$0.20	$6.00
grok-3	$3.00	$0.75	$15.00
grok-3-mini	$0.30	$0.07	$0.50
grok-code-fast-1	$0.20	$0.02	$1.50

Batch 처리 시 50% 할인
출처: https://docs.x.ai/docs/models

5. Qwen (Alibaba — OpenRouter 경유)

모델	입력	출력	아키텍처
Qwen3-235B-A22B	$0.455	$1.82	MoE 235B / 22B active
Qwen3 Coder 480B-A35B	$0.22	$1.00	MoE 480B / 35B active
Qwen3-32B	$0.08	$0.24	Dense 32B
Qwen3-30B-A3B	$0.08	$0.28	MoE 30B / 3B active
Qwen3-8B	$0.05	$0.40	Dense 8B

Alibaba Cloud DashScope 직접 사용 시 더 저렴할 수 있음
출처: https://openrouter.ai (OpenRouter 경유)

한눈에 비교: 가성비 순위

입력 토큰 ($/1M 기준)

순위	모델	입력
1	Qwen3-8B	$0.05
2	Qwen3-32B / 30B	$0.08
3	Gemini 2.0 Flash Lite	$0.075
4	Gemini 2.0 Flash	$0.15
5	grok-4-fast / 4.20-beta	$0.20
6	gpt-5.4-nano	$0.20
7	Gemini 2.5 Flash Lite	$0.10
8	Claude Haiku 3	$0.25
9	Gemini 2.5 Flash	$0.30
10	Gemini 3.1 Flash-Lite	$0.25

출력 토큰 ($/1M 기준)

순위	모델	출력
1	Qwen3-32B	$0.24
2	Qwen3-30B-A3B	$0.28
3	Gemini 2.0 Flash Lite	$0.30
4	Claude Haiku 3	$1.25
5	grok-4-fast	$0.50
6	Qwen3-8B	$0.40
7	Gemini 2.5 Flash Lite	$0.40
8	Gemini 2.0 Flash	$0.60
9	Gemini 2.5 Flash	$2.50
10	Claude Haiku 4.5	$5.00

종합 요약

구분	추천 모델
최고 성능	gpt-5.4-pro, grok-4, Claude Opus 4.6
가성비 최적	Gemini 2.5 Flash Lite, grok-4-fast
오픈소스 무료	Qwen3 시리즈 (로컬 배포 가능)
저렴한 입력	Qwen3-8B ($0.05/M), Gemini 2.0 Flash Lite ($0.075/M)
저렴한 출력	Qwen3-32B ($0.24/M), Gemini 2.0 Flash Lite ($0.30/M)

출처

Anthropic API Pricing: https://claude.com/pricing#api
OpenAI API Pricing: https://platform.openai.com/docs/pricing
Google Cloud Vertex AI Pricing: https://cloud.google.com/vertex-ai/generative-ai/pricing
xAI Grok API Models: https://docs.x.ai/docs/models
Qwen via OpenRouter: https://openrouter.ai

프롬프트

api 를 사용할때 가격 비교 요청
각회사별 세부 모델도 가격 비교

claude
openai
gemini
grok
qwen

황현동 블로그 개발, 인생, 유우머

260319 AI API 가격 비교 (2026년 3월 기준)

AI API 가격 비교 (2026년 3월 기준)

1. Claude (Anthropic)

2. OpenAI

주력 모델 (Flagship)

파인튜닝 가능 모델

추론 / 전문 모델

3. Gemini (Google Cloud)

Gemini 2.5 (Standard)

Gemini 2.0

Gemini 3 (최신 Preview)

4. Grok (xAI)

5. Qwen (Alibaba — OpenRouter 경유)

한눈에 비교: 가성비 순위

입력 토큰 ($/1M 기준)

출력 토큰 ($/1M 기준)

종합 요약

출처

프롬프트

Related Posts

11 Apr 2026

260408 미국주식 데이터API 서비스비교 08 Apr 2026

260404 QMD Firestore PydanticAI 가이드 04 Apr 2026