ai-orchestration
CHAPTER 57 / 59
읽기 약 2분
FUNCTION
파인튜닝 vs RAG: 언제 무엇을
핵심 개념
지식 주입은 RAG, 행동 변경은 파인튜닝. 2026엔 prompt caching · long context · Claude 4.7 Extended Thinking까지 결합해 의사결정이 더 복잡해졌습니다.
코드 분석
의사결정 매트릭스┌────────┬─────┬─────────┐│ 목적 │ RAG │파인튜닝 │├────────┼─────┼─────────┤│최신 사실│ ★★★│ ★ ││도메인 │ ★★ │ ★★★ ││형식·톤 │ ★ │ ★★★ ││추론 │ ★ │ ★★ ││비용 │ 낮음│ 높음 ││업데이트│ 즉시│ 재학습 │└────────┴─────┴─────────┘2026 추가 옵션:- Prompt Caching: 시스템 프롬프트로 톤 잡고 캐싱→ 파인튜닝의 70%를 대체- 1M Context (Opus 4.7):짧은 RAG는 그대로 입력- Extended Thinking:추론 강화는 모델 단에서AI 프롬프트
🤖 AI에게 잘 물어보는 법 — 모델·전략별 프롬프트
무료 모델
Gemini 2.5 Flash(무료) + Claude Sonnet 4.6(무료) + Grok 4.1(무료)
'파인튜닝 vs RAG: 언제 무엇을'을 무료 도구로 익히고 싶어. Google AI Studio + Anthropic Workbench 무료 크레딧 + Dify(셀프호스팅)로 RAG vs FT 의사결정 워크시트 무료을 0원 안에 만드는 단계별 가이드를 짜줘.
소자본 모델
Claude Sonnet 4.6 + Vercel AI SDK 5 + Supabase — 월 10~30만원
'파인튜닝 vs RAG: 언제 무엇을'을 월 20만원 예산으로 실서비스에 붙이고 싶어. Claude Sonnet 4.6 + Vercel AI SDK 5 + Supabase 조합으로 Sonnet 4.6 + caching으로 RAG 대체 ROI 분석을 만드는 예제와 월 비용 분배를 짜줘.
프로덕션 모델
Claude Opus 4.7 + LangGraph + MCP + LangSmith — 월 100만원+
'파인튜닝 vs RAG: 언제 무엇을'을 production 규모로 설계해줘. LangGraph + Claude Opus 4.7 + MCP + LangSmith로 Opus 4.7 + 도메인 파인튜닝 production 사례을 월 100만원+ 예산 기준으로 그려줘.
스택 프롬프트
0원 → $200/mo → $1000/mo 단계별 스택 비교
'파인튜닝 vs RAG: 언제 무엇을' 3단계 스택 비교: Level 1($0, Dify+HF+무료 크레딧) → Level 2($200/mo, Sonnet 4.6+Vercel AI SDK+Supabase) → Level 3($1000/mo, LangGraph+Opus 4.7+MCP). 각 레벨에서 만들 수 있는 산출물과 한계 포함.
⭐ 이것만 기억하세요
파인튜닝 vs RAG: 언제 무엇을은 이 3가지만 확실히 잡으세요
1.파인튜닝과 RAG는 '둘 중 하나'가 아니라 목적별로 다른 도구입니다
2.2026 기준 prompt caching이 파인튜닝의 톤·형식 케이스 70%를 흡수해, 진짜 파인튜닝이 필요한 경우는 줄었습니다
3.다음 챕터에서 Docker + FastAPI + LangServe로 production 배포를 다룹니다
공유하기
진행도 57 / 59