멀티턴 대화 구현

핵심 개념

messages 배열로 대화 컨텍스트를 유지하는 멀티턴 패턴. 긴 대화는 요약·압축으로 토큰을 절약하고, 메모리는 LangGraph 체크포인터로 영속화합니다.

코드 분석

AI-ORCHESTRATION📋 코드 (1줄)

멀티턴 대화messages 누적:[&nbsp;&nbsp;{ role: 'system', content: '...' },&nbsp;&nbsp;{ role: 'user', content: '...' },&nbsp;&nbsp;{ role: 'assistant', content: '...' },&nbsp;&nbsp;{ role: 'user', content: '...' }]토큰 압축 전략:1. Sliding window&nbsp;&nbsp;&nbsp;최근 N턴만 유지2. Summarize&nbsp;&nbsp;&nbsp;오래된 턴을 요약으로 대체3. 1M context (Opus 4.7)&nbsp;&nbsp;&nbsp;긴 대화도 그대로영속 메모리:LangGraph checkpointer→ Postgres/Redis에 상태 저장

AI 프롬프트

🤖 AI에게 잘 물어보는 법 — 모델·전략별 프롬프트

무료 모델

Gemini 2.5 Flash(무료) + Claude Sonnet 4.6(무료) + Grok 4.1(무료)

'멀티턴 대화 구현'을 무료 도구로 익히고 싶어.
Google AI Studio + Anthropic Workbench 무료 크레딧 + Dify(셀프호스팅)로
Sliding window + 요약 전략 적용한 무료 챗봇 1개을 0원 안에 만드는 단계별 가이드를 짜줘.

소자본 모델

Claude Sonnet 4.6 + Vercel AI SDK 5 + Supabase — 월 10~30만원

'멀티턴 대화 구현'을 월 20만원 예산으로 실서비스에 붙이고 싶어.
Claude Sonnet 4.6 + Vercel AI SDK 5 + Supabase 조합으로
Supabase 영속 메모리 + Sonnet 4.6 멀티턴 챗 (월 1000 사용자)을 만드는 예제와 월 비용 분배를 짜줘.

프로덕션 모델

Claude Opus 4.7 + LangGraph + MCP + LangSmith — 월 100만원+

'멀티턴 대화 구현'을 production 규모로 설계해줘.
LangGraph + Claude Opus 4.7 + MCP + LangSmith로
LangGraph checkpointer + Opus 4.7 1M 컨텍스트 멀티턴 에이전트을 월 100만원+ 예산 기준으로 그려줘.

스택 프롬프트

0원 → $200/mo → $1000/mo 단계별 스택 비교

'멀티턴 대화 구현' 3단계 스택 비교:
Level 1($0, Dify+HF+무료 크레딧) → Level 2($200/mo, Sonnet 4.6+Vercel AI SDK+Supabase) → Level 3($1000/mo, LangGraph+Opus 4.7+MCP).
각 레벨에서 만들 수 있는 산출물과 한계 포함.

⭐ 이것만 기억하세요

멀티턴 대화 구현은 이 3가지만 확실히 잡으세요

1.messages 배열을 그대로 누적하면 100턴 만에 컨텍스트 윈도우 한계에 도달해 비용·실패율이 함께 폭증합니다

2.Sliding window + 요약 + 1M 컨텍스트(Opus 4.7) 3개 전략을 대화 길이에 따라 자동 선택하는 것이 production 표준입니다

3.다음 챕터에서 function calling으로 모델이 외부 도구를 호출하는 흐름을 익힙니다

💬 이 챕터 질문 보기

AI-ORCHESTRATION · CH.16 — 질문하거나 답변을 확인하세요

→

진행도 16 / 59

← 커리큘럼으로 ← 목록으로 (AI Orchestration)