본문 바로가기
Analysis

RAG vs Agentic RAG

by Pebble`s 2025. 12. 12.
RAG vs Agentic RAG - 아키텍처 비교
AI Architecture Guide

RAG vs Agentic RAG

LLM의 지식 한계를 극복하는 세 가지 아키텍처 패턴의 비교와 이해

📚 Traditional RAG 아키텍처

사용자 질문을 벡터화하여 관련 문서를 검색하고, 검색된 컨텍스트와 함께 LLM에 전달하여 응답을 생성하는 단방향 파이프라인

👤
User
사용자 질의
🔤
Query
질문 입력
📁
Data Sources
PDF, DB, API, Web
🧮
Embedding
벡터 변환
🗃️
Vector DB
유사도 검색
📝
Augmented Context
Retrieved Info + Query + System Prompt
🧠
Large Language Model
Generation
💬
Output
응답 생성

핵심 특징

단일 검색 소스에서 관련 문서를 한 번 검색하여 LLM 컨텍스트에 주입합니다. 구현이 간단하고 지연 시간이 짧아 FAQ, 문서 검색, 고객 지원 챗봇에 적합합니다.

작동 방식

질문 → 임베딩 변환 → 벡터 유사도 검색 → 컨텍스트 증강 → LLM 응답 생성의 선형적 파이프라인으로 작동합니다.

한계점

반응적(Reactive) 시스템으로, 검색 결과가 부족해도 자체 판단이나 재검색이 불가능합니다. 복잡한 다단계 추론에는 제한적입니다.

🤖 Agentic RAG 아키텍처

AI 에이전트가 메모리와 계획 능력을 바탕으로 자율적으로 도구를 선택하고 정보를 검색하는 지능형 파이프라인

👤
User
사용자 질의
🧠
Memory
컨텍스트 저장
📋
Planning
전략 수립
Query
질문 분석
🤖
AI Agent
의사결정 & 조율
🛠️
Tools
검색, 계산, API
📊
Data Sources
PDF, DB, API, Web
💬
Output
정제된 응답

ReACT Reasoning + Acting

추론과 행동을 번갈아 수행하는 프레임워크입니다. 생각(Thought) → 행동(Action) → 관찰(Observation)의 순환 구조로 복잡한 작업을 처리합니다.

Thought → Action → Observation → ... → Final Answer

Chain of Thought CoT

복잡한 문제를 단계별로 분해하여 해결하는 프롬프팅 기법입니다. "단계별로 생각해보자"라는 지시로 모델의 추론 능력을 향상시킵니다.

문제 → Step 1 → Step 2 → ... → 최종 답변

Query Routing

에이전트가 질문의 성격을 분석하여 최적의 데이터 소스로 라우팅합니다. 코드 질문은 코드 DB로, 문서 질문은 문서 DB로 자동 분기됩니다.

Query Analysis → Best Tool Selection → Execute

🔗 Multi-Agent RAG 아키텍처

여러 특화 에이전트가 MCP(Model Context Protocol)를 통해 협업하며 복잡한 작업을 분담 처리하는 고급 파이프라인

🧠
Memory System
Short Term / Long Term
📋
Planning Module
ReACT / CoT
🔄
Aggregator Agent
결과 통합 & 조율
Generative Model
최종 응답 생성

MCP Servers

Model Context Protocol을 통해 표준화된 인터페이스로 다양한 외부 리소스에 연결

Agent 1
Local Data Servers
📁 Files 🗄️ DB
Agent 2
Search Engine
🔍 Kagi 🌐 Web
Agent 3
Cloud Services
☁️ AWS 🔷 Azure

MCP Model Context Protocol

Anthropic이 개발한 오픈 표준으로, AI 모델이 외부 데이터 소스 및 도구와 통일된 인터페이스로 연결되도록 합니다. M×N 통합 문제를 M+N으로 단순화합니다.

MCP Client ↔ MCP Server ↔ External Resources

Multi-Agent Collaboration

각 에이전트가 전문 분야(로컬 데이터, 검색, 클라우드)를 담당하고, 집계 에이전트가 결과를 종합합니다. 복잡한 엔터프라이즈 시나리오에 최적입니다.

Dynamic Tool Discovery

에이전트가 런타임에 사용 가능한 도구를 동적으로 발견하고 활용할 수 있어, 하드코딩 없이 확장성 있는 시스템 구축이 가능합니다.

📊 아키텍처 비교 분석

특성 Traditional RAG Agentic RAG Multi-Agent RAG
데이터 소스 단일 벡터 DB 다중 소스 라우팅 분산 MCP 서버
검색 방식 단일 검색 반복적 검색 협업적 검색
메모리 없음 단기/장기 메모리 공유 메모리 + 개별 메모리
계획 능력 없음 ReACT / CoT 분산 계획 + 조율
적응성 정적 동적 자율적
구현 복잡도 낮음 ⭐ 중간 ⭐⭐ 높음 ⭐⭐⭐
지연 시간 빠름 중간 상대적으로 높음
적합한 사용 사례 FAQ, 단순 문서 검색 복잡한 질의, 다단계 추론 엔터프라이즈, 대규모 협업

📚 Traditional RAG 선택 시

정형화된 질문에 빠른 응답이 필요한 경우, 단일 지식 베이스로 충분한 경우, 구현 비용과 복잡도를 최소화해야 하는 경우에 적합합니다.

🤖 Agentic RAG 선택 시

복잡한 질문이나 다단계 추론이 필요한 경우, 여러 소스의 정보를 종합해야 하는 경우, 동적 상황에 적응해야 하는 경우에 적합합니다.

🔗 Multi-Agent RAG 선택 시

여러 도메인의 전문 지식을 통합해야 하는 경우, 대규모 협업적 워크플로우가 필요한 경우, 엔터프라이즈급 확장성이 요구되는 경우에 적합합니다.

RAG Architecture Comparison Guide | 2024-2025