RAG vs Agentic RAG

RAG vs Agentic RAG - 아키텍처 비교

📚 Traditional RAG 아키텍처

사용자 질문을 벡터화하여 관련 문서를 검색하고, 검색된 컨텍스트와 함께 LLM에 전달하여 응답을 생성하는 단방향 파이프라인

👤

User

사용자 질의

→

🔤

Query

질문 입력

→

📁

Data Sources

PDF, DB, API, Web

→

🧮

Embedding

벡터 변환

→

🗃️

Vector DB

유사도 검색

→

📝

Augmented Context

Retrieved Info + Query + System Prompt

→

🧠

Large Language Model

Generation

→

💬

Output

응답 생성

핵심 특징

단일 검색 소스에서 관련 문서를 한 번 검색하여 LLM 컨텍스트에 주입합니다. 구현이 간단하고 지연 시간이 짧아 FAQ, 문서 검색, 고객 지원 챗봇에 적합합니다.

작동 방식

질문 → 임베딩 변환 → 벡터 유사도 검색 → 컨텍스트 증강 → LLM 응답 생성의 선형적 파이프라인으로 작동합니다.

한계점

반응적(Reactive) 시스템으로, 검색 결과가 부족해도 자체 판단이나 재검색이 불가능합니다. 복잡한 다단계 추론에는 제한적입니다.

🤖 Agentic RAG 아키텍처

AI 에이전트가 메모리와 계획 능력을 바탕으로 자율적으로 도구를 선택하고 정보를 검색하는 지능형 파이프라인

👤

User

사용자 질의

🧠

Memory

컨텍스트 저장

📋

Planning

전략 수립

→

❓

Query

질문 분석

→

🤖

AI Agent

의사결정 & 조율

→

🛠️

Tools

검색, 계산, API

↔

📊

Data Sources

PDF, DB, API, Web

→

💬

Output

정제된 응답

ReACT Reasoning + Acting

추론과 행동을 번갈아 수행하는 프레임워크입니다. 생각(Thought) → 행동(Action) → 관찰(Observation)의 순환 구조로 복잡한 작업을 처리합니다.

Thought → Action → Observation → ... → Final Answer

Chain of Thought CoT

복잡한 문제를 단계별로 분해하여 해결하는 프롬프팅 기법입니다. "단계별로 생각해보자"라는 지시로 모델의 추론 능력을 향상시킵니다.

문제 → Step 1 → Step 2 → ... → 최종 답변

Query Routing

에이전트가 질문의 성격을 분석하여 최적의 데이터 소스로 라우팅합니다. 코드 질문은 코드 DB로, 문서 질문은 문서 DB로 자동 분기됩니다.

Query Analysis → Best Tool Selection → Execute

🔗 Multi-Agent RAG 아키텍처

여러 특화 에이전트가 MCP(Model Context Protocol)를 통해 협업하며 복잡한 작업을 분담 처리하는 고급 파이프라인

⚡ MCP Servers

Model Context Protocol을 통해 표준화된 인터페이스로 다양한 외부 리소스에 연결

Agent 1

Local Data Servers

📁 Files 🗄️ DB

Agent 2

Search Engine

🔍 Kagi 🌐 Web

Agent 3

Cloud Services

☁️ AWS 🔷 Azure

MCP Model Context Protocol

Anthropic이 개발한 오픈 표준으로, AI 모델이 외부 데이터 소스 및 도구와 통일된 인터페이스로 연결되도록 합니다. M×N 통합 문제를 M+N으로 단순화합니다.

MCP Client ↔ MCP Server ↔ External Resources

Multi-Agent Collaboration

각 에이전트가 전문 분야(로컬 데이터, 검색, 클라우드)를 담당하고, 집계 에이전트가 결과를 종합합니다. 복잡한 엔터프라이즈 시나리오에 최적입니다.

Dynamic Tool Discovery

에이전트가 런타임에 사용 가능한 도구를 동적으로 발견하고 활용할 수 있어, 하드코딩 없이 확장성 있는 시스템 구축이 가능합니다.

📊 아키텍처 비교 분석

특성	Traditional RAG	Agentic RAG	Multi-Agent RAG
데이터 소스	단일 벡터 DB	다중 소스 라우팅	분산 MCP 서버
검색 방식	단일 검색	반복적 검색	협업적 검색
메모리	없음	단기/장기 메모리	공유 메모리 + 개별 메모리
계획 능력	없음	ReACT / CoT	분산 계획 + 조율
적응성	정적	동적	자율적
구현 복잡도	낮음 ⭐	중간 ⭐⭐	높음 ⭐⭐⭐
지연 시간	빠름	중간	상대적으로 높음
적합한 사용 사례	FAQ, 단순 문서 검색	복잡한 질의, 다단계 추론	엔터프라이즈, 대규모 협업

📚 Traditional RAG 선택 시

정형화된 질문에 빠른 응답이 필요한 경우, 단일 지식 베이스로 충분한 경우, 구현 비용과 복잡도를 최소화해야 하는 경우에 적합합니다.

🤖 Agentic RAG 선택 시

복잡한 질문이나 다단계 추론이 필요한 경우, 여러 소스의 정보를 종합해야 하는 경우, 동적 상황에 적응해야 하는 경우에 적합합니다.

🔗 Multi-Agent RAG 선택 시

여러 도메인의 전문 지식을 통합해야 하는 경우, 대규모 협업적 워크플로우가 필요한 경우, 엔터프라이즈급 확장성이 요구되는 경우에 적합합니다.

'Analysis' 카테고리의 다른 글

ML 분석 파이프라인 (0)	2025.12.15
데이터 파이프라인 아키텍처 (0)	2025.12.13
Agentic AI vs AI Agent (1)	2025.12.11
GPU 컴퓨팅 플랫폼의 양강 구도: NVIDIA CUDA vs AMD ROCm (0)	2025.12.02
반도체 설계의 새로운 물결: 칩렛(Chiplet) 아키텍처의 이해 (0)	2025.12.01

얇고 넓은 지식의 백과사전

RAG vs Agentic RAG

RAG vs Agentic RAG