//
알아서 잘하는 에이전틱 AI 시스템 구축하기 · 안자나바 비스와스, 릭 탈루크다르
에이전트가 세계를 이해하고 추론하려면, 먼저 지식을 구조화된 형태로 표현할 수 있어야 한다. 책에서는 세 가지 주요 방식을 소개한다.
개념들을 노드로, 관계를 엣지로 표현하는 그래프 구조다. "서울 -- 수도이다 -- 한국"처럼 직관적인 관계 표현이 가능하다. 지식 그래프(Knowledge Graph)가 대표적인 현대적 구현이다.
객체나 상황을 슬롯(속성)과 값의 집합으로 표현한다. 객체지향 프로그래밍의 클래스와 유사한 구조다.
프레임: 항공편
출발지: 서울
도착지: 도쿄
출발시간: 09:00
항공사: 대한항공
좌석등급: 이코노미
명제 논리나 1차 술어 논리를 사용해 지식을 형식화한다. 엄밀한 추론이 가능하지만, 현실 세계의 불확실성을 다루기 어렵다는 한계가 있다.
| 방식 | 장점 | 한계 |
|---|---|---|
| 의미망 | 직관적, 관계 탐색에 적합 | 복잡한 추론에 제한적 |
| 프레임 | 구조화된 정보 표현에 효과적 | 동적 환경 변화 반영이 어려움 |
| 논리 기반 | 엄밀한 추론 가능 | 불확실성 처리 곤란, 계산 비용 높음 |
지식을 기반으로 새로운 결론을 도출하는 과정이다. 에이전트의 지능은 곧 추론 능력의 품질에 달려 있다.
일반적인 규칙에서 구체적인 결론을 도출한다. "모든 포유류는 숨을 쉰다 + 고래는 포유류다 = 고래는 숨을 쉰다" 같은 형태다. 전제가 참이면 결론도 반드시 참이 된다.
구체적인 관찰에서 일반적인 규칙을 도출한다. "관찰한 백조가 모두 흰색이었다 = 모든 백조는 흰색일 것이다" 같은 형태다. 개연성은 높지만 확실성은 보장되지 않는다.
관찰된 결과로부터 가장 그럴듯한 원인을 추정한다. 의료 진단이 대표적인 예시로, 증상(결과)에서 질병(원인)을 추론한다. 불확실한 상황에서의 의사결정에 유용하다.
에이전트가 경험을 통해 성능을 향상시키는 메커니즘이다.
에이전틱 시스템에서는 강화 학습과 전이 학습이 특히 중요하다. 강화 학습은 에이전트가 시행착오를 통해 최적의 행동 전략을 찾는 기반이 되며, 전이 학습은 범용 LLM을 특정 에이전트 역할에 맞게 적응시키는 핵심 기법이다.
에이전트가 목표를 달성하기 위해 행동을 선택하고 순서를 정하는 과정이다.
각 상태나 행동에 수치적 가치를 부여하여 최적의 선택을 찾는다. 기대 유틸리티를 최대화하는 행동을 선택하는 것이 기본 원리다.
상태 공간을 그래프로 모델링하고, 초기 상태에서 목표 상태까지의 경로를 탐색한다. BFS(너비 우선), DFS(깊이 우선)가 기본적인 방법이다.
*A 알고리즘**이 대표적이다. 현재까지의 비용과 목표까지의 추정 비용을 합산하여 가장 유망한 경로를 우선 탐색한다. 최적성과 효율성의 균형을 잡는다.
시뮬레이션을 반복하여 가장 유망한 행동을 찾는다. AlphaGo에서 유명해진 알고리즘으로, 선택-확장-시뮬레이션-역전파의 네 단계를 반복한다. 불확실한 환경에서의 의사결정에 강점이 있다.
| 방법 | 특성 | 적합한 상황 |
|---|---|---|
| 유틸리티 함수 | 정량적 가치 비교 | 명확한 보상 체계가 있는 경우 |
| 그래프 탐색 | 완전 탐색 가능 | 상태 공간이 작은 경우 |
| 휴리스틱 탐색 | 효율적 최적 경로 탐색 | 좋은 추정 함수가 있는 경우 |
| MCTS | 시뮬레이션 기반 | 불확실성이 높은 환경 |
LLM의 등장으로 에이전트의 각 구성 요소가 한 단계 발전할 수 있게 되었다.
LLM 기반 에이전트의 추론 품질은 프롬프트 설계에 크게 좌우된다. 특히 Chain-of-Thought를 유도할 때, 단순히 "단계별로 생각하라"보다 구체적인 추론 프레임워크(예: 문제 정의 - 가능한 접근법 나열 - 각 접근법 평가 - 최종 선택)를 제시하는 것이 더 안정적인 결과를 낸다.
3장은 에이전트를 구성하는 지적 기능의 전체 구조를 체계적으로 정리한다. 지식 표현, 추론, 학습, 의사결정이라는 네 가지 축은 고전적 AI에서부터 현대 LLM 기반 시스템까지 관통하는 보편적 프레임워크다. 이 네 가지를 이해하면 이후 장에서 다루는 구체적인 구현 기법이 왜 그런 형태를 취하는지가 자연스럽게 이해된다.