지식 표현

에이전트가 세계를 이해하고 추론하려면, 먼저 지식을 구조화된 형태로 표현할 수 있어야 한다. 책에서는 세 가지 주요 방식을 소개한다.

의미망 (Semantic Networks)

개념들을 노드로, 관계를 엣지로 표현하는 그래프 구조다. "서울 -- 수도이다 -- 한국"처럼 직관적인 관계 표현이 가능하다. 지식 그래프(Knowledge Graph)가 대표적인 현대적 구현이다.

프레임 (Frames)

객체나 상황을 슬롯(속성)과 값의 집합으로 표현한다. 객체지향 프로그래밍의 클래스와 유사한 구조다.

프레임: 항공편
  출발지: 서울
  도착지: 도쿄
  출발시간: 09:00
  항공사: 대한항공
  좌석등급: 이코노미

논리 기반 (Logic-based)

명제 논리나 1차 술어 논리를 사용해 지식을 형식화한다. 엄밀한 추론이 가능하지만, 현실 세계의 불확실성을 다루기 어렵다는 한계가 있다.

방식	장점	한계
의미망	직관적, 관계 탐색에 적합	복잡한 추론에 제한적
프레임	구조화된 정보 표현에 효과적	동적 환경 변화 반영이 어려움
논리 기반	엄밀한 추론 가능	불확실성 처리 곤란, 계산 비용 높음

추론

지식을 기반으로 새로운 결론을 도출하는 과정이다. 에이전트의 지능은 곧 추론 능력의 품질에 달려 있다.

연역적 추론 (Deductive Reasoning)

일반적인 규칙에서 구체적인 결론을 도출한다. "모든 포유류는 숨을 쉰다 + 고래는 포유류다 = 고래는 숨을 쉰다" 같은 형태다. 전제가 참이면 결론도 반드시 참이 된다.

귀납적 추론 (Inductive Reasoning)

구체적인 관찰에서 일반적인 규칙을 도출한다. "관찰한 백조가 모두 흰색이었다 = 모든 백조는 흰색일 것이다" 같은 형태다. 개연성은 높지만 확실성은 보장되지 않는다.

가설 추론 (Abductive Reasoning)

관찰된 결과로부터 가장 그럴듯한 원인을 추정한다. 의료 진단이 대표적인 예시로, 증상(결과)에서 질병(원인)을 추론한다. 불확실한 상황에서의 의사결정에 유용하다.

학습

에이전트가 경험을 통해 성능을 향상시키는 메커니즘이다.

지도 학습(Supervised Learning) -- 레이블이 부착된 데이터로 입력-출력 매핑을 학습한다. 분류, 회귀 작업에 적합하다.
비지도 학습(Unsupervised Learning) -- 레이블 없이 데이터의 내재된 구조나 패턴을 발견한다. 클러스터링, 차원 축소 등이 해당한다.
강화 학습(Reinforcement Learning) -- 환경과의 상호작용을 통해 보상을 최대화하는 정책을 학습한다. 에이전트의 의사결정에 가장 직접적으로 관련된다.
전이 학습(Transfer Learning) -- 한 도메인에서 학습한 지식을 다른 도메인에 적용한다. 사전 학습된 LLM을 특정 작업에 파인튜닝하는 것이 대표적이다.

에이전틱 시스템에서는 강화 학습과 전이 학습이 특히 중요하다. 강화 학습은 에이전트가 시행착오를 통해 최적의 행동 전략을 찾는 기반이 되며, 전이 학습은 범용 LLM을 특정 에이전트 역할에 맞게 적응시키는 핵심 기법이다.

의사결정과 계획

에이전트가 목표를 달성하기 위해 행동을 선택하고 순서를 정하는 과정이다.

유틸리티 함수 (Utility Function)

각 상태나 행동에 수치적 가치를 부여하여 최적의 선택을 찾는다. 기대 유틸리티를 최대화하는 행동을 선택하는 것이 기본 원리다.

그래프 탐색

상태 공간을 그래프로 모델링하고, 초기 상태에서 목표 상태까지의 경로를 탐색한다. BFS(너비 우선), DFS(깊이 우선)가 기본적인 방법이다.

휴리스틱 탐색

*A 알고리즘**이 대표적이다. 현재까지의 비용과 목표까지의 추정 비용을 합산하여 가장 유망한 경로를 우선 탐색한다. 최적성과 효율성의 균형을 잡는다.

MCTS (몬테카를로 트리 탐색)

시뮬레이션을 반복하여 가장 유망한 행동을 찾는다. AlphaGo에서 유명해진 알고리즘으로, 선택-확장-시뮬레이션-역전파의 네 단계를 반복한다. 불확실한 환경에서의 의사결정에 강점이 있다.

방법	특성	적합한 상황
유틸리티 함수	정량적 가치 비교	명확한 보상 체계가 있는 경우
그래프 탐색	완전 탐색 가능	상태 공간이 작은 경우
휴리스틱 탐색	효율적 최적 경로 탐색	좋은 추정 함수가 있는 경우
MCTS	시뮬레이션 기반	불확실성이 높은 환경

생성형 AI를 활용한 에이전트 능력 향상

LLM의 등장으로 에이전트의 각 구성 요소가 한 단계 발전할 수 있게 되었다.

지식 표현 -- LLM이 방대한 세계 지식을 파라미터에 내재적으로 보유하고 있어, 별도의 지식 베이스 구축 부담이 줄어든다.
추론 -- Chain-of-Thought 프롬프팅 등을 통해 LLM의 추론 능력을 끌어낼 수 있다.
학습 -- In-context Learning으로 추가 학습 없이도 새로운 작업에 적응할 수 있다.
계획 -- 자연어로 복잡한 작업을 하위 단계로 분해하는 능력이 뛰어나다.

Tip

LLM 기반 에이전트의 추론 품질은 프롬프트 설계에 크게 좌우된다. 특히 Chain-of-Thought를 유도할 때, 단순히 "단계별로 생각하라"보다 구체적인 추론 프레임워크(예: 문제 정의 - 가능한 접근법 나열 - 각 접근법 평가 - 최종 선택)를 제시하는 것이 더 안정적인 결과를 낸다.

프레임: 항공편
  출발지: 서울
  도착지: 도쿄
  출발시간: 09:00
  항공사: 대한항공
  좌석등급: 이코노미

논리 기반 (Logic-based)

명제 논리나 1차 술어 논리를 사용해 지식을 형식화한다. 엄밀한 추론이 가능하지만, 현실 세계의 불확실성을 다루기 어렵다는 한계가 있다.

방식	장점	한계
의미망	직관적, 관계 탐색에 적합	복잡한 추론에 제한적
프레임	구조화된 정보 표현에 효과적	동적 환경 변화 반영이 어려움
논리 기반	엄밀한 추론 가능	불확실성 처리 곤란, 계산 비용 높음

지도 학습(Supervised Learning) -- 레이블이 부착된 데이터로 입력-출력 매핑을 학습한다. 분류, 회귀 작업에 적합하다.
비지도 학습(Unsupervised Learning) -- 레이블 없이 데이터의 내재된 구조나 패턴을 발견한다. 클러스터링, 차원 축소 등이 해당한다.
강화 학습(Reinforcement Learning) -- 환경과의 상호작용을 통해 보상을 최대화하는 정책을 학습한다. 에이전트의 의사결정에 가장 직접적으로 관련된다.
전이 학습(Transfer Learning) -- 한 도메인에서 학습한 지식을 다른 도메인에 적용한다. 사전 학습된 LLM을 특정 작업에 파인튜닝하는 것이 대표적이다.

방법	특성	적합한 상황
유틸리티 함수	정량적 가치 비교	명확한 보상 체계가 있는 경우
그래프 탐색	완전 탐색 가능	상태 공간이 작은 경우
휴리스틱 탐색	효율적 최적 경로 탐색	좋은 추정 함수가 있는 경우
MCTS	시뮬레이션 기반	불확실성이 높은 환경

생성형 AI를 활용한 에이전트 능력 향상

LLM의 등장으로 에이전트의 각 구성 요소가 한 단계 발전할 수 있게 되었다.

지식 표현 -- LLM이 방대한 세계 지식을 파라미터에 내재적으로 보유하고 있어, 별도의 지식 베이스 구축 부담이 줄어든다.
추론 -- Chain-of-Thought 프롬프팅 등을 통해 LLM의 추론 능력을 끌어낼 수 있다.
학습 -- In-context Learning으로 추가 학습 없이도 새로운 작업에 적응할 수 있다.
계획 -- 자연어로 복잡한 작업을 하위 단계로 분해하는 능력이 뛰어나다.

Tip

3장: 지능형 에이전트의 핵심 구성 요소

지식 표현

의미망 (Semantic Networks)

프레임 (Frames)

논리 기반 (Logic-based)

추론

연역적 추론 (Deductive Reasoning)

귀납적 추론 (Inductive Reasoning)

가설 추론 (Abductive Reasoning)

학습

의사결정과 계획

유틸리티 함수 (Utility Function)

그래프 탐색

휴리스틱 탐색

MCTS (몬테카를로 트리 탐색)

생성형 AI를 활용한 에이전트 능력 향상

정리

댓글

3장: 지능형 에이전트의 핵심 구성 요소

지식 표현

의미망 (Semantic Networks)

프레임 (Frames)

논리 기반 (Logic-based)

추론

연역적 추론 (Deductive Reasoning)

귀납적 추론 (Inductive Reasoning)

가설 추론 (Abductive Reasoning)

학습

의사결정과 계획

유틸리티 함수 (Utility Function)

그래프 탐색

휴리스틱 탐색

MCTS (몬테카를로 트리 탐색)

생성형 AI를 활용한 에이전트 능력 향상

정리

댓글