//
알아서 잘하는 에이전틱 AI 시스템 구축하기 · 안자나바 비스와스, 릭 탈루크다르
에이전트가 외부 세계와 상호작용하는 핵심 메커니즘이 도구 사용이다. 책에서는 먼저 두 용어의 차이를 명확히 한다.
실제 구현에서는 이 두 용어가 혼용되는 경우가 많지만, 개념적으로 도구 호출이 함수 호출의 상위 개념이라는 점을 인지해두면 설계 시 혼란을 줄일 수 있다.
에이전트가 활용할 수 있는 도구는 다섯 가지 유형으로 분류된다.
| 유형 | 설명 | 예시 |
|---|---|---|
| API 도구 | 외부 서비스와 통신 | 날씨 API, 검색 API, 결제 API |
| 데이터베이스 도구 | 데이터 조회 및 조작 | SQL 질의, 벡터 DB 검색 |
| 유틸리티 도구 | 범용 계산 및 처리 | 수학 연산, 날짜 변환, 텍스트 처리 |
| 통합 도구 | 여러 서비스를 연결 | Slack 메시지 전송, 이메일 발송, 캘린더 등록 |
| 하드웨어 도구 | 물리적 장치 제어 | 센서 데이터 읽기, 로봇 팔 제어 |
여행 계획 에이전트를 예로 들면, 항공권 검색 API(API 도구), 예약 데이터베이스 조회(DB 도구), 환율 변환(유틸리티 도구), 예약 확인 이메일 발송(통합 도구) 등을 조합하여 하나의 작업을 완수한다.
이 장에서 가장 인상적인 부분은 다양한 계획 알고리즘을 실용성 기준으로 분류한 것이다.
실제 에이전틱 시스템에서는 계획 수립과 도구 사용이 분리되지 않는다. 에이전트는 계획을 세우는 과정에서 어떤 도구를 사용할 수 있는지를 고려하고, 도구 실행 결과에 따라 계획을 수정한다.
이 순환 구조가 에이전틱 시스템의 핵심이다. 정적인 파이프라인이 아니라 동적으로 계획을 조정하며 도구를 활용하는 적응적 루프다.
책에서는 세 가지 프레임워크로 여행 계획 에이전트를 구현하며, 각 프레임워크의 특성을 비교한다.
역할 기반 에이전트 구성이 직관적이다. "여행 조사원", "일정 기획자", "예산 관리자" 같은 역할을 정의하고, 각 역할에 도구를 할당하는 방식이다. 진입 장벽이 낮아 프로토타이핑에 적합하다.
마이크로소프트가 개발한 프레임워크로, 에이전트 간 대화를 통해 작업을 진행한다. 멀티턴 대화 기반의 협업 패턴이 강점이며, 사람이 대화에 개입할 수 있는 Human-in-the-loop 패턴을 자연스럽게 지원한다.
LangChain 기반의 그래프 워크플로 엔진이다. 상태 머신(State Machine) 개념으로 에이전트의 행동 흐름을 명시적으로 정의한다. 복잡한 분기와 루프를 세밀하게 제어할 수 있어, 프로덕션 레벨의 시스템에 적합하다.
| 프레임워크 | 강점 | 적합한 상황 |
|---|---|---|
| CrewAI | 직관적 역할 기반 구성 | 빠른 프로토타이핑, 소규모 팀 에이전트 |
| AutoGen | 대화 기반 협업, HITL 지원 | 사람과 에이전트의 협업이 중요한 경우 |
| LangGraph | 세밀한 워크플로 제어 | 복잡한 분기/루프가 필요한 프로덕션 시스템 |
프레임워크 선택 시 "가장 좋은 프레임워크"를 찾기보다, 팀의 기술 스택과 프로젝트 요구사항에 맞는 것을 선택하는 것이 현실적이다. 빠른 검증이 목표라면 CrewAI, 세밀한 제어가 필요하면 LangGraph, 대화 기반 협업이 핵심이면 AutoGen을 고려할 수 있다.
5장은 이론에서 실무로 넘어가는 전환점이다. 계획 알고리즘을 실용성 기준으로 분류한 것은 학술적 알고리즘과 실제 구현 사이의 간극을 명확히 보여준다. 세 프레임워크의 비교 실습은 각각의 설계 철학 차이를 이해하는 데 도움이 되며, 실제 프로젝트에서 프레임워크를 선택할 때 참고할 만한 기준을 제공한다.