//
언어 모델은 크게 두 가지로 나뉜다.
마스크 언어 모델: 나는 [MASK] 먹었다 → "밥을" 예측 (양방향 컨텍스트)
자기회귀 언어 모델: 나는 밥을 → "먹었다" 예측 (왼쪽→오른쪽만)
"파운데이션"이란 단어는 이 모델들이 AI 애플리케이션에서 갖는 중요성과, 다양한 요구사항에 맞게 발전시킬 수 있다는 사실을 내포한다. 하나의 사전 학습된 모델을 기반으로 프롬프트 엔지니어링, RAG, 파인튜닝 등을 통해 다양한 도메인에 적용할 수 있다는 점에서 "기반(Foundation)"이라는 이름이 붙었다.
대표적인 AI 엔지니어링 기법으로 프롬프트 엔지니어링, RAG(검색 증강 생성), 파인튜닝이 있다. 깃허브 스타 수 기준으로 AI 엔지니어링 도구의 성장 속도는 다른 분야 대비 월등히 빠르다.
세 가지 기법은 난이도와 유연성의 스펙트럼 위에 있다.
| 기법 | 난이도 | 모델 변경 | 적합한 상황 |
|---|---|---|---|
| 프롬프트 엔지니어링 | 낮음 | 없음 | 빠른 프로토타이핑, 범용 작업 |
| RAG | 중간 | 없음 | 최신 정보, 도메인 지식이 필요한 경우 |
| 파인튜닝 | 높음 | 가중치 수정 | 특화된 행동 패턴, 출력 형식 제어 |
AI를 활용한 애플리케이션 범주의 비율을 살펴보면 다음과 같다.
| 범주 | 비율 |
|---|---|
| 코딩 | 30% |
| 대화형 봇 | 26.5% |
| 이미지/비디오 생성 | 12.7% |
| 정보 집계 | 12.7% |
| 워크플로 자동화 | 11.3% |
| 기타 | 각 5% 미만 |
코딩 분야에서 AI는 간단한 작업에서는 생산성을 크게 향상시키지만, 복잡한 작업에서는 효과가 제한적이다. 다만 이 범위는 점차 확대되는 추세다.
기업이 AI 애플리케이션 개발에 뛰어드는 주요 동기는 세 가지다.
AI 도입의 성숙도를 세 단계로 설명한다.
각 단계를 건너뛰지 않고 순차적으로 진행하는 것이 중요하다. 신뢰할 수 있는 평가 체계 없이 Run 단계로 넘어가면 예측 불가능한 사고로 이어질 수 있다.
울트라챗 논문의 딩(Ding, 2023)은 "0에서 60까지 가는 여정은 쉽지만, 60에서 100으로 나아가는 것은 매우 어렵다"고 했다. 링크드인(2024)도 80% 달성까지 한 달이 걸렸지만, 95%를 넘어서기 위해 4개월이나 더 걸렸다고 밝혔다. 초기 성과는 빠르지만 고도화에는 몇 배의 시간이 든다.
AI 프로젝트를 기획할 때 "80% 정확도까지 2주" 같은 초기 진척 속도로 전체 일정을 추정하면 안 된다. 마지막 15~20%를 개선하는 데 초기의 3~5배 이상 시간이 소요되는 것이 일반적이다. 마일스톤을 설정할 때 이 비선형적 특성을 반드시 반영해야 한다.
| 계층 | 주요 활동 |
|---|---|
| 애플리케이션 개발 | AI 인터페이스, 프롬프트 엔지니어링, 컨텍스트 구성, 평가 |
| 모델 개발 | 추론 최적화, 데이터셋 엔지니어링, 모델링과 학습, 평가 |
| 인프라 | 컴퓨팅 관리, 데이터 관리, 서빙, 모니터링 |
두 분야는 유사하면서도 본질적인 차이가 있다.
| 구분 | AI 엔지니어링 | ML 엔지니어링 |
|---|---|---|
| 핵심 활동 | 모델 조정과 평가 | 모델 개발 |
| 데이터 형태 | 개방형, 비정형 (텍스트, 이미지 등) | 폐쇄형, 정형 (테이블, 로그 등) |
| 모델 관계 | 사전 학습된 모델을 활용 | 직접 모델을 설계하고 학습 |
| 평가 방식 | 주관적, 개방형 평가가 중심 | 정량적 지표 (정확도, F1 등) 중심 |
| 진입 장벽 | 상대적으로 낮음 | 수학, 통계 기반 지식 필요 |
1장은 이후 다룰 주제들에 대한 전체적인 조감도를 제공한다. 파운데이션 모델이 AI 애플리케이션의 기반이 되는 이유, AI 엔지니어링이 기존 ML 엔지니어링과 어떻게 다른지를 설명하며, 앞으로의 여정에 대한 큰 그림을 그려준다.