//
7부까지 AI의 눈부신 발전을 다루었다면, 8부는 한 발 물러서서 AI 기술이 가진 근본적인 취약점을 직시한다. 저자는 현재 AI가 "지능"이라 부르기에는 여전히 많은 한계를 가지고 있다고 지적한다.
AI 모델의 성능은 결국 데이터의 품질에 의존한다. 저자는 데이터 정제와 레이블링이 AI 개발에서 가장 노동 집약적이면서도 과소평가되는 과정이라고 강조한다.
| 과정 | 내용 | 어려움 |
|---|---|---|
| 데이터 수집 | 목적에 맞는 데이터 확보 | 저작권, 프라이버시 문제 |
| 데이터 정제 | 오류, 중복, 결측치 처리 | 전체 작업의 60~80% 소요 |
| 레이블링 | 데이터에 정답 태그 부여 | 전문 지식 필요, 비용 높음 |
| 품질 검증 | 레이블의 일관성과 정확성 확인 | 주관적 판단의 불일치 |
"쓰레기가 들어가면 쓰레기가 나온다(Garbage In, Garbage Out)"는 격언이 AI에서도 여전히 유효하다. 아무리 정교한 모델 아키텍처를 사용하더라도 데이터의 품질이 낮으면 좋은 결과를 기대할 수 없다.
AI를 논할 때 빠지지 않는 구분이 **강인공지능(Strong AI)**과 **약인공지능(Weak AI)**이다.
현재의 LLM이 다양한 과제를 수행할 수 있어 강인공지능에 가까워 보이지만, 이는 대규모 데이터로 학습한 패턴 매칭의 결과이지 진정한 "이해"나 "추론"과는 다르다는 것이 다수 연구자들의 견해다.
**AGI(Artificial General Intelligence)**는 인간 수준의 범용 지능을 가진 AI를 의미한다. AGI에 대한 전망은 전문가들 사이에서도 크게 갈린다.
저자는 특정 입장을 강하게 주장하기보다, 각 관점을 균형 있게 소개하며 독자가 스스로 판단할 수 있도록 안내한다.
저자는 AI 기술이 실제 서비스로 만들어지기까지의 과정을 간략하게 소개한다. 연구와 개발 사이에는 상당한 간극이 있으며, 논문의 성능이 곧 서비스의 품질을 보장하지 않는다.
각 단계는 순차적으로 진행되는 것이 아니라, 반복적으로 순환하며 개선된다. 특히 배포 후 실사용 데이터로부터 피드백을 받아 모델을 개선하는 과정이 AI 서비스의 품질을 좌우한다.
저자는 마지막으로 AI 시대를 살아가는 개인과 조직이 어떤 자세를 가져야 하는지를 논한다. AI 기술 자체보다 AI를 어떻게 활용하고 그 한계를 어떻게 보완할 것인가가 더 중요한 질문이라고 강조한다.
8부는 기술적 내용을 넘어 AI와 인간의 관계를 성찰하며 책을 마무리한다. 1부에서 AI의 정의로 시작한 이 책이 8부에서 AI의 미래와 인간의 역할로 끝나는 구성은, 기술서이면서 동시에 AI 시대를 준비하는 교양서로서의 가치를 보여준다.