본문으로 건너뛰기
Kreath Archive
TechProjectsBooksAbout
TechProjectsBooksAbout
TechProjectsBooksAbout
© 2026 Kreath. All rights reserved.
홈TechProjectsBooksAbout

Tech

기술, 튜토리얼, 회고 등 개발과 관련된 글을 기록합니다.

전체4AI / ML4아키텍처0프로그래밍0인프라0웹 개발0개발 도구0데이터0#evaluation
최신순오래된순제목순

시리즈

AI / ML10편 · 177분2026년 3월 27일

하네스 엔지니어링

AI 에이전트에서 모델을 감싸는 모든 것, 하네스 엔지니어링의 정의와 등장 배경, 그리고 5가지 핵심 역할을 살펴봅니다.

AI / ML10편 · 171분2026년 3월 20일

AI 평가 하네스와 벤치마킹

300개 이상의 모델과 50개 이상의 벤치마크가 공존하는 시대, AI 평가 하네스가 왜 필요한지 그 정의와 핵심 구성요소, 평가 생태계 전체 지도를 살펴봅니다.

AI / ML10편 · 176분2026년 3월 18일

AI 에이전트 테스트와 품질 보증

결정론적 소프트웨어와 비결정적 AI 에이전트의 근본적 차이를 짚고, 전통적 QA 방법론의 한계와 에이전트 전용 3단계 테스트 모델을 소개합니다.

AI / ML10편 · 175분2026년 2월 2일

LLM 평가 프레임워크

LLM 애플리케이션을 프로덕션에서 안정적으로 운영하기 위해 평가와 모니터링이 왜 필수인지, 전체 프레임워크를 체계적으로 소개합니다.

"AI / ML" 4개 시리즈