본문으로 건너뛰기

Tech Projects Books About

Tech Projects Books About

Tech Projects Books About

© 2026 Kreath. All rights reserved.

홈 Tech Projects Books About

홈
테크
스트리밍 아키텍처와 실시간 AI 시리즈

스트리밍 아키텍처와 실시간 AI

요청-응답 모델의 한계를 넘어 스트리밍 아키텍처가 왜 AI 시대의 필수 인프라인지 살펴봅니다. TTFT, TPOT 등 핵심 지표와 프로토콜 생태계를 개관합니다.

10편총 165분 읽기7,896자

1
1장: 스트리밍 아키텍처의 필요성과 핵심 개념
요청-응답 모델의 한계를 넘어 스트리밍 아키텍처가 왜 AI 시대의 필수 인프라인지 살펴봅니다. TTFT, TPOT 등 핵심 지표와 프로토콜 생태계를 개관합니다.
2026년 3월 18일15분
2
2장: SSE(Server-Sent Events) 심층 분석
HTTP 기반 단방향 스트리밍 프로토콜인 SSE의 동작 원리, EventSource API, 자동 재연결 메커니즘을 분석하고 Next.js와 FastAPI에서의 LLM 토큰 스트리밍 구현을 다룹니다.
2026년 3월 20일14분
3
3장: WebSocket — 양방향 실시간 통신
WebSocket의 핸드셰이크, 프레이밍 구조, 양방향 통신의 강점과 상태 관리의 복잡성을 분석합니다. AI 채팅에서의 생성 중단, Socket.IO, 스케일링 전략을 다룹니다.
2026년 3월 22일17분
4
4장: gRPC Streaming — 고성능 백엔드 통신
HTTP/2 기반 gRPC의 4가지 스트리밍 모드, Protobuf 직렬화, 마이크로서비스 간 추론 파이프라인 구현을 다룹니다. gRPC-Web의 제약과 Python/Go 구현 예제를 포함합니다.
2026년 3월 24일16분
5
5장: 스트리밍 LLM 응답 처리
OpenAI, Anthropic, Google의 스트리밍 API 차이를 비교하고, 구조화된 출력의 파셜 파싱, React 스트리밍 UI 렌더링, Vercel AI SDK 활용법을 다룹니다.
2026년 3월 26일15분
6
6장: 실시간 추론 파이프라인 설계
vLLM의 스트리밍 입력, Continuous Batching, 시맨틱 캐싱, 추론 라우터, 멀티모달 실시간 처리 등 백엔드 추론 파이프라인의 핵심 아키텍처를 다룹니다.
2026년 3월 28일17분
7
7장: 이벤트 소싱과 CQRS 패턴
이벤트 소싱과 CQRS 패턴의 원리를 살펴보고, AI 시스템에서의 적용 사례를 다룹니다. 대화 이력 관리, 에이전트 상태 추적, 시간 여행 디버깅, Kafka와 EventStoreDB 활용을 포함합니다.
2026년 3월 30일15분
8
8장: 백프레셔와 흐름 제어
생산자-소비자 속도 불일치를 관리하는 백프레셔의 원리, 버퍼링/드롭/속도 제한 전략, LLM API 레이트 리미팅, 토큰 버킷 알고리즘, 큐 깊이 모니터링을 다룹니다.
2026년 4월 1일18분
9
9장: 프로덕션 스트리밍 인프라
로드밸런서의 WebSocket 업그레이드, CDN과 스트리밍, Kubernetes에서의 스트리밍 서비스 운영, 모니터링 전략, HTTP/3(QUIC)과 WebTransport의 미래를 다룹니다.
2026년 4월 3일17분
10
10장: 실전 프로젝트 — 스트리밍 AI 시스템 구축
SSE, gRPC, WebSocket을 결합한 하이브리드 스트리밍 AI 시스템을 설계하고 구현합니다. 프로토콜 선택 의사결정 트리, 엔드투엔드 구현, 성능 최적화, 운영 체크리스트를 다룹니다.
2026년 4월 5일21분