Meta의 HHVM 풀스택 최적화: GenAI 워크로드 대응

백엔드

인프라

HHVMHackGraphQLJIT CompilerLLM Inference

2025년 5월조회 1면접 0회원문 보기

Meta의 Web Foundation 팀이 Hack 언어 기반 모놀리식 웹 계층에서 GenAI 워크로드 최적화를 추진.

기존 웹서버는 수백ms 요청에 최적화됐으나 GenAI는 초~분 단위 장시간 요청 생성. I/O 대기 70%→90% 증가. 30초 타임아웃 제한이 병목.

5가지 최적화: 요청 타임아웃 증가(전용 테넌트), 스레드풀 크기 조정(~1000개), JIT 캐시 Jump-Start(이전 프로필 재사용), 요청 워밍업(더미 요청), 섀도우 트래픽(JIT 캐시 커버리지 유지).

30% 지연시간 개선. 높은 품질의 GenAI 경험 제공과 지속 가능한 시스템 운영 간 균형 달성.

이 사례 기반 면접에 도전해보세요

Meta의 실제 기술적 결정과 트레이드오프를 깊이 파고드는 면접 질문 2개가 준비되어 있습니다

BACKEND

타이머사례 참조 가능결과 아카이브

로그인 없이 바로 면접을 시작할 수 있습니다