Shopify
기술 블로그
B레벨 - 심화

Shopify가 블랙프라이데이 대규모 트래픽에 대비하는 방법

인프라
스케일링
SRE
KubernetesChaos EngineeringLoad TestingMulti-Region
2025년 1월조회 0면접 0원문 보기

배경

Shopify는 매년 블랙프라이데이·사이버먼데이(BFCM) 기간 동안 전 세계 커머스 트래픽의 최대 피크를 처리해야 한다. 2024년 BFCM에서 57.3PB의 데이터, 10.5조 데이터베이스 쿼리를 처리했다.

도전 과제

수백만 상점이 동시에 플래시 세일을 진행하면서 초당 수백만 요청이 발생한다. 단일 장애 지점이 전체 플랫폼에 영향을 미칠 수 있어, 매년 3월부터 체계적인 준비가 필요했다.

해결 방안

Game Day(장애 시뮬레이션), Genghis(부하 테스트 도구)로 글로벌 3개 리전에서 동시 트래픽을 시뮬레이션했다. 4월부터 10월까지 5차례 Scale Test를 수행하며 최종 200M RPM까지 테스트했다. Resiliency Matrix로 취약점과 복구 절차를 체계적으로 문서화했다.

결과

2024년 BFCM에서 1.19조 엣지 요청, 1.17조 DB 쓰기를 안정적으로 처리했다. 카오스 엔지니어링과 체계적 부하 테스트로 예상치 못한 장애에도 자동 복구가 가능해졌다.

핵심 인사이트

  • 1.대규모 트래픽 대비는 최소 6개월 전부터 체계적으로 준비해야 한다
  • 2.카오스 엔지니어링으로 장애 시나리오를 사전에 경험하면 실전 대응력이 향상된다
  • 3.다중 리전 부하 테스트로 글로벌 트래픽 패턴을 정확히 시뮬레이션해야 한다

이 사례 기반 면접에 도전해보세요

Shopify의 실제 기술적 결정과 트레이드오프를 깊이 파고드는 면접 질문 2가 준비되어 있습니다

SYSTEM_DESIGN
DEVOPS
타이머사례 참조 가능결과 아카이브

로그인 없이 바로 면접을 시작할 수 있습니다