18일 밤 9시 30분경부터 X 접속 불가… 롤·캔바·페이팔 등 글로벌 서비스 동시다발적 장애
클라우드플레어 “내부 서비스 성능 저하 확인, 복구 완료”… 지난 6월 이어 5개월 만에 또 ‘악몽’
소셜 네트워크 서비스 X(구 트위터)가 18일 밤 갑작스러운 접속 장애를 일으켜 전 세계 이용자들이 큰 불편을 겪고 있다. 이번 사태는 X 자체의 문제가 아닌, 전 세계 웹 트래픽의 관문과 같은 역할을 하는 인프라 기업 ‘클라우드플레어(Cloudflare)’의 오류에서 비롯된 것으로 추정돼 파장이 커지고 있다.
밤 9시 32분 ‘먹통’ 시작… 2시간 넘게 이어진 '희망 고문'
최초 오류 징후는 한국 시간으로 18일 오후 9시 32분을 전후해 감지됐다. 장애 발생 직후부터 약 2시간 넘게 X는 모바일 앱과 PC 웹 모두에서 정상적인 이용이 불가능했다.

접속 시 "문제가 발생했습니다. 새로고침해 보세요"라는 안내 문구가 뜨거나, ‘다시 시도’ 버튼을 눌러도 무한 로딩에 걸리는 현상이 반복됐다. 운 좋게 접속이 되더라도 프로필에 게시물이 보이지 않거나 실시간 트렌드가 갱신되지 않는 등 사실상 기능이 마비됐다. 일부 이용자들은 "잠깐 접속됐다가 다시 튕기는 현상이 반복되고 있어 더 답답하다"며 불만을 토로했다.
범인은 ‘인터넷의 수문장’ 클라우드플레어?
문제의 원인이 개별 서비스가 아닌 ‘인프라’에 있다는 증거는 곳곳에서 터져 나왔다. IT 커뮤니티에 따르면 이번 사태의 원인을 글로벌 웹 인프라 업체인 ‘클라우드플레어’의 서비스 장애로 지목하고 있다.
웹사이트 접속 장애 추적 사이트 다운디텍터(DownDetector)에 따르면, X뿐만 아니라 ▲리그 오브 레전드(LoL) ▲디자인 플랫폼 캔바(Canva) ▲결제 서비스 페이팔(Paypal) ▲호요버스 게임 '원신', '붕괴: 스타레일' ▲생성형 AI 서비스 챗GPT 등 다수의 글로벌 서비스에서 접속 오류가 동시다발적으로 보고됐다.

특히 웹 브라우저를 통해 이들 서비스에 접속하려 할 때, 클라우드플레어의 보안 기능인 ‘DDoS Protection’ 화면에서 멈추거나, 클라우드플레어의 오류 페이지만 표시되는 현상이 나타났다. 이는 클라우드플레어 서버가 비정상적으로 동작하고 있음을 시사했다.
긴박했던 3시간... 밤 11시 42분, 클라우드플레어 “해결(Resolved)” 선언
클라우드플레어 측은 사태 발생 직후인 협정 세계시(UTC) 기준 11시 48분(한국 시간 오후 8시 48분)경 첫 공지를 통해 “내부 서비스 성능 저하가 발생했다”고 인정하고 긴급 복구에 나섰다. 클라우드플레어의 공식 상태 페이지(https://www.cloudflarestatus.com/)에 따르면 긴박했던 복구 타임라인은 다음과 같다. (이하 한국 시간 기준)

- 20:48 (최초 인지): 클라우드플레어 측, “내부 서비스 성능 저하(Internal service degradation)로 일부 서비스 간헐적 영향” 공지.
- 21:20 ~ 22:00 (상황 악화): 서비스 복구 시도가 이어졌으나, 고객들은 여전히 높은 오류율을 경험. 이 시간대 X 등 주요 서비스 접속 장애 본격화.
- 22:09 (원인 파악): “문제가 식별되었으며 수정 사항(Fix)을 구현 중”이라고 업데이트.
- 22:13 (일부 회복): 핵심 보안 기능인 ‘액세스(Access)’와 ‘워프(WARP)’의 오류율이 사고 이전 수준으로 회복되었다고 밝힘. 단, 복구 과정에서 영국 런던 지역의 WARP 접속을 차단하는 등 긴급 조치가 시행됨.
- 23:34 (대시보드 복구): 대시보드 서비스 복구 완료. 광범위한 애플리케이션 서비스 영향 최소화 작업 지속.
- 23:42 (해결 선언): "수정 사항이 적용되었으며 사건이 해결된 것으로 판단됨(Incident is now resolved)" 공지. 모든 서비스 정상화 확인을 위해 모니터링 진행 중.
약 3시간에 걸친 복구 작업 끝에 현재 대부분의 서비스는 정상화 수순을 밟고 있으나, 트래픽이 몰리는 일부 서비스에서는 간헐적인 지연이 발생할 수 있다.
5개월 만에 또?… 반복되는 ‘인프라 셧다운’ 공포
클라우드플레어는 지난 6월 12일 스토리지 인프라(Workers KV) 장애로 전 세계 웹사이트를 마비시킨 바 있다. 당시 장애 지속 시간은 2시간 28분이었다. 하지만 이번 사태는 오후 8시 48분 최초 인지부터 오후 11시 42분 해결 선언까지, 꼬박 2시간 54분이 소요됐다. 지난 6월 사태보다 복구에 약 26분이 더 걸린 셈이다.
당시 클라우드플레어는 "타사 클라우드 공급자의 장애가 당사 스토리지 인프라(Workers KV)에 영향을 미쳤다"며 사과했으나, 특정 기업에 의존도가 높은 웹 생태계의 취약점이 고스란히 노출됐다는 비판을 받았다. 하지만 반년도 채 되지 않아 또다시 전 세계적 규모의 서비스 장애가 발생하며, ‘초거대 웹 인프라 기업에 대한 의존성’ 문제가 도마 위에 오를 전망이다.
※ 클라우드플레어(Cloudflare)란? 전 세계 웹사이트의 보안과 속도를 책임지는 콘텐츠 전송 네트워크(CDN) 기업이다. 웹사이트로 들어오는 트래픽을 미리 걸러내 디도스(DDoS) 공격을 막아주고, 사용자와 가까운 서버에서 데이터를 전송해 속도를 높여주는 역할을 한다. '인터넷의 수문장'으로 불리지만, 이곳에 문제가 생기면 연결된 수많은 글로벌 서비스가 동시에 마비되는 치명적인 단점이 있다.
개발 적당히, 정치 적당히, 일상 적당히, 그냥 뭐든지 적당히만 하는 소프트웨어전공 대학생, 쏘가리입니다. / Profile Image by REN (Twitter @Ren_S2_)