OpenAI의 대표 서비스인 ChatGPT와 Sora가 현지 시간으로 수요일 오후 3시(서부 시간)부터 약 6시간 동안 심각한 장애를 겪었습니다. 이번 장애는 개발자 API를 포함한 주요 서비스에 영향을 미쳤으며, OpenAI는 오후 9시경 대부분의 서비스를 정상화했다고 밝혔습니다.
문제 해결과 대응
OpenAI는 공식 트위터 계정을 통해 “오늘 ChatGPT, API, 그리고 Sora가 장애를 겪었지만 복구되었습니다”라고 공지하며, 사용자들에게 상황을 알렸습니다. 그러나 구체적인 장애 원인에 대한 설명은 여전히 부족한 상태입니다. 회사의 상태 페이지에 따르면 서비스는 오후 7시부터 점차 복구되기 시작했습니다.

장애 원인 가능성
장애 발생 당시 ChatGPT 웹사이트에는 “현재 ChatGPT를 사용할 수 없습니다. 문제를 식별했으며, 이를 해결하기 위해 작업 중입니다”라는 오류 메시지가 표시되었습니다. 흥미로운 점은 이번 장애가 Apple의 iOS 18.2 통합 론칭과 같은 날 발생했다는 것입니다. 이는 서버 트래픽의 급증으로 인한 장애 가능성을 시사합니다.
추가적으로, OpenAI는 최근 신규 서비스인 Sora를 공개하며 예상치를 뛰어넘는 사용자 관심을 받았습니다. 이로 인해 사용자를 제한하는 조치를 취하기도 했습니다. 이러한 상황이 이번 장애와 관련이 있을 가능성도 배제할 수 없습니다.
메타와의 연관성
이번 장애는 같은 날 메타(Meta) 제품에서도 글로벌 서비스 중단이 발생한 뒤에 이어졌습니다. 그러나 두 사건 간의 연관성에 대해서는 아직 명확한 근거가 나오지 않은 상태입니다.
연말 행사 중 발생한 장애
이번 장애는 OpenAI가 진행 중인 연말 행사 “12일의 선박 이벤트”의 다섯 번째 날에 발생했습니다. 이 행사는 OpenAI가 연말까지 매일 새로운 기술과 제품을 선보이는 대규모 프로그램입니다. 행사 일정 중에는 o1 추론 모델의 공식 출시, 강화 학습 연구 프로그램 발표, 그리고 Sora의 출시 등이 포함되어 있습니다.
향후 전망
이번 사건은 OpenAI의 핵심 서비스 안정성에 대한 우려를 불러일으켰지만, OpenAI는 빠른 복구를 통해 위기 관리 능력을 입증했습니다. 앞으로의 업데이트를 통해 장애 원인과 향후 대응 방안에 대한 명확한 설명이 추가되기를 기대합니다.