재해란 무엇일까요?
사전에는 이상적인 자연현상 또는 인위적인 사고가 원인이 되어 발생하는 사회적·경제적 피해를 재해라고 합니다.
그렇다면 IT 산업의 관점에서의 재해는 무엇일까요?
크게 나누어 보면 자연적 피해 또는 인재로 인해 전산시스템 가동이 전면 중단되고 허용 가능한 중단 시간을 초과하여 생기는 피해나 하드웨어나 소프트웨어의 오류로 발생한 시스템 불능 상태로서 수분에서 수시간 내에 복구가 가능한 피해로 나눌 수 있는데요. 요약하자면,
재해 및 장애로 인한 전산서비스 중지가 감내할 수 있는 시간을 초과하여 지속되는 피해를 재해라고 할 수 있다는 것이죠.
조금 더 나아가 비즈니스적인 관점에서의 재해는 어떻게 정의할 수 있을까요?
전산과 관련된 장애로 인하여 비즈니스 수행에 차질이 발생되는 피해 상황을 재해라고 할 수 있을 것 입니다.
IT업계에 종사한다고 하더라도 인프라 운영을 업으로 하지 않는 이상 재해라고 하면 소프트웨어적인 측면에서의 장애를 떠올리기 쉽습니다. 하지만 소프트웨어 적인 장애 뿐 아니라 소프트웨어가 올라가 있는 하드웨어 시스템의 장애 또는 네트워크 장애도 넓은 의미에서의 장애라고 할 수 있죠.
이렇게 재해에 대한 정의와 분류를 하다보니 우리 주변에서 생각보다 많은 종류의 재해가 발생하고 있음을 알 수 있습니다. 재해에 직면했을 때 우리는 자신의 안전이나 가족의 안전 혹은 친한 사람의 안전을 최우선으로 떠올리기 쉬울텐데요, 기업의 관점에서는 어떨까요?
좀 오래된 얘기일 수 있지만 재해에 제대로 대비하지 못한 기업은 약 70% 이상이 수년 내에 곤란한 상황에 직면한다고 합니다.
재해복구 서비스라는 개념은 사실 2000년대 초반 911 테러를 기점으로 본격적으로 논의 되기 시작했고 기업들도 재해가 몰고 오는 비즈니스 임팩트에 대해 진지하게 생각하게 되었고 나름대로 대처방안을 만들기 시작했죠.
기업의 재해복구 수준은 크게 다섯가지 정도로 구분할 수 있는데요,
대부분의 기업들은 3번 Diaster Recovery 수준에서의 재해복구 시스템을 구축하고 있습니다. 하지만 업무 연속성을 중요시하는 1금융권이나 2금융권에 속하는 기업들은 5번 Business Contiunity를 추구합니다.
그렇다면 비즈니스 연속성 계획이라 불리는 BCP(Buisiness Continuity Plan)이란 무엇일까요?
평상시 재해를 대비하여 조직, IT자원, 업무복구 절차 등을 준비하여, 실제 재해 발생시 시스템의 복구, 데이터 복구 등과 같은 단순 복구차원이 아닌 기업 비즈니스의 연속성(Continuity)을 보장할 수 있도록 하는 체계를 말합니다.
BCP는 전반적인 Crisis Management를 기반으로 하여 재해복구 (Disaster Recovery),
업무복구 및 재개 (Business Recovery & Resumption), 비상계획 (Contingency Planning) 등을 포함합니다.
재해복구 체계를 구축하는데는 4개의 핵심요소가 있는데요, BIA(Buisness Impact Analysis), 백업센터, 백업 방안, 운영 방안입니다.
재해가 비즈니스 서비스에 영향을 미치는 영향을 분석하는 프로세스인 BIA를 통해서 업무별 복구 우선순위를 정하고, RTO(복구 목표시간), RPO(데이터 복구 목표수준) 등을 도출해냅니다.
재해복구 센터의 운영 방안도 재해복구 체계의 수준을 결정하는 한 요소입니다. 위치부터 백업센터의 운영 형태, 백업을 구성하는 기술방향 같은 것이 주요 내용입니다.
다음편에서는 각 핵심요소별로 조금 더 알아보는 시간을 갖도록 하겠습니다.
'IT Note > Infrastructure' 카테고리의 다른 글
Graphite와 Collectd를 사용해 모니터링하기! (0) | 2021.03.29 |
---|---|
재해복구를 간단하게 알아봅시다(2) (0) | 2020.09.30 |
LoadBalancer Types: L3, L4, L7 (0) | 2020.08.05 |
데이터센터(Datacenter)란 무엇일까요? (0) | 2020.07.31 |
클라우드 전쟁, 멀티 클라우드는 선택이 아닌 필수 (0) | 2020.06.16 |