리탈, IT 시스템 고장 위험 감지 및 최소화

 

IT 전문가가 없는 회사에서 IT 시스템을 감시하고자 한다면 모니터링 소프트웨어가 중요한 역할을 한다. 이 소프트웨어는 전체 데이터 센터를 중심으로 인프라를 자동 감시한다.

크리스티안 아벨스(Christian Abels): Rittal GmbH & Co. KG 제품 커뮤니케이션 컨설턴트

오늘날 많은 기업들은 지속 가능한 IT 시스템에 의존하고 있다. 이러한 IT 시스템의 고장은 곧 신뢰 추락과 비용 초래를 의미한다. 2018년 독일의 기업들은 평균 22시간의 IT 시스템 고장 시간을 기록하였고, 이로 인한 추정 비용은 675,000유로(원화로 약 9억 원)에 달한다. Dell의 Global Data ProtectionIndex(글로벌 데이터 보호 인덱스)의 보고에 따르면 데이터 손실 시 경제적인 총 피해액이 대략 1백만 유로로 보고되었다. 이뿐만 아니라 고객과 파트너의 신뢰를 크게 잃을 수도 있다. 이러한 수치는 자사 IT 환경 점검이 얼마나 중요한지를 반증한다. 따라서 DCIM(데이터 센터 인프라 관리)을 위한 소프트웨어 도구는 각 IT 환경에서 매우 중요한 수단에 속한다. 중소기업에게 DCIM은 IT 환경의 사고 방지를 개선하는 이상적인 도구이다. 감시 솔루션은 서버 캐비닛과 전류 공급 그리고 공조에 혹시 문제가 없는지 지속적으로 감시하고, 이상이 있을 경우 기술자와 건물 보안팀에게 조기에 알려야 한다.

성공적으로 시작하는 방법

온도 모니터링은 효율적이고 안전한 IT 운영을 위한 최소한의 요건이다. IT 환경을 모듈 방식으로 구성되는 컴퓨터 멀티 컨트롤(CMC) III을 통해 효율적으로 감시할 수 있다.

IT 매니저는 구체적인 모니터링 계획을 세우기 전에 모니터링 솔루션의 복잡성부터 줄여야 한다. 사용 가능한 DCIM 소프트웨어의 모든 기능을 상세히 살피고, 에너지 관리를 중심으로 핵심 변수와 가용성 그리고 안전 관리 매개변수에 집중해야 한다. ITIL 지향 프로세스(IT 인프라 라이브러리) 감시 방향으로 DCIM 지원을 확장하는 것은 중소기업에 과도한 부담이 될 수 있다. 따라서 이번 프로젝트는 여러 인프라 구성 요소를 넘어 DCIM 소프트웨어를 단계 별로 도입하기 위해 다수의 하위 프로젝트로 분할해야 했다.

고장에 대한 안전성을 높이는 중요한 요소 가운데 하나는 서버에 이르는 전체 전류 공급을 모니터링하는 것이다. 전류 공급 관련 구성 요소가 고장 나면, 서버에 전류가 흐르지 않게 된다. UPS(무정전 전원 공급 장치)는 고장 시에만 사용되는 것이 아니다. 1차 회로와 2차 회로를 분리하고 모든 전원 장애를 걸러내기 때문에 UPS 모니터링은 반드시 필요하다. 또한 냉각 기능이 작동하지 않는다면 장치가 과열되기 때문에 열 생성에서 분배와 배출에 이르기까지 항상 점검이 이루어져야 한다.

이는 소프트웨어만으로는 충분하지 않다. 기업들은 지속적인 IT 운영을 위해 모든 부서와 직원들을 모니터링에 연결하는 광범위한 컨셉트를 적용해야 한다. 예를 들면 IT 부서 외에 설비 관리, 잠재 보안 구축, 가용성 요구 사항 및 산업에 따라 온라인 판매 및 생산 전문가를 포함한다.

DCIM 모니터링 장치 적용은 어렵지 않다. 공급자는 외부 장치 통합을 위해 사용하는 드라이버를 제공한다. 유연하게 구성할 수 있는 프로토콜 컨버터가 원하는 측정값을 IT 컨트롤 센터로 전달하고, 컨트롤 센터에서 모니터링 결과를 표준화된 방식으로 단순화한다.

운영 개념과 책임은 계속 증가해 왔다. 따라서 IT 관리자는 새로운 DCIM 솔루션을 도입하면서 기존 구조에 의문을 제기해야 한다. 책임을 재구성함으로써 예를 들어 건물 보안을 직접 알람 체인에 포함시키면 보다 합리적으로 할당하거나 경보를 실용적으로 실현할 수 있다.

DCIM 솔루션은 전체 데이터 센터 모니터링을 위해 설계되어 폭넓은 범위의 기능을 제공한다. 몇 개의 서버 캐비닛만 운영하는 것은 각각의 랙 제조사가 제공하는 소프트웨어만으로도 충분하다. 리탈(Rittal)은 Rizone솔루션과 함께 좁은 환경에서도 유용하고 신속하게 복잡한 인프라를 모니터링하는 모듈 방식의 DCIM 어플리케이션을 제공한다.

             초기 조사는 사내 IT 보안 수요를 확인하는 데 도움이 된다. 핵심 질문은 다음과 같다. 사업에 어떤 IT 시스템이 필수적인가? IT 시스템에서 영구적으로 수행해야 하는 관리 작업은 무엇인가? IT 전문 직원이 항상 상주하는가? IT 위치가 하나뿐인가 아니면 여러 곳에 존재하는가? IT 기술자는 첫 번째 단계에서 보안 수요를 산정하고 그로부터 모니터링을 위한 개념을 도출할 수 있다. IT 시스템은 온도, 에너지 공급, 출입 보안 및 화재 예방을 감시해야 한다. 또한 서버 랙이 있는 방에 물이 통과하는 파이프나 난방 파이프가 통과한다면 습기 센서를 설치하는 것도 적극 고려해야 한다.

공조 요소와 전력 백업 및 분배를 위한 구성 요소는 일반적인 네트워크 프로토콜을 통해 관리 소프트웨어와 통신한다. 습기, 소비 전력, 인클로저 도어의 개방 상태 및 온도 등의 수많은 작동 매개변수에 대한 센서들을 콘솔에 연결할 수 있다. 건물 보호를 위한 네트워크 프로토콜인 Bacnet과 같은 표준화된 인터페이스를 통해 소프트웨어를 설비 관리에도 연결할 수 있다. 전반적인 데이터 이미지로부터 IT 시스템 및 관련 인프라의 현재 상태에 대해 정확한 그림을 작성할 수 있다.

DCIM 애플리케이션으로 데이터 센터의 비용을 최적화하고 투명하게 분류할 수 있다. 이는 IT와 시설 관리가 IT 환경 운영에 동등하게 관여하는 경우에 매우 유용하다. 명확한 주요 수치, 동향과 소비자 중심의 결산은 IT 조직이 경제적으로 수익을 낼 수 있도록 구성하고 전체적인 거래에서 비용을 구분하는 데에 도움이 된다. IT 운영 비용을 최적화하고자 한다면 먼저 소비 전력을 정확히 확인해야 한다. 효율적인 에너지 관리의 기본은 얼마나 많은 전류를 서버와 네트워크 구성 요소들이 소비하는 하는가에 달려 있다. 측정 기능이 있는 PDUs (Power Distribution Units, 전력 분배 장치)은 IT 인클로저내 소비 전력을 자세히 보여준다. 이 값은 소수의 서버 랙만 운영하는 경우, 종래의 전기 계량기 등의 설비 관리를 통해 확인할 수 있다.

Micro Data Center는 필요에 따라 최대 F90 및 IP56의 물리적 IT 보호를 책임진다.

             DCIM 애플리케이션이 지속적인 IT 운영에 영향을 줄 수 있는지를 책임자들이 잘 모르는 경우가 많다. 하지만 DCIM 플랫폼 공급자들은 IT 인프라가 느려지지 않고 문제없이 작동할 수 있도록 솔루션을 최적화하였다. 예를 들어 리탈의 DCIM 소프트웨어 Rizone은 이러한 목적에 맞추어 Windows 서버 상에서 운영되어 자체 리소스가 충분하다.

DSGVO (데이터 보호 일반 규정)와 Basel II 같은 규정은 기업이 데이터 보호와 IT 보호에 관한 특정 표준을 준수하도록 규제한다. 여기에는 누가 언제 IT 시스템에 접근했는지 기록하는 것이 포함된다. 또한 모니터링 솔루션은 언제 서버 캐비닛 도어가 열렸는지도 기록해야 한다. 이는 IT 랙이 기술실에 있거나 인쇄실에 있는 경우에 특히 중요하다. 리더기와 결합된 전자 손잡이를 사용하면 여러 사람의 접근을 상세히 자동으로 기록할 수 있어 보안 증대에 도움이 된다.

모니터링 그 이상

IT 관리자는 DCIM을 이용하여 데이터 센터를 프로세스가 완전 자동화된 IT 공장으로 쉽게 전환할 수 있다. 이전에는 IT 구성 요소를 수동으로 정비하고 감시하였다면, 이상적인 데이터 센터는 광범위하게 자율적으로 적용 가능하다. 다양한 워크 로드에 필요한 IT 리소스는 필요에 맞게 IT 인프라를 사용할 수 있고, 사용자 부담 원칙에 따라 소비된 전력을 계산한다. 따라서 비용은 IT 운영 관련자들에게 분배되고 각 지점은 이를 확인할 수 있다. DCIM은 에너지 공급과 공조를 인프라 측면에서 보호하고 IT 랙 주변의 물리적 보호를 감시하며, 인프라와 활성 IT 구성 요소 간에 다리를 구축하는 데에 도움이 된다. 이를 통해 높은 수준의 자동화는 전략적으로 데이터 센터를 개발할 수 있는 더 많은 여지를 제공한다.