최근 국민은행 전산시스템 장애 사고가 발생하면서 국내 은행권의 시스플렉스(Sysplex:메인프레임 병렬처리시스템) 관리와 운영 노하우가 미흡한 것에 대한 우려의 목소리가 높아가고 있다.
지난 28일 오전 9시, 옛 국민은행의 정보계 시스템에서 가동되는 DB관리 소프트웨어에 장애가 발생하자 국민은행은 이를 복구하기 위해 계정계 시스템까지 중단시켰다.
이번 사건은 시스플렉스 환경에서 발생한 첫 사고라는 점에서 주목을 받고 있다.
옛 국민은행의 주전산시스템은 국내 최초로 구현된 시스플렉스 사례다. 옛 국민은행은 지난 99년부터 약 2년간 차세대프로젝트를 진행하면서 정보계와 계정계에 모두 IBM 메인프레임(IBM 9672) 기종을 도입하고 이를 병렬 처리하도록 했다.
시스플렉스란 IBM이 자사 메인프레임 기종의 처리용량을 늘리기 위해 기존 ‘MVS(메인프레임)’ 운영체제를 다중환경으로 전환시켜주는 고유의 클러스터링(Clustering)기술이다. 이 체제에서는 2대의 메인프레임 사이에서 CF라는 중간 CPU가 데이터를 교환해 주기 때문에 정보계 시스템에 문제가 생기더라도 계정계 시스템은 가동이 중단되지 않는다.
때문에 시스플렉스는 ‘무정지 무장애 시스템 가동’이라는 국내 은행들의 숙제를 해결했다는 평가를 받으며 약 2년전부터 금융권에 급속히 확산되는 추세다.
현재 기업은행이 차세대시스템을 시스플렉스 환경으로 구축하고 있으며 LG증권 등 대용량 거래를 처리해야 하는 대형 증권사들은 이미 1년전에 시스템 구축을 완료했다.
국민은행 역시 옛 주택은행과 옛 국민은행 시스템을 시스플렉스 형태로 통합하는 작업을 진행하고 있다. 문제는 국내 은행들이 무정지 무장애 시스템으로 각광받고 있는 시스플렉스를 제대로 운영하고 관리할 수 있는 인력과 노하우를 보유하지 못하고 있다는 사실이다.
IBM메인프레임을 사용하는 대부분의 은행들이 시스플렉스를 도입할 계획이고 국민은행의 통합 시스템 오픈이 당장 20일도 채 남지 않은 상황에서 국내에 이를 제대로 운영, 관리할 수 있는 인력이 없다는 것은 심각한 사실이다.
시스플렉스 시스템 자체는 어느 한쪽 부문의 가동이 중단돼도 다른 한쪽은 정상적으로 돌아간다. 이 상태에서 장애 원인을 파악해 재빨리 복구하면 시스템 가동을 중단시키지 않아도 된다. 그러나 현재는 장애가 발생하면 국내 은행 IT 인력들이 그 원인을 파악하고 복구하기까지 최소한 2~3시간이 걸린다. 근본적인 원인을 찾아내고 해결하는 것보다 시스템 전체의 전원을 한번 껐다 켜는 편이 빠른 것이 현실이다.
이번 국민은행 사고는 시스플렉스에 대한 국내 은행들의 이런 무지(無知)를 적나라하게 드러내고 있다. 실제로 하나은행은 올해 하반기에 시스플렉스 체제를 구축한다는 계획을 세웠다가 내부 직원들의 기술력과 운영 노하우 등이 부족하다는 판단하에 사업 자체를 내년으로 연기했다.
은행들이 이에 대한 인력과 노하우를 갖추려면 IT업체의 도움을 받아야 하지만 IT업계에도 시스플렉스 전문가가 부족해 이마저 어려운 것이 현실이다. 프로그램 개발자가 IBM의 시스플렉스 교육과정을 한달만 이수하면 연봉이 2배로 오를 정도다.
한 대형 SI업체 관계자는 “원론적인 얘기지만 중장기적으로 은행들이 시스플렉스 관련 기술을 최대한 빨리 습득하고 운영 체제를 정비하는 것이 최선의 해결책”이라고 말했다.
김미선 기자 una@fntimes.com