지난달 27일 발생한 국민은행 전산사고의 직접적인 원인은 메인프레임 3호기의 ‘DB(데이터베이스) 자동복구기능’ 작동 불능인 것으로 밝혀졌다.
국민은행은 3호기의 가동을 중단시킨 채 사실상 재해복구 효과를 내는 시스플렉스 체계내 메인프레임의 DB 자동복구 기능이 작동하지 않은 이유를 분석하고 있다.
한편 시스플렉스 외에 DB 복구에 영향을 미치는 디스크 결함에 관한 의혹도 제기되고 있어 이후 한국IBM과 한국EMC간의 책임소재를 둘러싼 공방이 확산될 것으로 예상된다.
2일 국민은행에 따르면 지난달 27일 오전 시스플렉스 체제내 3대의 메인프레임 중 3호기에서 장애가 발생했다. 국민은행은 즉각 3호기를 ‘가동 대기상태로’ 전환해 시스플렉스 체제에서 제외시켰다. 이 경우 제외된 시스템에서 처리하는 데이터를 자동복구시켜야 하는데 3호기의 3000개 DB중 7개에서 자동복구가 불가능하다는 메시지가 떴고 이를 수동복구하는 과정에서 1,2호기까지 가동을 중단시켜야 했다.
DB가 자동복구되지 않은 원인으로는 첫째, 시스플렉스내 CF(가상메모리)의 결함, 둘째, 메인프레임과 물려있는 디스크의 처리 오류 등 두가지로 좁혀지고 있다.
CF는 시스플렉스 체계에서 메인프레임간 트랜잭션 처리를 정리, 통제해 주는 일종의 가상메모리로써 데이터복구 절차에 따라 리커버리가 안된 디스크를 살려야 한다. 이 복구 절차가 정해진 규칙대로 실행되지 않아서 문제가 발생했을 가능성이 있다.
디스크 오류의 경우를 살펴보면 시스플렉스 체제내 시스템이 다운되면 먼저 시스템과 물려있는 디스크에서 데이터가 처리돼야 DB가 자동 복구되는데 디스크에서 반응이 없을 경우 이 기능이 실행되지 않을 수 있다는 지적이 제기되고 있다.
통합 이전인 지난 8월에도, 시스플렉스 체제로 구현된 옛 국민은행의 정보계 시스템이 정지된 사례가 있어 국민은행의 시스템 운영 미숙이 원인일 수 있다는 의견도 나오고 있다.
국민은행 관계자는 “시스템 결함과 운영 미숙이 반반정도 작용했겠지만 아직 정확한 원인이 밝혀지지 않아 뭐라고 단정지어 말할 수 없다”고 말했다.
사고발생 이후 국민은행은 결제가 집중되는 연말 거래의 안정성을 확보하기 위한 대책 마련에 들어갔으며 한국IBM은 관계자들의 대외 접촉을 차단한 채 사고원인 규명 작업을 벌이고 있다.
김미선 기자 una@fntimes.com