[일요시사 취재1팀] 김철준 기자 = 자칭 디지털강국이 무너졌다. 올해 들어 4번이나 전산망에 문제가 생겼다. 정부는 명확한 원인을 밝히고 있지 않다. 정부가 지방행정전산서비스 개편 TF를 구성한 만큼 후속 대응에 관심이 쏠린다.
정부 인증시스템상의 네트워크 장비 오류로 정부 행정전산망에 장애를 겪었다. 하지만 정부는 장비 고장의 구체적 원인과 백업시스템이 미작동한 이유에 대해서 속 시원한 답을 내놓지 못하고 있다.
지난 17일, 새올행정시스템에 접속하는 길목인 GPKI(행정전사서명인증서) 인증시스템에 장애가 발생했다. 같은 날 12시쯤 이를 복구해 정상 가동했으나 오후 1시 다시 시스템 장애가 발생해 서비스가 전면 중단됐다.
전면 중단
고기동 행정안전부(이하 행안부) 차관은 지난 19일, 정부서울청사 브리핑서 “지방행정전산서비스는 모두 정상화됐다”고 발표했다. 행정망 마비가 발생한 지 사흘 만이다. 고 차관은 이번 장애의 원인으로 새올 인증시스템에 연결된 네트워크 장비의 장애를 지목했다.
정부는 GPKI 인증시스템의 서버 등을 모두 분석해 네트워크 장비(L4스위치, 이하 L4)에 이상이 있음을 확인했다. 18일 새벽 이 장비를 교체하고 서비스를 정상 재개했다.
다만 문제 장비는 찾았으나 오류의 구체적 원인은 나오지 않고 있다는 지적이 나온다. 서보람 행안부 디지털정부실장도 브리핑 당시 “L4 장비 안에서 어떤 부분이 실제로 문제를 일으켰는지는 조금 더 면밀한 조사를 거쳐서 확정할 수 있을 것 같다”며 명확한 원인을 밝히지 못했다.
문제가 된 장비는 트래픽을 분산해 속도를 높이는 장치인 L4 장비다. 통상 네트워크 영역을 뭉뚱그려 ‘네트워크’라고 분류하지만 업계에서는 이를 L1부터 L7까지 7개 계층으로 구분한다.
이중 L4는 부하분산(로드밸런싱, Load Balancing)을 담당하는데 복수의 서버를 한 대처럼 묶어서 사용할 수 있도록 하는 역할을 한다. 애플리케이션 딜리버리 컨트롤러(ADC), 부하분산 장비라고도 불린다.
L4는 서버에 전달되는 수많은 요청을 우선순위에 따라 배분해 원활하게 가동될 수 있도록 하는 역할을 한다. A 창구(서버)에 사람(트래픽)이 많이 몰렸다면 비교적 한산한 B 창구(서버)로 사람(트래픽)을 유도함으로써 서비스가 장애 없이 잘 유지될 수 있도록 하는 것이 골자다.
이번 행정망 마비는 L4를 거쳐 서버에 요청이 가는데 L4가 이를 전달해 주지 않아서 생긴 것이다. 대체용 스위치가 있었지만 이마저도 고장 난 것으로 알려졌다. 하지만 하드웨어적인 문제였는지 소프트웨어적인 문제였는지 밝혀지지 않았다.
정부 전산망이 행정망 마비 사태 장애 복구 완료 선언 사흘 만에 또 오류를 일으키기도 했다. 행안부에 따르면 22일 오전 11시45분경 각 기초자치단체 주민센터서 20여분간 주민등록 등본, 초본 발급이 지연됐다. 이번 오류는 지난 17일 전산마비 주범인 새올 지방행정시스템 문제가 아니라 차세대 주민등록시스템서 발생한 것으로 알려졌다.
초유 행정전산망 올스톱
올들어 벌써 4번째 오류
이번 행정망 마비를 포함해 올해 들어 벌어진 국가전산망 마비는 네 번째다. 세계 최고의 디지털기술을 보유하고 있다고 자부하며 디지털 강국이라는 자찬도 무색해졌다.
지난 3월에는 법원 전산 시스템이 마비됐다. 데이터를 이관하던 중 오류가 발생해 소송 업무의 근간이라고 할 수 있는 전자소송시스템이 중단돼 일부 소송 일정이 미뤄졌다.
지난 6월에는 교육부의 4세대 교육행정정보시스템(NEIS·나이스)이 개통 직후 오작동했다. 당시 일선 학교서 기말고사 문항정보표가 유출되는 등 교육 현장에서는 ‘대혼란’이 일기도 했다.
일각에서는 정부가 대기업이 공공 전산망의 구축·관리에 참여하지 못하도록 하는 ‘공공 소프트웨어 대기업 참여제한 제도’가 문제라는 지적이 나온다.
참여제한 제도는 소프트웨어 관련 공공 프로젝트에 대기업이 참여하지 못하도록 하는 제도다. 참여제한 제도가 시행되고 최저가 입찰제로 기술력과 상관없이 저렴한 소프트웨어와 시스템을 공공기관서 낙찰한다는 문제 제기도 이어졌다.
새올 시스템과 나이스를 비롯한 정부 행정망은 모두 중소기업이 운영·관리를 맡고 있다. 국가행정망은 관리 주체인 국가정보자원관리원의 공무원 300여명(대전 본부 171명)이 관리·감독하고 실제 시스템 작업은 400여명의 협력업체 직원이 한다.
하지만 협력업체에는 잦은 인사와 이직으로 제대로 된 인수인계도 되지 않는 상황이다.
한 정보통신업계 관계자는 “대기업 SI가 지난 십몇년간 공공 (IT) 시장에 우수 인력을 공급하는 사관학교였다”며 “그러나 일정 규모 이하 정부 입찰에 대기업 참여가 제한되면서 기업서 우수 인력을 훈련시켜 공급하는 역할을 못하게 된 것이 이번 문제서도 드러났다”고 지적했다.
이어 “올해 들어 벌써 국가전산망이 네 번째 마비됐다”며 “이는 기술력도 인력도 부족한 중소기업에 국가기간망을 맡겨 사후대책이 미흡하다는 것을 방증하는 셈”이라고 꼬집었다.
디지털 재난에 대응할 정부 차원의 매뉴얼이 제대로 갖춰져 있지 않은 점도 문제다. 행안부 등에 따르면, 재난안전기본법에 따라 위기관리 매뉴얼을 만들어야 하는 41개의 위기 상황 유형에 ‘행정전산망 사고’는 포함돼있지 않다.
이번 사태 당시 행안부 국가정보자원관리원은 ‘장애관리절차서’라는 내부 매뉴얼에 따라 전산망 복구에 나섰다. 그러나 이 매뉴얼은 실무 차원의 내용일 뿐 위기 때 관계부처와의 상황 공유 등의 내용은 빠져 있는 것으로 알려졌다.
마비 근본 원인은?
“원인 규명이 우선”
행정전산망 사고에 대한 정부 차원의 위기 대응 체계가 부실하다 보니 전산 마비 때 민원 대응 매뉴얼이 없었고 일선 지자체 현장에선 혼선이 가중되기도 했다.
전문성 문제도 두드러졌다. 행안부나 유관기관들이 정부 시스템에 대한 운영 프로세스나 매뉴얼, 장비 간의 종속성, 서비스 간의 종속성을 파악하지 못하고 있을 확률이 크다는 것이다.
업계서도 단순 네트워크 문제로 사흘간이나 국가 행정망이 마비될 수 없다고 입을 모은다.
한 업계 관계자는 “(L4와 같은)스위칭 장비 서버는 라우터에 밀착해 있어 시스템이 꺼져도 전원을 가동하면 문제가 생각보다 빨리 해결되는 편”이라며 “사전 대응책 준비가 부족한 게 초유의 장기간 접속 오류를 빚은 것 같다”고 진단했다.
이어 “L4를 셧다운시키고 장애 복구에 나서더라도 애플리케이션 단에서의 시스템 및 구조를 이해 못할 경우, 애플리케이션 단 장애가 어디까지 확산돼있는지를 이해를 못하면 문제가 생길 수밖에 없다”고 주장했다.
이밖에 ‘디지털 정부’의 실현을 위해서는 국가 시스템 장비 노후부터 해결해야 한다는 목소리도 나온다. 현재 장비는 내구연한이 10년을 초과한 장비가 대다수라 업체가 바뀌더라도 사태의 재연 가능성이 크다는 지적도 나온다.
전문가들은 제도, 전문성, 후속 대처 방안의 문제보다 원인 규명이 먼저라는 입장이다. 김승주 고려대 정보보호대학원 교수는 “사태 초기 대응부터 원인 규명조차 안 되고 있다”며 “국민들이 납득할만한 책임 규명을 할 필요가 있다”고 말했다.
이삼열 연세대 행정학과 교수도 “누가 문제인지 손가락질하기 전에 모든 정보를 공개해 전문가들의 숙의를 거쳐야 한다”고 주장했다.
부실 복구?
정부는 지난 21일 ‘지역행정전산서비스 개편 TF’를 구성했다. TF엔 민관 관계자가 대거 참여한다. 공동팀장인 고기동 행안부 차관과 송상효 숭실대학교 교수를 비롯해 산학계 민간 전문가와 행안부, 국방부, 국정원, 한국인터넷진흥원, 한국지능정보사회진흥원, 한국지역정보개발원, LG, 네이버 등 관계 기관이 참여하게 됐다. 필요 시 전문가와 다른 기관도 추가적으로 참여를 요청할 방침이다.
고 차관은 “민관이 협력해 신속하고 정확하게 장애원인을 분석하고 이런 장애 상황이 다시는 일어나지 않도록 재발 방지 종합대책을 수립하기 위해 TF를 구성했다”며 “이번 일을 계기로 더 안정적이고 신뢰할 수 있는 서비스를 제공하는 정부로 거듭나겠다”고 말했다.
<kcj5121@ilyosisa.co.kr>