관련기사
[앵커]
조금전 보신 그 상황이 나의 일이라면 끔찍하고 심각하지요. 그런데 우리 공공기관에서 사용하는 보안 프로그램에 문제가 있습니다. 실제로 인터넷상에서 어떻게 검색이 이뤄지고 또 어디가 뚫려 있는건지 구민성 기자가 취재했습니다.
[리포트]
구글 등 검색엔진에서 몇 가지 검색어만 입력하면 어렵지 않게 개인정보가 담긴 PDF 파일을 찾을 수 있습니다. 그림 파일에서 글자를 뽑아내는 OCR 기술이 적용돼있기 때문입니다.
이형수 / 한국폴리텍대학 정보보안과 교수
"어떤 특정한 글자가 이루는 패턴과 비슷하다고 하면 데이터 베이스를 찾아내서 최종적으로 어떤 글자와 유사하다라는 걸…"
해당 기술로 직접 글자를 추출해봤습니다.
한 사회복지법인의 회의록인데, 왼쪽 그림 파일에서 오른쪽 텍스트 파일로 수십개의 주민등록번호를 순식간에 뽑아냅니다.
기술을 이용하면 거꾸로 이미지 파일에서 개인정보를 확인하고 이를 걸러내 유출을 막을 수 있습니다. 그런데 국내 공공기관 홈페이지는 텍스트 형태의 개인정보만 인식합니다. 검색엔진에서도 쉽게 찾아지는 그림 파일에 담긴 개인정보인데, 이를 걸러낼 수 있는 곳은 아직 한 곳도 없습니다.
공공기관 홈페이지 운영 규범에 '기술적 보호조치를 이행해야 한다'고 명시됐지만 어떤 조치도 이뤄지지 않은 겁니다.
행안부 관계자
"이미지, 사진에 있는 개인정보에 대해서 차단조치를 하고 있는데 (된 건 아니고 준비중이신거죠?) 저희들은…예 그렇습니다."
그림 파일 속 개인정보가 보호 대상의 사각지대에 놓여 있습니다.
TV조선 구민성입니다.