메뉴

검색

빅데이터

빅데이터시대,개인정보보호 위해 ‘비식별화’기술 필수

2016-04-05 06:26:00

빅데이터 시대, 개인정보보호 위해 ‘비식별화’기술 필수
최근 빅데이터 활용이 다양한 비즈니스 분야로 확대되면서 활용도와 정확도를 높여주는 분석 방안에 대한 관심이 높아지고 있다. 이와 함께 빅데이터에 포함된 개인정보 유출에 대한 우려는 빅데이터 활용 확산을 저해하는 요소로 고려되고 있다.
5일 업계 및 금융위원회에 따르면 금융회사와 핀테크업체 등이 비식별화된 데이터 활용을 통해 새로운 상품개발과 시장개척을 할 수 있도록 지원한다는 계획이다.
이를 위해 오는 8월, 비식별정보를 개인신용정보에서 제외하도록 신용정보법령을 개정해 금융회사 등이 비식별정보를 활용할 수 있는 근거를 마련하고, 금융회사 등이 적극적으로 빅데이터 활용에 동참할 수 있도록 금융권과 개인정보보호 전문가 등이 공동으로 비식별 지침도 마련하기로 했다.
빅데이터시대,개인정보보호 위해 ‘비식별화’기술 필수
▲ 빅데이터 활용을 위한 개인정보 비식별화 기술활용 안내서 (자료:미래창조과학부,한국정보화진흥원)
또 한국신용정보원이 다양한 통계 자료 등을 금융회사, 핀테크업체 등에 대해 제공할 예정이다. 한편, 방송통신위원회는 지난 1월 2016년 업무계획을 통해 수집된 개인정보가 누구의 것인지 알수 없도록 익명화시키는 비식별화된 정보의 활용이 가능하도록 법을 정비하겠다고 밝혔다. 비식별화된 정보를 보유한 기업이나 기관이 활용하고 향후 이용자가 요구하면 당사자의 개인정보를 삭제하는 방식이 거론된 상태다.
이러한 흐름에 맞춰 '비식별화' 기술 솔루션이 IT기업을 중심으로 속속 개발되고 있다. 데이터∙소프트웨어 보안 기업인 ㈜파수닷컴 (이하 파수닷컴, 대표 조규곤)이 빅데이터 분석 시 개인정보를 안전하게 보호하면서 데이터의 활용가치는 높여주는 개인정보 비식별화(De-Identification) 솔루션, ‘Analytic DID(애널리틱 디아이디)’를 4일 출시한다고 밝혔다.
빅데이터 활용 시 개인정보를 안전하게 보호하면서 가치 있는 분석 결과를 도출하기 위해서는 다양한 프라이버시 모델 제공과 최적화된 분석 알고리즘이 적용된 빅데이터 분석 환경이 꼭 마련되어야 한다. 데이터 유형 및 특징, 분석 목적에 따라 제공되는 데이터도 달라져야 하기 때문이다.
빅데이터시대,개인정보보호 위해 ‘비식별화’기술 필수
▲ 애널리틱 디아이디 작동 구조, 애널리틱 DID는 의사 결정에 도움을 줄 수 있도록 빅데이터 분석의 효용성과 위험에 대한 다양한 지표를 가시화해 제공해 준다. (사진:파수닷컴)
파수닷컴은 비식별화 기술을 기반으로 최적의 알고리즘이 적용된 개인정보 비식별화 솔루션, ‘애널리틱 디아이디’를 전문 컨설팅 서비스와 함께 제공한다. 애널리틱 디아이디는 의사 결정에 도움을 줄 수 있도록 빅데이터 분석의 효용성과 위험에 대한 다양한 지표를 가시화하여 제공해 준다. 권한 및 정책에 따른 사용 관리 및 익명화 위임 등을 통해 효율적인 업무 프로세스도 지원한다. 또한, 개인정보보호법, 빅데이터 진흥법, HIPPA* 등 빅데이터 활성화 관련 국내/외 컴플라이언스를 완벽하게 지원하여 안전하고 신뢰할 수 있는 빅데이터 사용 환경을 구축해 준다.
관련 사업본부를 맡고 있는 안혜연 부사장은 “빅데이터 활용이 금융, 기업, 의료기관 등 다양한 분야로 확산되고 있으며, 이를 마케팅, 신제품 개발, 고객 서비스 개선 등에 활용하며 엄청난 가치를 창출하고 있다.”라고 언급하며, “이번에 출시한 개인정보 비식별화 솔루션이 빅데이터에 포함된 개인정보 유출 걱정 없이 활용도 높은 분석 결과 제공을 지원함으로써 빅데이터 시장을 더욱 활성화 시키는데 도움이 될 것”이라고 밝혔다.
비식별화의 개념을 살펴보면 데이터 내에 개인을 식별할 수 있는 정보가 있는 경우, 이의 일부 또는 전부를 삭제, 또는 일부를 속성 정보로 대체 처리함으로써 다른 정보와 결합하여도 특정 개인을 식별하기 어렵도록 하는 조치를 말한다. 비식별화 대상 및 기준은 그 자체로 개인을 식별할 수 있는 정보 및 해당 정보만으로는 특정 개인을 알아볼 수 없더라도 다른 정보와 쉽게 결합하여 개인을 알아볼 수 있는 정보들을 대상으로 한다.
현재 비식별화에 활용되는 주요 기법으로는 ▲가명처리, ▲총계처리, ▲데이터 값 삭제, ▲범주화, ▲데이터 마스킹 등이 있다. 기술발전으로 완벽한 비식별화가 불가능하기 때문에 재식별 방지 등 사후관리가 강조되고 있다. 미국은 데이터 제공처에 재식별하지 않는 계약 조치가 필수적이고 영국은 최소한의 재식별 테스팅을 거치도록 하고 있다. 영국 감독청(ICO)은 지난해 말 ‘데이터 비식별화 실행 규칙’을 실시하고 있다.
◆ 비식별화와 관련된 주요 쟁점?비식별화 할 개인정보의 범위와 추후 재식별 가능성

빅데이터 환경하에 정보의 공유와 개방 요구는 점차 증대되고 기술발전이 진행됨에 따라 필연적으로 완벽한 개인정보보호를 보장하긴 어려운 것은 사실이다.

그러나, 개인을 식별할 수 있는 개인정보의 범위가 넓기 때문에 비식별화 해야하는 데이터의 범위도 명확치 않다는 문제가 있다. 즉, 현재는 개인식별이 되지 않는 정보라 판단하여 비식별화 처리없이 공개하더라도, 향후 동일한 정보를 이용해 개인을 식별할 수 있으면 개인정보 유출에 해당 될 위험이 있다는 설명이다.

빅데이터시대,개인정보보호 위해 ‘비식별화’기술 필수
▲ 빅데이터 활용을 위한 개인정보 비식별화 기술활용 안내서 (자료:미래창조과학부,한국정보화진흥원)
또, 비식별 개인정보는 공개 시점에 외부 데이터와의 조합을 통해 개인이 식별되거나, 향후 분석 기술이 진화하고 공개정보가 많아질수록 식별가능성이 커진다는 문제가 있다는 지적이다.
kt경제경영연구소 전수연 연구원은 '개인정보 비식별화 동향 및 시사점' 보고서를 통해 "더불어 업계가 자율적으로 비식별화 및 재식별 방지를 위한 지속적인 사후 관리를 통해 개인정보를 보호하고, 데이터 활용도를 높여 연관산업 발전과의 조화를 꾀해야 할 것"을 강조했다.

헤드라인

빅데이터 라이프

상단으로 이동