반응형
개인정보 비식별화의 개요
비식별 정보
- 정보의 집합물에 대해 "개인정보 비식별 조치 가이드라인"에 따라 적정하게 '비식별 조치'된 정보를 의미
비식별 조치
- 정보의 집합물에서 개인을 식별할 수 있는 요소를 전부 또는 일부 삭제하거나 대체 등의 방법을 통해 개인을 알아볼 수 없도록 하는 조치
비식별 정보의 활용
- 비식별 정보는 개인정보가 아닌 정보로 추정
- 정보 주체로부터의 별도 동의 없이 해당 정보를 이용하거나 제3자에게 제공 가능
- 불특정 다수에게 공개되는 경우, 다른 정보를 보유하고 있는 누군가에 의해 해당 정보주체가 식별될 가능성이 있으므로 비식별 정보의 공개는 원칙적으로 금지
비식별 정보의 보호
- 개인정보가 아닌것으로 추정되지만 새로운 결합 기술이 나타나거나 결합 가능한 정보가 증가하는 경우에는 정보주체가 '재식별'될 가능성 존재함
- 비식별 정보를 처리하는자(또는 제공 받는 자)가 해당 정보를 이용하는 과정에서 재식별하게 된 경우, 해당 정보를 즉시 처리중지하고 파기해야 함
- 비식별 정도라도 필수적인 관리적/기술적 보호조치 이행되어야 함
개인정보 비식별화 조치 가이드라인
개인정보 비식별화 조치 가이드라인의 추진배경
- 정부 3.0 및 빅데이터 활용 확산에 따른 데이터 활용 가치 증대
- 개인정보 보호 강화에 대한 사회적 요구 지속
- '보호와 활용'을 동시에 모색하는 세계적 정책변화에 적극 대응 필요
개인정보 비식별화 조치 가이드라인의 단계별 조치사항
단계 | 조치사항 | 데이터 |
사전 검토 | - 개인정보에 해당하는지 여부 검토 - 개인정보가 아닌 것이 명백한 경우 법적 규제 없이 활용 |
개인정보, 식별정보 |
비식별 조치 | - 정보 집합물(데이터 셋)에서 개인을 식별할 수 있는 요소 기준 - 요소의 전부 또는 일부를 삭제하거나 대체하는 등의 방법 활용 - 개인을 알아볼 수 없도록 하는 조치 |
가명, 총계, 삭제, 범주화, 마스킹 |
적정성 평가 | - 다른 정보와 쉽게 결합하여 개인을 식별할 수 있는지 평가 - '비식별 조치 적정성 평가단'을 통해 평가 |
k-익명성, l-다양성, t-근접성 |
사후 관리 | - 비식별 정보 활용 과정에서 재식별 방지를 위해 필요한 조치 수행 |
관리적/기술적 보호조치 |
* k-익명성 : 동일한 값을 가진 레코드를 k개 이상으로 하여 특정 개인을 식별할 확률을 1/k로 함
* l-다양성 : 각 레코드는 최소 1개 이상의 다양성을 가지도록 하여 동질성 또는 배경지식 등에 의한 추론을 방지
* t-근접성 : 전체 데이터 집합의 정보 분포와 특정 정보의 분포 차이를 t 이하로 하여 추론 방지
개인정보 비식별화 조치 가이드라인의 조치방법
- 가명 처리
- 개인정보 중 주요 식별 요소를 다른 값으로 대체하는 방법
- 값을 대체 시 규칙이 노출되어 역으로 쉽게 식별할 수 없도록 주의
- 예시 : 피카츄, 20세, 서울 거주, 서울대 재학 > 라이츄, 20대, 서울 거주, 티스토리대학 재학
- 총계 처리
- 데이터의 총합 값을 보여주고 개별 값을 보여주지 않는 방법
- 특정 속성을 지닌 개인으로 구성된 단체의 속성 정보를 공개하는 것은 그 집단에 속한 개인정보를 공개하는 것과 마찬가지이므로 주의
- 예시 : 피카츄 150cm, 라이츄 155cm, 파이리 153cm > 포켓몬 평균키 153cm
- 데이터 삭제
- 데이터 공유나 개방 목적에 따라 데이터 셋에 구성된 값 중 필요 없는 값 또는 개인식별에 중요한 값을 삭제하는 방법
- 예시 : 주민등록번호 900413-2345678 > 90년대생 여성
- 데이터 범주화
- 데이터의 값을 범주의 값으로 변환하여 값을 숨기는 방법
- 예시 : 피카츄, 5세 > 전기타입 포켓몬 1~10세
- 데이터 마스킹
- 개인을 식별하는데 기여할 확률이 높은 주요 식별자를 보이지 않도록 처리하는 방법
- 남아 있는 정보만으로 개인을 식별할 수 없어야 함
- 공개된 다른 정보와 결합하더라도 특정 개인을 식별할 수 없어야 함
- 예시 : 피카츄, 20세, 서울 거주, 서울대 재학 > 피ㅇㅇ, 35세, 서울 거주, ㅇㅇ대 재학
참고
반응형