데이터분석

5. 개인정보 보호

장수우 2023. 11. 24. 15:39
학습주제
  • 데이터 관련 주의해야할 이슈들
  • 개인정보란?
  • 개인정보 보호란?
  • 개인정보 보호법
주요 메모 사항 소개
  • 데이터 관련 최근 변화 (Gen AI 제외)
    - 데이터 소스와 양의 폭발적인 증가 (Data Warehouse → Data Lake)
    - 모든 조직에서 데이터 생성과 사용 증가
    - 데이터 사용자의 폭발적인 증가 (Data Democratization / SQL, Dashboard skill)
    - 클라우드 기본 사용
    - 개인정보 보호법의 강화
새로운 형태의 데이터 관리를 필요로 한다

 

  • 다양한 데이터 관련 이슈들이 발생한다.
    1. 무분별한 개인 정보 전파
      - GDPR 준수에 엄청난 비용과 시간이 들어간다.
      - 한번 테이블에 노출되면 불필요한 악순환 발생 (노출된 테이블 기반으로 생성된 다른 테이블로 전파)

    2. 같은 데이터, 다른 해석
      - 지표등의 정확한 정의 사전이 필요하다 → 데이터 사전 혹은 데이터 용어집
      - 데이터 소스, 필터링 등의 조건이 명확해야한다 → 데이터 기반 계산 공식
      - 같은 데이터를 기반으로 사용해야한다. (신뢰도)

    3. 너무 많은 대시보드와 비슷한 테이블들
      - Data Democratization은 정보 과잉으로 이어지기 쉽다.
      - Data Discovery 이슈
      - Data Infra 비용 증가

    4. 불분명한 데이터 오너쉽
      - 데이터 양의 증가는 보통 데이터 품질 이슈로 이어진다.
      - 누가 특정 데이터셋의 오너인가 명확해야한다(ETL / ELT)

    5. 조직이 커지면서 Data Silo 발생
      - 비슷한 일을 여러 팀에서 반복한다. (동일데이터 중복수집)
      - 데이터 독점이 권력이 되기도 한다.

  • 개인식별 정보(PII : Personally Identifiable Information)
    - 개인을 식별 할 수 있는 정보이다. 성명, 이메일주소, 전화번호, 신용카드정보 등
    - 몇가지 조합으로 개인을 식별할 수 있는 경우도 포함된다(준식별자 : 나이, 사는 도시, 직장)

  • 개인정보 보호
    - 개인의 정보를 적절한 동의없이 저장하고 사용하지 않는 것
    - 개인의 정보를 적절한 동의없이 노출하거나 배포하지 않는 것
    - 다양한 법률이 전세계적으로 만들어 지고 있다.
    - 해당 법률 준수가 데이터 카탈로그 / 거버넌스 도입의 가장 큰 이유
  • 개인정보 보호법
    • 국내 
      - 개인정보 보호법, 정보통신망법, 클라우드 컴퓨팅법
    • 미국
      - CCPA / CPRA,  HIPAA / ePHI, Cloud Act, Honest Ads Act, FOSTA, FCC Regulation
    • 유럽연합
      - GDPR
  • 내부위협과 외부위협
    • 내부위협
      - 내부 사람들의 단순한 실수에서 비롯된 Data Leak (기관에 따라 14% ~ 37%로 예측)
    • 외부위협
      - 해커, 랜섬웨어, 사이버 범죄조직, 국가 후원조작
  • GDPR
    - 2018년 5월 25일부터 시행된 유럽연합의 개인정보보호 법령
    - 유럽연합내 모든 회원국에 일괄 적용 (권고 아님)
    - EU 사용자가 있는 웹서비스의 경우 모두 적용대상이 된다.
    - 위반시 페널티가 존재 Level 1 = 매출액 2% or 1천만 유로 / Leve 2 = 매출액 4% or 2천만 유로 중 높은 금액을 낸다.

  • CCPA
    - GDPR 과 흡사하지만 캘리포니아 거주민으로 국한한다.
    - 2023년 1월 CPRA(California Privacy Rights Act)로 개정되었다.

  • 큰 회사들을 셀프 서비스 시스템을 만들어 대응 하기도 한다. (Google / Facebook / MS)
    - https://takeout.google.com/?pli=1
    - https://www.facebook.com/help/1701730696756992?_rdc=2&_rdr
    - https://account.microsoft.com/account/privacy?ru=https%3A%2F%2Faccount.microsoft.com%2Fprivacy&destrt=privacy-dashboard

 

공부하며 어려웠던 내용

 - 

반응형

'데이터분석' 카테고리의 다른 글

7. 효율적인 GPT 사용  (1) 2023.11.28
6. 공공데이터 포털 소개  (0) 2023.11.27
4. Gen AI  (1) 2023.11.23
3. 머신러닝 기초  (1) 2023.11.22
2. 지표(KPI)  (4) 2023.11.21