학습주제
- 데이터 관련 주의해야할 이슈들
- 개인정보란?
- 개인정보 보호란?
- 개인정보 보호법
주요 메모 사항 소개
- 데이터 관련 최근 변화 (Gen AI 제외)
- 데이터 소스와 양의 폭발적인 증가 (Data Warehouse → Data Lake)
- 모든 조직에서 데이터 생성과 사용 증가
- 데이터 사용자의 폭발적인 증가 (Data Democratization / SQL, Dashboard skill)
- 클라우드 기본 사용
- 개인정보 보호법의 강화
새로운 형태의 데이터 관리를 필요로 한다
- 다양한 데이터 관련 이슈들이 발생한다.
- 무분별한 개인 정보 전파
- GDPR 준수에 엄청난 비용과 시간이 들어간다.
- 한번 테이블에 노출되면 불필요한 악순환 발생 (노출된 테이블 기반으로 생성된 다른 테이블로 전파) - 같은 데이터, 다른 해석
- 지표등의 정확한 정의 사전이 필요하다 → 데이터 사전 혹은 데이터 용어집
- 데이터 소스, 필터링 등의 조건이 명확해야한다 → 데이터 기반 계산 공식
- 같은 데이터를 기반으로 사용해야한다. (신뢰도) - 너무 많은 대시보드와 비슷한 테이블들
- Data Democratization은 정보 과잉으로 이어지기 쉽다.
- Data Discovery 이슈
- Data Infra 비용 증가 - 불분명한 데이터 오너쉽
- 데이터 양의 증가는 보통 데이터 품질 이슈로 이어진다.
- 누가 특정 데이터셋의 오너인가 명확해야한다(ETL / ELT) - 조직이 커지면서 Data Silo 발생
- 비슷한 일을 여러 팀에서 반복한다. (동일데이터 중복수집)
- 데이터 독점이 권력이 되기도 한다.
- 무분별한 개인 정보 전파
- 개인식별 정보(PII : Personally Identifiable Information)
- 개인을 식별 할 수 있는 정보이다. 성명, 이메일주소, 전화번호, 신용카드정보 등
- 몇가지 조합으로 개인을 식별할 수 있는 경우도 포함된다(준식별자 : 나이, 사는 도시, 직장) - 개인정보 보호
- 개인의 정보를 적절한 동의없이 저장하고 사용하지 않는 것
- 개인의 정보를 적절한 동의없이 노출하거나 배포하지 않는 것
- 다양한 법률이 전세계적으로 만들어 지고 있다.
- 해당 법률 준수가 데이터 카탈로그 / 거버넌스 도입의 가장 큰 이유 - 개인정보 보호법
- 국내
- 개인정보 보호법, 정보통신망법, 클라우드 컴퓨팅법 - 미국
- CCPA / CPRA, HIPAA / ePHI, Cloud Act, Honest Ads Act, FOSTA, FCC Regulation - 유럽연합
- GDPR
- 국내
- 내부위협과 외부위협
- 내부위협
- 내부 사람들의 단순한 실수에서 비롯된 Data Leak (기관에 따라 14% ~ 37%로 예측) - 외부위협
- 해커, 랜섬웨어, 사이버 범죄조직, 국가 후원조작
- 내부위협
- GDPR
- 2018년 5월 25일부터 시행된 유럽연합의 개인정보보호 법령
- 유럽연합내 모든 회원국에 일괄 적용 (권고 아님)
- EU 사용자가 있는 웹서비스의 경우 모두 적용대상이 된다.
- 위반시 페널티가 존재 Level 1 = 매출액 2% or 1천만 유로 / Leve 2 = 매출액 4% or 2천만 유로 중 높은 금액을 낸다. - CCPA
- GDPR 과 흡사하지만 캘리포니아 거주민으로 국한한다.
- 2023년 1월 CPRA(California Privacy Rights Act)로 개정되었다. - 큰 회사들을 셀프 서비스 시스템을 만들어 대응 하기도 한다. (Google / Facebook / MS)
- https://takeout.google.com/?pli=1
- https://www.facebook.com/help/1701730696756992?_rdc=2&_rdr
- https://account.microsoft.com/account/privacy?ru=https%3A%2F%2Faccount.microsoft.com%2Fprivacy&destrt=privacy-dashboard
공부하며 어려웠던 내용
-
반응형
'데이터분석' 카테고리의 다른 글
| 7. 효율적인 GPT 사용 (1) | 2023.11.28 |
|---|---|
| 6. 공공데이터 포털 소개 (0) | 2023.11.27 |
| 4. Gen AI (1) | 2023.11.23 |
| 3. 머신러닝 기초 (1) | 2023.11.22 |
| 2. 지표(KPI) (4) | 2023.11.21 |