본문 바로가기

IT 지식

[1일 1로그 100일 완성 IT지식] 메타데이터에 관한 불편한 진실

해당 글 <메타데이터에 관한 불편한 진실>에서 요약된 목차

  

4부 - 데이터  

    086. 메타데이터에 관한 불편한 진실

 

메타데이터란?

 

데이터는 여러 유용한 서비스의 원료로, 현대 산업의 가장 중요한 자원으로 불리고 있다. 각 데이터는 세부 정보를 포함하며 이것을 메타데이터라고 부른다.  

 

스마트폰으로 촬영한 사진의 메타데이터에는 스마트폰 모델명, 촬영 시각, 위치 정보가 담겨 있다. (참고 자료 1) SNS에 올린 음식 사진의 메타데이터를 통해 누가 언제 어디에 머물렀는지 특정할 수 있는 것이다.  개인 정보와 무관해 보이는 데이터라도 그 데이터의 메타데이터는 개인을 드러낼 수 있다. 

 

특히 여러 출처에서 온 메타데이터의 결합은 개인 정보 유출 위험을 더 높인다. 예를 들어, 검색 엔진은 모든 쿼리를 기록하며 쿼리를 보낸 IP 주소와 이전 방문에서 생긴 쿠키도 함께 기록한다. 여기서 쿼리를 데이터, IP 주소와 쿠키를 메타데이터로 볼 수 있다. 

 

수 많은 메타데이터의 결합  

 

IP 주소는 그 자체로 개인을 특정하기 어려우나[각주:1]다른 정보[각주:2]와 결합하면 개인을 특정할 수 있다. 쿠키[각주:3]또한 여러 개의 쿠키를 종합하거나 다른 정보[각주:4]와 결합하면 개인을 식별할 가능성이 높아진다.  

 

서로 무관해 보이는 데이터라도 그들끼리 결합하면 예상 밖의 많은 정보를 알아낼 수 있다. 이미 세상은 개인에 대해 많은 것을 파악하고 있으며, 시간이 갈수록 커지는 데이터 시장에 따라 더 많은 정보를 입수하게 될 것이다.


Read me seconds.

 

온라인 개인 정보 보호를 위한 시도 

 

현재 구글이 개발 중인 프라이버시 샌드박스는 사용자 개인정보 보호를 강화하는 새로운 기술이다. 핵심 목표는 서드파티 쿠키[각주:5]수집을 차단해 사용자에 대한 추적을 제한하면서 구글이 수집한 데이터 내에서 광고 정보를 제공하여 광고 효율의 저하를 막는 것이다. (참고 자료 2)

 

서드파티 쿠키는 웹사이트 소유자가 동의하지 않은 데이터를 만들고 다른 용도로 재사용할 수 있게 해 개인 정보 유출 경로가 된다. 이에 파이어폭스, 사파리는 오래전부터 서드파티 쿠키 사용을 제한했다. 구글은 단순히 서드파티 쿠키 사용 제한만 하는 게 아니라 광고 수익과 관련된 효과적인 대안을 마련해야 한다고 주장하며 프라이버시 샌드박스를 대안으로 제시하고 있다. 

 

구글은 유튜브, 구글 검색 등 엄청난 규모의 자사 서비스를 보유하고 있으니 데이터를 '수집'하는 건 문제 없을 것이다. 그렇지만 크롬이 전 세계 인터넷 트래픽에서 65%를 차지하고 있는 만큼 구글 의존도가 더 높아질 우려는 있다. 또한 기존 쿠키보다 소비자 타겟팅이 어려워 광고 가격이 하락할 것이라는 전망이다. 

 

프라이버시 샌드박스가 구체적으로 어떻게 개인 정보를 익명화하는 지는 참고 자료 5에서 쉽게 설명하고 있다. 


참고 자료

  1. 김윤진, "페이스북 회원이 유의해야 할 개인정보 수집, 예방법은?", 뉴스 로드, 2021.10.27.
  2. 구글, "Privacy sandbox", 링크
  3. 황치규, "구글, 서드파티 쿠키 제거 마침내 스타트...온라인광고 업계 반발 계속", 디지털투데이, 2024.01.05. 링크
  4. Michael Crider, "웹 흔적을 모아 사용자 특정하는 '디지털 지문' 이해하기", ITWORLD, 2023.04.17. 링크
  5. 한동욱, "구글 크롬 서드파티 쿠키 지원 중단", TBWA DATA LAB, 2024.01.17. 링크

용어 설명

  1. IP 주소로만 개인을 특정하기 어려운 이유 : 일정 주기로 바뀌는 동적 IP 주소 사용, 여러 사람이 하나의 IP 주소 공유, VPN 사용 등 [본문으로]
  2. 개인 특정을 위해 IP 주소와 결합할 수 있는 다른 정보의 종류 : 웹사이트 방문 기록, 온라인 구매 기록, SNS 활동, 기기 정보, 위치 정보 등 [본문으로]
  3. 쿠키 : 서버와 사용자의 웹 브라우저가 통신할 때, 서버에서 전송하는 작은 데이터 조각. 사이트 방문 이력, 이용한 페이지와 같은 정보를 기록함. [본문으로]
  4. 개인 특정을 위해 쿠키와 결합할 수 있는 다른 정보의 종류 : IP 주소, 위치 정보, 기기 정보 등 [본문으로]
  5. 서드파티 쿠키 : 쿠키는 크게 퍼스트 파티(first-party), 서드파티(Third-party) 쿠키로 나눠지는데, 퍼스트파티 쿠키는 웹사이트 운영자가, 서드파티는 외부 업체가 심는 것이다. 애드테크 회사들은 서드파티 쿠키를 통해 여러 사이트를 이동하며 사용자 행동을 추적한다. 이를테면 사용자 A씨가 B에서 C사이트로 이동했을 때 타깃 광고를 계속 제공하는 것이다. (참고 자료 3)[/footnote]사용과 디지털 지문[footnote]디지털 지문 : 인터넷 사용자의 소프트웨어 및 하드웨어 정보에서 수집되는 광범위한 정보를 말한다. 대표적인 예로 사용하는 웹 브라우저, 운영체제 유형, 브라우저 확장 프로그램, 기기 타입, 기기에 설치된 프로그램과 애플리케이션 등이 있다. (참고 자료 4) [본문으로]