Co je deanonymizace
De-anonymizace je technika v těžbě dat, která znovu identifikuje šifrované nebo zobecněné informace. Deanonymizace, také označovaná jako opětovná identifikace dat, křížové odkazy na anonymizované informace s dalšími dostupnými údaji za účelem identifikace osoby, skupiny nebo transakce.
PORUŠENÍ DEN Anonymizace
Technologicky důvtipná éra rychle narušuje tradiční způsob, jak dělat věci napříč různými sektory hospodářství. V posledních letech došlo ve finančním sektoru k mnoha digitálním produktům představeným do tohoto odvětví finskými společnostmi. Tyto inovativní produkty podporovaly finanční začlenění, přičemž více spotřebitelů má přístup k finančním produktům a službám za nižší cenu, než umožňují tradiční finanční instituce. Nárůst zavádění technologie přinesl nárůst sběru, ukládání a používání dat. Technologické nástroje, jako jsou platformy sociálních médií, digitální platební platformy a technologie chytrých telefonů, odhalily spoustu dat používaných různými společnostmi k posílení jejich interakce se spotřebiteli. Tato tuna dat se nazývá velká data a je důvodem k obavám mezi jednotlivci a regulačními orgány požadujícími více zákonů, které chrání totožnost a soukromí uživatelů.
Jak deanonymizace funguje
Ve věku velkých dat, kde jsou citlivé informace o online aktivitách uživatele sdíleny okamžitě pomocí cloud computingu, byly pro ochranu identit uživatelů použity nástroje anonymizace dat. Anonymizace maskuje osobní údaje (PII) uživatelů, kteří operují v různých oblastech, jako jsou zdravotnické služby, platformy sociálních médií, obchody s elektronickým obchodem atd. PII zahrnuje informace, jako je datum narození, číslo sociálního zabezpečení (SSN), PSČ a IP adresa. Potřeba maskovat digitální stopy zanechané online aktivitami vedla k implementaci anonymizačních strategií, jako je šifrování, mazání, generalizace a porucha. Ačkoli vědci údajů používají tyto strategie k oddělení citlivých informací od sdílených dat, stále si zachovávají původní informace, čímž otevírají dveře možnosti opětovné identifikace.
De-anonymizace zvrátí proces anonymizace spojením sdílených, ale omezených datových souborů s datovými soubory, které jsou snadno dostupné online. Daníci dat pak mohou načíst některé informace z každé dostupné datové sady a dát dohromady identitu nebo transakci osoby. Například datový horník by mohl načíst datový soubor sdílený telekomunikační společností, webem sociálních médií, platformou elektronického obchodování a veřejně dostupným výsledkem sčítání lidu k určení jména a častých činností uživatele.
Jak se používá deanonymizace
Opětná identifikace může být úspěšná, když jsou zveřejněny nové informace nebo když není implementována anonymizační strategie správně. Díky velkému množství dat a omezenému množství času denně analytici dat a horníci implementují při rozhodování zkratky známé jako heuristika. Zatímco heuristika šetří drahocenný čas a prostředky při česání prostřednictvím datové sady, může také vytvářet mezery, které by bylo možné využít, kdyby byl implementován nesprávný heuristický nástroj. Tyto mezery by mohly odhalit horníci údajů, kteří usilují o anonymizaci souboru údajů pro legální nebo nezákonné účely.
Osobně identifikovatelné informace nezákonně získané technikami anonymizace lze prodávat na podzemních trzích, které jsou rovněž formou anonymizačních platforem. Informace, které se dostanou do nesprávných rukou, mohou být použity k donucení, vydírání a zastrašování, což vede k obavám o soukromí a obrovským nákladům pro podniky, které se staly oběťmi.
Deanonymizaci lze také použít legálně. Například web Silk Road, podzemní trh s nelegálními drogami, byl hostován anonymizovanou sítí zvanou Tor, která pomocí strategie cibule zahaluje IP adresy svých uživatelů. Síť Tor také hostí několik dalších nezákonných trhů obchodujících se zbraněmi, odcizenými kreditními kartami a citlivými informacemi o společnosti. S využitím komplexních nástrojů pro anonymizaci FBI úspěšně praskla a vypnula Silk Road a weby zabývající se dětskou pornografií.
Úspěch v procesech opětovné identifikace prokázal, že anonymita není zaručena. I když dnes byly pro maskování dat implementovány průlomové anonymizační nástroje, mohla by být data znovu identifikována za několik let, jakmile budou k dispozici nové technologie a nové datové soubory.
