„Anonymizovaná data“ jsou největší podvod IT firem. Nedovolte je vám ukrást – ani pod záminkou koronakrize.

Od začátku koronavirové krize se roztrhl pytel s IT firmami a údajnými vědci, kteří chtějí „pomáhat“ a tvrdě a vytrvale lobbují za jediné: přístup k těm nejcitlivějším a nejintimnějším datům občanů, od výpisu z bankovních účtů přes veškeré lokační údaje o jejich pohybech až po kompletní zdravotní dokumentaci. Aby tento přístup získali, ujišťují veřejnost že data budou „anonymizována“. Jenže to je nehorázná manipulace, ba fakticky řadou studií potvrzená lež.

Pokud totiž „datoví ajťáci“ hovoří o anonymizaci, nemají tím vůbec na mysli to, co si pod anonymizaci představí průměrný občan či novinář. Mají na mysli techniku, které se dříve a správněji říkalo data masking, tedy pouze zakrytí zjevně unikátního identifikátoru – jako je rodné číslo či jméno a příjmení – identifikátorem jiným, bezvýznamným, avšak stejně unikátním.

Problém je v tom, že takto anonymizovaná data s unikátními ID je směšně jednoduché opět deanonymizovat. Například ve státě Washington je legální prodávat anonymizovaná zdravotní data – tedy přesně to, co si nyní nárokují IT firmy po českém státu. Jenže datové analytička (čeští novináři takovým říkají „vědci“) Latanya Sweeney dokázala propojit anonymizované zdravotní záznamy s fyzickou identitou 35 občanů.

Postupu, kterým jsou anonymizovaná – ve skutečnosti pouze maskovaná – data deanonymizována, se říká zkorelování. Jedná se o stejný princip, na jakém je založeno např. vyhledávání podle otisků prstů: každý člověk má nějaké drážky na prstech, ale konkrétní kombinace délky, tvaru a pozice všech drážek dohromady je víceméně unikátní, takže pokud dokážete zkorelovat kombinaci drážek kůže na místě činu a v policejní kartotéce, máte podezřelého. A přesně stejně v IT platí, že kombinace různých, navzájem nesouvisejících digitálních informací o kterémkoli člověku jej identifikuje stejně spolehlivě, jako jeho jméno – pokud jsou zkorelovány, tzn. dány do vzájemných souvislostí a porovnány se známým identifikátorem. Pojďme si to vysvětlit na konkrétním příkladu.

Ještě než EU stihla omezit použití Cookies ke sledování pohybů lidí na internetu, reklamní agentury už přišly s vyšší úrovní – tzv. fingerprintingem počítače. Technika je geniálně jednoduchá. Existují stamiliony lidí s rozlišením obrazovky např. 1200×800, stamiliony lidí s Windows 10, miliardy lidí s prohlížečem Firefox. Ale počet lidí, kteří mají dohromady zároveň rozlišení 1200×800 a zároveň Windows 10 verze 17134 a zároveň verzi Firefoxu 52 a zároveň …, a zároveň …, a zároveň … je tak malé, že jejich kombinace poměrně unikátně identifikuje člověka. Potom už stačí jenom najít stránku, kde člověk s touto unikátní kombinací vystoupil pod svým pravým jménem – a rázem je s jeho reálnou identitou zkorelována, a tím deanonymizována, i veškerá ostatní jeho aktivita na internetu, u které byla zaznamenána stejná kombinace. Včetně té v anonymním prohlížení.

Deanonymizace zkorelováním tedy obecně znamená, že je nalezena unikátní kombinace informací která odpovídá zároveň anonymizovaným datům o jednom člověku na straně jedné, a zároveň neanonymním datům z tzv. „veřejných zdrojů“, ze kterých lze zjistit jméno či adresu (=jméno) na straně druhé. Touto veřejnou informací však může být např. i pouhý statistický údaj, o kterém byste to nečekali. Např. na sociální síti logicky každý nejčastěji ze všech stránek navštěvuje adresu www.socialni.sit/moje.jmeno-moje.prijmeni – čímž je deanonymizován pouhou statistickou informací o návštěvnosti, a to aniž by se třeba přihlašoval a i kdyby byl v anonymním módu prohlížeče (který totiž nedokáže zakrýt fingerprint).

Dr. Sweenyová dokázala deanonymizovat zdravotní dokumentaci 35 občanů jen na základě zkorelování dvou atributů – diagnózy a data hospitalizace. Jejich kombinací zkorelovala zdravotní dokumentaci s veřejnými zdroji – jako jsou média, sociální sítě apod. – a tam, kde se informace protnuly, položila rovnítko a získala jméno a příjmení osoby ze zdravotní dokumentace.

To je sice děsivé, ale procentuálně zanedbatelné – Sweenyová měla k dispozici tisíce, možná desetitisíce zdravotních záznamů a zkorelovat skrze novinové články dokázala jen 35 z nich. Jenže jak roste počet pomyslných sloupečků v tabulce, které můžete zkombinovat a zkorelovat, rychle roste i úspěšnost zkorelování.

Hodně zkorelovatelných dat = 99% deanonymizace

Výzkumníci z Imperial College London zjistili, že pokud sada anonymizovaných dat obsahuje 15 demografických identifikátorů, lze deanonymizovat přes 99,9% lidí z velkých aglomerací.

A to se bavíme o datech, která byla anonymizována bezchybně. Pokud jsou algoritmy, použité k maskování anonymizovaných dat, nedokonalé, jdou udělat úplně neuvěřitelné věci. Například deanonymizovat finanční příjmy a adresy pobyty milionů taxikářů v New Yorku.

Existují ale i jiné způsoby deanonymizace, kdy je zkorelováním omezeného množství veřejných dat deanonymizována mnohem větší sada dat intimních. Například streamovací služba Netflix nabízela „vědcům“ – fakticky však data-mining analytikům v rouše beránčím – anonymizovaná hodnocení všech filmů a seriálů svých uživatelů. To se na první pohled nezdá být nijak důležité. Jenže výzkumníci promptně vyvodili, že je možné z kombinace hodnocení politicky vyhraněných filmů, filmů o sexuální tematice a (proti)náboženských filmů velmi přesně dovodit intimní údaje o sexuální orientaci, sexuálních preferencích i politickém či náboženském (anti)přesvědčení hodnotícího diváka.

Tato poněkud intimní hodnocení vyhraněných filmů byla zdánlivě bezpečně ukryta v anonymizované sadě pro vědce a nikdo normální se jimi veřejně nechlubil. Jenže výzkumníky napadlo, že naopak ty filmy, za které se diváci Netflixu nestydí, budou hodnotit i veřejně – na serverech jako IMDB (ekvivalent ČSFD). A budou je tam hodnotit stejným skóre, jako v anonymizovaných datech, a s malým časovým rozestupem (klik hodnocení na Netflixu, vzápětí klik hodnocení na IMDB). Tím získali tři veličiny: film, hodnocení a čas. A s pomocí kombinace všech hodnocení a jejich časů na IMDB a v „anonymizované“ sadě dat Netflixu zkorelovali uživatelské jméno z IMDB s ID v sadě intimních hodnocení filmů – a úspěšně deanonymizovali tajná hodocení. Netflix posléze za zveřejnění snadno deanonymizovatelných dat čelil soudnímu procesu.

Vše, co jsem až dosud popsal, je ale pouze špička ledovce. Existují tisíce kreativních způsobů jak zkorelovat anonymizovaná data s něčím, co by vás ani v životě nenapadlo, a jak je tím deanonymizovat. Drtivá většina firem operujících v oboru IT zvaném data mining – firem jako Exactis či Google Adwords – se zabývá ošklivě řečeno tím, jak ukrást co nejintimnější data uživatelů a každému se prohrabat soukromím tak důkladně, jako to dělala komunistická Státní bezpečnost. Protože na základě takových intimních a důkladných osobních dat lze algoritmy generovat psychologický a behaviorální profil, který pak lze prodat k reklamě přesně cílené na slabiny toho kterého občana… Nebo dokonce prodávat predikce a behaviorální modifikace budoucího chování toho kterého občana. Pro tento charakterem StBácký, ale nesmírně lukrativní způsob IT podnikání se posledních pár let intenzivně razí pojem „Surveillance Capitalism“ neboli Dohledový kapitalismus.

Deanonymizace skrze obrovské hromady ukradených dat

Krušnou realitu dat, která jsou o vás vykrádána a zneužívána, nejnázorněji ukazuje uniklý profil data-miningové firmy Exactis. Přesně takovýto konkrétní profil ve formátu JSON je rozesílán všem potenciálním inzerentům, kteří vás chtějí dostat. Dnes totiž funguje reklama na internetu tak, že pokud přijdete na stránku s reklamou, reklamní společnost všem potencálním inzerentům rozešle váš intimní osobnostní profil a vydraží vás v online aukci automatizovaných algoritmů jako byste byli zboží – tomu se říká Real-Time Bidding. Mimochodem, můžeme za to poděkovat opět průkopníku data-miningu, Googlu, který tento koncept okopíroval od jednoho startupu, okolo něj předělal celý svůj obchodní model, vydělal na tom miliardy a revolucionizoval tím IT trh, protože každý chce takové pohádkové zisky kopírovat.

Výše jsem uvedl zjištění akademiků z Imperial College London, že se znalostí pouhých 15 demografických datových bodů lze deanonymizovat přes 99,9% obyvatel velké aglomerace. Exactis však prodával datovou sadu s více jak 400 datovými body – včetně platové kategorie, počtu a věku dětí, zájmů, politikého a náboženského přesvědčení atd. Zde je opravdový úryvek:

<pre“> personmaritalstatus: M,
inferredage: 42,
occupationgroup: G,
personoccupation: 0000,
ethnic_code: T3,
languagecode: E1,
ethnic_group: W,
religion_code: P,
hispaniccountrycode: 00,
personeducation: U,
creditrating: F,
investmentstocksecurities: Y,
health_institutioncontributor: Y,
donatestoenvironmentalcauses: Y,
censusmedianhomevalue: 002136,
censusmedianhouseholdincome: 00481,
cra_incomeclassificationcode: 2,
</pre“>

Věk, povolání, etnicita, přesvědčení, náboženství, příjmy a 400 dalších údajů? Kdyby si takto podrobná data o svých zaměstnancích vedla firma, už by měla na krku antidiskriminační žaloby. Ale IT dataminingovým firmám nejenže prochází takové údaje shromažďovat, ale dělat to bez vašeho souhlasu či vědomí, dělat to skrze krádež vašich dat, a navíc to všechno prodávat. Toto je jen jeden z mnoha neuvěřitelných příkladů, co všechno jsou dnes „veřejné zdroje“ které mohou být použity k vaší deanonymizaci. Je jich ale mnohem více – jiné IT firmy shromažďují data o vašem pohybu, o vaší tepové frekvenci v průběhu dne, o vašem pohybu na internetu… Protože základní imperativ obchodního modelu všech dataminingových firem z Dohledového kapitalismu zní: „ukrást a zpracovat do profilů všechna data o všech lidech, která se ukrást dají, dokud existuje příležitost je ukrást – jak se to dá zpeněžit budeme promýšlet později.“

Řada subjektů dnes bezelstně vydává citlivá data v anonymizované podobě různým vědcům a „vědcům“ (dnes si totiž „vědec“ říká každý IT nebo statistik, který se vám hrabe v soukromí skrze vaše ukradená data. Používá totiž „vědeckou metodu“.) Jenže pokud máte k dispozici datové sady o desítkách nebo dokonce stovkách atributů – např. od Exactisu -, je jednoduché zkorelovat ta „anonymizovaná“ data, jejichž kombinace je identická, a jejich zkorelováním si doplnit i ta data, která byla doposud neznámá… Nakonec včetně jména a bydliště.

Pokud navíc databáze data-miningových a data-agregačních firem uniknou, což je jen otázka času, vaše nejintimnější data prohledávají represivní složky skrze data-analytické nástroje jiných IT firem – od software Data Viper, prohledávající vysloveně ukradená data data-miningových a RTB firem, až po software Clearview AI, který prozměnu rozpoznává obličeje lidí v ulicích na základě jejich fotek ukradených ze sociálních sítí. Data-mining je prostě krádež tisíciletí a státy nad ní zavírají obě oči, protože jejich represivní složky na tom šťastně parazitují (tomu se prozměnu říká „Surveillance Exceptionalism“, neboli „je-li IT firma užitečná pro represivní složky, vyhnou se jí regulace shromažďování soukromých údajů“).

A teď si to zasaďte do kontextu ČR. Aby bylo jasno, nebavíme se tu o projektu e-rouška, nýbrž o „analytických“ projektech data-miningových IT firem a „datových vědců“ zejména napojených na CERGE-EI. Ti požadují pod záminkou „vědeckého výzkumu šíření koronaviru“ přístup k přehrabování se ve vaší nejintimnější zdravotní dokumentaci a těch pohybech po Česku, které by hypoteticky mohly souviset s hledáním „místa kde jste se nakazili“. A jako jedinou ochranu před zneužitím nabízí jen a pouze to, že tato data budou „anonymizována“ – což je vzhledem k jejich unikátnosti, granularitě a propojení s další datovou sadou pohybů občana úplně k ničemu.

Zdravotní dokumentace je Svatým grálem data-miningových a data-analytických firem, protože narozdíl od všeho ostatního ji lidé odmítají „sdílet“ – vědomi si možností zneužití. Google, průkopník a inspirace všech data-miningových firem, proto bez souhlasu dotčených pacientů kradl a analyzoval jejich zdravotní dokumentaci díky tajné smlouvě s poskytovatelem zdravotní péče Ascension, a posléze se vše pokusil legalizovat a propagovat přes Google Health a Google Cloud for Health API. A ještě předtím Google koupil „anonymizovanou“ zdravotní dokumentaci pacientů, kterým přitom bylo slíbeno, že nikdy nebude komerčně prodána.

České dataminingové firmy by rády totéž. A symptomaticky pro svůj obor se neptají, zda jim svá intimí data chcete vydat dobrovolně – chtějí vám je ukrást za vašimi zády a když se ukrást nedají, mají tu drzost si skrze naivní novináře již ve čtyřech článcích opakovaně stěžovat, že zlý stát chrání soukromé údaje občanů a tím údajně „překáží vědě“. IT firmy zde požadují, aby od státu dostaly přístup k vaší zdravotní dokumentaci i sledování pohybů a vy jste neměli žádnou možnost jim to nepovolit.

Jak se data dají skutečně anonymizovat – kdyby se chtělo

Samozřejmě existují i metody, jak lze data skutečně anonymizovat tak, aby je IT firmy nedokázaly deanonymizovat. Jsou to prakticky tři třídy metod.

Jednou z nich je tzv. agregování – tzn. smíchání všech údajů od unikátních lidí dohromady. Představte si třeba data o pohybech lidí, získaná od mobilních operátorů: máte mapu ČR a pohyby každého občana kreslí čáru o různé barvě. Agregovaná data znamenají, že všechny tyto čáry smícháte do jedné jediné vrstvy a mají jednu jedinou barvu – a v důsledku toho jakmile se dvě čáry protnou, už není možné spolehlivě určit, kam která čára pokračuje.

I agregovaná data mají samozřejmě své limity. Jednak pokud jsou data řídká, takže se datové čáry neprotínají a pořád spolehlivě identifkují jedince (nebo alespoň skupinu osob) a odhalují jeho pohyby i vzorce chování. Takto byly např. odhaleny tajné základny zvláštních jednotek v zemích třetího světa, protože chodily běhat a přitom jako jediné široko daleko nosily chytré hodinky – healthtrackery, data z nichž byla agregována a veřejně vystavena.

A jednak ve specifických případech ke zneužití stačí agregovaná data jako celek, aniž by bylo nutné identifikovat jedince. Představte si, že se státu (či aktivistům, nebo korporátu) nelíbí demonstrace a má agregovaná data o pohybech mobilních telefonů. Pokud se na demonstraci a cesty domů z ní nepřipletlo moc nezůčastněných telefonů (to je zásadní podmínka), aktivistům analyzujícím agregovaná data může být úplně jedno kdo je kdo – prostě platí, že jakákoli čára, která spojuje špatnou demonstraci a něčí domov jako koncový bod, je postačujícím důvodem dotyčnému prohodit kámen oknem.

(Veřejně zpřístupnit agregovaná data o pohybech občanů z mobilních telefonů, aby je mohl analyzovat a zneužívat úplně každý, je přitom dlouhodobým cílem propagátorů konceptu Open Data CZ – doposud nejúspěšnějšího v progresivím Brně. Open Data jsou zvráceně geniální, protože stát či EU přikáže sbírat data o vás aniž byste se mohli bránit, a pak je předá soukromým subjektům které by vás samy o sobě k jejich zveřejnění nutit nemohly. Stát zde funguje jako špicl soukromých firem a aktivistů.)

Každopádně u agregovaných dat platí jednoduché pravidlo: za čím delší časové období jsou data agregována a čím více datových stop se na nich protne, tím méně jsou zneužitelná. Například mapa agregovaných dat o pohybech mobilních telefonů napříč celým kalendářním rokem jsou pro deanonymizaci téměř 100% nepoužitelná, protože prostě není možné určit ani zda ta která čára v květnu demonstrovala, nebo se v prosinci účastnila vánočních trhů, ani kudy se pak vracela domů skrze tisíc průsečíků s jinými datovými stopami z různých dní a od různých lidí.

Druhou z technik skutečné anonymizace je prohazování hodnot atributů. Tato technika se po léta úspěšně používala např. v bankách, které potřebovaly testovat své SW systémy na reprezentativních datech zákazníků, ale přitom se nesmělo jednat o data skutečná. Pokud tedy máte řádky např. „001; Jan Mrcasík; 3,234,122 Kč; Praha“, dále „002; Tomáš Marný; 100 Kč; Plzeň“ a konečně „003; I.C.Weiner, 10,000,000 Kč, Londýn“, proházíte atributy takže vznikne „001; Tomáš Marný; 10,000,000 Kč; Praha“, „002; Jan Mrcasík; 100 Kč; Londýn“, atd. Jediný zádrhel je jak algoritmizačně spolehlivě zajistit, že se prohodí dostatečné množství dat, tzn. že na výstupu nebude např. „002; Jan Mrcasík, 100 Kč, Plzeň“ – protože to by se potom jednalo zase jen o anonymizaci maskováním, která je k ničemu (zde substituce UID „Tomáš Marný“ za stejně unikátní ID „Jan Mrcasík“).

A konečně třetí doopravdy anonymizační technikou je náhodný rozptyl: veškerá data jsou algoritmem upravena tak, že jsou jejich hodnoty pozměněny náhodným směrem o náhodnou veličinu která je zároveň tak malá, aby nezkreslila statistickou hodnotu dat, ale zároveň tak velká, aby zabránila zkorelování dat. Na příkladu výše by to tedy vypadalo třeba jako „005; Jan Morcík, 3,233,953 Kč, Roztoky u Prahy“. Protože 3,233,953 ≠ 3,234,122 a „Jan Morcík“ ≠ „Jan Mrcasík“, deanonymizace skrze spolehlivé zkorelování těchto kombinací dat z různých datových zdrojů je prakticky vyloučena, zatímco pro skutečně vědecké, statistické účely bez pokusů o deanonymizaci takový malý rozptyl nevadí. Tento přístup, ač nejdokonalejší, se ale dnes prakticky nevyužívá mimo interní testování SW firem. Pokud totiž takto anonymizovaná data nabídnete těm, kdo se „anonymizovaných dat“ dožadují, prohlásí že jsou nepoužitelná protože jsou příliš nepřesná a neumožňují dostatečně důkladnou analýzu. Proč?

Skutečně anonymizovaná data analytici nechtějí, protože neumožňují profilování

Skutečně anonymizovaná data – ať agregováním v hustě protínající se sadě dat, prohazováním hodnot, nebo náhodným rozptylem – jsou IT firmám k ničemu a oni je odmítají proto, že jejich primárním cílem vůbec není „statisticky“ pracovat s anonymními daty. Jejich datoví vědci totiž potřebují dokonale přesná, nezkreslená, neprohozená a extrémně podrobná osobní data proto, že onu „statistickou práci“ chtějí provádět až nad individuálními „profily jedinců“, jejichž individuální parametry pak teprve statisticky analyzují.

Profilování znamená analýzou historických dat ušít dokonale intimní, unikátní obraz chování a vlastností jedince: jeho kontakty, vzorce chování, anamnézu… Prostě všechno pro co nejpodrobnější a nejdokonalejší vhled do soukromí, života i těla, který dotyčného občana svlékne úplně do naha a umožní analyzovat, vysvětlit a nalézt opakující se vzorce jeho minulého chování a tím předvídat jeho budoucí chování. Statistika je aplikována až na jedince, kteří mají takřka shodný profil a proto se u nich dá předpokládat, že se budou chovat jeden jako druhý. Stejně jako to dělala StB, když hledala potenciální disidenty.

Jakýsi muž onehdá trefně prohlásil, že „StBáctví je nenapravitelná vada charakteru.“ Myslel tím právě posedlost šmírováním, sledovačkami (dnes nahrazenými vysáváním GPS souřadnic), vytvářením profilů (dříve kádrových, dnes behaviorálních) a jejich analýzu k vynášení nějakých závěrů či odsudků (dříve kádrových posudků, dnes „scoringu“) o obětech sledování. StBáctví je psychologicky velmi lákavé proto, že si tím lidé hrají na bohy: získávají opojný pocit vševědoucnosti, že zprofilovaného dotyčného „znají lépe než jeho blízcí“, dokonce vědí i to, jak se zachová v budoucnosti, a mohou jeho chování ovlivnit, manipulovat. Uzurpují si moc se postavit do role soudců, vyvýšit se nad sledované a oznámkovat a ovlivnit celý život dotyčného nějakým skóre, posudkem či nálepkou, které mu autoritativně přiřknou.

Data-miningové IT firmy a celé plejády datových vědců akorát povýšily toto StBáctví na „vědu“ vznosně nazývanou nazývanou „behaviorální analýza“ (viz např. firmu Behavio Labs, napojenou na KoroNERV-20 právě přes CERGE-EI), a její zjevnou amorálnost si sami pro sebe i pro veřejnost omlouvají tím, že lidi šmírují, kádrují, profilují, posuzují a skórují nebo manipulují „pro jejich dobro“, aby jim tím pomohli nebo je výslovně předělali k lepšímu.

Málo se ví, že digitální totalitu v Číně nevytvořil stát, nýbrž soukromé korporace Alibaba a Tencent, jejichž IT oddělení vydělávají na „dohledovém kapitalismu“ skrze data-mining. Svůj IT scoringový systém – stejný jako provozuje každá data-miningová a behaviorálně-analytická IT firma světa – akorát zpřístupnily vládě a napojily na její databáze (zlé jazyky by tomu mohly říci „Open Data Red China“), čímž vznikl předobraz nechvalně proslulých systémů „Čínského sociálního kreditu“. Stejně tak to v Číně nebyl stát, nýbrž soukromé bankovní/IT a retailové korporace, kdo zavedl fakticky bezhotovostní společnost a tím totální dohled nad transakcemi i osobními zájmy a pohyby. Velká část segmentu IT prostě nyní vede totální válku proti soukromí jedinců, protože digitální StBáctví slibuje pohádkové zisky od reklamních agentur a potenciálně i vlád, a bezostyšná krádež dat je jejich základní metoda zisku. Pokud na to odmítnete přistoupit, v IT si dnes musíte vybírat práci hodně opatrně, abyste se do toho nenamočili také. Nebo alespoň ne příliš.

Nevěřte tedy nikomu, kdo mluví o „anonymizovaných datech“ a myslí tím cokoli jiného, než agregovaná data o velkém množství lidí za velmi dlouhý čas. Žárlivě si braňte své soukromí a nedejte se zmást tím, že IT dataminingové firmy a výrobci StBáckých behaviorálních profilů samy sebe kamuflují coby „vědce“ a „výzkumníky“. A nedejte se zmanipulovat nikým, kdo zneužívá koronakaranténní krizi k prosazení digitálního dohledu. Obamův přítel a starosta Chicaga, Rahm Emanuel, kdysi prohlásil: „Nikdy nepromrhejte pořádnou krizi. Tím myslím, že je to příležitost udělat věci, které byste předtím udělat nemohli.“

Leckdo v čele s Čínou a IT firmami dnes přistupuje ke koronakaranténní krizi přesně s tímto přístupem: urvat co se dá z normálně nepřijatelného pod záminkou krize.
Zejména pokud se to týká vašich citlivých informací – protože jak se jednou dostanou ven, už je nikdy nikdo nesmaže.

Co s tím dělat? To je triviální, drahý Watsone. Krádež dat se doposud nachází pouze ve fázi lobbingu a mediální palebné přípravy. Pod každým článkem propagujícím vydání našich nejcitlivějších údajů IT firmám a datovým vědcům pod záminkou „anonymizace“ tedy čeřte vodu, hlasitě deklamujte že s vydáním svých citlivých dat v plen kategoricky nesouhlasíte – a vysvětlujte, že „anonymizace“ jiná než agregování je sprostá IT lež.

Disclaimer: článek je populárně naučný, tzn. dopouští se simplifikací pro vyšší názornost a srozumitelnost. Kdo chce psa bíti, hůl si v něm snadno najde.

17.05.2020 Jan Mrcasík

Související články: