„Tai kažkur čia!
JT išbando naują technologiją, kuri apdoroja duomenis konfidencialiai
DUOMENYS YRA vertingi. Tačiau ne visi jie yra tokie vertingi, kokie galėtų būti. Konfidencialumo priežastys reiškia, kad daugelis medicininių, finansinių, švietimo ir kitų asmeninių įrašų, iš kurių analizuojant galima gauti daug viešosios naudos, praktiškai neprieinami. Daug komercinių duomenų yra panašiai atskirta. Pavyzdžiui, įmonės turi išsamesnės ir savalaikės informacijos apie ekonomiką, nei vyriausybės gali gauti iš apklausų. Tačiau tokios žnios praverstų varžovams. Jei įmonės galėtų būti tikros, kad tai išliks paslaptyje, jos galbūt labiau norėtų tai padaryti prieinamą oficialiai.
Toks dalijimasis gali būti įmanomas, naudojant daugybę naujų duomenų apdorojimo metodų. Šios vadinamosios privatumą didinančios technologijos (PET) vis dar yra ankstyvosiose kūrimo stadijose. Tačiau jos netrukus gaus postūmį iš Jungtinių Tautų statistikos skyriaus pradėto projekto. JT PET laboratorija, kuri oficialiai atidaryta sausio 25 d., leidžia nacionalinėms statistikos tarnyboms, akademiniams tyrėjams ir įmonėms bendradarbiauti, įgyvendinant projektus, kuriuose bus tikrinami įvairūs PET, leidžiantys nustatyti ir įveikti techninius ir administracinius trukdžius.
Pirmosios tokios pastangos, kurios iš tikrųjų prasidėjo praėjusią vasarą, prieš oficialią PET laboratorijos inauguraciją, analizavo importo ir eksporto duomenis iš nacionalinių statistikos tarnybų Amerikoje, Britanijoje, Kanadoje, Italijoje ir Nyderlanduose, siekiant ieškoti anomalijų. Tai gali būti sukčiavimo, netinkamo apskaitos tvarkymo arba nekenksmingo reeksporto pasekmė.
Bandomojoje schemoje mokslininkai naudojo jau viešai prieinamas kategorijas – šiuo atveju tarptautinę prekybą tokiais dalykais, kaip medienos plaušiena ir laikrodžiai. Taigi jie tikėjosi parodyti, kad sistema veiks, prieš taikydami ją informacijai, kuriai svarbus konfidencialumas.
Jie naudoja kelių rūšių PET. Vieno bandymo metu Oksforde įsikūrusi labdaros organizacija „OpenMined“ išbandė metodą, vadinamą saugiu kelių šalių skaičiavimu (SMPC). Taikant šį metodą, analizuojamus duomenis užšifruoja jų valdytojas ir jie lieka jo patalpose. Analizę vykdanti organizacija (šiuo atveju „OpenMined“) siunčia savo algoritmą prižiūrėtojui, kuris jį vykdo su šiais šifruotais duomenimis. Tai matematiškai sudėtinga, bet įmanoma. Tada išvados siunčiamos atgal pradiniam klausėjui.
Taigi klausėjas gauna atsakymus, bet niekada neturi prieigos prie informacijos, kuria grindžiami tie atsakymai. Be to, siekiant papildomo saugumo, rezultatus apdoroja kitas PET, vadinamas diferenciniu privatumu. Tam naudojama sudėtinga matematika, kad rezultatas gautų šiek tiek statistinio triukšmo. Dėl to išvados nėra tokios tikslios, bet reiškia, kad jų negalima pakeisti, kad būtų atskleisti atskiri įrašai. Tai taip pat leidžia organizacijai, skelbiančiai išvadas, nustatyti vadinamąjį „privatumo biudžetą“, kuris nustato duomenų atskleidžiamo detalumo lygį. Rezultatas yra diržo ir petnešų metodas. Šioje srityje SMPC užtikrina įvesties privatumą, o diferencinis privatumas – išvesties privatumą.
Antrojo bandymo metu, naudojant tuos pačius duomenų rinkinius, PET laboratorija pasirūpino, kad Dublino bendrovė „Oblivious Software“ išbandytų „patikimą vykdymo aplinką“, dar vadinamą „anklavais“, kaip įvesties privatumo formą. Norėdami nustatyti šiuos duomenis, pirmiausia užšifruoja jų saugotojas, o tada siunčia į specialų, labai saugų serverį, kuris buvo sukurtas patikimai, kad būtų galima sekti kiekvieną operaciją ir visiškai išvalyti jos atmintį, atlikus darbą.
Saugiai saugomi šio serverio techninėje įrangoje duomenys iššifruojami ir atliekama norima analizė. Siekiant didesnio saugumo, taikomos kriptografinės maišos ir skaitmeniniai parašai, siekiant įrodyti, kad buvo atliktos tik įgaliotos operacijos. Išvestis taip pat statistiškai neryški, naudojant skirtingą privatumą, prieš siunčiant atgal pradiniam klausėjui.
Atliekant bandymus, abu metodai iš tikrųjų nustatė anomalijas. Pavyzdžiui, nors Amerikos ir Kanados medienos plaušienos vertės įrašai tarp dviejų šalių iš esmės buvo vienodi, jų duomenys apie laikrodžių prekybos vertę skyrėsi 80 proc. „Techniškai tai pavyko“, – sakė Ronaldas Jansenas iš JT statistikos skyriaus, administruojantis naująją laboratoriją.
Ar tai veikia biurokratiškai, dar reikia pamatyti. Tačiau numatoma nauda būtų didelė. Naudojant PET, galima ne tik sujungti duomenų rinkinius, kurie šiuo metu negali sąveikauti dėl nerimo dėl privatumo, bet ir būdas įvairioms organizacijoms saugiai bendradarbiauti tarpvalstybiniu mastu.
Kiti PET laboratorijos tikslai yra giliau pasinerti į prekybos duomenis ir įtraukti į sąrašą daugiau agentūrų. Visa tai atsiranda, nes daugelis vyriausybių vis labiau domisi PET. Gruodžio mėn. Amerika ir Didžioji Britanija paskelbė, kad planuoja šį pavasarį paskelbti „didįjį iššūkio“ prizą apie PET sistemas. Pasidalinimas daugeliu duomenų – ir jų naudojimas – dabar gali būti vis lengvesnis.“ [1]
· · · 1. "Your secret's safe with me; Data privacy." The Economist, 29 Jan. 2022, p. 63(US).
Komentarų nėra:
Rašyti komentarą