1. Duomenų maskavimo samprata
Duomenų maskavimas taip pat žinomas kaip duomenų maskavimas. Tai techninis būdas konvertuoti, modifikuoti ar uždengti neskelbtinus duomenis, tokius kaip mobiliojo telefono numeris, banko kortelės numeris ir kita informacija, kai pateikiame maskavimo taisykles ir politiką. Šis metodas visų pirma naudojamas siekiant užkirsti kelią jautriems duomenims tiesiogiai naudoti nepatikimoje aplinkoje.
Duomenų maskavimo principas: Duomenų maskavimas turi išlaikyti pradines duomenų charakteristikas, verslo taisykles ir duomenų aktualumą, kad būtų užtikrinta, jog maskavimas nepaveiks tolesnio kūrimo, testavimo ir duomenų analizės. Užtikrinkite duomenų nuoseklumą ir galiojimą prieš ir po maskavimo.
2. Duomenų maskavimo klasifikacija
Duomenų maskavimą galima suskirstyti į statinį duomenų maskavimą (SDM) ir dinaminį duomenų maskavimą (DDM).
Statinis duomenų maskavimas (SDM): Statiniam duomenų maskavimui reikia sukurti naują ne gamybinės aplinkos duomenų bazę, kad būtų galima atskirti nuo gamybos aplinkos. Jautrūs duomenys išgaunami iš gamybos duomenų bazės ir saugomi ne gamybos duomenų bazėje. Tokiu būdu nujautrinti duomenys yra izoliuojami nuo gamybos aplinkos, kuri atitinka verslo poreikius ir užtikrina gamybos duomenų saugumą.
Dinaminis duomenų maskavimas (DDM): Jis paprastai naudojamas gamybinėje aplinkoje, kad būtų sumažintas jautrių duomenų jautrumas realiuoju laiku. Kartais, norint nuskaityti tuos pačius jautrius duomenis skirtingose situacijose, reikia skirtingų maskavimo lygių. Pavyzdžiui, skirtingi vaidmenys ir leidimai gali įgyvendinti skirtingas maskavimo schemas.
Duomenų ataskaitų teikimo ir duomenų produktų maskavimo programa
Tokie scenarijai daugiausia apima vidinius duomenų stebėjimo produktus arba skelbimų lentą, išorinių paslaugų duomenų produktus ir ataskaitas, pagrįstas duomenų analize, pvz., verslo ataskaitas ir projekto apžvalgą.
3. Duomenų maskavimo sprendimas
Įprastos duomenų maskavimo schemos apima: negaliojimą, atsitiktinę vertę, duomenų pakeitimą, simetrišką šifravimą, vidutinę vertę, poslinkį ir apvalinimą ir kt.
Invalidavimas: negaliojimas reiškia neskelbtinų duomenų šifravimą, sutrumpinimą arba slėpimą. Ši schema dažniausiai tikrus duomenis pakeičia specialiais simboliais (pvz., *). Operacija paprasta, tačiau vartotojai negali žinoti pradinių duomenų formato, o tai gali turėti įtakos vėlesnėms duomenų programoms.
Atsitiktinė vertė: Atsitiktinė reikšmė reiškia atsitiktinį jautrių duomenų pakeitimą (skaičiai pakeičia skaitmenis, raidės pakeičia raides, o simboliai pakeičia simbolius). Šis maskavimo būdas tam tikru mastu užtikrins neskelbtinų duomenų formatą ir palengvins tolesnį duomenų pritaikymą. Kai kuriems reikšmingiems žodžiams, pvz., žmonių ir vietų pavadinimams, gali prireikti maskuojančių žodynų.
Duomenų pakeitimas: Duomenų pakeitimas yra panašus į nulinių ir atsitiktinių reikšmių maskavimą, išskyrus tai, kad vietoj specialiųjų simbolių ar atsitiktinių reikšmių maskavimo duomenys pakeičiami konkrečia reikšme.
Simetrinis šifravimas: Simetrinis šifravimas yra specialus grįžtamasis maskavimo metodas. Jis užšifruoja slaptus duomenis naudodamas šifravimo raktus ir algoritmus. Šifruoto teksto formatas atitinka pradinius duomenis loginėse taisyklėse.
Vidutinis: Vidurkio schema dažnai naudojama statistiniuose scenarijuose. Skaitiniams duomenims pirmiausia apskaičiuojame jų vidurkį, o tada atsitiktinai paskirstome desensibilizuotas reikšmes aplink vidurkį, taip išlaikant pastovią duomenų sumą.
Poslinkis ir apvalinimas: Šis metodas keičia skaitmeninius duomenis atsitiktiniu poslinkiu. Poslinkio apvalinimas užtikrina apytikslį diapazono autentiškumą išlaikant duomenų saugumą, kuris yra artimesnis tikriems duomenims nei ankstesnės schemos, ir turi didelę reikšmę didelių duomenų analizės scenarijuje.
Rekomenduojamas modelis"ML-NPB-5660"Duomenų maskavimui
4. Dažniausiai naudojami duomenų maskavimo metodai
(1). Statistiniai metodai
Duomenų atranka ir duomenų agregavimas
- Duomenų atranka: pradinio duomenų rinkinio analizė ir įvertinimas parenkant reprezentatyvų duomenų rinkinio poaibį yra svarbus metodas siekiant pagerinti tapatybės panaikinimo metodų veiksmingumą.
- Duomenų apibendrinimas: kaip statistinių metodų (tokių kaip sumavimas, skaičiavimas, vidurkis, didžiausias ir mažiausias) rinkinys, taikomas mikroduomenų atributams, rezultatas reprezentuoja visus pradinio duomenų rinkinio įrašus.
(2). Kriptografija
Kriptografija yra įprastas desensibilizacijos arba desensibilizacijos efektyvumo didinimo metodas. Įvairių tipų šifravimo algoritmai gali pasiekti skirtingus desensibilizacijos efektus.
- Deterministinis šifravimas: neatsitiktinis simetriškas šifravimas. Paprastai jis apdoroja ID duomenis ir prireikus gali iššifruoti ir atkurti šifruotą tekstą į pradinį ID, tačiau raktas turi būti tinkamai apsaugotas.
- Negrįžtamas šifravimas: maišos funkcija naudojama duomenims apdoroti, kuri paprastai naudojama ID duomenims. Jo negalima tiesiogiai iššifruoti, todėl susiejimo ryšys turi būti išsaugotas. Be to, dėl maišos funkcijos ypatybių gali įvykti duomenų susidūrimas.
- Homomorfinis šifravimas: naudojamas šifruoto teksto homomorfinis algoritmas. Jo ypatybė yra ta, kad šifruoto teksto operacijos rezultatas yra toks pat kaip ir paprasto teksto operacijos po iššifravimo. Todėl jis dažniausiai naudojamas skaitiniams laukams apdoroti, tačiau jis nėra plačiai naudojamas dėl našumo priežasčių.
(3). Sistemos technologija
Slopinimo technologija ištrina arba apsaugo duomenų elementus, kurie neatitinka privatumo apsaugos, bet jų neskelbia.
- Maskavimas: tai labiausiai paplitęs desensibilizacijos metodas, skirtas paslėpti atributo reikšmę, pvz., priešininko numerį, asmens tapatybės kortelė pažymėta žvaigždute arba sutrumpintas adresas.
- Vietinis slopinimas: reiškia konkrečių atributų reikšmių (stulpelių) ištrynimo, neesminių duomenų laukų pašalinimo procesą;
- Įrašų slopinimas: reiškia konkrečių įrašų (eilučių) ir neesminių duomenų įrašų ištrynimo procesą.
(4). Pseudonimas Technologija
Pseudomaningas yra identifikavimo panaikinimo būdas, kai tiesioginiam identifikatoriui (ar kitam jautriam identifikatoriui) pakeičiamas pseudonimas. Pseudonimų metodai sukuria unikalius identifikatorius kiekvienam atskiram informacijos subjektui, o ne tiesioginius ar jautrius identifikatorius.
- Jis gali savarankiškai generuoti atsitiktines reikšmes, kad atitiktų pradinį ID, išsaugotų atvaizdavimo lentelę ir griežtai kontroliuotų prieigą prie atvaizdavimo lentelės.
- Taip pat galite naudoti šifravimą, kad sukurtumėte slapyvardžius, tačiau reikia tinkamai išsaugoti iššifravimo raktą;
Ši technologija plačiai naudojama esant dideliam nepriklausomų duomenų naudotojų skaičiui, pvz., OpenID atviros platformos scenarijuje, kai skirtingi kūrėjai tam pačiam vartotojui gauna skirtingus OpenID.
(5). Apibendrinimo metodai
Apibendrinimo metodas reiškia identifikavimo panaikinimo metodą, kuris sumažina pasirinktų atributų detalumą duomenų rinkinyje ir pateikia bendresnį bei abstraktesnį duomenų aprašymą. Apibendrinimo technologija yra lengvai įgyvendinama ir gali apsaugoti įrašo lygio duomenų autentiškumą. Jis dažniausiai naudojamas duomenų produktuose arba duomenų ataskaitose.
- Apvalinimas: apima pasirinkto atributo apvalinimo pagrindo pasirinkimą, pvz., kriminalistika į viršų arba į apačią, duodanti rezultatus 100, 500, 1K ir 10K.
– Viršutinio ir apatinio kodavimo metodai: reikšmes virš (arba žemiau) slenksčio pakeiskite slenksčiu, nurodančiu aukščiausią (arba apatinį) lygį, ir gaunamas rezultatas „virš X“ arba „žemiau X“
(6). Atsitiktinės atrankos metodai
Atsitiktinių atpažinimo technologija, kaip tam tikra atpažinimo technika, reiškia atributo vertės modifikavimą atsitiktinės atrankos būdu, kad reikšmė po atsitiktinės atrankos skirtųsi nuo pradinės tikrosios vertės. Šis procesas sumažina užpuoliko galimybę gauti atributo reikšmę iš kitų atributų reikšmių tame pačiame duomenų įraše, tačiau paveikia gautų duomenų autentiškumą, kuris yra įprastas gamybos bandymo duomenims.
Paskelbimo laikas: 2022-09-27