Kas yra duomenų maskavimo technologija ir sprendimas tinklo paketų brokeryje?

1. Duomenų maskavimo koncepcija

Duomenų maskavimas taip pat žinomas kaip duomenų maskavimas. Tai techninis metodas, skirtas konvertuoti, modifikuoti arba uždengti neskelbtinus duomenis, pvz., mobiliojo telefono numerį, banko kortelės numerį ir kitą informaciją, kai esame nustatę maskavimo taisykles ir politiką. Ši technika pirmiausia naudojama siekiant užkirsti kelią neskelbtinų duomenų tiesioginiam naudojimui nepatikimose aplinkose.

Duomenų maskavimo principas: duomenų maskavimas turėtų išlaikyti pradines duomenų charakteristikas, verslo taisykles ir duomenų aktualumą, siekiant užtikrinti, kad maskavimas nepaveiktų vėlesnio kūrimo, testavimo ir duomenų analizės. Užtikrinkite duomenų nuoseklumą ir galiojimą prieš maskavimą ir po jo.

2. Duomenų maskavimo klasifikacija

Duomenų maskavimą galima suskirstyti į statinį duomenų maskavimą (SDM) ir dinaminį duomenų maskavimą (DDM).

Statinis duomenų maskavimas (SDM)Statiniam duomenų maskavimui reikia sukurti naują negamybinės aplinkos duomenų bazę, skirtą izoliuoti ją nuo gamybinės aplinkos. Jautrūs duomenys išgaunami iš gamybinės duomenų bazės ir saugomi negamybinėje duomenų bazėje. Tokiu būdu desensibilizuoti duomenys yra izoliuojami nuo gamybinės aplinkos, o tai atitinka verslo poreikius ir užtikrina gamybinių duomenų saugumą.

SDM

Dinaminis duomenų maskavimas (DDM)Paprastai jis naudojamas gamybinėje aplinkoje, siekiant realiuoju laiku sumažinti jautrių duomenų jautrumą. Kartais, norint nuskaityti tuos pačius jautrius duomenis skirtingose ​​situacijose, reikalingi skirtingi maskavimo lygiai. Pavyzdžiui, skirtingi vaidmenys ir leidimai gali įgyvendinti skirtingas maskavimo schemas.

DDM

Duomenų ataskaitų teikimo ir duomenų produktų maskavimo programa

Tokie scenarijai daugiausia apima vidinius duomenų stebėjimo produktus arba skelbimų lentas, išorinių paslaugų duomenų produktus ir ataskaitas, pagrįstas duomenų analize, pvz., verslo ataskaitas ir projektų apžvalgas.

duomenų ataskaitų teikimo produkto maskavimas

3. Duomenų maskavimo sprendimas

Įprastos duomenų maskavimo schemos apima: negaliojimą, atsitiktinę vertę, duomenų pakeitimą, simetrinį šifravimą, vidutinę vertę, poslinkį ir apvalinimą ir kt.

AnuliavimasNegaliojantis: Tai yra jautrių duomenų šifravimas, sutrumpinimas arba slėpimas. Ši schema paprastai pakeičia tikrus duomenis specialiais simboliais (pvz., *). Operacija yra paprasta, tačiau vartotojai negali žinoti pradinių duomenų formato, o tai gali turėti įtakos vėlesnėms duomenų programoms.

Atsitiktinė reikšmėAtsitiktinė reikšmė reiškia atsitiktinį jautrių duomenų pakeitimą (skaičiai pakeičia skaitmenis, raidės pakeičia raides, o simboliai pakeičia simbolius). Šis maskavimo metodas tam tikru mastu užtikrins jautrių duomenų formatą ir palengvins vėlesnį duomenų taikymą. Kai kuriems reikšmingiems žodžiams, pavyzdžiui, žmonių ir vietų pavadinimams, gali prireikti maskavimo žodynų.

Duomenų pakeitimasDuomenų pakeitimas yra panašus į nulinių ir atsitiktinių reikšmių maskavimą, išskyrus tai, kad vietoj specialiųjų simbolių ar atsitiktinių reikšmių naudojami maskuojantys duomenys pakeičiami konkrečia reikšme.

Simetrinis šifravimasSimetrinis šifravimas yra specialus grįžtamasis maskavimo metodas. Jis šifruoja jautrius duomenis naudodamas šifravimo raktus ir algoritmus. Šifruoto teksto formatas atitinka originalius duomenis loginėse taisyklėse.

VidutinisVidurkių schema dažnai naudojama statistiniuose scenarijuose. Skaitmeniniams duomenims pirmiausia apskaičiuojame jų vidurkį, o tada atsitiktinai paskirstome desensibilizuotas vertes aplink vidurkį, taip išlaikydami duomenų sumą pastovią.

Poslinkis ir apvalinimasŠis metodas keičia skaitmeninius duomenis atsitiktiniu poslinkiu. Apvalinimas su poslinkiu užtikrina apytikslį diapazono autentiškumą, išlaikant duomenų saugumą, kuris yra artimesnis tikriems duomenims nei ankstesnės schemos, ir yra labai svarbus didelių duomenų analizės scenarijuje.

ML-NPB-5660-数据脱敏

Rekomenduojamas modelis"ML-NPB-5660"dėl duomenų maskavimo"

4. Dažniausiai naudojami duomenų maskavimo metodai

(1). Statistiniai metodai

Duomenų atranka ir duomenų agregavimas

- Duomenų atranka: pradinio duomenų rinkinio analizė ir vertinimas parenkant reprezentatyvų duomenų rinkinio pogrupį yra svarbus metodas, siekiant pagerinti anonimiškumo nustatymo metodų veiksmingumą.

- Duomenų agregavimas: tai statistinių metodų (pvz., sumavimo, skaičiavimo, vidurkinimo, maksimumo ir minimumo) rinkinys, taikomas mikroduomenų atributams, ir rezultatas atspindi visus pradinio duomenų rinkinio įrašus.

(2). Kriptografija

Kriptografija yra įprastas metodas jautrumui sumažinti arba jautrumo mažinimo efektyvumui padidinti. Skirtingi šifravimo algoritmų tipai gali pasiekti skirtingą jautrumo mažinimo poveikį.

– Deterministinis šifravimas: neatsitiktinis simetrinis šifravimas. Paprastai jis apdoroja asmens tapatybės duomenis ir prireikus gali iššifruoti bei atkurti šifruotą tekstą iki pradinės asmens tapatybės, tačiau raktas turi būti tinkamai apsaugotas.

- Negrįžtamas šifravimas: Maišos funkcija naudojama duomenims apdoroti, ji paprastai naudojama ID duomenims. Jos negalima tiesiogiai iššifruoti, todėl reikia išsaugoti susiejimo ryšį. Be to, dėl maišos funkcijos ypatybių gali įvykti duomenų susidūrimas.

- Homomorfinis šifravimas: naudojamas šifruoto teksto homomorfinis algoritmas. Jo savybė yra ta, kad šifruoto teksto operacijos rezultatas po iššifravimo yra toks pat kaip ir paprasto teksto operacijos rezultatas. Todėl jis dažniausiai naudojamas skaitmeniniams laukams apdoroti, tačiau dėl našumo priežasčių nėra plačiai naudojamas.

(3). Sistemos technologija

Slopinimo technologija ištrina arba apsaugo duomenų elementus, kurie neatitinka privatumo apsaugos reikalavimų, bet jų neskelbia.

- Maskavimas: tai dažniausiai naudojamas jautrumo mažinimo metodas, skirtas užmaskuoti atributo reikšmę, pavyzdžiui, priešininko numeris, asmens tapatybės kortelė pažymima žvaigždute arba adresas sutrumpintas.

- Vietinis slopinimas: reiškia konkrečių atributų reikšmių (stulpelių) ištrynimo procesą, pašalinant nebūtinus duomenų laukus;

- Įrašų slopinimas: reiškia konkrečių įrašų (eilučių) ištrynimo procesą, ištrinant nebūtinus duomenų įrašus.

(4). Pseudonimų technologija

Pseudomanizavimas – tai anonimizacijos technika, kai tiesioginis identifikatorius (ar kitas jautrus identifikatorius) pakeičiamas pseudonimu. Pseudonimizavimo technikos sukuria unikalius kiekvieno informacijos subjekto identifikatorius, o ne tiesioginius ar jautrius identifikatorius.

- Jis gali nepriklausomai generuoti atsitiktines reikšmes, kad atitiktų originalų ID, išsaugoti atvaizdavimo lentelę ir griežtai kontroliuoti prieigą prie atvaizdavimo lentelės.

- Taip pat galite naudoti šifravimą pseudonimams kurti, tačiau turite tinkamai saugoti iššifravimo raktą;

Ši technologija plačiai naudojama esant dideliam skaičiui nepriklausomų duomenų naudotojų, pavyzdžiui, „OpenID“ atvirosios platformos scenarijuje, kai skirtingi kūrėjai tam pačiam naudotojui gauna skirtingus „OpenID“.

(5). Apibendrinimo metodai

Apibendrinimo technika – tai anonimiškumo panaikinimo technika, kuri sumažina pasirinktų atributų detalumą duomenų rinkinyje ir pateikia bendresnį bei abstraktesnį duomenų aprašymą. Apibendrinimo technologiją lengva įdiegti ir ji gali apsaugoti įrašų lygio duomenų autentiškumą. Ji dažniausiai naudojama duomenų produktuose arba duomenų ataskaitose.

- Apvalinimas: tai apvalinimo pagrindo pasirinkimas pasirinktam atributui, pvz., į viršų arba į apačią, gaunant rezultatus 100, 500, 1 tūkst. ir 10 tūkst.

- Viršutinio ir apatinio kodavimo metodai: pakeiskite vertes virš (arba žemiau) slenksčio slenksčiu, atitinkančiu viršutinį (arba apatinį) lygį, gaudami rezultatą „virš X“ arba „žemiau X“.

(6). Atsitiktinės atrankos metodai

Kaip tam tikra anonimiškumo pašalinimo technika, atsitiktinės atrankos technologija reiškia atributo vertės modifikavimą taikant atsitiktinės atrankos metodą, kad vertė po atsitiktinės atrankos skirtųsi nuo pradinės tikrosios vertės. Šis procesas sumažina užpuoliko galimybę gauti atributo vertę iš kitų atributo verčių tame pačiame duomenų įraše, tačiau paveikia gautų duomenų autentiškumą, kas būdinga gamybiniams bandymų duomenims.


Įrašo laikas: 2022 m. rugsėjo 27 d.