Якая тэхналогія маскіроўкі дадзеных і рашэнне ў сеткавым брокеры?

1. Канцэпцыя маскіроўкі дадзеных

Маскіроўка дадзеных таксама вядомая як маскіроўка дадзеных. Гэта тэхнічны метад пераўтварэння, змены або пакрыцця адчувальных дадзеных, такіх як нумар мабільнага тэлефона, нумар банкаўскай карты і іншая інфармацыя, калі мы далі правілы і палітыку маскіроўкі. Гэтая методыка ў першую чаргу выкарыстоўваецца для прадухілення непасрэднага выкарыстання дадзеных у ненадзейных умовах.

Прынцып маскіроўкі дадзеных: маскіроўка дадзеных павінна падтрымліваць зыходныя характарыстыкі дадзеных, правілы бізнесу і актуальнасць дадзеных, каб гарантаваць, што наступная распрацоўка, тэставанне і аналіз дадзеных не будуць закрануты маскіраваннем. Пераканайцеся, што паслядоўнасць дадзеных і абгрунтаванасць да і пасля маскіроўкі.

2. Класіфікацыя маскіроўкі дадзеных

Маскіраванне дадзеных можна падзяліць на статычны маскіраванне дадзеных (SDM) і дынамічную маскіроўку дадзеных (DDM).

Статычны маскіроўка дадзеных (SDM): Статычная маскіроўка дадзеных патрабуе стварэння новай базы дадзеных непрадукцыйных умоў для ізаляцыі ад вытворчай асяроддзя. Адчувальныя дадзеныя здабываюцца з базы дадзеных вытворчасці, а затым захоўваюцца ў базе дадзеных, якія не вырабляюць вытворчасць. Такім чынам, дэсенсібілізаваныя дадзеныя вылучаюцца з вытворчага асяроддзя, які адпавядае патрэбам бізнесу і забяспечвае бяспеку вытворчых дадзеных.

SDM

Дынамічная маскіроўка дадзеных (DDM): Звычайна ён выкарыстоўваецца ў вытворчых умовах для дэсенсібілізацыі адчувальных дадзеных у рэжыме рэальнага часу. Часам у розных сітуацыях патрабуецца розныя ўзроўні маскіравання. Напрыклад, розныя ролі і дазволы могуць рэалізаваць розныя схемы маскіроўкі.

DDM

Дадатак і дадзеныя аб дадзеных маскіравання прадуктаў для дадзеных

Такія сцэнарыі ў асноўным ўключаюць у сябе ўнутраныя прадукты маніторынгу дадзеных або білборд, прадукцыю дадзеных знешняй службы і справаздачы на ​​аснове аналізу дадзеных, такіх як справаздачы аб бізнес -справаздачах і агляд праектаў.

Маскіраванне прадукту паведамлення пра дадзеныя

3. Рашэнне маскіроўкі дадзеных

Агульныя схемы маскіроўкі дадзеных ўключаюць: несапраўдны, выпадковае значэнне, замена дадзеных, сіметрычнае шыфраванне, сярэдняе значэнне, зрушэнне і акругленне і г.д.

Інваліда: Несапраўдная абазначэнне ставіцца да шыфравання, усячэння або ўтойвання адчувальных дадзеных. Гэтая схема звычайна замяняе рэальныя дадзеныя спецыяльнымі сімваламі (напрыклад, *). Аперацыя простая, але карыстальнікі не могуць ведаць фармат зыходных дадзеных, што можа паўплываць на наступныя прыкладанні дадзеных.

Выпадковае значэнне: Выпадковае значэнне ставіцца да выпадковай замены адчувальных дадзеных (нумары замяняюць лічбы, літары замяняюць літары і знакі замяняюць сімвалы). Гэты метад маскіравання забяспечыць фармат адчувальных дадзеных у пэўнай ступені і палегчыць наступнае прыкладанне дадзеных. Маскіроўкі слоўнікаў могуць спатрэбіцца для некаторых значных слоў, такіх як імёны людзей і месцаў.

Замена дадзеных: Замена дадзеных падобная на маскіроўку нулявых і выпадковых значэнняў, за выключэннем таго, што замест выкарыстання спецыяльных сімвалаў або выпадковых значэнняў дадзеныя маскіравання замяняюцца на пэўнае значэнне.

Сіметрычнае шыфраванне: Сіметрычнае шыфраванне - гэта асаблівы метад зварачальнага маскіравання. Ён шыфруе адчувальныя дадзеныя праз ключы шыфравання і алгарытмы. Фармат CipherText адпавядае зыходным дадзеным у лагічных правілах.

Сярэдні: Сярэдняя схема часта выкарыстоўваецца ў статыстычных сцэнарыях. Для лікавых дадзеных мы спачатку разлічваем іх сярэдняе значэнне, а затым выпадковым чынам распаўсюджваем дэсенсібілізаваныя значэнні вакол сярэдняга, захоўваючы такім чынам суму пастаянных дадзеных.

Зрушэнне і акругленне: Гэты метад змяняе лічбавыя дадзеныя па выпадковым зруху. Зрушэнне акруглення забяспечвае прыблізную сапраўднасць дыяпазону, захоўваючы пры гэтым бяспеку дадзеных, што бліжэй да рэальных дадзеных, чым да папярэдніх схем, і мае вялікае значэнне ў сцэнарыі аналізу вялікіх дадзеных.

ML-NPB-5660- 数据脱敏

Рэкамендую мадэль "ML-NPB-5660"Для маскіроўкі дадзеных

4. Звычайна выкарыстоўваюцца метады маскіравання дадзеных

(1). Статыстычныя метады

Адбор дадзеных і агрэгацыя дадзеных

- Адбор дадзеных дадзеных: Аналіз і ацэнка арыгінальнага набору дадзеных шляхам выбару рэпрэзентатыўнага падмноства набору дадзеных- важны метад павышэння эфектыўнасці метадаў дэфініфікацыі.

- Агрэгацыя дадзеных: У якасці калекцыі статыстычных метадаў (напрыклад, падсумаванне, падлік, у сярэднім, максімальны і мінімальны), якія прымяняюцца да атрыбутаў у Microdata, вынік прадстаўляе ўсе запісы ў зыходным наборы дадзеных.

(2). Крыптаграфія

Крыптаграфія - звычайны метад дэсенсібілізацыі або павышэння эфектыўнасці дэсенсібілізацыі. Розныя тыпы алгарытмаў шыфравання могуць дасягнуць розных эфектаў дэсенсібілізацыі.

- Дэтэрмінаванае шыфраванне: нерандамнае сіметрычнае шыфраванне. Звычайна ён апрацоўвае дадзеныя ідэнтыфікатара і можа расшыфраваць і аднаўляць шыфруты ў зыходны ідэнтыфікатар пры неабходнасці, але ключ павінен быць належным чынам абаронены.

- Незваротнае шыфраванне: Хэш -функцыя выкарыстоўваецца для апрацоўкі дадзеных, якія звычайна выкарыстоўваюцца для дадзеных ідэнтыфікатара. Яго нельга непасрэдна расшыфраваць, і адносіны адлюстравання павінны быць захаваны. Акрамя таго, з -за асаблівасці хэш -функцыі можа адбыцца сутыкненне дадзеных.

- Гамаморфнае шыфраванне: выкарыстоўваецца гамаморфны алгарытм CipherText. Яго характарыстыка заключаецца ў тым, што вынік эксплуатацыі CipherText такі ж, як у працы ў адкрытым тэкст пасля расшыфроўкі. Такім чынам, ён звычайна выкарыстоўваецца для апрацоўкі лікавых палёў, але ён шырока выкарыстоўваецца па прычынах прадукцыйнасці.

(3). Сістэмныя тэхналогіі

Тэхналогія падаўлення выдаляе або засцерагае элементы дадзеных, якія не адпавядаюць абароне прыватнасці, але не публікуюць іх.

- Маскіроўка: гэта ставіцца да найбольш распаўсюджанага метаду дэсенсібілізацыі, каб замаскіраваць значэнне атрыбута, напрыклад, нумар суперніка, ідэнтыфікатар, пазначаная зорачкай, альбо адрас абрэзаны.

- лакальнае падаўленне: ставіцца да працэсу выдалення пэўных значэнняў атрыбутаў (слупкоў), выдалення неістотных палёў дадзеных;

- Падаўленне запісу: ставіцца да працэсу выдалення пэўных запісаў (радкоў), выдалення неістотных запісаў дадзеных.

(4). Тэхналогія псеўданіма

Pseudomanning-гэта метад дэ-ідэнтыфікацыі, якая выкарыстоўвае псеўданім для замены прамога ідэнтыфікатара (ці іншага адчувальнага ідэнтыфікатара). Метады псеўданіма ствараюць унікальныя ідэнтыфікатары для кожнага асобнага прадмета інфармацыі, а не прамыя або адчувальныя ідэнтыфікатары.

- Ён можа ствараць выпадковыя значэнні незалежна, каб адпавядаць зыходным ідэнтыфікатарам, захаваць табліцу адлюстравання і строга кантраляваць доступ да табліцы адлюстравання.

- Вы таксама можаце выкарыстоўваць шыфраванне для атрымання псеўданімаў, але неабходна правільна захаваць ключ расшыфроўкі;

Гэтая тэхналогія шырока выкарыстоўваецца ў выпадку вялікай колькасці незалежных карыстальнікаў дадзеных, напрыклад, OpenID у сцэнарыі адкрытай платформы, дзе розныя распрацоўшчыкі атрымліваюць розныя OpenID для таго ж карыстальніка.

(5). Метады абагульнення

Тэхніка абагульнення ставіцца да тэхнікі дэ-ідэнтыфікацыі, якая зніжае дэталёвасць выбраных атрыбутаў у наборы дадзеных і дае больш агульнае і абстрактнае апісанне дадзеных. Тэхналогія абагульнення лёгка рэалізаваць і можа абараніць сапраўднасць дадзеных рэкорднага ўзроўню. Звычайна ён выкарыстоўваецца ў прадуктах дадзеных або справаздачам аб дадзеных.

- акругленне: прадугледжвае выбар базы акруг для абранага атрыбута, напрыклад, крыміналістыкі ўверх або ўніз, што дасць вынікі 100, 500, 1k і 10k

- Тэхніка кадавання верхніх і ніжняй

(6). Метады рандомизации

У якасці своеасаблівай тэхнікі дэ-ідэнтыфікацыі тэхналогія рандомизации ставіцца да мадыфікацыі значэння атрыбута праз рандомизацию, так што значэнне пасля рандомизации адрозніваецца ад першапачатковага рэальнага значэння. Гэты працэс зніжае здольнасць зламысніка атрымаць значэнне атрыбута з іншых значэнняў атрыбутаў у тым жа запісе дадзеных, але ўплывае на сапраўднасць атрыманых дадзеных, што часта сустракаецца з дадзенымі праверкі вытворчасці.


Час паведамлення: верасня-27-2022