當(dāng)前位置:首頁 > 公眾號(hào)精選 > 架構(gòu)師社區(qū)
[導(dǎo)讀]最近連著幾天晚上在家總是接到一些奇奇怪怪的電話,“哥,你是 xxx 吧,我們這里是 xxx 高端男士私人會(huì)所...”,握草,我先是一愣,然后狠狠的罵了回去。一臉傲嬌的轉(zhuǎn)過頭,面帶微笑稍顯諂媚:老婆你聽我說,我真的啥也沒干,你要相信我!

最近連著幾天晚上在家總是接到一些奇奇怪怪的電話,“哥,你是 xxx 吧,我們這里是 xxx 高端男士私人會(huì)所...”,握草,我先是一愣,然后狠狠的罵了回去。一臉傲嬌的轉(zhuǎn)過頭,面帶微笑稍顯諂媚:老婆你聽我說,我真的啥也沒干,你要相信我!

啪~

大廠也在用的6種數(shù)據(jù)脫敏方案,別做泄密內(nèi)鬼
搞事情啊

過后揉揉臉細(xì)想想,肯定是哪個(gè)不道德的網(wǎng)站,又把我的個(gè)人信息給賣了,現(xiàn)在的人上網(wǎng)都處于一個(gè)裸奔的狀態(tài),個(gè)人信息已不再屬于個(gè)人,時(shí)下這種事好像也見怪不怪了,不過,出現(xiàn)這種事大多是有內(nèi)鬼。

大廠也在用的6種數(shù)據(jù)脫敏方案,別做泄密內(nèi)鬼
停止交易,有內(nèi)鬼

而作為開發(fā)者的我們,能做的就是盡量避免經(jīng)我們手的用戶數(shù)據(jù)泄露,那今天就來講講互聯(lián)網(wǎng)中內(nèi)部防止隱私數(shù)據(jù)泄露的手段-數(shù)據(jù)脫敏。

什么是數(shù)據(jù)脫敏

先來看看什么是數(shù)據(jù)脫敏?數(shù)據(jù)脫敏也叫數(shù)據(jù)的去隱私化,在我們給定脫敏規(guī)則和策略的情況下,對(duì)敏感數(shù)據(jù)比如 手機(jī)號(hào)、銀行卡號(hào) 等信息,進(jìn)行轉(zhuǎn)換或者修改的一種技術(shù)手段,防止敏感數(shù)據(jù)直接在不可靠的環(huán)境下使用。

像政府、醫(yī)療行業(yè)、金融機(jī)構(gòu)、移動(dòng)運(yùn)營商是比較早開始應(yīng)用數(shù)據(jù)脫敏的,因?yàn)樗麄兯莆盏亩际怯脩糇詈诵牡乃矫軘?shù)據(jù),如果泄露后果是不可估量的。

數(shù)據(jù)脫敏的應(yīng)用在生活中是比較常見的,比如我們在淘寶買東西訂單詳情中,商家賬戶信息會(huì)被用 * 遮擋,保障了商戶隱私不泄露,這就是一種數(shù)據(jù)脫敏方式。

大廠也在用的6種數(shù)據(jù)脫敏方案,別做泄密內(nèi)鬼
淘寶詳情

數(shù)據(jù)脫敏又分為靜態(tài)數(shù)據(jù)脫敏(SDM)和 動(dòng)態(tài)數(shù)據(jù)脫敏(DDM):

靜態(tài)數(shù)據(jù)脫敏

靜態(tài)數(shù)據(jù)脫敏(SDM):適用于將數(shù)據(jù)抽取出生產(chǎn)環(huán)境脫敏后分發(fā)至測試、開發(fā)、培訓(xùn)、數(shù)據(jù)分析等場景。

有時(shí)我們可能需要將生產(chǎn)環(huán)境的數(shù)據(jù) ?copy 到測試、開發(fā)庫中,以此來排查問題或進(jìn)行數(shù)據(jù)分析,但出于安全考慮又不能將敏感數(shù)據(jù)存儲(chǔ)于非生產(chǎn)環(huán)境,此時(shí)就要把敏感數(shù)據(jù)從生產(chǎn)環(huán)境脫敏完畢之后再在非生產(chǎn)環(huán)境使用。

這樣脫敏后的數(shù)據(jù)與生產(chǎn)環(huán)境隔離,滿足業(yè)務(wù)需要的同時(shí)又保障了生產(chǎn)數(shù)據(jù)的安全。

大廠也在用的6種數(shù)據(jù)脫敏方案,別做泄密內(nèi)鬼
數(shù)據(jù)脫敏過程

如上圖所示,將用戶的真實(shí) 姓名、手機(jī)號(hào)、身份證銀行卡號(hào) 通過 替換、無效化、亂序、對(duì)稱加密 等方案進(jìn)行脫敏改造。

動(dòng)態(tài)數(shù)據(jù)脫敏

動(dòng)態(tài)數(shù)據(jù)脫敏(DDM):一般用在生產(chǎn)環(huán)境,訪問敏感數(shù)據(jù)時(shí)實(shí)時(shí)進(jìn)行脫敏,因?yàn)橛袝r(shí)在不同情況下對(duì)于同一敏感數(shù)據(jù)的讀取,需要做不同級(jí)別的脫敏處理,例如:不同角色、不同權(quán)限所執(zhí)行的脫敏方案會(huì)不同。

注意:在抹去數(shù)據(jù)中的敏感內(nèi)容同時(shí),也需要保持原有的數(shù)據(jù)特征、業(yè)務(wù)規(guī)則和數(shù)據(jù)關(guān)聯(lián)性,保證我們在開發(fā)、測試以及數(shù)據(jù)分析類業(yè)務(wù)不會(huì)受到脫敏的影響,使脫敏前后的數(shù)據(jù)一致性和有效性。總之一句話:你愛怎么脫就怎么脫,別影響我使用就行

數(shù)據(jù)脫敏方案

數(shù)據(jù)脫敏系統(tǒng)可以按照不同業(yè)務(wù)場景自行定義和編寫脫敏規(guī)則,可以針對(duì)庫表的某個(gè)敏感字段,進(jìn)行數(shù)據(jù)的不落地脫敏。

大廠也在用的6種數(shù)據(jù)脫敏方案,別做泄密內(nèi)鬼
脫敏系統(tǒng)

數(shù)據(jù)脫敏的方式有很多種,接下來以下圖數(shù)據(jù)為準(zhǔn)一個(gè)一個(gè)的演示每種方案。

大廠也在用的6種數(shù)據(jù)脫敏方案,別做泄密內(nèi)鬼
原始數(shù)據(jù)

1、無效化

無效化方案在處理待脫敏的數(shù)據(jù)時(shí),通過對(duì)字段數(shù)據(jù)值進(jìn)行 截?cái)?/code>、加密隱藏 等方式讓敏感數(shù)據(jù)脫敏,使其不再具有利用價(jià)值。一般采用特殊字符(*等)代替真值,這種隱藏敏感數(shù)據(jù)的方法簡單,但缺點(diǎn)是用戶無法得知原數(shù)據(jù)的格式,如果想要獲取完整信息,要讓用戶授權(quán)查詢。

大廠也在用的6種數(shù)據(jù)脫敏方案,別做泄密內(nèi)鬼
截?cái)喾绞?

比如我們將身份證號(hào)用 * 替換真實(shí)數(shù)字就變成了 "220724 ****** 3523",非常簡單。

大廠也在用的6種數(shù)據(jù)脫敏方案,別做泄密內(nèi)鬼
隱藏方式

2、隨機(jī)值

隨機(jī)值替換,字母變?yōu)殡S機(jī)字母,數(shù)字變?yōu)殡S機(jī)數(shù)字,文字隨機(jī)替換文字的方式來改變敏感數(shù)據(jù),這種方案的優(yōu)點(diǎn)在于可以在一定程度上保留原有數(shù)據(jù)的格式,往往這種方法用戶不易察覺的。

我們看到 nameidnumber 字段進(jìn)行了隨機(jī)化脫敏,而名字姓、氏隨機(jī)化稍有特殊,需要有對(duì)應(yīng)姓氏字典數(shù)據(jù)支持。

大廠也在用的6種數(shù)據(jù)脫敏方案,別做泄密內(nèi)鬼
隨機(jī)值

3、數(shù)據(jù)替換

數(shù)據(jù)替換與前邊的無效化方式比較相似,不同的是這里不以特殊字符進(jìn)行遮擋,而是用一個(gè)設(shè)定的虛擬值替換真值。比如說我們將手機(jī)號(hào)統(tǒng)一設(shè)置成 “13651300000”。

大廠也在用的6種數(shù)據(jù)脫敏方案,別做泄密內(nèi)鬼
數(shù)據(jù)替換

4、對(duì)稱加密

對(duì)稱加密是一種特殊的可逆脫敏方法,通過加密密鑰和算法對(duì)敏感數(shù)據(jù)進(jìn)行加密,密文格式與原始數(shù)據(jù)在邏輯規(guī)則上一致,通過密鑰解密可以恢復(fù)原始數(shù)據(jù),要注意的就是密鑰的安全性。

大廠也在用的6種數(shù)據(jù)脫敏方案,別做泄密內(nèi)鬼
對(duì)稱加密

5、平均值

平均值方案經(jīng)常用在統(tǒng)計(jì)場景,針對(duì)數(shù)值型數(shù)據(jù),我們先計(jì)算它們的均值,然后使脫敏后的值在均值附近隨機(jī)分布,從而保持?jǐn)?shù)據(jù)的總和不變。

大廠也在用的6種數(shù)據(jù)脫敏方案,別做泄密內(nèi)鬼
原始數(shù)據(jù)

對(duì)價(jià)格字段 price 做平均值處理后,字段總金額不變,但脫敏后的字段值都在均值 60 附近。

大廠也在用的6種數(shù)據(jù)脫敏方案,別做泄密內(nèi)鬼
平均值

6、偏移和取整

這種方式通過隨機(jī)移位改變數(shù)字?jǐn)?shù)據(jù),偏移取整在保持了數(shù)據(jù)的安全性的同時(shí)保證了范圍的大致真實(shí)性,比之前幾種方案更接近真實(shí)數(shù)據(jù),在大數(shù)據(jù)分析場景中意義比較大。

比如下邊的日期字段create_time2020-12-08 15:12:25 變?yōu)?2018-01-02 15:00:00。

大廠也在用的6種數(shù)據(jù)脫敏方案,別做泄密內(nèi)鬼
取整

數(shù)據(jù)脫敏規(guī)則在實(shí)際應(yīng)用中往往都是多種方案配合使用,以此來達(dá)到更高的安全級(jí)別。

總結(jié)

無論是靜態(tài)脫敏還是動(dòng)態(tài)脫敏,其最終都是為了防止組織內(nèi)部對(duì)隱私數(shù)據(jù)的濫用,防止隱私數(shù)據(jù)在未經(jīng)脫敏的情況下從組織流出。所以作為一個(gè)程序員不泄露數(shù)據(jù)是最起碼的操守。

特別推薦一個(gè)分享架構(gòu)+算法的優(yōu)質(zhì)內(nèi)容,還沒關(guān)注的小伙伴,可以長按關(guān)注一下:

大廠也在用的6種數(shù)據(jù)脫敏方案,別做泄密內(nèi)鬼

大廠也在用的6種數(shù)據(jù)脫敏方案,別做泄密內(nèi)鬼

大廠也在用的6種數(shù)據(jù)脫敏方案,別做泄密內(nèi)鬼

長按訂閱更多精彩▼

大廠也在用的6種數(shù)據(jù)脫敏方案,別做泄密內(nèi)鬼

如有收獲,點(diǎn)個(gè)在看,誠摯感謝

免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉