當(dāng)前位置:首頁(yè) > 公眾號(hào)精選 > 架構(gòu)師社區(qū)
[導(dǎo)讀]緩存設(shè)計(jì)可謂老生常談了,早些時(shí)候都是采用memcache,現(xiàn)在大家更多傾向使用redis,除了知曉常用的數(shù)據(jù)存儲(chǔ)類型,結(jié)合業(yè)務(wù)場(chǎng)景有針對(duì)性選擇,好像其他也沒有什么大的難點(diǎn)。工程中引入RedisClient二方包,初始化一個(gè)Bean實(shí)例RedisTemplate?,一切搞定,soe...

緩存設(shè)計(jì)可謂老生常談了,早些時(shí)候都是采用memcache,現(xiàn)在大家更多傾向使用redis,除了知曉常用的數(shù)據(jù)存儲(chǔ)類型,結(jié)合業(yè)務(wù)場(chǎng)景有針對(duì)性選擇,好像其他也沒有什么大的難點(diǎn)。

工程中引入Redis Client二方包,初始化一個(gè)Bean實(shí)例RedisTemplate?,一切搞定,so easy。

億級(jí)系統(tǒng)的Redis緩存如何設(shè)計(jì)???

如果是幾十、幾百并發(fā)的業(yè)務(wù)場(chǎng)景,緩存設(shè)計(jì)可能并不需要考慮那么多,但如果是億級(jí)的系統(tǒng)呢?


億級(jí)系統(tǒng)的Redis緩存如何設(shè)計(jì)???


首先,先了解緩存知識(shí)圖譜


早期的緩存用于加速CPU數(shù)據(jù)交換的RAM。隨著互聯(lián)網(wǎng)的快速發(fā)展,緩存的應(yīng)用更加寬泛,用于數(shù)據(jù)高速交換的存儲(chǔ)介質(zhì)都稱之為緩存。

使用緩存時(shí),我們要關(guān)注哪些指標(biāo)?緩存有哪些應(yīng)用模式?以及緩存設(shè)計(jì)時(shí)有哪些Tip技巧?一圖勝千言,如下:

億級(jí)系統(tǒng)的Redis緩存如何設(shè)計(jì)???


七大經(jīng)典問題

緩存在使用過程不可避免會(huì)遇到一些問題,對(duì)于高頻的問題我們大概歸為了7類。具體內(nèi)容下面我們一一道來

1、緩存集中失效

當(dāng)業(yè)務(wù)系統(tǒng)查詢數(shù)據(jù)時(shí),首先會(huì)查詢緩存,如果緩存中數(shù)據(jù)不存在,然后查詢DB再將數(shù)據(jù)預(yù)熱到Cache中,并返回。緩存的性能比 DB 高 50~100?倍以上。

億級(jí)系統(tǒng)的Redis緩存如何設(shè)計(jì)???

很多業(yè)務(wù)場(chǎng)景,如:秒殺商品、微博熱搜排行、或者一些活動(dòng)數(shù)據(jù),都是通過跑任務(wù)方式,將DB數(shù)據(jù)批量、集中預(yù)熱到緩存中,緩存數(shù)據(jù)有著近乎相同的過期時(shí)間

當(dāng)過這批數(shù)據(jù)過期時(shí),會(huì)一起過期,此時(shí),對(duì)這批數(shù)據(jù)的所有請(qǐng)求,都會(huì)出現(xiàn)緩存失效,從而將壓力轉(zhuǎn)嫁到DB,DB的請(qǐng)求量激增,壓力變大,響應(yīng)開始變慢。

那么有沒有解呢?

當(dāng)然有了。

我們可以從緩存的過期時(shí)間入口,將原來的固定過期時(shí)間,調(diào)整為過期時(shí)間=基礎(chǔ)時(shí)間 隨機(jī)時(shí)間,讓緩存慢慢過期,避免瞬間全部過期,對(duì)DB產(chǎn)生過大壓力。

2、緩存穿透

不是所有的請(qǐng)求都能查到數(shù)據(jù),不論是從緩存中還是DB中。

假如黑客攻擊了一個(gè)論壇,用了一堆肉雞訪問一個(gè)不存的帖子id。按照常規(guī)思路,每次都會(huì)先查緩存,緩存中沒有,接著又查DB,同樣也沒有,此時(shí)不會(huì)預(yù)熱到Cache中,導(dǎo)致每次查詢,都會(huì)cache miss

由于DB的吞吐性能較差,會(huì)嚴(yán)重影響系統(tǒng)的性能,甚至影響正常用戶的訪問。

解決方案:

  • 方案一:查存DB 時(shí),如果數(shù)據(jù)不存在,預(yù)熱一個(gè)特殊空值到緩存中。這樣,后續(xù)查詢都會(huì)命中緩存,但是要對(duì)特殊值,解析處理。
  • 方案二:構(gòu)造一個(gè)BloomFilter過濾器,初始化全量數(shù)據(jù),當(dāng)接到請(qǐng)求時(shí),在BloomFilter中判斷這個(gè)key是否存在,如果不存在,直接返回即可,無需再查詢緩存和DB

3、緩存雪崩

緩存雪崩是指部分緩存節(jié)點(diǎn)不可用,進(jìn)而導(dǎo)致整個(gè)緩存體系甚至服務(wù)系統(tǒng)不可用的情況。

分布式緩存設(shè)計(jì)一般選擇一致性Hash,當(dāng)有部分節(jié)點(diǎn)異常時(shí),采用?rehash?策略,即把異常節(jié)點(diǎn)請(qǐng)求平均分散到其他緩存節(jié)點(diǎn)。但是,當(dāng)較大的流量洪峰到來時(shí),如果大流量 key 比較集中,正好在某 1~2 個(gè)緩存節(jié)點(diǎn),很容易將這些緩存節(jié)點(diǎn)的內(nèi)存、網(wǎng)卡過載,緩存節(jié)點(diǎn)異常 Crash,然后這些異常節(jié)點(diǎn)下線,這些大流量 key 請(qǐng)求又被 rehash 到其他緩存節(jié)點(diǎn),進(jìn)而導(dǎo)致其他緩存節(jié)點(diǎn)也被過載 Crash,緩存異常持續(xù)擴(kuò)散,最終導(dǎo)致整個(gè)緩存體系異常,無法對(duì)外提供服務(wù)。

解決方案:

  • 方案一:增加實(shí)時(shí)監(jiān)控,及時(shí)預(yù)警。通過機(jī)器替換、各種故障自動(dòng)轉(zhuǎn)移策略,快速恢復(fù)緩存對(duì)外的服務(wù)能力
  • 方案二:緩存增加多個(gè)副本,當(dāng)緩存異常時(shí),再讀取其他緩存副本。為了保證副本的可用性,盡量將多個(gè)緩存副本部署在不同機(jī)架上,降低風(fēng)險(xiǎn)。

4、緩存熱點(diǎn)

對(duì)于突發(fā)事件,大量用戶同時(shí)去訪問熱點(diǎn)信息,這個(gè)突發(fā)熱點(diǎn)信息所在的緩存節(jié)點(diǎn)就很容易出現(xiàn)過載和卡頓現(xiàn)象,甚至 Crash,我們稱之為緩存熱點(diǎn)。


億級(jí)系統(tǒng)的Redis緩存如何設(shè)計(jì)???


這個(gè)在新浪微博經(jīng)常遇到,某大V明星出軌、結(jié)婚、離婚,瞬間引發(fā)數(shù)百千萬的吃瓜群眾圍觀,訪問同一個(gè)key,流量集中打在一個(gè)緩存節(jié)點(diǎn)機(jī)器,很容易打爆網(wǎng)卡、帶寬、CPU的上限,最終導(dǎo)致緩存不可用。

解決方案:

  • 首先能先找到這個(gè)熱key來,比如通過Spark實(shí)時(shí)流分析,及時(shí)發(fā)現(xiàn)新的熱點(diǎn)key。
  • 將集中化流量打散,避免一個(gè)緩存節(jié)點(diǎn)過載。由于只有一個(gè)key,我們可以在key的后面拼上有序編號(hào),比如key#01、key#02。。。key#10多個(gè)副本,這些加工后的key位于多個(gè)緩存節(jié)點(diǎn)上。
  • 每次請(qǐng)求時(shí),客戶端隨機(jī)訪問一個(gè)即可
可以設(shè)計(jì)一個(gè)緩存服務(wù)治理管理后臺(tái),實(shí)時(shí)監(jiān)控緩存的SLA,并打通分布式配置中心,對(duì)于一些hot key可以快速、動(dòng)態(tài)擴(kuò)容。

5、緩存大Key

當(dāng)訪問緩存時(shí),如果key對(duì)應(yīng)的value過大,讀寫、加載很容易超時(shí),容易引發(fā)網(wǎng)絡(luò)擁堵。另外緩存的字段較多時(shí),每個(gè)字段的變更都會(huì)引發(fā)緩存數(shù)據(jù)的變更,頻繁的讀寫,導(dǎo)致慢查詢。如果大key過期被緩存淘汰失效,預(yù)熱數(shù)據(jù)要花費(fèi)較多的時(shí)間,也會(huì)導(dǎo)致慢查詢。

所以我們?cè)谠O(shè)計(jì)緩存的時(shí)候,要注意緩存的粒度,既不能過大,如果過大很容易導(dǎo)致網(wǎng)絡(luò)擁堵;也不能過小,如果太小,查詢頻率會(huì)很高,每次請(qǐng)求都要查詢多次。

解決方案:

  • 方案一:設(shè)置一個(gè)閾值,當(dāng)value的長(zhǎng)度超過閾值時(shí),對(duì)內(nèi)容啟動(dòng)壓縮,降低kv的大小
  • 方案二:評(píng)估大key所占的比例,由于很多框架采用池化技術(shù),如:Memcache,可以預(yù)先分配大對(duì)象空間。真正業(yè)務(wù)請(qǐng)求時(shí),直接拿來即用。
  • 方案三:顆粒劃分,將大key拆分為多個(gè)小key,獨(dú)立維護(hù),成本會(huì)降低不少
  • 方案四:大key要設(shè)置合理的過期時(shí)間,盡量不淘汰那些大key

6、緩存數(shù)據(jù)一致性

緩存是用來加速的,一般不會(huì)持久化儲(chǔ)存。所以,一份數(shù)據(jù)通常會(huì)存在DB緩存中,由此會(huì)帶來一個(gè)問題,如何保證這兩者的數(shù)據(jù)一致性。另外,緩存熱點(diǎn)問題會(huì)引入多個(gè)副本備份,也可能會(huì)發(fā)生不一致現(xiàn)象。


億級(jí)系統(tǒng)的Redis緩存如何設(shè)計(jì)???

解決方案:

  • 方案一:當(dāng)緩存更新失敗后,進(jìn)行重試,如果重試失敗,將失敗的key寫入MQ消息隊(duì)列,通過異步任務(wù)補(bǔ)償緩存,保證數(shù)據(jù)的一致性。
  • 方案二:設(shè)置一個(gè)較短的過期時(shí)間,通過自修復(fù)的方式,在緩存過期后,緩存重新加載最新的數(shù)據(jù)

7、數(shù)據(jù)并發(fā)競(jìng)爭(zhēng)預(yù)熱

互聯(lián)網(wǎng)系統(tǒng)典型的特點(diǎn)就是流量大,一旦緩存中的數(shù)據(jù)過期、或因某些原因被刪除等,導(dǎo)致緩存中的數(shù)據(jù)為空,大量的并發(fā)線程請(qǐng)求(查詢同一個(gè)key)就會(huì)一起并發(fā)查詢數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)的壓力陡然增加。


億級(jí)系統(tǒng)的Redis緩存如何設(shè)計(jì)???如果請(qǐng)求量非常大,全部壓在數(shù)據(jù)庫(kù),可能把數(shù)據(jù)庫(kù)壓垮,進(jìn)而導(dǎo)致整個(gè)系統(tǒng)的服務(wù)不可用。

解決方案:

  • 方案一:引入一把全局鎖,當(dāng)緩存未命中時(shí),先嘗試獲取全局鎖,如果拿到鎖,才有資格去查詢DB,并將數(shù)據(jù)預(yù)熱到緩存中。雖然,client端發(fā)起的請(qǐng)求非常多,但是由于拿不到鎖,只能處于等待狀態(tài),當(dāng)緩存中的數(shù)據(jù)預(yù)熱成功后,再?gòu)木彺嬷蝎@取
億級(jí)系統(tǒng)的Redis緩存如何設(shè)計(jì)???

為了便于理解,簡(jiǎn)單畫了個(gè)流程圖。這里面特別注意一個(gè)點(diǎn),由于有一個(gè)并發(fā)時(shí)間差,所以會(huì)有一個(gè)二次check緩存是否有值的校驗(yàn),防止緩存預(yù)熱重復(fù)覆蓋。

  • 方案二:緩存數(shù)據(jù)創(chuàng)建多個(gè)備份,當(dāng)一個(gè)過期失效后,可以訪問其他備份。

寫在最后

緩存設(shè)計(jì)時(shí),有很多技巧,優(yōu)化手段也是千變?nèi)f化,但是我們要抓住核心要素。那就是,讓訪問盡量命中緩存,同時(shí)保持?jǐn)?shù)據(jù)的一致性。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
關(guān)閉
關(guān)閉