教育行業(yè)A股IPO第一股(股票代碼 003032)

全國咨詢/投訴熱線:400-618-4000

Redis緩存預熱和緩存雪崩問題怎樣解決?

更新時間:2023年07月25日11時27分 來源:傳智教育 瀏覽次數(shù):

緩存預熱

場景:“宕機”

服務器啟動后迅速宕機

問題排查:

1.請求數(shù)量較高,大量的請求過來之后都需要去從緩存中獲取數(shù)據(jù),但是緩存中又沒有,此時從數(shù)據(jù)庫中查找數(shù)據(jù)然后將數(shù)據(jù)再存入緩存,造成了短期內對redis的高強度操作從而導致問題

2.主從之間數(shù)據(jù)吞吐量較大,數(shù)據(jù)同步操作頻度較高

解決方案:

前置準備工作:

1.日常例行統(tǒng)計數(shù)據(jù)訪問記錄,統(tǒng)計訪問頻度較高的熱點數(shù)據(jù)

2.利用LRU數(shù)據(jù)刪除策略,構建數(shù)據(jù)留存隊列例如:storm與kafka配合

準備工作:

1.將統(tǒng)計結果中的數(shù)據(jù)分類,根據(jù)級別,redis優(yōu)先加載級別較高的熱點數(shù)據(jù)

2.利用分布式多服務器同時進行數(shù)據(jù)讀取,提速數(shù)據(jù)加載過程

3.熱點數(shù)據(jù)主從同時預熱

實施:

4.使用腳本程序固定觸發(fā)數(shù)據(jù)預熱過程

5.如果條件允許,使用了CDN(內容分發(fā)網(wǎng)絡),效果會更好

總的來說:緩存預熱就是系統(tǒng)啟動前,提前將相關的緩存數(shù)據(jù)直接加載到緩存系統(tǒng)。避免在用戶請求的時候,先查詢數(shù)據(jù)庫,然后再將數(shù)據(jù)緩存的問題!用戶直接查詢事先被預熱的緩存數(shù)據(jù)!

緩存雪崩

場景:數(shù)據(jù)庫服務器崩潰,一連串的場景會隨之兒來。

1.系統(tǒng)平穩(wěn)運行過程中,忽然數(shù)據(jù)庫連接量激增

2.應用服務器無法及時處理請求

3.大量408,500錯誤頁面出現(xiàn)

4.客戶反復刷新頁面獲取數(shù)據(jù)

5.數(shù)據(jù)庫崩潰

6.應用服務器崩潰

7.重啟應用服務器無效

8.Redis服務器崩潰

9.Redis集群崩潰

10.重啟數(shù)據(jù)庫后再次被瞬間流量放倒

問題排查:

1.在一個較短的時間內,緩存中較多的key集中過期

2.此周期內請求訪問過期的數(shù)據(jù),redis未命中,redis向數(shù)據(jù)庫獲取數(shù)據(jù)

3.數(shù)據(jù)庫同時接收到大量的請求無法及時處理

4.Redis大量請求被積壓,開始出現(xiàn)超時現(xiàn)象

5.數(shù)據(jù)庫流量激增,數(shù)據(jù)庫崩潰

6.重啟后仍然面對緩存中無數(shù)據(jù)可用

7.Redis服務器資源被嚴重占用,Redis服務器崩潰

8.Redis集群呈現(xiàn)崩塌,集群瓦解

9.應用服務器無法及時得到數(shù)據(jù)響應請求,來自客戶端的請求數(shù)量越來越多,應用服務器崩潰

10.應用服務器,redis,數(shù)據(jù)庫全部重啟,效果不理想

總而言之就兩點:短時間范圍內,大量key集中過期

解決方案

思路:

1.更多的頁面靜態(tài)化處理

2.構建多級緩存架構:Nginx緩存+redis緩存+ehcache緩存

3.檢測Mysql嚴重耗時業(yè)務進行優(yōu)化:對數(shù)據(jù)庫的瓶頸排查:例如超時查詢、耗時較高事務等

4.災難預警機制:? 監(jiān)控redis服務器性能指標,CPU占用、CPU使用率,內存容量,查詢平均響應時間和線程數(shù)

5.限流、降級

短時間范圍內犧牲一些客戶體驗,限制一部分請求訪問,降低應用服務器壓力,待業(yè)務低速運轉后再逐步放開訪問

落地實踐:

1.LRU與LFU切換

2.數(shù)據(jù)有效期策略調整?:根據(jù)業(yè)務數(shù)據(jù)有效期進行分類錯峰,A類90分鐘,B類80分鐘,C類70分鐘過期時間使用固定時間+隨機值的形式,稀釋集中到期的key的數(shù)量

3.超熱數(shù)據(jù)使用永久key

4.定期維護(自動+人工):對即將過期數(shù)據(jù)做訪問量分析,確認是否延時,配合訪問量統(tǒng)計,做熱點數(shù)據(jù)的延時

5.加鎖:慎用!

總的來說:緩存雪崩就是瞬間過期數(shù)據(jù)量太大,導致對數(shù)據(jù)庫服務器造成壓力。如能夠有效避免過期時間集中,可以有效解決雪崩現(xiàn)象的 出現(xiàn)(約40%),配合其他策略一起使用,并監(jiān)控服務器的運行數(shù)據(jù),根據(jù)運行記錄做快速調整。

0 分享到:
和我們在線交談!