當前位置:首頁 > 公眾號精選 > 架構(gòu)師社區(qū)
[導(dǎo)讀]最近有個上位機獲取下位機上報數(shù)據(jù)的項目,由于上報頻率比較頻繁且數(shù)據(jù)量大,導(dǎo)致數(shù)據(jù)增長過快,磁盤占用多。為了節(jié)約成本,定期進行數(shù)據(jù)備份,并通過delete刪除表記錄。明明已經(jīng)執(zhí)行了delete,可表文件的大小卻沒減小,令人費解項目中使用Mysql作為數(shù)據(jù)庫,對于表來說,一般為表結(jié)構(gòu)...

為什么delete表數(shù)據(jù),磁盤空間卻還是被占用


最近有個上位機獲取下位機上報數(shù)據(jù)的項目,由于上報頻率比較頻繁且數(shù)據(jù)量大,導(dǎo)致數(shù)據(jù)增長過快,磁盤占用多。

為了節(jié)約成本,定期進行數(shù)據(jù)備份,并通過delete刪除表記錄。

明明已經(jīng)執(zhí)行了delete,可表文件的大小卻沒減小,令人費解

項目中使用Mysql作為數(shù)據(jù)庫,對于表來說,一般為表結(jié)構(gòu)和表數(shù)據(jù)。表結(jié)構(gòu)占用空間都是比較小的,一般都是表數(shù)據(jù)占用的空間。

當我們使用 delete刪除數(shù)據(jù)時,確實刪除了表中的數(shù)據(jù)記錄,但查看表文件大小卻沒什么變化。

Mysql數(shù)據(jù)結(jié)構(gòu)

凡是使用過mysql,對B 樹肯定是有所耳聞的,MySQL InnoDB 中采用了 B 樹作為存儲數(shù)據(jù)的結(jié)構(gòu),也就是常說的索引組織表,并且數(shù)據(jù)時按照頁來存儲的。因此在刪除數(shù)據(jù)時,會有兩種情況:

  • 刪除數(shù)據(jù)頁中的某些記錄
  • 刪除整個數(shù)據(jù)頁的內(nèi)容

表文件大小未更改和mysql設(shè)計有關(guān)

比如想要刪除 R4 這條記錄:

為什么delete表數(shù)據(jù),磁盤空間卻還是被占用
InnoDB 直接將 R4 這條記錄標記為刪除,稱為可復(fù)用的位置。如果之后要插入 ID 在 300 到 700 間的記錄時,就會復(fù)用該位置。由此可見,磁盤文件的大小并不會減少。

通用刪除整頁數(shù)據(jù)也將記錄標記刪除,數(shù)據(jù)就復(fù)用用該位置,與刪除默寫記錄不同的是,刪除整頁記錄,當后來插入的數(shù)據(jù)不在原來的范圍時,都可以復(fù)用位置,而如果只是刪除默寫記錄,是需要插入數(shù)據(jù)符合刪除記錄位置的時候才能復(fù)用。

因此,無論是數(shù)據(jù)行的刪除還是數(shù)據(jù)頁的刪除,都是將其標記為刪除的狀態(tài),用于復(fù)用,所以文件并不會減小。

那怎么才能讓表大小變小

DELETE只是將數(shù)據(jù)標識位刪除,并沒有整理數(shù)據(jù)文件,當插入新數(shù)據(jù)后,會再次使用這些被置為刪除標識的記錄空間,可以使用OPTIMIZE TABLE來回收未使用的空間,并整理數(shù)據(jù)文件的碎片。

OPTIMIZE?TABLE?表名;
注意:OPTIMIZE TABLE只對MyISAM, BDB和InnoDB表起作用。

另外,也可以執(zhí)行通過ALTER TABLE重建表

ALTER?TABLE?表名?ENGINE=INNODB
有人會問OPTIMIZE TABLE和ALTER TABLE有什么區(qū)別?

alter table t engine = InnoDB(也就是recreate),而optimize table t 等于recreate analyze

Online DDL

最后,再說一下Online DDL,dba的日常工作肯定有一項是ddl變更,ddl變更會鎖表,這個可以說是dba心中永遠的痛,特別是執(zhí)行ddl變更,導(dǎo)致庫上大量線程處于“Waiting for meta data lock”狀態(tài)的時候。因此在 5.6 版本后引入了 Online DDL。

Online DDL推出以前,執(zhí)行ddl主要有兩種方式copy方式和inplace方式,inplace方式又稱為(fast index creation)。相對于copy方式,inplace方式不拷貝數(shù)據(jù),因此較快。但是這種方式僅支持添加、刪除索引兩種方式,而且與copy方式一樣需要全程鎖表,實用性不是很強。Online方式與前兩種方式相比,不僅可以讀,還可以支持寫操作。

執(zhí)行online DDL語句的時候,使用ALGORITHM和LOCK關(guān)鍵字,這兩個關(guān)鍵字在我們的DDL語句的最后面,用逗號隔開即可。示例如下:

ALTER TABLE tbl_name ADD COLUMN col_name col_type, ALGORITHM=INPLACE, LOCK=NONE;

ALGORITHM選項

  • INPLACE:替換:直接在原表上面執(zhí)行DDL的操作。
  • COPY:復(fù)制:使用一種臨時表的方式,克隆出一個臨時表,在臨時表上執(zhí)行DDL,然后再把數(shù)據(jù)導(dǎo)入到臨時表中,在重命名等。這期間需要多出一倍的磁盤空間來支撐這樣的 操作。執(zhí)行期間,表不允許DML的操作。
  • DEFAULT:默認方式,有MySQL自己選擇,優(yōu)先使用INPLACE的方式。
LOCK選項

  • SHARE:共享鎖,執(zhí)行DDL的表可以讀,但是不可以寫。
  • NONE:沒有任何限制,執(zhí)行DDL的表可讀可寫。
  • EXCLUSIVE:排它鎖,執(zhí)行DDL的表不可以讀,也不可以寫。
  • DEFAULT:默認值,也就是在DDL語句中不指定LOCK子句的時候使用的默認值。如果指定LOCK的值為DEFAULT,那就是交給MySQL子句去覺得鎖還是不鎖表。不建議使用,如果你確定你的DDL語句不會鎖表,你可以不指定lock或者指定它的值為default,否則建議指定它的鎖類型。
執(zhí)行DDL操作時,ALGORITHM選項可以不指定,這時候MySQL按照INSTANT、INPLACE、COPY的順序自動選擇合適的模式。也可以指定ALGORITHM=DEFAULT,也是同樣的效果。如果指定了ALGORITHM選項,但不支持的話,會直接報錯。

OPTIMIZE TABLE 和 ALTER TABLE 表名 ENGINE=INNODB都支持Oline DDL,但依舊建議在業(yè)務(wù)訪問量低的時候使用

總結(jié)

delete 刪除數(shù)據(jù)時,其實對應(yīng)的數(shù)據(jù)行并不是真正的刪除,僅僅是將其標記成可復(fù)用的狀態(tài),所以表空間不會變小。

可以重建表的方式,快速將delete數(shù)據(jù)后的表變?。∣PTIMIZE TABLE 或ALTER TABLE),在 5.6 版本后,創(chuàng)建表已經(jīng)支持 Online 的操作,但最好是在業(yè)務(wù)低峰時使用


本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
關(guān)閉
關(guān)閉