tar命令高級(jí)用法——備份數(shù)據(jù)
Linux上有功能強(qiáng)大的tar命令,tar最初是為了制作磁帶備份(tape archive)而設(shè)計(jì)的,它的作用是把文件和目錄備份到磁帶中,然后從磁帶中提取或恢復(fù)文件?,F(xiàn)在我們可以使用tar來(lái)備份數(shù)據(jù)到任何存儲(chǔ)介質(zhì)上。它是文件級(jí)備份,不必考慮底層文件系統(tǒng)類別,并且支持增量備份。
1. 部分常用選項(xiàng)
-z, --gzip:使用gzip工具(解)壓縮,后綴一般為.gz
-c, --create:tar打包,后綴一般為.tar
-f, --file=:后面立刻接打包或壓縮后得到的文件名
-x, --extract:解包命令,與-c對(duì)應(yīng)
-p:保留備份數(shù)據(jù)的原本權(quán)限和屬性
-g:后接增量備份的快照文件
-C:指定解壓縮的目錄
--exclude:排除不打包的目錄或文件,支持正則匹配
其他
-X, --exclude-from:在一個(gè)文件中列出要排除的目錄或文件(在--exclude=較多時(shí)使用)
-t, --list:列出備份檔案中的文件列表,不與-c、-x同時(shí)出現(xiàn)
-j, --bzip2:使用bzip2工具(解)壓縮,后綴一般為.bz2
-P:保留絕對(duì)路徑,解壓時(shí)同樣會(huì)自動(dòng)解壓到絕對(duì)路徑下
-v:(解)壓縮過(guò)程顯示文件處理過(guò)程,常用但不建議對(duì)大型文件使用
2. 增量備份(網(wǎng)站)數(shù)據(jù)
許多系統(tǒng)(應(yīng)用或網(wǎng)站)每天都有靜態(tài)文件產(chǎn)生,對(duì)于一些比較重要的靜態(tài)文件如果有進(jìn)行定期備份的需求,就可以通過(guò)tar打包壓縮備份到指定的地方,特別是對(duì)一些總文件比較大比較多的情況,還可以利用-g選項(xiàng)來(lái)做增量備份。
備份的目錄最好使用相對(duì)路徑,也就是進(jìn)入到需要備份的根目錄下
具體示例方法如下。
12345
備份當(dāng)前目錄下的所有文件# tar -g /tmp/snapshot_data.snap -zcpf /tmp/data01.tar.gz .在需要恢復(fù)的目錄下解壓恢復(fù)# tar -zxpf /tmp/data01.tar.gz -C .
-g選項(xiàng)可以理解備份時(shí)給目錄文件做一個(gè)快照,記錄權(quán)限和屬性等信息,第一次備份時(shí)/tmp/snapshot_data.snap不存在,會(huì)新建一個(gè)并做完全備份。當(dāng)目錄下的文件有修改后,再次執(zhí)行第一條備份命令(記得修改后面的檔案文件名),會(huì)自動(dòng)根據(jù)-g指定的快照文件,增量備份修改過(guò)的文件,包括權(quán)限和屬性,沒(méi)有動(dòng)過(guò)的文件不會(huì)重復(fù)備份。
另外需要注意上面的恢復(fù),是“保留恢復(fù)”,即存在相同文件名的文件會(huì)被覆蓋,而原目錄下已存在(但備份檔案里沒(méi)有)的,會(huì)依然保留。所以如果你想完全恢復(fù)到與備份文件一模一樣,需要清空原目錄。如果有增量備份檔案,則還需要使用同樣的方式分別解壓這些檔案,而且要注意順序。
下面演示一個(gè)比較綜合的例子,要求:
備份/tmp/data目錄,但cache目錄以及臨時(shí)文件排除在外
由于目錄比較大(>4G),所以全備時(shí)分割備份的檔案(如每個(gè)備份檔案文件最大1G)
保留所有文件的權(quán)限和屬性,如用戶組和讀寫(xiě)權(quán)限
12345678910111213141516171819
# cd /tmp/data做一次完全備份# rm -f /tmp/snapshot_data.snap# tar -g /tmp/snapshot_data.snap -zcpf - --exclude=./cache ./ | split -b 1024M - /tmp/bak_data$(date -I).tar.gz_分割后文件名后會(huì)依次加上aa,ab,ac,...,上面最終的備份歸檔會(huì)保存成bak_data2014-12-07.tar.gz_aabak_data2014-12-07.tar.gz_abbak_data2014-12-07.tar.gz_ac...增量備份可以是與完全備份一模一樣的命令,但需要注意的是假如你一天備份多次,可能導(dǎo)致檔案文件名重復(fù),那么就會(huì)導(dǎo)致備份實(shí)現(xiàn),因?yàn)閟plit依然會(huì)從aa,ab開(kāi)始命名,如果一天的文件產(chǎn)生(修改)量不是特別大,那么建議增量部分不分割處理了:( 一定要分割的話,文件名加入更細(xì)致的時(shí)間如$(date +%Y-%m-%d_%H) )# tar -g /tmp/snapshot_data.snap -zcpf /tmp/bak_data2014-12-07.tar.gz --exclude=./cache ./第二天增備# tar -g /tmp/snapshot_data.snap -zcpf /tmp/bak_data2014-12-08.tar.gz --exclude=./cache ./
恢復(fù)過(guò)程
123456789
恢復(fù)完全備份的檔案文件可以選擇是否先清空/tmp/data/目錄# cat /tmp/bak_data2014-12-07.tar.gz_* | tar -zxpf - -C /tmp/data/恢復(fù)增量備份的檔案文件$ tar –zxpf /tmp/bak_data2014-12-07.tar.gz -C /tmp/data/$ tar –zxpf /tmp/bak_data2014-12-08.tar.gz -C /tmp/data/...一定要保證是按時(shí)間順序恢復(fù)的,像下面文件名規(guī)則也可以使用上面通配符的形式
如果需要定期備份,如每周一次全備,每天一次增量備份,則可以結(jié)合crontab實(shí)現(xiàn)。