Sao lưu gia tăng (Incremental Backup) với Rsnapshot

0
406
(Last Updated On: Th3 21, 2019)

Chào tất cả các bạn, một ngày mới lại gần trôi qua và thời gian thì chẳng bao giờ chịu dừng lại. Chính vì thế cho nên đối với việc sao lưu dữ liệu (chẳng hạn như một trang web động, số liệu, sổ sách với dữ liệu luôn thay đổi hàng ngày) thì càng trở nên cấp thiết hơn.

Việc sao lưu giữ liệu kiểu gia tăng (Incremental Backup) là giải pháp thiết thực và tiết kiệm không gian lưu trữ đối với những trường hợp mà mình đã đề cập ở trên, đối với dữ liệu thay đổi thường xuyên, mỗi khi có sự cố xảy ra, chúng ta luôn có một bản sao lưu gần nhất để khôi phục dữ liệu.

Trong bài viết ngày hôm nay, mình xin mạn phép giới thiệu các bạn cách sao lưu gia tăng trên máy chủ Ubuntu. Tất nhiên đối với các hệ thống Linux khác cũng có thể áp dụng tương tự.

Và để sử dụng Rsnapshot, giống như tên gọi của nó thì bạn cũng chỉ cần cài đặt Rsnapshot là được:

apt install rsnapshot

Và bây giờ mình sẽ tiến hành tạo thư mục để tạo các bản sao lưu. Thư mục này mình đặt tên là vngeek:

mkdir /vngeek

Tiếp theo đó là chúng ta sẽ cấu hình cho Rsnapshot, và trước khi làm bất cứ điều gì, chúng ta sẽ sao lưu lại tập tin cấu hình để sau này có thể khôi phục lại nếu muốn:

cp /etc/rsnapshot.conf /etc/rsnapshot.conf.backup

Như vậy, mình đã sao lưu tập tin cấu hình tại file: /etc/rsnapshot.conf.backup

sau này nếu có vấn đề gì, thì chỉ cần đổi tên tập tin này thành rsnapshot.conf và đặt nó vào thư mục /etc là được.

Để bắt đầu chỉnh sửa tập tin cấu hình, trước tiên chúng ta có thể nghía qua một chút, có thể dùng lệnh nano để chỉnh sửa:

nano /etc/rsnapshot.conf

Mình xin mạn phép chép hết nội dung của em nó vào bên dưới để các bạn có thể dễ dàng chiêm ngưỡng:

#################################################
# rsnapshot.conf - rsnapshot configuration file #
#################################################
#                                               #
# PLEASE BE AWARE OF THE FOLLOWING RULE:        #
#                                               #
# This file requires tabs between elements      #
#                                               #
#################################################

#######################
# CONFIG FILE VERSION #
#######################

config_version	1.2

###########################
# SNAPSHOT ROOT DIRECTORY #
###########################

# All snapshots will be stored under this root directory.
#
snapshot_root	/var/cache/rsnapshot/

# If no_create_root is enabled, rsnapshot will not automatically create the
# snapshot_root directory. This is particularly useful if you are backing
# up to removable media, such as a FireWire or USB drive.
#
#no_create_root	1

#################################
# EXTERNAL PROGRAM DEPENDENCIES #
#################################

# LINUX USERS:   Be sure to uncomment "cmd_cp". This gives you extra features.
# EVERYONE ELSE: Leave "cmd_cp" commented out for compatibility.
#
# See the README file or the man page for more details.
#
cmd_cp		/bin/cp

# uncomment this to use the rm program instead of the built-in perl routine.
#
cmd_rm		/bin/rm

# rsync must be enabled for anything to work. This is the only command that
# must be enabled.
#
cmd_rsync	/usr/bin/rsync

# Uncomment this to enable remote ssh backups over rsync.
#
#cmd_ssh	/usr/bin/ssh

# Comment this out to disable syslog support.
#
cmd_logger	/usr/bin/logger

# Uncomment this to specify the path to "du" for disk usage checks.
# If you have an older version of "du", you may also want to check the
# "du_args" parameter below.
#
#cmd_du		/usr/bin/du

# Uncomment this to specify the path to rsnapshot-diff.
#
#cmd_rsnapshot_diff	/usr/bin/rsnapshot-diff

# Specify the path to a script (and any optional arguments) to run right
# before rsnapshot syncs files
#
#cmd_preexec	/path/to/preexec/script

# Specify the path to a script (and any optional arguments) to run right
# after rsnapshot syncs files
#
#cmd_postexec	/path/to/postexec/script

# Paths to lvcreate, lvremove, mount and umount commands, for use with
# Linux LVMs.
#
#linux_lvm_cmd_lvcreate	/sbin/lvcreate
#linux_lvm_cmd_lvremove	/sbin/lvremove
#linux_lvm_cmd_mount	/bin/mount
#linux_lvm_cmd_umount	/bin/umount

#########################################
#     BACKUP LEVELS / INTERVALS         #
# Must be unique and in ascending order #
# e.g. alpha, beta, gamma, etc.         #
#########################################

retain	alpha	6
retain	beta	7
retain	gamma	4
#retain	delta	3

############################################
#              GLOBAL OPTIONS              #
# All are optional, with sensible defaults #
############################################

# Verbose level, 1 through 5.
# 1     Quiet           Print fatal errors only
# 2     Default         Print errors and warnings only
# 3     Verbose         Show equivalent shell commands being executed
# 4     Extra Verbose   Show extra verbose information
# 5     Debug mode      Everything
#
verbose		2

# Same as "verbose" above, but controls the amount of data sent to the
# logfile, if one is being used. The default is 3.
# If you want the rsync output, you have to set it to 4
#
loglevel	3

# If you enable this, data will be written to the file you specify. The
# amount of data written is controlled by the "loglevel" parameter.
#
#logfile	/var/log/rsnapshot.log

# If enabled, rsnapshot will write a lockfile to prevent two instances
# from running simultaneously (and messing up the snapshot_root).
# If you enable this, make sure the lockfile directory is not world
# writable. Otherwise anyone can prevent the program from running.
#
lockfile	/var/run/rsnapshot.pid

# By default, rsnapshot check lockfile, check if PID is running
# and if not, consider lockfile as stale, then start
# Enabling this stop rsnapshot if PID in lockfile is not running
#
#stop_on_stale_lockfile		0

# Default rsync args. All rsync commands have at least these options set.
#
#rsync_short_args	-a
#rsync_long_args	--delete --numeric-ids --relative --delete-excluded

# ssh has no args passed by default, but you can specify some here.
#
#ssh_args	-p 22

# Default arguments for the "du" program (for disk space reporting).
# The GNU version of "du" is preferred. See the man page for more details.
# If your version of "du" doesn't support the -h flag, try -k flag instead.
#
#du_args	-csh

# If this is enabled, rsync won't span filesystem partitions within a
# backup point. This essentially passes the -x option to rsync.
# The default is 0 (off).
#
#one_fs		0

# The include and exclude parameters, if enabled, simply get passed directly
# to rsync. If you have multiple include/exclude patterns, put each one on a
# separate line. Please look up the --include and --exclude options in the
# rsync man page for more details on how to specify file name patterns. 
# 
#include	???
#include	???
#exclude	???
#exclude	???

# The include_file and exclude_file parameters, if enabled, simply get
# passed directly to rsync. Please look up the --include-from and
# --exclude-from options in the rsync man page for more details.
#
#include_file	/path/to/include/file
#exclude_file	/path/to/exclude/file

# If your version of rsync supports --link-dest, consider enabling this.
# This is the best way to support special files (FIFOs, etc) cross-platform.
# The default is 0 (off).
#
#link_dest	0

# When sync_first is enabled, it changes the default behaviour of rsnapshot.
# Normally, when rsnapshot is called with its lowest interval
# (i.e.: "rsnapshot alpha"), it will sync files AND rotate the lowest
# intervals. With sync_first enabled, "rsnapshot sync" handles the file sync,
# and all interval calls simply rotate files. See the man page for more
# details. The default is 0 (off).
#
#sync_first	0

# If enabled, rsnapshot will move the oldest directory for each interval
# to [interval_name].delete, then it will remove the lockfile and delete
# that directory just before it exits. The default is 0 (off).
#
#use_lazy_deletes	0

# Number of rsync re-tries. If you experience any network problems or
# network card issues that tend to cause ssh to fail with errors like
# "Corrupted MAC on input", for example, set this to a non-zero value
# to have the rsync operation re-tried.
#
#rsync_numtries 0

# LVM parameters. Used to backup with creating lvm snapshot before backup
# and removing it after. This should ensure consistency of data in some special
# cases
#
# LVM snapshot(s) size (lvcreate --size option).
#
#linux_lvm_snapshotsize	100M

# Name to be used when creating the LVM logical volume snapshot(s).
#
#linux_lvm_snapshotname	rsnapshot

# Path to the LVM Volume Groups.
#
#linux_lvm_vgpath	/dev

# Mount point to use to temporarily mount the snapshot(s).
#
#linux_lvm_mountpath	/path/to/mount/lvm/snapshot/during/backup

###############################
### BACKUP POINTS / SCRIPTS ###
###############################

# LOCALHOST
backup	/home/		localhost/
backup	/etc/		localhost/
backup	/usr/local/	localhost/
#backup	/var/log/rsnapshot		localhost/
#backup	/etc/passwd	localhost/
#backup	/home/foo/My Documents/		localhost/
#backup	/foo/bar/	localhost/	one_fs=1, rsync_short_args=-urltvpog
#backup_script	/usr/local/bin/backup_pgsql.sh	localhost/postgres/
# You must set linux_lvm_* parameters below before using lvm snapshots
#backup	lvm://vg0/xen-home/	lvm-vg0/xen-home/

# EXAMPLE.COM
#backup_exec	/bin/date "+ backup of example.com started at %c"
#backup	root@example.com:/home/	example.com/	+rsync_long_args=--bwlimit=16,exclude=core
#backup	root@example.com:/etc/	example.com/	exclude=mtab,exclude=core
#backup_exec	ssh root@example.com "mysqldump -A > /var/db/dump/mysql.sql"
#backup	root@example.com:/var/db/dump/	example.com/
#backup_exec	/bin/date "+ backup of example.com ended at %c"

# CVS.SOURCEFORGE.NET
#backup_script	/usr/local/bin/backup_rsnapshot_cvsroot.sh	rsnapshot.cvs.sourceforge.net/

# RSYNC.SAMBA.ORG
#backup	rsync://rsync.samba.org/rsyncftp/	rsync.samba.org/rsyncftp/

Rất may mắn đó là tập tin cấu hình có sẵn hướng dẫn cụ thể ở từng mục thiết lập, và sẽ không khó khăn gì khi mà bạn chịu khó đọc qua một chút.

Tuy nhiên chúng ta sẽ chú trọng những thiết lập cơ bản và quan trọng trước, sau này bạn có thể cấu hình nâng cao thêm phù hợp với nhu cầu phát sinh nào đó.

Cần chú ý:

snapshot_root:

Đây là thư mục mà Rsnapshot sẽ tiến hành chứa các bản sao lưu trong tương lai, và như trước đó mình đã tạo một thư mục là /vngeek, cho nên mình sẽ cấu hình dòng này thành:

snapshot_root	/vngeek

Tiếp đến là mục EXTERNAL PROGRAM DEPENDENCIES, ở đây bạn có thể kiểm tra qua một số chương trình như /usr/bin/cp,/usr/bin/rm và đặc biệt đó là /usr/bin/rsync có đúng đường dẫn hay không. Bạn có thể dùng lệnh:

which rsync
which rm

Để biết được đường dẫn chính xác của các chương trình bên trên.

Tiếp tục kéo xuống một chút để cấu hình BACKUP LEVELS / INTERVALS:

Bạn có thể thấy những dòng như retain alpha, beta, gamma,… thì ở đây chúng như những cái tên mà bạn có thể đặt bất kỳ, tương ứng với số lần tạo ảnh chụp sao lưu. Và nó không tượng trưng cho thời gian nhé, chỉ đơn giản là một cái tên nào đó.

Như trong hình bạn có thể thấy đó là cấu hình retain alpha 6, tức là bản sao lưu với tên alpha sẽ tạo 6 bản sao lưu, xoay vòng và sẽ giữ lại những gì mới nhất, bản mới sẽ đè lên bản cũ tương ứng với các tên từ alpha.0 –> alpha.5

Tiếp tục kéo xuống dưới và bạn không cần phải chỉnh sửa quá nhiều vì hầu như các thiết lập đã được cấu hình tự động khi bạn cài đặt Rsnapshot rồi, chính vì thế, chúng ta sẽ quan tâm hơn đến thư mục cần sao lưu ở mục BACKUP POINTS / SCRIPTS:


Như vậy, mình đã thêm thư mục /var/www vào tiến trình sao lưu.

Tất nhiên nó có dạng:

backup	/var/www	localhost/

Tức có nghĩa là sao lưu thư mục /var/www tại máy chủ localhost. Tất nhiên bạn có thể thêm một máy chủ nào đó khác nếu muốn kiểu như:

backup	root@vngeek.com:/var/www/	vngeek.com/

Và dĩ nhiên nếu muốn cấu hình để sao lưu từ xa một thư mục nào đó thì chúng ta cần tạo key SSH để có thể kết nối từ xa:

ssh-keygen -t rsa

Bạn đừng thêm passpharase làm gì nhé vì như thế chúng ta mới có thể kết nối từ xa được, máy tính không tự động gõ pass được đâu.

Trông thế này là hơi ổn ổn rồi đó.

Tất nhiên chúng ta phải sao chép Public Key SSH lên những máy chủ mà chúng ta dự định sao lưu từ xa:

ssh-copy-id -i /root/.ssh/id_rsa.pub root@vngeek.com

Vâng đó mà một chút thông tin thêm về việc sao lưu từ xa một máy chủ nào đó. Chứ làm tới đây là coi như xong 90% công việc rồi đó.

Tiếp theo đây chúng ta sẽ kiểm tra sơ qua việc cấu hình:

rsnapshot configtest

Nếu thấy báo “Syntax OK” tức là mọi thứ đâu vào đấy rồi, và chỉ cần chúng ta tiến hành “đặt lệnh” mà thôi.

Để chạy rsnapshot và tạo một bản sao lưu với cấu hình alpha, chúng ta dùng lệnh:

rsnapshot alpha

Chờ một chút và chúng ta vào kiểm tra xem thư mục /vngeek:

ls /vngeek

Bạn sẽ thấy có thư mục tên là alpha.0

Như vậy là bản sao lưu alpha.0 đã được tạo.

Và tất nhiên để Rsnapshot hoạt động 1 cách tự động thì chỉ cần chúng ta thêm vào Cronjob:

0 1 * * * /usr/bin/rsnapshot alpha

Tức là Rsnapshot sẽ tự động tạo bản sao lưu alpha vào lúc 1 giờ sáng mỗi ngày.

Để khôi phục lại dữ liệu, với một bản sao lưu nào đó bạn có thể dùng lệnh kiểu như:

rsync -avr /vngeek/alpha.0/localhost /var/www

Đối với máy chủ từ xa (Lệnh sau chạy trên máy chủ cài đặt Rsnapshot):

rsync -avr /vngeek/alpha.0/localhost root@vngeek.com:/var/www/

Và đây là kết quả:

Chúc các bạn thành công nhé!

Bình luận