]> git.sesse.net Git - backup.sh/blob - backup.sh
ting kjører i parallell
[backup.sh] / backup.sh
1 #!/bin/sh
2
3 # Locking
4 LOCKFILE=/home/backup/backuprun.lockfile
5
6 # Initially, we consider everything to be just fine.
7 R=0
8
9 # Die gracefully (ie. remove lockfile)
10 die() {
11         echo `date`": Something nasty happened, and since I fork a lot:"
12         echo `date`": I CANNOT CLEAN UP THE MESS MYSELF."
13         echo `date`": You need to get rid of lost process named stuff like $0, tar and ssh."
14         exit 255
15 }
16
17 # Trap C-c and kill
18 trap die SIGINT SIGTERM
19
20 # Don't start if we're already running
21 if [ -e $LOCKFILE ]; then
22         echo `date`": $LOCKFILE exists, exiting."
23         exit 1
24 fi;
25 touch $LOCKFILE
26
27 #dirs
28 confdir=/home/backup/conf/           #configuration files
29 storagedir=/backup                   #mountpoint of huge disc
30 ###
31
32 #exclude-pattern
33 exclude=$confdir/exclude
34 [ ! -f $exclude ] && printf "tmp\ncore\n" > $exclude
35 ###
36
37 #syntax of remotestat:
38 #hostname:/directory/
39 remotestatf=$confdir/remotestat
40 [ -f $remotestatf ] && remotestat=`cat $remotestatf`
41 ###
42
43 PATH=/local/bin:$PATH:/store/bin
44 export PATH
45
46 #start the logfile
47 echo `date`": Backup run starting" >&2
48
49 umask 027
50
51 # The computers we want to back up
52 unixcomputers=`cat $confdir/computers.unix \
53   | grep -v "^#" \
54   | grep -v "^$" `
55
56 # Backup only one computer, from command line?
57 if [ $1 ] ; then 
58   unixcomputers=$1
59 fi;
60
61 #disse bør kunne varieres fra fs til fs?
62 maksantallfulle=3          #hvor mange fulle vi tar vare på
63 dagermellomfulle=30        #antall dager før det er på tide med ny full
64 logw=40
65 ###
66
67 #lager datovariabeler
68 DATE=`date "+%Y%m%d%H%M"`            #format: touch
69 DATEs=`date "+%Y-%m-%d %H:%M"`       #format: tar
70 ###
71
72 #selve backupen
73 # krever at noen variabler er satt
74 # krever at vi er i rett katalog
75 backup()
76 {
77
78  echo -n `date` >&2
79  printf " $computer: %-${logw}s %s\n" "$computer:$filesystem" "$backuplevel backup" >&2
80
81  if [ "$backuplevel" = "daglig" ] || [ "$backuplevel" = "incremental" ]
82  then
83   lastd=`cat ../.date`
84   lastcmd="--newer='$lastd'"
85  else
86   lastcmd=""
87  fi
88
89  #if this client has a special tar
90  #we need to find a better solution to this conf-issue
91  if [ -f $confdir/tar.$computer ] ; then
92    tar=`cat $confdir/tar.$computer`
93  else 
94    tar=tar
95  fi
96
97  #expand the exclude-path for use with tar
98  exf=`ssh $computer "ls ~/.backup/exclude"`
99
100  #We try to run tar on the remote computer
101  #    z gzip it
102  #    c create archive
103  #    C change to directory first
104  #    - output to stdout (we pipe to gzip, then to dd)
105  #    . where to start taring (see C)
106  #    $lastcmd only files newer than this
107  #    --exclude-from file to get exclusion pattern from
108  #    pipe to gzip, which in turn pipes over the ssh-stream
109  #    ..to dd, to output to a file. We surpress messages from dd.
110  #    And at last, redirect stderr to stdout, to get output logged.
111  TARFILE=$DATE.tmp
112  TARCMD="ssh $computer \"$tar --one-file-system -zcf - -C $filesystem . $lastcmd \
113         --exclude-from=$exf\" > $TARFILE"
114  echo `date`" $computer: Running $TARCMD" >&2
115
116  if eval $TARCMD; then
117   mv $TARFILE $DATE.tgz
118   #make a filelist.
119   #update the datefile if the filelist is ok.
120   tar tvfz $DATE.tgz > $DATE.idx 2>&1 &&
121     echo $DATEs > ../.date            &&
122     touch -t $DATE ../.date
123
124   #make a sortet filelist
125   grep -v ^d $DATE.idx | sort -n -r +2 > $DATE.sdx
126
127   #fix perm
128   chmod 600 *tgz                      #only for us
129   chmod 644 *sdx *idx 2>/dev/null     #everyone can read
130
131  else
132   #it did not work
133   rm $TARFILE
134   echo `date`" $computer: $TARFILE empty. $backuplevel backup of $computer:$filesystem failed and deleted"
135
136   # We don't want to return 0
137   R=1
138  fi
139
140 }
141
142 #Løper gjennom listen av unixmaskiner som vi skal ta backup av
143 for computer in $unixcomputers
144 do
145
146  echo `date`" $computer: Backing up $computer" >&2
147
148  # Try to SSH to the computer without entering a password.
149  if ! `ssh -n -o NumberOfPasswordPrompts=0 $computer /bin/true`; then
150   echo `date`" $computer: Could not use passwordless SSH."
151
152   # We don't want to return 0
153   R=1
154   break;
155  fi
156  
157  #tømmer variabelen for sikkerhets skyld
158  filesystems=""
159
160  #Sjekker nest siste felt i fstab. Om det er 0 tar vi ikke backup
161  filesystems=`ssh -n $computer "cat /etc/fstab" \
162   | grep -v nfs \
163   | grep -v "^#" \
164   | grep -v "^$" \
165   | awk '{ if ( $(NF-1) != "0" ) print $2}' `
166
167  #clean up our dir at this client
168  if ! ssh $computer "rm -r ~/.backup ; mkdir -m 700 ~/.backup"; then
169   echo `date`" $computer: Could not create backup staging area at $computer:~/.backup"
170   # We don't want to return 0
171   R=1
172   break;
173  fi
174
175  #try to copy $exclude to $computer
176  if ! scp $exclude $computer:~/.backup/exclude > /dev/null; then
177   echo `date`" $computer: Could not copy exclude.txt to $computer"
178   # We don't want to return 0
179   R=1
180   break;
181  fi
182
183  #try to copy preeexec and postexec if they exist
184 # TODO: Gah, clean this mess!
185  [ -f $confdir/preexec.$computer ] && (
186     scp $confdir/preexec.$computer  $computer:~/.backup/preexec ||
187      ( echo `date`" $computer: Could not copy preexec.$computer to $computer:~/.backup/preexec";
188        R=1
189        break
190      )
191     )
192  [ -f $confdir/postexec.$computer ] && (
193     scp $confdir/postexec.$computer $computer:~/.backup/postexec ||
194      ( echo `date`" $computer: Could not copy postexec.$computer to $computer:~/.backup/postexec"
195        break
196        R=1
197      )
198     )
199
200  #try to run preexec if it exist
201  ssh $computer "[ -f ~/.backup/preexec ] && /bin/bash -x ~/.backup/preexec"
202
203  for filesystem in $filesystems
204  do
205   #lager en variant uten tegnet "/" eller $ (gjelder NT)
206   sfilesystem=`echo $filesystem | tr '\/\$' '__'`
207
208   #lager det som trengs av kataloger
209   mkdir -m 755 -p $storagedir/$computer/$sfilesystem/{full,daglig} 2>/dev/null
210
211   echo $filesystem > ${storagedir}/${computer}/.${sfilesystem}.name 
212   chmod 644 ${storagedir}/${computer}/.${sfilesystem}.name
213
214   #set default backuplevel
215   backuplevel=daglig
216
217   if [ ! -f $storagedir/$computer/$sfilesystem/.date ]
218   then
219    #take the first full backup of this filesystem on this computer
220    backuplevel=full
221    echo $DATEs > $storagedir/$computer/$sfilesystem/.date
222   fi
223
224   #sjekker om det er på tide med en full
225   if [ -z "`find $storagedir/$computer/$sfilesystem/full/ -name \*tgz -mtime -$dagermellomfulle`" ]; then
226    backuplevel=full
227   fi
228  
229   #gå ned i rett katalog, eller dø 
230   # TODO bør sende mail om dette skjer!
231   cd $storagedir/$computer/$sfilesystem/$backuplevel || die
232
233   #perform the actual backup
234   backup
235
236   # Sjekk om det skal være et annet antall fulle backuper av en boks
237   if [ -f $confdir/maksfulle.$computer ] ; then
238     mf=$((`cat $confdir/maksfulle.$computer`+1))
239   else
240     mf=$(($maksantallfulle+1))
241   fi
242
243   #delete complete backups
244   for full in `ls -1t $storagedir/$computer/$sfilesystem/full/*tgz | tail +$mf`
245   do
246    prefix=`echo $full | sed "s/\.[^.]*$//"`
247    echo `date`": $computer:$filesystem sletter full $prefix (for mange)" >&2
248    rm $prefix*
249   done
250
251   #delete incremental backups older than the oldest complete backup
252   oldf=`ls -t1 $storagedir/$computer/$sfilesystem/full/*tgz | tail -1`
253   find \
254      $storagedir/$computer/$sfilesystem/daglig \
255      -type f \
256      \! -newer $oldf \
257      -exec rm {} \;
258  done
259
260  #try to run postexec if it exist
261  ssh $computer "[ -f ~/.backup/postexec ] && /bin/bash -x ~/.backup/postexec"
262
263 )  
264 done &
265
266 wait
267
268 # Remove lockfile
269 rm $LOCKFILE
270
271 # Did anything go wrong?
272 if [ $R != 0 ]; then
273         echo `date`": Backup run ended with errors, check logs."
274         exit 1
275 else
276         echo `date`": Backup run ended" >&2
277 fi