Now support dynamic per-file checksum2 size.
[rsync/rsync.git] / rsync.h
1 /* 
2    Copyright (C) by Andrew Tridgell 1996, 2000
3    Copyright (C) Paul Mackerras 1996
4    Copyright (C) 2001, 2002 by Martin Pool <mbp@samba.org>
5    
6    This program is free software; you can redistribute it and/or modify
7    it under the terms of the GNU General Public License as published by
8    the Free Software Foundation; either version 2 of the License, or
9    (at your option) any later version.
10    
11    This program is distributed in the hope that it will be useful,
12    but WITHOUT ANY WARRANTY; without even the implied warranty of
13    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14    GNU General Public License for more details.
15    
16    You should have received a copy of the GNU General Public License
17    along with this program; if not, write to the Free Software
18    Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
19 */
20
21
22 #define False 0
23 #define True 1
24
25 #define BLOCK_SIZE 700
26 #define RSYNC_RSH_ENV "RSYNC_RSH"
27
28 #define RSYNC_NAME "rsync"
29 #define RSYNCD_SYSCONF "/etc/rsyncd.conf"
30 #define RSYNCD_USERCONF "rsyncd.conf"
31
32 #define DEFAULT_LOCK_FILE "/var/run/rsyncd.lock"
33 #define URL_PREFIX "rsync://"
34
35 #define BACKUP_SUFFIX "~"
36
37 /* a non-zero CHAR_OFFSET makes the rolling sum stronger, but is
38    incompatible with older versions :-( */
39 #define CHAR_OFFSET 0
40
41
42 #define FLAG_DELETE (1<<0)
43 #define SAME_MODE (1<<1)
44 #define SAME_RDEV (1<<2)
45 #define SAME_UID (1<<3)
46 #define SAME_GID (1<<4)
47 #define SAME_DIR (1<<5)
48 #define SAME_NAME SAME_DIR
49 #define LONG_NAME (1<<6)
50 #define SAME_TIME (1<<7)
51
52 /* update this if you make incompatible changes */
53 #define PROTOCOL_VERSION 27
54
55 /* We refuse to interoperate with versions that are not in this range.
56  * Note that we assume we'll work with later versions: the onus is on
57  * people writing them to make sure that they don't send us anything
58  * we won't understand.
59  *
60  * Interoperation with old but supported protocol versions
61  * should cause a warning to be printed.  At a future date
62  * the old protocol will become the minimum and
63  * compatibility code removed.
64  *
65  * There are two possible explanations for the limit at
66  * MAX_PROTOCOL_VERSION: either to allow new major-rev versions that
67  * do not interoperate with us, and (more likely) so that we can
68  * detect an attempt to connect rsync to a non-rsync server, which is
69  * unlikely to begin by sending a byte between MIN_PROTOCL_VERSION and
70  * MAX_PROTOCOL_VERSION. */
71
72 #define MIN_PROTOCOL_VERSION 17
73 #define OLD_PROTOCOL_VERSION 20
74 #define MAX_PROTOCOL_VERSION 40
75
76 #define RSYNC_PORT 873
77
78 #define SPARSE_WRITE_SIZE (1024)
79 #define WRITE_SIZE (32*1024)
80 #define CHUNK_SIZE (32*1024)
81 #define MAX_MAP_SIZE (256*1024)
82 #define IO_BUFFER_SIZE (4092)
83
84 #define MAX_ARGS 1000
85
86 #define MPLEX_BASE 7
87
88 /* Log values.  I *think* what these mean is: FLOG goes to the server
89  * logfile; FERROR and FINFO try to end up on the client, with
90  * different levels of filtering. */
91 enum logcode {FNONE=0, FERROR=1, FINFO=2, FLOG=3 };
92
93 #include "errcode.h"
94
95 #include "config.h"
96
97 /* The default RSYNC_RSH is always set in config.h, either to "remsh",
98  * "rsh", or otherwise something specified by the user.  HAVE_REMSH
99  * controls parameter munging for HP/UX, etc. */
100
101 #include <sys/types.h>
102
103 #ifdef HAVE_UNISTD_H
104 #include <unistd.h>
105 #endif
106 #include <stdio.h>
107 #include <stddef.h>
108
109 #ifdef HAVE_SYS_PARAM_H
110 #include <sys/param.h>
111 #endif
112
113 #ifdef HAVE_STDLIB_H
114 #include <stdlib.h>
115 #endif
116
117 #ifdef HAVE_SYS_SOCKET_H
118 #include <sys/socket.h>
119 #endif
120
121 #ifdef HAVE_STRING_H
122 #include <string.h>
123 #endif
124
125 #ifdef HAVE_MALLOC_H
126 #include <malloc.h>
127 #endif
128
129 #ifdef TIME_WITH_SYS_TIME
130 #include <sys/time.h>
131 #include <time.h>
132 #else
133 #ifdef HAVE_SYS_TIME_H
134 #include <sys/time.h>
135 #else
136 #include <time.h>
137 #endif
138 #endif
139
140 #ifdef HAVE_FCNTL_H
141 #include <fcntl.h>
142 #else
143 #ifdef HAVE_SYS_FCNTL_H
144 #include <sys/fcntl.h>
145 #endif
146 #endif
147
148 #include <sys/stat.h>
149
150 #ifdef HAVE_SYS_IOCTL_H
151 #include <sys/ioctl.h>
152 #endif
153
154 #ifdef HAVE_SYS_FILIO_H
155 #include <sys/filio.h>
156 #endif
157
158 #include <signal.h>
159 #ifdef HAVE_SYS_WAIT_H
160 #include <sys/wait.h>
161 #endif
162 #ifdef HAVE_CTYPE_H
163 #include <ctype.h>
164 #endif
165 #ifdef HAVE_GRP_H
166 #include <grp.h>
167 #endif
168 #include <errno.h>
169
170 #ifdef HAVE_UTIME_H
171 #include <utime.h>
172 #endif
173
174 #ifdef HAVE_SYS_SELECT_H
175 #include <sys/select.h>
176 #endif
177
178 #ifdef HAVE_SYS_MODE_H
179 /* apparently AIX needs this for S_ISLNK */
180 #ifndef S_ISLNK
181 #include <sys/mode.h>
182 #endif
183 #endif
184
185 #ifdef HAVE_FNMATCH
186 #include <fnmatch.h>
187 #else
188 #include "lib/fnmatch.h"
189 #endif
190
191 #ifdef HAVE_GLOB_H
192 #include <glob.h>
193 #endif
194
195 #ifdef HAVE_MALLOC_H
196 #  include <malloc.h>
197 #endif
198
199 /* these are needed for the uid/gid mapping code */
200 #include <pwd.h>
201 #include <grp.h>
202
203 #include <stdarg.h>
204 #include <netinet/in.h>
205 #include <arpa/inet.h>
206 #include <netdb.h>
207 #include <syslog.h>
208 #include <sys/file.h>
209
210 #if HAVE_DIRENT_H
211 # include <dirent.h>
212 #else
213 # define dirent direct
214 # if HAVE_SYS_NDIR_H
215 #  include <sys/ndir.h>
216 # endif
217 # if HAVE_SYS_DIR_H
218 #  include <sys/dir.h>
219 # endif
220 # if HAVE_NDIR_H
221 #  include <ndir.h>
222 # endif
223 #endif
224
225 #ifdef HAVE_COMPAT_H
226 #include <compat.h>
227 #endif
228
229 #include <assert.h>
230
231
232 #define BOOL int
233
234 #ifndef uchar
235 #define uchar unsigned char
236 #endif
237
238 #if HAVE_UNSIGNED_CHAR
239 #define schar signed char
240 #else
241 #define schar char
242 #endif
243
244 #ifndef int32
245 #if (SIZEOF_INT == 4)
246 #define int32 int
247 #elif (SIZEOF_LONG == 4)
248 #define int32 long
249 #elif (SIZEOF_SHORT == 4)
250 #define int32 short
251 #else
252 /* I hope this works */
253 #define int32 int
254 #define LARGE_INT32
255 #endif
256 #endif
257
258 #ifndef uint32
259 #define uint32 unsigned int32
260 #endif
261
262 #if HAVE_OFF64_T
263 #define OFF_T off64_t
264 #define STRUCT_STAT struct stat64
265 #else
266 #define OFF_T off_t
267 #define STRUCT_STAT struct stat
268 #endif
269
270 #if HAVE_OFF64_T
271 #define int64 off64_t
272 #elif (SIZEOF_LONG == 8) 
273 #define int64 long
274 #elif (SIZEOF_INT == 8) 
275 #define int64 int
276 #elif HAVE_LONGLONG
277 #define int64 long long
278 #else
279 /* As long as it gets... */
280 #define int64 off_t
281 #define NO_INT64
282 #endif
283
284 #if (SIZEOF_LONG == 8) 
285 #define uint64 unsigned long
286 #elif (SIZEOF_INT == 8) 
287 #define uint64 unsigned int
288 #elif HAVE_LONGLONG
289 #define uint64 unsigned long long
290 #else
291 /* As long as it gets... */
292 #define uint64 unsigned off_t
293 #endif
294
295 /* Starting from protocol version 26, we always use 64-bit
296  * ino_t and dev_t internally, even if this platform does not
297  * allow files to have 64-bit inums.  That's because the
298  * receiver needs to find duplicate (dev,ino) tuples to detect
299  * hardlinks, and it might have files coming from a platform
300  * that has 64-bit inums.
301  *
302  * The only exception is if we're on a platform with no 64-bit type at
303  * all.
304  *
305  * Because we use read_longint() to get these off the wire, if you
306  * transfer devices or hardlinks with dev or inum > 2**32 to a machine
307  * with no 64-bit types then you will get an overflow error.  Probably
308  * not many people have that combination of machines, and you can
309  * avoid it by not preserving hardlinks or not transferring device
310  * nodes.  It's not clear that any other behaviour is better.
311  *
312  * Note that if you transfer devices from a 64-bit-devt machine (say,
313  * Solaris) to a 32-bit-devt machine (say, Linux-2.2/x86) then the
314  * device numbers will be truncated.  But it's a kind of silly thing
315  * to do anyhow.
316  *
317  * FIXME: In future, we should probable split the device number into
318  * major/minor, and transfer the two parts as 32-bit ints.  That gives
319  * you somewhat more of a chance that they'll come from a big machine
320  * to a little one in a useful way.
321  *
322  * FIXME: Really we need an unsigned type, and we perhaps ought to
323  * cope with platforms on which this is an unsigned int or even a
324  * struct.  Later.
325  */ 
326 #define INO64_T uint64
327 #define DEV64_T uint64
328
329 #ifndef MIN
330 #define MIN(a,b) ((a)<(b)?(a):(b))
331 #endif
332
333 #ifndef MAX
334 #define MAX(a,b) ((a)>(b)?(a):(b))
335 #endif
336
337 #ifndef MAXHOSTNAMELEN
338 #define MAXHOSTNAMELEN 256
339 #endif
340
341 /* the length of the md4 checksum */
342 #define MD4_SUM_LENGTH 16
343 #define SUM_LENGTH 16
344
345 #ifndef MAXPATHLEN
346 #define MAXPATHLEN 1024
347 #endif
348
349 #ifndef NAME_MAX
350 #define NAME_MAX 255
351 #endif
352
353 #ifndef INADDR_NONE
354 #define INADDR_NONE 0xffffffff
355 #endif
356
357 #ifndef IN_LOOPBACKNET
358 #define IN_LOOPBACKNET 127
359 #endif
360
361 struct file_struct {
362         unsigned flags;
363         time_t modtime;
364         OFF_T length;
365         mode_t mode;
366
367         INO64_T inode;
368         /** Device this file lives upon */
369         DEV64_T dev;
370
371         /** If this is a device node, the device number. */
372         DEV64_T rdev;
373         uid_t uid;
374         gid_t gid;
375         char *basename;
376         char *dirname;
377         char *basedir;
378         char *link;
379         char *sum;
380 };
381
382
383 #define ARENA_SIZE      (32 * 1024)
384
385 struct string_area {
386         char *base;
387         char *end;
388         char *current;
389         struct string_area *next;
390 };
391
392 struct file_list {
393         int count;
394         int malloced;
395         struct file_struct **files;
396         struct string_area *string_area;
397 };
398
399 struct sum_buf {
400         OFF_T offset;           /**< offset in file of this chunk */
401         int len;                /**< length of chunk of file */
402         int i;                  /**< index of this chunk */
403         uint32 sum1;            /**< simple checksum */
404         char sum2[SUM_LENGTH];  /**< checksum  */
405 };
406
407 struct sum_struct {
408         OFF_T flength;          /**< total file length */
409         size_t count;           /**< how many chunks */
410         size_t remainder;       /**< flength % block_length */
411         size_t blength;         /**< block_length */
412         size_t s2length;        /**< sum2_length */
413         struct sum_buf *sums;   /**< points to info for each chunk */
414 };
415
416 struct map_struct {
417         char *p;
418         int fd,p_size,p_len;
419         OFF_T file_size, p_offset, p_fd_offset;
420 };
421
422 struct exclude_struct {
423         char *pattern;
424         int regular_exp;
425         int fnmatch_flags;
426         int include;
427         int directory;
428         int local;
429 };
430
431 struct stats {
432         int64 total_size;
433         int64 total_transferred_size;
434         int64 total_written;
435         int64 total_read;
436         int64 literal_data;
437         int64 matched_data;
438         int flist_size;
439         int num_files;
440         int num_transferred_files;
441 };
442
443
444 /* we need this function because of the silly way in which duplicate
445    entries are handled in the file lists - we can't change this
446    without breaking existing versions */
447 static inline int flist_up(struct file_list *flist, int i)
448 {
449         while (!flist->files[i]->basename) i++;
450         return i;
451 }
452
453 #include "byteorder.h"
454 #include "lib/mdfour.h"
455 #include "lib/permstring.h"
456 #include "lib/addrinfo.h"
457
458 #include "proto.h"
459
460 /* We have replacement versions of these if they're missing. */
461 #ifndef HAVE_ASPRINTF
462 int asprintf(char **ptr, const char *format, ...);
463 #endif
464
465 #ifndef HAVE_VASPRINTF
466 int vasprintf(char **ptr, const char *format, va_list ap);
467 #endif
468
469 #if !defined(HAVE_VSNPRINTF) && !defined(HAVE_C99_VSNPRINTF)
470 int vsnprintf (char *str, size_t count, const char *fmt, va_list args);
471 #endif
472
473 #if !defined(HAVE_SNPRINTF) && !defined(HAVE_C99_VSNPRINTF)
474 int snprintf(char *str,size_t count,const char *fmt,...);
475 #endif
476
477
478 #if !HAVE_STRERROR
479 extern char *sys_errlist[];
480 #define strerror(i) sys_errlist[i]
481 #endif
482
483 #ifndef HAVE_STRCHR
484 # define strchr                 index
485 # define strrchr                rindex
486 #endif
487
488 #ifndef HAVE_ERRNO_DECL
489 extern int errno;
490 #endif
491
492 #define SUPPORT_LINKS HAVE_READLINK
493 #define SUPPORT_HARD_LINKS HAVE_LINK
494
495 /* This could be bad on systems which have no lchown and where chown
496  * follows symbollic links.  On such systems it might be better not to
497  * try to chown symlinks at all. */
498 #ifndef HAVE_LCHOWN
499 #define lchown chown
500 #endif
501
502 #define SIGNAL_CAST (RETSIGTYPE (*)())
503
504 #ifndef EWOULDBLOCK
505 #define EWOULDBLOCK EAGAIN
506 #endif
507
508 #ifndef STDIN_FILENO
509 #define STDIN_FILENO 0
510 #endif
511
512 #ifndef STDOUT_FILENO
513 #define STDOUT_FILENO 1
514 #endif
515
516 #ifndef STDERR_FILENO
517 #define STDERR_FILENO 2
518 #endif
519
520 #ifndef S_IWUSR
521 #define S_IWUSR 0200
522 #endif
523
524 #ifndef ACCESSPERMS
525 #define ACCESSPERMS 0777
526 #endif
527
528 #ifndef S_ISVTX
529 #define S_ISVTX 0
530 #endif
531
532 #define CHMOD_BITS (S_ISUID | S_ISGID | S_ISVTX | ACCESSPERMS)
533
534 #ifndef _S_IFMT
535 #define _S_IFMT        0170000
536 #endif
537
538 #ifndef _S_IFLNK
539 #define _S_IFLNK  0120000
540 #endif
541
542 #ifndef S_ISLNK
543 #define S_ISLNK(mode) (((mode) & (_S_IFMT)) == (_S_IFLNK))
544 #endif
545
546 #ifndef S_ISBLK
547 #define S_ISBLK(mode) (((mode) & (_S_IFMT)) == (_S_IFBLK))
548 #endif
549
550 #ifndef S_ISCHR
551 #define S_ISCHR(mode) (((mode) & (_S_IFMT)) == (_S_IFCHR))
552 #endif
553
554 #ifndef S_ISSOCK
555 #ifdef _S_IFSOCK
556 #define S_ISSOCK(mode) (((mode) & (_S_IFMT)) == (_S_IFSOCK))
557 #else
558 #define S_ISSOCK(mode) (0)
559 #endif
560 #endif
561
562 #ifndef S_ISFIFO
563 #ifdef _S_IFIFO
564 #define S_ISFIFO(mode) (((mode) & (_S_IFMT)) == (_S_IFIFO))
565 #else
566 #define S_ISFIFO(mode) (0)
567 #endif
568 #endif
569
570 #ifndef S_ISDIR
571 #define S_ISDIR(mode) (((mode) & (_S_IFMT)) == (_S_IFDIR))
572 #endif
573
574 #ifndef S_ISREG
575 #define S_ISREG(mode) (((mode) & (_S_IFMT)) == (_S_IFREG))
576 #endif
577
578 /* work out what fcntl flag to use for non-blocking */
579 #ifdef O_NONBLOCK
580 # define NONBLOCK_FLAG O_NONBLOCK
581 #elif defined(SYSV)
582 # define NONBLOCK_FLAG O_NDELAY
583 #else 
584 # define NONBLOCK_FLAG FNDELAY
585 #endif
586
587 #ifndef INADDR_LOOPBACK
588 #define INADDR_LOOPBACK 0x7f000001
589 #endif
590
591 #ifndef INADDR_NONE
592 #define INADDR_NONE 0xffffffff
593 #endif
594
595 #define IS_DEVICE(mode) (S_ISCHR(mode) || S_ISBLK(mode) || S_ISSOCK(mode) || S_ISFIFO(mode))
596
597 /* Initial mask on permissions given to temporary files.  Mask off setuid
598      bits and group access because of potential race-condition security
599      holes, and mask other access because mode 707 is bizarre */
600 #define INITACCESSPERMS 0700
601
602 /* handler for null strings in printf format */
603 #define NS(s) ((s)?(s):"<NULL>")
604
605 #if !defined(__GNUC__) || defined(APPLE)
606 /* Apparently the OS X port of gcc gags on __attribute__.
607  *
608  * <http://www.opensource.apple.com/bugs/X/gcc/2512150.html> */
609 #define __attribute__(x) 
610
611 #endif
612
613
614 /* use magic gcc attributes to catch format errors */
615  void rprintf(enum logcode , const char *, ...)
616      __attribute__((format (printf, 2, 3)))
617 ;
618
619 /* This is just like rprintf, but it also tries to print some
620  * representation of the error code.  Normally errcode = errno. */
621 void rsyserr(enum logcode, int, const char *, ...)
622      __attribute__((format (printf, 3, 4)))
623      ;
624
625 #ifdef REPLACE_INET_NTOA
626 #define inet_ntoa rep_inet_ntoa
627 #endif
628
629 /* Make sure that the O_BINARY flag is defined. */
630 #ifndef O_BINARY
631 #define O_BINARY 0
632 #endif
633
634 #ifndef HAVE_STRLCPY
635 size_t strlcpy(char *d, const char *s, size_t bufsize);
636 #endif
637
638 #ifndef HAVE_STRLCAT
639 size_t strlcat(char *d, const char *s, size_t bufsize);
640 #endif
641
642 #ifndef WEXITSTATUS
643 #define WEXITSTATUS(stat)       ((int)(((stat)>>8)&0xFF))
644 #endif
645
646 #define exit_cleanup(code) _exit_cleanup(code, __FILE__, __LINE__)
647
648
649 extern int verbose;
650
651 #ifndef HAVE_INET_NTOP
652 const char *                 
653 inet_ntop(int af, const void *src, char *dst, size_t size);
654 #endif /* !HAVE_INET_NTOP */
655
656 #ifndef HAVE_INET_PTON
657 int inet_pton(int af, const char *src, void *dst);
658 #endif
659
660 #ifdef MAINTAINER_MODE
661 const char *get_panic_action(void);
662 #endif
663
664 #define UNUSED(x) x __attribute__((__unused__))
665
666 extern const char *io_write_phase, *io_read_phase;