]> git.sesse.net Git - ffmpeg/blob - libavformat/http.c
a8a76882dd5aa3db18acd249aa252aa522fdf8cc
[ffmpeg] / libavformat / http.c
1 /*
2  * HTTP protocol for avconv client
3  * Copyright (c) 2000, 2001 Fabrice Bellard
4  *
5  * This file is part of Libav.
6  *
7  * Libav is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * Libav is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with Libav; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include "libavutil/avstring.h"
23 #include "avformat.h"
24 #include <unistd.h>
25 #include "internal.h"
26 #include "network.h"
27 #include "http.h"
28 #include "os_support.h"
29 #include "httpauth.h"
30 #include "url.h"
31 #include "libavutil/opt.h"
32
33 /* XXX: POST protocol is not completely implemented because avconv uses
34    only a subset of it. */
35
36 /* used for protocol handling */
37 #define BUFFER_SIZE 1024
38 #define MAX_REDIRECTS 8
39
40 typedef struct {
41     const AVClass *class;
42     URLContext *hd;
43     unsigned char buffer[BUFFER_SIZE], *buf_ptr, *buf_end;
44     int line_count;
45     int http_code;
46     int64_t chunksize;      /**< Used if "Transfer-Encoding: chunked" otherwise -1. */
47     int64_t off, filesize;
48     char location[MAX_URL_SIZE];
49     HTTPAuthState auth_state;
50     HTTPAuthState proxy_auth_state;
51     char *headers;
52     int willclose;          /**< Set if the server correctly handles Connection: close and will close the connection after feeding us the content. */
53     int chunked_post;
54 } HTTPContext;
55
56 #define OFFSET(x) offsetof(HTTPContext, x)
57 #define D AV_OPT_FLAG_DECODING_PARAM
58 #define E AV_OPT_FLAG_ENCODING_PARAM
59 static const AVOption options[] = {
60 {"chunked_post", "use chunked transfer-encoding for posts", OFFSET(chunked_post), AV_OPT_TYPE_INT, {.dbl = 1}, 0, 1, E },
61 {"headers", "custom HTTP headers, can override built in default headers", OFFSET(headers), AV_OPT_TYPE_STRING, { 0 }, 0, 0, D|E },
62 {NULL}
63 };
64 #define HTTP_CLASS(flavor)\
65 static const AVClass flavor ## _context_class = {\
66     .class_name     = #flavor,\
67     .item_name      = av_default_item_name,\
68     .option         = options,\
69     .version        = LIBAVUTIL_VERSION_INT,\
70 };
71
72 HTTP_CLASS(http);
73 HTTP_CLASS(https);
74
75 static int http_connect(URLContext *h, const char *path, const char *local_path,
76                         const char *hoststr, const char *auth,
77                         const char *proxyauth, int *new_location);
78
79 void ff_http_init_auth_state(URLContext *dest, const URLContext *src)
80 {
81     memcpy(&((HTTPContext*)dest->priv_data)->auth_state,
82            &((HTTPContext*)src->priv_data)->auth_state, sizeof(HTTPAuthState));
83     memcpy(&((HTTPContext*)dest->priv_data)->proxy_auth_state,
84            &((HTTPContext*)src->priv_data)->proxy_auth_state,
85            sizeof(HTTPAuthState));
86 }
87
88 /* return non zero if error */
89 static int http_open_cnx(URLContext *h)
90 {
91     const char *path, *proxy_path, *lower_proto = "tcp", *local_path;
92     char hostname[1024], hoststr[1024], proto[10];
93     char auth[1024], proxyauth[1024];
94     char path1[1024];
95     char buf[1024], urlbuf[1024];
96     int port, use_proxy, err, location_changed = 0, redirects = 0;
97     HTTPAuthType cur_auth_type, cur_proxy_auth_type;
98     HTTPContext *s = h->priv_data;
99     URLContext *hd = NULL;
100
101     proxy_path = getenv("http_proxy");
102     use_proxy = (proxy_path != NULL) && !getenv("no_proxy") &&
103         av_strstart(proxy_path, "http://", NULL);
104
105     /* fill the dest addr */
106  redo:
107     /* needed in any case to build the host string */
108     av_url_split(proto, sizeof(proto), auth, sizeof(auth),
109                  hostname, sizeof(hostname), &port,
110                  path1, sizeof(path1), s->location);
111     ff_url_join(hoststr, sizeof(hoststr), NULL, NULL, hostname, port, NULL);
112
113     if (path1[0] == '\0')
114         path = "/";
115     else
116         path = path1;
117     local_path = path;
118     if (use_proxy) {
119         /* Reassemble the request URL without auth string - we don't
120          * want to leak the auth to the proxy. */
121         ff_url_join(urlbuf, sizeof(urlbuf), proto, NULL, hostname, port, "%s",
122                     path1);
123         path = urlbuf;
124         av_url_split(NULL, 0, proxyauth, sizeof(proxyauth),
125                      hostname, sizeof(hostname), &port, NULL, 0, proxy_path);
126     }
127     if (!strcmp(proto, "https")) {
128         lower_proto = "tls";
129         if (port < 0)
130             port = 443;
131     }
132     if (port < 0)
133         port = 80;
134
135     ff_url_join(buf, sizeof(buf), lower_proto, NULL, hostname, port, NULL);
136     err = ffurl_open(&hd, buf, AVIO_FLAG_READ_WRITE);
137     if (err < 0)
138         goto fail;
139
140     s->hd = hd;
141     cur_auth_type = s->auth_state.auth_type;
142     cur_proxy_auth_type = s->auth_state.auth_type;
143     if (http_connect(h, path, local_path, hoststr, auth, proxyauth, &location_changed) < 0)
144         goto fail;
145     if (s->http_code == 401) {
146         if (cur_auth_type == HTTP_AUTH_NONE && s->auth_state.auth_type != HTTP_AUTH_NONE) {
147             ffurl_close(hd);
148             goto redo;
149         } else
150             goto fail;
151     }
152     if (s->http_code == 407) {
153         if (cur_proxy_auth_type == HTTP_AUTH_NONE &&
154             s->proxy_auth_state.auth_type != HTTP_AUTH_NONE) {
155             ffurl_close(hd);
156             goto redo;
157         } else
158             goto fail;
159     }
160     if ((s->http_code == 301 || s->http_code == 302 || s->http_code == 303 || s->http_code == 307)
161         && location_changed == 1) {
162         /* url moved, get next */
163         ffurl_close(hd);
164         if (redirects++ >= MAX_REDIRECTS)
165             return AVERROR(EIO);
166         location_changed = 0;
167         goto redo;
168     }
169     return 0;
170  fail:
171     if (hd)
172         ffurl_close(hd);
173     s->hd = NULL;
174     return AVERROR(EIO);
175 }
176
177 static int http_open(URLContext *h, const char *uri, int flags)
178 {
179     HTTPContext *s = h->priv_data;
180
181     h->is_streamed = 1;
182
183     s->filesize = -1;
184     av_strlcpy(s->location, uri, sizeof(s->location));
185
186     if (s->headers) {
187         int len = strlen(s->headers);
188         if (len < 2 || strcmp("\r\n", s->headers + len - 2))
189             av_log(h, AV_LOG_WARNING, "No trailing CRLF found in HTTP header.\n");
190     }
191
192     return http_open_cnx(h);
193 }
194 static int http_getc(HTTPContext *s)
195 {
196     int len;
197     if (s->buf_ptr >= s->buf_end) {
198         len = ffurl_read(s->hd, s->buffer, BUFFER_SIZE);
199         if (len < 0) {
200             return AVERROR(EIO);
201         } else if (len == 0) {
202             return -1;
203         } else {
204             s->buf_ptr = s->buffer;
205             s->buf_end = s->buffer + len;
206         }
207     }
208     return *s->buf_ptr++;
209 }
210
211 static int http_get_line(HTTPContext *s, char *line, int line_size)
212 {
213     int ch;
214     char *q;
215
216     q = line;
217     for(;;) {
218         ch = http_getc(s);
219         if (ch < 0)
220             return AVERROR(EIO);
221         if (ch == '\n') {
222             /* process line */
223             if (q > line && q[-1] == '\r')
224                 q--;
225             *q = '\0';
226
227             return 0;
228         } else {
229             if ((q - line) < line_size - 1)
230                 *q++ = ch;
231         }
232     }
233 }
234
235 static int process_line(URLContext *h, char *line, int line_count,
236                         int *new_location)
237 {
238     HTTPContext *s = h->priv_data;
239     char *tag, *p, *end;
240
241     /* end of header */
242     if (line[0] == '\0')
243         return 0;
244
245     p = line;
246     if (line_count == 0) {
247         while (!isspace(*p) && *p != '\0')
248             p++;
249         while (isspace(*p))
250             p++;
251         s->http_code = strtol(p, &end, 10);
252
253         av_dlog(NULL, "http_code=%d\n", s->http_code);
254
255         /* error codes are 4xx and 5xx, but regard 401 as a success, so we
256          * don't abort until all headers have been parsed. */
257         if (s->http_code >= 400 && s->http_code < 600 && (s->http_code != 401
258             || s->auth_state.auth_type != HTTP_AUTH_NONE) &&
259             (s->http_code != 407 || s->proxy_auth_state.auth_type != HTTP_AUTH_NONE)) {
260             end += strspn(end, SPACE_CHARS);
261             av_log(h, AV_LOG_WARNING, "HTTP error %d %s\n",
262                    s->http_code, end);
263             return -1;
264         }
265     } else {
266         while (*p != '\0' && *p != ':')
267             p++;
268         if (*p != ':')
269             return 1;
270
271         *p = '\0';
272         tag = line;
273         p++;
274         while (isspace(*p))
275             p++;
276         if (!av_strcasecmp(tag, "Location")) {
277             strcpy(s->location, p);
278             *new_location = 1;
279         } else if (!av_strcasecmp (tag, "Content-Length") && s->filesize == -1) {
280             s->filesize = atoll(p);
281         } else if (!av_strcasecmp (tag, "Content-Range")) {
282             /* "bytes $from-$to/$document_size" */
283             const char *slash;
284             if (!strncmp (p, "bytes ", 6)) {
285                 p += 6;
286                 s->off = atoll(p);
287                 if ((slash = strchr(p, '/')) && strlen(slash) > 0)
288                     s->filesize = atoll(slash+1);
289             }
290             h->is_streamed = 0; /* we _can_ in fact seek */
291         } else if (!av_strcasecmp(tag, "Accept-Ranges") && !strncmp(p, "bytes", 5)) {
292             h->is_streamed = 0;
293         } else if (!av_strcasecmp (tag, "Transfer-Encoding") && !av_strncasecmp(p, "chunked", 7)) {
294             s->filesize = -1;
295             s->chunksize = 0;
296         } else if (!av_strcasecmp (tag, "WWW-Authenticate")) {
297             ff_http_auth_handle_header(&s->auth_state, tag, p);
298         } else if (!av_strcasecmp (tag, "Authentication-Info")) {
299             ff_http_auth_handle_header(&s->auth_state, tag, p);
300         } else if (!av_strcasecmp (tag, "Proxy-Authenticate")) {
301             ff_http_auth_handle_header(&s->proxy_auth_state, tag, p);
302         } else if (!av_strcasecmp (tag, "Connection")) {
303             if (!strcmp(p, "close"))
304                 s->willclose = 1;
305         }
306     }
307     return 1;
308 }
309
310 static inline int has_header(const char *str, const char *header)
311 {
312     /* header + 2 to skip over CRLF prefix. (make sure you have one!) */
313     if (!str)
314         return 0;
315     return av_stristart(str, header + 2, NULL) || av_stristr(str, header);
316 }
317
318 static int http_connect(URLContext *h, const char *path, const char *local_path,
319                         const char *hoststr, const char *auth,
320                         const char *proxyauth, int *new_location)
321 {
322     HTTPContext *s = h->priv_data;
323     int post, err;
324     char line[1024];
325     char headers[1024] = "";
326     char *authstr = NULL, *proxyauthstr = NULL;
327     int64_t off = s->off;
328     int len = 0;
329     const char *method;
330
331
332     /* send http header */
333     post = h->flags & AVIO_FLAG_WRITE;
334     method = post ? "POST" : "GET";
335     authstr = ff_http_auth_create_response(&s->auth_state, auth, local_path,
336                                            method);
337     proxyauthstr = ff_http_auth_create_response(&s->proxy_auth_state, proxyauth,
338                                                 local_path, method);
339
340     /* set default headers if needed */
341     if (!has_header(s->headers, "\r\nUser-Agent: "))
342        len += av_strlcatf(headers + len, sizeof(headers) - len,
343                           "User-Agent: %s\r\n", LIBAVFORMAT_IDENT);
344     if (!has_header(s->headers, "\r\nAccept: "))
345         len += av_strlcpy(headers + len, "Accept: */*\r\n",
346                           sizeof(headers) - len);
347     if (!has_header(s->headers, "\r\nRange: ") && !post)
348         len += av_strlcatf(headers + len, sizeof(headers) - len,
349                            "Range: bytes=%"PRId64"-\r\n", s->off);
350     if (!has_header(s->headers, "\r\nConnection: "))
351         len += av_strlcpy(headers + len, "Connection: close\r\n",
352                           sizeof(headers)-len);
353     if (!has_header(s->headers, "\r\nHost: "))
354         len += av_strlcatf(headers + len, sizeof(headers) - len,
355                            "Host: %s\r\n", hoststr);
356
357     /* now add in custom headers */
358     if (s->headers)
359         av_strlcpy(headers + len, s->headers, sizeof(headers) - len);
360
361     snprintf(s->buffer, sizeof(s->buffer),
362              "%s %s HTTP/1.1\r\n"
363              "%s"
364              "%s"
365              "%s"
366              "%s%s"
367              "\r\n",
368              method,
369              path,
370              post && s->chunked_post ? "Transfer-Encoding: chunked\r\n" : "",
371              headers,
372              authstr ? authstr : "",
373              proxyauthstr ? "Proxy-" : "", proxyauthstr ? proxyauthstr : "");
374
375     av_freep(&authstr);
376     av_freep(&proxyauthstr);
377     if (ffurl_write(s->hd, s->buffer, strlen(s->buffer)) < 0)
378         return AVERROR(EIO);
379
380     /* init input buffer */
381     s->buf_ptr = s->buffer;
382     s->buf_end = s->buffer;
383     s->line_count = 0;
384     s->off = 0;
385     s->filesize = -1;
386     s->willclose = 0;
387     if (post) {
388         /* Pretend that it did work. We didn't read any header yet, since
389          * we've still to send the POST data, but the code calling this
390          * function will check http_code after we return. */
391         s->http_code = 200;
392         return 0;
393     }
394     s->chunksize = -1;
395
396     /* wait for header */
397     for(;;) {
398         if (http_get_line(s, line, sizeof(line)) < 0)
399             return AVERROR(EIO);
400
401         av_dlog(NULL, "header='%s'\n", line);
402
403         err = process_line(h, line, s->line_count, new_location);
404         if (err < 0)
405             return err;
406         if (err == 0)
407             break;
408         s->line_count++;
409     }
410
411     return (off == s->off) ? 0 : -1;
412 }
413
414
415 static int http_read(URLContext *h, uint8_t *buf, int size)
416 {
417     HTTPContext *s = h->priv_data;
418     int len;
419
420     if (s->chunksize >= 0) {
421         if (!s->chunksize) {
422             char line[32];
423
424             for(;;) {
425                 do {
426                     if (http_get_line(s, line, sizeof(line)) < 0)
427                         return AVERROR(EIO);
428                 } while (!*line);    /* skip CR LF from last chunk */
429
430                 s->chunksize = strtoll(line, NULL, 16);
431
432                 av_dlog(NULL, "Chunked encoding data size: %"PRId64"'\n", s->chunksize);
433
434                 if (!s->chunksize)
435                     return 0;
436                 break;
437             }
438         }
439         size = FFMIN(size, s->chunksize);
440     }
441     /* read bytes from input buffer first */
442     len = s->buf_end - s->buf_ptr;
443     if (len > 0) {
444         if (len > size)
445             len = size;
446         memcpy(buf, s->buf_ptr, len);
447         s->buf_ptr += len;
448     } else {
449         if (!s->willclose && s->filesize >= 0 && s->off >= s->filesize)
450             return AVERROR_EOF;
451         len = ffurl_read(s->hd, buf, size);
452     }
453     if (len > 0) {
454         s->off += len;
455         if (s->chunksize > 0)
456             s->chunksize -= len;
457     }
458     return len;
459 }
460
461 /* used only when posting data */
462 static int http_write(URLContext *h, const uint8_t *buf, int size)
463 {
464     char temp[11] = "";  /* 32-bit hex + CRLF + nul */
465     int ret;
466     char crlf[] = "\r\n";
467     HTTPContext *s = h->priv_data;
468
469     if (!s->chunked_post) {
470         /* non-chunked data is sent without any special encoding */
471         return ffurl_write(s->hd, buf, size);
472     }
473
474     /* silently ignore zero-size data since chunk encoding that would
475      * signal EOF */
476     if (size > 0) {
477         /* upload data using chunked encoding */
478         snprintf(temp, sizeof(temp), "%x\r\n", size);
479
480         if ((ret = ffurl_write(s->hd, temp, strlen(temp))) < 0 ||
481             (ret = ffurl_write(s->hd, buf, size)) < 0 ||
482             (ret = ffurl_write(s->hd, crlf, sizeof(crlf) - 1)) < 0)
483             return ret;
484     }
485     return size;
486 }
487
488 static int http_close(URLContext *h)
489 {
490     int ret = 0;
491     char footer[] = "0\r\n\r\n";
492     HTTPContext *s = h->priv_data;
493
494     /* signal end of chunked encoding if used */
495     if ((h->flags & AVIO_FLAG_WRITE) && s->chunked_post) {
496         ret = ffurl_write(s->hd, footer, sizeof(footer) - 1);
497         ret = ret > 0 ? 0 : ret;
498     }
499
500     if (s->hd)
501         ffurl_close(s->hd);
502     return ret;
503 }
504
505 static int64_t http_seek(URLContext *h, int64_t off, int whence)
506 {
507     HTTPContext *s = h->priv_data;
508     URLContext *old_hd = s->hd;
509     int64_t old_off = s->off;
510     uint8_t old_buf[BUFFER_SIZE];
511     int old_buf_size;
512
513     if (whence == AVSEEK_SIZE)
514         return s->filesize;
515     else if ((s->filesize == -1 && whence == SEEK_END) || h->is_streamed)
516         return -1;
517
518     /* we save the old context in case the seek fails */
519     old_buf_size = s->buf_end - s->buf_ptr;
520     memcpy(old_buf, s->buf_ptr, old_buf_size);
521     s->hd = NULL;
522     if (whence == SEEK_CUR)
523         off += s->off;
524     else if (whence == SEEK_END)
525         off += s->filesize;
526     s->off = off;
527
528     /* if it fails, continue on old connection */
529     if (http_open_cnx(h) < 0) {
530         memcpy(s->buffer, old_buf, old_buf_size);
531         s->buf_ptr = s->buffer;
532         s->buf_end = s->buffer + old_buf_size;
533         s->hd = old_hd;
534         s->off = old_off;
535         return -1;
536     }
537     ffurl_close(old_hd);
538     return off;
539 }
540
541 static int
542 http_get_file_handle(URLContext *h)
543 {
544     HTTPContext *s = h->priv_data;
545     return ffurl_get_file_handle(s->hd);
546 }
547
548 #if CONFIG_HTTP_PROTOCOL
549 URLProtocol ff_http_protocol = {
550     .name                = "http",
551     .url_open            = http_open,
552     .url_read            = http_read,
553     .url_write           = http_write,
554     .url_seek            = http_seek,
555     .url_close           = http_close,
556     .url_get_file_handle = http_get_file_handle,
557     .priv_data_size      = sizeof(HTTPContext),
558     .priv_data_class     = &http_context_class,
559 };
560 #endif
561 #if CONFIG_HTTPS_PROTOCOL
562 URLProtocol ff_https_protocol = {
563     .name                = "https",
564     .url_open            = http_open,
565     .url_read            = http_read,
566     .url_write           = http_write,
567     .url_seek            = http_seek,
568     .url_close           = http_close,
569     .url_get_file_handle = http_get_file_handle,
570     .priv_data_size      = sizeof(HTTPContext),
571     .priv_data_class     = &https_context_class,
572 };
573 #endif