]> git.sesse.net Git - ffmpeg/blob - libavformat/mov.c
vf_sab: Fix memleak
[ffmpeg] / libavformat / mov.c
1 /*
2  * MOV demuxer
3  * Copyright (c) 2001 Fabrice Bellard
4  * Copyright (c) 2009 Baptiste Coudurier <baptiste dot coudurier at gmail dot com>
5  *
6  * first version by Francois Revol <revol@free.fr>
7  * seek function by Gael Chardon <gael.dev@4now.net>
8  *
9  * This file is part of FFmpeg.
10  *
11  * FFmpeg is free software; you can redistribute it and/or
12  * modify it under the terms of the GNU Lesser General Public
13  * License as published by the Free Software Foundation; either
14  * version 2.1 of the License, or (at your option) any later version.
15  *
16  * FFmpeg is distributed in the hope that it will be useful,
17  * but WITHOUT ANY WARRANTY; without even the implied warranty of
18  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
19  * Lesser General Public License for more details.
20  *
21  * You should have received a copy of the GNU Lesser General Public
22  * License along with FFmpeg; if not, write to the Free Software
23  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
24  */
25
26 #include <limits.h>
27
28 //#define MOV_EXPORT_ALL_METADATA
29
30 #include "libavutil/attributes.h"
31 #include "libavutil/channel_layout.h"
32 #include "libavutil/intreadwrite.h"
33 #include "libavutil/intfloat.h"
34 #include "libavutil/mathematics.h"
35 #include "libavutil/avstring.h"
36 #include "libavutil/dict.h"
37 #include "libavutil/opt.h"
38 #include "libavutil/timecode.h"
39 #include "libavcodec/ac3tab.h"
40 #include "avformat.h"
41 #include "internal.h"
42 #include "avio_internal.h"
43 #include "riff.h"
44 #include "isom.h"
45 #include "libavcodec/get_bits.h"
46 #include "id3v1.h"
47 #include "mov_chan.h"
48
49 #if CONFIG_ZLIB
50 #include <zlib.h>
51 #endif
52
53 #include "qtpalette.h"
54
55
56 #undef NDEBUG
57 #include <assert.h>
58
59 /* those functions parse an atom */
60 /* links atom IDs to parse functions */
61 typedef struct MOVParseTableEntry {
62     uint32_t type;
63     int (*parse)(MOVContext *ctx, AVIOContext *pb, MOVAtom atom);
64 } MOVParseTableEntry;
65
66 static int mov_read_default(MOVContext *c, AVIOContext *pb, MOVAtom atom);
67
68 static int mov_metadata_track_or_disc_number(MOVContext *c, AVIOContext *pb,
69                                              unsigned len, const char *key)
70 {
71     char buf[16];
72
73     short current, total = 0;
74     avio_rb16(pb); // unknown
75     current = avio_rb16(pb);
76     if (len >= 6)
77         total = avio_rb16(pb);
78     if (!total)
79         snprintf(buf, sizeof(buf), "%d", current);
80     else
81         snprintf(buf, sizeof(buf), "%d/%d", current, total);
82     av_dict_set(&c->fc->metadata, key, buf, 0);
83
84     return 0;
85 }
86
87 static int mov_metadata_int8_bypass_padding(MOVContext *c, AVIOContext *pb,
88                                             unsigned len, const char *key)
89 {
90     char buf[16];
91
92     /* bypass padding bytes */
93     avio_r8(pb);
94     avio_r8(pb);
95     avio_r8(pb);
96
97     snprintf(buf, sizeof(buf), "%d", avio_r8(pb));
98     av_dict_set(&c->fc->metadata, key, buf, 0);
99
100     return 0;
101 }
102
103 static int mov_metadata_int8_no_padding(MOVContext *c, AVIOContext *pb,
104                                         unsigned len, const char *key)
105 {
106     char buf[16];
107
108     snprintf(buf, sizeof(buf), "%d", avio_r8(pb));
109     av_dict_set(&c->fc->metadata, key, buf, 0);
110
111     return 0;
112 }
113
114 static int mov_metadata_gnre(MOVContext *c, AVIOContext *pb,
115                              unsigned len, const char *key)
116 {
117     short genre;
118     char buf[20];
119
120     avio_r8(pb); // unknown
121
122     genre = avio_r8(pb);
123     if (genre < 1 || genre > ID3v1_GENRE_MAX)
124         return 0;
125     snprintf(buf, sizeof(buf), "%s", ff_id3v1_genre_str[genre-1]);
126     av_dict_set(&c->fc->metadata, key, buf, 0);
127
128     return 0;
129 }
130
131 static int mov_read_custom_metadata(MOVContext *c, AVIOContext *pb, MOVAtom atom)
132 {
133     char key[1024]={0}, data[1024]={0};
134     int i;
135     AVStream *st;
136     MOVStreamContext *sc;
137
138     if (c->fc->nb_streams < 1)
139         return 0;
140     st = c->fc->streams[c->fc->nb_streams-1];
141     sc = st->priv_data;
142
143     if (atom.size <= 8) return 0;
144
145     for (i = 0; i < 3; i++) { // Parse up to three sub-atoms looking for name and data.
146         int data_size = avio_rb32(pb);
147         int tag = avio_rl32(pb);
148         int str_size = 0, skip_size = 0;
149         char *target = NULL;
150
151         switch (tag) {
152         case MKTAG('n','a','m','e'):
153             avio_rb32(pb); // version/flags
154             str_size = skip_size = data_size - 12;
155             atom.size -= 12;
156             target = key;
157             break;
158         case MKTAG('d','a','t','a'):
159             avio_rb32(pb); // version/flags
160             avio_rb32(pb); // reserved (zero)
161             str_size = skip_size = data_size - 16;
162             atom.size -= 16;
163             target = data;
164             break;
165         default:
166             skip_size = data_size - 8;
167             str_size = 0;
168             break;
169         }
170
171         if (target) {
172             str_size = FFMIN3(sizeof(data)-1, str_size, atom.size);
173             avio_read(pb, target, str_size);
174             target[str_size] = 0;
175         }
176         atom.size -= skip_size;
177
178         // If we didn't read the full data chunk for the sub-atom, skip to the end of it.
179         if (skip_size > str_size) avio_skip(pb, skip_size - str_size);
180     }
181
182     if (*key && *data) {
183         if (strcmp(key, "iTunSMPB") == 0) {
184             int priming, remainder, samples;
185             if(sscanf(data, "%*X %X %X %X", &priming, &remainder, &samples) == 3){
186                 if(priming>0 && priming<16384)
187                     sc->start_pad = priming;
188                 return 1;
189             }
190         }
191         if (strcmp(key, "cdec") == 0) {
192 //             av_dict_set(&st->metadata, key, data, 0);
193             return 1;
194         }
195     }
196     return 0;
197 }
198
199 static const uint32_t mac_to_unicode[128] = {
200     0x00C4,0x00C5,0x00C7,0x00C9,0x00D1,0x00D6,0x00DC,0x00E1,
201     0x00E0,0x00E2,0x00E4,0x00E3,0x00E5,0x00E7,0x00E9,0x00E8,
202     0x00EA,0x00EB,0x00ED,0x00EC,0x00EE,0x00EF,0x00F1,0x00F3,
203     0x00F2,0x00F4,0x00F6,0x00F5,0x00FA,0x00F9,0x00FB,0x00FC,
204     0x2020,0x00B0,0x00A2,0x00A3,0x00A7,0x2022,0x00B6,0x00DF,
205     0x00AE,0x00A9,0x2122,0x00B4,0x00A8,0x2260,0x00C6,0x00D8,
206     0x221E,0x00B1,0x2264,0x2265,0x00A5,0x00B5,0x2202,0x2211,
207     0x220F,0x03C0,0x222B,0x00AA,0x00BA,0x03A9,0x00E6,0x00F8,
208     0x00BF,0x00A1,0x00AC,0x221A,0x0192,0x2248,0x2206,0x00AB,
209     0x00BB,0x2026,0x00A0,0x00C0,0x00C3,0x00D5,0x0152,0x0153,
210     0x2013,0x2014,0x201C,0x201D,0x2018,0x2019,0x00F7,0x25CA,
211     0x00FF,0x0178,0x2044,0x20AC,0x2039,0x203A,0xFB01,0xFB02,
212     0x2021,0x00B7,0x201A,0x201E,0x2030,0x00C2,0x00CA,0x00C1,
213     0x00CB,0x00C8,0x00CD,0x00CE,0x00CF,0x00CC,0x00D3,0x00D4,
214     0xF8FF,0x00D2,0x00DA,0x00DB,0x00D9,0x0131,0x02C6,0x02DC,
215     0x00AF,0x02D8,0x02D9,0x02DA,0x00B8,0x02DD,0x02DB,0x02C7,
216 };
217
218 static int mov_read_mac_string(MOVContext *c, AVIOContext *pb, int len,
219                                char *dst, int dstlen)
220 {
221     char *p = dst;
222     char *end = dst+dstlen-1;
223     int i;
224
225     for (i = 0; i < len; i++) {
226         uint8_t t, c = avio_r8(pb);
227         if (c < 0x80 && p < end)
228             *p++ = c;
229         else if (p < end)
230             PUT_UTF8(mac_to_unicode[c-0x80], t, if (p < end) *p++ = t;);
231     }
232     *p = 0;
233     return p - dst;
234 }
235
236 static int mov_read_covr(MOVContext *c, AVIOContext *pb, int type, int len)
237 {
238     AVPacket pkt;
239     AVStream *st;
240     MOVStreamContext *sc;
241     enum AVCodecID id;
242     int ret;
243
244     switch (type) {
245     case 0xd:  id = AV_CODEC_ID_MJPEG; break;
246     case 0xe:  id = AV_CODEC_ID_PNG;   break;
247     case 0x1b: id = AV_CODEC_ID_BMP;   break;
248     default:
249         av_log(c->fc, AV_LOG_WARNING, "Unknown cover type: 0x%x.\n", type);
250         avio_skip(pb, len);
251         return 0;
252     }
253
254     st = avformat_new_stream(c->fc, NULL);
255     if (!st)
256         return AVERROR(ENOMEM);
257     sc = av_mallocz(sizeof(*sc));
258     if (!sc)
259         return AVERROR(ENOMEM);
260     st->priv_data = sc;
261
262     ret = av_get_packet(pb, &pkt, len);
263     if (ret < 0)
264         return ret;
265
266     st->disposition              |= AV_DISPOSITION_ATTACHED_PIC;
267
268     st->attached_pic              = pkt;
269     st->attached_pic.stream_index = st->index;
270     st->attached_pic.flags       |= AV_PKT_FLAG_KEY;
271
272     st->codec->codec_type = AVMEDIA_TYPE_VIDEO;
273     st->codec->codec_id   = id;
274
275     return 0;
276 }
277
278 static int mov_metadata_raw(MOVContext *c, AVIOContext *pb,
279                             unsigned len, const char *key)
280 {
281     char *value = av_malloc(len + 1);
282     if (!value)
283         return AVERROR(ENOMEM);
284     avio_read(pb, value, len);
285     value[len] = 0;
286     return av_dict_set(&c->fc->metadata, key, value, AV_DICT_DONT_STRDUP_VAL);
287 }
288
289 static int mov_read_udta_string(MOVContext *c, AVIOContext *pb, MOVAtom atom)
290 {
291 #ifdef MOV_EXPORT_ALL_METADATA
292     char tmp_key[5];
293 #endif
294     char str[1024], key2[16], language[4] = {0};
295     const char *key = NULL;
296     uint16_t langcode = 0;
297     uint32_t data_type = 0, str_size;
298     int (*parse)(MOVContext*, AVIOContext*, unsigned, const char*) = NULL;
299
300     if (c->itunes_metadata && atom.type == MKTAG('-','-','-','-'))
301         return mov_read_custom_metadata(c, pb, atom);
302
303     switch (atom.type) {
304     case MKTAG(0xa9,'n','a','m'): key = "title";     break;
305     case MKTAG(0xa9,'a','u','t'):
306     case MKTAG(0xa9,'A','R','T'): key = "artist";    break;
307     case MKTAG( 'a','A','R','T'): key = "album_artist";    break;
308     case MKTAG(0xa9,'w','r','t'): key = "composer";  break;
309     case MKTAG( 'c','p','r','t'):
310     case MKTAG(0xa9,'c','p','y'): key = "copyright"; break;
311     case MKTAG(0xa9,'g','r','p'): key = "grouping"; break;
312     case MKTAG(0xa9,'l','y','r'): key = "lyrics"; break;
313     case MKTAG(0xa9,'c','m','t'):
314     case MKTAG(0xa9,'i','n','f'): key = "comment";   break;
315     case MKTAG(0xa9,'a','l','b'): key = "album";     break;
316     case MKTAG(0xa9,'d','a','y'): key = "date";      break;
317     case MKTAG(0xa9,'g','e','n'): key = "genre";     break;
318     case MKTAG( 'g','n','r','e'): key = "genre";
319         parse = mov_metadata_gnre; break;
320     case MKTAG(0xa9,'t','o','o'):
321     case MKTAG(0xa9,'s','w','r'): key = "encoder";   break;
322     case MKTAG(0xa9,'e','n','c'): key = "encoder";   break;
323     case MKTAG(0xa9,'m','a','k'): key = "make";      break;
324     case MKTAG(0xa9,'m','o','d'): key = "model";     break;
325     case MKTAG(0xa9,'x','y','z'): key = "location";  break;
326     case MKTAG( 'd','e','s','c'): key = "description";break;
327     case MKTAG( 'l','d','e','s'): key = "synopsis";  break;
328     case MKTAG( 't','v','s','h'): key = "show";      break;
329     case MKTAG( 't','v','e','n'): key = "episode_id";break;
330     case MKTAG( 't','v','n','n'): key = "network";   break;
331     case MKTAG( 't','r','k','n'): key = "track";
332         parse = mov_metadata_track_or_disc_number; break;
333     case MKTAG( 'd','i','s','k'): key = "disc";
334         parse = mov_metadata_track_or_disc_number; break;
335     case MKTAG( 't','v','e','s'): key = "episode_sort";
336         parse = mov_metadata_int8_bypass_padding; break;
337     case MKTAG( 't','v','s','n'): key = "season_number";
338         parse = mov_metadata_int8_bypass_padding; break;
339     case MKTAG( 's','t','i','k'): key = "media_type";
340         parse = mov_metadata_int8_no_padding; break;
341     case MKTAG( 'h','d','v','d'): key = "hd_video";
342         parse = mov_metadata_int8_no_padding; break;
343     case MKTAG( 'p','g','a','p'): key = "gapless_playback";
344         parse = mov_metadata_int8_no_padding; break;
345     case MKTAG( '@','P','R','M'):
346         return mov_metadata_raw(c, pb, atom.size, "premiere_version");
347     case MKTAG( '@','P','R','Q'):
348         return mov_metadata_raw(c, pb, atom.size, "quicktime_version");
349     }
350
351     if (c->itunes_metadata && atom.size > 8) {
352         int data_size = avio_rb32(pb);
353         int tag = avio_rl32(pb);
354         if (tag == MKTAG('d','a','t','a')) {
355             data_type = avio_rb32(pb); // type
356             avio_rb32(pb); // unknown
357             str_size = data_size - 16;
358             atom.size -= 16;
359
360             if (atom.type == MKTAG('c', 'o', 'v', 'r')) {
361                 int ret = mov_read_covr(c, pb, data_type, str_size);
362                 if (ret < 0) {
363                     av_log(c->fc, AV_LOG_ERROR, "Error parsing cover art.\n");
364                     return ret;
365                 }
366             }
367         } else return 0;
368     } else if (atom.size > 4 && key && !c->itunes_metadata) {
369         str_size = avio_rb16(pb); // string length
370         langcode = avio_rb16(pb);
371         ff_mov_lang_to_iso639(langcode, language);
372         atom.size -= 4;
373     } else
374         str_size = atom.size;
375
376 #ifdef MOV_EXPORT_ALL_METADATA
377     if (!key) {
378         snprintf(tmp_key, 5, "%.4s", (char*)&atom.type);
379         key = tmp_key;
380     }
381 #endif
382
383     if (!key)
384         return 0;
385     if (atom.size < 0)
386         return AVERROR_INVALIDDATA;
387
388     str_size = FFMIN3(sizeof(str)-1, str_size, atom.size);
389
390     if (parse)
391         parse(c, pb, str_size, key);
392     else {
393         if (data_type == 3 || (data_type == 0 && (langcode < 0x400 || langcode == 0x7fff))) { // MAC Encoded
394             mov_read_mac_string(c, pb, str_size, str, sizeof(str));
395         } else {
396             avio_read(pb, str, str_size);
397             str[str_size] = 0;
398         }
399         av_dict_set(&c->fc->metadata, key, str, 0);
400         if (*language && strcmp(language, "und")) {
401             snprintf(key2, sizeof(key2), "%s-%s", key, language);
402             av_dict_set(&c->fc->metadata, key2, str, 0);
403         }
404     }
405     av_dlog(c->fc, "lang \"%3s\" ", language);
406     av_dlog(c->fc, "tag \"%s\" value \"%s\" atom \"%.4s\" %d %"PRId64"\n",
407             key, str, (char*)&atom.type, str_size, atom.size);
408
409     return 0;
410 }
411
412 static int mov_read_chpl(MOVContext *c, AVIOContext *pb, MOVAtom atom)
413 {
414     int64_t start;
415     int i, nb_chapters, str_len, version;
416     char str[256+1];
417
418     if ((atom.size -= 5) < 0)
419         return 0;
420
421     version = avio_r8(pb);
422     avio_rb24(pb);
423     if (version)
424         avio_rb32(pb); // ???
425     nb_chapters = avio_r8(pb);
426
427     for (i = 0; i < nb_chapters; i++) {
428         if (atom.size < 9)
429             return 0;
430
431         start = avio_rb64(pb);
432         str_len = avio_r8(pb);
433
434         if ((atom.size -= 9+str_len) < 0)
435             return 0;
436
437         avio_read(pb, str, str_len);
438         str[str_len] = 0;
439         avpriv_new_chapter(c->fc, i, (AVRational){1,10000000}, start, AV_NOPTS_VALUE, str);
440     }
441     return 0;
442 }
443
444 #define MIN_DATA_ENTRY_BOX_SIZE 12
445 static int mov_read_dref(MOVContext *c, AVIOContext *pb, MOVAtom atom)
446 {
447     AVStream *st;
448     MOVStreamContext *sc;
449     int entries, i, j;
450
451     if (c->fc->nb_streams < 1)
452         return 0;
453     st = c->fc->streams[c->fc->nb_streams-1];
454     sc = st->priv_data;
455
456     avio_rb32(pb); // version + flags
457     entries = avio_rb32(pb);
458     if (entries >  (atom.size - 1) / MIN_DATA_ENTRY_BOX_SIZE + 1 ||
459         entries >= UINT_MAX / sizeof(*sc->drefs))
460         return AVERROR_INVALIDDATA;
461     av_free(sc->drefs);
462     sc->drefs_count = 0;
463     sc->drefs = av_mallocz(entries * sizeof(*sc->drefs));
464     if (!sc->drefs)
465         return AVERROR(ENOMEM);
466     sc->drefs_count = entries;
467
468     for (i = 0; i < sc->drefs_count; i++) {
469         MOVDref *dref = &sc->drefs[i];
470         uint32_t size = avio_rb32(pb);
471         int64_t next = avio_tell(pb) + size - 4;
472
473         if (size < 12)
474             return AVERROR_INVALIDDATA;
475
476         dref->type = avio_rl32(pb);
477         avio_rb32(pb); // version + flags
478         av_dlog(c->fc, "type %.4s size %d\n", (char*)&dref->type, size);
479
480         if (dref->type == MKTAG('a','l','i','s') && size > 150) {
481             /* macintosh alias record */
482             uint16_t volume_len, len;
483             int16_t type;
484
485             avio_skip(pb, 10);
486
487             volume_len = avio_r8(pb);
488             volume_len = FFMIN(volume_len, 27);
489             avio_read(pb, dref->volume, 27);
490             dref->volume[volume_len] = 0;
491             av_log(c->fc, AV_LOG_DEBUG, "volume %s, len %d\n", dref->volume, volume_len);
492
493             avio_skip(pb, 12);
494
495             len = avio_r8(pb);
496             len = FFMIN(len, 63);
497             avio_read(pb, dref->filename, 63);
498             dref->filename[len] = 0;
499             av_log(c->fc, AV_LOG_DEBUG, "filename %s, len %d\n", dref->filename, len);
500
501             avio_skip(pb, 16);
502
503             /* read next level up_from_alias/down_to_target */
504             dref->nlvl_from = avio_rb16(pb);
505             dref->nlvl_to   = avio_rb16(pb);
506             av_log(c->fc, AV_LOG_DEBUG, "nlvl from %d, nlvl to %d\n",
507                    dref->nlvl_from, dref->nlvl_to);
508
509             avio_skip(pb, 16);
510
511             for (type = 0; type != -1 && avio_tell(pb) < next; ) {
512                 if(url_feof(pb))
513                     return AVERROR_EOF;
514                 type = avio_rb16(pb);
515                 len = avio_rb16(pb);
516                 av_log(c->fc, AV_LOG_DEBUG, "type %d, len %d\n", type, len);
517                 if (len&1)
518                     len += 1;
519                 if (type == 2) { // absolute path
520                     av_free(dref->path);
521                     dref->path = av_mallocz(len+1);
522                     if (!dref->path)
523                         return AVERROR(ENOMEM);
524                     avio_read(pb, dref->path, len);
525                     if (len > volume_len && !strncmp(dref->path, dref->volume, volume_len)) {
526                         len -= volume_len;
527                         memmove(dref->path, dref->path+volume_len, len);
528                         dref->path[len] = 0;
529                     }
530                     for (j = 0; j < len; j++)
531                         if (dref->path[j] == ':')
532                             dref->path[j] = '/';
533                     av_log(c->fc, AV_LOG_DEBUG, "path %s\n", dref->path);
534                 } else if (type == 0) { // directory name
535                     av_free(dref->dir);
536                     dref->dir = av_malloc(len+1);
537                     if (!dref->dir)
538                         return AVERROR(ENOMEM);
539                     avio_read(pb, dref->dir, len);
540                     dref->dir[len] = 0;
541                     for (j = 0; j < len; j++)
542                         if (dref->dir[j] == ':')
543                             dref->dir[j] = '/';
544                     av_log(c->fc, AV_LOG_DEBUG, "dir %s\n", dref->dir);
545                 } else
546                     avio_skip(pb, len);
547             }
548         }
549         avio_seek(pb, next, SEEK_SET);
550     }
551     return 0;
552 }
553
554 static int mov_read_hdlr(MOVContext *c, AVIOContext *pb, MOVAtom atom)
555 {
556     AVStream *st;
557     uint32_t type;
558     uint32_t av_unused ctype;
559     int title_size;
560     char *title_str;
561
562     if (c->fc->nb_streams < 1) // meta before first trak
563         return 0;
564
565     st = c->fc->streams[c->fc->nb_streams-1];
566
567     avio_r8(pb); /* version */
568     avio_rb24(pb); /* flags */
569
570     /* component type */
571     ctype = avio_rl32(pb);
572     type = avio_rl32(pb); /* component subtype */
573
574     av_dlog(c->fc, "ctype= %.4s (0x%08x)\n", (char*)&ctype, ctype);
575     av_dlog(c->fc, "stype= %.4s\n", (char*)&type);
576
577     if     (type == MKTAG('v','i','d','e'))
578         st->codec->codec_type = AVMEDIA_TYPE_VIDEO;
579     else if (type == MKTAG('s','o','u','n'))
580         st->codec->codec_type = AVMEDIA_TYPE_AUDIO;
581     else if (type == MKTAG('m','1','a',' '))
582         st->codec->codec_id = AV_CODEC_ID_MP2;
583     else if ((type == MKTAG('s','u','b','p')) || (type == MKTAG('c','l','c','p')))
584         st->codec->codec_type = AVMEDIA_TYPE_SUBTITLE;
585
586     avio_rb32(pb); /* component  manufacture */
587     avio_rb32(pb); /* component flags */
588     avio_rb32(pb); /* component flags mask */
589
590     title_size = atom.size - 24;
591     if (title_size > 0) {
592         title_str = av_malloc(title_size + 1); /* Add null terminator */
593         if (!title_str)
594             return AVERROR(ENOMEM);
595         avio_read(pb, title_str, title_size);
596         title_str[title_size] = 0;
597         if (title_str[0])
598             av_dict_set(&st->metadata, "handler_name", title_str +
599                         (!c->isom && title_str[0] == title_size - 1), 0);
600         av_freep(&title_str);
601     }
602
603     return 0;
604 }
605
606 int ff_mov_read_esds(AVFormatContext *fc, AVIOContext *pb, MOVAtom atom)
607 {
608     AVStream *st;
609     int tag;
610
611     if (fc->nb_streams < 1)
612         return 0;
613     st = fc->streams[fc->nb_streams-1];
614
615     avio_rb32(pb); /* version + flags */
616     ff_mp4_read_descr(fc, pb, &tag);
617     if (tag == MP4ESDescrTag) {
618         ff_mp4_parse_es_descr(pb, NULL);
619     } else
620         avio_rb16(pb); /* ID */
621
622     ff_mp4_read_descr(fc, pb, &tag);
623     if (tag == MP4DecConfigDescrTag)
624         ff_mp4_read_dec_config_descr(fc, st, pb);
625     return 0;
626 }
627
628 static int mov_read_esds(MOVContext *c, AVIOContext *pb, MOVAtom atom)
629 {
630     return ff_mov_read_esds(c->fc, pb, atom);
631 }
632
633 static int mov_read_dac3(MOVContext *c, AVIOContext *pb, MOVAtom atom)
634 {
635     AVStream *st;
636     int ac3info, acmod, lfeon, bsmod;
637
638     if (c->fc->nb_streams < 1)
639         return 0;
640     st = c->fc->streams[c->fc->nb_streams-1];
641
642     ac3info = avio_rb24(pb);
643     bsmod = (ac3info >> 14) & 0x7;
644     acmod = (ac3info >> 11) & 0x7;
645     lfeon = (ac3info >> 10) & 0x1;
646     st->codec->channels = ((int[]){2,1,2,3,3,4,4,5})[acmod] + lfeon;
647     st->codec->channel_layout = avpriv_ac3_channel_layout_tab[acmod];
648     if (lfeon)
649         st->codec->channel_layout |= AV_CH_LOW_FREQUENCY;
650     st->codec->audio_service_type = bsmod;
651     if (st->codec->channels > 1 && bsmod == 0x7)
652         st->codec->audio_service_type = AV_AUDIO_SERVICE_TYPE_KARAOKE;
653
654     return 0;
655 }
656
657 static int mov_read_dec3(MOVContext *c, AVIOContext *pb, MOVAtom atom)
658 {
659     AVStream *st;
660     int eac3info, acmod, lfeon, bsmod;
661
662     if (c->fc->nb_streams < 1)
663         return 0;
664     st = c->fc->streams[c->fc->nb_streams-1];
665
666     /* No need to parse fields for additional independent substreams and its
667      * associated dependent substreams since libavcodec's E-AC-3 decoder
668      * does not support them yet. */
669     avio_rb16(pb); /* data_rate and num_ind_sub */
670     eac3info = avio_rb24(pb);
671     bsmod = (eac3info >> 12) & 0x1f;
672     acmod = (eac3info >>  9) & 0x7;
673     lfeon = (eac3info >>  8) & 0x1;
674     st->codec->channel_layout = avpriv_ac3_channel_layout_tab[acmod];
675     if (lfeon)
676         st->codec->channel_layout |= AV_CH_LOW_FREQUENCY;
677     st->codec->channels = av_get_channel_layout_nb_channels(st->codec->channel_layout);
678     st->codec->audio_service_type = bsmod;
679     if (st->codec->channels > 1 && bsmod == 0x7)
680         st->codec->audio_service_type = AV_AUDIO_SERVICE_TYPE_KARAOKE;
681
682     return 0;
683 }
684
685 static int mov_read_chan(MOVContext *c, AVIOContext *pb, MOVAtom atom)
686 {
687     AVStream *st;
688
689     if (c->fc->nb_streams < 1)
690         return 0;
691     st = c->fc->streams[c->fc->nb_streams-1];
692
693     if (atom.size < 16)
694         return 0;
695
696     /* skip version and flags */
697     avio_skip(pb, 4);
698
699     ff_mov_read_chan(c->fc, pb, st, atom.size - 4);
700
701     return 0;
702 }
703
704 static int mov_read_wfex(MOVContext *c, AVIOContext *pb, MOVAtom atom)
705 {
706     AVStream *st;
707
708     if (c->fc->nb_streams < 1)
709         return 0;
710     st = c->fc->streams[c->fc->nb_streams-1];
711
712     if (ff_get_wav_header(pb, st->codec, atom.size) < 0) {
713         av_log(c->fc, AV_LOG_WARNING, "get_wav_header failed\n");
714     }
715
716     return 0;
717 }
718
719 static int mov_read_pasp(MOVContext *c, AVIOContext *pb, MOVAtom atom)
720 {
721     const int num = avio_rb32(pb);
722     const int den = avio_rb32(pb);
723     AVStream *st;
724
725     if (c->fc->nb_streams < 1)
726         return 0;
727     st = c->fc->streams[c->fc->nb_streams-1];
728
729     if ((st->sample_aspect_ratio.den != 1 || st->sample_aspect_ratio.num) && // default
730         (den != st->sample_aspect_ratio.den || num != st->sample_aspect_ratio.num)) {
731         av_log(c->fc, AV_LOG_WARNING,
732                "sample aspect ratio already set to %d:%d, ignoring 'pasp' atom (%d:%d)\n",
733                st->sample_aspect_ratio.num, st->sample_aspect_ratio.den,
734                num, den);
735     } else if (den != 0) {
736         st->sample_aspect_ratio.num = num;
737         st->sample_aspect_ratio.den = den;
738     }
739     return 0;
740 }
741
742 /* this atom contains actual media data */
743 static int mov_read_mdat(MOVContext *c, AVIOContext *pb, MOVAtom atom)
744 {
745     if (atom.size == 0) /* wrong one (MP4) */
746         return 0;
747     c->found_mdat=1;
748     return 0; /* now go for moov */
749 }
750
751 /* read major brand, minor version and compatible brands and store them as metadata */
752 static int mov_read_ftyp(MOVContext *c, AVIOContext *pb, MOVAtom atom)
753 {
754     uint32_t minor_ver;
755     int comp_brand_size;
756     char minor_ver_str[11]; /* 32 bit integer -> 10 digits + null */
757     char* comp_brands_str;
758     uint8_t type[5] = {0};
759
760     avio_read(pb, type, 4);
761     if (strcmp(type, "qt  "))
762         c->isom = 1;
763     av_log(c->fc, AV_LOG_DEBUG, "ISO: File Type Major Brand: %.4s\n",(char *)&type);
764     av_dict_set(&c->fc->metadata, "major_brand", type, 0);
765     minor_ver = avio_rb32(pb); /* minor version */
766     snprintf(minor_ver_str, sizeof(minor_ver_str), "%d", minor_ver);
767     av_dict_set(&c->fc->metadata, "minor_version", minor_ver_str, 0);
768
769     comp_brand_size = atom.size - 8;
770     if (comp_brand_size < 0)
771         return AVERROR_INVALIDDATA;
772     comp_brands_str = av_malloc(comp_brand_size + 1); /* Add null terminator */
773     if (!comp_brands_str)
774         return AVERROR(ENOMEM);
775     avio_read(pb, comp_brands_str, comp_brand_size);
776     comp_brands_str[comp_brand_size] = 0;
777     av_dict_set(&c->fc->metadata, "compatible_brands", comp_brands_str, 0);
778     av_freep(&comp_brands_str);
779
780     return 0;
781 }
782
783 /* this atom should contain all header atoms */
784 static int mov_read_moov(MOVContext *c, AVIOContext *pb, MOVAtom atom)
785 {
786     int ret;
787
788     if ((ret = mov_read_default(c, pb, atom)) < 0)
789         return ret;
790     /* we parsed the 'moov' atom, we can terminate the parsing as soon as we find the 'mdat' */
791     /* so we don't parse the whole file if over a network */
792     c->found_moov=1;
793     return 0; /* now go for mdat */
794 }
795
796 static int mov_read_moof(MOVContext *c, AVIOContext *pb, MOVAtom atom)
797 {
798     c->fragment.moof_offset = avio_tell(pb) - 8;
799     av_dlog(c->fc, "moof offset %"PRIx64"\n", c->fragment.moof_offset);
800     return mov_read_default(c, pb, atom);
801 }
802
803 static void mov_metadata_creation_time(AVDictionary **metadata, int64_t time)
804 {
805     char buffer[32];
806     if (time) {
807         struct tm *ptm;
808         time_t timet;
809         if(time >= 2082844800)
810             time -= 2082844800;  /* seconds between 1904-01-01 and Epoch */
811         timet = time;
812         ptm = gmtime(&timet);
813         if (!ptm) return;
814         strftime(buffer, sizeof(buffer), "%Y-%m-%d %H:%M:%S", ptm);
815         av_dict_set(metadata, "creation_time", buffer, 0);
816     }
817 }
818
819 static int mov_read_mdhd(MOVContext *c, AVIOContext *pb, MOVAtom atom)
820 {
821     AVStream *st;
822     MOVStreamContext *sc;
823     int version;
824     char language[4] = {0};
825     unsigned lang;
826     int64_t creation_time;
827
828     if (c->fc->nb_streams < 1)
829         return 0;
830     st = c->fc->streams[c->fc->nb_streams-1];
831     sc = st->priv_data;
832
833     version = avio_r8(pb);
834     if (version > 1) {
835         avpriv_request_sample(c->fc, "Version %d", version);
836         return AVERROR_PATCHWELCOME;
837     }
838     avio_rb24(pb); /* flags */
839     if (version == 1) {
840         creation_time = avio_rb64(pb);
841         avio_rb64(pb);
842     } else {
843         creation_time = avio_rb32(pb);
844         avio_rb32(pb); /* modification time */
845     }
846     mov_metadata_creation_time(&st->metadata, creation_time);
847
848     sc->time_scale = avio_rb32(pb);
849     st->duration = (version == 1) ? avio_rb64(pb) : avio_rb32(pb); /* duration */
850
851     lang = avio_rb16(pb); /* language */
852     if (ff_mov_lang_to_iso639(lang, language))
853         av_dict_set(&st->metadata, "language", language, 0);
854     avio_rb16(pb); /* quality */
855
856     return 0;
857 }
858
859 static int mov_read_mvhd(MOVContext *c, AVIOContext *pb, MOVAtom atom)
860 {
861     int64_t creation_time;
862     int version = avio_r8(pb); /* version */
863     avio_rb24(pb); /* flags */
864
865     if (version == 1) {
866         creation_time = avio_rb64(pb);
867         avio_rb64(pb);
868     } else {
869         creation_time = avio_rb32(pb);
870         avio_rb32(pb); /* modification time */
871     }
872     mov_metadata_creation_time(&c->fc->metadata, creation_time);
873     c->time_scale = avio_rb32(pb); /* time scale */
874
875     av_dlog(c->fc, "time scale = %i\n", c->time_scale);
876
877     c->duration = (version == 1) ? avio_rb64(pb) : avio_rb32(pb); /* duration */
878     // set the AVCodecContext duration because the duration of individual tracks
879     // may be inaccurate
880     if (c->time_scale > 0)
881         c->fc->duration = av_rescale(c->duration, AV_TIME_BASE, c->time_scale);
882     avio_rb32(pb); /* preferred scale */
883
884     avio_rb16(pb); /* preferred volume */
885
886     avio_skip(pb, 10); /* reserved */
887
888     avio_skip(pb, 36); /* display matrix */
889
890     avio_rb32(pb); /* preview time */
891     avio_rb32(pb); /* preview duration */
892     avio_rb32(pb); /* poster time */
893     avio_rb32(pb); /* selection time */
894     avio_rb32(pb); /* selection duration */
895     avio_rb32(pb); /* current time */
896     avio_rb32(pb); /* next track ID */
897     return 0;
898 }
899
900 static int mov_read_enda(MOVContext *c, AVIOContext *pb, MOVAtom atom)
901 {
902     AVStream *st;
903     int little_endian;
904
905     if (c->fc->nb_streams < 1)
906         return 0;
907     st = c->fc->streams[c->fc->nb_streams-1];
908
909     little_endian = avio_rb16(pb) & 0xFF;
910     av_dlog(c->fc, "enda %d\n", little_endian);
911     if (little_endian == 1) {
912         switch (st->codec->codec_id) {
913         case AV_CODEC_ID_PCM_S24BE:
914             st->codec->codec_id = AV_CODEC_ID_PCM_S24LE;
915             break;
916         case AV_CODEC_ID_PCM_S32BE:
917             st->codec->codec_id = AV_CODEC_ID_PCM_S32LE;
918             break;
919         case AV_CODEC_ID_PCM_F32BE:
920             st->codec->codec_id = AV_CODEC_ID_PCM_F32LE;
921             break;
922         case AV_CODEC_ID_PCM_F64BE:
923             st->codec->codec_id = AV_CODEC_ID_PCM_F64LE;
924             break;
925         default:
926             break;
927         }
928     }
929     return 0;
930 }
931
932 static int mov_read_fiel(MOVContext *c, AVIOContext *pb, MOVAtom atom)
933 {
934     AVStream *st;
935     unsigned mov_field_order;
936     enum AVFieldOrder decoded_field_order = AV_FIELD_UNKNOWN;
937
938     if (c->fc->nb_streams < 1) // will happen with jp2 files
939         return 0;
940     st = c->fc->streams[c->fc->nb_streams-1];
941     if (atom.size < 2)
942         return AVERROR_INVALIDDATA;
943     mov_field_order = avio_rb16(pb);
944     if ((mov_field_order & 0xFF00) == 0x0100)
945         decoded_field_order = AV_FIELD_PROGRESSIVE;
946     else if ((mov_field_order & 0xFF00) == 0x0200) {
947         switch (mov_field_order & 0xFF) {
948         case 0x01: decoded_field_order = AV_FIELD_TT;
949                    break;
950         case 0x06: decoded_field_order = AV_FIELD_BB;
951                    break;
952         case 0x09: decoded_field_order = AV_FIELD_TB;
953                    break;
954         case 0x0E: decoded_field_order = AV_FIELD_BT;
955                    break;
956         }
957     }
958     if (decoded_field_order == AV_FIELD_UNKNOWN && mov_field_order) {
959         av_log(NULL, AV_LOG_ERROR, "Unknown MOV field order 0x%04x\n", mov_field_order);
960     }
961     st->codec->field_order = decoded_field_order;
962
963     return 0;
964 }
965
966 /* FIXME modify qdm2/svq3/h264 decoders to take full atom as extradata */
967 static int mov_read_extradata(MOVContext *c, AVIOContext *pb, MOVAtom atom,
968                               enum AVCodecID codec_id)
969 {
970     AVStream *st;
971     uint64_t size;
972     uint8_t *buf;
973
974     if (c->fc->nb_streams < 1) // will happen with jp2 files
975         return 0;
976     st= c->fc->streams[c->fc->nb_streams-1];
977
978     if (st->codec->codec_id != codec_id)
979         return 0; /* unexpected codec_id - don't mess with extradata */
980
981     size= (uint64_t)st->codec->extradata_size + atom.size + 8 + FF_INPUT_BUFFER_PADDING_SIZE;
982     if (size > INT_MAX || (uint64_t)atom.size > INT_MAX)
983         return AVERROR_INVALIDDATA;
984     buf= av_realloc(st->codec->extradata, size);
985     if (!buf)
986         return AVERROR(ENOMEM);
987     st->codec->extradata= buf;
988     buf+= st->codec->extradata_size;
989     st->codec->extradata_size= size - FF_INPUT_BUFFER_PADDING_SIZE;
990     AV_WB32(       buf    , atom.size + 8);
991     AV_WL32(       buf + 4, atom.type);
992     avio_read(pb, buf + 8, atom.size);
993     return 0;
994 }
995
996 /* wrapper functions for reading ALAC/AVS/MJPEG/MJPEG2000 extradata atoms only for those codecs */
997 static int mov_read_alac(MOVContext *c, AVIOContext *pb, MOVAtom atom)
998 {
999     return mov_read_extradata(c, pb, atom, AV_CODEC_ID_ALAC);
1000 }
1001
1002 static int mov_read_avss(MOVContext *c, AVIOContext *pb, MOVAtom atom)
1003 {
1004     return mov_read_extradata(c, pb, atom, AV_CODEC_ID_AVS);
1005 }
1006
1007 static int mov_read_jp2h(MOVContext *c, AVIOContext *pb, MOVAtom atom)
1008 {
1009     return mov_read_extradata(c, pb, atom, AV_CODEC_ID_JPEG2000);
1010 }
1011
1012 static int mov_read_avid(MOVContext *c, AVIOContext *pb, MOVAtom atom)
1013 {
1014     return mov_read_extradata(c, pb, atom, AV_CODEC_ID_AVUI);
1015 }
1016
1017 static int mov_read_svq3(MOVContext *c, AVIOContext *pb, MOVAtom atom)
1018 {
1019     return mov_read_extradata(c, pb, atom, AV_CODEC_ID_SVQ3);
1020 }
1021
1022 static int mov_read_wave(MOVContext *c, AVIOContext *pb, MOVAtom atom)
1023 {
1024     AVStream *st;
1025
1026     if (c->fc->nb_streams < 1)
1027         return 0;
1028     st = c->fc->streams[c->fc->nb_streams-1];
1029
1030     if ((uint64_t)atom.size > (1<<30))
1031         return AVERROR_INVALIDDATA;
1032
1033     if (st->codec->codec_id == AV_CODEC_ID_QDM2 ||
1034         st->codec->codec_id == AV_CODEC_ID_QDMC ||
1035         st->codec->codec_id == AV_CODEC_ID_SPEEX) {
1036         // pass all frma atom to codec, needed at least for QDMC and QDM2
1037         av_free(st->codec->extradata);
1038         st->codec->extradata_size = 0;
1039         st->codec->extradata = av_mallocz(atom.size + FF_INPUT_BUFFER_PADDING_SIZE);
1040         if (!st->codec->extradata)
1041             return AVERROR(ENOMEM);
1042         st->codec->extradata_size = atom.size;
1043         avio_read(pb, st->codec->extradata, atom.size);
1044     } else if (atom.size > 8) { /* to read frma, esds atoms */
1045         int ret;
1046         if ((ret = mov_read_default(c, pb, atom)) < 0)
1047             return ret;
1048     } else
1049         avio_skip(pb, atom.size);
1050     return 0;
1051 }
1052
1053 /**
1054  * This function reads atom content and puts data in extradata without tag
1055  * nor size unlike mov_read_extradata.
1056  */
1057 static int mov_read_glbl(MOVContext *c, AVIOContext *pb, MOVAtom atom)
1058 {
1059     AVStream *st;
1060
1061     if (c->fc->nb_streams < 1)
1062         return 0;
1063     st = c->fc->streams[c->fc->nb_streams-1];
1064
1065     if ((uint64_t)atom.size > (1<<30))
1066         return AVERROR_INVALIDDATA;
1067
1068     if (atom.size >= 10) {
1069         // Broken files created by legacy versions of libavformat will
1070         // wrap a whole fiel atom inside of a glbl atom.
1071         unsigned size = avio_rb32(pb);
1072         unsigned type = avio_rl32(pb);
1073         avio_seek(pb, -8, SEEK_CUR);
1074         if (type == MKTAG('f','i','e','l') && size == atom.size)
1075             return mov_read_default(c, pb, atom);
1076     }
1077     av_free(st->codec->extradata);
1078     st->codec->extradata_size = 0;
1079     st->codec->extradata = av_mallocz(atom.size + FF_INPUT_BUFFER_PADDING_SIZE);
1080     if (!st->codec->extradata)
1081         return AVERROR(ENOMEM);
1082     st->codec->extradata_size = atom.size;
1083     avio_read(pb, st->codec->extradata, atom.size);
1084     return 0;
1085 }
1086
1087 static int mov_read_dvc1(MOVContext *c, AVIOContext *pb, MOVAtom atom)
1088 {
1089     AVStream *st;
1090     uint8_t profile_level;
1091
1092     if (c->fc->nb_streams < 1)
1093         return 0;
1094     st = c->fc->streams[c->fc->nb_streams-1];
1095
1096     if (atom.size >= (1<<28) || atom.size < 7)
1097         return AVERROR_INVALIDDATA;
1098
1099     profile_level = avio_r8(pb);
1100     if ((profile_level & 0xf0) != 0xc0)
1101         return 0;
1102
1103     av_free(st->codec->extradata);
1104     st->codec->extradata_size = 0;
1105     st->codec->extradata = av_mallocz(atom.size - 7 + FF_INPUT_BUFFER_PADDING_SIZE);
1106     if (!st->codec->extradata)
1107         return AVERROR(ENOMEM);
1108     st->codec->extradata_size = atom.size - 7;
1109     avio_seek(pb, 6, SEEK_CUR);
1110     avio_read(pb, st->codec->extradata, st->codec->extradata_size);
1111     return 0;
1112 }
1113
1114 /**
1115  * An strf atom is a BITMAPINFOHEADER struct. This struct is 40 bytes itself,
1116  * but can have extradata appended at the end after the 40 bytes belonging
1117  * to the struct.
1118  */
1119 static int mov_read_strf(MOVContext *c, AVIOContext *pb, MOVAtom atom)
1120 {
1121     AVStream *st;
1122
1123     if (c->fc->nb_streams < 1)
1124         return 0;
1125     if (atom.size <= 40)
1126         return 0;
1127     st = c->fc->streams[c->fc->nb_streams-1];
1128
1129     if ((uint64_t)atom.size > (1<<30))
1130         return AVERROR_INVALIDDATA;
1131
1132     av_free(st->codec->extradata);
1133     st->codec->extradata_size = 0;
1134     st->codec->extradata = av_mallocz(atom.size - 40 + FF_INPUT_BUFFER_PADDING_SIZE);
1135     if (!st->codec->extradata)
1136         return AVERROR(ENOMEM);
1137     st->codec->extradata_size = atom.size - 40;
1138     avio_skip(pb, 40);
1139     avio_read(pb, st->codec->extradata, atom.size - 40);
1140     return 0;
1141 }
1142
1143 static int mov_read_stco(MOVContext *c, AVIOContext *pb, MOVAtom atom)
1144 {
1145     AVStream *st;
1146     MOVStreamContext *sc;
1147     unsigned int i, entries;
1148
1149     if (c->fc->nb_streams < 1)
1150         return 0;
1151     st = c->fc->streams[c->fc->nb_streams-1];
1152     sc = st->priv_data;
1153
1154     avio_r8(pb); /* version */
1155     avio_rb24(pb); /* flags */
1156
1157     entries = avio_rb32(pb);
1158
1159     if (!entries)
1160         return 0;
1161     if (entries >= UINT_MAX/sizeof(int64_t))
1162         return AVERROR_INVALIDDATA;
1163
1164     sc->chunk_offsets = av_malloc(entries * sizeof(int64_t));
1165     if (!sc->chunk_offsets)
1166         return AVERROR(ENOMEM);
1167     sc->chunk_count = entries;
1168
1169     if      (atom.type == MKTAG('s','t','c','o'))
1170         for (i = 0; i < entries && !pb->eof_reached; i++)
1171             sc->chunk_offsets[i] = avio_rb32(pb);
1172     else if (atom.type == MKTAG('c','o','6','4'))
1173         for (i = 0; i < entries && !pb->eof_reached; i++)
1174             sc->chunk_offsets[i] = avio_rb64(pb);
1175     else
1176         return AVERROR_INVALIDDATA;
1177
1178     sc->chunk_count = i;
1179
1180     if (pb->eof_reached)
1181         return AVERROR_EOF;
1182
1183     return 0;
1184 }
1185
1186 /**
1187  * Compute codec id for 'lpcm' tag.
1188  * See CoreAudioTypes and AudioStreamBasicDescription at Apple.
1189  */
1190 enum AVCodecID ff_mov_get_lpcm_codec_id(int bps, int flags)
1191 {
1192     /* lpcm flags:
1193      * 0x1 = float
1194      * 0x2 = big-endian
1195      * 0x4 = signed
1196      */
1197     return ff_get_pcm_codec_id(bps, flags & 1, flags & 2, flags & 4 ? -1 : 0);
1198 }
1199
1200 int ff_mov_read_stsd_entries(MOVContext *c, AVIOContext *pb, int entries)
1201 {
1202     AVStream *st;
1203     MOVStreamContext *sc;
1204     int j, pseudo_stream_id;
1205
1206     if (c->fc->nb_streams < 1)
1207         return 0;
1208     st = c->fc->streams[c->fc->nb_streams-1];
1209     sc = st->priv_data;
1210
1211     for (pseudo_stream_id = 0;
1212          pseudo_stream_id < entries && !pb->eof_reached;
1213          pseudo_stream_id++) {
1214         //Parsing Sample description table
1215         enum AVCodecID id;
1216         int dref_id = 1;
1217         MOVAtom a = { AV_RL32("stsd") };
1218         int64_t start_pos = avio_tell(pb);
1219         int64_t size = avio_rb32(pb); /* size */
1220         uint32_t format = avio_rl32(pb); /* data format */
1221
1222         if (size >= 16) {
1223             avio_rb32(pb); /* reserved */
1224             avio_rb16(pb); /* reserved */
1225             dref_id = avio_rb16(pb);
1226         }else if (size <= 7){
1227             av_log(c->fc, AV_LOG_ERROR, "invalid size %"PRId64" in stsd\n", size);
1228             return AVERROR_INVALIDDATA;
1229         }
1230
1231         if (st->codec->codec_tag &&
1232             st->codec->codec_tag != format &&
1233             (c->fc->video_codec_id ? ff_codec_get_id(ff_codec_movvideo_tags, format) != c->fc->video_codec_id
1234                                    : st->codec->codec_tag != MKTAG('j','p','e','g'))
1235            ){
1236             /* Multiple fourcc, we skip JPEG. This is not correct, we should
1237              * export it as a separate AVStream but this needs a few changes
1238              * in the MOV demuxer, patch welcome. */
1239             av_log(c->fc, AV_LOG_WARNING, "multiple fourcc not supported\n");
1240             avio_skip(pb, size - (avio_tell(pb) - start_pos));
1241             continue;
1242         }
1243         /* we cannot demux concatenated h264 streams because of different extradata */
1244         if (st->codec->codec_tag && st->codec->codec_tag == AV_RL32("avc1"))
1245             av_log(c->fc, AV_LOG_WARNING, "Concatenated H.264 might not play corrently.\n");
1246         sc->pseudo_stream_id = st->codec->codec_tag ? -1 : pseudo_stream_id;
1247         sc->dref_id= dref_id;
1248
1249         st->codec->codec_tag = format;
1250         id = ff_codec_get_id(ff_codec_movaudio_tags, format);
1251         if (id<=0 && ((format&0xFFFF) == 'm'+('s'<<8) || (format&0xFFFF) == 'T'+('S'<<8)))
1252             id = ff_codec_get_id(ff_codec_wav_tags, av_bswap32(format)&0xFFFF);
1253
1254         if (st->codec->codec_type != AVMEDIA_TYPE_VIDEO && id > 0) {
1255             st->codec->codec_type = AVMEDIA_TYPE_AUDIO;
1256         } else if (st->codec->codec_type != AVMEDIA_TYPE_AUDIO && /* do not overwrite codec type */
1257                    format && format != MKTAG('m','p','4','s')) { /* skip old asf mpeg4 tag */
1258             id = ff_codec_get_id(ff_codec_movvideo_tags, format);
1259             if (id <= 0)
1260                 id = ff_codec_get_id(ff_codec_bmp_tags, format);
1261             if (id > 0)
1262                 st->codec->codec_type = AVMEDIA_TYPE_VIDEO;
1263             else if (st->codec->codec_type == AVMEDIA_TYPE_DATA ||
1264                      (st->codec->codec_type == AVMEDIA_TYPE_SUBTITLE &&
1265                       st->codec->codec_id == AV_CODEC_ID_NONE)){
1266                 id = ff_codec_get_id(ff_codec_movsubtitle_tags, format);
1267                 if (id > 0)
1268                     st->codec->codec_type = AVMEDIA_TYPE_SUBTITLE;
1269             }
1270         }
1271
1272         av_dlog(c->fc, "size=%"PRId64" 4CC= %c%c%c%c codec_type=%d\n", size,
1273                 (format >> 0) & 0xff, (format >> 8) & 0xff, (format >> 16) & 0xff,
1274                 (format >> 24) & 0xff, st->codec->codec_type);
1275
1276         if (st->codec->codec_type==AVMEDIA_TYPE_VIDEO) {
1277             unsigned int color_depth, len;
1278             int color_greyscale;
1279             int color_table_id;
1280
1281             st->codec->codec_id = id;
1282             avio_rb16(pb); /* version */
1283             avio_rb16(pb); /* revision level */
1284             avio_rb32(pb); /* vendor */
1285             avio_rb32(pb); /* temporal quality */
1286             avio_rb32(pb); /* spatial quality */
1287
1288             st->codec->width = avio_rb16(pb); /* width */
1289             st->codec->height = avio_rb16(pb); /* height */
1290
1291             avio_rb32(pb); /* horiz resolution */
1292             avio_rb32(pb); /* vert resolution */
1293             avio_rb32(pb); /* data size, always 0 */
1294             avio_rb16(pb); /* frames per samples */
1295
1296             len = avio_r8(pb); /* codec name, pascal string */
1297             if (len > 31)
1298                 len = 31;
1299             mov_read_mac_string(c, pb, len, st->codec->codec_name, 32);
1300             if (len < 31)
1301                 avio_skip(pb, 31 - len);
1302             /* codec_tag YV12 triggers an UV swap in rawdec.c */
1303             if (!memcmp(st->codec->codec_name, "Planar Y'CbCr 8-bit 4:2:0", 25)){
1304                 st->codec->codec_tag=MKTAG('I', '4', '2', '0');
1305                 st->codec->width &= ~1;
1306                 st->codec->height &= ~1;
1307             }
1308             /* Flash Media Server uses tag H263 with Sorenson Spark */
1309             if (format == MKTAG('H','2','6','3') &&
1310                 !memcmp(st->codec->codec_name, "Sorenson H263", 13))
1311                 st->codec->codec_id = AV_CODEC_ID_FLV1;
1312
1313             st->codec->bits_per_coded_sample = avio_rb16(pb); /* depth */
1314             color_table_id = avio_rb16(pb); /* colortable id */
1315             av_dlog(c->fc, "depth %d, ctab id %d\n",
1316                    st->codec->bits_per_coded_sample, color_table_id);
1317             /* figure out the palette situation */
1318             color_depth = st->codec->bits_per_coded_sample & 0x1F;
1319             color_greyscale = st->codec->bits_per_coded_sample & 0x20;
1320
1321             /* if the depth is 2, 4, or 8 bpp, file is palettized */
1322             if ((color_depth == 2) || (color_depth == 4) ||
1323                 (color_depth == 8)) {
1324                 /* for palette traversal */
1325                 unsigned int color_start, color_count, color_end;
1326                 unsigned char a, r, g, b;
1327
1328                 if (color_greyscale) {
1329                     int color_index, color_dec;
1330                     /* compute the greyscale palette */
1331                     st->codec->bits_per_coded_sample = color_depth;
1332                     color_count = 1 << color_depth;
1333                     color_index = 255;
1334                     color_dec = 256 / (color_count - 1);
1335                     for (j = 0; j < color_count; j++) {
1336                         if (id == AV_CODEC_ID_CINEPAK){
1337                             r = g = b = color_count - 1 - color_index;
1338                         }else
1339                         r = g = b = color_index;
1340                         sc->palette[j] =
1341                             (0xFFU << 24) | (r << 16) | (g << 8) | (b);
1342                         color_index -= color_dec;
1343                         if (color_index < 0)
1344                             color_index = 0;
1345                     }
1346                 } else if (color_table_id) {
1347                     const uint8_t *color_table;
1348                     /* if flag bit 3 is set, use the default palette */
1349                     color_count = 1 << color_depth;
1350                     if (color_depth == 2)
1351                         color_table = ff_qt_default_palette_4;
1352                     else if (color_depth == 4)
1353                         color_table = ff_qt_default_palette_16;
1354                     else
1355                         color_table = ff_qt_default_palette_256;
1356
1357                     for (j = 0; j < color_count; j++) {
1358                         r = color_table[j * 3 + 0];
1359                         g = color_table[j * 3 + 1];
1360                         b = color_table[j * 3 + 2];
1361                         sc->palette[j] =
1362                             (0xFFU << 24) | (r << 16) | (g << 8) | (b);
1363                     }
1364                 } else {
1365                     /* load the palette from the file */
1366                     color_start = avio_rb32(pb);
1367                     color_count = avio_rb16(pb);
1368                     color_end = avio_rb16(pb);
1369                     if ((color_start <= 255) &&
1370                         (color_end <= 255)) {
1371                         for (j = color_start; j <= color_end; j++) {
1372                             /* each A, R, G, or B component is 16 bits;
1373                              * only use the top 8 bits */
1374                             a = avio_r8(pb);
1375                             avio_r8(pb);
1376                             r = avio_r8(pb);
1377                             avio_r8(pb);
1378                             g = avio_r8(pb);
1379                             avio_r8(pb);
1380                             b = avio_r8(pb);
1381                             avio_r8(pb);
1382                             sc->palette[j] =
1383                                 (a << 24 ) | (r << 16) | (g << 8) | (b);
1384                         }
1385                     }
1386                 }
1387                 sc->has_palette = 1;
1388             }
1389         } else if (st->codec->codec_type==AVMEDIA_TYPE_AUDIO) {
1390             int bits_per_sample, flags;
1391             uint16_t version = avio_rb16(pb);
1392             AVDictionaryEntry *compatible_brands = av_dict_get(c->fc->metadata, "compatible_brands", NULL, AV_DICT_MATCH_CASE);
1393
1394             st->codec->codec_id = id;
1395             avio_rb16(pb); /* revision level */
1396             avio_rb32(pb); /* vendor */
1397
1398             st->codec->channels = avio_rb16(pb);             /* channel count */
1399             av_dlog(c->fc, "audio channels %d\n", st->codec->channels);
1400             st->codec->bits_per_coded_sample = avio_rb16(pb);      /* sample size */
1401
1402             sc->audio_cid = avio_rb16(pb);
1403             avio_rb16(pb); /* packet size = 0 */
1404
1405             st->codec->sample_rate = ((avio_rb32(pb) >> 16));
1406
1407             //Read QT version 1 fields. In version 0 these do not exist.
1408             av_dlog(c->fc, "version =%d, isom =%d\n",version,c->isom);
1409             if (!c->isom ||
1410                 (compatible_brands && strstr(compatible_brands->value, "qt  "))) {
1411                 if (version==1) {
1412                     sc->samples_per_frame = avio_rb32(pb);
1413                     avio_rb32(pb); /* bytes per packet */
1414                     sc->bytes_per_frame = avio_rb32(pb);
1415                     avio_rb32(pb); /* bytes per sample */
1416                 } else if (version==2) {
1417                     avio_rb32(pb); /* sizeof struct only */
1418                     st->codec->sample_rate = av_int2double(avio_rb64(pb)); /* float 64 */
1419                     st->codec->channels = avio_rb32(pb);
1420                     avio_rb32(pb); /* always 0x7F000000 */
1421                     st->codec->bits_per_coded_sample = avio_rb32(pb); /* bits per channel if sound is uncompressed */
1422                     flags = avio_rb32(pb); /* lpcm format specific flag */
1423                     sc->bytes_per_frame = avio_rb32(pb); /* bytes per audio packet if constant */
1424                     sc->samples_per_frame = avio_rb32(pb); /* lpcm frames per audio packet if constant */
1425                     if (format == MKTAG('l','p','c','m'))
1426                         st->codec->codec_id = ff_mov_get_lpcm_codec_id(st->codec->bits_per_coded_sample, flags);
1427                 }
1428             }
1429
1430             switch (st->codec->codec_id) {
1431             case AV_CODEC_ID_PCM_S8:
1432             case AV_CODEC_ID_PCM_U8:
1433                 if (st->codec->bits_per_coded_sample == 16)
1434                     st->codec->codec_id = AV_CODEC_ID_PCM_S16BE;
1435                 break;
1436             case AV_CODEC_ID_PCM_S16LE:
1437             case AV_CODEC_ID_PCM_S16BE:
1438                 if (st->codec->bits_per_coded_sample == 8)
1439                     st->codec->codec_id = AV_CODEC_ID_PCM_S8;
1440                 else if (st->codec->bits_per_coded_sample == 24)
1441                     st->codec->codec_id =
1442                         st->codec->codec_id == AV_CODEC_ID_PCM_S16BE ?
1443                         AV_CODEC_ID_PCM_S24BE : AV_CODEC_ID_PCM_S24LE;
1444                 break;
1445             /* set values for old format before stsd version 1 appeared */
1446             case AV_CODEC_ID_MACE3:
1447                 sc->samples_per_frame = 6;
1448                 sc->bytes_per_frame = 2*st->codec->channels;
1449                 break;
1450             case AV_CODEC_ID_MACE6:
1451                 sc->samples_per_frame = 6;
1452                 sc->bytes_per_frame = 1*st->codec->channels;
1453                 break;
1454             case AV_CODEC_ID_ADPCM_IMA_QT:
1455                 sc->samples_per_frame = 64;
1456                 sc->bytes_per_frame = 34*st->codec->channels;
1457                 break;
1458             case AV_CODEC_ID_GSM:
1459                 sc->samples_per_frame = 160;
1460                 sc->bytes_per_frame = 33;
1461                 break;
1462             default:
1463                 break;
1464             }
1465
1466             bits_per_sample = av_get_bits_per_sample(st->codec->codec_id);
1467             if (bits_per_sample) {
1468                 st->codec->bits_per_coded_sample = bits_per_sample;
1469                 sc->sample_size = (bits_per_sample >> 3) * st->codec->channels;
1470             }
1471         } else if (st->codec->codec_type==AVMEDIA_TYPE_SUBTITLE){
1472             // ttxt stsd contains display flags, justification, background
1473             // color, fonts, and default styles, so fake an atom to read it
1474             MOVAtom fake_atom = { .size = size - (avio_tell(pb) - start_pos) };
1475             if (format != AV_RL32("mp4s")) // mp4s contains a regular esds atom
1476                 mov_read_glbl(c, pb, fake_atom);
1477             st->codec->codec_id= id;
1478             st->codec->width = sc->width;
1479             st->codec->height = sc->height;
1480         } else {
1481             if (st->codec->codec_tag == MKTAG('t','m','c','d')) {
1482                 MOVStreamContext *tmcd_ctx = st->priv_data;
1483                 int val;
1484                 avio_rb32(pb);       /* reserved */
1485                 val = avio_rb32(pb); /* flags */
1486                 tmcd_ctx->tmcd_flags = val;
1487                 if (val & 1)
1488                     st->codec->flags2 |= CODEC_FLAG2_DROP_FRAME_TIMECODE;
1489                 avio_rb32(pb); /* time scale */
1490                 avio_rb32(pb); /* frame duration */
1491                 st->codec->time_base.den = avio_r8(pb); /* number of frame */
1492                 st->codec->time_base.num = 1;
1493             }
1494             /* other codec type, just skip (rtp, mp4s, ...) */
1495             avio_skip(pb, size - (avio_tell(pb) - start_pos));
1496         }
1497         /* this will read extra atoms at the end (wave, alac, damr, avcC, SMI ...) */
1498         a.size = size - (avio_tell(pb) - start_pos);
1499         if (a.size > 8) {
1500             int ret;
1501             if ((ret = mov_read_default(c, pb, a)) < 0)
1502                 return ret;
1503         } else if (a.size > 0)
1504             avio_skip(pb, a.size);
1505     }
1506
1507     if (pb->eof_reached)
1508         return AVERROR_EOF;
1509
1510     if (st->codec->codec_type==AVMEDIA_TYPE_AUDIO && st->codec->sample_rate==0 && sc->time_scale>1)
1511         st->codec->sample_rate= sc->time_scale;
1512
1513     /* special codec parameters handling */
1514     switch (st->codec->codec_id) {
1515 #if CONFIG_DV_DEMUXER
1516     case AV_CODEC_ID_DVAUDIO:
1517         c->dv_fctx = avformat_alloc_context();
1518         c->dv_demux = avpriv_dv_init_demux(c->dv_fctx);
1519         if (!c->dv_demux) {
1520             av_log(c->fc, AV_LOG_ERROR, "dv demux context init error\n");
1521             return AVERROR(ENOMEM);
1522         }
1523         sc->dv_audio_container = 1;
1524         st->codec->codec_id = AV_CODEC_ID_PCM_S16LE;
1525         break;
1526 #endif
1527     /* no ifdef since parameters are always those */
1528     case AV_CODEC_ID_QCELP:
1529         // force sample rate for qcelp when not stored in mov
1530         if (st->codec->codec_tag != MKTAG('Q','c','l','p'))
1531             st->codec->sample_rate = 8000;
1532         st->codec->channels= 1; /* really needed */
1533         break;
1534     case AV_CODEC_ID_AMR_NB:
1535         st->codec->channels= 1; /* really needed */
1536         /* force sample rate for amr, stsd in 3gp does not store sample rate */
1537         st->codec->sample_rate = 8000;
1538         break;
1539     case AV_CODEC_ID_AMR_WB:
1540         st->codec->channels    = 1;
1541         st->codec->sample_rate = 16000;
1542         break;
1543     case AV_CODEC_ID_MP2:
1544     case AV_CODEC_ID_MP3:
1545         st->codec->codec_type = AVMEDIA_TYPE_AUDIO; /* force type after stsd for m1a hdlr */
1546         st->need_parsing = AVSTREAM_PARSE_FULL;
1547         break;
1548     case AV_CODEC_ID_GSM:
1549     case AV_CODEC_ID_ADPCM_MS:
1550     case AV_CODEC_ID_ADPCM_IMA_WAV:
1551     case AV_CODEC_ID_ILBC:
1552     case AV_CODEC_ID_MACE3:
1553     case AV_CODEC_ID_MACE6:
1554         st->codec->block_align = sc->bytes_per_frame;
1555         break;
1556     case AV_CODEC_ID_ALAC:
1557         if (st->codec->extradata_size == 36) {
1558             st->codec->channels   = AV_RB8 (st->codec->extradata+21);
1559             st->codec->sample_rate = AV_RB32(st->codec->extradata+32);
1560         }
1561         break;
1562     case AV_CODEC_ID_AC3:
1563         st->need_parsing = AVSTREAM_PARSE_FULL;
1564         break;
1565     case AV_CODEC_ID_MPEG1VIDEO:
1566         st->need_parsing = AVSTREAM_PARSE_FULL;
1567         break;
1568     case AV_CODEC_ID_VC1:
1569         st->need_parsing = AVSTREAM_PARSE_FULL;
1570         break;
1571     default:
1572         break;
1573     }
1574
1575     return 0;
1576 }
1577
1578 static int mov_read_stsd(MOVContext *c, AVIOContext *pb, MOVAtom atom)
1579 {
1580     int entries;
1581
1582     avio_r8(pb); /* version */
1583     avio_rb24(pb); /* flags */
1584     entries = avio_rb32(pb);
1585
1586     return ff_mov_read_stsd_entries(c, pb, entries);
1587 }
1588
1589 static int mov_read_stsc(MOVContext *c, AVIOContext *pb, MOVAtom atom)
1590 {
1591     AVStream *st;
1592     MOVStreamContext *sc;
1593     unsigned int i, entries;
1594
1595     if (c->fc->nb_streams < 1)
1596         return 0;
1597     st = c->fc->streams[c->fc->nb_streams-1];
1598     sc = st->priv_data;
1599
1600     avio_r8(pb); /* version */
1601     avio_rb24(pb); /* flags */
1602
1603     entries = avio_rb32(pb);
1604
1605     av_dlog(c->fc, "track[%i].stsc.entries = %i\n", c->fc->nb_streams-1, entries);
1606
1607     if (!entries)
1608         return 0;
1609     if (entries >= UINT_MAX / sizeof(*sc->stsc_data))
1610         return AVERROR_INVALIDDATA;
1611     sc->stsc_data = av_malloc(entries * sizeof(*sc->stsc_data));
1612     if (!sc->stsc_data)
1613         return AVERROR(ENOMEM);
1614
1615     for (i = 0; i < entries && !pb->eof_reached; i++) {
1616         sc->stsc_data[i].first = avio_rb32(pb);
1617         sc->stsc_data[i].count = avio_rb32(pb);
1618         sc->stsc_data[i].id = avio_rb32(pb);
1619     }
1620
1621     sc->stsc_count = i;
1622
1623     if (pb->eof_reached)
1624         return AVERROR_EOF;
1625
1626     return 0;
1627 }
1628
1629 static int mov_read_stps(MOVContext *c, AVIOContext *pb, MOVAtom atom)
1630 {
1631     AVStream *st;
1632     MOVStreamContext *sc;
1633     unsigned i, entries;
1634
1635     if (c->fc->nb_streams < 1)
1636         return 0;
1637     st = c->fc->streams[c->fc->nb_streams-1];
1638     sc = st->priv_data;
1639
1640     avio_rb32(pb); // version + flags
1641
1642     entries = avio_rb32(pb);
1643     if (entries >= UINT_MAX / sizeof(*sc->stps_data))
1644         return AVERROR_INVALIDDATA;
1645     sc->stps_data = av_malloc(entries * sizeof(*sc->stps_data));
1646     if (!sc->stps_data)
1647         return AVERROR(ENOMEM);
1648
1649     for (i = 0; i < entries && !pb->eof_reached; i++) {
1650         sc->stps_data[i] = avio_rb32(pb);
1651         //av_dlog(c->fc, "stps %d\n", sc->stps_data[i]);
1652     }
1653
1654     sc->stps_count = i;
1655
1656     if (pb->eof_reached)
1657         return AVERROR_EOF;
1658
1659     return 0;
1660 }
1661
1662 static int mov_read_stss(MOVContext *c, AVIOContext *pb, MOVAtom atom)
1663 {
1664     AVStream *st;
1665     MOVStreamContext *sc;
1666     unsigned int i, entries;
1667
1668     if (c->fc->nb_streams < 1)
1669         return 0;
1670     st = c->fc->streams[c->fc->nb_streams-1];
1671     sc = st->priv_data;
1672
1673     avio_r8(pb); /* version */
1674     avio_rb24(pb); /* flags */
1675
1676     entries = avio_rb32(pb);
1677
1678     av_dlog(c->fc, "keyframe_count = %d\n", entries);
1679
1680     if (!entries)
1681     {
1682         sc->keyframe_absent = 1;
1683         return 0;
1684     }
1685     if (entries >= UINT_MAX / sizeof(int))
1686         return AVERROR_INVALIDDATA;
1687     sc->keyframes = av_malloc(entries * sizeof(int));
1688     if (!sc->keyframes)
1689         return AVERROR(ENOMEM);
1690
1691     for (i = 0; i < entries && !pb->eof_reached; i++) {
1692         sc->keyframes[i] = avio_rb32(pb);
1693         //av_dlog(c->fc, "keyframes[]=%d\n", sc->keyframes[i]);
1694     }
1695
1696     sc->keyframe_count = i;
1697
1698     if (pb->eof_reached)
1699         return AVERROR_EOF;
1700
1701     return 0;
1702 }
1703
1704 static int mov_read_stsz(MOVContext *c, AVIOContext *pb, MOVAtom atom)
1705 {
1706     AVStream *st;
1707     MOVStreamContext *sc;
1708     unsigned int i, entries, sample_size, field_size, num_bytes;
1709     GetBitContext gb;
1710     unsigned char* buf;
1711
1712     if (c->fc->nb_streams < 1)
1713         return 0;
1714     st = c->fc->streams[c->fc->nb_streams-1];
1715     sc = st->priv_data;
1716
1717     avio_r8(pb); /* version */
1718     avio_rb24(pb); /* flags */
1719
1720     if (atom.type == MKTAG('s','t','s','z')) {
1721         sample_size = avio_rb32(pb);
1722         if (!sc->sample_size) /* do not overwrite value computed in stsd */
1723             sc->sample_size = sample_size;
1724         sc->stsz_sample_size = sample_size;
1725         field_size = 32;
1726     } else {
1727         sample_size = 0;
1728         avio_rb24(pb); /* reserved */
1729         field_size = avio_r8(pb);
1730     }
1731     entries = avio_rb32(pb);
1732
1733     av_dlog(c->fc, "sample_size = %d sample_count = %d\n", sc->sample_size, entries);
1734
1735     sc->sample_count = entries;
1736     if (sample_size)
1737         return 0;
1738
1739     if (field_size != 4 && field_size != 8 && field_size != 16 && field_size != 32) {
1740         av_log(c->fc, AV_LOG_ERROR, "Invalid sample field size %d\n", field_size);
1741         return AVERROR_INVALIDDATA;
1742     }
1743
1744     if (!entries)
1745         return 0;
1746     if (entries >= UINT_MAX / sizeof(int) || entries >= (UINT_MAX - 4) / field_size)
1747         return AVERROR_INVALIDDATA;
1748     sc->sample_sizes = av_malloc(entries * sizeof(int));
1749     if (!sc->sample_sizes)
1750         return AVERROR(ENOMEM);
1751
1752     num_bytes = (entries*field_size+4)>>3;
1753
1754     buf = av_malloc(num_bytes+FF_INPUT_BUFFER_PADDING_SIZE);
1755     if (!buf) {
1756         av_freep(&sc->sample_sizes);
1757         return AVERROR(ENOMEM);
1758     }
1759
1760     if (avio_read(pb, buf, num_bytes) < num_bytes) {
1761         av_freep(&sc->sample_sizes);
1762         av_free(buf);
1763         return AVERROR_INVALIDDATA;
1764     }
1765
1766     init_get_bits(&gb, buf, 8*num_bytes);
1767
1768     for (i = 0; i < entries && !pb->eof_reached; i++) {
1769         sc->sample_sizes[i] = get_bits_long(&gb, field_size);
1770         sc->data_size += sc->sample_sizes[i];
1771     }
1772
1773     sc->sample_count = i;
1774
1775     if (pb->eof_reached)
1776         return AVERROR_EOF;
1777
1778     av_free(buf);
1779     return 0;
1780 }
1781
1782 static int mov_read_stts(MOVContext *c, AVIOContext *pb, MOVAtom atom)
1783 {
1784     AVStream *st;
1785     MOVStreamContext *sc;
1786     unsigned int i, entries;
1787     int64_t duration=0;
1788     int64_t total_sample_count=0;
1789
1790     if (c->fc->nb_streams < 1)
1791         return 0;
1792     st = c->fc->streams[c->fc->nb_streams-1];
1793     sc = st->priv_data;
1794
1795     avio_r8(pb); /* version */
1796     avio_rb24(pb); /* flags */
1797     entries = avio_rb32(pb);
1798
1799     av_dlog(c->fc, "track[%i].stts.entries = %i\n",
1800             c->fc->nb_streams-1, entries);
1801
1802     if (entries >= UINT_MAX / sizeof(*sc->stts_data))
1803         return -1;
1804
1805     sc->stts_data = av_malloc(entries * sizeof(*sc->stts_data));
1806     if (!sc->stts_data)
1807         return AVERROR(ENOMEM);
1808
1809     for (i = 0; i < entries && !pb->eof_reached; i++) {
1810         int sample_duration;
1811         int sample_count;
1812
1813         sample_count=avio_rb32(pb);
1814         sample_duration = avio_rb32(pb);
1815         /* sample_duration < 0 is invalid based on the spec */
1816         if (sample_duration < 0) {
1817             av_log(c->fc, AV_LOG_ERROR, "Invalid SampleDelta in STTS %d\n", sample_duration);
1818             sample_duration = 1;
1819         }
1820         sc->stts_data[i].count= sample_count;
1821         sc->stts_data[i].duration= sample_duration;
1822
1823         av_dlog(c->fc, "sample_count=%d, sample_duration=%d\n",
1824                 sample_count, sample_duration);
1825
1826         duration+=(int64_t)sample_duration*sample_count;
1827         total_sample_count+=sample_count;
1828     }
1829
1830     sc->stts_count = i;
1831
1832     if (pb->eof_reached)
1833         return AVERROR_EOF;
1834
1835     st->nb_frames= total_sample_count;
1836     if (duration)
1837         st->duration= duration;
1838     sc->track_end = duration;
1839     return 0;
1840 }
1841
1842 static void mov_update_dts_shift(MOVStreamContext *sc, int duration)
1843 {
1844     if (duration < 0) {
1845         sc->dts_shift = FFMAX(sc->dts_shift, -duration);
1846     }
1847 }
1848
1849 static int mov_read_ctts(MOVContext *c, AVIOContext *pb, MOVAtom atom)
1850 {
1851     AVStream *st;
1852     MOVStreamContext *sc;
1853     unsigned int i, entries;
1854
1855     if (c->fc->nb_streams < 1)
1856         return 0;
1857     st = c->fc->streams[c->fc->nb_streams-1];
1858     sc = st->priv_data;
1859
1860     avio_r8(pb); /* version */
1861     avio_rb24(pb); /* flags */
1862     entries = avio_rb32(pb);
1863
1864     av_dlog(c->fc, "track[%i].ctts.entries = %i\n", c->fc->nb_streams-1, entries);
1865
1866     if (!entries)
1867         return 0;
1868     if (entries >= UINT_MAX / sizeof(*sc->ctts_data))
1869         return AVERROR_INVALIDDATA;
1870     sc->ctts_data = av_malloc(entries * sizeof(*sc->ctts_data));
1871     if (!sc->ctts_data)
1872         return AVERROR(ENOMEM);
1873
1874     for (i = 0; i < entries && !pb->eof_reached; i++) {
1875         int count    =avio_rb32(pb);
1876         int duration =avio_rb32(pb);
1877
1878         sc->ctts_data[i].count   = count;
1879         sc->ctts_data[i].duration= duration;
1880
1881         av_dlog(c->fc, "count=%d, duration=%d\n",
1882                 count, duration);
1883
1884         if (FFABS(duration) > (1<<28) && i+2<entries) {
1885             av_log(c->fc, AV_LOG_WARNING, "CTTS invalid\n");
1886             av_freep(&sc->ctts_data);
1887             sc->ctts_count = 0;
1888             return 0;
1889         }
1890
1891         if (i+2<entries)
1892             mov_update_dts_shift(sc, duration);
1893     }
1894
1895     sc->ctts_count = i;
1896
1897     if (pb->eof_reached)
1898         return AVERROR_EOF;
1899
1900     av_dlog(c->fc, "dts shift %d\n", sc->dts_shift);
1901
1902     return 0;
1903 }
1904
1905 static int mov_read_sbgp(MOVContext *c, AVIOContext *pb, MOVAtom atom)
1906 {
1907     AVStream *st;
1908     MOVStreamContext *sc;
1909     unsigned int i, entries;
1910     uint8_t version;
1911     uint32_t grouping_type;
1912
1913     if (c->fc->nb_streams < 1)
1914         return 0;
1915     st = c->fc->streams[c->fc->nb_streams-1];
1916     sc = st->priv_data;
1917
1918     version = avio_r8(pb); /* version */
1919     avio_rb24(pb); /* flags */
1920     grouping_type = avio_rl32(pb);
1921     if (grouping_type != MKTAG( 'r','a','p',' '))
1922         return 0; /* only support 'rap ' grouping */
1923     if (version == 1)
1924         avio_rb32(pb); /* grouping_type_parameter */
1925
1926     entries = avio_rb32(pb);
1927     if (!entries)
1928         return 0;
1929     if (entries >= UINT_MAX / sizeof(*sc->rap_group))
1930         return AVERROR_INVALIDDATA;
1931     sc->rap_group = av_malloc(entries * sizeof(*sc->rap_group));
1932     if (!sc->rap_group)
1933         return AVERROR(ENOMEM);
1934
1935     for (i = 0; i < entries && !pb->eof_reached; i++) {
1936         sc->rap_group[i].count = avio_rb32(pb); /* sample_count */
1937         sc->rap_group[i].index = avio_rb32(pb); /* group_description_index */
1938     }
1939
1940     sc->rap_group_count = i;
1941
1942     return pb->eof_reached ? AVERROR_EOF : 0;
1943 }
1944
1945 static void mov_build_index(MOVContext *mov, AVStream *st)
1946 {
1947     MOVStreamContext *sc = st->priv_data;
1948     int64_t current_offset;
1949     int64_t current_dts = 0;
1950     unsigned int stts_index = 0;
1951     unsigned int stsc_index = 0;
1952     unsigned int stss_index = 0;
1953     unsigned int stps_index = 0;
1954     unsigned int i, j;
1955     uint64_t stream_size = 0;
1956     AVIndexEntry *mem;
1957
1958     /* adjust first dts according to edit list */
1959     if ((sc->empty_duration || sc->start_time) && mov->time_scale > 0) {
1960         if (sc->empty_duration)
1961             sc->empty_duration = av_rescale(sc->empty_duration, sc->time_scale, mov->time_scale);
1962         sc->time_offset = sc->start_time - sc->empty_duration;
1963         current_dts = -sc->time_offset;
1964         if (sc->ctts_count>0 && sc->stts_count>0 &&
1965             sc->ctts_data[0].duration / FFMAX(sc->stts_data[0].duration, 1) > 16) {
1966             /* more than 16 frames delay, dts are likely wrong
1967                this happens with files created by iMovie */
1968             sc->wrong_dts = 1;
1969             st->codec->has_b_frames = 1;
1970         }
1971     }
1972
1973     /* only use old uncompressed audio chunk demuxing when stts specifies it */
1974     if (!(st->codec->codec_type == AVMEDIA_TYPE_AUDIO &&
1975           sc->stts_count == 1 && sc->stts_data[0].duration == 1)) {
1976         unsigned int current_sample = 0;
1977         unsigned int stts_sample = 0;
1978         unsigned int sample_size;
1979         unsigned int distance = 0;
1980         unsigned int rap_group_index = 0;
1981         unsigned int rap_group_sample = 0;
1982         int rap_group_present = sc->rap_group_count && sc->rap_group;
1983         int key_off = (sc->keyframe_count && sc->keyframes[0] > 0) || (sc->stps_count && sc->stps_data[0] > 0);
1984
1985         current_dts -= sc->dts_shift;
1986
1987         if (!sc->sample_count || st->nb_index_entries)
1988             return;
1989         if (sc->sample_count >= UINT_MAX / sizeof(*st->index_entries) - st->nb_index_entries)
1990             return;
1991         mem = av_realloc(st->index_entries, (st->nb_index_entries + sc->sample_count) * sizeof(*st->index_entries));
1992         if (!mem)
1993             return;
1994         st->index_entries = mem;
1995         st->index_entries_allocated_size = (st->nb_index_entries + sc->sample_count) * sizeof(*st->index_entries);
1996
1997         for (i = 0; i < sc->chunk_count; i++) {
1998             int64_t next_offset = i+1 < sc->chunk_count ? sc->chunk_offsets[i+1] : INT64_MAX;
1999             current_offset = sc->chunk_offsets[i];
2000             while (stsc_index + 1 < sc->stsc_count &&
2001                 i + 1 == sc->stsc_data[stsc_index + 1].first)
2002                 stsc_index++;
2003
2004             if (next_offset > current_offset && sc->sample_size>0 && sc->sample_size < sc->stsz_sample_size &&
2005                 sc->stsc_data[stsc_index].count * (int64_t)sc->stsz_sample_size > next_offset - current_offset) {
2006                 av_log(mov->fc, AV_LOG_WARNING, "STSZ sample size %d invalid (too large), ignoring\n", sc->stsz_sample_size);
2007                 sc->stsz_sample_size = sc->sample_size;
2008             }
2009             if (sc->stsz_sample_size>0 && sc->stsz_sample_size < sc->sample_size) {
2010                 av_log(mov->fc, AV_LOG_WARNING, "STSZ sample size %d invalid (too small), ignoring\n", sc->stsz_sample_size);
2011                 sc->stsz_sample_size = sc->sample_size;
2012             }
2013
2014             for (j = 0; j < sc->stsc_data[stsc_index].count; j++) {
2015                 int keyframe = 0;
2016                 if (current_sample >= sc->sample_count) {
2017                     av_log(mov->fc, AV_LOG_ERROR, "wrong sample count\n");
2018                     return;
2019                 }
2020
2021                 if (!sc->keyframe_absent && (!sc->keyframe_count || current_sample+key_off == sc->keyframes[stss_index])) {
2022                     keyframe = 1;
2023                     if (stss_index + 1 < sc->keyframe_count)
2024                         stss_index++;
2025                 } else if (sc->stps_count && current_sample+key_off == sc->stps_data[stps_index]) {
2026                     keyframe = 1;
2027                     if (stps_index + 1 < sc->stps_count)
2028                         stps_index++;
2029                 }
2030                 if (rap_group_present && rap_group_index < sc->rap_group_count) {
2031                     if (sc->rap_group[rap_group_index].index > 0)
2032                         keyframe = 1;
2033                     if (++rap_group_sample == sc->rap_group[rap_group_index].count) {
2034                         rap_group_sample = 0;
2035                         rap_group_index++;
2036                     }
2037                 }
2038                 if (keyframe)
2039                     distance = 0;
2040                 sample_size = sc->stsz_sample_size > 0 ? sc->stsz_sample_size : sc->sample_sizes[current_sample];
2041                 if (sc->pseudo_stream_id == -1 ||
2042                    sc->stsc_data[stsc_index].id - 1 == sc->pseudo_stream_id) {
2043                     AVIndexEntry *e = &st->index_entries[st->nb_index_entries++];
2044                     e->pos = current_offset;
2045                     e->timestamp = current_dts;
2046                     e->size = sample_size;
2047                     e->min_distance = distance;
2048                     e->flags = keyframe ? AVINDEX_KEYFRAME : 0;
2049                     av_dlog(mov->fc, "AVIndex stream %d, sample %d, offset %"PRIx64", dts %"PRId64", "
2050                             "size %d, distance %d, keyframe %d\n", st->index, current_sample,
2051                             current_offset, current_dts, sample_size, distance, keyframe);
2052                 }
2053
2054                 current_offset += sample_size;
2055                 stream_size += sample_size;
2056                 current_dts += sc->stts_data[stts_index].duration;
2057                 distance++;
2058                 stts_sample++;
2059                 current_sample++;
2060                 if (stts_index + 1 < sc->stts_count && stts_sample == sc->stts_data[stts_index].count) {
2061                     stts_sample = 0;
2062                     stts_index++;
2063                 }
2064             }
2065         }
2066         if (st->duration > 0)
2067             st->codec->bit_rate = stream_size*8*sc->time_scale/st->duration;
2068     } else {
2069         unsigned chunk_samples, total = 0;
2070
2071         // compute total chunk count
2072         for (i = 0; i < sc->stsc_count; i++) {
2073             unsigned count, chunk_count;
2074
2075             chunk_samples = sc->stsc_data[i].count;
2076             if (i != sc->stsc_count - 1 &&
2077                 sc->samples_per_frame && chunk_samples % sc->samples_per_frame) {
2078                 av_log(mov->fc, AV_LOG_ERROR, "error unaligned chunk\n");
2079                 return;
2080             }
2081
2082             if (sc->samples_per_frame >= 160) { // gsm
2083                 count = chunk_samples / sc->samples_per_frame;
2084             } else if (sc->samples_per_frame > 1) {
2085                 unsigned samples = (1024/sc->samples_per_frame)*sc->samples_per_frame;
2086                 count = (chunk_samples+samples-1) / samples;
2087             } else {
2088                 count = (chunk_samples+1023) / 1024;
2089             }
2090
2091             if (i < sc->stsc_count - 1)
2092                 chunk_count = sc->stsc_data[i+1].first - sc->stsc_data[i].first;
2093             else
2094                 chunk_count = sc->chunk_count - (sc->stsc_data[i].first - 1);
2095             total += chunk_count * count;
2096         }
2097
2098         av_dlog(mov->fc, "chunk count %d\n", total);
2099         if (total >= UINT_MAX / sizeof(*st->index_entries) - st->nb_index_entries)
2100             return;
2101         mem = av_realloc(st->index_entries, (st->nb_index_entries + total) * sizeof(*st->index_entries));
2102         if (!mem)
2103             return;
2104         st->index_entries = mem;
2105         st->index_entries_allocated_size = (st->nb_index_entries + total) * sizeof(*st->index_entries);
2106
2107         // populate index
2108         for (i = 0; i < sc->chunk_count; i++) {
2109             current_offset = sc->chunk_offsets[i];
2110             if (stsc_index + 1 < sc->stsc_count &&
2111                 i + 1 == sc->stsc_data[stsc_index + 1].first)
2112                 stsc_index++;
2113             chunk_samples = sc->stsc_data[stsc_index].count;
2114
2115             while (chunk_samples > 0) {
2116                 AVIndexEntry *e;
2117                 unsigned size, samples;
2118
2119                 if (sc->samples_per_frame >= 160) { // gsm
2120                     samples = sc->samples_per_frame;
2121                     size = sc->bytes_per_frame;
2122                 } else {
2123                     if (sc->samples_per_frame > 1) {
2124                         samples = FFMIN((1024 / sc->samples_per_frame)*
2125                                         sc->samples_per_frame, chunk_samples);
2126                         size = (samples / sc->samples_per_frame) * sc->bytes_per_frame;
2127                     } else {
2128                         samples = FFMIN(1024, chunk_samples);
2129                         size = samples * sc->sample_size;
2130                     }
2131                 }
2132
2133                 if (st->nb_index_entries >= total) {
2134                     av_log(mov->fc, AV_LOG_ERROR, "wrong chunk count %d\n", total);
2135                     return;
2136                 }
2137                 e = &st->index_entries[st->nb_index_entries++];
2138                 e->pos = current_offset;
2139                 e->timestamp = current_dts;
2140                 e->size = size;
2141                 e->min_distance = 0;
2142                 e->flags = AVINDEX_KEYFRAME;
2143                 av_dlog(mov->fc, "AVIndex stream %d, chunk %d, offset %"PRIx64", dts %"PRId64", "
2144                         "size %d, duration %d\n", st->index, i, current_offset, current_dts,
2145                         size, samples);
2146
2147                 current_offset += size;
2148                 current_dts += samples;
2149                 chunk_samples -= samples;
2150             }
2151         }
2152     }
2153 }
2154
2155 static int mov_open_dref(AVIOContext **pb, const char *src, MOVDref *ref,
2156                          AVIOInterruptCB *int_cb, int use_absolute_path, AVFormatContext *fc)
2157 {
2158     /* try relative path, we do not try the absolute because it can leak information about our
2159        system to an attacker */
2160     if (ref->nlvl_to > 0 && ref->nlvl_from > 0) {
2161         char filename[1024];
2162         const char *src_path;
2163         int i, l;
2164
2165         /* find a source dir */
2166         src_path = strrchr(src, '/');
2167         if (src_path)
2168             src_path++;
2169         else
2170             src_path = src;
2171
2172         /* find a next level down to target */
2173         for (i = 0, l = strlen(ref->path) - 1; l >= 0; l--)
2174             if (ref->path[l] == '/') {
2175                 if (i == ref->nlvl_to - 1)
2176                     break;
2177                 else
2178                     i++;
2179             }
2180
2181         /* compose filename if next level down to target was found */
2182         if (i == ref->nlvl_to - 1 && src_path - src  < sizeof(filename)) {
2183             memcpy(filename, src, src_path - src);
2184             filename[src_path - src] = 0;
2185
2186             for (i = 1; i < ref->nlvl_from; i++)
2187                 av_strlcat(filename, "../", 1024);
2188
2189             av_strlcat(filename, ref->path + l + 1, 1024);
2190
2191             if (!avio_open2(pb, filename, AVIO_FLAG_READ, int_cb, NULL))
2192                 return 0;
2193         }
2194     } else if (use_absolute_path) {
2195         av_log(fc, AV_LOG_WARNING, "Using absolute path on user request, "
2196                "this is a possible security issue\n");
2197         if (!avio_open2(pb, ref->path, AVIO_FLAG_READ, int_cb, NULL))
2198             return 0;
2199     }
2200
2201     return AVERROR(ENOENT);
2202 }
2203
2204 static void fix_timescale(MOVContext *c, MOVStreamContext *sc)
2205 {
2206     if (sc->time_scale <= 0) {
2207         av_log(c->fc, AV_LOG_WARNING, "stream %d, timescale not set\n", sc->ffindex);
2208         sc->time_scale = c->time_scale;
2209         if (sc->time_scale <= 0)
2210             sc->time_scale = 1;
2211     }
2212 }
2213
2214 static int mov_read_trak(MOVContext *c, AVIOContext *pb, MOVAtom atom)
2215 {
2216     AVStream *st;
2217     MOVStreamContext *sc;
2218     int ret;
2219
2220     st = avformat_new_stream(c->fc, NULL);
2221     if (!st) return AVERROR(ENOMEM);
2222     st->id = c->fc->nb_streams;
2223     sc = av_mallocz(sizeof(MOVStreamContext));
2224     if (!sc) return AVERROR(ENOMEM);
2225
2226     st->priv_data = sc;
2227     st->codec->codec_type = AVMEDIA_TYPE_DATA;
2228     sc->ffindex = st->index;
2229
2230     if ((ret = mov_read_default(c, pb, atom)) < 0)
2231         return ret;
2232
2233     /* sanity checks */
2234     if (sc->chunk_count && (!sc->stts_count || !sc->stsc_count ||
2235                             (!sc->sample_size && !sc->sample_count))) {
2236         av_log(c->fc, AV_LOG_ERROR, "stream %d, missing mandatory atoms, broken header\n",
2237                st->index);
2238         return 0;
2239     }
2240
2241     fix_timescale(c, sc);
2242
2243     avpriv_set_pts_info(st, 64, 1, sc->time_scale);
2244
2245     mov_build_index(c, st);
2246
2247     if (sc->dref_id-1 < sc->drefs_count && sc->drefs[sc->dref_id-1].path) {
2248         MOVDref *dref = &sc->drefs[sc->dref_id - 1];
2249         if (mov_open_dref(&sc->pb, c->fc->filename, dref, &c->fc->interrupt_callback,
2250             c->use_absolute_path, c->fc) < 0)
2251             av_log(c->fc, AV_LOG_ERROR,
2252                    "stream %d, error opening alias: path='%s', dir='%s', "
2253                    "filename='%s', volume='%s', nlvl_from=%d, nlvl_to=%d\n",
2254                    st->index, dref->path, dref->dir, dref->filename,
2255                    dref->volume, dref->nlvl_from, dref->nlvl_to);
2256     } else {
2257         sc->pb = c->fc->pb;
2258         sc->pb_is_copied = 1;
2259     }
2260
2261     if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO) {
2262         if (!st->sample_aspect_ratio.num &&
2263             (st->codec->width != sc->width || st->codec->height != sc->height)) {
2264             st->sample_aspect_ratio = av_d2q(((double)st->codec->height * sc->width) /
2265                                              ((double)st->codec->width * sc->height), INT_MAX);
2266         }
2267
2268         if (st->duration > 0)
2269             av_reduce(&st->avg_frame_rate.num, &st->avg_frame_rate.den,
2270                       sc->time_scale*st->nb_frames, st->duration, INT_MAX);
2271
2272 #if FF_API_R_FRAME_RATE
2273         if (sc->stts_count == 1 || (sc->stts_count == 2 && sc->stts_data[1].count == 1))
2274             av_reduce(&st->r_frame_rate.num, &st->r_frame_rate.den,
2275                       sc->time_scale, sc->stts_data[0].duration, INT_MAX);
2276 #endif
2277     }
2278
2279     // done for ai5q, ai52, ai55, ai1q, ai12 and ai15.
2280     if (!st->codec->extradata_size && st->codec->codec_id == AV_CODEC_ID_H264 &&
2281         st->codec->codec_tag != MKTAG('a', 'v', 'c', '1')) {
2282         ff_generate_avci_extradata(st);
2283     }
2284
2285     switch (st->codec->codec_id) {
2286 #if CONFIG_H261_DECODER
2287     case AV_CODEC_ID_H261:
2288 #endif
2289 #if CONFIG_H263_DECODER
2290     case AV_CODEC_ID_H263:
2291 #endif
2292 #if CONFIG_MPEG4_DECODER
2293     case AV_CODEC_ID_MPEG4:
2294 #endif
2295         st->codec->width = 0; /* let decoder init width/height */
2296         st->codec->height= 0;
2297         break;
2298     }
2299
2300     /* Do not need those anymore. */
2301     av_freep(&sc->chunk_offsets);
2302     av_freep(&sc->stsc_data);
2303     av_freep(&sc->sample_sizes);
2304     av_freep(&sc->keyframes);
2305     av_freep(&sc->stts_data);
2306     av_freep(&sc->stps_data);
2307     av_freep(&sc->rap_group);
2308
2309     return 0;
2310 }
2311
2312 static int mov_read_ilst(MOVContext *c, AVIOContext *pb, MOVAtom atom)
2313 {
2314     int ret;
2315     c->itunes_metadata = 1;
2316     ret = mov_read_default(c, pb, atom);
2317     c->itunes_metadata = 0;
2318     return ret;
2319 }
2320
2321 static int mov_read_meta(MOVContext *c, AVIOContext *pb, MOVAtom atom)
2322 {
2323     while (atom.size > 8) {
2324         uint32_t tag = avio_rl32(pb);
2325         atom.size -= 4;
2326         if (tag == MKTAG('h','d','l','r')) {
2327             avio_seek(pb, -8, SEEK_CUR);
2328             atom.size += 8;
2329             return mov_read_default(c, pb, atom);
2330         }
2331     }
2332     return 0;
2333 }
2334
2335 static int mov_read_tkhd(MOVContext *c, AVIOContext *pb, MOVAtom atom)
2336 {
2337     int i;
2338     int width;
2339     int height;
2340     int64_t disp_transform[2];
2341     int display_matrix[3][2];
2342     AVStream *st;
2343     MOVStreamContext *sc;
2344     int version;
2345
2346     if (c->fc->nb_streams < 1)
2347         return 0;
2348     st = c->fc->streams[c->fc->nb_streams-1];
2349     sc = st->priv_data;
2350
2351     version = avio_r8(pb);
2352     avio_rb24(pb); /* flags */
2353     /*
2354     MOV_TRACK_ENABLED 0x0001
2355     MOV_TRACK_IN_MOVIE 0x0002
2356     MOV_TRACK_IN_PREVIEW 0x0004
2357     MOV_TRACK_IN_POSTER 0x0008
2358     */
2359
2360     if (version == 1) {
2361         avio_rb64(pb);
2362         avio_rb64(pb);
2363     } else {
2364         avio_rb32(pb); /* creation time */
2365         avio_rb32(pb); /* modification time */
2366     }
2367     st->id = (int)avio_rb32(pb); /* track id (NOT 0 !)*/
2368     avio_rb32(pb); /* reserved */
2369
2370     /* highlevel (considering edits) duration in movie timebase */
2371     (version == 1) ? avio_rb64(pb) : avio_rb32(pb);
2372     avio_rb32(pb); /* reserved */
2373     avio_rb32(pb); /* reserved */
2374
2375     avio_rb16(pb); /* layer */
2376     avio_rb16(pb); /* alternate group */
2377     avio_rb16(pb); /* volume */
2378     avio_rb16(pb); /* reserved */
2379
2380     //read in the display matrix (outlined in ISO 14496-12, Section 6.2.2)
2381     // they're kept in fixed point format through all calculations
2382     // ignore u,v,z b/c we don't need the scale factor to calc aspect ratio
2383     for (i = 0; i < 3; i++) {
2384         display_matrix[i][0] = avio_rb32(pb);   // 16.16 fixed point
2385         display_matrix[i][1] = avio_rb32(pb);   // 16.16 fixed point
2386         avio_rb32(pb);           // 2.30 fixed point (not used)
2387     }
2388
2389     width = avio_rb32(pb);       // 16.16 fixed point track width
2390     height = avio_rb32(pb);      // 16.16 fixed point track height
2391     sc->width = width >> 16;
2392     sc->height = height >> 16;
2393
2394     //Assign clockwise rotate values based on transform matrix so that
2395     //we can compensate for iPhone orientation during capture.
2396
2397     if (display_matrix[1][0] == -65536 && display_matrix[0][1] == 65536) {
2398          av_dict_set(&st->metadata, "rotate", "90", 0);
2399     }
2400
2401     if (display_matrix[0][0] == -65536 && display_matrix[1][1] == -65536) {
2402          av_dict_set(&st->metadata, "rotate", "180", 0);
2403     }
2404
2405     if (display_matrix[1][0] == 65536 && display_matrix[0][1] == -65536) {
2406          av_dict_set(&st->metadata, "rotate", "270", 0);
2407     }
2408
2409     // transform the display width/height according to the matrix
2410     // skip this if the display matrix is the default identity matrix
2411     // or if it is rotating the picture, ex iPhone 3GS
2412     // to keep the same scale, use [width height 1<<16]
2413     if (width && height &&
2414         ((display_matrix[0][0] != 65536  ||
2415           display_matrix[1][1] != 65536) &&
2416          !display_matrix[0][1] &&
2417          !display_matrix[1][0] &&
2418          !display_matrix[2][0] && !display_matrix[2][1])) {
2419         for (i = 0; i < 2; i++)
2420             disp_transform[i] =
2421                 (int64_t)  width  * display_matrix[0][i] +
2422                 (int64_t)  height * display_matrix[1][i] +
2423                 ((int64_t) display_matrix[2][i] << 16);
2424
2425         //sample aspect ratio is new width/height divided by old width/height
2426         st->sample_aspect_ratio = av_d2q(
2427             ((double) disp_transform[0] * height) /
2428             ((double) disp_transform[1] * width), INT_MAX);
2429     }
2430     return 0;
2431 }
2432
2433 static int mov_read_tfhd(MOVContext *c, AVIOContext *pb, MOVAtom atom)
2434 {
2435     MOVFragment *frag = &c->fragment;
2436     MOVTrackExt *trex = NULL;
2437     int flags, track_id, i;
2438
2439     avio_r8(pb); /* version */
2440     flags = avio_rb24(pb);
2441
2442     track_id = avio_rb32(pb);
2443     if (!track_id)
2444         return AVERROR_INVALIDDATA;
2445     frag->track_id = track_id;
2446     for (i = 0; i < c->trex_count; i++)
2447         if (c->trex_data[i].track_id == frag->track_id) {
2448             trex = &c->trex_data[i];
2449             break;
2450         }
2451     if (!trex) {
2452         av_log(c->fc, AV_LOG_ERROR, "could not find corresponding trex\n");
2453         return AVERROR_INVALIDDATA;
2454     }
2455
2456     frag->base_data_offset = flags & MOV_TFHD_BASE_DATA_OFFSET ?
2457                              avio_rb64(pb) : frag->moof_offset;
2458     frag->stsd_id  = flags & MOV_TFHD_STSD_ID ? avio_rb32(pb) : trex->stsd_id;
2459
2460     frag->duration = flags & MOV_TFHD_DEFAULT_DURATION ?
2461                      avio_rb32(pb) : trex->duration;
2462     frag->size     = flags & MOV_TFHD_DEFAULT_SIZE ?
2463                      avio_rb32(pb) : trex->size;
2464     frag->flags    = flags & MOV_TFHD_DEFAULT_FLAGS ?
2465                      avio_rb32(pb) : trex->flags;
2466     av_dlog(c->fc, "frag flags 0x%x\n", frag->flags);
2467     return 0;
2468 }
2469
2470 static int mov_read_chap(MOVContext *c, AVIOContext *pb, MOVAtom atom)
2471 {
2472     c->chapter_track = avio_rb32(pb);
2473     return 0;
2474 }
2475
2476 static int mov_read_trex(MOVContext *c, AVIOContext *pb, MOVAtom atom)
2477 {
2478     MOVTrackExt *trex;
2479
2480     if ((uint64_t)c->trex_count+1 >= UINT_MAX / sizeof(*c->trex_data))
2481         return AVERROR_INVALIDDATA;
2482     trex = av_realloc(c->trex_data, (c->trex_count+1)*sizeof(*c->trex_data));
2483     if (!trex)
2484         return AVERROR(ENOMEM);
2485
2486     c->fc->duration = AV_NOPTS_VALUE; // the duration from mvhd is not representing the whole file when fragments are used.
2487
2488     c->trex_data = trex;
2489     trex = &c->trex_data[c->trex_count++];
2490     avio_r8(pb); /* version */
2491     avio_rb24(pb); /* flags */
2492     trex->track_id = avio_rb32(pb);
2493     trex->stsd_id  = avio_rb32(pb);
2494     trex->duration = avio_rb32(pb);
2495     trex->size     = avio_rb32(pb);
2496     trex->flags    = avio_rb32(pb);
2497     return 0;
2498 }
2499
2500 static int mov_read_trun(MOVContext *c, AVIOContext *pb, MOVAtom atom)
2501 {
2502     MOVFragment *frag = &c->fragment;
2503     AVStream *st = NULL;
2504     MOVStreamContext *sc;
2505     MOVStts *ctts_data;
2506     uint64_t offset;
2507     int64_t dts;
2508     int data_offset = 0;
2509     unsigned entries, first_sample_flags = frag->flags;
2510     int flags, distance, i, found_keyframe = 0;
2511
2512     for (i = 0; i < c->fc->nb_streams; i++) {
2513         if (c->fc->streams[i]->id == frag->track_id) {
2514             st = c->fc->streams[i];
2515             break;
2516         }
2517     }
2518     if (!st) {
2519         av_log(c->fc, AV_LOG_ERROR, "could not find corresponding track id %d\n", frag->track_id);
2520         return AVERROR_INVALIDDATA;
2521     }
2522     sc = st->priv_data;
2523     if (sc->pseudo_stream_id+1 != frag->stsd_id)
2524         return 0;
2525     avio_r8(pb); /* version */
2526     flags = avio_rb24(pb);
2527     entries = avio_rb32(pb);
2528     av_dlog(c->fc, "flags 0x%x entries %d\n", flags, entries);
2529
2530     /* Always assume the presence of composition time offsets.
2531      * Without this assumption, for instance, we cannot deal with a track in fragmented movies that meet the following.
2532      *  1) in the initial movie, there are no samples.
2533      *  2) in the first movie fragment, there is only one sample without composition time offset.
2534      *  3) in the subsequent movie fragments, there are samples with composition time offset. */
2535     if (!sc->ctts_count && sc->sample_count)
2536     {
2537         /* Complement ctts table if moov atom doesn't have ctts atom. */
2538         ctts_data = av_malloc(sizeof(*sc->ctts_data));
2539         if (!ctts_data)
2540             return AVERROR(ENOMEM);
2541         sc->ctts_data = ctts_data;
2542         sc->ctts_data[sc->ctts_count].count = sc->sample_count;
2543         sc->ctts_data[sc->ctts_count].duration = 0;
2544         sc->ctts_count++;
2545     }
2546     if ((uint64_t)entries+sc->ctts_count >= UINT_MAX/sizeof(*sc->ctts_data))
2547         return AVERROR_INVALIDDATA;
2548     ctts_data = av_realloc(sc->ctts_data,
2549                            (entries+sc->ctts_count)*sizeof(*sc->ctts_data));
2550     if (!ctts_data)
2551         return AVERROR(ENOMEM);
2552     sc->ctts_data = ctts_data;
2553
2554     if (flags & MOV_TRUN_DATA_OFFSET)        data_offset        = avio_rb32(pb);
2555     if (flags & MOV_TRUN_FIRST_SAMPLE_FLAGS) first_sample_flags = avio_rb32(pb);
2556     dts    = sc->track_end - sc->time_offset;
2557     offset = frag->base_data_offset + data_offset;
2558     distance = 0;
2559     av_dlog(c->fc, "first sample flags 0x%x\n", first_sample_flags);
2560     for (i = 0; i < entries && !pb->eof_reached; i++) {
2561         unsigned sample_size = frag->size;
2562         int sample_flags = i ? frag->flags : first_sample_flags;
2563         unsigned sample_duration = frag->duration;
2564         int keyframe = 0;
2565
2566         if (flags & MOV_TRUN_SAMPLE_DURATION) sample_duration = avio_rb32(pb);
2567         if (flags & MOV_TRUN_SAMPLE_SIZE)     sample_size     = avio_rb32(pb);
2568         if (flags & MOV_TRUN_SAMPLE_FLAGS)    sample_flags    = avio_rb32(pb);
2569         sc->ctts_data[sc->ctts_count].count = 1;
2570         sc->ctts_data[sc->ctts_count].duration = (flags & MOV_TRUN_SAMPLE_CTS) ?
2571                                                   avio_rb32(pb) : 0;
2572         mov_update_dts_shift(sc, sc->ctts_data[sc->ctts_count].duration);
2573         sc->ctts_count++;
2574         if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO)
2575             keyframe = 1;
2576         else if (!found_keyframe)
2577             keyframe = found_keyframe =
2578                 !(sample_flags & (MOV_FRAG_SAMPLE_FLAG_IS_NON_SYNC |
2579                                   MOV_FRAG_SAMPLE_FLAG_DEPENDS_YES));
2580         if (keyframe)
2581             distance = 0;
2582         av_add_index_entry(st, offset, dts, sample_size, distance,
2583                            keyframe ? AVINDEX_KEYFRAME : 0);
2584         av_dlog(c->fc, "AVIndex stream %d, sample %d, offset %"PRIx64", dts %"PRId64", "
2585                 "size %d, distance %d, keyframe %d\n", st->index, sc->sample_count+i,
2586                 offset, dts, sample_size, distance, keyframe);
2587         distance++;
2588         dts += sample_duration;
2589         offset += sample_size;
2590         sc->data_size += sample_size;
2591     }
2592
2593     if (pb->eof_reached)
2594         return AVERROR_EOF;
2595
2596     frag->moof_offset = offset;
2597     st->duration = sc->track_end = dts + sc->time_offset;
2598     return 0;
2599 }
2600
2601 /* this atom should be null (from specs), but some buggy files put the 'moov' atom inside it... */
2602 /* like the files created with Adobe Premiere 5.0, for samples see */
2603 /* http://graphics.tudelft.nl/~wouter/publications/soundtests/ */
2604 static int mov_read_wide(MOVContext *c, AVIOContext *pb, MOVAtom atom)
2605 {
2606     int err;
2607
2608     if (atom.size < 8)
2609         return 0; /* continue */
2610     if (avio_rb32(pb) != 0) { /* 0 sized mdat atom... use the 'wide' atom size */
2611         avio_skip(pb, atom.size - 4);
2612         return 0;
2613     }
2614     atom.type = avio_rl32(pb);
2615     atom.size -= 8;
2616     if (atom.type != MKTAG('m','d','a','t')) {
2617         avio_skip(pb, atom.size);
2618         return 0;
2619     }
2620     err = mov_read_mdat(c, pb, atom);
2621     return err;
2622 }
2623
2624 static int mov_read_cmov(MOVContext *c, AVIOContext *pb, MOVAtom atom)
2625 {
2626 #if CONFIG_ZLIB
2627     AVIOContext ctx;
2628     uint8_t *cmov_data;
2629     uint8_t *moov_data; /* uncompressed data */
2630     long cmov_len, moov_len;
2631     int ret = -1;
2632
2633     avio_rb32(pb); /* dcom atom */
2634     if (avio_rl32(pb) != MKTAG('d','c','o','m'))
2635         return AVERROR_INVALIDDATA;
2636     if (avio_rl32(pb) != MKTAG('z','l','i','b')) {
2637         av_log(c->fc, AV_LOG_ERROR, "unknown compression for cmov atom !\n");
2638         return AVERROR_INVALIDDATA;
2639     }
2640     avio_rb32(pb); /* cmvd atom */
2641     if (avio_rl32(pb) != MKTAG('c','m','v','d'))
2642         return AVERROR_INVALIDDATA;
2643     moov_len = avio_rb32(pb); /* uncompressed size */
2644     cmov_len = atom.size - 6 * 4;
2645
2646     cmov_data = av_malloc(cmov_len);
2647     if (!cmov_data)
2648         return AVERROR(ENOMEM);
2649     moov_data = av_malloc(moov_len);
2650     if (!moov_data) {
2651         av_free(cmov_data);
2652         return AVERROR(ENOMEM);
2653     }
2654     avio_read(pb, cmov_data, cmov_len);
2655     if (uncompress (moov_data, (uLongf *) &moov_len, (const Bytef *)cmov_data, cmov_len) != Z_OK)
2656         goto free_and_return;
2657     if (ffio_init_context(&ctx, moov_data, moov_len, 0, NULL, NULL, NULL, NULL) != 0)
2658         goto free_and_return;
2659     atom.type = MKTAG('m','o','o','v');
2660     atom.size = moov_len;
2661     ret = mov_read_default(c, &ctx, atom);
2662 free_and_return:
2663     av_free(moov_data);
2664     av_free(cmov_data);
2665     return ret;
2666 #else
2667     av_log(c->fc, AV_LOG_ERROR, "this file requires zlib support compiled in\n");
2668     return AVERROR(ENOSYS);
2669 #endif
2670 }
2671
2672 /* edit list atom */
2673 static int mov_read_elst(MOVContext *c, AVIOContext *pb, MOVAtom atom)
2674 {
2675     MOVStreamContext *sc;
2676     int i, edit_count, version, edit_start_index = 0;
2677     int unsupported = 0;
2678
2679     if (c->fc->nb_streams < 1 || c->ignore_editlist)
2680         return 0;
2681     sc = c->fc->streams[c->fc->nb_streams-1]->priv_data;
2682
2683     version = avio_r8(pb); /* version */
2684     avio_rb24(pb); /* flags */
2685     edit_count = avio_rb32(pb); /* entries */
2686
2687     if ((uint64_t)edit_count*12+8 > atom.size)
2688         return AVERROR_INVALIDDATA;
2689
2690     av_dlog(c->fc, "track[%i].edit_count = %i\n", c->fc->nb_streams-1, edit_count);
2691     for (i=0; i<edit_count; i++){
2692         int64_t time;
2693         int64_t duration;
2694         int rate;
2695         if (version == 1) {
2696             duration = avio_rb64(pb);
2697             time     = avio_rb64(pb);
2698         } else {
2699             duration = avio_rb32(pb); /* segment duration */
2700             time     = (int32_t)avio_rb32(pb); /* media time */
2701         }
2702         rate = avio_rb32(pb);
2703         if (i == 0 && time == -1) {
2704             sc->empty_duration = duration;
2705             edit_start_index = 1;
2706         } else if (i == edit_start_index && time >= 0)
2707             sc->start_time = time;
2708         else
2709             unsupported = 1;
2710
2711         av_dlog(c->fc, "duration=%"PRId64" time=%"PRId64" rate=%f\n",
2712                 duration, time, rate / 65536.0);
2713     }
2714
2715     if (unsupported)
2716         av_log(c->fc, AV_LOG_WARNING, "multiple edit list entries, "
2717                "a/v desync might occur, patch welcome\n");
2718
2719     return 0;
2720 }
2721
2722 static int mov_read_tmcd(MOVContext *c, AVIOContext *pb, MOVAtom atom)
2723 {
2724     MOVStreamContext *sc;
2725
2726     if (c->fc->nb_streams < 1)
2727         return AVERROR_INVALIDDATA;
2728     sc = c->fc->streams[c->fc->nb_streams - 1]->priv_data;
2729     sc->timecode_track = avio_rb32(pb);
2730     return 0;
2731 }
2732
2733 static const MOVParseTableEntry mov_default_parse_table[] = {
2734 { MKTAG('A','C','L','R'), mov_read_avid },
2735 { MKTAG('A','P','R','G'), mov_read_avid },
2736 { MKTAG('A','A','L','P'), mov_read_avid },
2737 { MKTAG('A','R','E','S'), mov_read_avid },
2738 { MKTAG('a','v','s','s'), mov_read_avss },
2739 { MKTAG('c','h','p','l'), mov_read_chpl },
2740 { MKTAG('c','o','6','4'), mov_read_stco },
2741 { MKTAG('c','t','t','s'), mov_read_ctts }, /* composition time to sample */
2742 { MKTAG('d','i','n','f'), mov_read_default },
2743 { MKTAG('d','r','e','f'), mov_read_dref },
2744 { MKTAG('e','d','t','s'), mov_read_default },
2745 { MKTAG('e','l','s','t'), mov_read_elst },
2746 { MKTAG('e','n','d','a'), mov_read_enda },
2747 { MKTAG('f','i','e','l'), mov_read_fiel },
2748 { MKTAG('f','t','y','p'), mov_read_ftyp },
2749 { MKTAG('g','l','b','l'), mov_read_glbl },
2750 { MKTAG('h','d','l','r'), mov_read_hdlr },
2751 { MKTAG('i','l','s','t'), mov_read_ilst },
2752 { MKTAG('j','p','2','h'), mov_read_jp2h },
2753 { MKTAG('m','d','a','t'), mov_read_mdat },
2754 { MKTAG('m','d','h','d'), mov_read_mdhd },
2755 { MKTAG('m','d','i','a'), mov_read_default },
2756 { MKTAG('m','e','t','a'), mov_read_meta },
2757 { MKTAG('m','i','n','f'), mov_read_default },
2758 { MKTAG('m','o','o','f'), mov_read_moof },
2759 { MKTAG('m','o','o','v'), mov_read_moov },
2760 { MKTAG('m','v','e','x'), mov_read_default },
2761 { MKTAG('m','v','h','d'), mov_read_mvhd },
2762 { MKTAG('S','M','I',' '), mov_read_svq3 },
2763 { MKTAG('a','l','a','c'), mov_read_alac }, /* alac specific atom */
2764 { MKTAG('a','v','c','C'), mov_read_glbl },
2765 { MKTAG('p','a','s','p'), mov_read_pasp },
2766 { MKTAG('s','t','b','l'), mov_read_default },
2767 { MKTAG('s','t','c','o'), mov_read_stco },
2768 { MKTAG('s','t','p','s'), mov_read_stps },
2769 { MKTAG('s','t','r','f'), mov_read_strf },
2770 { MKTAG('s','t','s','c'), mov_read_stsc },
2771 { MKTAG('s','t','s','d'), mov_read_stsd }, /* sample description */
2772 { MKTAG('s','t','s','s'), mov_read_stss }, /* sync sample */
2773 { MKTAG('s','t','s','z'), mov_read_stsz }, /* sample size */
2774 { MKTAG('s','t','t','s'), mov_read_stts },
2775 { MKTAG('s','t','z','2'), mov_read_stsz }, /* compact sample size */
2776 { MKTAG('t','k','h','d'), mov_read_tkhd }, /* track header */
2777 { MKTAG('t','f','h','d'), mov_read_tfhd }, /* track fragment header */
2778 { MKTAG('t','r','a','k'), mov_read_trak },
2779 { MKTAG('t','r','a','f'), mov_read_default },
2780 { MKTAG('t','r','e','f'), mov_read_default },
2781 { MKTAG('t','m','c','d'), mov_read_tmcd },
2782 { MKTAG('c','h','a','p'), mov_read_chap },
2783 { MKTAG('t','r','e','x'), mov_read_trex },
2784 { MKTAG('t','r','u','n'), mov_read_trun },
2785 { MKTAG('u','d','t','a'), mov_read_default },
2786 { MKTAG('w','a','v','e'), mov_read_wave },
2787 { MKTAG('e','s','d','s'), mov_read_esds },
2788 { MKTAG('d','a','c','3'), mov_read_dac3 }, /* AC-3 info */
2789 { MKTAG('d','e','c','3'), mov_read_dec3 }, /* EAC-3 info */
2790 { MKTAG('w','i','d','e'), mov_read_wide }, /* place holder */
2791 { MKTAG('w','f','e','x'), mov_read_wfex },
2792 { MKTAG('c','m','o','v'), mov_read_cmov },
2793 { MKTAG('c','h','a','n'), mov_read_chan }, /* channel layout */
2794 { MKTAG('d','v','c','1'), mov_read_dvc1 },
2795 { MKTAG('s','b','g','p'), mov_read_sbgp },
2796 { 0, NULL }
2797 };
2798
2799 static int mov_read_default(MOVContext *c, AVIOContext *pb, MOVAtom atom)
2800 {
2801     int64_t total_size = 0;
2802     MOVAtom a;
2803     int i;
2804
2805     if (atom.size < 0)
2806         atom.size = INT64_MAX;
2807     while (total_size + 8 <= atom.size && !url_feof(pb)) {
2808         int (*parse)(MOVContext*, AVIOContext*, MOVAtom) = NULL;
2809         a.size = atom.size;
2810         a.type=0;
2811         if (atom.size >= 8) {
2812             a.size = avio_rb32(pb);
2813             a.type = avio_rl32(pb);
2814             if (atom.type != MKTAG('r','o','o','t') &&
2815                 atom.type != MKTAG('m','o','o','v'))
2816             {
2817                 if (a.type == MKTAG('t','r','a','k') || a.type == MKTAG('m','d','a','t'))
2818                 {
2819                     av_log(c->fc, AV_LOG_ERROR, "Broken file, trak/mdat not at top-level\n");
2820                     avio_skip(pb, -8);
2821                     return 0;
2822                 }
2823             }
2824             total_size += 8;
2825             if (a.size == 1) { /* 64 bit extended size */
2826                 a.size = avio_rb64(pb) - 8;
2827                 total_size += 8;
2828             }
2829         }
2830         av_dlog(c->fc, "type: %08x '%.4s' parent:'%.4s' sz: %"PRId64" %"PRId64" %"PRId64"\n",
2831                 a.type, (char*)&a.type, (char*)&atom.type, a.size, total_size, atom.size);
2832         if (a.size == 0) {
2833             a.size = atom.size - total_size + 8;
2834         }
2835         a.size -= 8;
2836         if (a.size < 0)
2837             break;
2838         a.size = FFMIN(a.size, atom.size - total_size);
2839
2840         for (i = 0; mov_default_parse_table[i].type; i++)
2841             if (mov_default_parse_table[i].type == a.type) {
2842                 parse = mov_default_parse_table[i].parse;
2843                 break;
2844             }
2845
2846         // container is user data
2847         if (!parse && (atom.type == MKTAG('u','d','t','a') ||
2848                        atom.type == MKTAG('i','l','s','t')))
2849             parse = mov_read_udta_string;
2850
2851         if (!parse) { /* skip leaf atoms data */
2852             avio_skip(pb, a.size);
2853         } else {
2854             int64_t start_pos = avio_tell(pb);
2855             int64_t left;
2856             int err = parse(c, pb, a);
2857             if (err < 0)
2858                 return err;
2859             if (c->found_moov && c->found_mdat &&
2860                 ((!pb->seekable || c->fc->flags & AVFMT_FLAG_IGNIDX) ||
2861                  start_pos + a.size == avio_size(pb))) {
2862                 if (!pb->seekable || c->fc->flags & AVFMT_FLAG_IGNIDX)
2863                     c->next_root_atom = start_pos + a.size;
2864                 return 0;
2865             }
2866             left = a.size - avio_tell(pb) + start_pos;
2867             if (left > 0) /* skip garbage at atom end */
2868                 avio_skip(pb, left);
2869             else if(left < 0) {
2870                 av_log(c->fc, AV_LOG_DEBUG, "undoing overread of %"PRId64" in '%.4s'\n", -left, (char*)&a.type);
2871                 avio_seek(pb, left, SEEK_CUR);
2872             }
2873         }
2874
2875         total_size += a.size;
2876     }
2877
2878     if (total_size < atom.size && atom.size < 0x7ffff)
2879         avio_skip(pb, atom.size - total_size);
2880
2881     return 0;
2882 }
2883
2884 static int mov_probe(AVProbeData *p)
2885 {
2886     int64_t offset;
2887     uint32_t tag;
2888     int score = 0;
2889     int moov_offset = -1;
2890
2891     /* check file header */
2892     offset = 0;
2893     for (;;) {
2894         /* ignore invalid offset */
2895         if ((offset + 8) > (unsigned int)p->buf_size)
2896             break;
2897         tag = AV_RL32(p->buf + offset + 4);
2898         switch(tag) {
2899         /* check for obvious tags */
2900         case MKTAG('m','o','o','v'):
2901             moov_offset = offset + 4;
2902         case MKTAG('j','P',' ',' '): /* jpeg 2000 signature */
2903         case MKTAG('m','d','a','t'):
2904         case MKTAG('p','n','o','t'): /* detect movs with preview pics like ew.mov and april.mov */
2905         case MKTAG('u','d','t','a'): /* Packet Video PVAuthor adds this and a lot of more junk */
2906         case MKTAG('f','t','y','p'):
2907             if (AV_RB32(p->buf+offset) < 8 &&
2908                 (AV_RB32(p->buf+offset) != 1 ||
2909                  offset + 12 > (unsigned int)p->buf_size ||
2910                  AV_RB64(p->buf+offset + 8) == 0)) {
2911                 score = FFMAX(score, AVPROBE_SCORE_EXTENSION);
2912             } else {
2913                 score = AVPROBE_SCORE_MAX;
2914             }
2915             offset = FFMAX(4, AV_RB32(p->buf+offset)) + offset;
2916             break;
2917         /* those are more common words, so rate then a bit less */
2918         case MKTAG('e','d','i','w'): /* xdcam files have reverted first tags */
2919         case MKTAG('w','i','d','e'):
2920         case MKTAG('f','r','e','e'):
2921         case MKTAG('j','u','n','k'):
2922         case MKTAG('p','i','c','t'):
2923             score  = FFMAX(score, AVPROBE_SCORE_MAX - 5);
2924             offset = FFMAX(4, AV_RB32(p->buf+offset)) + offset;
2925             break;
2926         case MKTAG(0x82,0x82,0x7f,0x7d):
2927         case MKTAG('s','k','i','p'):
2928         case MKTAG('u','u','i','d'):
2929         case MKTAG('p','r','f','l'):
2930             /* if we only find those cause probedata is too small at least rate them */
2931             score  = FFMAX(score, AVPROBE_SCORE_EXTENSION);
2932             offset = FFMAX(4, AV_RB32(p->buf+offset)) + offset;
2933             break;
2934         default:
2935             offset = FFMAX(4, AV_RB32(p->buf+offset)) + offset;
2936         }
2937     }
2938     if(score > AVPROBE_SCORE_MAX - 50 && moov_offset != -1) {
2939         /* moov atom in the header - we should make sure that this is not a
2940          * MOV-packed MPEG-PS */
2941         offset = moov_offset;
2942
2943         while(offset < (p->buf_size - 16)){ /* Sufficient space */
2944                /* We found an actual hdlr atom */
2945             if(AV_RL32(p->buf + offset     ) == MKTAG('h','d','l','r') &&
2946                AV_RL32(p->buf + offset +  8) == MKTAG('m','h','l','r') &&
2947                AV_RL32(p->buf + offset + 12) == MKTAG('M','P','E','G')){
2948                 av_log(NULL, AV_LOG_WARNING, "Found media data tag MPEG indicating this is a MOV-packed MPEG-PS.\n");
2949                 /* We found a media handler reference atom describing an
2950                  * MPEG-PS-in-MOV, return a
2951                  * low score to force expanding the probe window until
2952                  * mpegps_probe finds what it needs */
2953                 return 5;
2954             }else
2955                 /* Keep looking */
2956                 offset+=2;
2957         }
2958     }
2959
2960     return score;
2961 }
2962
2963 // must be done after parsing all trak because there's no order requirement
2964 static void mov_read_chapters(AVFormatContext *s)
2965 {
2966     MOVContext *mov = s->priv_data;
2967     AVStream *st = NULL;
2968     MOVStreamContext *sc;
2969     int64_t cur_pos;
2970     int i;
2971
2972     for (i = 0; i < s->nb_streams; i++)
2973         if (s->streams[i]->id == mov->chapter_track) {
2974             st = s->streams[i];
2975             break;
2976         }
2977     if (!st) {
2978         av_log(s, AV_LOG_ERROR, "Referenced QT chapter track not found\n");
2979         return;
2980     }
2981
2982     st->discard = AVDISCARD_ALL;
2983     sc = st->priv_data;
2984     cur_pos = avio_tell(sc->pb);
2985
2986     for (i = 0; i < st->nb_index_entries; i++) {
2987         AVIndexEntry *sample = &st->index_entries[i];
2988         int64_t end = i+1 < st->nb_index_entries ? st->index_entries[i+1].timestamp : st->duration;
2989         uint8_t *title;
2990         uint16_t ch;
2991         int len, title_len;
2992
2993         if (avio_seek(sc->pb, sample->pos, SEEK_SET) != sample->pos) {
2994             av_log(s, AV_LOG_ERROR, "Chapter %d not found in file\n", i);
2995             goto finish;
2996         }
2997
2998         // the first two bytes are the length of the title
2999         len = avio_rb16(sc->pb);
3000         if (len > sample->size-2)
3001             continue;
3002         title_len = 2*len + 1;
3003         if (!(title = av_mallocz(title_len)))
3004             goto finish;
3005
3006         // The samples could theoretically be in any encoding if there's an encd
3007         // atom following, but in practice are only utf-8 or utf-16, distinguished
3008         // instead by the presence of a BOM
3009         if (!len) {
3010             title[0] = 0;
3011         } else {
3012             ch = avio_rb16(sc->pb);
3013             if (ch == 0xfeff)
3014                 avio_get_str16be(sc->pb, len, title, title_len);
3015             else if (ch == 0xfffe)
3016                 avio_get_str16le(sc->pb, len, title, title_len);
3017             else {
3018                 AV_WB16(title, ch);
3019                 if (len == 1 || len == 2)
3020                     title[len] = 0;
3021                 else
3022                     avio_get_str(sc->pb, INT_MAX, title + 2, len - 1);
3023             }
3024         }
3025
3026         avpriv_new_chapter(s, i, st->time_base, sample->timestamp, end, title);
3027         av_freep(&title);
3028     }
3029 finish:
3030     avio_seek(sc->pb, cur_pos, SEEK_SET);
3031 }
3032
3033 static int parse_timecode_in_framenum_format(AVFormatContext *s, AVStream *st,
3034                                              uint32_t value, int flags)
3035 {
3036     AVTimecode tc;
3037     char buf[AV_TIMECODE_STR_SIZE];
3038     AVRational rate = {st->codec->time_base.den,
3039                        st->codec->time_base.num};
3040     int ret = av_timecode_init(&tc, rate, flags, 0, s);
3041     if (ret < 0)
3042         return ret;
3043     av_dict_set(&st->metadata, "timecode",
3044                 av_timecode_make_string(&tc, buf, value), 0);
3045     return 0;
3046 }
3047
3048 static int mov_read_timecode_track(AVFormatContext *s, AVStream *st)
3049 {
3050     MOVStreamContext *sc = st->priv_data;
3051     int flags = 0;
3052     int64_t cur_pos = avio_tell(sc->pb);
3053     uint32_t value;
3054
3055     if (!st->nb_index_entries)
3056         return -1;
3057
3058     avio_seek(sc->pb, st->index_entries->pos, SEEK_SET);
3059     value = avio_rb32(s->pb);
3060
3061     if (sc->tmcd_flags & 0x0001) flags |= AV_TIMECODE_FLAG_DROPFRAME;
3062     if (sc->tmcd_flags & 0x0002) flags |= AV_TIMECODE_FLAG_24HOURSMAX;
3063     if (sc->tmcd_flags & 0x0004) flags |= AV_TIMECODE_FLAG_ALLOWNEGATIVE;
3064
3065     /* Assume Counter flag is set to 1 in tmcd track (even though it is likely
3066      * not the case) and thus assume "frame number format" instead of QT one.
3067      * No sample with tmcd track can be found with a QT timecode at the moment,
3068      * despite what the tmcd track "suggests" (Counter flag set to 0 means QT
3069      * format). */
3070     parse_timecode_in_framenum_format(s, st, value, flags);
3071
3072     avio_seek(sc->pb, cur_pos, SEEK_SET);
3073     return 0;
3074 }
3075
3076 static int mov_read_close(AVFormatContext *s)
3077 {
3078     MOVContext *mov = s->priv_data;
3079     int i, j;
3080
3081     for (i = 0; i < s->nb_streams; i++) {
3082         AVStream *st = s->streams[i];
3083         MOVStreamContext *sc = st->priv_data;
3084
3085         av_freep(&sc->ctts_data);
3086         for (j = 0; j < sc->drefs_count; j++) {
3087             av_freep(&sc->drefs[j].path);
3088             av_freep(&sc->drefs[j].dir);
3089         }
3090         av_freep(&sc->drefs);
3091         if (!sc->pb_is_copied)
3092             avio_close(sc->pb);
3093         sc->pb = NULL;
3094         av_freep(&sc->chunk_offsets);
3095         av_freep(&sc->keyframes);
3096         av_freep(&sc->sample_sizes);
3097         av_freep(&sc->stps_data);
3098         av_freep(&sc->stsc_data);
3099         av_freep(&sc->stts_data);
3100     }
3101
3102     if (mov->dv_demux) {
3103         for (i = 0; i < mov->dv_fctx->nb_streams; i++) {
3104             av_freep(&mov->dv_fctx->streams[i]->codec);
3105             av_freep(&mov->dv_fctx->streams[i]);
3106         }
3107         av_freep(&mov->dv_fctx);
3108         av_freep(&mov->dv_demux);
3109     }
3110
3111     av_freep(&mov->trex_data);
3112
3113     return 0;
3114 }
3115
3116 static int tmcd_is_referenced(AVFormatContext *s, int tmcd_id)
3117 {
3118     int i;
3119
3120     for (i = 0; i < s->nb_streams; i++) {
3121         AVStream *st = s->streams[i];
3122         MOVStreamContext *sc = st->priv_data;
3123
3124         if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO &&
3125             sc->timecode_track == tmcd_id)
3126             return 1;
3127     }
3128     return 0;
3129 }
3130
3131 /* look for a tmcd track not referenced by any video track, and export it globally */
3132 static void export_orphan_timecode(AVFormatContext *s)
3133 {
3134     int i;
3135
3136     for (i = 0; i < s->nb_streams; i++) {
3137         AVStream *st = s->streams[i];
3138
3139         if (st->codec->codec_tag  == MKTAG('t','m','c','d') &&
3140             !tmcd_is_referenced(s, i + 1)) {
3141             AVDictionaryEntry *tcr = av_dict_get(st->metadata, "timecode", NULL, 0);
3142             if (tcr) {
3143                 av_dict_set(&s->metadata, "timecode", tcr->value, 0);
3144                 break;
3145             }
3146         }
3147     }
3148 }
3149
3150 static int mov_read_header(AVFormatContext *s)
3151 {
3152     MOVContext *mov = s->priv_data;
3153     AVIOContext *pb = s->pb;
3154     int i, j, err;
3155     MOVAtom atom = { AV_RL32("root") };
3156
3157     mov->fc = s;
3158     /* .mov and .mp4 aren't streamable anyway (only progressive download if moov is before mdat) */
3159     if (pb->seekable)
3160         atom.size = avio_size(pb);
3161     else
3162         atom.size = INT64_MAX;
3163
3164     /* check MOV header */
3165     if ((err = mov_read_default(mov, pb, atom)) < 0) {
3166         av_log(s, AV_LOG_ERROR, "error reading header: %d\n", err);
3167         mov_read_close(s);
3168         return err;
3169     }
3170     if (!mov->found_moov) {
3171         av_log(s, AV_LOG_ERROR, "moov atom not found\n");
3172         mov_read_close(s);
3173         return AVERROR_INVALIDDATA;
3174     }
3175     av_dlog(mov->fc, "on_parse_exit_offset=%"PRId64"\n", avio_tell(pb));
3176
3177     if (pb->seekable) {
3178         if (mov->chapter_track > 0)
3179             mov_read_chapters(s);
3180         for (i = 0; i < s->nb_streams; i++)
3181             if (s->streams[i]->codec->codec_tag == AV_RL32("tmcd"))
3182                 mov_read_timecode_track(s, s->streams[i]);
3183     }
3184
3185     /* copy timecode metadata from tmcd tracks to the related video streams */
3186     for (i = 0; i < s->nb_streams; i++) {
3187         AVStream *st = s->streams[i];
3188         MOVStreamContext *sc = st->priv_data;
3189         if (sc->timecode_track > 0) {
3190             AVDictionaryEntry *tcr;
3191             int tmcd_st_id = -1;
3192
3193             for (j = 0; j < s->nb_streams; j++)
3194                 if (s->streams[j]->id == sc->timecode_track)
3195                     tmcd_st_id = j;
3196
3197             if (tmcd_st_id < 0 || tmcd_st_id == i)
3198                 continue;
3199             tcr = av_dict_get(s->streams[tmcd_st_id]->metadata, "timecode", NULL, 0);
3200             if (tcr)
3201                 av_dict_set(&st->metadata, "timecode", tcr->value, 0);
3202         }
3203     }
3204     export_orphan_timecode(s);
3205
3206     for (i = 0; i < s->nb_streams; i++) {
3207         AVStream *st = s->streams[i];
3208         MOVStreamContext *sc = st->priv_data;
3209         fix_timescale(mov, sc);
3210         if(st->codec->codec_type == AVMEDIA_TYPE_AUDIO && st->codec->codec_id == AV_CODEC_ID_AAC) {
3211             st->skip_samples = sc->start_pad;
3212         }
3213     }
3214
3215     if (mov->trex_data) {
3216         for (i = 0; i < s->nb_streams; i++) {
3217             AVStream *st = s->streams[i];
3218             MOVStreamContext *sc = st->priv_data;
3219             if (st->duration)
3220                 st->codec->bit_rate = sc->data_size * 8 * sc->time_scale / st->duration;
3221         }
3222     }
3223
3224     return 0;
3225 }
3226
3227 static AVIndexEntry *mov_find_next_sample(AVFormatContext *s, AVStream **st)
3228 {
3229     AVIndexEntry *sample = NULL;
3230     int64_t best_dts = INT64_MAX;
3231     int i;
3232     for (i = 0; i < s->nb_streams; i++) {
3233         AVStream *avst = s->streams[i];
3234         MOVStreamContext *msc = avst->priv_data;
3235         if (msc->pb && msc->current_sample < avst->nb_index_entries) {
3236             AVIndexEntry *current_sample = &avst->index_entries[msc->current_sample];
3237             int64_t dts = av_rescale(current_sample->timestamp, AV_TIME_BASE, msc->time_scale);
3238             av_dlog(s, "stream %d, sample %d, dts %"PRId64"\n", i, msc->current_sample, dts);
3239             if (!sample || (!s->pb->seekable && current_sample->pos < sample->pos) ||
3240                 (s->pb->seekable &&
3241                  ((msc->pb != s->pb && dts < best_dts) || (msc->pb == s->pb &&
3242                  ((FFABS(best_dts - dts) <= AV_TIME_BASE && current_sample->pos < sample->pos) ||
3243                   (FFABS(best_dts - dts) > AV_TIME_BASE && dts < best_dts)))))) {
3244                 sample = current_sample;
3245                 best_dts = dts;
3246                 *st = avst;
3247             }
3248         }
3249     }
3250     return sample;
3251 }
3252
3253 static int mov_read_packet(AVFormatContext *s, AVPacket *pkt)
3254 {
3255     MOVContext *mov = s->priv_data;
3256     MOVStreamContext *sc;
3257     AVIndexEntry *sample;
3258     AVStream *st = NULL;
3259     int ret;
3260     mov->fc = s;
3261  retry:
3262     sample = mov_find_next_sample(s, &st);
3263     if (!sample) {
3264         mov->found_mdat = 0;
3265         if (!mov->next_root_atom)
3266             return AVERROR_EOF;
3267         avio_seek(s->pb, mov->next_root_atom, SEEK_SET);
3268         mov->next_root_atom = 0;
3269         if (mov_read_default(mov, s->pb, (MOVAtom){ AV_RL32("root"), INT64_MAX }) < 0 ||
3270             url_feof(s->pb))
3271             return AVERROR_EOF;
3272         av_dlog(s, "read fragments, offset 0x%"PRIx64"\n", avio_tell(s->pb));
3273         goto retry;
3274     }
3275     sc = st->priv_data;
3276     /* must be done just before reading, to avoid infinite loop on sample */
3277     sc->current_sample++;
3278
3279     if (st->discard != AVDISCARD_ALL) {
3280         if (avio_seek(sc->pb, sample->pos, SEEK_SET) != sample->pos) {
3281             av_log(mov->fc, AV_LOG_ERROR, "stream %d, offset 0x%"PRIx64": partial file\n",
3282                    sc->ffindex, sample->pos);
3283             return AVERROR_INVALIDDATA;
3284         }
3285         ret = av_get_packet(sc->pb, pkt, sample->size);
3286         if (ret < 0)
3287             return ret;
3288         if (sc->has_palette) {
3289             uint8_t *pal;
3290
3291             pal = av_packet_new_side_data(pkt, AV_PKT_DATA_PALETTE, AVPALETTE_SIZE);
3292             if (!pal) {
3293                 av_log(mov->fc, AV_LOG_ERROR, "Cannot append palette to packet\n");
3294             } else {
3295                 memcpy(pal, sc->palette, AVPALETTE_SIZE);
3296                 sc->has_palette = 0;
3297             }
3298         }
3299 #if CONFIG_DV_DEMUXER
3300         if (mov->dv_demux && sc->dv_audio_container) {
3301             avpriv_dv_produce_packet(mov->dv_demux, pkt, pkt->data, pkt->size, pkt->pos);
3302             av_free(pkt->data);
3303             pkt->size = 0;
3304             ret = avpriv_dv_get_packet(mov->dv_demux, pkt);
3305             if (ret < 0)
3306                 return ret;
3307         }
3308 #endif
3309     }
3310
3311     pkt->stream_index = sc->ffindex;
3312     pkt->dts = sample->timestamp;
3313     if (sc->ctts_data && sc->ctts_index < sc->ctts_count) {
3314         pkt->pts = pkt->dts + sc->dts_shift + sc->ctts_data[sc->ctts_index].duration;
3315         /* update ctts context */
3316         sc->ctts_sample++;
3317         if (sc->ctts_index < sc->ctts_count &&
3318             sc->ctts_data[sc->ctts_index].count == sc->ctts_sample) {
3319             sc->ctts_index++;
3320             sc->ctts_sample = 0;
3321         }
3322         if (sc->wrong_dts)
3323             pkt->dts = AV_NOPTS_VALUE;
3324     } else {
3325         int64_t next_dts = (sc->current_sample < st->nb_index_entries) ?
3326             st->index_entries[sc->current_sample].timestamp : st->duration;
3327         pkt->duration = next_dts - pkt->dts;
3328         pkt->pts = pkt->dts;
3329     }
3330     if (st->discard == AVDISCARD_ALL)
3331         goto retry;
3332     pkt->flags |= sample->flags & AVINDEX_KEYFRAME ? AV_PKT_FLAG_KEY : 0;
3333     pkt->pos = sample->pos;
3334     av_dlog(s, "stream %d, pts %"PRId64", dts %"PRId64", pos 0x%"PRIx64", duration %d\n",
3335             pkt->stream_index, pkt->pts, pkt->dts, pkt->pos, pkt->duration);
3336     return 0;
3337 }
3338
3339 static int mov_seek_stream(AVFormatContext *s, AVStream *st, int64_t timestamp, int flags)
3340 {
3341     MOVStreamContext *sc = st->priv_data;
3342     int sample, time_sample;
3343     int i;
3344
3345     sample = av_index_search_timestamp(st, timestamp, flags);
3346     av_dlog(s, "stream %d, timestamp %"PRId64", sample %d\n", st->index, timestamp, sample);
3347     if (sample < 0 && st->nb_index_entries && timestamp < st->index_entries[0].timestamp)
3348         sample = 0;
3349     if (sample < 0) /* not sure what to do */
3350         return AVERROR_INVALIDDATA;
3351     sc->current_sample = sample;
3352     av_dlog(s, "stream %d, found sample %d\n", st->index, sc->current_sample);
3353     /* adjust ctts index */
3354     if (sc->ctts_data) {
3355         time_sample = 0;
3356         for (i = 0; i < sc->ctts_count; i++) {
3357             int next = time_sample + sc->ctts_data[i].count;
3358             if (next > sc->current_sample) {
3359                 sc->ctts_index = i;
3360                 sc->ctts_sample = sc->current_sample - time_sample;
3361                 break;
3362             }
3363             time_sample = next;
3364         }
3365     }
3366     return sample;
3367 }
3368
3369 static int mov_read_seek(AVFormatContext *s, int stream_index, int64_t sample_time, int flags)
3370 {
3371     AVStream *st;
3372     int64_t seek_timestamp, timestamp;
3373     int sample;
3374     int i;
3375
3376     if (stream_index >= s->nb_streams)
3377         return AVERROR_INVALIDDATA;
3378
3379     st = s->streams[stream_index];
3380     sample = mov_seek_stream(s, st, sample_time, flags);
3381     if (sample < 0)
3382         return sample;
3383
3384     /* adjust seek timestamp to found sample timestamp */
3385     seek_timestamp = st->index_entries[sample].timestamp;
3386
3387     for (i = 0; i < s->nb_streams; i++) {
3388         MOVStreamContext *sc = s->streams[i]->priv_data;
3389         st = s->streams[i];
3390         st->skip_samples = (sample_time <= 0) ? sc->start_pad : 0;
3391
3392         if (stream_index == i)
3393             continue;
3394
3395         timestamp = av_rescale_q(seek_timestamp, s->streams[stream_index]->time_base, st->time_base);
3396         mov_seek_stream(s, st, timestamp, flags);
3397     }
3398     return 0;
3399 }
3400
3401 static const AVOption options[] = {
3402     {"use_absolute_path",
3403         "allow using absolute path when opening alias, this is a possible security issue",
3404         offsetof(MOVContext, use_absolute_path), FF_OPT_TYPE_INT, {.i64 = 0},
3405         0, 1, AV_OPT_FLAG_VIDEO_PARAM|AV_OPT_FLAG_DECODING_PARAM},
3406     {"ignore_editlist", "", offsetof(MOVContext, ignore_editlist), FF_OPT_TYPE_INT, {.i64 = 0},
3407         0, 1, AV_OPT_FLAG_VIDEO_PARAM|AV_OPT_FLAG_DECODING_PARAM},
3408     {NULL}
3409 };
3410
3411 static const AVClass class = {
3412     .class_name = "mov,mp4,m4a,3gp,3g2,mj2",
3413     .item_name  = av_default_item_name,
3414     .option     = options,
3415     .version    = LIBAVUTIL_VERSION_INT,
3416 };
3417
3418 AVInputFormat ff_mov_demuxer = {
3419     .name           = "mov,mp4,m4a,3gp,3g2,mj2",
3420     .long_name      = NULL_IF_CONFIG_SMALL("QuickTime / MOV"),
3421     .priv_data_size = sizeof(MOVContext),
3422     .read_probe     = mov_probe,
3423     .read_header    = mov_read_header,
3424     .read_packet    = mov_read_packet,
3425     .read_close     = mov_read_close,
3426     .read_seek      = mov_read_seek,
3427     .priv_class     = &class,
3428     .flags          = AVFMT_NO_BYTE_SEEK,
3429 };