]> git.sesse.net Git - ffmpeg/blob - libavformat/movenc.c
80531d09f768b8d16388d3843b95685d1a249a91
[ffmpeg] / libavformat / movenc.c
1 /*
2  * MOV, 3GP, MP4 muxer
3  * Copyright (c) 2003 Thomas Raivio
4  * Copyright (c) 2004 Gildas Bazin <gbazin at videolan dot org>
5  * Copyright (c) 2009 Baptiste Coudurier <baptiste dot coudurier at gmail dot com>
6  *
7  * This file is part of Libav.
8  *
9  * Libav is free software; you can redistribute it and/or
10  * modify it under the terms of the GNU Lesser General Public
11  * License as published by the Free Software Foundation; either
12  * version 2.1 of the License, or (at your option) any later version.
13  *
14  * Libav is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
17  * Lesser General Public License for more details.
18  *
19  * You should have received a copy of the GNU Lesser General Public
20  * License along with Libav; if not, write to the Free Software
21  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
22  */
23
24 #include <stdint.h>
25 #include <inttypes.h>
26
27 #include "movenc.h"
28 #include "avformat.h"
29 #include "avio_internal.h"
30 #include "riff.h"
31 #include "avio.h"
32 #include "isom.h"
33 #include "avc.h"
34 #include "libavcodec/get_bits.h"
35 #include "libavcodec/put_bits.h"
36 #include "libavcodec/vc1_common.h"
37 #include "internal.h"
38 #include "libavutil/avstring.h"
39 #include "libavutil/intfloat.h"
40 #include "libavutil/mathematics.h"
41 #include "libavutil/opt.h"
42 #include "libavutil/dict.h"
43 #include "hevc.h"
44 #include "rtpenc.h"
45 #include "mov_chan.h"
46
47 #undef NDEBUG
48 #include <assert.h>
49
50 static const AVOption options[] = {
51     { "movflags", "MOV muxer flags", offsetof(MOVMuxContext, flags), AV_OPT_TYPE_FLAGS, {.i64 = 0}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
52     { "rtphint", "Add RTP hint tracks", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_RTP_HINT}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
53     { "empty_moov", "Make the initial moov atom empty", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_EMPTY_MOOV}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
54     { "frag_keyframe", "Fragment at video keyframes", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_FRAG_KEYFRAME}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
55     { "separate_moof", "Write separate moof/mdat atoms for each track", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_SEPARATE_MOOF}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
56     { "frag_custom", "Flush fragments on caller requests", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_FRAG_CUSTOM}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
57     { "isml", "Create a live smooth streaming feed (for pushing to a publishing point)", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_ISML}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
58     { "faststart", "Run a second pass to put the index (moov atom) at the beginning of the file", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_FASTSTART}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
59     { "omit_tfhd_offset", "Omit the base data offset in tfhd atoms", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_OMIT_TFHD_OFFSET}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
60     { "disable_chpl", "Disable Nero chapter atom", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_DISABLE_CHPL}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
61     { "default_base_moof", "Set the default-base-is-moof flag in tfhd atoms", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_DEFAULT_BASE_MOOF}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
62     { "dash", "Write DASH compatible fragmented MP4", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_DASH}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
63     { "frag_discont", "Signal that the next fragment is discontinuous from earlier ones", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_FRAG_DISCONT}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
64     FF_RTP_FLAG_OPTS(MOVMuxContext, rtp_flags),
65     { "skip_iods", "Skip writing iods atom.", offsetof(MOVMuxContext, iods_skip), AV_OPT_TYPE_INT, {.i64 = 0}, 0, 1, AV_OPT_FLAG_ENCODING_PARAM},
66     { "iods_audio_profile", "iods audio profile atom.", offsetof(MOVMuxContext, iods_audio_profile), AV_OPT_TYPE_INT, {.i64 = -1}, -1, 255, AV_OPT_FLAG_ENCODING_PARAM},
67     { "iods_video_profile", "iods video profile atom.", offsetof(MOVMuxContext, iods_video_profile), AV_OPT_TYPE_INT, {.i64 = -1}, -1, 255, AV_OPT_FLAG_ENCODING_PARAM},
68     { "frag_duration", "Maximum fragment duration", offsetof(MOVMuxContext, max_fragment_duration), AV_OPT_TYPE_INT, {.i64 = 0}, 0, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM},
69     { "min_frag_duration", "Minimum fragment duration", offsetof(MOVMuxContext, min_fragment_duration), AV_OPT_TYPE_INT, {.i64 = 0}, 0, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM},
70     { "frag_size", "Maximum fragment size", offsetof(MOVMuxContext, max_fragment_size), AV_OPT_TYPE_INT, {.i64 = 0}, 0, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM},
71     { "ism_lookahead", "Number of lookahead entries for ISM files", offsetof(MOVMuxContext, ism_lookahead), AV_OPT_TYPE_INT, {.i64 = 0}, 0, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM},
72     { "brand",    "Override major brand", offsetof(MOVMuxContext, major_brand),   AV_OPT_TYPE_STRING, {.str = NULL}, .flags = AV_OPT_FLAG_ENCODING_PARAM },
73     { "use_editlist", "use edit list", offsetof(MOVMuxContext, use_editlist), AV_OPT_TYPE_INT, {.i64 = -1}, -1, 1, AV_OPT_FLAG_ENCODING_PARAM},
74     { NULL },
75 };
76
77 #define MOV_CLASS(flavor)\
78 static const AVClass flavor ## _muxer_class = {\
79     .class_name = #flavor " muxer",\
80     .item_name  = av_default_item_name,\
81     .option     = options,\
82     .version    = LIBAVUTIL_VERSION_INT,\
83 };
84
85 static int utf8len(const uint8_t *b)
86 {
87     int len = 0;
88     int val;
89     while (*b) {
90         GET_UTF8(val, *b++, return -1;)
91         len++;
92     }
93     return len;
94 }
95
96 //FIXME support 64 bit variant with wide placeholders
97 static int64_t update_size(AVIOContext *pb, int64_t pos)
98 {
99     int64_t curpos = avio_tell(pb);
100     avio_seek(pb, pos, SEEK_SET);
101     avio_wb32(pb, curpos - pos); /* rewrite size */
102     avio_seek(pb, curpos, SEEK_SET);
103
104     return curpos - pos;
105 }
106
107 static int co64_required(const MOVTrack *track)
108 {
109     if (track->entry > 0 && track->cluster[track->entry - 1].pos + track->data_offset > UINT32_MAX)
110         return 1;
111     return 0;
112 }
113
114 /* Chunk offset atom */
115 static int mov_write_stco_tag(AVIOContext *pb, MOVTrack *track)
116 {
117     int i;
118     int mode64 = co64_required(track); // use 32 bit size variant if possible
119     int64_t pos = avio_tell(pb);
120     avio_wb32(pb, 0); /* size */
121     if (mode64) {
122         ffio_wfourcc(pb, "co64");
123     } else
124         ffio_wfourcc(pb, "stco");
125     avio_wb32(pb, 0); /* version & flags */
126     avio_wb32(pb, track->entry); /* entry count */
127     for (i = 0; i < track->entry; i++) {
128         if (mode64 == 1)
129             avio_wb64(pb, track->cluster[i].pos + track->data_offset);
130         else
131             avio_wb32(pb, track->cluster[i].pos + track->data_offset);
132     }
133     return update_size(pb, pos);
134 }
135
136 /* Sample size atom */
137 static int mov_write_stsz_tag(AVIOContext *pb, MOVTrack *track)
138 {
139     int equalChunks = 1;
140     int i, j, entries = 0, tst = -1, oldtst = -1;
141
142     int64_t pos = avio_tell(pb);
143     avio_wb32(pb, 0); /* size */
144     ffio_wfourcc(pb, "stsz");
145     avio_wb32(pb, 0); /* version & flags */
146
147     for (i = 0; i < track->entry; i++) {
148         tst = track->cluster[i].size / track->cluster[i].entries;
149         if (oldtst != -1 && tst != oldtst)
150             equalChunks = 0;
151         oldtst = tst;
152         entries += track->cluster[i].entries;
153     }
154     if (equalChunks && track->entry) {
155         int sSize = track->entry ? track->cluster[0].size / track->cluster[0].entries : 0;
156         sSize = FFMAX(1, sSize); // adpcm mono case could make sSize == 0
157         avio_wb32(pb, sSize); // sample size
158         avio_wb32(pb, entries); // sample count
159     } else {
160         avio_wb32(pb, 0); // sample size
161         avio_wb32(pb, entries); // sample count
162         for (i = 0; i < track->entry; i++) {
163             for (j = 0; j < track->cluster[i].entries; j++) {
164                 avio_wb32(pb, track->cluster[i].size /
165                           track->cluster[i].entries);
166             }
167         }
168     }
169     return update_size(pb, pos);
170 }
171
172 /* Sample to chunk atom */
173 static int mov_write_stsc_tag(AVIOContext *pb, MOVTrack *track)
174 {
175     int index = 0, oldval = -1, i;
176     int64_t entryPos, curpos;
177
178     int64_t pos = avio_tell(pb);
179     avio_wb32(pb, 0); /* size */
180     ffio_wfourcc(pb, "stsc");
181     avio_wb32(pb, 0); // version & flags
182     entryPos = avio_tell(pb);
183     avio_wb32(pb, track->entry); // entry count
184     for (i = 0; i < track->entry; i++) {
185         if (oldval != track->cluster[i].samples_in_chunk) {
186             avio_wb32(pb, i + 1); // first chunk
187             avio_wb32(pb, track->cluster[i].samples_in_chunk); // samples per chunk
188             avio_wb32(pb, 0x1); // sample description index
189             oldval = track->cluster[i].samples_in_chunk;
190             index++;
191         }
192     }
193     curpos = avio_tell(pb);
194     avio_seek(pb, entryPos, SEEK_SET);
195     avio_wb32(pb, index); // rewrite size
196     avio_seek(pb, curpos, SEEK_SET);
197
198     return update_size(pb, pos);
199 }
200
201 /* Sync sample atom */
202 static int mov_write_stss_tag(AVIOContext *pb, MOVTrack *track, uint32_t flag)
203 {
204     int64_t curpos, entryPos;
205     int i, index = 0;
206     int64_t pos = avio_tell(pb);
207     avio_wb32(pb, 0); // size
208     ffio_wfourcc(pb, flag == MOV_SYNC_SAMPLE ? "stss" : "stps");
209     avio_wb32(pb, 0); // version & flags
210     entryPos = avio_tell(pb);
211     avio_wb32(pb, track->entry); // entry count
212     for (i = 0; i < track->entry; i++) {
213         if (track->cluster[i].flags & flag) {
214             avio_wb32(pb, i + 1);
215             index++;
216         }
217     }
218     curpos = avio_tell(pb);
219     avio_seek(pb, entryPos, SEEK_SET);
220     avio_wb32(pb, index); // rewrite size
221     avio_seek(pb, curpos, SEEK_SET);
222     return update_size(pb, pos);
223 }
224
225 static int mov_write_amr_tag(AVIOContext *pb, MOVTrack *track)
226 {
227     avio_wb32(pb, 0x11); /* size */
228     if (track->mode == MODE_MOV) ffio_wfourcc(pb, "samr");
229     else                         ffio_wfourcc(pb, "damr");
230     ffio_wfourcc(pb, "FFMP");
231     avio_w8(pb, 0); /* decoder version */
232
233     avio_wb16(pb, 0x81FF); /* Mode set (all modes for AMR_NB) */
234     avio_w8(pb, 0x00); /* Mode change period (no restriction) */
235     avio_w8(pb, 0x01); /* Frames per sample */
236     return 0x11;
237 }
238
239 static int mov_write_ac3_tag(AVIOContext *pb, MOVTrack *track)
240 {
241     GetBitContext gbc;
242     PutBitContext pbc;
243     uint8_t buf[3];
244     int fscod, bsid, bsmod, acmod, lfeon, frmsizecod;
245
246     if (track->vos_len < 7)
247         return -1;
248
249     avio_wb32(pb, 11);
250     ffio_wfourcc(pb, "dac3");
251
252     init_get_bits(&gbc, track->vos_data + 4, (track->vos_len - 4) * 8);
253     fscod      = get_bits(&gbc, 2);
254     frmsizecod = get_bits(&gbc, 6);
255     bsid       = get_bits(&gbc, 5);
256     bsmod      = get_bits(&gbc, 3);
257     acmod      = get_bits(&gbc, 3);
258     if (acmod == 2) {
259         skip_bits(&gbc, 2); // dsurmod
260     } else {
261         if ((acmod & 1) && acmod != 1)
262             skip_bits(&gbc, 2); // cmixlev
263         if (acmod & 4)
264             skip_bits(&gbc, 2); // surmixlev
265     }
266     lfeon = get_bits1(&gbc);
267
268     init_put_bits(&pbc, buf, sizeof(buf));
269     put_bits(&pbc, 2, fscod);
270     put_bits(&pbc, 5, bsid);
271     put_bits(&pbc, 3, bsmod);
272     put_bits(&pbc, 3, acmod);
273     put_bits(&pbc, 1, lfeon);
274     put_bits(&pbc, 5, frmsizecod >> 1); // bit_rate_code
275     put_bits(&pbc, 5, 0); // reserved
276
277     flush_put_bits(&pbc);
278     avio_write(pb, buf, sizeof(buf));
279
280     return 11;
281 }
282
283 /**
284  * This function writes extradata "as is".
285  * Extradata must be formatted like a valid atom (with size and tag).
286  */
287 static int mov_write_extradata_tag(AVIOContext *pb, MOVTrack *track)
288 {
289     avio_write(pb, track->enc->extradata, track->enc->extradata_size);
290     return track->enc->extradata_size;
291 }
292
293 static void put_descr(AVIOContext *pb, int tag, unsigned int size)
294 {
295     int i = 3;
296     avio_w8(pb, tag);
297     for (; i > 0; i--)
298         avio_w8(pb, (size >> (7 * i)) | 0x80);
299     avio_w8(pb, size & 0x7F);
300 }
301
302 static int mov_write_esds_tag(AVIOContext *pb, MOVTrack *track) // Basic
303 {
304     int64_t pos = avio_tell(pb);
305     int decoder_specific_info_len = track->vos_len ? 5 + track->vos_len : 0;
306
307     avio_wb32(pb, 0); // size
308     ffio_wfourcc(pb, "esds");
309     avio_wb32(pb, 0); // Version
310
311     // ES descriptor
312     put_descr(pb, 0x03, 3 + 5+13 + decoder_specific_info_len + 5+1);
313     avio_wb16(pb, track->track_id);
314     avio_w8(pb, 0x00); // flags (= no flags)
315
316     // DecoderConfig descriptor
317     put_descr(pb, 0x04, 13 + decoder_specific_info_len);
318
319     // Object type indication
320     if ((track->enc->codec_id == AV_CODEC_ID_MP2 ||
321          track->enc->codec_id == AV_CODEC_ID_MP3) &&
322         track->enc->sample_rate > 24000)
323         avio_w8(pb, 0x6B); // 11172-3
324     else
325         avio_w8(pb, ff_codec_get_tag(ff_mp4_obj_type, track->enc->codec_id));
326
327     // the following fields is made of 6 bits to identify the streamtype (4 for video, 5 for audio)
328     // plus 1 bit to indicate upstream and 1 bit set to 1 (reserved)
329     if (track->enc->codec_id == AV_CODEC_ID_DVD_SUBTITLE)
330         avio_w8(pb, (0x38 << 2) | 1); // flags (= NeroSubpicStream)
331     else if (track->enc->codec_type == AVMEDIA_TYPE_AUDIO)
332         avio_w8(pb, 0x15); // flags (= Audiostream)
333     else
334         avio_w8(pb, 0x11); // flags (= Visualstream)
335
336     avio_wb24(pb, track->enc->rc_buffer_size >> 3); // Buffersize DB
337
338     avio_wb32(pb, FFMAX(track->enc->bit_rate, track->enc->rc_max_rate)); // maxbitrate (FIXME should be max rate in any 1 sec window)
339     if (track->enc->rc_max_rate != track->enc->rc_min_rate ||
340         track->enc->rc_min_rate == 0)
341         avio_wb32(pb, 0); // vbr
342     else
343         avio_wb32(pb, track->enc->rc_max_rate); // avg bitrate
344
345     if (track->vos_len) {
346         // DecoderSpecific info descriptor
347         put_descr(pb, 0x05, track->vos_len);
348         avio_write(pb, track->vos_data, track->vos_len);
349     }
350
351     // SL descriptor
352     put_descr(pb, 0x06, 1);
353     avio_w8(pb, 0x02);
354     return update_size(pb, pos);
355 }
356
357 static int mov_write_ms_tag(AVIOContext *pb, MOVTrack *track)
358 {
359     int64_t pos = avio_tell(pb);
360     avio_wb32(pb, 0);
361     avio_wl32(pb, track->tag); // store it byteswapped
362     track->enc->codec_tag = av_bswap16(track->tag >> 16);
363     ff_put_wav_header(pb, track->enc);
364     return update_size(pb, pos);
365 }
366
367 static int mov_write_wfex_tag(AVIOContext *pb, MOVTrack *track)
368 {
369     int64_t pos = avio_tell(pb);
370     avio_wb32(pb, 0);
371     ffio_wfourcc(pb, "wfex");
372     ff_put_wav_header(pb, track->enc);
373     return update_size(pb, pos);
374 }
375
376 static int mov_write_chan_tag(AVIOContext *pb, MOVTrack *track)
377 {
378     uint32_t layout_tag, bitmap;
379     int64_t pos = avio_tell(pb);
380
381     layout_tag = ff_mov_get_channel_layout_tag(track->enc->codec_id,
382                                                track->enc->channel_layout,
383                                                &bitmap);
384     if (!layout_tag) {
385         av_log(track->enc, AV_LOG_WARNING, "not writing 'chan' tag due to "
386                "lack of channel information\n");
387         return 0;
388     }
389
390     avio_wb32(pb, 0);           // Size
391     ffio_wfourcc(pb, "chan");   // Type
392     avio_w8(pb, 0);             // Version
393     avio_wb24(pb, 0);           // Flags
394     avio_wb32(pb, layout_tag);  // mChannelLayoutTag
395     avio_wb32(pb, bitmap);      // mChannelBitmap
396     avio_wb32(pb, 0);           // mNumberChannelDescriptions
397
398     return update_size(pb, pos);
399 }
400
401 static int mov_write_wave_tag(AVIOContext *pb, MOVTrack *track)
402 {
403     int64_t pos = avio_tell(pb);
404
405     avio_wb32(pb, 0);     /* size */
406     ffio_wfourcc(pb, "wave");
407
408     avio_wb32(pb, 12);    /* size */
409     ffio_wfourcc(pb, "frma");
410     avio_wl32(pb, track->tag);
411
412     if (track->enc->codec_id == AV_CODEC_ID_AAC) {
413         /* useless atom needed by mplayer, ipod, not needed by quicktime */
414         avio_wb32(pb, 12); /* size */
415         ffio_wfourcc(pb, "mp4a");
416         avio_wb32(pb, 0);
417         mov_write_esds_tag(pb, track);
418     } else if (track->enc->codec_id == AV_CODEC_ID_AMR_NB) {
419         mov_write_amr_tag(pb, track);
420     } else if (track->enc->codec_id == AV_CODEC_ID_AC3) {
421         mov_write_ac3_tag(pb, track);
422     } else if (track->enc->codec_id == AV_CODEC_ID_ALAC) {
423         mov_write_extradata_tag(pb, track);
424     } else if (track->enc->codec_id == AV_CODEC_ID_ADPCM_MS ||
425                track->enc->codec_id == AV_CODEC_ID_ADPCM_IMA_WAV) {
426         mov_write_ms_tag(pb, track);
427     }
428
429     avio_wb32(pb, 8);     /* size */
430     avio_wb32(pb, 0);     /* null tag */
431
432     return update_size(pb, pos);
433 }
434
435 static int mov_write_dvc1_structs(MOVTrack *track, uint8_t *buf)
436 {
437     uint8_t *unescaped;
438     const uint8_t *start, *next, *end = track->vos_data + track->vos_len;
439     int unescaped_size, seq_found = 0;
440     int level = 0, interlace = 0;
441     int packet_seq   = track->vc1_info.packet_seq;
442     int packet_entry = track->vc1_info.packet_entry;
443     int slices       = track->vc1_info.slices;
444     PutBitContext pbc;
445
446     if (track->start_dts == AV_NOPTS_VALUE) {
447         /* No packets written yet, vc1_info isn't authoritative yet. */
448         /* Assume inline sequence and entry headers. This will be
449          * overwritten at the end if the file is seekable. */
450         packet_seq = packet_entry = 1;
451     }
452
453     unescaped = av_mallocz(track->vos_len + FF_INPUT_BUFFER_PADDING_SIZE);
454     if (!unescaped)
455         return AVERROR(ENOMEM);
456     start = find_next_marker(track->vos_data, end);
457     for (next = start; next < end; start = next) {
458         GetBitContext gb;
459         int size;
460         next = find_next_marker(start + 4, end);
461         size = next - start - 4;
462         if (size <= 0)
463             continue;
464         unescaped_size = vc1_unescape_buffer(start + 4, size, unescaped);
465         init_get_bits(&gb, unescaped, 8 * unescaped_size);
466         if (AV_RB32(start) == VC1_CODE_SEQHDR) {
467             int profile = get_bits(&gb, 2);
468             if (profile != PROFILE_ADVANCED) {
469                 av_free(unescaped);
470                 return AVERROR(ENOSYS);
471             }
472             seq_found = 1;
473             level = get_bits(&gb, 3);
474             /* chromaformat, frmrtq_postproc, bitrtq_postproc, postprocflag,
475              * width, height */
476             skip_bits_long(&gb, 2 + 3 + 5 + 1 + 2*12);
477             skip_bits(&gb, 1); /* broadcast */
478             interlace = get_bits1(&gb);
479             skip_bits(&gb, 4); /* tfcntrflag, finterpflag, reserved, psf */
480         }
481     }
482     if (!seq_found) {
483         av_free(unescaped);
484         return AVERROR(ENOSYS);
485     }
486
487     init_put_bits(&pbc, buf, 7);
488     /* VC1DecSpecStruc */
489     put_bits(&pbc, 4, 12); /* profile - advanced */
490     put_bits(&pbc, 3, level);
491     put_bits(&pbc, 1, 0); /* reserved */
492     /* VC1AdvDecSpecStruc */
493     put_bits(&pbc, 3, level);
494     put_bits(&pbc, 1, 0); /* cbr */
495     put_bits(&pbc, 6, 0); /* reserved */
496     put_bits(&pbc, 1, !interlace); /* no interlace */
497     put_bits(&pbc, 1, !packet_seq); /* no multiple seq */
498     put_bits(&pbc, 1, !packet_entry); /* no multiple entry */
499     put_bits(&pbc, 1, !slices); /* no slice code */
500     put_bits(&pbc, 1, 0); /* no bframe */
501     put_bits(&pbc, 1, 0); /* reserved */
502
503     /* framerate */
504     if (track->st->avg_frame_rate.num > 0 && track->st->avg_frame_rate.den > 0)
505         put_bits32(&pbc, track->st->avg_frame_rate.num / track->st->avg_frame_rate.den);
506     else
507         put_bits32(&pbc, 0xffffffff);
508
509     flush_put_bits(&pbc);
510
511     av_free(unescaped);
512
513     return 0;
514 }
515
516 static int mov_write_dvc1_tag(AVIOContext *pb, MOVTrack *track)
517 {
518     uint8_t buf[7] = { 0 };
519     int ret;
520
521     if ((ret = mov_write_dvc1_structs(track, buf)) < 0)
522         return ret;
523
524     avio_wb32(pb, track->vos_len + 8 + sizeof(buf));
525     ffio_wfourcc(pb, "dvc1");
526     track->vc1_info.struct_offset = avio_tell(pb);
527     avio_write(pb, buf, sizeof(buf));
528     avio_write(pb, track->vos_data, track->vos_len);
529
530     return 0;
531 }
532
533 static int mov_write_glbl_tag(AVIOContext *pb, MOVTrack *track)
534 {
535     avio_wb32(pb, track->vos_len + 8);
536     ffio_wfourcc(pb, "glbl");
537     avio_write(pb, track->vos_data, track->vos_len);
538     return 8 + track->vos_len;
539 }
540
541 /**
542  * Compute flags for 'lpcm' tag.
543  * See CoreAudioTypes and AudioStreamBasicDescription at Apple.
544  */
545 static int mov_get_lpcm_flags(enum AVCodecID codec_id)
546 {
547     switch (codec_id) {
548     case AV_CODEC_ID_PCM_F32BE:
549     case AV_CODEC_ID_PCM_F64BE:
550         return 11;
551     case AV_CODEC_ID_PCM_F32LE:
552     case AV_CODEC_ID_PCM_F64LE:
553         return 9;
554     case AV_CODEC_ID_PCM_U8:
555         return 10;
556     case AV_CODEC_ID_PCM_S16BE:
557     case AV_CODEC_ID_PCM_S24BE:
558     case AV_CODEC_ID_PCM_S32BE:
559         return 14;
560     case AV_CODEC_ID_PCM_S8:
561     case AV_CODEC_ID_PCM_S16LE:
562     case AV_CODEC_ID_PCM_S24LE:
563     case AV_CODEC_ID_PCM_S32LE:
564         return 12;
565     default:
566         return 0;
567     }
568 }
569
570 static int get_cluster_duration(MOVTrack *track, int cluster_idx)
571 {
572     int64_t next_dts;
573
574     if (cluster_idx >= track->entry)
575         return 0;
576
577     if (cluster_idx + 1 == track->entry)
578         next_dts = track->track_duration + track->start_dts;
579     else
580         next_dts = track->cluster[cluster_idx + 1].dts;
581
582     return next_dts - track->cluster[cluster_idx].dts;
583 }
584
585 static int get_samples_per_packet(MOVTrack *track)
586 {
587     int i, first_duration;
588
589     /* use 1 for raw PCM */
590     if (!track->audio_vbr)
591         return 1;
592
593     /* check to see if duration is constant for all clusters */
594     if (!track->entry)
595         return 0;
596     first_duration = get_cluster_duration(track, 0);
597     for (i = 1; i < track->entry; i++) {
598         if (get_cluster_duration(track, i) != first_duration)
599             return 0;
600     }
601     return first_duration;
602 }
603
604 static int mov_write_audio_tag(AVIOContext *pb, MOVTrack *track)
605 {
606     int64_t pos = avio_tell(pb);
607     int version = 0;
608     uint32_t tag = track->tag;
609
610     if (track->mode == MODE_MOV) {
611         if (mov_get_lpcm_flags(track->enc->codec_id))
612             tag = AV_RL32("lpcm");
613         version = 2;
614     }
615
616     avio_wb32(pb, 0); /* size */
617     avio_wl32(pb, tag); // store it byteswapped
618     avio_wb32(pb, 0); /* Reserved */
619     avio_wb16(pb, 0); /* Reserved */
620     avio_wb16(pb, 1); /* Data-reference index, XXX  == 1 */
621
622     /* SoundDescription */
623     avio_wb16(pb, version); /* Version */
624     avio_wb16(pb, 0); /* Revision level */
625     avio_wb32(pb, 0); /* Reserved */
626
627     if (version == 2) {
628         avio_wb16(pb, 3);
629         avio_wb16(pb, 16);
630         avio_wb16(pb, 0xfffe);
631         avio_wb16(pb, 0);
632         avio_wb32(pb, 0x00010000);
633         avio_wb32(pb, 72);
634         avio_wb64(pb, av_double2int(track->enc->sample_rate));
635         avio_wb32(pb, track->enc->channels);
636         avio_wb32(pb, 0x7F000000);
637         avio_wb32(pb, av_get_bits_per_sample(track->enc->codec_id));
638         avio_wb32(pb, mov_get_lpcm_flags(track->enc->codec_id));
639         avio_wb32(pb, track->sample_size);
640         avio_wb32(pb, get_samples_per_packet(track));
641     } else {
642         /* reserved for mp4/3gp */
643         avio_wb16(pb, 2);
644         avio_wb16(pb, 16);
645         avio_wb16(pb, 0);
646
647         avio_wb16(pb, 0); /* packet size (= 0) */
648         avio_wb16(pb, track->enc->sample_rate <= UINT16_MAX ?
649                       track->enc->sample_rate : 0);
650         avio_wb16(pb, 0); /* Reserved */
651     }
652
653     if (track->mode == MODE_MOV &&
654         (track->enc->codec_id == AV_CODEC_ID_AAC           ||
655          track->enc->codec_id == AV_CODEC_ID_AC3           ||
656          track->enc->codec_id == AV_CODEC_ID_AMR_NB        ||
657          track->enc->codec_id == AV_CODEC_ID_ALAC          ||
658          track->enc->codec_id == AV_CODEC_ID_ADPCM_MS      ||
659          track->enc->codec_id == AV_CODEC_ID_ADPCM_IMA_WAV))
660         mov_write_wave_tag(pb, track);
661     else if (track->tag == MKTAG('m','p','4','a'))
662         mov_write_esds_tag(pb, track);
663     else if (track->enc->codec_id == AV_CODEC_ID_AMR_NB)
664         mov_write_amr_tag(pb, track);
665     else if (track->enc->codec_id == AV_CODEC_ID_AC3)
666         mov_write_ac3_tag(pb, track);
667     else if (track->enc->codec_id == AV_CODEC_ID_ALAC)
668         mov_write_extradata_tag(pb, track);
669     else if (track->enc->codec_id == AV_CODEC_ID_WMAPRO)
670         mov_write_wfex_tag(pb, track);
671     else if (track->vos_len > 0)
672         mov_write_glbl_tag(pb, track);
673
674     if (track->mode == MODE_MOV && track->enc->codec_type == AVMEDIA_TYPE_AUDIO)
675         mov_write_chan_tag(pb, track);
676
677     return update_size(pb, pos);
678 }
679
680 static int mov_write_d263_tag(AVIOContext *pb)
681 {
682     avio_wb32(pb, 0xf); /* size */
683     ffio_wfourcc(pb, "d263");
684     ffio_wfourcc(pb, "FFMP");
685     avio_w8(pb, 0); /* decoder version */
686     /* FIXME use AVCodecContext level/profile, when encoder will set values */
687     avio_w8(pb, 0xa); /* level */
688     avio_w8(pb, 0); /* profile */
689     return 0xf;
690 }
691
692 /* TODO: No idea about these values */
693 static int mov_write_svq3_tag(AVIOContext *pb)
694 {
695     avio_wb32(pb, 0x15);
696     ffio_wfourcc(pb, "SMI ");
697     ffio_wfourcc(pb, "SEQH");
698     avio_wb32(pb, 0x5);
699     avio_wb32(pb, 0xe2c0211d);
700     avio_wb32(pb, 0xc0000000);
701     avio_w8(pb, 0);
702     return 0x15;
703 }
704
705 static int mov_write_avcc_tag(AVIOContext *pb, MOVTrack *track)
706 {
707     int64_t pos = avio_tell(pb);
708
709     avio_wb32(pb, 0);
710     ffio_wfourcc(pb, "avcC");
711     ff_isom_write_avcc(pb, track->vos_data, track->vos_len);
712     return update_size(pb, pos);
713 }
714
715 static int mov_write_hvcc_tag(AVIOContext *pb, MOVTrack *track)
716 {
717     int64_t pos = avio_tell(pb);
718
719     avio_wb32(pb, 0);
720     ffio_wfourcc(pb, "hvcC");
721     ff_isom_write_hvcc(pb, track->vos_data, track->vos_len, 0);
722     return update_size(pb, pos);
723 }
724
725 /* also used by all avid codecs (dv, imx, meridien) and their variants */
726 static int mov_write_avid_tag(AVIOContext *pb, MOVTrack *track)
727 {
728     int i;
729     avio_wb32(pb, 24); /* size */
730     ffio_wfourcc(pb, "ACLR");
731     ffio_wfourcc(pb, "ACLR");
732     ffio_wfourcc(pb, "0001");
733     avio_wb32(pb, 2); /* yuv range: full 1 / normal 2 */
734     avio_wb32(pb, 0); /* unknown */
735
736     avio_wb32(pb, 24); /* size */
737     ffio_wfourcc(pb, "APRG");
738     ffio_wfourcc(pb, "APRG");
739     ffio_wfourcc(pb, "0001");
740     avio_wb32(pb, 1); /* unknown */
741     avio_wb32(pb, 0); /* unknown */
742
743     avio_wb32(pb, 120); /* size */
744     ffio_wfourcc(pb, "ARES");
745     ffio_wfourcc(pb, "ARES");
746     ffio_wfourcc(pb, "0001");
747     avio_wb32(pb, AV_RB32(track->vos_data + 0x28)); /* dnxhd cid, some id ? */
748     avio_wb32(pb, track->enc->width);
749     /* values below are based on samples created with quicktime and avid codecs */
750     if (track->vos_data[5] & 2) { // interlaced
751         avio_wb32(pb, track->enc->height / 2);
752         avio_wb32(pb, 2); /* unknown */
753         avio_wb32(pb, 0); /* unknown */
754         avio_wb32(pb, 4); /* unknown */
755     } else {
756         avio_wb32(pb, track->enc->height);
757         avio_wb32(pb, 1); /* unknown */
758         avio_wb32(pb, 0); /* unknown */
759         if (track->enc->height == 1080)
760             avio_wb32(pb, 5); /* unknown */
761         else
762             avio_wb32(pb, 6); /* unknown */
763     }
764     /* padding */
765     for (i = 0; i < 10; i++)
766         avio_wb64(pb, 0);
767
768     /* extra padding for stsd needed */
769     avio_wb32(pb, 0);
770     return 0;
771 }
772
773 static int mp4_get_codec_tag(AVFormatContext *s, MOVTrack *track)
774 {
775     int tag = track->enc->codec_tag;
776
777     if (!ff_codec_get_tag(ff_mp4_obj_type, track->enc->codec_id))
778         return 0;
779
780     if      (track->enc->codec_id == AV_CODEC_ID_H264)      tag = MKTAG('a','v','c','1');
781     else if (track->enc->codec_id == AV_CODEC_ID_HEVC)      tag = MKTAG('h','e','v','1');
782     else if (track->enc->codec_id == AV_CODEC_ID_AC3)       tag = MKTAG('a','c','-','3');
783     else if (track->enc->codec_id == AV_CODEC_ID_DIRAC)     tag = MKTAG('d','r','a','c');
784     else if (track->enc->codec_id == AV_CODEC_ID_MOV_TEXT)  tag = MKTAG('t','x','3','g');
785     else if (track->enc->codec_id == AV_CODEC_ID_VC1)       tag = MKTAG('v','c','-','1');
786     else if (track->enc->codec_type == AVMEDIA_TYPE_VIDEO)  tag = MKTAG('m','p','4','v');
787     else if (track->enc->codec_type == AVMEDIA_TYPE_AUDIO)  tag = MKTAG('m','p','4','a');
788     else if (track->enc->codec_id == AV_CODEC_ID_DVD_SUBTITLE)  tag = MKTAG('m','p','4','s');
789
790     return tag;
791 }
792
793 static const AVCodecTag codec_ipod_tags[] = {
794     { AV_CODEC_ID_H264,     MKTAG('a','v','c','1') },
795     { AV_CODEC_ID_MPEG4,    MKTAG('m','p','4','v') },
796     { AV_CODEC_ID_AAC,      MKTAG('m','p','4','a') },
797     { AV_CODEC_ID_ALAC,     MKTAG('a','l','a','c') },
798     { AV_CODEC_ID_AC3,      MKTAG('a','c','-','3') },
799     { AV_CODEC_ID_MOV_TEXT, MKTAG('t','x','3','g') },
800     { AV_CODEC_ID_MOV_TEXT, MKTAG('t','e','x','t') },
801     { AV_CODEC_ID_NONE, 0 },
802 };
803
804 static int ipod_get_codec_tag(AVFormatContext *s, MOVTrack *track)
805 {
806     int tag = track->enc->codec_tag;
807
808     // keep original tag for subs, ipod supports both formats
809     if (!(track->enc->codec_type == AVMEDIA_TYPE_SUBTITLE &&
810           (tag == MKTAG('t', 'x', '3', 'g') ||
811            tag == MKTAG('t', 'e', 'x', 't'))))
812         tag = ff_codec_get_tag(codec_ipod_tags, track->enc->codec_id);
813
814     if (!av_match_ext(s->filename, "m4a") && !av_match_ext(s->filename, "m4v"))
815         av_log(s, AV_LOG_WARNING, "Warning, extension is not .m4a nor .m4v "
816                "Quicktime/Ipod might not play the file\n");
817
818     return tag;
819 }
820
821 static int mov_get_dv_codec_tag(AVFormatContext *s, MOVTrack *track)
822 {
823     int tag;
824
825     if (track->enc->width == 720) /* SD */
826         if (track->enc->height == 480) /* NTSC */
827             if  (track->enc->pix_fmt == AV_PIX_FMT_YUV422P) tag = MKTAG('d','v','5','n');
828             else                                            tag = MKTAG('d','v','c',' ');
829         else if (track->enc->pix_fmt == AV_PIX_FMT_YUV422P) tag = MKTAG('d','v','5','p');
830         else if (track->enc->pix_fmt == AV_PIX_FMT_YUV420P) tag = MKTAG('d','v','c','p');
831         else                                                tag = MKTAG('d','v','p','p');
832     else if (track->enc->height == 720) /* HD 720 line */
833         if  (track->st->time_base.den == 50)                tag = MKTAG('d','v','h','q');
834         else                                                tag = MKTAG('d','v','h','p');
835     else if (track->enc->height == 1080) /* HD 1080 line */
836         if  (track->st->time_base.den == 25)                tag = MKTAG('d','v','h','5');
837         else                                                tag = MKTAG('d','v','h','6');
838     else {
839         av_log(s, AV_LOG_ERROR, "unsupported height for dv codec\n");
840         return 0;
841     }
842
843     return tag;
844 }
845
846 static const struct {
847     enum AVPixelFormat pix_fmt;
848     uint32_t tag;
849     unsigned bps;
850 } mov_pix_fmt_tags[] = {
851     { AV_PIX_FMT_YUYV422, MKTAG('y','u','v','s'),  0 },
852     { AV_PIX_FMT_UYVY422, MKTAG('2','v','u','y'),  0 },
853     { AV_PIX_FMT_RGB555BE,MKTAG('r','a','w',' '), 16 },
854     { AV_PIX_FMT_RGB555LE,MKTAG('L','5','5','5'), 16 },
855     { AV_PIX_FMT_RGB565LE,MKTAG('L','5','6','5'), 16 },
856     { AV_PIX_FMT_RGB565BE,MKTAG('B','5','6','5'), 16 },
857     { AV_PIX_FMT_GRAY16BE,MKTAG('b','1','6','g'), 16 },
858     { AV_PIX_FMT_RGB24,   MKTAG('r','a','w',' '), 24 },
859     { AV_PIX_FMT_BGR24,   MKTAG('2','4','B','G'), 24 },
860     { AV_PIX_FMT_ARGB,    MKTAG('r','a','w',' '), 32 },
861     { AV_PIX_FMT_BGRA,    MKTAG('B','G','R','A'), 32 },
862     { AV_PIX_FMT_RGBA,    MKTAG('R','G','B','A'), 32 },
863     { AV_PIX_FMT_ABGR,    MKTAG('A','B','G','R'), 32 },
864     { AV_PIX_FMT_RGB48BE, MKTAG('b','4','8','r'), 48 },
865 };
866
867 static int mov_get_rawvideo_codec_tag(AVFormatContext *s, MOVTrack *track)
868 {
869     int tag = track->enc->codec_tag;
870     int i;
871
872     for (i = 0; i < FF_ARRAY_ELEMS(mov_pix_fmt_tags); i++) {
873         if (track->enc->pix_fmt == mov_pix_fmt_tags[i].pix_fmt) {
874             tag = mov_pix_fmt_tags[i].tag;
875             track->enc->bits_per_coded_sample = mov_pix_fmt_tags[i].bps;
876             break;
877         }
878     }
879
880     return tag;
881 }
882
883 static int mov_get_codec_tag(AVFormatContext *s, MOVTrack *track)
884 {
885     int tag = track->enc->codec_tag;
886
887     if (!tag || (s->strict_std_compliance >= FF_COMPLIANCE_NORMAL &&
888                  (track->enc->codec_id == AV_CODEC_ID_DVVIDEO ||
889                   track->enc->codec_id == AV_CODEC_ID_RAWVIDEO ||
890                   track->enc->codec_id == AV_CODEC_ID_H263 ||
891                   av_get_bits_per_sample(track->enc->codec_id)))) { // pcm audio
892         if (track->enc->codec_id == AV_CODEC_ID_DVVIDEO)
893             tag = mov_get_dv_codec_tag(s, track);
894         else if (track->enc->codec_id == AV_CODEC_ID_RAWVIDEO)
895             tag = mov_get_rawvideo_codec_tag(s, track);
896         else if (track->enc->codec_type == AVMEDIA_TYPE_VIDEO) {
897             tag = ff_codec_get_tag(ff_codec_movvideo_tags, track->enc->codec_id);
898             if (!tag) { // if no mac fcc found, try with Microsoft tags
899                 tag = ff_codec_get_tag(ff_codec_bmp_tags, track->enc->codec_id);
900                 if (tag)
901                     av_log(s, AV_LOG_WARNING, "Using MS style video codec tag, "
902                            "the file may be unplayable!\n");
903             }
904         } else if (track->enc->codec_type == AVMEDIA_TYPE_AUDIO) {
905             tag = ff_codec_get_tag(ff_codec_movaudio_tags, track->enc->codec_id);
906             if (!tag) { // if no mac fcc found, try with Microsoft tags
907                 int ms_tag = ff_codec_get_tag(ff_codec_wav_tags, track->enc->codec_id);
908                 if (ms_tag) {
909                     tag = MKTAG('m', 's', ((ms_tag >> 8) & 0xff), (ms_tag & 0xff));
910                     av_log(s, AV_LOG_WARNING, "Using MS style audio codec tag, "
911                            "the file may be unplayable!\n");
912                 }
913             }
914         } else if (track->enc->codec_type == AVMEDIA_TYPE_SUBTITLE)
915             tag = ff_codec_get_tag(ff_codec_movsubtitle_tags, track->enc->codec_id);
916     }
917
918     return tag;
919 }
920
921 static const AVCodecTag codec_3gp_tags[] = {
922     { AV_CODEC_ID_H263,     MKTAG('s','2','6','3') },
923     { AV_CODEC_ID_H264,     MKTAG('a','v','c','1') },
924     { AV_CODEC_ID_MPEG4,    MKTAG('m','p','4','v') },
925     { AV_CODEC_ID_AAC,      MKTAG('m','p','4','a') },
926     { AV_CODEC_ID_AMR_NB,   MKTAG('s','a','m','r') },
927     { AV_CODEC_ID_AMR_WB,   MKTAG('s','a','w','b') },
928     { AV_CODEC_ID_MOV_TEXT, MKTAG('t','x','3','g') },
929     { AV_CODEC_ID_NONE, 0 },
930 };
931
932 static const AVCodecTag codec_f4v_tags[] = {
933     { AV_CODEC_ID_MP3,    MKTAG('.','m','p','3') },
934     { AV_CODEC_ID_AAC,    MKTAG('m','p','4','a') },
935     { AV_CODEC_ID_H264,   MKTAG('a','v','c','1') },
936     { AV_CODEC_ID_VP6A,   MKTAG('V','P','6','A') },
937     { AV_CODEC_ID_VP6F,   MKTAG('V','P','6','F') },
938     { AV_CODEC_ID_NONE, 0 },
939 };
940
941 static int mov_find_codec_tag(AVFormatContext *s, MOVTrack *track)
942 {
943     int tag;
944
945     if (track->mode == MODE_MP4 || track->mode == MODE_PSP)
946         tag = mp4_get_codec_tag(s, track);
947     else if (track->mode == MODE_ISM) {
948         tag = mp4_get_codec_tag(s, track);
949         if (!tag && track->enc->codec_id == AV_CODEC_ID_WMAPRO)
950             tag = MKTAG('w', 'm', 'a', ' ');
951     } else if (track->mode == MODE_IPOD)
952         tag = ipod_get_codec_tag(s, track);
953     else if (track->mode & MODE_3GP)
954         tag = ff_codec_get_tag(codec_3gp_tags, track->enc->codec_id);
955     else if (track->mode == MODE_F4V)
956         tag = ff_codec_get_tag(codec_f4v_tags, track->enc->codec_id);
957     else
958         tag = mov_get_codec_tag(s, track);
959
960     return tag;
961 }
962
963 /** Write uuid atom.
964  * Needed to make file play in iPods running newest firmware
965  * goes after avcC atom in moov.trak.mdia.minf.stbl.stsd.avc1
966  */
967 static int mov_write_uuid_tag_ipod(AVIOContext *pb)
968 {
969     avio_wb32(pb, 28);
970     ffio_wfourcc(pb, "uuid");
971     avio_wb32(pb, 0x6b6840f2);
972     avio_wb32(pb, 0x5f244fc5);
973     avio_wb32(pb, 0xba39a51b);
974     avio_wb32(pb, 0xcf0323f3);
975     avio_wb32(pb, 0x0);
976     return 28;
977 }
978
979 static const uint16_t fiel_data[] = {
980     0x0000, 0x0100, 0x0201, 0x0206, 0x0209, 0x020e
981 };
982
983 static int mov_write_fiel_tag(AVIOContext *pb, MOVTrack *track)
984 {
985     unsigned mov_field_order = 0;
986     if (track->enc->field_order < FF_ARRAY_ELEMS(fiel_data))
987         mov_field_order = fiel_data[track->enc->field_order];
988     else
989         return 0;
990     avio_wb32(pb, 10);
991     ffio_wfourcc(pb, "fiel");
992     avio_wb16(pb, mov_field_order);
993     return 10;
994 }
995
996 static int mov_write_subtitle_tag(AVIOContext *pb, MOVTrack *track)
997 {
998     int64_t pos = avio_tell(pb);
999     avio_wb32(pb, 0);    /* size */
1000     avio_wl32(pb, track->tag); // store it byteswapped
1001     avio_wb32(pb, 0);    /* Reserved */
1002     avio_wb16(pb, 0);    /* Reserved */
1003     avio_wb16(pb, 1);    /* Data-reference index */
1004
1005     if (track->enc->codec_id == AV_CODEC_ID_DVD_SUBTITLE)
1006         mov_write_esds_tag(pb, track);
1007     else if (track->enc->extradata_size)
1008         avio_write(pb, track->enc->extradata, track->enc->extradata_size);
1009
1010     return update_size(pb, pos);
1011 }
1012
1013 static int mov_write_pasp_tag(AVIOContext *pb, MOVTrack *track)
1014 {
1015     AVRational sar;
1016     av_reduce(&sar.num, &sar.den, track->enc->sample_aspect_ratio.num,
1017               track->enc->sample_aspect_ratio.den, INT_MAX);
1018
1019     avio_wb32(pb, 16);
1020     ffio_wfourcc(pb, "pasp");
1021     avio_wb32(pb, sar.num);
1022     avio_wb32(pb, sar.den);
1023     return 16;
1024 }
1025
1026 static int mov_write_video_tag(AVIOContext *pb, MOVTrack *track)
1027 {
1028     AVDictionaryEntry *encoder;
1029     int64_t pos = avio_tell(pb);
1030     char compressor_name[32] = { 0 };
1031
1032     avio_wb32(pb, 0); /* size */
1033     avio_wl32(pb, track->tag); // store it byteswapped
1034     avio_wb32(pb, 0); /* Reserved */
1035     avio_wb16(pb, 0); /* Reserved */
1036     avio_wb16(pb, 1); /* Data-reference index */
1037
1038     avio_wb16(pb, 0); /* Codec stream version */
1039     avio_wb16(pb, 0); /* Codec stream revision (=0) */
1040     if (track->mode == MODE_MOV) {
1041         ffio_wfourcc(pb, "FFMP"); /* Vendor */
1042         if (track->enc->codec_id == AV_CODEC_ID_RAWVIDEO) {
1043             avio_wb32(pb, 0); /* Temporal Quality */
1044             avio_wb32(pb, 0x400); /* Spatial Quality = lossless*/
1045         } else {
1046             avio_wb32(pb, 0x200); /* Temporal Quality = normal */
1047             avio_wb32(pb, 0x200); /* Spatial Quality = normal */
1048         }
1049     } else {
1050         avio_wb32(pb, 0); /* Reserved */
1051         avio_wb32(pb, 0); /* Reserved */
1052         avio_wb32(pb, 0); /* Reserved */
1053     }
1054     avio_wb16(pb, track->enc->width); /* Video width */
1055     avio_wb16(pb, track->height); /* Video height */
1056     avio_wb32(pb, 0x00480000); /* Horizontal resolution 72dpi */
1057     avio_wb32(pb, 0x00480000); /* Vertical resolution 72dpi */
1058     avio_wb32(pb, 0); /* Data size (= 0) */
1059     avio_wb16(pb, 1); /* Frame count (= 1) */
1060
1061     /* FIXME not sure, ISO 14496-1 draft where it shall be set to 0 */
1062     if (track->mode == MODE_MOV &&
1063         (encoder = av_dict_get(track->st->metadata, "encoder", NULL, 0)))
1064         av_strlcpy(compressor_name, encoder->value, 32);
1065     avio_w8(pb, strlen(compressor_name));
1066     avio_write(pb, compressor_name, 31);
1067
1068     if (track->mode == MODE_MOV && track->enc->bits_per_coded_sample)
1069         avio_wb16(pb, track->enc->bits_per_coded_sample);
1070     else
1071         avio_wb16(pb, 0x18); /* Reserved */
1072     avio_wb16(pb, 0xffff); /* Reserved */
1073     if (track->tag == MKTAG('m','p','4','v'))
1074         mov_write_esds_tag(pb, track);
1075     else if (track->enc->codec_id == AV_CODEC_ID_H263)
1076         mov_write_d263_tag(pb);
1077     else if (track->enc->codec_id == AV_CODEC_ID_SVQ3)
1078         mov_write_svq3_tag(pb);
1079     else if (track->enc->codec_id == AV_CODEC_ID_DNXHD)
1080         mov_write_avid_tag(pb, track);
1081     else if (track->enc->codec_id == AV_CODEC_ID_HEVC)
1082         mov_write_hvcc_tag(pb, track);
1083     else if (track->enc->codec_id == AV_CODEC_ID_H264) {
1084         mov_write_avcc_tag(pb, track);
1085         if (track->mode == MODE_IPOD)
1086             mov_write_uuid_tag_ipod(pb);
1087     } else if (track->enc->field_order != AV_FIELD_UNKNOWN)
1088         mov_write_fiel_tag(pb, track);
1089     else if (track->enc->codec_id == AV_CODEC_ID_VC1 && track->vos_len > 0)
1090         mov_write_dvc1_tag(pb, track);
1091     else if (track->enc->codec_id == AV_CODEC_ID_VP6F ||
1092              track->enc->codec_id == AV_CODEC_ID_VP6A) {
1093         /* Don't write any potential extradata here - the cropping
1094          * is signalled via the normal width/height fields. */
1095     } else if (track->vos_len > 0)
1096         mov_write_glbl_tag(pb, track);
1097
1098     if (track->enc->sample_aspect_ratio.den && track->enc->sample_aspect_ratio.num &&
1099         track->enc->sample_aspect_ratio.den != track->enc->sample_aspect_ratio.num) {
1100         mov_write_pasp_tag(pb, track);
1101     }
1102
1103     return update_size(pb, pos);
1104 }
1105
1106 static int mov_write_rtp_tag(AVIOContext *pb, MOVTrack *track)
1107 {
1108     int64_t pos = avio_tell(pb);
1109     avio_wb32(pb, 0); /* size */
1110     ffio_wfourcc(pb, "rtp ");
1111     avio_wb32(pb, 0); /* Reserved */
1112     avio_wb16(pb, 0); /* Reserved */
1113     avio_wb16(pb, 1); /* Data-reference index */
1114
1115     avio_wb16(pb, 1); /* Hint track version */
1116     avio_wb16(pb, 1); /* Highest compatible version */
1117     avio_wb32(pb, track->max_packet_size); /* Max packet size */
1118
1119     avio_wb32(pb, 12); /* size */
1120     ffio_wfourcc(pb, "tims");
1121     avio_wb32(pb, track->timescale);
1122
1123     return update_size(pb, pos);
1124 }
1125
1126 static int mov_write_tmcd_tag(AVIOContext *pb, MOVTrack *track)
1127 {
1128     int64_t pos = avio_tell(pb);
1129
1130     avio_wb32(pb, 0); /* size */
1131     ffio_wfourcc(pb, "tmcd");               /* Data format */
1132     avio_wb32(pb, 0);                       /* Reserved */
1133     avio_wb32(pb, 1);                       /* Data reference index */
1134     if (track->enc->extradata_size)
1135         avio_write(pb, track->enc->extradata, track->enc->extradata_size);
1136     return update_size(pb, pos);
1137 }
1138
1139 static int mov_write_stsd_tag(AVIOContext *pb, MOVTrack *track)
1140 {
1141     int64_t pos = avio_tell(pb);
1142     avio_wb32(pb, 0); /* size */
1143     ffio_wfourcc(pb, "stsd");
1144     avio_wb32(pb, 0); /* version & flags */
1145     avio_wb32(pb, 1); /* entry count */
1146     if (track->enc->codec_type == AVMEDIA_TYPE_VIDEO)
1147         mov_write_video_tag(pb, track);
1148     else if (track->enc->codec_type == AVMEDIA_TYPE_AUDIO)
1149         mov_write_audio_tag(pb, track);
1150     else if (track->enc->codec_type == AVMEDIA_TYPE_SUBTITLE)
1151         mov_write_subtitle_tag(pb, track);
1152     else if (track->enc->codec_tag == MKTAG('r','t','p',' '))
1153         mov_write_rtp_tag(pb, track);
1154     else if (track->enc->codec_tag == MKTAG('t','m','c','d'))
1155         mov_write_tmcd_tag(pb, track);
1156     return update_size(pb, pos);
1157 }
1158
1159 static int mov_write_ctts_tag(AVIOContext *pb, MOVTrack *track)
1160 {
1161     MOVStts *ctts_entries;
1162     uint32_t entries = 0;
1163     uint32_t atom_size;
1164     int i;
1165
1166     ctts_entries = av_malloc((track->entry + 1) * sizeof(*ctts_entries)); /* worst case */
1167     ctts_entries[0].count = 1;
1168     ctts_entries[0].duration = track->cluster[0].cts;
1169     for (i = 1; i < track->entry; i++) {
1170         if (track->cluster[i].cts == ctts_entries[entries].duration) {
1171             ctts_entries[entries].count++; /* compress */
1172         } else {
1173             entries++;
1174             ctts_entries[entries].duration = track->cluster[i].cts;
1175             ctts_entries[entries].count = 1;
1176         }
1177     }
1178     entries++; /* last one */
1179     atom_size = 16 + (entries * 8);
1180     avio_wb32(pb, atom_size); /* size */
1181     ffio_wfourcc(pb, "ctts");
1182     avio_wb32(pb, 0); /* version & flags */
1183     avio_wb32(pb, entries); /* entry count */
1184     for (i = 0; i < entries; i++) {
1185         avio_wb32(pb, ctts_entries[i].count);
1186         avio_wb32(pb, ctts_entries[i].duration);
1187     }
1188     av_free(ctts_entries);
1189     return atom_size;
1190 }
1191
1192 /* Time to sample atom */
1193 static int mov_write_stts_tag(AVIOContext *pb, MOVTrack *track)
1194 {
1195     MOVStts *stts_entries;
1196     uint32_t entries = -1;
1197     uint32_t atom_size;
1198     int i;
1199
1200     if (track->enc->codec_type == AVMEDIA_TYPE_AUDIO && !track->audio_vbr) {
1201         stts_entries = av_malloc(sizeof(*stts_entries)); /* one entry */
1202         stts_entries[0].count = track->sample_count;
1203         stts_entries[0].duration = 1;
1204         entries = 1;
1205     } else {
1206         stts_entries = track->entry ?
1207                        av_malloc(track->entry * sizeof(*stts_entries)) : /* worst case */
1208                        NULL;
1209         for (i = 0; i < track->entry; i++) {
1210             int duration = get_cluster_duration(track, i);
1211             if (i && duration == stts_entries[entries].duration) {
1212                 stts_entries[entries].count++; /* compress */
1213             } else {
1214                 entries++;
1215                 stts_entries[entries].duration = duration;
1216                 stts_entries[entries].count = 1;
1217             }
1218         }
1219         entries++; /* last one */
1220     }
1221     atom_size = 16 + (entries * 8);
1222     avio_wb32(pb, atom_size); /* size */
1223     ffio_wfourcc(pb, "stts");
1224     avio_wb32(pb, 0); /* version & flags */
1225     avio_wb32(pb, entries); /* entry count */
1226     for (i = 0; i < entries; i++) {
1227         avio_wb32(pb, stts_entries[i].count);
1228         avio_wb32(pb, stts_entries[i].duration);
1229     }
1230     av_free(stts_entries);
1231     return atom_size;
1232 }
1233
1234 static int mov_write_dref_tag(AVIOContext *pb)
1235 {
1236     avio_wb32(pb, 28); /* size */
1237     ffio_wfourcc(pb, "dref");
1238     avio_wb32(pb, 0); /* version & flags */
1239     avio_wb32(pb, 1); /* entry count */
1240
1241     avio_wb32(pb, 0xc); /* size */
1242     ffio_wfourcc(pb, "url ");
1243     avio_wb32(pb, 1); /* version & flags */
1244
1245     return 28;
1246 }
1247
1248 static int mov_write_stbl_tag(AVIOContext *pb, MOVTrack *track)
1249 {
1250     int64_t pos = avio_tell(pb);
1251     avio_wb32(pb, 0); /* size */
1252     ffio_wfourcc(pb, "stbl");
1253     mov_write_stsd_tag(pb, track);
1254     mov_write_stts_tag(pb, track);
1255     if ((track->enc->codec_type == AVMEDIA_TYPE_VIDEO ||
1256          track->enc->codec_tag == MKTAG('r','t','p',' ')) &&
1257         track->has_keyframes && track->has_keyframes < track->entry)
1258         mov_write_stss_tag(pb, track, MOV_SYNC_SAMPLE);
1259     if (track->mode == MODE_MOV && track->flags & MOV_TRACK_STPS)
1260         mov_write_stss_tag(pb, track, MOV_PARTIAL_SYNC_SAMPLE);
1261     if (track->enc->codec_type == AVMEDIA_TYPE_VIDEO &&
1262         track->flags & MOV_TRACK_CTTS)
1263         mov_write_ctts_tag(pb, track);
1264     mov_write_stsc_tag(pb, track);
1265     mov_write_stsz_tag(pb, track);
1266     mov_write_stco_tag(pb, track);
1267     return update_size(pb, pos);
1268 }
1269
1270 static int mov_write_dinf_tag(AVIOContext *pb)
1271 {
1272     int64_t pos = avio_tell(pb);
1273     avio_wb32(pb, 0); /* size */
1274     ffio_wfourcc(pb, "dinf");
1275     mov_write_dref_tag(pb);
1276     return update_size(pb, pos);
1277 }
1278
1279 static int mov_write_nmhd_tag(AVIOContext *pb)
1280 {
1281     avio_wb32(pb, 12);
1282     ffio_wfourcc(pb, "nmhd");
1283     avio_wb32(pb, 0);
1284     return 12;
1285 }
1286
1287 static int mov_write_gmhd_tag(AVIOContext *pb)
1288 {
1289     avio_wb32(pb, 0x20);   /* size */
1290     ffio_wfourcc(pb, "gmhd");
1291     avio_wb32(pb, 0x18);   /* gmin size */
1292     ffio_wfourcc(pb, "gmin");/* generic media info */
1293     avio_wb32(pb, 0);      /* version & flags */
1294     avio_wb16(pb, 0x40);   /* graphics mode = */
1295     avio_wb16(pb, 0x8000); /* opColor (r?) */
1296     avio_wb16(pb, 0x8000); /* opColor (g?) */
1297     avio_wb16(pb, 0x8000); /* opColor (b?) */
1298     avio_wb16(pb, 0);      /* balance */
1299     avio_wb16(pb, 0);      /* reserved */
1300     return 0x20;
1301 }
1302
1303 static int mov_write_smhd_tag(AVIOContext *pb)
1304 {
1305     avio_wb32(pb, 16); /* size */
1306     ffio_wfourcc(pb, "smhd");
1307     avio_wb32(pb, 0); /* version & flags */
1308     avio_wb16(pb, 0); /* reserved (balance, normally = 0) */
1309     avio_wb16(pb, 0); /* reserved */
1310     return 16;
1311 }
1312
1313 static int mov_write_vmhd_tag(AVIOContext *pb)
1314 {
1315     avio_wb32(pb, 0x14); /* size (always 0x14) */
1316     ffio_wfourcc(pb, "vmhd");
1317     avio_wb32(pb, 0x01); /* version & flags */
1318     avio_wb64(pb, 0); /* reserved (graphics mode = copy) */
1319     return 0x14;
1320 }
1321
1322 static int is_clcp_track(MOVTrack *track)
1323 {
1324     return track->tag == MKTAG('c','7','0','8') ||
1325            track->tag == MKTAG('c','6','0','8');
1326 }
1327
1328 static int mov_write_hdlr_tag(AVIOContext *pb, MOVTrack *track)
1329 {
1330     const char *hdlr, *descr = NULL, *hdlr_type = NULL;
1331     int64_t pos = avio_tell(pb);
1332
1333     hdlr      = "dhlr";
1334     hdlr_type = "url ";
1335     descr     = "DataHandler";
1336
1337     if (track) {
1338         hdlr = (track->mode == MODE_MOV) ? "mhlr" : "\0\0\0\0";
1339         if (track->enc->codec_type == AVMEDIA_TYPE_VIDEO) {
1340             hdlr_type = "vide";
1341             descr     = "VideoHandler";
1342         } else if (track->enc->codec_type == AVMEDIA_TYPE_AUDIO) {
1343             hdlr_type = "soun";
1344             descr     = "SoundHandler";
1345         } else if (track->enc->codec_type == AVMEDIA_TYPE_SUBTITLE) {
1346             if (track->tag == MKTAG('t','x','3','g')) {
1347                 hdlr_type = "sbtl";
1348             } else if (track->tag == MKTAG('m','p','4','s')) {
1349                 hdlr_type = "subp";
1350             } else if (is_clcp_track(track)) {
1351                 hdlr_type = "clcp";
1352             } else {
1353                 hdlr_type = "text";
1354             }
1355             descr = "SubtitleHandler";
1356         } else if (track->enc->codec_tag == MKTAG('r','t','p',' ')) {
1357             hdlr_type = "hint";
1358             descr     = "HintHandler";
1359         } else if (track->enc->codec_tag == MKTAG('t','m','c','d')) {
1360             hdlr_type = "tmcd";
1361             descr = "TimeCodeHandler";
1362         } else {
1363             char tag_buf[32];
1364             av_get_codec_tag_string(tag_buf, sizeof(tag_buf),
1365                                     track->enc->codec_tag);
1366
1367             av_log(track->enc, AV_LOG_WARNING,
1368                    "Unknown hldr_type for %s / 0x%04X, writing dummy values\n",
1369                    tag_buf, track->enc->codec_tag);
1370         }
1371         if (track->st) {
1372             // hdlr.name is used by some players to identify the content title
1373             // of the track. So if an alternate handler description is
1374             // specified, use it.
1375             AVDictionaryEntry *t;
1376             t = av_dict_get(track->st->metadata, "handler", NULL, 0);
1377             if (t && utf8len(t->value))
1378                 descr = t->value;
1379         }
1380     }
1381
1382     avio_wb32(pb, 0); /* size */
1383     ffio_wfourcc(pb, "hdlr");
1384     avio_wb32(pb, 0); /* Version & flags */
1385     avio_write(pb, hdlr, 4); /* handler */
1386     ffio_wfourcc(pb, hdlr_type); /* handler type */
1387     avio_wb32(pb, 0); /* reserved */
1388     avio_wb32(pb, 0); /* reserved */
1389     avio_wb32(pb, 0); /* reserved */
1390     if (!track || track->mode == MODE_MOV)
1391         avio_w8(pb, strlen(descr)); /* pascal string */
1392     avio_write(pb, descr, strlen(descr)); /* handler description */
1393     if (track && track->mode != MODE_MOV)
1394         avio_w8(pb, 0); /* c string */
1395     return update_size(pb, pos);
1396 }
1397
1398 static int mov_write_hmhd_tag(AVIOContext *pb)
1399 {
1400     /* This atom must be present, but leaving the values at zero
1401      * seems harmless. */
1402     avio_wb32(pb, 28); /* size */
1403     ffio_wfourcc(pb, "hmhd");
1404     avio_wb32(pb, 0); /* version, flags */
1405     avio_wb16(pb, 0); /* maxPDUsize */
1406     avio_wb16(pb, 0); /* avgPDUsize */
1407     avio_wb32(pb, 0); /* maxbitrate */
1408     avio_wb32(pb, 0); /* avgbitrate */
1409     avio_wb32(pb, 0); /* reserved */
1410     return 28;
1411 }
1412
1413 static int mov_write_minf_tag(AVIOContext *pb, MOVTrack *track)
1414 {
1415     int64_t pos = avio_tell(pb);
1416     avio_wb32(pb, 0); /* size */
1417     ffio_wfourcc(pb, "minf");
1418     if (track->enc->codec_type == AVMEDIA_TYPE_VIDEO)
1419         mov_write_vmhd_tag(pb);
1420     else if (track->enc->codec_type == AVMEDIA_TYPE_AUDIO)
1421         mov_write_smhd_tag(pb);
1422     else if (track->enc->codec_type == AVMEDIA_TYPE_SUBTITLE) {
1423         if (track->tag == MKTAG('t','e','x','t') || is_clcp_track(track)) {
1424             mov_write_gmhd_tag(pb);
1425         } else {
1426             mov_write_nmhd_tag(pb);
1427         }
1428     } else if (track->tag == MKTAG('r','t','p',' ')) {
1429         mov_write_hmhd_tag(pb);
1430     } else if (track->tag == MKTAG('t','m','c','d')) {
1431         mov_write_gmhd_tag(pb);
1432     }
1433     if (track->mode == MODE_MOV) /* FIXME: Why do it for MODE_MOV only ? */
1434         mov_write_hdlr_tag(pb, NULL);
1435     mov_write_dinf_tag(pb);
1436     mov_write_stbl_tag(pb, track);
1437     return update_size(pb, pos);
1438 }
1439
1440 static int mov_write_mdhd_tag(AVIOContext *pb, MOVMuxContext *mov,
1441                               MOVTrack *track)
1442 {
1443     int version = track->track_duration < INT32_MAX ? 0 : 1;
1444
1445     if (track->mode == MODE_ISM)
1446         version = 1;
1447
1448     (version == 1) ? avio_wb32(pb, 44) : avio_wb32(pb, 32); /* size */
1449     ffio_wfourcc(pb, "mdhd");
1450     avio_w8(pb, version);
1451     avio_wb24(pb, 0); /* flags */
1452     if (version == 1) {
1453         avio_wb64(pb, track->time);
1454         avio_wb64(pb, track->time);
1455     } else {
1456         avio_wb32(pb, track->time); /* creation time */
1457         avio_wb32(pb, track->time); /* modification time */
1458     }
1459     avio_wb32(pb, track->timescale); /* time scale (sample rate for audio) */
1460     if (!track->entry && mov->mode == MODE_ISM)
1461         (version == 1) ? avio_wb64(pb, UINT64_C(0xffffffffffffffff)) : avio_wb32(pb, 0xffffffff);
1462     else if (!track->entry)
1463         (version == 1) ? avio_wb64(pb, 0) : avio_wb32(pb, 0);
1464     else
1465         (version == 1) ? avio_wb64(pb, track->track_duration) : avio_wb32(pb, track->track_duration); /* duration */
1466     avio_wb16(pb, track->language); /* language */
1467     avio_wb16(pb, 0); /* reserved (quality) */
1468
1469     if (version != 0 && track->mode == MODE_MOV) {
1470         av_log(NULL, AV_LOG_ERROR,
1471                "FATAL error, file duration too long for timebase, this file will not be\n"
1472                "playable with quicktime. Choose a different timebase or a different\n"
1473                "container format\n");
1474     }
1475
1476     return 32;
1477 }
1478
1479 static int mov_write_mdia_tag(AVIOContext *pb, MOVMuxContext *mov,
1480                               MOVTrack *track)
1481 {
1482     int64_t pos = avio_tell(pb);
1483     avio_wb32(pb, 0); /* size */
1484     ffio_wfourcc(pb, "mdia");
1485     mov_write_mdhd_tag(pb, mov, track);
1486     mov_write_hdlr_tag(pb, track);
1487     mov_write_minf_tag(pb, track);
1488     return update_size(pb, pos);
1489 }
1490
1491 static int mov_write_tkhd_tag(AVIOContext *pb, MOVMuxContext *mov,
1492                               MOVTrack *track, AVStream *st)
1493 {
1494     int64_t duration = av_rescale_rnd(track->track_duration, MOV_TIMESCALE,
1495                                       track->timescale, AV_ROUND_UP);
1496     int version = duration < INT32_MAX ? 0 : 1;
1497     int flags   = MOV_TKHD_FLAG_IN_MOVIE;
1498     int group   = 0;
1499
1500
1501     if (st) {
1502         if (mov->per_stream_grouping)
1503             group = st->index;
1504         else
1505             group = st->codec->codec_type;
1506     }
1507
1508     if (track->flags & MOV_TRACK_ENABLED)
1509         flags |= MOV_TKHD_FLAG_ENABLED;
1510
1511     if (track->mode == MODE_ISM)
1512         version = 1;
1513
1514     (version == 1) ? avio_wb32(pb, 104) : avio_wb32(pb, 92); /* size */
1515     ffio_wfourcc(pb, "tkhd");
1516     avio_w8(pb, version);
1517     avio_wb24(pb, flags);
1518     if (version == 1) {
1519         avio_wb64(pb, track->time);
1520         avio_wb64(pb, track->time);
1521     } else {
1522         avio_wb32(pb, track->time); /* creation time */
1523         avio_wb32(pb, track->time); /* modification time */
1524     }
1525     avio_wb32(pb, track->track_id); /* track-id */
1526     avio_wb32(pb, 0); /* reserved */
1527     if (!track->entry && mov->mode == MODE_ISM)
1528         (version == 1) ? avio_wb64(pb, UINT64_C(0xffffffffffffffff)) : avio_wb32(pb, 0xffffffff);
1529     else if (!track->entry)
1530         (version == 1) ? avio_wb64(pb, 0) : avio_wb32(pb, 0);
1531     else
1532         (version == 1) ? avio_wb64(pb, duration) : avio_wb32(pb, duration);
1533
1534     avio_wb32(pb, 0); /* reserved */
1535     avio_wb32(pb, 0); /* reserved */
1536     avio_wb16(pb, 0); /* layer */
1537     avio_wb16(pb, group); /* alternate group) */
1538     /* Volume, only for audio */
1539     if (track->enc->codec_type == AVMEDIA_TYPE_AUDIO)
1540         avio_wb16(pb, 0x0100);
1541     else
1542         avio_wb16(pb, 0);
1543     avio_wb16(pb, 0); /* reserved */
1544
1545     /* Matrix structure */
1546     avio_wb32(pb, 0x00010000); /* reserved */
1547     avio_wb32(pb, 0x0); /* reserved */
1548     avio_wb32(pb, 0x0); /* reserved */
1549     avio_wb32(pb, 0x0); /* reserved */
1550     avio_wb32(pb, 0x00010000); /* reserved */
1551     avio_wb32(pb, 0x0); /* reserved */
1552     avio_wb32(pb, 0x0); /* reserved */
1553     avio_wb32(pb, 0x0); /* reserved */
1554     avio_wb32(pb, 0x40000000); /* reserved */
1555
1556     /* Track width and height, for visual only */
1557     if (st && (track->enc->codec_type == AVMEDIA_TYPE_VIDEO ||
1558                track->enc->codec_type == AVMEDIA_TYPE_SUBTITLE)) {
1559         if (track->mode == MODE_MOV) {
1560             avio_wb32(pb, track->enc->width << 16);
1561             avio_wb32(pb, track->height << 16);
1562         } else {
1563             double sample_aspect_ratio = av_q2d(st->sample_aspect_ratio);
1564             if (!sample_aspect_ratio || track->height != track->enc->height)
1565                 sample_aspect_ratio = 1;
1566             avio_wb32(pb, sample_aspect_ratio * track->enc->width * 0x10000);
1567             avio_wb32(pb, track->height * 0x10000);
1568         }
1569     } else {
1570         avio_wb32(pb, 0);
1571         avio_wb32(pb, 0);
1572     }
1573     return 0x5c;
1574 }
1575
1576 static int mov_write_tapt_tag(AVIOContext *pb, MOVTrack *track)
1577 {
1578     int32_t width = av_rescale(track->enc->sample_aspect_ratio.num, track->enc->width,
1579                                track->enc->sample_aspect_ratio.den);
1580
1581     int64_t pos = avio_tell(pb);
1582
1583     avio_wb32(pb, 0); /* size */
1584     ffio_wfourcc(pb, "tapt");
1585
1586     avio_wb32(pb, 20);
1587     ffio_wfourcc(pb, "clef");
1588     avio_wb32(pb, 0);
1589     avio_wb32(pb, width << 16);
1590     avio_wb32(pb, track->enc->height << 16);
1591
1592     avio_wb32(pb, 20);
1593     ffio_wfourcc(pb, "prof");
1594     avio_wb32(pb, 0);
1595     avio_wb32(pb, width << 16);
1596     avio_wb32(pb, track->enc->height << 16);
1597
1598     avio_wb32(pb, 20);
1599     ffio_wfourcc(pb, "enof");
1600     avio_wb32(pb, 0);
1601     avio_wb32(pb, track->enc->width << 16);
1602     avio_wb32(pb, track->enc->height << 16);
1603
1604     return update_size(pb, pos);
1605 }
1606
1607 // This box seems important for the psp playback ... without it the movie seems to hang
1608 static int mov_write_edts_tag(AVIOContext *pb, MOVMuxContext *mov,
1609                               MOVTrack *track)
1610 {
1611     int64_t duration = av_rescale_rnd(track->track_duration, MOV_TIMESCALE,
1612                                       track->timescale, AV_ROUND_UP);
1613     int version = duration < INT32_MAX ? 0 : 1;
1614     int entry_size, entry_count, size;
1615     int64_t delay, start_ct = track->cluster[0].cts;
1616     delay = av_rescale_rnd(track->cluster[0].dts + start_ct, MOV_TIMESCALE,
1617                            track->timescale, AV_ROUND_DOWN);
1618     version |= delay < INT32_MAX ? 0 : 1;
1619
1620     entry_size = (version == 1) ? 20 : 12;
1621     entry_count = 1 + (delay > 0);
1622     size = 24 + entry_count * entry_size;
1623
1624     /* write the atom data */
1625     avio_wb32(pb, size);
1626     ffio_wfourcc(pb, "edts");
1627     avio_wb32(pb, size - 8);
1628     ffio_wfourcc(pb, "elst");
1629     avio_w8(pb, version);
1630     avio_wb24(pb, 0); /* flags */
1631
1632     avio_wb32(pb, entry_count);
1633     if (delay > 0) { /* add an empty edit to delay presentation */
1634         /* In the positive delay case, the delay includes the cts
1635          * offset, and the second edit list entry below trims out
1636          * the same amount from the actual content. This makes sure
1637          * that the offsetted last sample is included in the edit
1638          * list duration as well. */
1639         if (version == 1) {
1640             avio_wb64(pb, delay);
1641             avio_wb64(pb, -1);
1642         } else {
1643             avio_wb32(pb, delay);
1644             avio_wb32(pb, -1);
1645         }
1646         avio_wb32(pb, 0x00010000);
1647     } else {
1648         /* Avoid accidentally ending up with start_ct = -1 which has got a
1649          * special meaning. Normally start_ct should end up positive or zero
1650          * here, but use FFMIN in case dts is a a small positive integer
1651          * rounded to 0 when represented in MOV_TIMESCALE units. */
1652         start_ct  = -FFMIN(track->cluster[0].dts, 0);
1653         /* Note, this delay is calculated from the pts of the first sample,
1654          * ensuring that we don't reduce the duration for cases with
1655          * dts<0 pts=0. */
1656         duration += delay;
1657     }
1658
1659     /* For fragmented files, we don't know the full length yet. Setting
1660      * duration to 0 allows us to only specify the offset, including
1661      * the rest of the content (from all future fragments) without specifying
1662      * an explicit duration. */
1663     if (mov->flags & FF_MOV_FLAG_FRAGMENT)
1664         duration = 0;
1665
1666     /* duration */
1667     if (version == 1) {
1668         avio_wb64(pb, duration);
1669         avio_wb64(pb, start_ct);
1670     } else {
1671         avio_wb32(pb, duration);
1672         avio_wb32(pb, start_ct);
1673     }
1674     avio_wb32(pb, 0x00010000);
1675     return size;
1676 }
1677
1678 static int mov_write_tref_tag(AVIOContext *pb, MOVTrack *track)
1679 {
1680     avio_wb32(pb, 20);   // size
1681     ffio_wfourcc(pb, "tref");
1682     avio_wb32(pb, 12);   // size (subatom)
1683     avio_wl32(pb, track->tref_tag);
1684     avio_wb32(pb, track->tref_id);
1685     return 20;
1686 }
1687
1688 // goes at the end of each track!  ... Critical for PSP playback ("Incompatible data" without it)
1689 static int mov_write_uuid_tag_psp(AVIOContext *pb, MOVTrack *mov)
1690 {
1691     avio_wb32(pb, 0x34); /* size ... reports as 28 in mp4box! */
1692     ffio_wfourcc(pb, "uuid");
1693     ffio_wfourcc(pb, "USMT");
1694     avio_wb32(pb, 0x21d24fce);
1695     avio_wb32(pb, 0xbb88695c);
1696     avio_wb32(pb, 0xfac9c740);
1697     avio_wb32(pb, 0x1c);     // another size here!
1698     ffio_wfourcc(pb, "MTDT");
1699     avio_wb32(pb, 0x00010012);
1700     avio_wb32(pb, 0x0a);
1701     avio_wb32(pb, 0x55c40000);
1702     avio_wb32(pb, 0x1);
1703     avio_wb32(pb, 0x0);
1704     return 0x34;
1705 }
1706
1707 static int mov_write_udta_sdp(AVIOContext *pb, MOVTrack *track)
1708 {
1709     AVFormatContext *ctx = track->rtp_ctx;
1710     char buf[1000] = "";
1711     int len;
1712
1713     ff_sdp_write_media(buf, sizeof(buf), ctx->streams[0], track->src_track,
1714                        NULL, NULL, 0, 0, ctx);
1715     av_strlcatf(buf, sizeof(buf), "a=control:streamid=%d\r\n", track->track_id);
1716     len = strlen(buf);
1717
1718     avio_wb32(pb, len + 24);
1719     ffio_wfourcc(pb, "udta");
1720     avio_wb32(pb, len + 16);
1721     ffio_wfourcc(pb, "hnti");
1722     avio_wb32(pb, len + 8);
1723     ffio_wfourcc(pb, "sdp ");
1724     avio_write(pb, buf, len);
1725     return len + 24;
1726 }
1727
1728 static int mov_write_track_metadata(AVIOContext *pb, AVStream *st,
1729                                     const char *tag, const char *str)
1730 {
1731     int64_t pos = avio_tell(pb);
1732     AVDictionaryEntry *t = av_dict_get(st->metadata, str, NULL, 0);
1733     if (!t || !utf8len(t->value))
1734         return 0;
1735
1736     avio_wb32(pb, 0);   /* size */
1737     ffio_wfourcc(pb, tag); /* type */
1738     avio_write(pb, t->value, strlen(t->value)); /* UTF8 string value */
1739     return update_size(pb, pos);
1740 }
1741
1742 static int mov_write_track_udta_tag(AVIOContext *pb, MOVMuxContext *mov,
1743                                     AVStream *st)
1744 {
1745     AVIOContext *pb_buf;
1746     int ret, size;
1747     uint8_t *buf;
1748
1749     if (!st || mov->fc->flags & AVFMT_FLAG_BITEXACT)
1750         return 0;
1751
1752     ret = avio_open_dyn_buf(&pb_buf);
1753     if (ret < 0)
1754         return ret;
1755
1756     if (mov->mode & MODE_MP4)
1757         mov_write_track_metadata(pb_buf, st, "name", "title");
1758
1759     if ((size = avio_close_dyn_buf(pb_buf, &buf)) > 0) {
1760         avio_wb32(pb, size + 8);
1761         ffio_wfourcc(pb, "udta");
1762         avio_write(pb, buf, size);
1763     }
1764     av_free(buf);
1765
1766     return 0;
1767 }
1768
1769 static int mov_write_trak_tag(AVIOContext *pb, MOVMuxContext *mov,
1770                               MOVTrack *track, AVStream *st)
1771 {
1772     int64_t pos = avio_tell(pb);
1773     avio_wb32(pb, 0); /* size */
1774     ffio_wfourcc(pb, "trak");
1775     mov_write_tkhd_tag(pb, mov, track, st);
1776     if (track->entry &&
1777         (track->mode == MODE_PSP || track->flags & MOV_TRACK_CTTS ||
1778         track->cluster[0].dts || is_clcp_track(track))) {
1779         if (mov->use_editlist)
1780             mov_write_edts_tag(pb, mov, track);  // PSP Movies require edts box
1781         else if ((track->entry && track->cluster[0].dts) || track->mode == MODE_PSP || is_clcp_track(track))
1782             av_log(mov->fc, AV_LOG_WARNING,
1783                    "Not writing any edit list even though one would have been required\n");
1784     }
1785     if (track->tref_tag)
1786         mov_write_tref_tag(pb, track);
1787     mov_write_mdia_tag(pb, mov, track);
1788     if (track->mode == MODE_PSP)
1789         mov_write_uuid_tag_psp(pb, track); // PSP Movies require this uuid box
1790     if (track->tag == MKTAG('r','t','p',' '))
1791         mov_write_udta_sdp(pb, track);
1792     if (track->mode == MODE_MOV) {
1793         if (track->enc->codec_type == AVMEDIA_TYPE_VIDEO) {
1794             double sample_aspect_ratio = av_q2d(st->sample_aspect_ratio);
1795             if ((0.0 != sample_aspect_ratio && 1.0 != sample_aspect_ratio)) {
1796                 mov_write_tapt_tag(pb, track);
1797             }
1798         }
1799         if (is_clcp_track(track)) {
1800             mov_write_tapt_tag(pb, track);
1801         }
1802     }
1803     mov_write_track_udta_tag(pb, mov, st);
1804     return update_size(pb, pos);
1805 }
1806
1807 static int mov_write_iods_tag(AVIOContext *pb, MOVMuxContext *mov)
1808 {
1809     int i, has_audio = 0, has_video = 0;
1810     int64_t pos = avio_tell(pb);
1811     int audio_profile = mov->iods_audio_profile;
1812     int video_profile = mov->iods_video_profile;
1813     for (i = 0; i < mov->nb_streams; i++) {
1814         if (mov->tracks[i].entry > 0 || mov->flags & FF_MOV_FLAG_EMPTY_MOOV) {
1815             has_audio |= mov->tracks[i].enc->codec_type == AVMEDIA_TYPE_AUDIO;
1816             has_video |= mov->tracks[i].enc->codec_type == AVMEDIA_TYPE_VIDEO;
1817         }
1818     }
1819     if (audio_profile < 0)
1820         audio_profile = 0xFF - has_audio;
1821     if (video_profile < 0)
1822         video_profile = 0xFF - has_video;
1823     avio_wb32(pb, 0x0); /* size */
1824     ffio_wfourcc(pb, "iods");
1825     avio_wb32(pb, 0);    /* version & flags */
1826     put_descr(pb, 0x10, 7);
1827     avio_wb16(pb, 0x004f);
1828     avio_w8(pb, 0xff);
1829     avio_w8(pb, 0xff);
1830     avio_w8(pb, audio_profile);
1831     avio_w8(pb, video_profile);
1832     avio_w8(pb, 0xff);
1833     return update_size(pb, pos);
1834 }
1835
1836 static int mov_write_trex_tag(AVIOContext *pb, MOVTrack *track)
1837 {
1838     avio_wb32(pb, 0x20); /* size */
1839     ffio_wfourcc(pb, "trex");
1840     avio_wb32(pb, 0);   /* version & flags */
1841     avio_wb32(pb, track->track_id); /* track ID */
1842     avio_wb32(pb, 1);   /* default sample description index */
1843     avio_wb32(pb, 0);   /* default sample duration */
1844     avio_wb32(pb, 0);   /* default sample size */
1845     avio_wb32(pb, 0);   /* default sample flags */
1846     return 0;
1847 }
1848
1849 static int mov_write_mvex_tag(AVIOContext *pb, MOVMuxContext *mov)
1850 {
1851     int64_t pos = avio_tell(pb);
1852     int i;
1853     avio_wb32(pb, 0x0); /* size */
1854     ffio_wfourcc(pb, "mvex");
1855     for (i = 0; i < mov->nb_streams; i++)
1856         mov_write_trex_tag(pb, &mov->tracks[i]);
1857     return update_size(pb, pos);
1858 }
1859
1860 static int mov_write_mvhd_tag(AVIOContext *pb, MOVMuxContext *mov)
1861 {
1862     int max_track_id = 1, i;
1863     int64_t max_track_len_temp, max_track_len = 0;
1864     int version;
1865
1866     for (i = 0; i < mov->nb_streams; i++) {
1867         if (mov->tracks[i].entry > 0 && mov->tracks[i].timescale) {
1868             max_track_len_temp = av_rescale_rnd(mov->tracks[i].track_duration,
1869                                                 MOV_TIMESCALE,
1870                                                 mov->tracks[i].timescale,
1871                                                 AV_ROUND_UP);
1872             if (max_track_len < max_track_len_temp)
1873                 max_track_len = max_track_len_temp;
1874             if (max_track_id < mov->tracks[i].track_id)
1875                 max_track_id = mov->tracks[i].track_id;
1876         }
1877     }
1878
1879     version = max_track_len < UINT32_MAX ? 0 : 1;
1880     (version == 1) ? avio_wb32(pb, 120) : avio_wb32(pb, 108); /* size */
1881     ffio_wfourcc(pb, "mvhd");
1882     avio_w8(pb, version);
1883     avio_wb24(pb, 0); /* flags */
1884     if (version == 1) {
1885         avio_wb64(pb, mov->time);
1886         avio_wb64(pb, mov->time);
1887     } else {
1888         avio_wb32(pb, mov->time); /* creation time */
1889         avio_wb32(pb, mov->time); /* modification time */
1890     }
1891     avio_wb32(pb, MOV_TIMESCALE);
1892     (version == 1) ? avio_wb64(pb, max_track_len) : avio_wb32(pb, max_track_len); /* duration of longest track */
1893
1894     avio_wb32(pb, 0x00010000); /* reserved (preferred rate) 1.0 = normal */
1895     avio_wb16(pb, 0x0100); /* reserved (preferred volume) 1.0 = normal */
1896     avio_wb16(pb, 0); /* reserved */
1897     avio_wb32(pb, 0); /* reserved */
1898     avio_wb32(pb, 0); /* reserved */
1899
1900     /* Matrix structure */
1901     avio_wb32(pb, 0x00010000); /* reserved */
1902     avio_wb32(pb, 0x0); /* reserved */
1903     avio_wb32(pb, 0x0); /* reserved */
1904     avio_wb32(pb, 0x0); /* reserved */
1905     avio_wb32(pb, 0x00010000); /* reserved */
1906     avio_wb32(pb, 0x0); /* reserved */
1907     avio_wb32(pb, 0x0); /* reserved */
1908     avio_wb32(pb, 0x0); /* reserved */
1909     avio_wb32(pb, 0x40000000); /* reserved */
1910
1911     avio_wb32(pb, 0); /* reserved (preview time) */
1912     avio_wb32(pb, 0); /* reserved (preview duration) */
1913     avio_wb32(pb, 0); /* reserved (poster time) */
1914     avio_wb32(pb, 0); /* reserved (selection time) */
1915     avio_wb32(pb, 0); /* reserved (selection duration) */
1916     avio_wb32(pb, 0); /* reserved (current time) */
1917     avio_wb32(pb, max_track_id + 1); /* Next track id */
1918     return 0x6c;
1919 }
1920
1921 static int mov_write_itunes_hdlr_tag(AVIOContext *pb, MOVMuxContext *mov,
1922                                      AVFormatContext *s)
1923 {
1924     avio_wb32(pb, 33); /* size */
1925     ffio_wfourcc(pb, "hdlr");
1926     avio_wb32(pb, 0);
1927     avio_wb32(pb, 0);
1928     ffio_wfourcc(pb, "mdir");
1929     ffio_wfourcc(pb, "appl");
1930     avio_wb32(pb, 0);
1931     avio_wb32(pb, 0);
1932     avio_w8(pb, 0);
1933     return 33;
1934 }
1935
1936 /* helper function to write a data tag with the specified string as data */
1937 static int mov_write_string_data_tag(AVIOContext *pb, const char *data, int lang, int long_style)
1938 {
1939     if (long_style) {
1940         int size = 16 + strlen(data);
1941         avio_wb32(pb, size); /* size */
1942         ffio_wfourcc(pb, "data");
1943         avio_wb32(pb, 1);
1944         avio_wb32(pb, 0);
1945         avio_write(pb, data, strlen(data));
1946         return size;
1947     } else {
1948         if (!lang)
1949             lang = ff_mov_iso639_to_lang("und", 1);
1950         avio_wb16(pb, strlen(data)); /* string length */
1951         avio_wb16(pb, lang);
1952         avio_write(pb, data, strlen(data));
1953         return strlen(data) + 4;
1954     }
1955 }
1956
1957 static int mov_write_string_tag(AVIOContext *pb, const char *name,
1958                                 const char *value, int lang, int long_style)
1959 {
1960     int size = 0;
1961     if (value && value[0]) {
1962         int64_t pos = avio_tell(pb);
1963         avio_wb32(pb, 0); /* size */
1964         ffio_wfourcc(pb, name);
1965         mov_write_string_data_tag(pb, value, lang, long_style);
1966         size = update_size(pb, pos);
1967     }
1968     return size;
1969 }
1970
1971 static int mov_write_string_metadata(AVFormatContext *s, AVIOContext *pb,
1972                                      const char *name, const char *tag,
1973                                      int long_style)
1974 {
1975     int l, lang = 0, len, len2;
1976     AVDictionaryEntry *t, *t2 = NULL;
1977     char tag2[16];
1978
1979     if (!(t = av_dict_get(s->metadata, tag, NULL, 0)))
1980         return 0;
1981
1982     len = strlen(t->key);
1983     snprintf(tag2, sizeof(tag2), "%s-", tag);
1984     while ((t2 = av_dict_get(s->metadata, tag2, t2, AV_DICT_IGNORE_SUFFIX))) {
1985         len2 = strlen(t2->key);
1986         if (len2 == len + 4 && !strcmp(t->value, t2->value)
1987             && (l = ff_mov_iso639_to_lang(&t2->key[len2 - 3], 1)) >= 0) {
1988             lang = l;
1989             break;
1990         }
1991     }
1992     return mov_write_string_tag(pb, name, t->value, lang, long_style);
1993 }
1994
1995 /* iTunes track number */
1996 static int mov_write_trkn_tag(AVIOContext *pb, MOVMuxContext *mov,
1997                               AVFormatContext *s)
1998 {
1999     AVDictionaryEntry *t = av_dict_get(s->metadata, "track", NULL, 0);
2000     int size = 0, track = t ? atoi(t->value) : 0;
2001     if (track) {
2002         avio_wb32(pb, 32); /* size */
2003         ffio_wfourcc(pb, "trkn");
2004         avio_wb32(pb, 24); /* size */
2005         ffio_wfourcc(pb, "data");
2006         avio_wb32(pb, 0);        // 8 bytes empty
2007         avio_wb32(pb, 0);
2008         avio_wb16(pb, 0);        // empty
2009         avio_wb16(pb, track);    // track number
2010         avio_wb16(pb, 0);        // total track number
2011         avio_wb16(pb, 0);        // empty
2012         size = 32;
2013     }
2014     return size;
2015 }
2016
2017 /* iTunes meta data list */
2018 static int mov_write_ilst_tag(AVIOContext *pb, MOVMuxContext *mov,
2019                               AVFormatContext *s)
2020 {
2021     int64_t pos = avio_tell(pb);
2022     avio_wb32(pb, 0); /* size */
2023     ffio_wfourcc(pb, "ilst");
2024     mov_write_string_metadata(s, pb, "\251nam", "title"    , 1);
2025     mov_write_string_metadata(s, pb, "\251ART", "artist"   , 1);
2026     mov_write_string_metadata(s, pb, "aART", "album_artist", 1);
2027     mov_write_string_metadata(s, pb, "\251wrt", "composer" , 1);
2028     mov_write_string_metadata(s, pb, "\251alb", "album"    , 1);
2029     mov_write_string_metadata(s, pb, "\251day", "date"     , 1);
2030     if (!mov_write_string_metadata(s, pb, "\251too", "encoding_tool", 1))
2031         mov_write_string_tag(pb, "\251too", LIBAVFORMAT_IDENT, 0, 1);
2032     mov_write_string_metadata(s, pb, "\251cmt", "comment"  , 1);
2033     mov_write_string_metadata(s, pb, "\251gen", "genre"    , 1);
2034     mov_write_string_metadata(s, pb, "\251cpy", "copyright", 1);
2035     mov_write_string_metadata(s, pb, "\251grp", "grouping" , 1);
2036     mov_write_string_metadata(s, pb, "\251lyr", "lyrics"   , 1);
2037     mov_write_string_metadata(s, pb, "desc",    "description",1);
2038     mov_write_string_metadata(s, pb, "ldes",    "synopsis" , 1);
2039     mov_write_string_metadata(s, pb, "tvsh",    "show"     , 1);
2040     mov_write_string_metadata(s, pb, "tven",    "episode_id",1);
2041     mov_write_string_metadata(s, pb, "tvnn",    "network"  , 1);
2042     mov_write_trkn_tag(pb, mov, s);
2043     return update_size(pb, pos);
2044 }
2045
2046 /* iTunes meta data tag */
2047 static int mov_write_meta_tag(AVIOContext *pb, MOVMuxContext *mov,
2048                               AVFormatContext *s)
2049 {
2050     int size = 0;
2051     int64_t pos = avio_tell(pb);
2052     avio_wb32(pb, 0); /* size */
2053     ffio_wfourcc(pb, "meta");
2054     avio_wb32(pb, 0);
2055     mov_write_itunes_hdlr_tag(pb, mov, s);
2056     mov_write_ilst_tag(pb, mov, s);
2057     size = update_size(pb, pos);
2058     return size;
2059 }
2060
2061 static int ascii_to_wc(AVIOContext *pb, const uint8_t *b)
2062 {
2063     int val;
2064     while (*b) {
2065         GET_UTF8(val, *b++, return -1;)
2066         avio_wb16(pb, val);
2067     }
2068     avio_wb16(pb, 0x00);
2069     return 0;
2070 }
2071
2072 static uint16_t language_code(const char *str)
2073 {
2074     return (((str[0] - 0x60) & 0x1F) << 10) +
2075            (((str[1] - 0x60) & 0x1F) <<  5) +
2076            (( str[2] - 0x60) & 0x1F);
2077 }
2078
2079 static int mov_write_3gp_udta_tag(AVIOContext *pb, AVFormatContext *s,
2080                                   const char *tag, const char *str)
2081 {
2082     int64_t pos = avio_tell(pb);
2083     AVDictionaryEntry *t = av_dict_get(s->metadata, str, NULL, 0);
2084     if (!t || !utf8len(t->value))
2085         return 0;
2086     avio_wb32(pb, 0);   /* size */
2087     ffio_wfourcc(pb, tag); /* type */
2088     avio_wb32(pb, 0);   /* version + flags */
2089     if (!strcmp(tag, "yrrc"))
2090         avio_wb16(pb, atoi(t->value));
2091     else {
2092         avio_wb16(pb, language_code("eng")); /* language */
2093         avio_write(pb, t->value, strlen(t->value) + 1); /* UTF8 string value */
2094         if (!strcmp(tag, "albm") &&
2095             (t = av_dict_get(s->metadata, "track", NULL, 0)))
2096             avio_w8(pb, atoi(t->value));
2097     }
2098     return update_size(pb, pos);
2099 }
2100
2101 static int mov_write_chpl_tag(AVIOContext *pb, AVFormatContext *s)
2102 {
2103     int64_t pos = avio_tell(pb);
2104     int i, nb_chapters = FFMIN(s->nb_chapters, 255);
2105
2106     avio_wb32(pb, 0);            // size
2107     ffio_wfourcc(pb, "chpl");
2108     avio_wb32(pb, 0x01000000);   // version + flags
2109     avio_wb32(pb, 0);            // unknown
2110     avio_w8(pb, nb_chapters);
2111
2112     for (i = 0; i < nb_chapters; i++) {
2113         AVChapter *c = s->chapters[i];
2114         AVDictionaryEntry *t;
2115         avio_wb64(pb, av_rescale_q(c->start, c->time_base, (AVRational){1,10000000}));
2116
2117         if ((t = av_dict_get(c->metadata, "title", NULL, 0))) {
2118             int len = FFMIN(strlen(t->value), 255);
2119             avio_w8(pb, len);
2120             avio_write(pb, t->value, len);
2121         } else
2122             avio_w8(pb, 0);
2123     }
2124     return update_size(pb, pos);
2125 }
2126
2127 static int mov_write_udta_tag(AVIOContext *pb, MOVMuxContext *mov,
2128                               AVFormatContext *s)
2129 {
2130     AVIOContext *pb_buf;
2131     int ret, size;
2132     uint8_t *buf;
2133
2134     if (s->flags & AVFMT_FLAG_BITEXACT)
2135         return 0;
2136
2137     ret = avio_open_dyn_buf(&pb_buf);
2138     if (ret < 0)
2139         return ret;
2140
2141     if (mov->mode & MODE_3GP) {
2142         mov_write_3gp_udta_tag(pb_buf, s, "perf", "artist");
2143         mov_write_3gp_udta_tag(pb_buf, s, "titl", "title");
2144         mov_write_3gp_udta_tag(pb_buf, s, "auth", "author");
2145         mov_write_3gp_udta_tag(pb_buf, s, "gnre", "genre");
2146         mov_write_3gp_udta_tag(pb_buf, s, "dscp", "comment");
2147         mov_write_3gp_udta_tag(pb_buf, s, "albm", "album");
2148         mov_write_3gp_udta_tag(pb_buf, s, "cprt", "copyright");
2149         mov_write_3gp_udta_tag(pb_buf, s, "yrrc", "date");
2150     } else if (mov->mode == MODE_MOV) { // the title field breaks gtkpod with mp4 and my suspicion is that stuff is not valid in mp4
2151         mov_write_string_metadata(s, pb_buf, "\251ART", "artist",      0);
2152         mov_write_string_metadata(s, pb_buf, "\251nam", "title",       0);
2153         mov_write_string_metadata(s, pb_buf, "\251aut", "author",      0);
2154         mov_write_string_metadata(s, pb_buf, "\251alb", "album",       0);
2155         mov_write_string_metadata(s, pb_buf, "\251day", "date",        0);
2156         mov_write_string_metadata(s, pb_buf, "\251swr", "encoder",     0);
2157         mov_write_string_metadata(s, pb_buf, "\251des", "comment",     0);
2158         mov_write_string_metadata(s, pb_buf, "\251gen", "genre",       0);
2159         mov_write_string_metadata(s, pb_buf, "\251cpy", "copyright",   0);
2160     } else {
2161         /* iTunes meta data */
2162         mov_write_meta_tag(pb_buf, mov, s);
2163     }
2164
2165     if (s->nb_chapters && !(mov->flags & FF_MOV_FLAG_DISABLE_CHPL))
2166         mov_write_chpl_tag(pb_buf, s);
2167
2168     if ((size = avio_close_dyn_buf(pb_buf, &buf)) > 0) {
2169         avio_wb32(pb, size + 8);
2170         ffio_wfourcc(pb, "udta");
2171         avio_write(pb, buf, size);
2172     }
2173     av_free(buf);
2174
2175     return 0;
2176 }
2177
2178 static void mov_write_psp_udta_tag(AVIOContext *pb,
2179                                    const char *str, const char *lang, int type)
2180 {
2181     int len = utf8len(str) + 1;
2182     if (len <= 0)
2183         return;
2184     avio_wb16(pb, len * 2 + 10);        /* size */
2185     avio_wb32(pb, type);                /* type */
2186     avio_wb16(pb, language_code(lang)); /* language */
2187     avio_wb16(pb, 0x01);                /* ? */
2188     ascii_to_wc(pb, str);
2189 }
2190
2191 static int mov_write_uuidusmt_tag(AVIOContext *pb, AVFormatContext *s)
2192 {
2193     AVDictionaryEntry *title = av_dict_get(s->metadata, "title", NULL, 0);
2194     int64_t pos, pos2;
2195
2196     if (title) {
2197         pos = avio_tell(pb);
2198         avio_wb32(pb, 0); /* size placeholder*/
2199         ffio_wfourcc(pb, "uuid");
2200         ffio_wfourcc(pb, "USMT");
2201         avio_wb32(pb, 0x21d24fce); /* 96 bit UUID */
2202         avio_wb32(pb, 0xbb88695c);
2203         avio_wb32(pb, 0xfac9c740);
2204
2205         pos2 = avio_tell(pb);
2206         avio_wb32(pb, 0); /* size placeholder*/
2207         ffio_wfourcc(pb, "MTDT");
2208         avio_wb16(pb, 4);
2209
2210         // ?
2211         avio_wb16(pb, 0x0C);                 /* size */
2212         avio_wb32(pb, 0x0B);                 /* type */
2213         avio_wb16(pb, language_code("und")); /* language */
2214         avio_wb16(pb, 0x0);                  /* ? */
2215         avio_wb16(pb, 0x021C);               /* data */
2216
2217         mov_write_psp_udta_tag(pb, LIBAVCODEC_IDENT,      "eng", 0x04);
2218         mov_write_psp_udta_tag(pb, title->value,          "eng", 0x01);
2219         mov_write_psp_udta_tag(pb, "2006/04/01 11:11:11", "und", 0x03);
2220
2221         update_size(pb, pos2);
2222         return update_size(pb, pos);
2223     }
2224
2225     return 0;
2226 }
2227
2228 static int mov_write_moov_tag(AVIOContext *pb, MOVMuxContext *mov,
2229                               AVFormatContext *s)
2230 {
2231     int i;
2232     int64_t pos = avio_tell(pb);
2233     avio_wb32(pb, 0); /* size placeholder*/
2234     ffio_wfourcc(pb, "moov");
2235
2236     for (i = 0; i < mov->nb_streams; i++) {
2237         if (mov->tracks[i].entry <= 0 && !(mov->flags & FF_MOV_FLAG_FRAGMENT))
2238             continue;
2239
2240         mov->tracks[i].time     = mov->time;
2241         mov->tracks[i].track_id = i + 1;
2242     }
2243
2244     if (mov->chapter_track)
2245         for (i = 0; i < s->nb_streams; i++) {
2246             mov->tracks[i].tref_tag = MKTAG('c','h','a','p');
2247             mov->tracks[i].tref_id  = mov->tracks[mov->chapter_track].track_id;
2248         }
2249     for (i = 0; i < mov->nb_streams; i++) {
2250         if (mov->tracks[i].tag == MKTAG('r','t','p',' ')) {
2251             mov->tracks[i].tref_tag = MKTAG('h','i','n','t');
2252             mov->tracks[i].tref_id =
2253                 mov->tracks[mov->tracks[i].src_track].track_id;
2254         }
2255     }
2256
2257     mov_write_mvhd_tag(pb, mov);
2258     if (mov->mode != MODE_MOV && !mov->iods_skip)
2259         mov_write_iods_tag(pb, mov);
2260     for (i = 0; i < mov->nb_streams; i++) {
2261         if (mov->tracks[i].entry > 0 || mov->flags & FF_MOV_FLAG_FRAGMENT) {
2262             mov_write_trak_tag(pb, mov, &(mov->tracks[i]), i < s->nb_streams ? s->streams[i] : NULL);
2263         }
2264     }
2265     if (mov->flags & FF_MOV_FLAG_FRAGMENT)
2266         mov_write_mvex_tag(pb, mov); /* QuickTime requires trak to precede this */
2267
2268     if (mov->mode == MODE_PSP)
2269         mov_write_uuidusmt_tag(pb, s);
2270     else
2271         mov_write_udta_tag(pb, mov, s);
2272
2273     return update_size(pb, pos);
2274 }
2275
2276 static void param_write_int(AVIOContext *pb, const char *name, int value)
2277 {
2278     avio_printf(pb, "<param name=\"%s\" value=\"%d\" valuetype=\"data\"/>\n", name, value);
2279 }
2280
2281 static void param_write_string(AVIOContext *pb, const char *name, const char *value)
2282 {
2283     avio_printf(pb, "<param name=\"%s\" value=\"%s\" valuetype=\"data\"/>\n", name, value);
2284 }
2285
2286 static void param_write_hex(AVIOContext *pb, const char *name, const uint8_t *value, int len)
2287 {
2288     char buf[150];
2289     len = FFMIN(sizeof(buf) / 2 - 1, len);
2290     ff_data_to_hex(buf, value, len, 0);
2291     buf[2 * len] = '\0';
2292     avio_printf(pb, "<param name=\"%s\" value=\"%s\" valuetype=\"data\"/>\n", name, buf);
2293 }
2294
2295 static int mov_write_isml_manifest(AVIOContext *pb, MOVMuxContext *mov)
2296 {
2297     int64_t pos = avio_tell(pb);
2298     int i;
2299     const uint8_t uuid[] = {
2300         0xa5, 0xd4, 0x0b, 0x30, 0xe8, 0x14, 0x11, 0xdd,
2301         0xba, 0x2f, 0x08, 0x00, 0x20, 0x0c, 0x9a, 0x66
2302     };
2303
2304     avio_wb32(pb, 0);
2305     ffio_wfourcc(pb, "uuid");
2306     avio_write(pb, uuid, sizeof(uuid));
2307     avio_wb32(pb, 0);
2308
2309     avio_printf(pb, "<?xml version=\"1.0\" encoding=\"utf-8\"?>\n");
2310     avio_printf(pb, "<smil xmlns=\"http://www.w3.org/2001/SMIL20/Language\">\n");
2311     avio_printf(pb, "<head>\n");
2312     avio_printf(pb, "<meta name=\"creator\" content=\"%s\" />\n",
2313                     LIBAVFORMAT_IDENT);
2314     avio_printf(pb, "</head>\n");
2315     avio_printf(pb, "<body>\n");
2316     avio_printf(pb, "<switch>\n");
2317     for (i = 0; i < mov->nb_streams; i++) {
2318         MOVTrack *track = &mov->tracks[i];
2319         const char *type;
2320         /* track->track_id is initialized in write_moov, and thus isn't known
2321          * here yet */
2322         int track_id = i + 1;
2323
2324         if (track->enc->codec_type == AVMEDIA_TYPE_VIDEO) {
2325             type = "video";
2326         } else if (track->enc->codec_type == AVMEDIA_TYPE_AUDIO) {
2327             type = "audio";
2328         } else {
2329             continue;
2330         }
2331         avio_printf(pb, "<%s systemBitrate=\"%d\">\n", type,
2332                                                        track->enc->bit_rate);
2333         param_write_int(pb, "systemBitrate", track->enc->bit_rate);
2334         param_write_int(pb, "trackID", track_id);
2335         if (track->enc->codec_type == AVMEDIA_TYPE_VIDEO) {
2336             if (track->enc->codec_id == AV_CODEC_ID_H264) {
2337                 uint8_t *ptr;
2338                 int size = track->enc->extradata_size;
2339                 if (!ff_avc_write_annexb_extradata(track->enc->extradata, &ptr,
2340                                                    &size)) {
2341                     param_write_hex(pb, "CodecPrivateData",
2342                                     ptr ? ptr : track->enc->extradata,
2343                                     size);
2344                     av_free(ptr);
2345                 }
2346                 param_write_string(pb, "FourCC", "H264");
2347             } else if (track->enc->codec_id == AV_CODEC_ID_VC1) {
2348                 param_write_string(pb, "FourCC", "WVC1");
2349                 param_write_hex(pb, "CodecPrivateData", track->enc->extradata,
2350                                 track->enc->extradata_size);
2351             }
2352             param_write_int(pb, "MaxWidth", track->enc->width);
2353             param_write_int(pb, "MaxHeight", track->enc->height);
2354             param_write_int(pb, "DisplayWidth", track->enc->width);
2355             param_write_int(pb, "DisplayHeight", track->enc->height);
2356         } else {
2357             if (track->enc->codec_id == AV_CODEC_ID_AAC) {
2358                 param_write_string(pb, "FourCC", "AACL");
2359             } else if (track->enc->codec_id == AV_CODEC_ID_WMAPRO) {
2360                 param_write_string(pb, "FourCC", "WMAP");
2361             }
2362             param_write_hex(pb, "CodecPrivateData", track->enc->extradata,
2363                             track->enc->extradata_size);
2364             param_write_int(pb, "AudioTag", ff_codec_get_tag(ff_codec_wav_tags,
2365                                                              track->enc->codec_id));
2366             param_write_int(pb, "Channels", track->enc->channels);
2367             param_write_int(pb, "SamplingRate", track->enc->sample_rate);
2368             param_write_int(pb, "BitsPerSample", 16);
2369             param_write_int(pb, "PacketSize", track->enc->block_align ?
2370                                               track->enc->block_align : 4);
2371         }
2372         avio_printf(pb, "</%s>\n", type);
2373     }
2374     avio_printf(pb, "</switch>\n");
2375     avio_printf(pb, "</body>\n");
2376     avio_printf(pb, "</smil>\n");
2377
2378     return update_size(pb, pos);
2379 }
2380
2381 static int mov_write_mfhd_tag(AVIOContext *pb, MOVMuxContext *mov)
2382 {
2383     avio_wb32(pb, 16);
2384     ffio_wfourcc(pb, "mfhd");
2385     avio_wb32(pb, 0);
2386     avio_wb32(pb, mov->fragments);
2387     return 0;
2388 }
2389
2390 static int mov_write_tfhd_tag(AVIOContext *pb, MOVMuxContext *mov,
2391                               MOVTrack *track, int64_t moof_offset)
2392 {
2393     int64_t pos = avio_tell(pb);
2394     uint32_t flags = MOV_TFHD_DEFAULT_SIZE | MOV_TFHD_DEFAULT_DURATION |
2395                      MOV_TFHD_BASE_DATA_OFFSET;
2396     if (!track->entry) {
2397         flags |= MOV_TFHD_DURATION_IS_EMPTY;
2398     } else {
2399         flags |= MOV_TFHD_DEFAULT_FLAGS;
2400     }
2401     if (mov->flags & FF_MOV_FLAG_OMIT_TFHD_OFFSET)
2402         flags &= ~MOV_TFHD_BASE_DATA_OFFSET;
2403     if (mov->flags & FF_MOV_FLAG_DEFAULT_BASE_MOOF) {
2404         flags &= ~MOV_TFHD_BASE_DATA_OFFSET;
2405         flags |= MOV_TFHD_DEFAULT_BASE_IS_MOOF;
2406     }
2407
2408     /* Don't set a default sample size, the silverlight player refuses
2409      * to play files with that set. Don't set a default sample duration,
2410      * WMP freaks out if it is set. Don't set a base data offset, PIFF
2411      * file format says it MUST NOT be set. */
2412     if (track->mode == MODE_ISM)
2413         flags &= ~(MOV_TFHD_DEFAULT_SIZE | MOV_TFHD_DEFAULT_DURATION |
2414                    MOV_TFHD_BASE_DATA_OFFSET);
2415
2416     avio_wb32(pb, 0); /* size placeholder */
2417     ffio_wfourcc(pb, "tfhd");
2418     avio_w8(pb, 0); /* version */
2419     avio_wb24(pb, flags);
2420
2421     avio_wb32(pb, track->track_id); /* track-id */
2422     if (flags & MOV_TFHD_BASE_DATA_OFFSET)
2423         avio_wb64(pb, moof_offset);
2424     if (flags & MOV_TFHD_DEFAULT_DURATION) {
2425         track->default_duration = get_cluster_duration(track, 0);
2426         avio_wb32(pb, track->default_duration);
2427     }
2428     if (flags & MOV_TFHD_DEFAULT_SIZE) {
2429         track->default_size = track->entry ? track->cluster[0].size : 1;
2430         avio_wb32(pb, track->default_size);
2431     } else
2432         track->default_size = -1;
2433
2434     if (flags & MOV_TFHD_DEFAULT_FLAGS) {
2435         track->default_sample_flags =
2436             track->enc->codec_type == AVMEDIA_TYPE_VIDEO ?
2437             (MOV_FRAG_SAMPLE_FLAG_DEPENDS_YES | MOV_FRAG_SAMPLE_FLAG_IS_NON_SYNC) :
2438             MOV_FRAG_SAMPLE_FLAG_DEPENDS_NO;
2439         avio_wb32(pb, track->default_sample_flags);
2440     }
2441
2442     return update_size(pb, pos);
2443 }
2444
2445 static uint32_t get_sample_flags(MOVTrack *track, MOVIentry *entry)
2446 {
2447     return entry->flags & MOV_SYNC_SAMPLE ? MOV_FRAG_SAMPLE_FLAG_DEPENDS_NO :
2448            (MOV_FRAG_SAMPLE_FLAG_DEPENDS_YES | MOV_FRAG_SAMPLE_FLAG_IS_NON_SYNC);
2449 }
2450
2451 static int mov_write_trun_tag(AVIOContext *pb, MOVMuxContext *mov,
2452                               MOVTrack *track, int moof_size)
2453 {
2454     int64_t pos = avio_tell(pb);
2455     uint32_t flags = MOV_TRUN_DATA_OFFSET;
2456     int i;
2457
2458     for (i = 0; i < track->entry; i++) {
2459         if (get_cluster_duration(track, i) != track->default_duration)
2460             flags |= MOV_TRUN_SAMPLE_DURATION;
2461         if (track->cluster[i].size != track->default_size)
2462             flags |= MOV_TRUN_SAMPLE_SIZE;
2463         if (i > 0 && get_sample_flags(track, &track->cluster[i]) != track->default_sample_flags)
2464             flags |= MOV_TRUN_SAMPLE_FLAGS;
2465     }
2466     if (!(flags & MOV_TRUN_SAMPLE_FLAGS))
2467         flags |= MOV_TRUN_FIRST_SAMPLE_FLAGS;
2468     if (track->flags & MOV_TRACK_CTTS)
2469         flags |= MOV_TRUN_SAMPLE_CTS;
2470
2471     avio_wb32(pb, 0); /* size placeholder */
2472     ffio_wfourcc(pb, "trun");
2473     avio_w8(pb, 0); /* version */
2474     avio_wb24(pb, flags);
2475
2476     avio_wb32(pb, track->entry); /* sample count */
2477     if (mov->flags & FF_MOV_FLAG_OMIT_TFHD_OFFSET &&
2478         !(mov->flags & FF_MOV_FLAG_DEFAULT_BASE_MOOF) &&
2479         !mov->first_trun)
2480         avio_wb32(pb, 0); /* Later tracks follow immediately after the previous one */
2481     else
2482         avio_wb32(pb, moof_size + 8 + track->data_offset +
2483                       track->cluster[0].pos); /* data offset */
2484     if (flags & MOV_TRUN_FIRST_SAMPLE_FLAGS)
2485         avio_wb32(pb, get_sample_flags(track, &track->cluster[0]));
2486
2487     for (i = 0; i < track->entry; i++) {
2488         if (flags & MOV_TRUN_SAMPLE_DURATION)
2489             avio_wb32(pb, get_cluster_duration(track, i));
2490         if (flags & MOV_TRUN_SAMPLE_SIZE)
2491             avio_wb32(pb, track->cluster[i].size);
2492         if (flags & MOV_TRUN_SAMPLE_FLAGS)
2493             avio_wb32(pb, get_sample_flags(track, &track->cluster[i]));
2494         if (flags & MOV_TRUN_SAMPLE_CTS)
2495             avio_wb32(pb, track->cluster[i].cts);
2496     }
2497
2498     mov->first_trun = 0;
2499     return update_size(pb, pos);
2500 }
2501
2502 static int mov_write_tfxd_tag(AVIOContext *pb, MOVTrack *track)
2503 {
2504     int64_t pos = avio_tell(pb);
2505     const uint8_t uuid[] = {
2506         0x6d, 0x1d, 0x9b, 0x05, 0x42, 0xd5, 0x44, 0xe6,
2507         0x80, 0xe2, 0x14, 0x1d, 0xaf, 0xf7, 0x57, 0xb2
2508     };
2509
2510     avio_wb32(pb, 0); /* size placeholder */
2511     ffio_wfourcc(pb, "uuid");
2512     avio_write(pb, uuid, sizeof(uuid));
2513     avio_w8(pb, 1);
2514     avio_wb24(pb, 0);
2515     avio_wb64(pb, track->frag_start);
2516     avio_wb64(pb, track->start_dts + track->track_duration -
2517                   track->cluster[0].dts);
2518
2519     return update_size(pb, pos);
2520 }
2521
2522 static int mov_write_tfrf_tag(AVIOContext *pb, MOVMuxContext *mov,
2523                               MOVTrack *track, int entry)
2524 {
2525     int n = track->nb_frag_info - 1 - entry, i;
2526     int size = 8 + 16 + 4 + 1 + 16*n;
2527     const uint8_t uuid[] = {
2528         0xd4, 0x80, 0x7e, 0xf2, 0xca, 0x39, 0x46, 0x95,
2529         0x8e, 0x54, 0x26, 0xcb, 0x9e, 0x46, 0xa7, 0x9f
2530     };
2531
2532     if (entry < 0)
2533         return 0;
2534
2535     avio_seek(pb, track->frag_info[entry].tfrf_offset, SEEK_SET);
2536     avio_wb32(pb, size);
2537     ffio_wfourcc(pb, "uuid");
2538     avio_write(pb, uuid, sizeof(uuid));
2539     avio_w8(pb, 1);
2540     avio_wb24(pb, 0);
2541     avio_w8(pb, n);
2542     for (i = 0; i < n; i++) {
2543         int index = entry + 1 + i;
2544         avio_wb64(pb, track->frag_info[index].time);
2545         avio_wb64(pb, track->frag_info[index].duration);
2546     }
2547     if (n < mov->ism_lookahead) {
2548         int free_size = 16 * (mov->ism_lookahead - n);
2549         avio_wb32(pb, free_size);
2550         ffio_wfourcc(pb, "free");
2551         for (i = 0; i < free_size - 8; i++)
2552             avio_w8(pb, 0);
2553     }
2554
2555     return 0;
2556 }
2557
2558 static int mov_write_tfrf_tags(AVIOContext *pb, MOVMuxContext *mov,
2559                                MOVTrack *track)
2560 {
2561     int64_t pos = avio_tell(pb);
2562     int i;
2563     for (i = 0; i < mov->ism_lookahead; i++) {
2564         /* Update the tfrf tag for the last ism_lookahead fragments,
2565          * nb_frag_info - 1 is the next fragment to be written. */
2566         mov_write_tfrf_tag(pb, mov, track, track->nb_frag_info - 2 - i);
2567     }
2568     avio_seek(pb, pos, SEEK_SET);
2569     return 0;
2570 }
2571
2572 static int mov_add_tfra_entries(AVIOContext *pb, MOVMuxContext *mov, int tracks,
2573                                 int size)
2574 {
2575     int i;
2576     for (i = 0; i < mov->nb_streams; i++) {
2577         MOVTrack *track = &mov->tracks[i];
2578         MOVFragmentInfo *info;
2579         if ((tracks >= 0 && i != tracks) || !track->entry)
2580             continue;
2581         track->nb_frag_info++;
2582         if (track->nb_frag_info >= track->frag_info_capacity) {
2583             unsigned new_capacity = track->nb_frag_info + MOV_FRAG_INFO_ALLOC_INCREMENT;
2584             if (av_reallocp_array(&track->frag_info,
2585                                   new_capacity,
2586                                   sizeof(*track->frag_info)))
2587                 return AVERROR(ENOMEM);
2588             track->frag_info_capacity = new_capacity;
2589         }
2590         info = &track->frag_info[track->nb_frag_info - 1];
2591         info->offset   = avio_tell(pb);
2592         info->size     = size;
2593         // Try to recreate the original pts for the first packet
2594         // from the fields we have stored
2595         info->time     = track->start_dts + track->frag_start +
2596                          track->cluster[0].cts;
2597         // If the pts is less than zero, we will have trimmed
2598         // away parts of the media track using an edit list,
2599         // and the corresponding start presentation time is zero.
2600         if (info->time < 0)
2601             info->time = 0;
2602         info->duration = track->start_dts + track->track_duration -
2603                          track->cluster[0].dts;
2604         info->tfrf_offset = 0;
2605         mov_write_tfrf_tags(pb, mov, track);
2606     }
2607     return 0;
2608 }
2609
2610 static int mov_write_tfdt_tag(AVIOContext *pb, MOVTrack *track)
2611 {
2612     int64_t pos = avio_tell(pb);
2613
2614     avio_wb32(pb, 0); /* size */
2615     ffio_wfourcc(pb, "tfdt");
2616     avio_w8(pb, 1); /* version */
2617     avio_wb24(pb, 0);
2618     avio_wb64(pb, track->frag_start);
2619     return update_size(pb, pos);
2620 }
2621
2622 static int mov_write_traf_tag(AVIOContext *pb, MOVMuxContext *mov,
2623                               MOVTrack *track, int64_t moof_offset,
2624                               int moof_size)
2625 {
2626     int64_t pos = avio_tell(pb);
2627     avio_wb32(pb, 0); /* size placeholder */
2628     ffio_wfourcc(pb, "traf");
2629
2630     mov_write_tfhd_tag(pb, mov, track, moof_offset);
2631     if (mov->mode != MODE_ISM)
2632         mov_write_tfdt_tag(pb, track);
2633     mov_write_trun_tag(pb, mov, track, moof_size);
2634     if (mov->mode == MODE_ISM) {
2635         mov_write_tfxd_tag(pb, track);
2636
2637         if (mov->ism_lookahead) {
2638             int i, size = 16 + 4 + 1 + 16 * mov->ism_lookahead;
2639
2640             if (track->nb_frag_info > 0) {
2641                 MOVFragmentInfo *info = &track->frag_info[track->nb_frag_info - 1];
2642                 if (!info->tfrf_offset)
2643                     info->tfrf_offset = avio_tell(pb);
2644             }
2645             avio_wb32(pb, 8 + size);
2646             ffio_wfourcc(pb, "free");
2647             for (i = 0; i < size; i++)
2648                 avio_w8(pb, 0);
2649         }
2650     }
2651
2652     return update_size(pb, pos);
2653 }
2654
2655 static int mov_write_moof_tag_internal(AVIOContext *pb, MOVMuxContext *mov,
2656                                        int tracks, int moof_size)
2657 {
2658     int64_t pos = avio_tell(pb);
2659     int i;
2660
2661     avio_wb32(pb, 0); /* size placeholder */
2662     ffio_wfourcc(pb, "moof");
2663     mov->first_trun = 1;
2664
2665     mov_write_mfhd_tag(pb, mov);
2666     for (i = 0; i < mov->nb_streams; i++) {
2667         MOVTrack *track = &mov->tracks[i];
2668         if (tracks >= 0 && i != tracks)
2669             continue;
2670         if (!track->entry)
2671             continue;
2672         mov_write_traf_tag(pb, mov, track, pos, moof_size);
2673     }
2674
2675     return update_size(pb, pos);
2676 }
2677
2678 static int mov_write_sidx_tag(AVIOContext *pb,
2679                               MOVTrack *track, int ref_size, int total_sidx_size)
2680 {
2681     int64_t pos = avio_tell(pb), offset_pos, end_pos;
2682     int64_t presentation_time, duration, offset;
2683     int starts_with_SAP, i, entries;
2684
2685     if (track->entry) {
2686         entries = 1;
2687         presentation_time = track->start_dts + track->frag_start +
2688                             track->cluster[0].cts;
2689         duration = track->start_dts + track->track_duration -
2690                    track->cluster[0].dts;
2691         starts_with_SAP = track->cluster[0].flags & MOV_SYNC_SAMPLE;
2692     } else {
2693         entries = track->nb_frag_info;
2694         presentation_time = track->frag_info[0].time;
2695     }
2696
2697     // pts<0 should be cut away using edts
2698     if (presentation_time < 0)
2699         presentation_time = 0;
2700
2701     avio_wb32(pb, 0); /* size */
2702     ffio_wfourcc(pb, "sidx");
2703     avio_w8(pb, 1); /* version */
2704     avio_wb24(pb, 0);
2705     avio_wb32(pb, track->track_id); /* reference_ID */
2706     avio_wb32(pb, track->timescale); /* timescale */
2707     avio_wb64(pb, presentation_time); /* earliest_presentation_time */
2708     offset_pos = avio_tell(pb);
2709     avio_wb64(pb, 0); /* first_offset (offset to referenced moof) */
2710     avio_wb16(pb, 0); /* reserved */
2711
2712     avio_wb16(pb, entries); /* reference_count */
2713     for (i = 0; i < entries; i++) {
2714         if (!track->entry) {
2715             if (i > 1 && track->frag_info[i].offset != track->frag_info[i - 1].offset + track->frag_info[i - 1].size) {
2716                av_log(NULL, AV_LOG_ERROR, "Non-consecutive fragments, writing incorrect sidx\n");
2717             }
2718             duration = track->frag_info[i].duration;
2719             ref_size = track->frag_info[i].size;
2720             starts_with_SAP = 1;
2721         }
2722         avio_wb32(pb, (0 << 31) | (ref_size & 0x7fffffff)); /* reference_type (0 = media) | referenced_size */
2723         avio_wb32(pb, duration); /* subsegment_duration */
2724         avio_wb32(pb, (starts_with_SAP << 31) | (0 << 28) | 0); /* starts_with_SAP | SAP_type | SAP_delta_time */
2725     }
2726
2727     end_pos = avio_tell(pb);
2728     offset = pos + total_sidx_size - end_pos;
2729     avio_seek(pb, offset_pos, SEEK_SET);
2730     avio_wb64(pb, offset);
2731     avio_seek(pb, end_pos, SEEK_SET);
2732     return update_size(pb, pos);
2733 }
2734
2735 static int mov_write_sidx_tags(AVIOContext *pb, MOVMuxContext *mov,
2736                                int tracks, int ref_size)
2737 {
2738     int i, round, ret;
2739     AVIOContext *avio_buf;
2740     int total_size = 0;
2741     for (round = 0; round < 2; round++) {
2742         // First run one round to calculate the total size of all
2743         // sidx atoms.
2744         // This would be much simpler if we'd only write one sidx
2745         // atom, for the first track in the moof.
2746         if (round == 0) {
2747             if ((ret = ffio_open_null_buf(&avio_buf)) < 0)
2748                 return ret;
2749         } else {
2750             avio_buf = pb;
2751         }
2752         for (i = 0; i < mov->nb_streams; i++) {
2753             MOVTrack *track = &mov->tracks[i];
2754             if (tracks >= 0 && i != tracks)
2755                 continue;
2756             // When writing a sidx for the full file, entry is 0, but
2757             // we want to include all tracks. ref_size is 0 in this case,
2758             // since we read it from frag_info instead.
2759             if (!track->entry && ref_size > 0)
2760                 continue;
2761             total_size -= mov_write_sidx_tag(avio_buf, track, ref_size,
2762                                              total_size);
2763         }
2764         if (round == 0)
2765             total_size = ffio_close_null_buf(avio_buf);
2766     }
2767     return 0;
2768 }
2769
2770 static int mov_write_moof_tag(AVIOContext *pb, MOVMuxContext *mov, int tracks,
2771                               int64_t mdat_size)
2772 {
2773     AVIOContext *avio_buf;
2774     int ret, moof_size;
2775
2776     if ((ret = ffio_open_null_buf(&avio_buf)) < 0)
2777         return ret;
2778     mov_write_moof_tag_internal(avio_buf, mov, tracks, 0);
2779     moof_size = ffio_close_null_buf(avio_buf);
2780
2781     if (mov->flags & FF_MOV_FLAG_DASH && !(mov->flags & FF_MOV_FLAG_FASTSTART))
2782         mov_write_sidx_tags(pb, mov, tracks, moof_size + 8 + mdat_size);
2783
2784     if ((ret = mov_add_tfra_entries(pb, mov, tracks, moof_size + 8 + mdat_size)) < 0)
2785         return ret;
2786
2787     return mov_write_moof_tag_internal(pb, mov, tracks, moof_size);
2788 }
2789
2790 static int mov_write_tfra_tag(AVIOContext *pb, MOVTrack *track)
2791 {
2792     int64_t pos = avio_tell(pb);
2793     int i;
2794
2795     avio_wb32(pb, 0); /* size placeholder */
2796     ffio_wfourcc(pb, "tfra");
2797     avio_w8(pb, 1); /* version */
2798     avio_wb24(pb, 0);
2799
2800     avio_wb32(pb, track->track_id);
2801     avio_wb32(pb, 0); /* length of traf/trun/sample num */
2802     avio_wb32(pb, track->nb_frag_info);
2803     for (i = 0; i < track->nb_frag_info; i++) {
2804         avio_wb64(pb, track->frag_info[i].time);
2805         avio_wb64(pb, track->frag_info[i].offset + track->data_offset);
2806         avio_w8(pb, 1); /* traf number */
2807         avio_w8(pb, 1); /* trun number */
2808         avio_w8(pb, 1); /* sample number */
2809     }
2810
2811     return update_size(pb, pos);
2812 }
2813
2814 static int mov_write_mfra_tag(AVIOContext *pb, MOVMuxContext *mov)
2815 {
2816     int64_t pos = avio_tell(pb);
2817     int i;
2818
2819     avio_wb32(pb, 0); /* size placeholder */
2820     ffio_wfourcc(pb, "mfra");
2821     /* An empty mfra atom is enough to indicate to the publishing point that
2822      * the stream has ended. */
2823     if (mov->flags & FF_MOV_FLAG_ISML)
2824         return update_size(pb, pos);
2825
2826     for (i = 0; i < mov->nb_streams; i++) {
2827         MOVTrack *track = &mov->tracks[i];
2828         if (track->nb_frag_info)
2829             mov_write_tfra_tag(pb, track);
2830     }
2831
2832     avio_wb32(pb, 16);
2833     ffio_wfourcc(pb, "mfro");
2834     avio_wb32(pb, 0); /* version + flags */
2835     avio_wb32(pb, avio_tell(pb) + 4 - pos);
2836
2837     return update_size(pb, pos);
2838 }
2839
2840 static int mov_write_mdat_tag(AVIOContext *pb, MOVMuxContext *mov)
2841 {
2842     avio_wb32(pb, 8);    // placeholder for extended size field (64 bit)
2843     ffio_wfourcc(pb, mov->mode == MODE_MOV ? "wide" : "free");
2844
2845     mov->mdat_pos = avio_tell(pb);
2846     avio_wb32(pb, 0); /* size placeholder*/
2847     ffio_wfourcc(pb, "mdat");
2848     return 0;
2849 }
2850
2851 /* TODO: This needs to be more general */
2852 static int mov_write_ftyp_tag(AVIOContext *pb, AVFormatContext *s)
2853 {
2854     MOVMuxContext *mov = s->priv_data;
2855     int64_t pos = avio_tell(pb);
2856     int has_h264 = 0, has_video = 0;
2857     int minor = 0x200;
2858     int i;
2859
2860     for (i = 0; i < s->nb_streams; i++) {
2861         AVStream *st = s->streams[i];
2862         if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO)
2863             has_video = 1;
2864         if (st->codec->codec_id == AV_CODEC_ID_H264)
2865             has_h264 = 1;
2866     }
2867
2868     avio_wb32(pb, 0); /* size */
2869     ffio_wfourcc(pb, "ftyp");
2870
2871     if (mov->major_brand && strlen(mov->major_brand) >= 4)
2872         ffio_wfourcc(pb, mov->major_brand);
2873     else if (mov->mode == MODE_3GP) {
2874         ffio_wfourcc(pb, has_h264 ? "3gp6"  : "3gp4");
2875         minor =     has_h264 ?   0x100 :   0x200;
2876     } else if (mov->mode & MODE_3G2) {
2877         ffio_wfourcc(pb, has_h264 ? "3g2b"  : "3g2a");
2878         minor =     has_h264 ? 0x20000 : 0x10000;
2879     } else if (mov->mode == MODE_PSP)
2880         ffio_wfourcc(pb, "MSNV");
2881     else if (mov->mode == MODE_MP4 && mov->flags & FF_MOV_FLAG_DEFAULT_BASE_MOOF)
2882         ffio_wfourcc(pb, "iso5"); // Required when using default-base-is-moof
2883     else if (mov->mode == MODE_MP4)
2884         ffio_wfourcc(pb, "isom");
2885     else if (mov->mode == MODE_IPOD)
2886         ffio_wfourcc(pb, has_video ? "M4V ":"M4A ");
2887     else if (mov->mode == MODE_ISM)
2888         ffio_wfourcc(pb, "isml");
2889     else if (mov->mode == MODE_F4V)
2890         ffio_wfourcc(pb, "f4v ");
2891     else
2892         ffio_wfourcc(pb, "qt  ");
2893
2894     avio_wb32(pb, minor);
2895
2896     if (mov->mode == MODE_MOV)
2897         ffio_wfourcc(pb, "qt  ");
2898     else if (mov->mode == MODE_ISM) {
2899         ffio_wfourcc(pb, "piff");
2900     } else if (!(mov->flags & FF_MOV_FLAG_DEFAULT_BASE_MOOF)) {
2901         ffio_wfourcc(pb, "isom");
2902         ffio_wfourcc(pb, "iso2");
2903         if (has_h264)
2904             ffio_wfourcc(pb, "avc1");
2905     }
2906
2907     // We add tfdt atoms when fragmenting, signal this with the iso6 compatible
2908     // brand. This is compatible with users that don't understand tfdt.
2909     if (mov->flags & FF_MOV_FLAG_FRAGMENT && mov->mode != MODE_ISM)
2910         ffio_wfourcc(pb, "iso6");
2911
2912     if (mov->mode == MODE_3GP)
2913         ffio_wfourcc(pb, has_h264 ? "3gp6":"3gp4");
2914     else if (mov->mode & MODE_3G2)
2915         ffio_wfourcc(pb, has_h264 ? "3g2b":"3g2a");
2916     else if (mov->mode == MODE_PSP)
2917         ffio_wfourcc(pb, "MSNV");
2918     else if (mov->mode == MODE_MP4)
2919         ffio_wfourcc(pb, "mp41");
2920
2921     if (mov->flags & FF_MOV_FLAG_DASH && mov->flags & FF_MOV_FLAG_FASTSTART)
2922         ffio_wfourcc(pb, "dash");
2923
2924     return update_size(pb, pos);
2925 }
2926
2927 static void mov_write_uuidprof_tag(AVIOContext *pb, AVFormatContext *s)
2928 {
2929     AVStream       *video_st    = s->streams[0];
2930     AVCodecContext *video_codec = s->streams[0]->codec;
2931     AVCodecContext *audio_codec = s->streams[1]->codec;
2932     int audio_rate = audio_codec->sample_rate;
2933     // TODO: should be avg_frame_rate
2934     int frame_rate = ((video_st->time_base.den) * (0x10000)) / (video_st->time_base.num);
2935     int audio_kbitrate = audio_codec->bit_rate / 1000;
2936     int video_kbitrate = FFMIN(video_codec->bit_rate / 1000, 800 - audio_kbitrate);
2937
2938     avio_wb32(pb, 0x94); /* size */
2939     ffio_wfourcc(pb, "uuid");
2940     ffio_wfourcc(pb, "PROF");
2941
2942     avio_wb32(pb, 0x21d24fce); /* 96 bit UUID */
2943     avio_wb32(pb, 0xbb88695c);
2944     avio_wb32(pb, 0xfac9c740);
2945
2946     avio_wb32(pb, 0x0);  /* ? */
2947     avio_wb32(pb, 0x3);  /* 3 sections ? */
2948
2949     avio_wb32(pb, 0x14); /* size */
2950     ffio_wfourcc(pb, "FPRF");
2951     avio_wb32(pb, 0x0);  /* ? */
2952     avio_wb32(pb, 0x0);  /* ? */
2953     avio_wb32(pb, 0x0);  /* ? */
2954
2955     avio_wb32(pb, 0x2c);  /* size */
2956     ffio_wfourcc(pb, "APRF"); /* audio */
2957     avio_wb32(pb, 0x0);
2958     avio_wb32(pb, 0x2);   /* TrackID */
2959     ffio_wfourcc(pb, "mp4a");
2960     avio_wb32(pb, 0x20f);
2961     avio_wb32(pb, 0x0);
2962     avio_wb32(pb, audio_kbitrate);
2963     avio_wb32(pb, audio_kbitrate);
2964     avio_wb32(pb, audio_rate);
2965     avio_wb32(pb, audio_codec->channels);
2966
2967     avio_wb32(pb, 0x34);  /* size */
2968     ffio_wfourcc(pb, "VPRF");   /* video */
2969     avio_wb32(pb, 0x0);
2970     avio_wb32(pb, 0x1);    /* TrackID */
2971     if (video_codec->codec_id == AV_CODEC_ID_H264) {
2972         ffio_wfourcc(pb, "avc1");
2973         avio_wb16(pb, 0x014D);
2974         avio_wb16(pb, 0x0015);
2975     } else {
2976         ffio_wfourcc(pb, "mp4v");
2977         avio_wb16(pb, 0x0000);
2978         avio_wb16(pb, 0x0103);
2979     }
2980     avio_wb32(pb, 0x0);
2981     avio_wb32(pb, video_kbitrate);
2982     avio_wb32(pb, video_kbitrate);
2983     avio_wb32(pb, frame_rate);
2984     avio_wb32(pb, frame_rate);
2985     avio_wb16(pb, video_codec->width);
2986     avio_wb16(pb, video_codec->height);
2987     avio_wb32(pb, 0x010001); /* ? */
2988 }
2989
2990 static int mov_parse_mpeg2_frame(AVPacket *pkt, uint32_t *flags)
2991 {
2992     uint32_t c = -1;
2993     int i, closed_gop = 0;
2994
2995     for (i = 0; i < pkt->size - 4; i++) {
2996         c = (c << 8) + pkt->data[i];
2997         if (c == 0x1b8) { // gop
2998             closed_gop = pkt->data[i + 4] >> 6 & 0x01;
2999         } else if (c == 0x100) { // pic
3000             int temp_ref = (pkt->data[i + 1] << 2) | (pkt->data[i + 2] >> 6);
3001             if (!temp_ref || closed_gop) // I picture is not reordered
3002                 *flags = MOV_SYNC_SAMPLE;
3003             else
3004                 *flags = MOV_PARTIAL_SYNC_SAMPLE;
3005             break;
3006         }
3007     }
3008     return 0;
3009 }
3010
3011 static void mov_parse_vc1_frame(AVPacket *pkt, MOVTrack *trk, int fragment)
3012 {
3013     const uint8_t *start, *next, *end = pkt->data + pkt->size;
3014     int seq = 0, entry = 0;
3015     int key = pkt->flags & AV_PKT_FLAG_KEY;
3016     start = find_next_marker(pkt->data, end);
3017     for (next = start; next < end; start = next) {
3018         next = find_next_marker(start + 4, end);
3019         switch (AV_RB32(start)) {
3020         case VC1_CODE_SEQHDR:
3021             seq = 1;
3022             break;
3023         case VC1_CODE_ENTRYPOINT:
3024             entry = 1;
3025             break;
3026         case VC1_CODE_SLICE:
3027             trk->vc1_info.slices = 1;
3028             break;
3029         }
3030     }
3031     if (!trk->entry && !fragment) {
3032         /* First packet in first fragment */
3033         trk->vc1_info.first_packet_seq   = seq;
3034         trk->vc1_info.first_packet_entry = entry;
3035     } else if ((seq && !trk->vc1_info.packet_seq) ||
3036                (entry && !trk->vc1_info.packet_entry)) {
3037         int i;
3038         for (i = 0; i < trk->entry; i++)
3039             trk->cluster[i].flags &= ~MOV_SYNC_SAMPLE;
3040         trk->has_keyframes = 0;
3041         if (seq)
3042             trk->vc1_info.packet_seq = 1;
3043         if (entry)
3044             trk->vc1_info.packet_entry = 1;
3045         if (!fragment) {
3046             /* First fragment */
3047             if ((!seq   || trk->vc1_info.first_packet_seq) &&
3048                 (!entry || trk->vc1_info.first_packet_entry)) {
3049                 /* First packet had the same headers as this one, readd the
3050                  * sync sample flag. */
3051                 trk->cluster[0].flags |= MOV_SYNC_SAMPLE;
3052                 trk->has_keyframes = 1;
3053             }
3054         }
3055     }
3056     if (trk->vc1_info.packet_seq && trk->vc1_info.packet_entry)
3057         key = seq && entry;
3058     else if (trk->vc1_info.packet_seq)
3059         key = seq;
3060     else if (trk->vc1_info.packet_entry)
3061         key = entry;
3062     if (key) {
3063         trk->cluster[trk->entry].flags |= MOV_SYNC_SAMPLE;
3064         trk->has_keyframes++;
3065     }
3066 }
3067
3068 static int mov_flush_fragment(AVFormatContext *s)
3069 {
3070     MOVMuxContext *mov = s->priv_data;
3071     int i, first_track = -1;
3072     int64_t mdat_size = 0;
3073
3074     if (!(mov->flags & FF_MOV_FLAG_FRAGMENT))
3075         return 0;
3076
3077     if (!(mov->flags & FF_MOV_FLAG_EMPTY_MOOV) && mov->fragments == 0) {
3078         int64_t pos = avio_tell(s->pb);
3079         int ret;
3080         AVIOContext *moov_buf;
3081         uint8_t *buf;
3082         int buf_size;
3083
3084         for (i = 0; i < mov->nb_streams; i++)
3085             if (!mov->tracks[i].entry)
3086                 break;
3087         /* Don't write the initial moov unless all tracks have data */
3088         if (i < mov->nb_streams)
3089             return 0;
3090
3091         if ((ret = ffio_open_null_buf(&moov_buf)) < 0)
3092             return ret;
3093         mov_write_moov_tag(moov_buf, mov, s);
3094         buf_size = ffio_close_null_buf(moov_buf);
3095         for (i = 0; i < mov->nb_streams; i++)
3096             mov->tracks[i].data_offset = pos + buf_size + 8;
3097
3098         mov_write_moov_tag(s->pb, mov, s);
3099
3100         buf_size = avio_close_dyn_buf(mov->mdat_buf, &buf);
3101         mov->mdat_buf = NULL;
3102         avio_wb32(s->pb, buf_size + 8);
3103         ffio_wfourcc(s->pb, "mdat");
3104         avio_write(s->pb, buf, buf_size);
3105         av_free(buf);
3106
3107         mov->fragments++;
3108         mov->mdat_size = 0;
3109         for (i = 0; i < mov->nb_streams; i++) {
3110             if (mov->tracks[i].entry)
3111                 mov->tracks[i].frag_start += mov->tracks[i].start_dts +
3112                                              mov->tracks[i].track_duration -
3113                                              mov->tracks[i].cluster[0].dts;
3114             mov->tracks[i].entry = 0;
3115         }
3116         avio_flush(s->pb);
3117         return 0;
3118     }
3119
3120     for (i = 0; i < mov->nb_streams; i++) {
3121         MOVTrack *track = &mov->tracks[i];
3122         if (mov->flags & FF_MOV_FLAG_SEPARATE_MOOF)
3123             track->data_offset = 0;
3124         else
3125             track->data_offset = mdat_size;
3126         if (!track->mdat_buf)
3127             continue;
3128         mdat_size += avio_tell(track->mdat_buf);
3129         if (first_track < 0)
3130             first_track = i;
3131     }
3132
3133     if (!mdat_size)
3134         return 0;
3135
3136     for (i = 0; i < mov->nb_streams; i++) {
3137         MOVTrack *track = &mov->tracks[i];
3138         int buf_size, write_moof = 1, moof_tracks = -1;
3139         uint8_t *buf;
3140         int64_t duration = 0;
3141
3142         if (track->entry)
3143             duration = track->start_dts + track->track_duration -
3144                        track->cluster[0].dts;
3145         if (mov->flags & FF_MOV_FLAG_SEPARATE_MOOF) {
3146             if (!track->mdat_buf)
3147                 continue;
3148             mdat_size = avio_tell(track->mdat_buf);
3149             moof_tracks = i;
3150         } else {
3151             write_moof = i == first_track;
3152         }
3153
3154         if (write_moof) {
3155             avio_flush(s->pb);
3156
3157             mov_write_moof_tag(s->pb, mov, moof_tracks, mdat_size);
3158             mov->fragments++;
3159
3160             avio_wb32(s->pb, mdat_size + 8);
3161             ffio_wfourcc(s->pb, "mdat");
3162         }
3163
3164         if (track->entry)
3165             track->frag_start += duration;
3166         track->entry = 0;
3167         if (!track->mdat_buf)
3168             continue;
3169         buf_size = avio_close_dyn_buf(track->mdat_buf, &buf);
3170         track->mdat_buf = NULL;
3171
3172         avio_write(s->pb, buf, buf_size);
3173         av_free(buf);
3174     }
3175
3176     mov->mdat_size = 0;
3177
3178     avio_flush(s->pb);
3179     return 0;
3180 }
3181
3182 int ff_mov_write_packet(AVFormatContext *s, AVPacket *pkt)
3183 {
3184     MOVMuxContext *mov = s->priv_data;
3185     AVIOContext *pb = s->pb;
3186     MOVTrack *trk = &mov->tracks[pkt->stream_index];
3187     AVCodecContext *enc = trk->enc;
3188     unsigned int samples_in_chunk = 0;
3189     int size = pkt->size, ret = 0;
3190     uint8_t *reformatted_data = NULL;
3191
3192     if (mov->flags & FF_MOV_FLAG_FRAGMENT) {
3193         int ret;
3194         if (mov->fragments > 0) {
3195             if (!trk->mdat_buf) {
3196                 if ((ret = avio_open_dyn_buf(&trk->mdat_buf)) < 0)
3197                     return ret;
3198             }
3199             pb = trk->mdat_buf;
3200         } else {
3201             if (!mov->mdat_buf) {
3202                 if ((ret = avio_open_dyn_buf(&mov->mdat_buf)) < 0)
3203                     return ret;
3204             }
3205             pb = mov->mdat_buf;
3206         }
3207     }
3208
3209     if (enc->codec_id == AV_CODEC_ID_AMR_NB) {
3210         /* We must find out how many AMR blocks there are in one packet */
3211         static uint16_t packed_size[16] =
3212             {13, 14, 16, 18, 20, 21, 27, 32, 6, 0, 0, 0, 0, 0, 0, 1};
3213         int len = 0;
3214
3215         while (len < size && samples_in_chunk < 100) {
3216             len += packed_size[(pkt->data[len] >> 3) & 0x0F];
3217             samples_in_chunk++;
3218         }
3219         if (samples_in_chunk > 1) {
3220             av_log(s, AV_LOG_ERROR, "fatal error, input is not a single packet, implement a AVParser for it\n");
3221             return -1;
3222         }
3223     } else if (trk->sample_size)
3224         samples_in_chunk = size / trk->sample_size;
3225     else
3226         samples_in_chunk = 1;
3227
3228     /* copy extradata if it exists */
3229     if (trk->vos_len == 0 && enc->extradata_size > 0) {
3230         trk->vos_len  = enc->extradata_size;
3231         trk->vos_data = av_malloc(trk->vos_len);
3232         memcpy(trk->vos_data, enc->extradata, trk->vos_len);
3233     }
3234
3235     if (enc->codec_id == AV_CODEC_ID_H264 && trk->vos_len > 0 && *(uint8_t *)trk->vos_data != 1) {
3236         /* from x264 or from bytestream h264 */
3237         /* nal reformating needed */
3238         if (trk->hint_track >= 0 && trk->hint_track < mov->nb_streams) {
3239             ff_avc_parse_nal_units_buf(pkt->data, &reformatted_data,
3240                                        &size);
3241             avio_write(pb, reformatted_data, size);
3242         } else {
3243             size = ff_avc_parse_nal_units(pb, pkt->data, pkt->size);
3244         }
3245     } else if (enc->codec_id == AV_CODEC_ID_HEVC && trk->vos_len > 6 &&
3246                (AV_RB24(trk->vos_data) == 1 || AV_RB32(trk->vos_data) == 1)) {
3247         /* extradata is Annex B, assume the bitstream is too and convert it */
3248         if (trk->hint_track >= 0 && trk->hint_track < mov->nb_streams) {
3249             ff_hevc_annexb2mp4_buf(pkt->data, &reformatted_data, &size, 0, NULL);
3250             avio_write(pb, reformatted_data, size);
3251         } else {
3252             size = ff_hevc_annexb2mp4(pb, pkt->data, pkt->size, 0, NULL);
3253         }
3254     } else {
3255         avio_write(pb, pkt->data, size);
3256     }
3257
3258     if ((enc->codec_id == AV_CODEC_ID_DNXHD ||
3259          enc->codec_id == AV_CODEC_ID_AC3) && !trk->vos_len) {
3260         /* copy frame to create needed atoms */
3261         trk->vos_len  = size;
3262         trk->vos_data = av_malloc(size);
3263         if (!trk->vos_data) {
3264             ret = AVERROR(ENOMEM);
3265             goto err;
3266         }
3267         memcpy(trk->vos_data, pkt->data, size);
3268     }
3269
3270     if (trk->entry >= trk->cluster_capacity) {
3271         unsigned new_capacity = 2 * (trk->entry + MOV_INDEX_CLUSTER_SIZE);
3272         if (av_reallocp_array(&trk->cluster, new_capacity,
3273                               sizeof(*trk->cluster))) {
3274             ret = AVERROR(ENOMEM);
3275             goto err;
3276         }
3277         trk->cluster_capacity = new_capacity;
3278     }
3279
3280     trk->cluster[trk->entry].pos              = avio_tell(pb) - size;
3281     trk->cluster[trk->entry].samples_in_chunk = samples_in_chunk;
3282     trk->cluster[trk->entry].size             = size;
3283     trk->cluster[trk->entry].entries          = samples_in_chunk;
3284     trk->cluster[trk->entry].dts              = pkt->dts;
3285     if (!trk->entry && trk->start_dts != AV_NOPTS_VALUE) {
3286         if (!trk->frag_discont) {
3287             /* First packet of a new fragment. We already wrote the duration
3288              * of the last packet of the previous fragment based on track_duration,
3289              * which might not exactly match our dts. Therefore adjust the dts
3290              * of this packet to be what the previous packets duration implies. */
3291             trk->cluster[trk->entry].dts = trk->start_dts + trk->track_duration;
3292         } else {
3293             /* New fragment, but discontinuous from previous fragments.
3294              * Pretend the duration sum of the earlier fragments is
3295              * pkt->dts - trk->start_dts. */
3296             trk->frag_start = pkt->dts - trk->start_dts;
3297             trk->frag_discont = 0;
3298         }
3299     }
3300     if (!trk->entry && trk->start_dts == AV_NOPTS_VALUE && !mov->use_editlist &&
3301         s->avoid_negative_ts == AVFMT_AVOID_NEG_TS_MAKE_ZERO) {
3302         /* Not using edit lists and shifting the first track to start from zero.
3303          * If the other streams start from a later timestamp, we won't be able
3304          * to signal the difference in starting time without an edit list.
3305          * Thus move the timestamp for this first sample to 0, increasing
3306          * its duration instead. */
3307         trk->cluster[trk->entry].dts = trk->start_dts = 0;
3308     }
3309     if (trk->start_dts == AV_NOPTS_VALUE) {
3310         trk->start_dts = pkt->dts;
3311         if (trk->frag_discont) {
3312             /* Pretend the whole stream started at dts=0, with earlier framgents
3313              * already written, with a duration summing up to pkt->dts. */
3314             trk->frag_start   = pkt->dts;
3315             trk->start_dts    = 0;
3316             trk->frag_discont = 0;
3317         } else if (pkt->dts && mov->flags & FF_MOV_FLAG_EMPTY_MOOV)
3318             av_log(s, AV_LOG_WARNING,
3319                    "Track %d starts with a nonzero dts %"PRId64". This "
3320                    "currently isn't handled correctly in combination with "
3321                    "empty_moov.\n", pkt->stream_index, pkt->dts);
3322     }
3323     trk->track_duration = pkt->dts - trk->start_dts + pkt->duration;
3324
3325     if (pkt->pts == AV_NOPTS_VALUE) {
3326         av_log(s, AV_LOG_WARNING, "pts has no value\n");
3327         pkt->pts = pkt->dts;
3328     }
3329     if (pkt->dts != pkt->pts)
3330         trk->flags |= MOV_TRACK_CTTS;
3331     trk->cluster[trk->entry].cts   = pkt->pts - pkt->dts;
3332     trk->cluster[trk->entry].flags = 0;
3333     if (enc->codec_id == AV_CODEC_ID_VC1) {
3334         mov_parse_vc1_frame(pkt, trk, mov->fragments);
3335     } else if (pkt->flags & AV_PKT_FLAG_KEY) {
3336         if (mov->mode == MODE_MOV && enc->codec_id == AV_CODEC_ID_MPEG2VIDEO &&
3337             trk->entry > 0) { // force sync sample for the first key frame
3338             mov_parse_mpeg2_frame(pkt, &trk->cluster[trk->entry].flags);
3339             if (trk->cluster[trk->entry].flags & MOV_PARTIAL_SYNC_SAMPLE)
3340                 trk->flags |= MOV_TRACK_STPS;
3341         } else {
3342             trk->cluster[trk->entry].flags = MOV_SYNC_SAMPLE;
3343         }
3344         if (trk->cluster[trk->entry].flags & MOV_SYNC_SAMPLE)
3345             trk->has_keyframes++;
3346     }
3347     trk->entry++;
3348     trk->sample_count += samples_in_chunk;
3349     mov->mdat_size    += size;
3350
3351     if (trk->hint_track >= 0 && trk->hint_track < mov->nb_streams)
3352         ff_mov_add_hinted_packet(s, pkt, trk->hint_track, trk->entry,
3353                                  reformatted_data, size);
3354
3355 err:
3356     av_free(reformatted_data);
3357     return ret;
3358 }
3359
3360 static int mov_write_packet(AVFormatContext *s, AVPacket *pkt)
3361 {
3362     if (!pkt) {
3363         mov_flush_fragment(s);
3364         return 1;
3365     } else {
3366         MOVMuxContext *mov = s->priv_data;
3367         MOVTrack *trk = &mov->tracks[pkt->stream_index];
3368         AVCodecContext *enc = trk->enc;
3369         int64_t frag_duration = 0;
3370         int size = pkt->size;
3371
3372         if (!pkt->size)
3373             return 0;             /* Discard 0 sized packets */
3374
3375         if (mov->flags & FF_MOV_FLAG_FRAG_DISCONT) {
3376             int i;
3377             for (i = 0; i < s->nb_streams; i++)
3378                 mov->tracks[i].frag_discont = 1;
3379             mov->flags &= ~FF_MOV_FLAG_FRAG_DISCONT;
3380         }
3381
3382         if (trk->entry)
3383             frag_duration = av_rescale_q(pkt->dts - trk->cluster[0].dts,
3384                                          s->streams[pkt->stream_index]->time_base,
3385                                          AV_TIME_BASE_Q);
3386         if ((mov->max_fragment_duration &&
3387              frag_duration >= mov->max_fragment_duration) ||
3388              (mov->max_fragment_size && mov->mdat_size + size >= mov->max_fragment_size) ||
3389              (mov->flags & FF_MOV_FLAG_FRAG_KEYFRAME &&
3390               enc->codec_type == AVMEDIA_TYPE_VIDEO &&
3391               trk->entry && pkt->flags & AV_PKT_FLAG_KEY)) {
3392             if (frag_duration >= mov->min_fragment_duration)
3393                 mov_flush_fragment(s);
3394         }
3395
3396         return ff_mov_write_packet(s, pkt);
3397     }
3398 }
3399
3400 // QuickTime chapters involve an additional text track with the chapter names
3401 // as samples, and a tref pointing from the other tracks to the chapter one.
3402 static int mov_create_chapter_track(AVFormatContext *s, int tracknum)
3403 {
3404     MOVMuxContext *mov = s->priv_data;
3405     MOVTrack *track = &mov->tracks[tracknum];
3406     AVPacket pkt = { .stream_index = tracknum, .flags = AV_PKT_FLAG_KEY };
3407     int i, len;
3408     // These properties are required to make QT recognize the chapter track
3409     uint8_t chapter_properties[43] = { 0, 0, 0, 0, 0, 0, 0, 1, };
3410
3411     track->mode = mov->mode;
3412     track->tag = MKTAG('t','e','x','t');
3413     track->timescale = MOV_TIMESCALE;
3414     track->enc = avcodec_alloc_context3(NULL);
3415     if (!track->enc)
3416         return AVERROR(ENOMEM);
3417     track->enc->codec_type = AVMEDIA_TYPE_SUBTITLE;
3418     track->enc->extradata = av_malloc(sizeof(chapter_properties));
3419     if (!track->enc->extradata)
3420         return AVERROR(ENOMEM);
3421     track->enc->extradata_size = sizeof(chapter_properties);
3422     memcpy(track->enc->extradata, chapter_properties, sizeof(chapter_properties));
3423
3424     for (i = 0; i < s->nb_chapters; i++) {
3425         AVChapter *c = s->chapters[i];
3426         AVDictionaryEntry *t;
3427
3428         int64_t end = av_rescale_q(c->end, c->time_base, (AVRational){1,MOV_TIMESCALE});
3429         pkt.pts = pkt.dts = av_rescale_q(c->start, c->time_base, (AVRational){1,MOV_TIMESCALE});
3430         pkt.duration = end - pkt.dts;
3431
3432         if ((t = av_dict_get(c->metadata, "title", NULL, 0))) {
3433             const char encd[12] = {
3434                 0x00, 0x00, 0x00, 0x0C,
3435                 'e',  'n',  'c',  'd',
3436                 0x00, 0x00, 0x01, 0x00 };
3437             len      = strlen(t->value);
3438             pkt.size = len + 2 + 12;
3439             pkt.data = av_malloc(pkt.size);
3440             if (!pkt.data)
3441                 return AVERROR(ENOMEM);
3442             AV_WB16(pkt.data, len);
3443             memcpy(pkt.data + 2, t->value, len);
3444             memcpy(pkt.data + len + 2, encd, sizeof(encd));
3445             ff_mov_write_packet(s, &pkt);
3446             av_freep(&pkt.data);
3447         }
3448     }
3449
3450     return 0;
3451 }
3452
3453 /*
3454  * st->disposition controls the "enabled" flag in the tkhd tag.
3455  * QuickTime will not play a track if it is not enabled.  So make sure
3456  * that one track of each type (audio, video, subtitle) is enabled.
3457  *
3458  * Subtitles are special.  For audio and video, setting "enabled" also
3459  * makes the track "default" (i.e. it is rendered when played). For
3460  * subtitles, an "enabled" subtitle is not rendered by default, but
3461  * if no subtitle is enabled, the subtitle menu in QuickTime will be
3462  * empty!
3463  */
3464 static void enable_tracks(AVFormatContext *s)
3465 {
3466     MOVMuxContext *mov = s->priv_data;
3467     int i;
3468     int enabled[AVMEDIA_TYPE_NB];
3469     int first[AVMEDIA_TYPE_NB];
3470
3471     for (i = 0; i < AVMEDIA_TYPE_NB; i++) {
3472         enabled[i] = 0;
3473         first[i] = -1;
3474     }
3475
3476     for (i = 0; i < s->nb_streams; i++) {
3477         AVStream *st = s->streams[i];
3478
3479         if (st->codec->codec_type <= AVMEDIA_TYPE_UNKNOWN ||
3480             st->codec->codec_type >= AVMEDIA_TYPE_NB)
3481             continue;
3482
3483         if (first[st->codec->codec_type] < 0)
3484             first[st->codec->codec_type] = i;
3485         if (st->disposition & AV_DISPOSITION_DEFAULT) {
3486             mov->tracks[i].flags |= MOV_TRACK_ENABLED;
3487             enabled[st->codec->codec_type]++;
3488         }
3489     }
3490
3491     for (i = 0; i < AVMEDIA_TYPE_NB; i++) {
3492         switch (i) {
3493         case AVMEDIA_TYPE_VIDEO:
3494         case AVMEDIA_TYPE_AUDIO:
3495         case AVMEDIA_TYPE_SUBTITLE:
3496             if (enabled[i] > 1)
3497                 mov->per_stream_grouping = 1;
3498             if (!enabled[i] && first[i] >= 0)
3499                 mov->tracks[first[i]].flags |= MOV_TRACK_ENABLED;
3500             break;
3501         }
3502     }
3503 }
3504
3505 static void mov_free(AVFormatContext *s)
3506 {
3507     MOVMuxContext *mov = s->priv_data;
3508     int i;
3509
3510     if (mov->chapter_track) {
3511         if (mov->tracks[mov->chapter_track].enc)
3512             av_free(mov->tracks[mov->chapter_track].enc->extradata);
3513         av_freep(&mov->tracks[mov->chapter_track].enc);
3514     }
3515
3516     for (i = 0; i < mov->nb_streams; i++) {
3517         if (mov->tracks[i].tag == MKTAG('r','t','p',' '))
3518             ff_mov_close_hinting(&mov->tracks[i]);
3519         av_freep(&mov->tracks[i].cluster);
3520         av_freep(&mov->tracks[i].frag_info);
3521
3522         if (mov->tracks[i].vos_len)
3523             av_free(mov->tracks[i].vos_data);
3524     }
3525
3526     av_freep(&mov->tracks);
3527 }
3528
3529 static uint32_t rgb_to_yuv(uint32_t rgb)
3530 {
3531     uint8_t r, g, b;
3532     int y, cb, cr;
3533
3534     r = (rgb >> 16) & 0xFF;
3535     g = (rgb >>  8) & 0xFF;
3536     b = (rgb      ) & 0xFF;
3537
3538     y  = av_clip_uint8( 16. +  0.257 * r + 0.504 * g + 0.098 * b);
3539     cb = av_clip_uint8(128. -  0.148 * r - 0.291 * g + 0.439 * b);
3540     cr = av_clip_uint8(128. +  0.439 * r - 0.368 * g - 0.071 * b);
3541
3542     return (y << 16) | (cr << 8) | cb;
3543 }
3544
3545 static int mov_create_dvd_sub_decoder_specific_info(MOVTrack *track,
3546                                                     AVStream *st)
3547 {
3548     int i, width = 720, height = 480;
3549     int have_palette = 0, have_size = 0;
3550     uint32_t palette[16];
3551     char *cur = st->codec->extradata;
3552
3553     while (cur && *cur) {
3554         if (strncmp("palette:", cur, 8) == 0) {
3555             int i, count;
3556             count = sscanf(cur + 8,
3557                 "%06"PRIx32", %06"PRIx32", %06"PRIx32", %06"PRIx32", "
3558                 "%06"PRIx32", %06"PRIx32", %06"PRIx32", %06"PRIx32", "
3559                 "%06"PRIx32", %06"PRIx32", %06"PRIx32", %06"PRIx32", "
3560                 "%06"PRIx32", %06"PRIx32", %06"PRIx32", %06"PRIx32"",
3561                 &palette[ 0], &palette[ 1], &palette[ 2], &palette[ 3],
3562                 &palette[ 4], &palette[ 5], &palette[ 6], &palette[ 7],
3563                 &palette[ 8], &palette[ 9], &palette[10], &palette[11],
3564                 &palette[12], &palette[13], &palette[14], &palette[15]);
3565
3566             for (i = 0; i < count; i++) {
3567                 palette[i] = rgb_to_yuv(palette[i]);
3568             }
3569             have_palette = 1;
3570         } else if (!strncmp("size:", cur, 5)) {
3571             sscanf(cur + 5, "%dx%d", &width, &height);
3572             have_size = 1;
3573         }
3574         if (have_palette && have_size)
3575             break;
3576         cur += strcspn(cur, "\n\r");
3577         cur += strspn(cur, "\n\r");
3578     }
3579     if (have_palette) {
3580         track->vos_data = av_malloc(16*4);
3581         if (!track->vos_data)
3582             return AVERROR(ENOMEM);
3583         for (i = 0; i < 16; i++) {
3584             AV_WB32(track->vos_data + i * 4, palette[i]);
3585         }
3586         track->vos_len = 16 * 4;
3587     }
3588     st->codec->width = width;
3589     st->codec->height = track->height = height;
3590
3591     return 0;
3592 }
3593
3594 static int mov_write_header(AVFormatContext *s)
3595 {
3596     AVIOContext *pb = s->pb;
3597     MOVMuxContext *mov = s->priv_data;
3598     AVDictionaryEntry *t;
3599     int i, hint_track = 0;
3600
3601     mov->fc = s;
3602
3603     /* Default mode == MP4 */
3604     mov->mode = MODE_MP4;
3605
3606     if (s->oformat) {
3607         if (!strcmp("3gp", s->oformat->name)) mov->mode = MODE_3GP;
3608         else if (!strcmp("3g2", s->oformat->name)) mov->mode = MODE_3GP|MODE_3G2;
3609         else if (!strcmp("mov", s->oformat->name)) mov->mode = MODE_MOV;
3610         else if (!strcmp("psp", s->oformat->name)) mov->mode = MODE_PSP;
3611         else if (!strcmp("ipod",s->oformat->name)) mov->mode = MODE_IPOD;
3612         else if (!strcmp("ismv",s->oformat->name)) mov->mode = MODE_ISM;
3613         else if (!strcmp("f4v", s->oformat->name)) mov->mode = MODE_F4V;
3614     }
3615
3616     /* Set the FRAGMENT flag if any of the fragmentation methods are
3617      * enabled. */
3618     if (mov->max_fragment_duration || mov->max_fragment_size ||
3619         mov->flags & (FF_MOV_FLAG_EMPTY_MOOV |
3620                       FF_MOV_FLAG_FRAG_KEYFRAME |
3621                       FF_MOV_FLAG_FRAG_CUSTOM))
3622         mov->flags |= FF_MOV_FLAG_FRAGMENT;
3623
3624     /* Set other implicit flags immediately */
3625     if (mov->mode == MODE_ISM)
3626         mov->flags |= FF_MOV_FLAG_EMPTY_MOOV | FF_MOV_FLAG_SEPARATE_MOOF |
3627                       FF_MOV_FLAG_FRAGMENT;
3628     if (mov->flags & FF_MOV_FLAG_DASH)
3629         mov->flags |= FF_MOV_FLAG_FRAGMENT | FF_MOV_FLAG_EMPTY_MOOV |
3630                       FF_MOV_FLAG_DEFAULT_BASE_MOOF;
3631
3632     if (mov->use_editlist < 0) {
3633         mov->use_editlist = 1;
3634         if (mov->flags & FF_MOV_FLAG_FRAGMENT) {
3635             // If we can avoid needing an edit list by shifting the
3636             // tracks, prefer that over (trying to) write edit lists
3637             // in fragmented output.
3638             if (s->avoid_negative_ts == AVFMT_AVOID_NEG_TS_AUTO ||
3639                 s->avoid_negative_ts == AVFMT_AVOID_NEG_TS_MAKE_ZERO)
3640                 mov->use_editlist = 0;
3641         }
3642     }
3643     if (mov->flags & FF_MOV_FLAG_EMPTY_MOOV && mov->use_editlist)
3644         av_log(s, AV_LOG_WARNING, "No meaningful edit list will be written when using empty_moov\n");
3645
3646     if (!mov->use_editlist && s->avoid_negative_ts == AVFMT_AVOID_NEG_TS_AUTO)
3647         s->avoid_negative_ts = AVFMT_AVOID_NEG_TS_MAKE_ZERO;
3648
3649     /* Non-seekable output is ok if using fragmentation. If ism_lookahead
3650      * is enabled, we don't support non-seekable output at all. */
3651     if (!s->pb->seekable &&
3652         (!(mov->flags & FF_MOV_FLAG_FRAGMENT) || mov->ism_lookahead)) {
3653         av_log(s, AV_LOG_ERROR, "muxer does not support non seekable output\n");
3654         return AVERROR(EINVAL);
3655     }
3656
3657
3658     mov_write_ftyp_tag(pb,s);
3659     if (mov->mode == MODE_PSP) {
3660         if (s->nb_streams != 2) {
3661             av_log(s, AV_LOG_ERROR, "PSP mode need one video and one audio stream\n");
3662             return AVERROR(EINVAL);
3663         }
3664         mov_write_uuidprof_tag(pb, s);
3665     }
3666
3667     mov->nb_streams = s->nb_streams;
3668     if (mov->mode & (MODE_MP4|MODE_MOV|MODE_IPOD) && s->nb_chapters)
3669         mov->chapter_track = mov->nb_streams++;
3670
3671     if (mov->flags & FF_MOV_FLAG_RTP_HINT) {
3672         /* Add hint tracks for each audio and video stream */
3673         hint_track = mov->nb_streams;
3674         for (i = 0; i < s->nb_streams; i++) {
3675             AVStream *st = s->streams[i];
3676             if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO ||
3677                 st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
3678                 mov->nb_streams++;
3679             }
3680         }
3681     }
3682
3683     // Reserve an extra stream for chapters for the case where chapters
3684     // are written in the trailer
3685     mov->tracks = av_mallocz((mov->nb_streams + 1) * sizeof(*mov->tracks));
3686     if (!mov->tracks)
3687         return AVERROR(ENOMEM);
3688
3689     for (i = 0; i < s->nb_streams; i++) {
3690         AVStream *st= s->streams[i];
3691         MOVTrack *track= &mov->tracks[i];
3692         AVDictionaryEntry *lang = av_dict_get(st->metadata, "language", NULL,0);
3693
3694         track->st  = st;
3695         track->enc = st->codec;
3696         track->language = ff_mov_iso639_to_lang(lang?lang->value:"und", mov->mode!=MODE_MOV);
3697         if (track->language < 0)
3698             track->language = 0;
3699         track->mode = mov->mode;
3700         track->tag  = mov_find_codec_tag(s, track);
3701         if (!track->tag) {
3702             av_log(s, AV_LOG_ERROR, "track %d: could not find tag, "
3703                    "codec not currently supported in container\n", i);
3704             goto error;
3705         }
3706         /* If hinting of this track is enabled by a later hint track,
3707          * this is updated. */
3708         track->hint_track = -1;
3709         track->start_dts  = AV_NOPTS_VALUE;
3710         if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO) {
3711             if (track->tag == MKTAG('m','x','3','p') || track->tag == MKTAG('m','x','3','n') ||
3712                 track->tag == MKTAG('m','x','4','p') || track->tag == MKTAG('m','x','4','n') ||
3713                 track->tag == MKTAG('m','x','5','p') || track->tag == MKTAG('m','x','5','n')) {
3714                 if (st->codec->width != 720 || (st->codec->height != 608 && st->codec->height != 512)) {
3715                     av_log(s, AV_LOG_ERROR, "D-10/IMX must use 720x608 or 720x512 video resolution\n");
3716                     goto error;
3717                 }
3718                 track->height = track->tag >> 24 == 'n' ? 486 : 576;
3719             }
3720             track->timescale = st->time_base.den;
3721             if (track->mode == MODE_MOV && track->timescale > 100000)
3722                 av_log(s, AV_LOG_WARNING,
3723                        "WARNING codec timebase is very high. If duration is too long,\n"
3724                        "file may not be playable by quicktime. Specify a shorter timebase\n"
3725                        "or choose different container.\n");
3726         } else if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
3727             track->timescale = st->codec->sample_rate;
3728             /* set sample_size for PCM and ADPCM */
3729             if (av_get_bits_per_sample(st->codec->codec_id) ||
3730                 st->codec->codec_id == AV_CODEC_ID_ILBC) {
3731                 if (!st->codec->block_align) {
3732                     av_log(s, AV_LOG_ERROR, "track %d: codec block align is not set\n", i);
3733                     goto error;
3734                 }
3735                 track->sample_size = st->codec->block_align;
3736             }
3737             /* set audio_vbr for compressed audio */
3738             if (av_get_bits_per_sample(st->codec->codec_id) < 8) {
3739                 track->audio_vbr = 1;
3740             }
3741             if (track->mode != MODE_MOV &&
3742                 track->enc->codec_id == AV_CODEC_ID_MP3 && track->timescale < 16000) {
3743                 av_log(s, AV_LOG_ERROR, "track %d: muxing mp3 at %dhz is not supported\n",
3744                        i, track->enc->sample_rate);
3745                 goto error;
3746             }
3747         } else if (st->codec->codec_type == AVMEDIA_TYPE_SUBTITLE) {
3748             track->timescale = st->time_base.den;
3749         } else if (st->codec->codec_type == AVMEDIA_TYPE_DATA) {
3750             track->timescale = st->time_base.den;
3751         }
3752         if (!track->height)
3753             track->height = st->codec->height;
3754         /* The ism specific timescale isn't mandatory, but is assumed by
3755          * some tools, such as mp4split. */
3756         if (mov->mode == MODE_ISM)
3757             track->timescale = 10000000;
3758
3759         avpriv_set_pts_info(st, 64, 1, track->timescale);
3760
3761         /* copy extradata if it exists */
3762         if (st->codec->extradata_size) {
3763             if (st->codec->codec_id == AV_CODEC_ID_DVD_SUBTITLE)
3764                 mov_create_dvd_sub_decoder_specific_info(track, st);
3765             else {
3766                 track->vos_len  = st->codec->extradata_size;
3767                 track->vos_data = av_malloc(track->vos_len);
3768                 memcpy(track->vos_data, st->codec->extradata, track->vos_len);
3769             }
3770         }
3771     }
3772
3773     enable_tracks(s);
3774
3775     if (mov->flags & FF_MOV_FLAG_FRAGMENT) {
3776         /* If no fragmentation options have been set, set a default. */
3777         if (!(mov->flags & (FF_MOV_FLAG_FRAG_KEYFRAME |
3778                             FF_MOV_FLAG_FRAG_CUSTOM)) &&
3779             !mov->max_fragment_duration && !mov->max_fragment_size)
3780             mov->flags |= FF_MOV_FLAG_FRAG_KEYFRAME;
3781     } else {
3782         if (mov->flags & FF_MOV_FLAG_FASTSTART)
3783             mov->reserved_moov_pos = avio_tell(pb);
3784         mov_write_mdat_tag(pb, mov);
3785     }
3786
3787     if (t = av_dict_get(s->metadata, "creation_time", NULL, 0))
3788         mov->time = ff_iso8601_to_unix_time(t->value);
3789     if (mov->time)
3790         mov->time += 0x7C25B080; // 1970 based -> 1904 based
3791
3792     if (mov->chapter_track)
3793         if (mov_create_chapter_track(s, mov->chapter_track) < 0)
3794             goto error;
3795
3796     if (mov->flags & FF_MOV_FLAG_RTP_HINT) {
3797         /* Initialize the hint tracks for each audio and video stream */
3798         for (i = 0; i < s->nb_streams; i++) {
3799             AVStream *st = s->streams[i];
3800             if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO ||
3801                 st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
3802                 ff_mov_init_hinting(s, hint_track, i);
3803                 hint_track++;
3804             }
3805         }
3806     }
3807
3808     avio_flush(pb);
3809
3810     if (mov->flags & FF_MOV_FLAG_ISML)
3811         mov_write_isml_manifest(pb, mov);
3812
3813     if (mov->flags & FF_MOV_FLAG_EMPTY_MOOV) {
3814         mov_write_moov_tag(pb, mov, s);
3815         mov->fragments++;
3816         if (mov->flags & FF_MOV_FLAG_FASTSTART)
3817             mov->reserved_moov_pos = avio_tell(pb);
3818     }
3819
3820     return 0;
3821  error:
3822     mov_free(s);
3823     return -1;
3824 }
3825
3826 static int get_moov_size(AVFormatContext *s)
3827 {
3828     int ret;
3829     AVIOContext *moov_buf;
3830     MOVMuxContext *mov = s->priv_data;
3831
3832     if ((ret = ffio_open_null_buf(&moov_buf)) < 0)
3833         return ret;
3834     mov_write_moov_tag(moov_buf, mov, s);
3835     return ffio_close_null_buf(moov_buf);
3836 }
3837
3838 static int get_sidx_size(AVFormatContext *s)
3839 {
3840     int ret;
3841     AVIOContext *buf;
3842     MOVMuxContext *mov = s->priv_data;
3843
3844     if ((ret = ffio_open_null_buf(&buf)) < 0)
3845         return ret;
3846     mov_write_sidx_tags(buf, mov, -1, 0);
3847     return ffio_close_null_buf(buf);
3848 }
3849
3850 /*
3851  * This function gets the moov size if moved to the top of the file: the chunk
3852  * offset table can switch between stco (32-bit entries) to co64 (64-bit
3853  * entries) when the moov is moved to the beginning, so the size of the moov
3854  * would change. It also updates the chunk offset tables.
3855  */
3856 static int compute_moov_size(AVFormatContext *s)
3857 {
3858     int i, moov_size, moov_size2;
3859     MOVMuxContext *mov = s->priv_data;
3860
3861     moov_size = get_moov_size(s);
3862     if (moov_size < 0)
3863         return moov_size;
3864
3865     for (i = 0; i < mov->nb_streams; i++)
3866         mov->tracks[i].data_offset += moov_size;
3867
3868     moov_size2 = get_moov_size(s);
3869     if (moov_size2 < 0)
3870         return moov_size2;
3871
3872     /* if the size changed, we just switched from stco to co64 and need to
3873      * update the offsets */
3874     if (moov_size2 != moov_size)
3875         for (i = 0; i < mov->nb_streams; i++)
3876             mov->tracks[i].data_offset += moov_size2 - moov_size;
3877
3878     return moov_size2;
3879 }
3880
3881 static int compute_sidx_size(AVFormatContext *s)
3882 {
3883     int i, sidx_size;
3884     MOVMuxContext *mov = s->priv_data;
3885
3886     sidx_size = get_sidx_size(s);
3887     if (sidx_size < 0)
3888         return sidx_size;
3889
3890     for (i = 0; i < mov->nb_streams; i++)
3891         mov->tracks[i].data_offset += sidx_size;
3892
3893     return sidx_size;
3894 }
3895
3896 static int shift_data(AVFormatContext *s)
3897 {
3898     int ret = 0, moov_size;
3899     MOVMuxContext *mov = s->priv_data;
3900     int64_t pos, pos_end = avio_tell(s->pb);
3901     uint8_t *buf, *read_buf[2];
3902     int read_buf_id = 0;
3903     int read_size[2];
3904     AVIOContext *read_pb;
3905
3906     if (mov->flags & FF_MOV_FLAG_FRAGMENT)
3907         moov_size = compute_sidx_size(s);
3908     else
3909         moov_size = compute_moov_size(s);
3910     if (moov_size < 0)
3911         return moov_size;
3912
3913     buf = av_malloc(moov_size * 2);
3914     if (!buf)
3915         return AVERROR(ENOMEM);
3916     read_buf[0] = buf;
3917     read_buf[1] = buf + moov_size;
3918
3919     /* Shift the data: the AVIO context of the output can only be used for
3920      * writing, so we re-open the same output, but for reading. It also avoids
3921      * a read/seek/write/seek back and forth. */
3922     avio_flush(s->pb);
3923     ret = avio_open(&read_pb, s->filename, AVIO_FLAG_READ);
3924     if (ret < 0) {
3925         av_log(s, AV_LOG_ERROR, "Unable to re-open %s output file for "
3926                "the second pass (faststart)\n", s->filename);
3927         goto end;
3928     }
3929
3930     /* mark the end of the shift to up to the last data we wrote, and get ready
3931      * for writing */
3932     pos_end = avio_tell(s->pb);
3933     avio_seek(s->pb, mov->reserved_moov_pos + moov_size, SEEK_SET);
3934
3935     /* start reading at where the new moov will be placed */
3936     avio_seek(read_pb, mov->reserved_moov_pos, SEEK_SET);
3937     pos = avio_tell(read_pb);
3938
3939 #define READ_BLOCK do {                                                             \
3940     read_size[read_buf_id] = avio_read(read_pb, read_buf[read_buf_id], moov_size);  \
3941     read_buf_id ^= 1;                                                               \
3942 } while (0)
3943
3944     /* shift data by chunk of at most moov_size */
3945     READ_BLOCK;
3946     do {
3947         int n;
3948         READ_BLOCK;
3949         n = read_size[read_buf_id];
3950         if (n <= 0)
3951             break;
3952         avio_write(s->pb, read_buf[read_buf_id], n);
3953         pos += n;
3954     } while (pos < pos_end);
3955     avio_close(read_pb);
3956
3957 end:
3958     av_free(buf);
3959     return ret;
3960 }
3961
3962 static int mov_write_trailer(AVFormatContext *s)
3963 {
3964     MOVMuxContext *mov = s->priv_data;
3965     AVIOContext *pb = s->pb;
3966     int res = 0;
3967     int i;
3968     int64_t moov_pos;
3969
3970     // If there were no chapters when the header was written, but there
3971     // are chapters now, write them in the trailer.  This only works
3972     // when we are not doing fragments.
3973     if (!mov->chapter_track && !(mov->flags & FF_MOV_FLAG_FRAGMENT)) {
3974         if (mov->mode & (MODE_MP4|MODE_MOV|MODE_IPOD) && s->nb_chapters) {
3975             mov->chapter_track = mov->nb_streams++;
3976             if ((res = mov_create_chapter_track(s, mov->chapter_track)) < 0)
3977                 goto error;
3978         }
3979     }
3980
3981     if (!(mov->flags & FF_MOV_FLAG_FRAGMENT)) {
3982         moov_pos = avio_tell(pb);
3983
3984         /* Write size of mdat tag */
3985         if (mov->mdat_size + 8 <= UINT32_MAX) {
3986             avio_seek(pb, mov->mdat_pos, SEEK_SET);
3987             avio_wb32(pb, mov->mdat_size + 8);
3988         } else {
3989             /* overwrite 'wide' placeholder atom */
3990             avio_seek(pb, mov->mdat_pos - 8, SEEK_SET);
3991             /* special value: real atom size will be 64 bit value after
3992              * tag field */
3993             avio_wb32(pb, 1);
3994             ffio_wfourcc(pb, "mdat");
3995             avio_wb64(pb, mov->mdat_size + 16);
3996         }
3997         avio_seek(pb, moov_pos, SEEK_SET);
3998
3999         if (mov->flags & FF_MOV_FLAG_FASTSTART) {
4000             av_log(s, AV_LOG_INFO, "Starting second pass: moving the moov atom to the beginning of the file\n");
4001             res = shift_data(s);
4002             if (res == 0) {
4003                 avio_seek(pb, mov->reserved_moov_pos, SEEK_SET);
4004                 mov_write_moov_tag(pb, mov, s);
4005             }
4006         } else {
4007             mov_write_moov_tag(pb, mov, s);
4008         }
4009     } else {
4010         mov_flush_fragment(s);
4011         for (i = 0; i < mov->nb_streams; i++)
4012            mov->tracks[i].data_offset = 0;
4013         if (mov->flags & FF_MOV_FLAG_FASTSTART) {
4014             av_log(s, AV_LOG_INFO, "Starting second pass: inserting sidx atoms\n");
4015             res = shift_data(s);
4016             if (res == 0) {
4017                 int64_t end = avio_tell(pb);
4018                 avio_seek(pb, mov->reserved_moov_pos, SEEK_SET);
4019                 mov_write_sidx_tags(pb, mov, -1, 0);
4020                 avio_seek(pb, end, SEEK_SET);
4021                 mov_write_mfra_tag(pb, mov);
4022             }
4023         } else {
4024             mov_write_mfra_tag(pb, mov);
4025         }
4026     }
4027
4028     for (i = 0; i < mov->nb_streams; i++) {
4029         if (mov->flags & FF_MOV_FLAG_FRAGMENT &&
4030             mov->tracks[i].vc1_info.struct_offset && s->pb->seekable) {
4031             int64_t off = avio_tell(pb);
4032             uint8_t buf[7];
4033             if (mov_write_dvc1_structs(&mov->tracks[i], buf) >= 0) {
4034                 avio_seek(pb, mov->tracks[i].vc1_info.struct_offset, SEEK_SET);
4035                 avio_write(pb, buf, 7);
4036                 avio_seek(pb, off, SEEK_SET);
4037             }
4038         }
4039     }
4040
4041 error:
4042     mov_free(s);
4043
4044     return res;
4045 }
4046
4047 #if CONFIG_MOV_MUXER
4048 MOV_CLASS(mov)
4049 AVOutputFormat ff_mov_muxer = {
4050     .name              = "mov",
4051     .long_name         = NULL_IF_CONFIG_SMALL("QuickTime / MOV"),
4052     .extensions        = "mov",
4053     .priv_data_size    = sizeof(MOVMuxContext),
4054     .audio_codec       = AV_CODEC_ID_AAC,
4055     .video_codec       = CONFIG_LIBX264_ENCODER ?
4056                          AV_CODEC_ID_H264 : AV_CODEC_ID_MPEG4,
4057     .write_header      = mov_write_header,
4058     .write_packet      = mov_write_packet,
4059     .write_trailer     = mov_write_trailer,
4060     .flags             = AVFMT_GLOBALHEADER | AVFMT_ALLOW_FLUSH | AVFMT_TS_NEGATIVE,
4061     .codec_tag         = (const AVCodecTag* const []){
4062         ff_codec_movvideo_tags, ff_codec_movaudio_tags, 0
4063     },
4064     .priv_class        = &mov_muxer_class,
4065 };
4066 #endif
4067 #if CONFIG_TGP_MUXER
4068 MOV_CLASS(tgp)
4069 AVOutputFormat ff_tgp_muxer = {
4070     .name              = "3gp",
4071     .long_name         = NULL_IF_CONFIG_SMALL("3GP (3GPP file format)"),
4072     .extensions        = "3gp",
4073     .priv_data_size    = sizeof(MOVMuxContext),
4074     .audio_codec       = AV_CODEC_ID_AMR_NB,
4075     .video_codec       = AV_CODEC_ID_H263,
4076     .write_header      = mov_write_header,
4077     .write_packet      = mov_write_packet,
4078     .write_trailer     = mov_write_trailer,
4079     .flags             = AVFMT_GLOBALHEADER | AVFMT_ALLOW_FLUSH | AVFMT_TS_NEGATIVE,
4080     .codec_tag         = (const AVCodecTag* const []){ codec_3gp_tags, 0 },
4081     .priv_class        = &tgp_muxer_class,
4082 };
4083 #endif
4084 #if CONFIG_MP4_MUXER
4085 MOV_CLASS(mp4)
4086 AVOutputFormat ff_mp4_muxer = {
4087     .name              = "mp4",
4088     .long_name         = NULL_IF_CONFIG_SMALL("MP4 (MPEG-4 Part 14)"),
4089     .mime_type         = "application/mp4",
4090     .extensions        = "mp4",
4091     .priv_data_size    = sizeof(MOVMuxContext),
4092     .audio_codec       = AV_CODEC_ID_AAC,
4093     .video_codec       = CONFIG_LIBX264_ENCODER ?
4094                          AV_CODEC_ID_H264 : AV_CODEC_ID_MPEG4,
4095     .write_header      = mov_write_header,
4096     .write_packet      = mov_write_packet,
4097     .write_trailer     = mov_write_trailer,
4098     .flags             = AVFMT_GLOBALHEADER | AVFMT_ALLOW_FLUSH | AVFMT_TS_NEGATIVE,
4099     .codec_tag         = (const AVCodecTag* const []){ ff_mp4_obj_type, 0 },
4100     .priv_class        = &mp4_muxer_class,
4101 };
4102 #endif
4103 #if CONFIG_PSP_MUXER
4104 MOV_CLASS(psp)
4105 AVOutputFormat ff_psp_muxer = {
4106     .name              = "psp",
4107     .long_name         = NULL_IF_CONFIG_SMALL("PSP MP4 (MPEG-4 Part 14)"),
4108     .extensions        = "mp4,psp",
4109     .priv_data_size    = sizeof(MOVMuxContext),
4110     .audio_codec       = AV_CODEC_ID_AAC,
4111     .video_codec       = CONFIG_LIBX264_ENCODER ?
4112                          AV_CODEC_ID_H264 : AV_CODEC_ID_MPEG4,
4113     .write_header      = mov_write_header,
4114     .write_packet      = mov_write_packet,
4115     .write_trailer     = mov_write_trailer,
4116     .flags             = AVFMT_GLOBALHEADER | AVFMT_ALLOW_FLUSH | AVFMT_TS_NEGATIVE,
4117     .codec_tag         = (const AVCodecTag* const []){ ff_mp4_obj_type, 0 },
4118     .priv_class        = &psp_muxer_class,
4119 };
4120 #endif
4121 #if CONFIG_TG2_MUXER
4122 MOV_CLASS(tg2)
4123 AVOutputFormat ff_tg2_muxer = {
4124     .name              = "3g2",
4125     .long_name         = NULL_IF_CONFIG_SMALL("3GP2 (3GPP2 file format)"),
4126     .extensions        = "3g2",
4127     .priv_data_size    = sizeof(MOVMuxContext),
4128     .audio_codec       = AV_CODEC_ID_AMR_NB,
4129     .video_codec       = AV_CODEC_ID_H263,
4130     .write_header      = mov_write_header,
4131     .write_packet      = mov_write_packet,
4132     .write_trailer     = mov_write_trailer,
4133     .flags             = AVFMT_GLOBALHEADER | AVFMT_ALLOW_FLUSH | AVFMT_TS_NEGATIVE,
4134     .codec_tag         = (const AVCodecTag* const []){ codec_3gp_tags, 0 },
4135     .priv_class        = &tg2_muxer_class,
4136 };
4137 #endif
4138 #if CONFIG_IPOD_MUXER
4139 MOV_CLASS(ipod)
4140 AVOutputFormat ff_ipod_muxer = {
4141     .name              = "ipod",
4142     .long_name         = NULL_IF_CONFIG_SMALL("iPod H.264 MP4 (MPEG-4 Part 14)"),
4143     .mime_type         = "application/mp4",
4144     .extensions        = "m4v,m4a",
4145     .priv_data_size    = sizeof(MOVMuxContext),
4146     .audio_codec       = AV_CODEC_ID_AAC,
4147     .video_codec       = AV_CODEC_ID_H264,
4148     .write_header      = mov_write_header,
4149     .write_packet      = mov_write_packet,
4150     .write_trailer     = mov_write_trailer,
4151     .flags             = AVFMT_GLOBALHEADER | AVFMT_ALLOW_FLUSH | AVFMT_TS_NEGATIVE,
4152     .codec_tag         = (const AVCodecTag* const []){ codec_ipod_tags, 0 },
4153     .priv_class        = &ipod_muxer_class,
4154 };
4155 #endif
4156 #if CONFIG_ISMV_MUXER
4157 MOV_CLASS(ismv)
4158 AVOutputFormat ff_ismv_muxer = {
4159     .name              = "ismv",
4160     .long_name         = NULL_IF_CONFIG_SMALL("ISMV/ISMA (Smooth Streaming)"),
4161     .mime_type         = "application/mp4",
4162     .extensions        = "ismv,isma",
4163     .priv_data_size    = sizeof(MOVMuxContext),
4164     .audio_codec       = AV_CODEC_ID_AAC,
4165     .video_codec       = AV_CODEC_ID_H264,
4166     .write_header      = mov_write_header,
4167     .write_packet      = mov_write_packet,
4168     .write_trailer     = mov_write_trailer,
4169     .flags             = AVFMT_GLOBALHEADER | AVFMT_ALLOW_FLUSH | AVFMT_TS_NEGATIVE,
4170     .codec_tag         = (const AVCodecTag* const []){ ff_mp4_obj_type, 0 },
4171     .priv_class        = &ismv_muxer_class,
4172 };
4173 #endif
4174 #if CONFIG_F4V_MUXER
4175 MOV_CLASS(f4v)
4176 AVOutputFormat ff_f4v_muxer = {
4177     .name              = "f4v",
4178     .long_name         = NULL_IF_CONFIG_SMALL("F4V Adobe Flash Video"),
4179     .mime_type         = "application/f4v",
4180     .extensions        = "f4v",
4181     .priv_data_size    = sizeof(MOVMuxContext),
4182     .audio_codec       = AV_CODEC_ID_AAC,
4183     .video_codec       = AV_CODEC_ID_H264,
4184     .write_header      = mov_write_header,
4185     .write_packet      = mov_write_packet,
4186     .write_trailer     = mov_write_trailer,
4187     .flags             = AVFMT_GLOBALHEADER | AVFMT_ALLOW_FLUSH | AVFMT_TS_NEGATIVE,
4188     .codec_tag         = (const AVCodecTag* const []){ codec_f4v_tags, 0 },
4189     .priv_class        = &f4v_muxer_class,
4190 };
4191 #endif