]> git.sesse.net Git - ffmpeg/blob - libavformat/movenc.c
rtmpproto: Clarify a comment
[ffmpeg] / libavformat / movenc.c
1 /*
2  * MOV, 3GP, MP4 muxer
3  * Copyright (c) 2003 Thomas Raivio
4  * Copyright (c) 2004 Gildas Bazin <gbazin at videolan dot org>
5  * Copyright (c) 2009 Baptiste Coudurier <baptiste dot coudurier at gmail dot com>
6  *
7  * This file is part of Libav.
8  *
9  * Libav is free software; you can redistribute it and/or
10  * modify it under the terms of the GNU Lesser General Public
11  * License as published by the Free Software Foundation; either
12  * version 2.1 of the License, or (at your option) any later version.
13  *
14  * Libav is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
17  * Lesser General Public License for more details.
18  *
19  * You should have received a copy of the GNU Lesser General Public
20  * License along with Libav; if not, write to the Free Software
21  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
22  */
23
24 #include <stdint.h>
25 #include <inttypes.h>
26
27 #include "movenc.h"
28 #include "avformat.h"
29 #include "avio_internal.h"
30 #include "riff.h"
31 #include "avio.h"
32 #include "isom.h"
33 #include "avc.h"
34 #include "libavcodec/get_bits.h"
35 #include "libavcodec/put_bits.h"
36 #include "libavcodec/vc1_common.h"
37 #include "internal.h"
38 #include "libavutil/avstring.h"
39 #include "libavutil/intfloat.h"
40 #include "libavutil/mathematics.h"
41 #include "libavutil/opt.h"
42 #include "libavutil/dict.h"
43 #include "hevc.h"
44 #include "rtpenc.h"
45 #include "mov_chan.h"
46
47 #undef NDEBUG
48 #include <assert.h>
49
50 static const AVOption options[] = {
51     { "movflags", "MOV muxer flags", offsetof(MOVMuxContext, flags), AV_OPT_TYPE_FLAGS, {.i64 = 0}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
52     { "rtphint", "Add RTP hint tracks", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_RTP_HINT}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
53     { "empty_moov", "Make the initial moov atom empty", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_EMPTY_MOOV}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
54     { "frag_keyframe", "Fragment at video keyframes", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_FRAG_KEYFRAME}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
55     { "separate_moof", "Write separate moof/mdat atoms for each track", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_SEPARATE_MOOF}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
56     { "frag_custom", "Flush fragments on caller requests", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_FRAG_CUSTOM}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
57     { "isml", "Create a live smooth streaming feed (for pushing to a publishing point)", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_ISML}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
58     { "faststart", "Run a second pass to put the index (moov atom) at the beginning of the file", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_FASTSTART}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
59     { "omit_tfhd_offset", "Omit the base data offset in tfhd atoms", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_OMIT_TFHD_OFFSET}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
60     { "disable_chpl", "Disable Nero chapter atom", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_DISABLE_CHPL}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
61     { "default_base_moof", "Set the default-base-is-moof flag in tfhd atoms", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_DEFAULT_BASE_MOOF}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
62     { "dash", "Write DASH compatible fragmented MP4", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_DASH}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
63     { "frag_discont", "Signal that the next fragment is discontinuous from earlier ones", 0, AV_OPT_TYPE_CONST, {.i64 = FF_MOV_FLAG_FRAG_DISCONT}, INT_MIN, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM, "movflags" },
64     FF_RTP_FLAG_OPTS(MOVMuxContext, rtp_flags),
65     { "skip_iods", "Skip writing iods atom.", offsetof(MOVMuxContext, iods_skip), AV_OPT_TYPE_INT, {.i64 = 0}, 0, 1, AV_OPT_FLAG_ENCODING_PARAM},
66     { "iods_audio_profile", "iods audio profile atom.", offsetof(MOVMuxContext, iods_audio_profile), AV_OPT_TYPE_INT, {.i64 = -1}, -1, 255, AV_OPT_FLAG_ENCODING_PARAM},
67     { "iods_video_profile", "iods video profile atom.", offsetof(MOVMuxContext, iods_video_profile), AV_OPT_TYPE_INT, {.i64 = -1}, -1, 255, AV_OPT_FLAG_ENCODING_PARAM},
68     { "frag_duration", "Maximum fragment duration", offsetof(MOVMuxContext, max_fragment_duration), AV_OPT_TYPE_INT, {.i64 = 0}, 0, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM},
69     { "min_frag_duration", "Minimum fragment duration", offsetof(MOVMuxContext, min_fragment_duration), AV_OPT_TYPE_INT, {.i64 = 0}, 0, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM},
70     { "frag_size", "Maximum fragment size", offsetof(MOVMuxContext, max_fragment_size), AV_OPT_TYPE_INT, {.i64 = 0}, 0, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM},
71     { "ism_lookahead", "Number of lookahead entries for ISM files", offsetof(MOVMuxContext, ism_lookahead), AV_OPT_TYPE_INT, {.i64 = 0}, 0, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM},
72     { "brand",    "Override major brand", offsetof(MOVMuxContext, major_brand),   AV_OPT_TYPE_STRING, {.str = NULL}, .flags = AV_OPT_FLAG_ENCODING_PARAM },
73     { "use_editlist", "use edit list", offsetof(MOVMuxContext, use_editlist), AV_OPT_TYPE_INT, {.i64 = -1}, -1, 1, AV_OPT_FLAG_ENCODING_PARAM},
74     { "fragment_index", "Fragment number of the next fragment", offsetof(MOVMuxContext, fragments), AV_OPT_TYPE_INT, {.i64 = 0}, 0, INT_MAX, AV_OPT_FLAG_ENCODING_PARAM},
75     { NULL },
76 };
77
78 #define MOV_CLASS(flavor)\
79 static const AVClass flavor ## _muxer_class = {\
80     .class_name = #flavor " muxer",\
81     .item_name  = av_default_item_name,\
82     .option     = options,\
83     .version    = LIBAVUTIL_VERSION_INT,\
84 };
85
86 static int utf8len(const uint8_t *b)
87 {
88     int len = 0;
89     int val;
90     while (*b) {
91         GET_UTF8(val, *b++, return -1;)
92         len++;
93     }
94     return len;
95 }
96
97 //FIXME support 64 bit variant with wide placeholders
98 static int64_t update_size(AVIOContext *pb, int64_t pos)
99 {
100     int64_t curpos = avio_tell(pb);
101     avio_seek(pb, pos, SEEK_SET);
102     avio_wb32(pb, curpos - pos); /* rewrite size */
103     avio_seek(pb, curpos, SEEK_SET);
104
105     return curpos - pos;
106 }
107
108 static int co64_required(const MOVTrack *track)
109 {
110     if (track->entry > 0 && track->cluster[track->entry - 1].pos + track->data_offset > UINT32_MAX)
111         return 1;
112     return 0;
113 }
114
115 /* Chunk offset atom */
116 static int mov_write_stco_tag(AVIOContext *pb, MOVTrack *track)
117 {
118     int i;
119     int mode64 = co64_required(track); // use 32 bit size variant if possible
120     int64_t pos = avio_tell(pb);
121     avio_wb32(pb, 0); /* size */
122     if (mode64) {
123         ffio_wfourcc(pb, "co64");
124     } else
125         ffio_wfourcc(pb, "stco");
126     avio_wb32(pb, 0); /* version & flags */
127     avio_wb32(pb, track->entry); /* entry count */
128     for (i = 0; i < track->entry; i++) {
129         if (mode64 == 1)
130             avio_wb64(pb, track->cluster[i].pos + track->data_offset);
131         else
132             avio_wb32(pb, track->cluster[i].pos + track->data_offset);
133     }
134     return update_size(pb, pos);
135 }
136
137 /* Sample size atom */
138 static int mov_write_stsz_tag(AVIOContext *pb, MOVTrack *track)
139 {
140     int equalChunks = 1;
141     int i, j, entries = 0, tst = -1, oldtst = -1;
142
143     int64_t pos = avio_tell(pb);
144     avio_wb32(pb, 0); /* size */
145     ffio_wfourcc(pb, "stsz");
146     avio_wb32(pb, 0); /* version & flags */
147
148     for (i = 0; i < track->entry; i++) {
149         tst = track->cluster[i].size / track->cluster[i].entries;
150         if (oldtst != -1 && tst != oldtst)
151             equalChunks = 0;
152         oldtst = tst;
153         entries += track->cluster[i].entries;
154     }
155     if (equalChunks && track->entry) {
156         int sSize = track->entry ? track->cluster[0].size / track->cluster[0].entries : 0;
157         sSize = FFMAX(1, sSize); // adpcm mono case could make sSize == 0
158         avio_wb32(pb, sSize); // sample size
159         avio_wb32(pb, entries); // sample count
160     } else {
161         avio_wb32(pb, 0); // sample size
162         avio_wb32(pb, entries); // sample count
163         for (i = 0; i < track->entry; i++) {
164             for (j = 0; j < track->cluster[i].entries; j++) {
165                 avio_wb32(pb, track->cluster[i].size /
166                           track->cluster[i].entries);
167             }
168         }
169     }
170     return update_size(pb, pos);
171 }
172
173 /* Sample to chunk atom */
174 static int mov_write_stsc_tag(AVIOContext *pb, MOVTrack *track)
175 {
176     int index = 0, oldval = -1, i;
177     int64_t entryPos, curpos;
178
179     int64_t pos = avio_tell(pb);
180     avio_wb32(pb, 0); /* size */
181     ffio_wfourcc(pb, "stsc");
182     avio_wb32(pb, 0); // version & flags
183     entryPos = avio_tell(pb);
184     avio_wb32(pb, track->entry); // entry count
185     for (i = 0; i < track->entry; i++) {
186         if (oldval != track->cluster[i].samples_in_chunk) {
187             avio_wb32(pb, i + 1); // first chunk
188             avio_wb32(pb, track->cluster[i].samples_in_chunk); // samples per chunk
189             avio_wb32(pb, 0x1); // sample description index
190             oldval = track->cluster[i].samples_in_chunk;
191             index++;
192         }
193     }
194     curpos = avio_tell(pb);
195     avio_seek(pb, entryPos, SEEK_SET);
196     avio_wb32(pb, index); // rewrite size
197     avio_seek(pb, curpos, SEEK_SET);
198
199     return update_size(pb, pos);
200 }
201
202 /* Sync sample atom */
203 static int mov_write_stss_tag(AVIOContext *pb, MOVTrack *track, uint32_t flag)
204 {
205     int64_t curpos, entryPos;
206     int i, index = 0;
207     int64_t pos = avio_tell(pb);
208     avio_wb32(pb, 0); // size
209     ffio_wfourcc(pb, flag == MOV_SYNC_SAMPLE ? "stss" : "stps");
210     avio_wb32(pb, 0); // version & flags
211     entryPos = avio_tell(pb);
212     avio_wb32(pb, track->entry); // entry count
213     for (i = 0; i < track->entry; i++) {
214         if (track->cluster[i].flags & flag) {
215             avio_wb32(pb, i + 1);
216             index++;
217         }
218     }
219     curpos = avio_tell(pb);
220     avio_seek(pb, entryPos, SEEK_SET);
221     avio_wb32(pb, index); // rewrite size
222     avio_seek(pb, curpos, SEEK_SET);
223     return update_size(pb, pos);
224 }
225
226 static int mov_write_amr_tag(AVIOContext *pb, MOVTrack *track)
227 {
228     avio_wb32(pb, 0x11); /* size */
229     if (track->mode == MODE_MOV) ffio_wfourcc(pb, "samr");
230     else                         ffio_wfourcc(pb, "damr");
231     ffio_wfourcc(pb, "FFMP");
232     avio_w8(pb, 0); /* decoder version */
233
234     avio_wb16(pb, 0x81FF); /* Mode set (all modes for AMR_NB) */
235     avio_w8(pb, 0x00); /* Mode change period (no restriction) */
236     avio_w8(pb, 0x01); /* Frames per sample */
237     return 0x11;
238 }
239
240 static int mov_write_ac3_tag(AVIOContext *pb, MOVTrack *track)
241 {
242     GetBitContext gbc;
243     PutBitContext pbc;
244     uint8_t buf[3];
245     int fscod, bsid, bsmod, acmod, lfeon, frmsizecod;
246
247     if (track->vos_len < 7)
248         return -1;
249
250     avio_wb32(pb, 11);
251     ffio_wfourcc(pb, "dac3");
252
253     init_get_bits(&gbc, track->vos_data + 4, (track->vos_len - 4) * 8);
254     fscod      = get_bits(&gbc, 2);
255     frmsizecod = get_bits(&gbc, 6);
256     bsid       = get_bits(&gbc, 5);
257     bsmod      = get_bits(&gbc, 3);
258     acmod      = get_bits(&gbc, 3);
259     if (acmod == 2) {
260         skip_bits(&gbc, 2); // dsurmod
261     } else {
262         if ((acmod & 1) && acmod != 1)
263             skip_bits(&gbc, 2); // cmixlev
264         if (acmod & 4)
265             skip_bits(&gbc, 2); // surmixlev
266     }
267     lfeon = get_bits1(&gbc);
268
269     init_put_bits(&pbc, buf, sizeof(buf));
270     put_bits(&pbc, 2, fscod);
271     put_bits(&pbc, 5, bsid);
272     put_bits(&pbc, 3, bsmod);
273     put_bits(&pbc, 3, acmod);
274     put_bits(&pbc, 1, lfeon);
275     put_bits(&pbc, 5, frmsizecod >> 1); // bit_rate_code
276     put_bits(&pbc, 5, 0); // reserved
277
278     flush_put_bits(&pbc);
279     avio_write(pb, buf, sizeof(buf));
280
281     return 11;
282 }
283
284 /**
285  * This function writes extradata "as is".
286  * Extradata must be formatted like a valid atom (with size and tag).
287  */
288 static int mov_write_extradata_tag(AVIOContext *pb, MOVTrack *track)
289 {
290     avio_write(pb, track->enc->extradata, track->enc->extradata_size);
291     return track->enc->extradata_size;
292 }
293
294 static void put_descr(AVIOContext *pb, int tag, unsigned int size)
295 {
296     int i = 3;
297     avio_w8(pb, tag);
298     for (; i > 0; i--)
299         avio_w8(pb, (size >> (7 * i)) | 0x80);
300     avio_w8(pb, size & 0x7F);
301 }
302
303 static int mov_write_esds_tag(AVIOContext *pb, MOVTrack *track) // Basic
304 {
305     int64_t pos = avio_tell(pb);
306     int decoder_specific_info_len = track->vos_len ? 5 + track->vos_len : 0;
307
308     avio_wb32(pb, 0); // size
309     ffio_wfourcc(pb, "esds");
310     avio_wb32(pb, 0); // Version
311
312     // ES descriptor
313     put_descr(pb, 0x03, 3 + 5+13 + decoder_specific_info_len + 5+1);
314     avio_wb16(pb, track->track_id);
315     avio_w8(pb, 0x00); // flags (= no flags)
316
317     // DecoderConfig descriptor
318     put_descr(pb, 0x04, 13 + decoder_specific_info_len);
319
320     // Object type indication
321     if ((track->enc->codec_id == AV_CODEC_ID_MP2 ||
322          track->enc->codec_id == AV_CODEC_ID_MP3) &&
323         track->enc->sample_rate > 24000)
324         avio_w8(pb, 0x6B); // 11172-3
325     else
326         avio_w8(pb, ff_codec_get_tag(ff_mp4_obj_type, track->enc->codec_id));
327
328     // the following fields is made of 6 bits to identify the streamtype (4 for video, 5 for audio)
329     // plus 1 bit to indicate upstream and 1 bit set to 1 (reserved)
330     if (track->enc->codec_id == AV_CODEC_ID_DVD_SUBTITLE)
331         avio_w8(pb, (0x38 << 2) | 1); // flags (= NeroSubpicStream)
332     else if (track->enc->codec_type == AVMEDIA_TYPE_AUDIO)
333         avio_w8(pb, 0x15); // flags (= Audiostream)
334     else
335         avio_w8(pb, 0x11); // flags (= Visualstream)
336
337     avio_wb24(pb, track->enc->rc_buffer_size >> 3); // Buffersize DB
338
339     avio_wb32(pb, FFMAX(track->enc->bit_rate, track->enc->rc_max_rate)); // maxbitrate (FIXME should be max rate in any 1 sec window)
340     if (track->enc->rc_max_rate != track->enc->rc_min_rate ||
341         track->enc->rc_min_rate == 0)
342         avio_wb32(pb, 0); // vbr
343     else
344         avio_wb32(pb, track->enc->rc_max_rate); // avg bitrate
345
346     if (track->vos_len) {
347         // DecoderSpecific info descriptor
348         put_descr(pb, 0x05, track->vos_len);
349         avio_write(pb, track->vos_data, track->vos_len);
350     }
351
352     // SL descriptor
353     put_descr(pb, 0x06, 1);
354     avio_w8(pb, 0x02);
355     return update_size(pb, pos);
356 }
357
358 static int mov_write_ms_tag(AVIOContext *pb, MOVTrack *track)
359 {
360     int64_t pos = avio_tell(pb);
361     avio_wb32(pb, 0);
362     avio_wl32(pb, track->tag); // store it byteswapped
363     track->enc->codec_tag = av_bswap16(track->tag >> 16);
364     ff_put_wav_header(pb, track->enc);
365     return update_size(pb, pos);
366 }
367
368 static int mov_write_wfex_tag(AVIOContext *pb, MOVTrack *track)
369 {
370     int64_t pos = avio_tell(pb);
371     avio_wb32(pb, 0);
372     ffio_wfourcc(pb, "wfex");
373     ff_put_wav_header(pb, track->enc);
374     return update_size(pb, pos);
375 }
376
377 static int mov_write_chan_tag(AVIOContext *pb, MOVTrack *track)
378 {
379     uint32_t layout_tag, bitmap;
380     int64_t pos = avio_tell(pb);
381
382     layout_tag = ff_mov_get_channel_layout_tag(track->enc->codec_id,
383                                                track->enc->channel_layout,
384                                                &bitmap);
385     if (!layout_tag) {
386         av_log(track->enc, AV_LOG_WARNING, "not writing 'chan' tag due to "
387                "lack of channel information\n");
388         return 0;
389     }
390
391     avio_wb32(pb, 0);           // Size
392     ffio_wfourcc(pb, "chan");   // Type
393     avio_w8(pb, 0);             // Version
394     avio_wb24(pb, 0);           // Flags
395     avio_wb32(pb, layout_tag);  // mChannelLayoutTag
396     avio_wb32(pb, bitmap);      // mChannelBitmap
397     avio_wb32(pb, 0);           // mNumberChannelDescriptions
398
399     return update_size(pb, pos);
400 }
401
402 static int mov_write_wave_tag(AVIOContext *pb, MOVTrack *track)
403 {
404     int64_t pos = avio_tell(pb);
405
406     avio_wb32(pb, 0);     /* size */
407     ffio_wfourcc(pb, "wave");
408
409     avio_wb32(pb, 12);    /* size */
410     ffio_wfourcc(pb, "frma");
411     avio_wl32(pb, track->tag);
412
413     if (track->enc->codec_id == AV_CODEC_ID_AAC) {
414         /* useless atom needed by mplayer, ipod, not needed by quicktime */
415         avio_wb32(pb, 12); /* size */
416         ffio_wfourcc(pb, "mp4a");
417         avio_wb32(pb, 0);
418         mov_write_esds_tag(pb, track);
419     } else if (track->enc->codec_id == AV_CODEC_ID_AMR_NB) {
420         mov_write_amr_tag(pb, track);
421     } else if (track->enc->codec_id == AV_CODEC_ID_AC3) {
422         mov_write_ac3_tag(pb, track);
423     } else if (track->enc->codec_id == AV_CODEC_ID_ALAC) {
424         mov_write_extradata_tag(pb, track);
425     } else if (track->enc->codec_id == AV_CODEC_ID_ADPCM_MS ||
426                track->enc->codec_id == AV_CODEC_ID_ADPCM_IMA_WAV) {
427         mov_write_ms_tag(pb, track);
428     }
429
430     avio_wb32(pb, 8);     /* size */
431     avio_wb32(pb, 0);     /* null tag */
432
433     return update_size(pb, pos);
434 }
435
436 static int mov_write_dvc1_structs(MOVTrack *track, uint8_t *buf)
437 {
438     uint8_t *unescaped;
439     const uint8_t *start, *next, *end = track->vos_data + track->vos_len;
440     int unescaped_size, seq_found = 0;
441     int level = 0, interlace = 0;
442     int packet_seq   = track->vc1_info.packet_seq;
443     int packet_entry = track->vc1_info.packet_entry;
444     int slices       = track->vc1_info.slices;
445     PutBitContext pbc;
446
447     if (track->start_dts == AV_NOPTS_VALUE) {
448         /* No packets written yet, vc1_info isn't authoritative yet. */
449         /* Assume inline sequence and entry headers. This will be
450          * overwritten at the end if the file is seekable. */
451         packet_seq = packet_entry = 1;
452     }
453
454     unescaped = av_mallocz(track->vos_len + FF_INPUT_BUFFER_PADDING_SIZE);
455     if (!unescaped)
456         return AVERROR(ENOMEM);
457     start = find_next_marker(track->vos_data, end);
458     for (next = start; next < end; start = next) {
459         GetBitContext gb;
460         int size;
461         next = find_next_marker(start + 4, end);
462         size = next - start - 4;
463         if (size <= 0)
464             continue;
465         unescaped_size = vc1_unescape_buffer(start + 4, size, unescaped);
466         init_get_bits(&gb, unescaped, 8 * unescaped_size);
467         if (AV_RB32(start) == VC1_CODE_SEQHDR) {
468             int profile = get_bits(&gb, 2);
469             if (profile != PROFILE_ADVANCED) {
470                 av_free(unescaped);
471                 return AVERROR(ENOSYS);
472             }
473             seq_found = 1;
474             level = get_bits(&gb, 3);
475             /* chromaformat, frmrtq_postproc, bitrtq_postproc, postprocflag,
476              * width, height */
477             skip_bits_long(&gb, 2 + 3 + 5 + 1 + 2*12);
478             skip_bits(&gb, 1); /* broadcast */
479             interlace = get_bits1(&gb);
480             skip_bits(&gb, 4); /* tfcntrflag, finterpflag, reserved, psf */
481         }
482     }
483     if (!seq_found) {
484         av_free(unescaped);
485         return AVERROR(ENOSYS);
486     }
487
488     init_put_bits(&pbc, buf, 7);
489     /* VC1DecSpecStruc */
490     put_bits(&pbc, 4, 12); /* profile - advanced */
491     put_bits(&pbc, 3, level);
492     put_bits(&pbc, 1, 0); /* reserved */
493     /* VC1AdvDecSpecStruc */
494     put_bits(&pbc, 3, level);
495     put_bits(&pbc, 1, 0); /* cbr */
496     put_bits(&pbc, 6, 0); /* reserved */
497     put_bits(&pbc, 1, !interlace); /* no interlace */
498     put_bits(&pbc, 1, !packet_seq); /* no multiple seq */
499     put_bits(&pbc, 1, !packet_entry); /* no multiple entry */
500     put_bits(&pbc, 1, !slices); /* no slice code */
501     put_bits(&pbc, 1, 0); /* no bframe */
502     put_bits(&pbc, 1, 0); /* reserved */
503
504     /* framerate */
505     if (track->st->avg_frame_rate.num > 0 && track->st->avg_frame_rate.den > 0)
506         put_bits32(&pbc, track->st->avg_frame_rate.num / track->st->avg_frame_rate.den);
507     else
508         put_bits32(&pbc, 0xffffffff);
509
510     flush_put_bits(&pbc);
511
512     av_free(unescaped);
513
514     return 0;
515 }
516
517 static int mov_write_dvc1_tag(AVIOContext *pb, MOVTrack *track)
518 {
519     uint8_t buf[7] = { 0 };
520     int ret;
521
522     if ((ret = mov_write_dvc1_structs(track, buf)) < 0)
523         return ret;
524
525     avio_wb32(pb, track->vos_len + 8 + sizeof(buf));
526     ffio_wfourcc(pb, "dvc1");
527     track->vc1_info.struct_offset = avio_tell(pb);
528     avio_write(pb, buf, sizeof(buf));
529     avio_write(pb, track->vos_data, track->vos_len);
530
531     return 0;
532 }
533
534 static int mov_write_glbl_tag(AVIOContext *pb, MOVTrack *track)
535 {
536     avio_wb32(pb, track->vos_len + 8);
537     ffio_wfourcc(pb, "glbl");
538     avio_write(pb, track->vos_data, track->vos_len);
539     return 8 + track->vos_len;
540 }
541
542 /**
543  * Compute flags for 'lpcm' tag.
544  * See CoreAudioTypes and AudioStreamBasicDescription at Apple.
545  */
546 static int mov_get_lpcm_flags(enum AVCodecID codec_id)
547 {
548     switch (codec_id) {
549     case AV_CODEC_ID_PCM_F32BE:
550     case AV_CODEC_ID_PCM_F64BE:
551         return 11;
552     case AV_CODEC_ID_PCM_F32LE:
553     case AV_CODEC_ID_PCM_F64LE:
554         return 9;
555     case AV_CODEC_ID_PCM_U8:
556         return 10;
557     case AV_CODEC_ID_PCM_S16BE:
558     case AV_CODEC_ID_PCM_S24BE:
559     case AV_CODEC_ID_PCM_S32BE:
560         return 14;
561     case AV_CODEC_ID_PCM_S8:
562     case AV_CODEC_ID_PCM_S16LE:
563     case AV_CODEC_ID_PCM_S24LE:
564     case AV_CODEC_ID_PCM_S32LE:
565         return 12;
566     default:
567         return 0;
568     }
569 }
570
571 static int get_cluster_duration(MOVTrack *track, int cluster_idx)
572 {
573     int64_t next_dts;
574
575     if (cluster_idx >= track->entry)
576         return 0;
577
578     if (cluster_idx + 1 == track->entry)
579         next_dts = track->track_duration + track->start_dts;
580     else
581         next_dts = track->cluster[cluster_idx + 1].dts;
582
583     return next_dts - track->cluster[cluster_idx].dts;
584 }
585
586 static int get_samples_per_packet(MOVTrack *track)
587 {
588     int i, first_duration;
589
590     /* use 1 for raw PCM */
591     if (!track->audio_vbr)
592         return 1;
593
594     /* check to see if duration is constant for all clusters */
595     if (!track->entry)
596         return 0;
597     first_duration = get_cluster_duration(track, 0);
598     for (i = 1; i < track->entry; i++) {
599         if (get_cluster_duration(track, i) != first_duration)
600             return 0;
601     }
602     return first_duration;
603 }
604
605 static int mov_write_audio_tag(AVIOContext *pb, MOVTrack *track)
606 {
607     int64_t pos = avio_tell(pb);
608     int version = 0;
609     uint32_t tag = track->tag;
610
611     if (track->mode == MODE_MOV) {
612         if (mov_get_lpcm_flags(track->enc->codec_id))
613             tag = AV_RL32("lpcm");
614         version = 2;
615     }
616
617     avio_wb32(pb, 0); /* size */
618     avio_wl32(pb, tag); // store it byteswapped
619     avio_wb32(pb, 0); /* Reserved */
620     avio_wb16(pb, 0); /* Reserved */
621     avio_wb16(pb, 1); /* Data-reference index, XXX  == 1 */
622
623     /* SoundDescription */
624     avio_wb16(pb, version); /* Version */
625     avio_wb16(pb, 0); /* Revision level */
626     avio_wb32(pb, 0); /* Reserved */
627
628     if (version == 2) {
629         avio_wb16(pb, 3);
630         avio_wb16(pb, 16);
631         avio_wb16(pb, 0xfffe);
632         avio_wb16(pb, 0);
633         avio_wb32(pb, 0x00010000);
634         avio_wb32(pb, 72);
635         avio_wb64(pb, av_double2int(track->enc->sample_rate));
636         avio_wb32(pb, track->enc->channels);
637         avio_wb32(pb, 0x7F000000);
638         avio_wb32(pb, av_get_bits_per_sample(track->enc->codec_id));
639         avio_wb32(pb, mov_get_lpcm_flags(track->enc->codec_id));
640         avio_wb32(pb, track->sample_size);
641         avio_wb32(pb, get_samples_per_packet(track));
642     } else {
643         /* reserved for mp4/3gp */
644         avio_wb16(pb, 2);
645         avio_wb16(pb, 16);
646         avio_wb16(pb, 0);
647
648         avio_wb16(pb, 0); /* packet size (= 0) */
649         avio_wb16(pb, track->enc->sample_rate <= UINT16_MAX ?
650                       track->enc->sample_rate : 0);
651         avio_wb16(pb, 0); /* Reserved */
652     }
653
654     if (track->mode == MODE_MOV &&
655         (track->enc->codec_id == AV_CODEC_ID_AAC           ||
656          track->enc->codec_id == AV_CODEC_ID_AC3           ||
657          track->enc->codec_id == AV_CODEC_ID_AMR_NB        ||
658          track->enc->codec_id == AV_CODEC_ID_ALAC          ||
659          track->enc->codec_id == AV_CODEC_ID_ADPCM_MS      ||
660          track->enc->codec_id == AV_CODEC_ID_ADPCM_IMA_WAV))
661         mov_write_wave_tag(pb, track);
662     else if (track->tag == MKTAG('m','p','4','a'))
663         mov_write_esds_tag(pb, track);
664     else if (track->enc->codec_id == AV_CODEC_ID_AMR_NB)
665         mov_write_amr_tag(pb, track);
666     else if (track->enc->codec_id == AV_CODEC_ID_AC3)
667         mov_write_ac3_tag(pb, track);
668     else if (track->enc->codec_id == AV_CODEC_ID_ALAC)
669         mov_write_extradata_tag(pb, track);
670     else if (track->enc->codec_id == AV_CODEC_ID_WMAPRO)
671         mov_write_wfex_tag(pb, track);
672     else if (track->vos_len > 0)
673         mov_write_glbl_tag(pb, track);
674
675     if (track->mode == MODE_MOV && track->enc->codec_type == AVMEDIA_TYPE_AUDIO)
676         mov_write_chan_tag(pb, track);
677
678     return update_size(pb, pos);
679 }
680
681 static int mov_write_d263_tag(AVIOContext *pb)
682 {
683     avio_wb32(pb, 0xf); /* size */
684     ffio_wfourcc(pb, "d263");
685     ffio_wfourcc(pb, "FFMP");
686     avio_w8(pb, 0); /* decoder version */
687     /* FIXME use AVCodecContext level/profile, when encoder will set values */
688     avio_w8(pb, 0xa); /* level */
689     avio_w8(pb, 0); /* profile */
690     return 0xf;
691 }
692
693 /* TODO: No idea about these values */
694 static int mov_write_svq3_tag(AVIOContext *pb)
695 {
696     avio_wb32(pb, 0x15);
697     ffio_wfourcc(pb, "SMI ");
698     ffio_wfourcc(pb, "SEQH");
699     avio_wb32(pb, 0x5);
700     avio_wb32(pb, 0xe2c0211d);
701     avio_wb32(pb, 0xc0000000);
702     avio_w8(pb, 0);
703     return 0x15;
704 }
705
706 static int mov_write_avcc_tag(AVIOContext *pb, MOVTrack *track)
707 {
708     int64_t pos = avio_tell(pb);
709
710     avio_wb32(pb, 0);
711     ffio_wfourcc(pb, "avcC");
712     ff_isom_write_avcc(pb, track->vos_data, track->vos_len);
713     return update_size(pb, pos);
714 }
715
716 static int mov_write_hvcc_tag(AVIOContext *pb, MOVTrack *track)
717 {
718     int64_t pos = avio_tell(pb);
719
720     avio_wb32(pb, 0);
721     ffio_wfourcc(pb, "hvcC");
722     ff_isom_write_hvcc(pb, track->vos_data, track->vos_len, 0);
723     return update_size(pb, pos);
724 }
725
726 /* also used by all avid codecs (dv, imx, meridien) and their variants */
727 static int mov_write_avid_tag(AVIOContext *pb, MOVTrack *track)
728 {
729     int i;
730     avio_wb32(pb, 24); /* size */
731     ffio_wfourcc(pb, "ACLR");
732     ffio_wfourcc(pb, "ACLR");
733     ffio_wfourcc(pb, "0001");
734     avio_wb32(pb, 2); /* yuv range: full 1 / normal 2 */
735     avio_wb32(pb, 0); /* unknown */
736
737     avio_wb32(pb, 24); /* size */
738     ffio_wfourcc(pb, "APRG");
739     ffio_wfourcc(pb, "APRG");
740     ffio_wfourcc(pb, "0001");
741     avio_wb32(pb, 1); /* unknown */
742     avio_wb32(pb, 0); /* unknown */
743
744     avio_wb32(pb, 120); /* size */
745     ffio_wfourcc(pb, "ARES");
746     ffio_wfourcc(pb, "ARES");
747     ffio_wfourcc(pb, "0001");
748     avio_wb32(pb, AV_RB32(track->vos_data + 0x28)); /* dnxhd cid, some id ? */
749     avio_wb32(pb, track->enc->width);
750     /* values below are based on samples created with quicktime and avid codecs */
751     if (track->vos_data[5] & 2) { // interlaced
752         avio_wb32(pb, track->enc->height / 2);
753         avio_wb32(pb, 2); /* unknown */
754         avio_wb32(pb, 0); /* unknown */
755         avio_wb32(pb, 4); /* unknown */
756     } else {
757         avio_wb32(pb, track->enc->height);
758         avio_wb32(pb, 1); /* unknown */
759         avio_wb32(pb, 0); /* unknown */
760         if (track->enc->height == 1080)
761             avio_wb32(pb, 5); /* unknown */
762         else
763             avio_wb32(pb, 6); /* unknown */
764     }
765     /* padding */
766     for (i = 0; i < 10; i++)
767         avio_wb64(pb, 0);
768
769     /* extra padding for stsd needed */
770     avio_wb32(pb, 0);
771     return 0;
772 }
773
774 static int mp4_get_codec_tag(AVFormatContext *s, MOVTrack *track)
775 {
776     int tag = track->enc->codec_tag;
777
778     if (!ff_codec_get_tag(ff_mp4_obj_type, track->enc->codec_id))
779         return 0;
780
781     if      (track->enc->codec_id == AV_CODEC_ID_H264)      tag = MKTAG('a','v','c','1');
782     else if (track->enc->codec_id == AV_CODEC_ID_HEVC)      tag = MKTAG('h','e','v','1');
783     else if (track->enc->codec_id == AV_CODEC_ID_AC3)       tag = MKTAG('a','c','-','3');
784     else if (track->enc->codec_id == AV_CODEC_ID_DIRAC)     tag = MKTAG('d','r','a','c');
785     else if (track->enc->codec_id == AV_CODEC_ID_MOV_TEXT)  tag = MKTAG('t','x','3','g');
786     else if (track->enc->codec_id == AV_CODEC_ID_VC1)       tag = MKTAG('v','c','-','1');
787     else if (track->enc->codec_type == AVMEDIA_TYPE_VIDEO)  tag = MKTAG('m','p','4','v');
788     else if (track->enc->codec_type == AVMEDIA_TYPE_AUDIO)  tag = MKTAG('m','p','4','a');
789     else if (track->enc->codec_id == AV_CODEC_ID_DVD_SUBTITLE)  tag = MKTAG('m','p','4','s');
790
791     return tag;
792 }
793
794 static const AVCodecTag codec_ipod_tags[] = {
795     { AV_CODEC_ID_H264,     MKTAG('a','v','c','1') },
796     { AV_CODEC_ID_MPEG4,    MKTAG('m','p','4','v') },
797     { AV_CODEC_ID_AAC,      MKTAG('m','p','4','a') },
798     { AV_CODEC_ID_ALAC,     MKTAG('a','l','a','c') },
799     { AV_CODEC_ID_AC3,      MKTAG('a','c','-','3') },
800     { AV_CODEC_ID_MOV_TEXT, MKTAG('t','x','3','g') },
801     { AV_CODEC_ID_MOV_TEXT, MKTAG('t','e','x','t') },
802     { AV_CODEC_ID_NONE, 0 },
803 };
804
805 static int ipod_get_codec_tag(AVFormatContext *s, MOVTrack *track)
806 {
807     int tag = track->enc->codec_tag;
808
809     // keep original tag for subs, ipod supports both formats
810     if (!(track->enc->codec_type == AVMEDIA_TYPE_SUBTITLE &&
811           (tag == MKTAG('t', 'x', '3', 'g') ||
812            tag == MKTAG('t', 'e', 'x', 't'))))
813         tag = ff_codec_get_tag(codec_ipod_tags, track->enc->codec_id);
814
815     if (!av_match_ext(s->filename, "m4a") && !av_match_ext(s->filename, "m4v"))
816         av_log(s, AV_LOG_WARNING, "Warning, extension is not .m4a nor .m4v "
817                "Quicktime/Ipod might not play the file\n");
818
819     return tag;
820 }
821
822 static int mov_get_dv_codec_tag(AVFormatContext *s, MOVTrack *track)
823 {
824     int tag;
825
826     if (track->enc->width == 720) /* SD */
827         if (track->enc->height == 480) /* NTSC */
828             if  (track->enc->pix_fmt == AV_PIX_FMT_YUV422P) tag = MKTAG('d','v','5','n');
829             else                                            tag = MKTAG('d','v','c',' ');
830         else if (track->enc->pix_fmt == AV_PIX_FMT_YUV422P) tag = MKTAG('d','v','5','p');
831         else if (track->enc->pix_fmt == AV_PIX_FMT_YUV420P) tag = MKTAG('d','v','c','p');
832         else                                                tag = MKTAG('d','v','p','p');
833     else if (track->enc->height == 720) /* HD 720 line */
834         if  (track->st->time_base.den == 50)                tag = MKTAG('d','v','h','q');
835         else                                                tag = MKTAG('d','v','h','p');
836     else if (track->enc->height == 1080) /* HD 1080 line */
837         if  (track->st->time_base.den == 25)                tag = MKTAG('d','v','h','5');
838         else                                                tag = MKTAG('d','v','h','6');
839     else {
840         av_log(s, AV_LOG_ERROR, "unsupported height for dv codec\n");
841         return 0;
842     }
843
844     return tag;
845 }
846
847 static const struct {
848     enum AVPixelFormat pix_fmt;
849     uint32_t tag;
850     unsigned bps;
851 } mov_pix_fmt_tags[] = {
852     { AV_PIX_FMT_YUYV422, MKTAG('y','u','v','s'),  0 },
853     { AV_PIX_FMT_UYVY422, MKTAG('2','v','u','y'),  0 },
854     { AV_PIX_FMT_RGB555BE,MKTAG('r','a','w',' '), 16 },
855     { AV_PIX_FMT_RGB555LE,MKTAG('L','5','5','5'), 16 },
856     { AV_PIX_FMT_RGB565LE,MKTAG('L','5','6','5'), 16 },
857     { AV_PIX_FMT_RGB565BE,MKTAG('B','5','6','5'), 16 },
858     { AV_PIX_FMT_GRAY16BE,MKTAG('b','1','6','g'), 16 },
859     { AV_PIX_FMT_RGB24,   MKTAG('r','a','w',' '), 24 },
860     { AV_PIX_FMT_BGR24,   MKTAG('2','4','B','G'), 24 },
861     { AV_PIX_FMT_ARGB,    MKTAG('r','a','w',' '), 32 },
862     { AV_PIX_FMT_BGRA,    MKTAG('B','G','R','A'), 32 },
863     { AV_PIX_FMT_RGBA,    MKTAG('R','G','B','A'), 32 },
864     { AV_PIX_FMT_ABGR,    MKTAG('A','B','G','R'), 32 },
865     { AV_PIX_FMT_RGB48BE, MKTAG('b','4','8','r'), 48 },
866 };
867
868 static int mov_get_rawvideo_codec_tag(AVFormatContext *s, MOVTrack *track)
869 {
870     int tag = track->enc->codec_tag;
871     int i;
872
873     for (i = 0; i < FF_ARRAY_ELEMS(mov_pix_fmt_tags); i++) {
874         if (track->enc->pix_fmt == mov_pix_fmt_tags[i].pix_fmt) {
875             tag = mov_pix_fmt_tags[i].tag;
876             track->enc->bits_per_coded_sample = mov_pix_fmt_tags[i].bps;
877             break;
878         }
879     }
880
881     return tag;
882 }
883
884 static int mov_get_codec_tag(AVFormatContext *s, MOVTrack *track)
885 {
886     int tag = track->enc->codec_tag;
887
888     if (!tag || (s->strict_std_compliance >= FF_COMPLIANCE_NORMAL &&
889                  (track->enc->codec_id == AV_CODEC_ID_DVVIDEO ||
890                   track->enc->codec_id == AV_CODEC_ID_RAWVIDEO ||
891                   track->enc->codec_id == AV_CODEC_ID_H263 ||
892                   av_get_bits_per_sample(track->enc->codec_id)))) { // pcm audio
893         if (track->enc->codec_id == AV_CODEC_ID_DVVIDEO)
894             tag = mov_get_dv_codec_tag(s, track);
895         else if (track->enc->codec_id == AV_CODEC_ID_RAWVIDEO)
896             tag = mov_get_rawvideo_codec_tag(s, track);
897         else if (track->enc->codec_type == AVMEDIA_TYPE_VIDEO) {
898             tag = ff_codec_get_tag(ff_codec_movvideo_tags, track->enc->codec_id);
899             if (!tag) { // if no mac fcc found, try with Microsoft tags
900                 tag = ff_codec_get_tag(ff_codec_bmp_tags, track->enc->codec_id);
901                 if (tag)
902                     av_log(s, AV_LOG_WARNING, "Using MS style video codec tag, "
903                            "the file may be unplayable!\n");
904             }
905         } else if (track->enc->codec_type == AVMEDIA_TYPE_AUDIO) {
906             tag = ff_codec_get_tag(ff_codec_movaudio_tags, track->enc->codec_id);
907             if (!tag) { // if no mac fcc found, try with Microsoft tags
908                 int ms_tag = ff_codec_get_tag(ff_codec_wav_tags, track->enc->codec_id);
909                 if (ms_tag) {
910                     tag = MKTAG('m', 's', ((ms_tag >> 8) & 0xff), (ms_tag & 0xff));
911                     av_log(s, AV_LOG_WARNING, "Using MS style audio codec tag, "
912                            "the file may be unplayable!\n");
913                 }
914             }
915         } else if (track->enc->codec_type == AVMEDIA_TYPE_SUBTITLE)
916             tag = ff_codec_get_tag(ff_codec_movsubtitle_tags, track->enc->codec_id);
917     }
918
919     return tag;
920 }
921
922 static const AVCodecTag codec_3gp_tags[] = {
923     { AV_CODEC_ID_H263,     MKTAG('s','2','6','3') },
924     { AV_CODEC_ID_H264,     MKTAG('a','v','c','1') },
925     { AV_CODEC_ID_MPEG4,    MKTAG('m','p','4','v') },
926     { AV_CODEC_ID_AAC,      MKTAG('m','p','4','a') },
927     { AV_CODEC_ID_AMR_NB,   MKTAG('s','a','m','r') },
928     { AV_CODEC_ID_AMR_WB,   MKTAG('s','a','w','b') },
929     { AV_CODEC_ID_MOV_TEXT, MKTAG('t','x','3','g') },
930     { AV_CODEC_ID_NONE, 0 },
931 };
932
933 static const AVCodecTag codec_f4v_tags[] = {
934     { AV_CODEC_ID_MP3,    MKTAG('.','m','p','3') },
935     { AV_CODEC_ID_AAC,    MKTAG('m','p','4','a') },
936     { AV_CODEC_ID_H264,   MKTAG('a','v','c','1') },
937     { AV_CODEC_ID_VP6A,   MKTAG('V','P','6','A') },
938     { AV_CODEC_ID_VP6F,   MKTAG('V','P','6','F') },
939     { AV_CODEC_ID_NONE, 0 },
940 };
941
942 static int mov_find_codec_tag(AVFormatContext *s, MOVTrack *track)
943 {
944     int tag;
945
946     if (track->mode == MODE_MP4 || track->mode == MODE_PSP)
947         tag = mp4_get_codec_tag(s, track);
948     else if (track->mode == MODE_ISM) {
949         tag = mp4_get_codec_tag(s, track);
950         if (!tag && track->enc->codec_id == AV_CODEC_ID_WMAPRO)
951             tag = MKTAG('w', 'm', 'a', ' ');
952     } else if (track->mode == MODE_IPOD)
953         tag = ipod_get_codec_tag(s, track);
954     else if (track->mode & MODE_3GP)
955         tag = ff_codec_get_tag(codec_3gp_tags, track->enc->codec_id);
956     else if (track->mode == MODE_F4V)
957         tag = ff_codec_get_tag(codec_f4v_tags, track->enc->codec_id);
958     else
959         tag = mov_get_codec_tag(s, track);
960
961     return tag;
962 }
963
964 /** Write uuid atom.
965  * Needed to make file play in iPods running newest firmware
966  * goes after avcC atom in moov.trak.mdia.minf.stbl.stsd.avc1
967  */
968 static int mov_write_uuid_tag_ipod(AVIOContext *pb)
969 {
970     avio_wb32(pb, 28);
971     ffio_wfourcc(pb, "uuid");
972     avio_wb32(pb, 0x6b6840f2);
973     avio_wb32(pb, 0x5f244fc5);
974     avio_wb32(pb, 0xba39a51b);
975     avio_wb32(pb, 0xcf0323f3);
976     avio_wb32(pb, 0x0);
977     return 28;
978 }
979
980 static const uint16_t fiel_data[] = {
981     0x0000, 0x0100, 0x0201, 0x0206, 0x0209, 0x020e
982 };
983
984 static int mov_write_fiel_tag(AVIOContext *pb, MOVTrack *track)
985 {
986     unsigned mov_field_order = 0;
987     if (track->enc->field_order < FF_ARRAY_ELEMS(fiel_data))
988         mov_field_order = fiel_data[track->enc->field_order];
989     else
990         return 0;
991     avio_wb32(pb, 10);
992     ffio_wfourcc(pb, "fiel");
993     avio_wb16(pb, mov_field_order);
994     return 10;
995 }
996
997 static int mov_write_subtitle_tag(AVIOContext *pb, MOVTrack *track)
998 {
999     int64_t pos = avio_tell(pb);
1000     avio_wb32(pb, 0);    /* size */
1001     avio_wl32(pb, track->tag); // store it byteswapped
1002     avio_wb32(pb, 0);    /* Reserved */
1003     avio_wb16(pb, 0);    /* Reserved */
1004     avio_wb16(pb, 1);    /* Data-reference index */
1005
1006     if (track->enc->codec_id == AV_CODEC_ID_DVD_SUBTITLE)
1007         mov_write_esds_tag(pb, track);
1008     else if (track->enc->extradata_size)
1009         avio_write(pb, track->enc->extradata, track->enc->extradata_size);
1010
1011     return update_size(pb, pos);
1012 }
1013
1014 static int mov_write_pasp_tag(AVIOContext *pb, MOVTrack *track)
1015 {
1016     AVRational sar;
1017     av_reduce(&sar.num, &sar.den, track->enc->sample_aspect_ratio.num,
1018               track->enc->sample_aspect_ratio.den, INT_MAX);
1019
1020     avio_wb32(pb, 16);
1021     ffio_wfourcc(pb, "pasp");
1022     avio_wb32(pb, sar.num);
1023     avio_wb32(pb, sar.den);
1024     return 16;
1025 }
1026
1027 static int mov_write_video_tag(AVIOContext *pb, MOVTrack *track)
1028 {
1029     AVDictionaryEntry *encoder;
1030     int64_t pos = avio_tell(pb);
1031     char compressor_name[32] = { 0 };
1032
1033     avio_wb32(pb, 0); /* size */
1034     avio_wl32(pb, track->tag); // store it byteswapped
1035     avio_wb32(pb, 0); /* Reserved */
1036     avio_wb16(pb, 0); /* Reserved */
1037     avio_wb16(pb, 1); /* Data-reference index */
1038
1039     avio_wb16(pb, 0); /* Codec stream version */
1040     avio_wb16(pb, 0); /* Codec stream revision (=0) */
1041     if (track->mode == MODE_MOV) {
1042         ffio_wfourcc(pb, "FFMP"); /* Vendor */
1043         if (track->enc->codec_id == AV_CODEC_ID_RAWVIDEO) {
1044             avio_wb32(pb, 0); /* Temporal Quality */
1045             avio_wb32(pb, 0x400); /* Spatial Quality = lossless*/
1046         } else {
1047             avio_wb32(pb, 0x200); /* Temporal Quality = normal */
1048             avio_wb32(pb, 0x200); /* Spatial Quality = normal */
1049         }
1050     } else {
1051         avio_wb32(pb, 0); /* Reserved */
1052         avio_wb32(pb, 0); /* Reserved */
1053         avio_wb32(pb, 0); /* Reserved */
1054     }
1055     avio_wb16(pb, track->enc->width); /* Video width */
1056     avio_wb16(pb, track->height); /* Video height */
1057     avio_wb32(pb, 0x00480000); /* Horizontal resolution 72dpi */
1058     avio_wb32(pb, 0x00480000); /* Vertical resolution 72dpi */
1059     avio_wb32(pb, 0); /* Data size (= 0) */
1060     avio_wb16(pb, 1); /* Frame count (= 1) */
1061
1062     /* FIXME not sure, ISO 14496-1 draft where it shall be set to 0 */
1063     if (track->mode == MODE_MOV &&
1064         (encoder = av_dict_get(track->st->metadata, "encoder", NULL, 0)))
1065         av_strlcpy(compressor_name, encoder->value, 32);
1066     avio_w8(pb, strlen(compressor_name));
1067     avio_write(pb, compressor_name, 31);
1068
1069     if (track->mode == MODE_MOV && track->enc->bits_per_coded_sample)
1070         avio_wb16(pb, track->enc->bits_per_coded_sample);
1071     else
1072         avio_wb16(pb, 0x18); /* Reserved */
1073     avio_wb16(pb, 0xffff); /* Reserved */
1074     if (track->tag == MKTAG('m','p','4','v'))
1075         mov_write_esds_tag(pb, track);
1076     else if (track->enc->codec_id == AV_CODEC_ID_H263)
1077         mov_write_d263_tag(pb);
1078     else if (track->enc->codec_id == AV_CODEC_ID_SVQ3)
1079         mov_write_svq3_tag(pb);
1080     else if (track->enc->codec_id == AV_CODEC_ID_DNXHD)
1081         mov_write_avid_tag(pb, track);
1082     else if (track->enc->codec_id == AV_CODEC_ID_HEVC)
1083         mov_write_hvcc_tag(pb, track);
1084     else if (track->enc->codec_id == AV_CODEC_ID_H264) {
1085         mov_write_avcc_tag(pb, track);
1086         if (track->mode == MODE_IPOD)
1087             mov_write_uuid_tag_ipod(pb);
1088     } else if (track->enc->field_order != AV_FIELD_UNKNOWN)
1089         mov_write_fiel_tag(pb, track);
1090     else if (track->enc->codec_id == AV_CODEC_ID_VC1 && track->vos_len > 0)
1091         mov_write_dvc1_tag(pb, track);
1092     else if (track->enc->codec_id == AV_CODEC_ID_VP6F ||
1093              track->enc->codec_id == AV_CODEC_ID_VP6A) {
1094         /* Don't write any potential extradata here - the cropping
1095          * is signalled via the normal width/height fields. */
1096     } else if (track->vos_len > 0)
1097         mov_write_glbl_tag(pb, track);
1098
1099     if (track->enc->sample_aspect_ratio.den && track->enc->sample_aspect_ratio.num &&
1100         track->enc->sample_aspect_ratio.den != track->enc->sample_aspect_ratio.num) {
1101         mov_write_pasp_tag(pb, track);
1102     }
1103
1104     return update_size(pb, pos);
1105 }
1106
1107 static int mov_write_rtp_tag(AVIOContext *pb, MOVTrack *track)
1108 {
1109     int64_t pos = avio_tell(pb);
1110     avio_wb32(pb, 0); /* size */
1111     ffio_wfourcc(pb, "rtp ");
1112     avio_wb32(pb, 0); /* Reserved */
1113     avio_wb16(pb, 0); /* Reserved */
1114     avio_wb16(pb, 1); /* Data-reference index */
1115
1116     avio_wb16(pb, 1); /* Hint track version */
1117     avio_wb16(pb, 1); /* Highest compatible version */
1118     avio_wb32(pb, track->max_packet_size); /* Max packet size */
1119
1120     avio_wb32(pb, 12); /* size */
1121     ffio_wfourcc(pb, "tims");
1122     avio_wb32(pb, track->timescale);
1123
1124     return update_size(pb, pos);
1125 }
1126
1127 static int mov_write_tmcd_tag(AVIOContext *pb, MOVTrack *track)
1128 {
1129     int64_t pos = avio_tell(pb);
1130
1131     avio_wb32(pb, 0); /* size */
1132     ffio_wfourcc(pb, "tmcd");               /* Data format */
1133     avio_wb32(pb, 0);                       /* Reserved */
1134     avio_wb32(pb, 1);                       /* Data reference index */
1135     if (track->enc->extradata_size)
1136         avio_write(pb, track->enc->extradata, track->enc->extradata_size);
1137     return update_size(pb, pos);
1138 }
1139
1140 static int mov_write_stsd_tag(AVIOContext *pb, MOVTrack *track)
1141 {
1142     int64_t pos = avio_tell(pb);
1143     avio_wb32(pb, 0); /* size */
1144     ffio_wfourcc(pb, "stsd");
1145     avio_wb32(pb, 0); /* version & flags */
1146     avio_wb32(pb, 1); /* entry count */
1147     if (track->enc->codec_type == AVMEDIA_TYPE_VIDEO)
1148         mov_write_video_tag(pb, track);
1149     else if (track->enc->codec_type == AVMEDIA_TYPE_AUDIO)
1150         mov_write_audio_tag(pb, track);
1151     else if (track->enc->codec_type == AVMEDIA_TYPE_SUBTITLE)
1152         mov_write_subtitle_tag(pb, track);
1153     else if (track->enc->codec_tag == MKTAG('r','t','p',' '))
1154         mov_write_rtp_tag(pb, track);
1155     else if (track->enc->codec_tag == MKTAG('t','m','c','d'))
1156         mov_write_tmcd_tag(pb, track);
1157     return update_size(pb, pos);
1158 }
1159
1160 static int mov_write_ctts_tag(AVIOContext *pb, MOVTrack *track)
1161 {
1162     MOVStts *ctts_entries;
1163     uint32_t entries = 0;
1164     uint32_t atom_size;
1165     int i;
1166
1167     ctts_entries = av_malloc((track->entry + 1) * sizeof(*ctts_entries)); /* worst case */
1168     ctts_entries[0].count = 1;
1169     ctts_entries[0].duration = track->cluster[0].cts;
1170     for (i = 1; i < track->entry; i++) {
1171         if (track->cluster[i].cts == ctts_entries[entries].duration) {
1172             ctts_entries[entries].count++; /* compress */
1173         } else {
1174             entries++;
1175             ctts_entries[entries].duration = track->cluster[i].cts;
1176             ctts_entries[entries].count = 1;
1177         }
1178     }
1179     entries++; /* last one */
1180     atom_size = 16 + (entries * 8);
1181     avio_wb32(pb, atom_size); /* size */
1182     ffio_wfourcc(pb, "ctts");
1183     avio_wb32(pb, 0); /* version & flags */
1184     avio_wb32(pb, entries); /* entry count */
1185     for (i = 0; i < entries; i++) {
1186         avio_wb32(pb, ctts_entries[i].count);
1187         avio_wb32(pb, ctts_entries[i].duration);
1188     }
1189     av_free(ctts_entries);
1190     return atom_size;
1191 }
1192
1193 /* Time to sample atom */
1194 static int mov_write_stts_tag(AVIOContext *pb, MOVTrack *track)
1195 {
1196     MOVStts *stts_entries;
1197     uint32_t entries = -1;
1198     uint32_t atom_size;
1199     int i;
1200
1201     if (track->enc->codec_type == AVMEDIA_TYPE_AUDIO && !track->audio_vbr) {
1202         stts_entries = av_malloc(sizeof(*stts_entries)); /* one entry */
1203         stts_entries[0].count = track->sample_count;
1204         stts_entries[0].duration = 1;
1205         entries = 1;
1206     } else {
1207         stts_entries = track->entry ?
1208                        av_malloc(track->entry * sizeof(*stts_entries)) : /* worst case */
1209                        NULL;
1210         for (i = 0; i < track->entry; i++) {
1211             int duration = get_cluster_duration(track, i);
1212             if (i && duration == stts_entries[entries].duration) {
1213                 stts_entries[entries].count++; /* compress */
1214             } else {
1215                 entries++;
1216                 stts_entries[entries].duration = duration;
1217                 stts_entries[entries].count = 1;
1218             }
1219         }
1220         entries++; /* last one */
1221     }
1222     atom_size = 16 + (entries * 8);
1223     avio_wb32(pb, atom_size); /* size */
1224     ffio_wfourcc(pb, "stts");
1225     avio_wb32(pb, 0); /* version & flags */
1226     avio_wb32(pb, entries); /* entry count */
1227     for (i = 0; i < entries; i++) {
1228         avio_wb32(pb, stts_entries[i].count);
1229         avio_wb32(pb, stts_entries[i].duration);
1230     }
1231     av_free(stts_entries);
1232     return atom_size;
1233 }
1234
1235 static int mov_write_dref_tag(AVIOContext *pb)
1236 {
1237     avio_wb32(pb, 28); /* size */
1238     ffio_wfourcc(pb, "dref");
1239     avio_wb32(pb, 0); /* version & flags */
1240     avio_wb32(pb, 1); /* entry count */
1241
1242     avio_wb32(pb, 0xc); /* size */
1243     ffio_wfourcc(pb, "url ");
1244     avio_wb32(pb, 1); /* version & flags */
1245
1246     return 28;
1247 }
1248
1249 static int mov_write_stbl_tag(AVIOContext *pb, MOVTrack *track)
1250 {
1251     int64_t pos = avio_tell(pb);
1252     avio_wb32(pb, 0); /* size */
1253     ffio_wfourcc(pb, "stbl");
1254     mov_write_stsd_tag(pb, track);
1255     mov_write_stts_tag(pb, track);
1256     if ((track->enc->codec_type == AVMEDIA_TYPE_VIDEO ||
1257          track->enc->codec_tag == MKTAG('r','t','p',' ')) &&
1258         track->has_keyframes && track->has_keyframes < track->entry)
1259         mov_write_stss_tag(pb, track, MOV_SYNC_SAMPLE);
1260     if (track->mode == MODE_MOV && track->flags & MOV_TRACK_STPS)
1261         mov_write_stss_tag(pb, track, MOV_PARTIAL_SYNC_SAMPLE);
1262     if (track->enc->codec_type == AVMEDIA_TYPE_VIDEO &&
1263         track->flags & MOV_TRACK_CTTS)
1264         mov_write_ctts_tag(pb, track);
1265     mov_write_stsc_tag(pb, track);
1266     mov_write_stsz_tag(pb, track);
1267     mov_write_stco_tag(pb, track);
1268     return update_size(pb, pos);
1269 }
1270
1271 static int mov_write_dinf_tag(AVIOContext *pb)
1272 {
1273     int64_t pos = avio_tell(pb);
1274     avio_wb32(pb, 0); /* size */
1275     ffio_wfourcc(pb, "dinf");
1276     mov_write_dref_tag(pb);
1277     return update_size(pb, pos);
1278 }
1279
1280 static int mov_write_nmhd_tag(AVIOContext *pb)
1281 {
1282     avio_wb32(pb, 12);
1283     ffio_wfourcc(pb, "nmhd");
1284     avio_wb32(pb, 0);
1285     return 12;
1286 }
1287
1288 static int mov_write_gmhd_tag(AVIOContext *pb)
1289 {
1290     avio_wb32(pb, 0x20);   /* size */
1291     ffio_wfourcc(pb, "gmhd");
1292     avio_wb32(pb, 0x18);   /* gmin size */
1293     ffio_wfourcc(pb, "gmin");/* generic media info */
1294     avio_wb32(pb, 0);      /* version & flags */
1295     avio_wb16(pb, 0x40);   /* graphics mode = */
1296     avio_wb16(pb, 0x8000); /* opColor (r?) */
1297     avio_wb16(pb, 0x8000); /* opColor (g?) */
1298     avio_wb16(pb, 0x8000); /* opColor (b?) */
1299     avio_wb16(pb, 0);      /* balance */
1300     avio_wb16(pb, 0);      /* reserved */
1301     return 0x20;
1302 }
1303
1304 static int mov_write_smhd_tag(AVIOContext *pb)
1305 {
1306     avio_wb32(pb, 16); /* size */
1307     ffio_wfourcc(pb, "smhd");
1308     avio_wb32(pb, 0); /* version & flags */
1309     avio_wb16(pb, 0); /* reserved (balance, normally = 0) */
1310     avio_wb16(pb, 0); /* reserved */
1311     return 16;
1312 }
1313
1314 static int mov_write_vmhd_tag(AVIOContext *pb)
1315 {
1316     avio_wb32(pb, 0x14); /* size (always 0x14) */
1317     ffio_wfourcc(pb, "vmhd");
1318     avio_wb32(pb, 0x01); /* version & flags */
1319     avio_wb64(pb, 0); /* reserved (graphics mode = copy) */
1320     return 0x14;
1321 }
1322
1323 static int is_clcp_track(MOVTrack *track)
1324 {
1325     return track->tag == MKTAG('c','7','0','8') ||
1326            track->tag == MKTAG('c','6','0','8');
1327 }
1328
1329 static int mov_write_hdlr_tag(AVIOContext *pb, MOVTrack *track)
1330 {
1331     const char *hdlr, *descr = NULL, *hdlr_type = NULL;
1332     int64_t pos = avio_tell(pb);
1333
1334     hdlr      = "dhlr";
1335     hdlr_type = "url ";
1336     descr     = "DataHandler";
1337
1338     if (track) {
1339         hdlr = (track->mode == MODE_MOV) ? "mhlr" : "\0\0\0\0";
1340         if (track->enc->codec_type == AVMEDIA_TYPE_VIDEO) {
1341             hdlr_type = "vide";
1342             descr     = "VideoHandler";
1343         } else if (track->enc->codec_type == AVMEDIA_TYPE_AUDIO) {
1344             hdlr_type = "soun";
1345             descr     = "SoundHandler";
1346         } else if (track->enc->codec_type == AVMEDIA_TYPE_SUBTITLE) {
1347             if (track->tag == MKTAG('t','x','3','g')) {
1348                 hdlr_type = "sbtl";
1349             } else if (track->tag == MKTAG('m','p','4','s')) {
1350                 hdlr_type = "subp";
1351             } else if (is_clcp_track(track)) {
1352                 hdlr_type = "clcp";
1353             } else {
1354                 hdlr_type = "text";
1355             }
1356             descr = "SubtitleHandler";
1357         } else if (track->enc->codec_tag == MKTAG('r','t','p',' ')) {
1358             hdlr_type = "hint";
1359             descr     = "HintHandler";
1360         } else if (track->enc->codec_tag == MKTAG('t','m','c','d')) {
1361             hdlr_type = "tmcd";
1362             descr = "TimeCodeHandler";
1363         } else {
1364             char tag_buf[32];
1365             av_get_codec_tag_string(tag_buf, sizeof(tag_buf),
1366                                     track->enc->codec_tag);
1367
1368             av_log(track->enc, AV_LOG_WARNING,
1369                    "Unknown hldr_type for %s / 0x%04X, writing dummy values\n",
1370                    tag_buf, track->enc->codec_tag);
1371         }
1372         if (track->st) {
1373             // hdlr.name is used by some players to identify the content title
1374             // of the track. So if an alternate handler description is
1375             // specified, use it.
1376             AVDictionaryEntry *t;
1377             t = av_dict_get(track->st->metadata, "handler", NULL, 0);
1378             if (t && utf8len(t->value))
1379                 descr = t->value;
1380         }
1381     }
1382
1383     avio_wb32(pb, 0); /* size */
1384     ffio_wfourcc(pb, "hdlr");
1385     avio_wb32(pb, 0); /* Version & flags */
1386     avio_write(pb, hdlr, 4); /* handler */
1387     ffio_wfourcc(pb, hdlr_type); /* handler type */
1388     avio_wb32(pb, 0); /* reserved */
1389     avio_wb32(pb, 0); /* reserved */
1390     avio_wb32(pb, 0); /* reserved */
1391     if (!track || track->mode == MODE_MOV)
1392         avio_w8(pb, strlen(descr)); /* pascal string */
1393     avio_write(pb, descr, strlen(descr)); /* handler description */
1394     if (track && track->mode != MODE_MOV)
1395         avio_w8(pb, 0); /* c string */
1396     return update_size(pb, pos);
1397 }
1398
1399 static int mov_write_hmhd_tag(AVIOContext *pb)
1400 {
1401     /* This atom must be present, but leaving the values at zero
1402      * seems harmless. */
1403     avio_wb32(pb, 28); /* size */
1404     ffio_wfourcc(pb, "hmhd");
1405     avio_wb32(pb, 0); /* version, flags */
1406     avio_wb16(pb, 0); /* maxPDUsize */
1407     avio_wb16(pb, 0); /* avgPDUsize */
1408     avio_wb32(pb, 0); /* maxbitrate */
1409     avio_wb32(pb, 0); /* avgbitrate */
1410     avio_wb32(pb, 0); /* reserved */
1411     return 28;
1412 }
1413
1414 static int mov_write_minf_tag(AVIOContext *pb, MOVTrack *track)
1415 {
1416     int64_t pos = avio_tell(pb);
1417     avio_wb32(pb, 0); /* size */
1418     ffio_wfourcc(pb, "minf");
1419     if (track->enc->codec_type == AVMEDIA_TYPE_VIDEO)
1420         mov_write_vmhd_tag(pb);
1421     else if (track->enc->codec_type == AVMEDIA_TYPE_AUDIO)
1422         mov_write_smhd_tag(pb);
1423     else if (track->enc->codec_type == AVMEDIA_TYPE_SUBTITLE) {
1424         if (track->tag == MKTAG('t','e','x','t') || is_clcp_track(track)) {
1425             mov_write_gmhd_tag(pb);
1426         } else {
1427             mov_write_nmhd_tag(pb);
1428         }
1429     } else if (track->tag == MKTAG('r','t','p',' ')) {
1430         mov_write_hmhd_tag(pb);
1431     } else if (track->tag == MKTAG('t','m','c','d')) {
1432         mov_write_gmhd_tag(pb);
1433     }
1434     if (track->mode == MODE_MOV) /* FIXME: Why do it for MODE_MOV only ? */
1435         mov_write_hdlr_tag(pb, NULL);
1436     mov_write_dinf_tag(pb);
1437     mov_write_stbl_tag(pb, track);
1438     return update_size(pb, pos);
1439 }
1440
1441 static int mov_write_mdhd_tag(AVIOContext *pb, MOVMuxContext *mov,
1442                               MOVTrack *track)
1443 {
1444     int version = track->track_duration < INT32_MAX ? 0 : 1;
1445
1446     if (track->mode == MODE_ISM)
1447         version = 1;
1448
1449     (version == 1) ? avio_wb32(pb, 44) : avio_wb32(pb, 32); /* size */
1450     ffio_wfourcc(pb, "mdhd");
1451     avio_w8(pb, version);
1452     avio_wb24(pb, 0); /* flags */
1453     if (version == 1) {
1454         avio_wb64(pb, track->time);
1455         avio_wb64(pb, track->time);
1456     } else {
1457         avio_wb32(pb, track->time); /* creation time */
1458         avio_wb32(pb, track->time); /* modification time */
1459     }
1460     avio_wb32(pb, track->timescale); /* time scale (sample rate for audio) */
1461     if (!track->entry && mov->mode == MODE_ISM)
1462         (version == 1) ? avio_wb64(pb, UINT64_C(0xffffffffffffffff)) : avio_wb32(pb, 0xffffffff);
1463     else if (!track->entry)
1464         (version == 1) ? avio_wb64(pb, 0) : avio_wb32(pb, 0);
1465     else
1466         (version == 1) ? avio_wb64(pb, track->track_duration) : avio_wb32(pb, track->track_duration); /* duration */
1467     avio_wb16(pb, track->language); /* language */
1468     avio_wb16(pb, 0); /* reserved (quality) */
1469
1470     if (version != 0 && track->mode == MODE_MOV) {
1471         av_log(NULL, AV_LOG_ERROR,
1472                "FATAL error, file duration too long for timebase, this file will not be\n"
1473                "playable with quicktime. Choose a different timebase or a different\n"
1474                "container format\n");
1475     }
1476
1477     return 32;
1478 }
1479
1480 static int mov_write_mdia_tag(AVIOContext *pb, MOVMuxContext *mov,
1481                               MOVTrack *track)
1482 {
1483     int64_t pos = avio_tell(pb);
1484     avio_wb32(pb, 0); /* size */
1485     ffio_wfourcc(pb, "mdia");
1486     mov_write_mdhd_tag(pb, mov, track);
1487     mov_write_hdlr_tag(pb, track);
1488     mov_write_minf_tag(pb, track);
1489     return update_size(pb, pos);
1490 }
1491
1492 static int mov_write_tkhd_tag(AVIOContext *pb, MOVMuxContext *mov,
1493                               MOVTrack *track, AVStream *st)
1494 {
1495     int64_t duration = av_rescale_rnd(track->track_duration, MOV_TIMESCALE,
1496                                       track->timescale, AV_ROUND_UP);
1497     int version = duration < INT32_MAX ? 0 : 1;
1498     int flags   = MOV_TKHD_FLAG_IN_MOVIE;
1499     int group   = 0;
1500
1501
1502     if (st) {
1503         if (mov->per_stream_grouping)
1504             group = st->index;
1505         else
1506             group = st->codec->codec_type;
1507     }
1508
1509     if (track->flags & MOV_TRACK_ENABLED)
1510         flags |= MOV_TKHD_FLAG_ENABLED;
1511
1512     if (track->mode == MODE_ISM)
1513         version = 1;
1514
1515     (version == 1) ? avio_wb32(pb, 104) : avio_wb32(pb, 92); /* size */
1516     ffio_wfourcc(pb, "tkhd");
1517     avio_w8(pb, version);
1518     avio_wb24(pb, flags);
1519     if (version == 1) {
1520         avio_wb64(pb, track->time);
1521         avio_wb64(pb, track->time);
1522     } else {
1523         avio_wb32(pb, track->time); /* creation time */
1524         avio_wb32(pb, track->time); /* modification time */
1525     }
1526     avio_wb32(pb, track->track_id); /* track-id */
1527     avio_wb32(pb, 0); /* reserved */
1528     if (!track->entry && mov->mode == MODE_ISM)
1529         (version == 1) ? avio_wb64(pb, UINT64_C(0xffffffffffffffff)) : avio_wb32(pb, 0xffffffff);
1530     else if (!track->entry)
1531         (version == 1) ? avio_wb64(pb, 0) : avio_wb32(pb, 0);
1532     else
1533         (version == 1) ? avio_wb64(pb, duration) : avio_wb32(pb, duration);
1534
1535     avio_wb32(pb, 0); /* reserved */
1536     avio_wb32(pb, 0); /* reserved */
1537     avio_wb16(pb, 0); /* layer */
1538     avio_wb16(pb, group); /* alternate group) */
1539     /* Volume, only for audio */
1540     if (track->enc->codec_type == AVMEDIA_TYPE_AUDIO)
1541         avio_wb16(pb, 0x0100);
1542     else
1543         avio_wb16(pb, 0);
1544     avio_wb16(pb, 0); /* reserved */
1545
1546     /* Matrix structure */
1547     avio_wb32(pb, 0x00010000); /* reserved */
1548     avio_wb32(pb, 0x0); /* reserved */
1549     avio_wb32(pb, 0x0); /* reserved */
1550     avio_wb32(pb, 0x0); /* reserved */
1551     avio_wb32(pb, 0x00010000); /* reserved */
1552     avio_wb32(pb, 0x0); /* reserved */
1553     avio_wb32(pb, 0x0); /* reserved */
1554     avio_wb32(pb, 0x0); /* reserved */
1555     avio_wb32(pb, 0x40000000); /* reserved */
1556
1557     /* Track width and height, for visual only */
1558     if (st && (track->enc->codec_type == AVMEDIA_TYPE_VIDEO ||
1559                track->enc->codec_type == AVMEDIA_TYPE_SUBTITLE)) {
1560         if (track->mode == MODE_MOV) {
1561             avio_wb32(pb, track->enc->width << 16);
1562             avio_wb32(pb, track->height << 16);
1563         } else {
1564             double sample_aspect_ratio = av_q2d(st->sample_aspect_ratio);
1565             if (!sample_aspect_ratio || track->height != track->enc->height)
1566                 sample_aspect_ratio = 1;
1567             avio_wb32(pb, sample_aspect_ratio * track->enc->width * 0x10000);
1568             avio_wb32(pb, track->height * 0x10000);
1569         }
1570     } else {
1571         avio_wb32(pb, 0);
1572         avio_wb32(pb, 0);
1573     }
1574     return 0x5c;
1575 }
1576
1577 static int mov_write_tapt_tag(AVIOContext *pb, MOVTrack *track)
1578 {
1579     int32_t width = av_rescale(track->enc->sample_aspect_ratio.num, track->enc->width,
1580                                track->enc->sample_aspect_ratio.den);
1581
1582     int64_t pos = avio_tell(pb);
1583
1584     avio_wb32(pb, 0); /* size */
1585     ffio_wfourcc(pb, "tapt");
1586
1587     avio_wb32(pb, 20);
1588     ffio_wfourcc(pb, "clef");
1589     avio_wb32(pb, 0);
1590     avio_wb32(pb, width << 16);
1591     avio_wb32(pb, track->enc->height << 16);
1592
1593     avio_wb32(pb, 20);
1594     ffio_wfourcc(pb, "prof");
1595     avio_wb32(pb, 0);
1596     avio_wb32(pb, width << 16);
1597     avio_wb32(pb, track->enc->height << 16);
1598
1599     avio_wb32(pb, 20);
1600     ffio_wfourcc(pb, "enof");
1601     avio_wb32(pb, 0);
1602     avio_wb32(pb, track->enc->width << 16);
1603     avio_wb32(pb, track->enc->height << 16);
1604
1605     return update_size(pb, pos);
1606 }
1607
1608 // This box seems important for the psp playback ... without it the movie seems to hang
1609 static int mov_write_edts_tag(AVIOContext *pb, MOVMuxContext *mov,
1610                               MOVTrack *track)
1611 {
1612     int64_t duration = av_rescale_rnd(track->track_duration, MOV_TIMESCALE,
1613                                       track->timescale, AV_ROUND_UP);
1614     int version = duration < INT32_MAX ? 0 : 1;
1615     int entry_size, entry_count, size;
1616     int64_t delay, start_ct = track->cluster[0].cts;
1617     delay = av_rescale_rnd(track->cluster[0].dts + start_ct, MOV_TIMESCALE,
1618                            track->timescale, AV_ROUND_DOWN);
1619     version |= delay < INT32_MAX ? 0 : 1;
1620
1621     entry_size = (version == 1) ? 20 : 12;
1622     entry_count = 1 + (delay > 0);
1623     size = 24 + entry_count * entry_size;
1624
1625     /* write the atom data */
1626     avio_wb32(pb, size);
1627     ffio_wfourcc(pb, "edts");
1628     avio_wb32(pb, size - 8);
1629     ffio_wfourcc(pb, "elst");
1630     avio_w8(pb, version);
1631     avio_wb24(pb, 0); /* flags */
1632
1633     avio_wb32(pb, entry_count);
1634     if (delay > 0) { /* add an empty edit to delay presentation */
1635         /* In the positive delay case, the delay includes the cts
1636          * offset, and the second edit list entry below trims out
1637          * the same amount from the actual content. This makes sure
1638          * that the offsetted last sample is included in the edit
1639          * list duration as well. */
1640         if (version == 1) {
1641             avio_wb64(pb, delay);
1642             avio_wb64(pb, -1);
1643         } else {
1644             avio_wb32(pb, delay);
1645             avio_wb32(pb, -1);
1646         }
1647         avio_wb32(pb, 0x00010000);
1648     } else {
1649         /* Avoid accidentally ending up with start_ct = -1 which has got a
1650          * special meaning. Normally start_ct should end up positive or zero
1651          * here, but use FFMIN in case dts is a a small positive integer
1652          * rounded to 0 when represented in MOV_TIMESCALE units. */
1653         start_ct  = -FFMIN(track->cluster[0].dts, 0);
1654         /* Note, this delay is calculated from the pts of the first sample,
1655          * ensuring that we don't reduce the duration for cases with
1656          * dts<0 pts=0. */
1657         duration += delay;
1658     }
1659
1660     /* For fragmented files, we don't know the full length yet. Setting
1661      * duration to 0 allows us to only specify the offset, including
1662      * the rest of the content (from all future fragments) without specifying
1663      * an explicit duration. */
1664     if (mov->flags & FF_MOV_FLAG_FRAGMENT)
1665         duration = 0;
1666
1667     /* duration */
1668     if (version == 1) {
1669         avio_wb64(pb, duration);
1670         avio_wb64(pb, start_ct);
1671     } else {
1672         avio_wb32(pb, duration);
1673         avio_wb32(pb, start_ct);
1674     }
1675     avio_wb32(pb, 0x00010000);
1676     return size;
1677 }
1678
1679 static int mov_write_tref_tag(AVIOContext *pb, MOVTrack *track)
1680 {
1681     avio_wb32(pb, 20);   // size
1682     ffio_wfourcc(pb, "tref");
1683     avio_wb32(pb, 12);   // size (subatom)
1684     avio_wl32(pb, track->tref_tag);
1685     avio_wb32(pb, track->tref_id);
1686     return 20;
1687 }
1688
1689 // goes at the end of each track!  ... Critical for PSP playback ("Incompatible data" without it)
1690 static int mov_write_uuid_tag_psp(AVIOContext *pb, MOVTrack *mov)
1691 {
1692     avio_wb32(pb, 0x34); /* size ... reports as 28 in mp4box! */
1693     ffio_wfourcc(pb, "uuid");
1694     ffio_wfourcc(pb, "USMT");
1695     avio_wb32(pb, 0x21d24fce);
1696     avio_wb32(pb, 0xbb88695c);
1697     avio_wb32(pb, 0xfac9c740);
1698     avio_wb32(pb, 0x1c);     // another size here!
1699     ffio_wfourcc(pb, "MTDT");
1700     avio_wb32(pb, 0x00010012);
1701     avio_wb32(pb, 0x0a);
1702     avio_wb32(pb, 0x55c40000);
1703     avio_wb32(pb, 0x1);
1704     avio_wb32(pb, 0x0);
1705     return 0x34;
1706 }
1707
1708 static int mov_write_udta_sdp(AVIOContext *pb, MOVTrack *track)
1709 {
1710     AVFormatContext *ctx = track->rtp_ctx;
1711     char buf[1000] = "";
1712     int len;
1713
1714     ff_sdp_write_media(buf, sizeof(buf), ctx->streams[0], track->src_track,
1715                        NULL, NULL, 0, 0, ctx);
1716     av_strlcatf(buf, sizeof(buf), "a=control:streamid=%d\r\n", track->track_id);
1717     len = strlen(buf);
1718
1719     avio_wb32(pb, len + 24);
1720     ffio_wfourcc(pb, "udta");
1721     avio_wb32(pb, len + 16);
1722     ffio_wfourcc(pb, "hnti");
1723     avio_wb32(pb, len + 8);
1724     ffio_wfourcc(pb, "sdp ");
1725     avio_write(pb, buf, len);
1726     return len + 24;
1727 }
1728
1729 static int mov_write_track_metadata(AVIOContext *pb, AVStream *st,
1730                                     const char *tag, const char *str)
1731 {
1732     int64_t pos = avio_tell(pb);
1733     AVDictionaryEntry *t = av_dict_get(st->metadata, str, NULL, 0);
1734     if (!t || !utf8len(t->value))
1735         return 0;
1736
1737     avio_wb32(pb, 0);   /* size */
1738     ffio_wfourcc(pb, tag); /* type */
1739     avio_write(pb, t->value, strlen(t->value)); /* UTF8 string value */
1740     return update_size(pb, pos);
1741 }
1742
1743 static int mov_write_track_udta_tag(AVIOContext *pb, MOVMuxContext *mov,
1744                                     AVStream *st)
1745 {
1746     AVIOContext *pb_buf;
1747     int ret, size;
1748     uint8_t *buf;
1749
1750     if (!st || mov->fc->flags & AVFMT_FLAG_BITEXACT)
1751         return 0;
1752
1753     ret = avio_open_dyn_buf(&pb_buf);
1754     if (ret < 0)
1755         return ret;
1756
1757     if (mov->mode & MODE_MP4)
1758         mov_write_track_metadata(pb_buf, st, "name", "title");
1759
1760     if ((size = avio_close_dyn_buf(pb_buf, &buf)) > 0) {
1761         avio_wb32(pb, size + 8);
1762         ffio_wfourcc(pb, "udta");
1763         avio_write(pb, buf, size);
1764     }
1765     av_free(buf);
1766
1767     return 0;
1768 }
1769
1770 static int mov_write_trak_tag(AVIOContext *pb, MOVMuxContext *mov,
1771                               MOVTrack *track, AVStream *st)
1772 {
1773     int64_t pos = avio_tell(pb);
1774     avio_wb32(pb, 0); /* size */
1775     ffio_wfourcc(pb, "trak");
1776     mov_write_tkhd_tag(pb, mov, track, st);
1777     if (track->entry &&
1778         (track->mode == MODE_PSP || track->flags & MOV_TRACK_CTTS ||
1779         track->cluster[0].dts || is_clcp_track(track))) {
1780         if (mov->use_editlist)
1781             mov_write_edts_tag(pb, mov, track);  // PSP Movies require edts box
1782         else if ((track->entry && track->cluster[0].dts) || track->mode == MODE_PSP || is_clcp_track(track))
1783             av_log(mov->fc, AV_LOG_WARNING,
1784                    "Not writing any edit list even though one would have been required\n");
1785     }
1786     if (track->tref_tag)
1787         mov_write_tref_tag(pb, track);
1788     mov_write_mdia_tag(pb, mov, track);
1789     if (track->mode == MODE_PSP)
1790         mov_write_uuid_tag_psp(pb, track); // PSP Movies require this uuid box
1791     if (track->tag == MKTAG('r','t','p',' '))
1792         mov_write_udta_sdp(pb, track);
1793     if (track->mode == MODE_MOV) {
1794         if (track->enc->codec_type == AVMEDIA_TYPE_VIDEO) {
1795             double sample_aspect_ratio = av_q2d(st->sample_aspect_ratio);
1796             if ((0.0 != sample_aspect_ratio && 1.0 != sample_aspect_ratio)) {
1797                 mov_write_tapt_tag(pb, track);
1798             }
1799         }
1800         if (is_clcp_track(track)) {
1801             mov_write_tapt_tag(pb, track);
1802         }
1803     }
1804     mov_write_track_udta_tag(pb, mov, st);
1805     return update_size(pb, pos);
1806 }
1807
1808 static int mov_write_iods_tag(AVIOContext *pb, MOVMuxContext *mov)
1809 {
1810     int i, has_audio = 0, has_video = 0;
1811     int64_t pos = avio_tell(pb);
1812     int audio_profile = mov->iods_audio_profile;
1813     int video_profile = mov->iods_video_profile;
1814     for (i = 0; i < mov->nb_streams; i++) {
1815         if (mov->tracks[i].entry > 0 || mov->flags & FF_MOV_FLAG_EMPTY_MOOV) {
1816             has_audio |= mov->tracks[i].enc->codec_type == AVMEDIA_TYPE_AUDIO;
1817             has_video |= mov->tracks[i].enc->codec_type == AVMEDIA_TYPE_VIDEO;
1818         }
1819     }
1820     if (audio_profile < 0)
1821         audio_profile = 0xFF - has_audio;
1822     if (video_profile < 0)
1823         video_profile = 0xFF - has_video;
1824     avio_wb32(pb, 0x0); /* size */
1825     ffio_wfourcc(pb, "iods");
1826     avio_wb32(pb, 0);    /* version & flags */
1827     put_descr(pb, 0x10, 7);
1828     avio_wb16(pb, 0x004f);
1829     avio_w8(pb, 0xff);
1830     avio_w8(pb, 0xff);
1831     avio_w8(pb, audio_profile);
1832     avio_w8(pb, video_profile);
1833     avio_w8(pb, 0xff);
1834     return update_size(pb, pos);
1835 }
1836
1837 static int mov_write_trex_tag(AVIOContext *pb, MOVTrack *track)
1838 {
1839     avio_wb32(pb, 0x20); /* size */
1840     ffio_wfourcc(pb, "trex");
1841     avio_wb32(pb, 0);   /* version & flags */
1842     avio_wb32(pb, track->track_id); /* track ID */
1843     avio_wb32(pb, 1);   /* default sample description index */
1844     avio_wb32(pb, 0);   /* default sample duration */
1845     avio_wb32(pb, 0);   /* default sample size */
1846     avio_wb32(pb, 0);   /* default sample flags */
1847     return 0;
1848 }
1849
1850 static int mov_write_mvex_tag(AVIOContext *pb, MOVMuxContext *mov)
1851 {
1852     int64_t pos = avio_tell(pb);
1853     int i;
1854     avio_wb32(pb, 0x0); /* size */
1855     ffio_wfourcc(pb, "mvex");
1856     for (i = 0; i < mov->nb_streams; i++)
1857         mov_write_trex_tag(pb, &mov->tracks[i]);
1858     return update_size(pb, pos);
1859 }
1860
1861 static int mov_write_mvhd_tag(AVIOContext *pb, MOVMuxContext *mov)
1862 {
1863     int max_track_id = 1, i;
1864     int64_t max_track_len_temp, max_track_len = 0;
1865     int version;
1866
1867     for (i = 0; i < mov->nb_streams; i++) {
1868         if (mov->tracks[i].entry > 0 && mov->tracks[i].timescale) {
1869             max_track_len_temp = av_rescale_rnd(mov->tracks[i].track_duration,
1870                                                 MOV_TIMESCALE,
1871                                                 mov->tracks[i].timescale,
1872                                                 AV_ROUND_UP);
1873             if (max_track_len < max_track_len_temp)
1874                 max_track_len = max_track_len_temp;
1875             if (max_track_id < mov->tracks[i].track_id)
1876                 max_track_id = mov->tracks[i].track_id;
1877         }
1878     }
1879
1880     version = max_track_len < UINT32_MAX ? 0 : 1;
1881     (version == 1) ? avio_wb32(pb, 120) : avio_wb32(pb, 108); /* size */
1882     ffio_wfourcc(pb, "mvhd");
1883     avio_w8(pb, version);
1884     avio_wb24(pb, 0); /* flags */
1885     if (version == 1) {
1886         avio_wb64(pb, mov->time);
1887         avio_wb64(pb, mov->time);
1888     } else {
1889         avio_wb32(pb, mov->time); /* creation time */
1890         avio_wb32(pb, mov->time); /* modification time */
1891     }
1892     avio_wb32(pb, MOV_TIMESCALE);
1893     (version == 1) ? avio_wb64(pb, max_track_len) : avio_wb32(pb, max_track_len); /* duration of longest track */
1894
1895     avio_wb32(pb, 0x00010000); /* reserved (preferred rate) 1.0 = normal */
1896     avio_wb16(pb, 0x0100); /* reserved (preferred volume) 1.0 = normal */
1897     avio_wb16(pb, 0); /* reserved */
1898     avio_wb32(pb, 0); /* reserved */
1899     avio_wb32(pb, 0); /* reserved */
1900
1901     /* Matrix structure */
1902     avio_wb32(pb, 0x00010000); /* reserved */
1903     avio_wb32(pb, 0x0); /* reserved */
1904     avio_wb32(pb, 0x0); /* reserved */
1905     avio_wb32(pb, 0x0); /* reserved */
1906     avio_wb32(pb, 0x00010000); /* reserved */
1907     avio_wb32(pb, 0x0); /* reserved */
1908     avio_wb32(pb, 0x0); /* reserved */
1909     avio_wb32(pb, 0x0); /* reserved */
1910     avio_wb32(pb, 0x40000000); /* reserved */
1911
1912     avio_wb32(pb, 0); /* reserved (preview time) */
1913     avio_wb32(pb, 0); /* reserved (preview duration) */
1914     avio_wb32(pb, 0); /* reserved (poster time) */
1915     avio_wb32(pb, 0); /* reserved (selection time) */
1916     avio_wb32(pb, 0); /* reserved (selection duration) */
1917     avio_wb32(pb, 0); /* reserved (current time) */
1918     avio_wb32(pb, max_track_id + 1); /* Next track id */
1919     return 0x6c;
1920 }
1921
1922 static int mov_write_itunes_hdlr_tag(AVIOContext *pb, MOVMuxContext *mov,
1923                                      AVFormatContext *s)
1924 {
1925     avio_wb32(pb, 33); /* size */
1926     ffio_wfourcc(pb, "hdlr");
1927     avio_wb32(pb, 0);
1928     avio_wb32(pb, 0);
1929     ffio_wfourcc(pb, "mdir");
1930     ffio_wfourcc(pb, "appl");
1931     avio_wb32(pb, 0);
1932     avio_wb32(pb, 0);
1933     avio_w8(pb, 0);
1934     return 33;
1935 }
1936
1937 /* helper function to write a data tag with the specified string as data */
1938 static int mov_write_string_data_tag(AVIOContext *pb, const char *data, int lang, int long_style)
1939 {
1940     if (long_style) {
1941         int size = 16 + strlen(data);
1942         avio_wb32(pb, size); /* size */
1943         ffio_wfourcc(pb, "data");
1944         avio_wb32(pb, 1);
1945         avio_wb32(pb, 0);
1946         avio_write(pb, data, strlen(data));
1947         return size;
1948     } else {
1949         if (!lang)
1950             lang = ff_mov_iso639_to_lang("und", 1);
1951         avio_wb16(pb, strlen(data)); /* string length */
1952         avio_wb16(pb, lang);
1953         avio_write(pb, data, strlen(data));
1954         return strlen(data) + 4;
1955     }
1956 }
1957
1958 static int mov_write_string_tag(AVIOContext *pb, const char *name,
1959                                 const char *value, int lang, int long_style)
1960 {
1961     int size = 0;
1962     if (value && value[0]) {
1963         int64_t pos = avio_tell(pb);
1964         avio_wb32(pb, 0); /* size */
1965         ffio_wfourcc(pb, name);
1966         mov_write_string_data_tag(pb, value, lang, long_style);
1967         size = update_size(pb, pos);
1968     }
1969     return size;
1970 }
1971
1972 static int mov_write_string_metadata(AVFormatContext *s, AVIOContext *pb,
1973                                      const char *name, const char *tag,
1974                                      int long_style)
1975 {
1976     int l, lang = 0, len, len2;
1977     AVDictionaryEntry *t, *t2 = NULL;
1978     char tag2[16];
1979
1980     if (!(t = av_dict_get(s->metadata, tag, NULL, 0)))
1981         return 0;
1982
1983     len = strlen(t->key);
1984     snprintf(tag2, sizeof(tag2), "%s-", tag);
1985     while ((t2 = av_dict_get(s->metadata, tag2, t2, AV_DICT_IGNORE_SUFFIX))) {
1986         len2 = strlen(t2->key);
1987         if (len2 == len + 4 && !strcmp(t->value, t2->value)
1988             && (l = ff_mov_iso639_to_lang(&t2->key[len2 - 3], 1)) >= 0) {
1989             lang = l;
1990             break;
1991         }
1992     }
1993     return mov_write_string_tag(pb, name, t->value, lang, long_style);
1994 }
1995
1996 /* iTunes track number */
1997 static int mov_write_trkn_tag(AVIOContext *pb, MOVMuxContext *mov,
1998                               AVFormatContext *s)
1999 {
2000     AVDictionaryEntry *t = av_dict_get(s->metadata, "track", NULL, 0);
2001     int size = 0, track = t ? atoi(t->value) : 0;
2002     if (track) {
2003         avio_wb32(pb, 32); /* size */
2004         ffio_wfourcc(pb, "trkn");
2005         avio_wb32(pb, 24); /* size */
2006         ffio_wfourcc(pb, "data");
2007         avio_wb32(pb, 0);        // 8 bytes empty
2008         avio_wb32(pb, 0);
2009         avio_wb16(pb, 0);        // empty
2010         avio_wb16(pb, track);    // track number
2011         avio_wb16(pb, 0);        // total track number
2012         avio_wb16(pb, 0);        // empty
2013         size = 32;
2014     }
2015     return size;
2016 }
2017
2018 /* iTunes meta data list */
2019 static int mov_write_ilst_tag(AVIOContext *pb, MOVMuxContext *mov,
2020                               AVFormatContext *s)
2021 {
2022     int64_t pos = avio_tell(pb);
2023     avio_wb32(pb, 0); /* size */
2024     ffio_wfourcc(pb, "ilst");
2025     mov_write_string_metadata(s, pb, "\251nam", "title"    , 1);
2026     mov_write_string_metadata(s, pb, "\251ART", "artist"   , 1);
2027     mov_write_string_metadata(s, pb, "aART", "album_artist", 1);
2028     mov_write_string_metadata(s, pb, "\251wrt", "composer" , 1);
2029     mov_write_string_metadata(s, pb, "\251alb", "album"    , 1);
2030     mov_write_string_metadata(s, pb, "\251day", "date"     , 1);
2031     if (!mov_write_string_metadata(s, pb, "\251too", "encoding_tool", 1))
2032         mov_write_string_tag(pb, "\251too", LIBAVFORMAT_IDENT, 0, 1);
2033     mov_write_string_metadata(s, pb, "\251cmt", "comment"  , 1);
2034     mov_write_string_metadata(s, pb, "\251gen", "genre"    , 1);
2035     mov_write_string_metadata(s, pb, "\251cpy", "copyright", 1);
2036     mov_write_string_metadata(s, pb, "\251grp", "grouping" , 1);
2037     mov_write_string_metadata(s, pb, "\251lyr", "lyrics"   , 1);
2038     mov_write_string_metadata(s, pb, "desc",    "description",1);
2039     mov_write_string_metadata(s, pb, "ldes",    "synopsis" , 1);
2040     mov_write_string_metadata(s, pb, "tvsh",    "show"     , 1);
2041     mov_write_string_metadata(s, pb, "tven",    "episode_id",1);
2042     mov_write_string_metadata(s, pb, "tvnn",    "network"  , 1);
2043     mov_write_trkn_tag(pb, mov, s);
2044     return update_size(pb, pos);
2045 }
2046
2047 /* iTunes meta data tag */
2048 static int mov_write_meta_tag(AVIOContext *pb, MOVMuxContext *mov,
2049                               AVFormatContext *s)
2050 {
2051     int size = 0;
2052     int64_t pos = avio_tell(pb);
2053     avio_wb32(pb, 0); /* size */
2054     ffio_wfourcc(pb, "meta");
2055     avio_wb32(pb, 0);
2056     mov_write_itunes_hdlr_tag(pb, mov, s);
2057     mov_write_ilst_tag(pb, mov, s);
2058     size = update_size(pb, pos);
2059     return size;
2060 }
2061
2062 static int ascii_to_wc(AVIOContext *pb, const uint8_t *b)
2063 {
2064     int val;
2065     while (*b) {
2066         GET_UTF8(val, *b++, return -1;)
2067         avio_wb16(pb, val);
2068     }
2069     avio_wb16(pb, 0x00);
2070     return 0;
2071 }
2072
2073 static uint16_t language_code(const char *str)
2074 {
2075     return (((str[0] - 0x60) & 0x1F) << 10) +
2076            (((str[1] - 0x60) & 0x1F) <<  5) +
2077            (( str[2] - 0x60) & 0x1F);
2078 }
2079
2080 static int mov_write_3gp_udta_tag(AVIOContext *pb, AVFormatContext *s,
2081                                   const char *tag, const char *str)
2082 {
2083     int64_t pos = avio_tell(pb);
2084     AVDictionaryEntry *t = av_dict_get(s->metadata, str, NULL, 0);
2085     if (!t || !utf8len(t->value))
2086         return 0;
2087     avio_wb32(pb, 0);   /* size */
2088     ffio_wfourcc(pb, tag); /* type */
2089     avio_wb32(pb, 0);   /* version + flags */
2090     if (!strcmp(tag, "yrrc"))
2091         avio_wb16(pb, atoi(t->value));
2092     else {
2093         avio_wb16(pb, language_code("eng")); /* language */
2094         avio_write(pb, t->value, strlen(t->value) + 1); /* UTF8 string value */
2095         if (!strcmp(tag, "albm") &&
2096             (t = av_dict_get(s->metadata, "track", NULL, 0)))
2097             avio_w8(pb, atoi(t->value));
2098     }
2099     return update_size(pb, pos);
2100 }
2101
2102 static int mov_write_chpl_tag(AVIOContext *pb, AVFormatContext *s)
2103 {
2104     int64_t pos = avio_tell(pb);
2105     int i, nb_chapters = FFMIN(s->nb_chapters, 255);
2106
2107     avio_wb32(pb, 0);            // size
2108     ffio_wfourcc(pb, "chpl");
2109     avio_wb32(pb, 0x01000000);   // version + flags
2110     avio_wb32(pb, 0);            // unknown
2111     avio_w8(pb, nb_chapters);
2112
2113     for (i = 0; i < nb_chapters; i++) {
2114         AVChapter *c = s->chapters[i];
2115         AVDictionaryEntry *t;
2116         avio_wb64(pb, av_rescale_q(c->start, c->time_base, (AVRational){1,10000000}));
2117
2118         if ((t = av_dict_get(c->metadata, "title", NULL, 0))) {
2119             int len = FFMIN(strlen(t->value), 255);
2120             avio_w8(pb, len);
2121             avio_write(pb, t->value, len);
2122         } else
2123             avio_w8(pb, 0);
2124     }
2125     return update_size(pb, pos);
2126 }
2127
2128 static int mov_write_udta_tag(AVIOContext *pb, MOVMuxContext *mov,
2129                               AVFormatContext *s)
2130 {
2131     AVIOContext *pb_buf;
2132     int ret, size;
2133     uint8_t *buf;
2134
2135     if (s->flags & AVFMT_FLAG_BITEXACT)
2136         return 0;
2137
2138     ret = avio_open_dyn_buf(&pb_buf);
2139     if (ret < 0)
2140         return ret;
2141
2142     if (mov->mode & MODE_3GP) {
2143         mov_write_3gp_udta_tag(pb_buf, s, "perf", "artist");
2144         mov_write_3gp_udta_tag(pb_buf, s, "titl", "title");
2145         mov_write_3gp_udta_tag(pb_buf, s, "auth", "author");
2146         mov_write_3gp_udta_tag(pb_buf, s, "gnre", "genre");
2147         mov_write_3gp_udta_tag(pb_buf, s, "dscp", "comment");
2148         mov_write_3gp_udta_tag(pb_buf, s, "albm", "album");
2149         mov_write_3gp_udta_tag(pb_buf, s, "cprt", "copyright");
2150         mov_write_3gp_udta_tag(pb_buf, s, "yrrc", "date");
2151     } else if (mov->mode == MODE_MOV) { // the title field breaks gtkpod with mp4 and my suspicion is that stuff is not valid in mp4
2152         mov_write_string_metadata(s, pb_buf, "\251ART", "artist",      0);
2153         mov_write_string_metadata(s, pb_buf, "\251nam", "title",       0);
2154         mov_write_string_metadata(s, pb_buf, "\251aut", "author",      0);
2155         mov_write_string_metadata(s, pb_buf, "\251alb", "album",       0);
2156         mov_write_string_metadata(s, pb_buf, "\251day", "date",        0);
2157         mov_write_string_metadata(s, pb_buf, "\251swr", "encoder",     0);
2158         mov_write_string_metadata(s, pb_buf, "\251des", "comment",     0);
2159         mov_write_string_metadata(s, pb_buf, "\251gen", "genre",       0);
2160         mov_write_string_metadata(s, pb_buf, "\251cpy", "copyright",   0);
2161     } else {
2162         /* iTunes meta data */
2163         mov_write_meta_tag(pb_buf, mov, s);
2164     }
2165
2166     if (s->nb_chapters && !(mov->flags & FF_MOV_FLAG_DISABLE_CHPL))
2167         mov_write_chpl_tag(pb_buf, s);
2168
2169     if ((size = avio_close_dyn_buf(pb_buf, &buf)) > 0) {
2170         avio_wb32(pb, size + 8);
2171         ffio_wfourcc(pb, "udta");
2172         avio_write(pb, buf, size);
2173     }
2174     av_free(buf);
2175
2176     return 0;
2177 }
2178
2179 static void mov_write_psp_udta_tag(AVIOContext *pb,
2180                                    const char *str, const char *lang, int type)
2181 {
2182     int len = utf8len(str) + 1;
2183     if (len <= 0)
2184         return;
2185     avio_wb16(pb, len * 2 + 10);        /* size */
2186     avio_wb32(pb, type);                /* type */
2187     avio_wb16(pb, language_code(lang)); /* language */
2188     avio_wb16(pb, 0x01);                /* ? */
2189     ascii_to_wc(pb, str);
2190 }
2191
2192 static int mov_write_uuidusmt_tag(AVIOContext *pb, AVFormatContext *s)
2193 {
2194     AVDictionaryEntry *title = av_dict_get(s->metadata, "title", NULL, 0);
2195     int64_t pos, pos2;
2196
2197     if (title) {
2198         pos = avio_tell(pb);
2199         avio_wb32(pb, 0); /* size placeholder*/
2200         ffio_wfourcc(pb, "uuid");
2201         ffio_wfourcc(pb, "USMT");
2202         avio_wb32(pb, 0x21d24fce); /* 96 bit UUID */
2203         avio_wb32(pb, 0xbb88695c);
2204         avio_wb32(pb, 0xfac9c740);
2205
2206         pos2 = avio_tell(pb);
2207         avio_wb32(pb, 0); /* size placeholder*/
2208         ffio_wfourcc(pb, "MTDT");
2209         avio_wb16(pb, 4);
2210
2211         // ?
2212         avio_wb16(pb, 0x0C);                 /* size */
2213         avio_wb32(pb, 0x0B);                 /* type */
2214         avio_wb16(pb, language_code("und")); /* language */
2215         avio_wb16(pb, 0x0);                  /* ? */
2216         avio_wb16(pb, 0x021C);               /* data */
2217
2218         mov_write_psp_udta_tag(pb, LIBAVCODEC_IDENT,      "eng", 0x04);
2219         mov_write_psp_udta_tag(pb, title->value,          "eng", 0x01);
2220         mov_write_psp_udta_tag(pb, "2006/04/01 11:11:11", "und", 0x03);
2221
2222         update_size(pb, pos2);
2223         return update_size(pb, pos);
2224     }
2225
2226     return 0;
2227 }
2228
2229 static int mov_write_moov_tag(AVIOContext *pb, MOVMuxContext *mov,
2230                               AVFormatContext *s)
2231 {
2232     int i;
2233     int64_t pos = avio_tell(pb);
2234     avio_wb32(pb, 0); /* size placeholder*/
2235     ffio_wfourcc(pb, "moov");
2236
2237     for (i = 0; i < mov->nb_streams; i++) {
2238         if (mov->tracks[i].entry <= 0 && !(mov->flags & FF_MOV_FLAG_FRAGMENT))
2239             continue;
2240
2241         mov->tracks[i].time     = mov->time;
2242         mov->tracks[i].track_id = i + 1;
2243     }
2244
2245     if (mov->chapter_track)
2246         for (i = 0; i < s->nb_streams; i++) {
2247             mov->tracks[i].tref_tag = MKTAG('c','h','a','p');
2248             mov->tracks[i].tref_id  = mov->tracks[mov->chapter_track].track_id;
2249         }
2250     for (i = 0; i < mov->nb_streams; i++) {
2251         if (mov->tracks[i].tag == MKTAG('r','t','p',' ')) {
2252             mov->tracks[i].tref_tag = MKTAG('h','i','n','t');
2253             mov->tracks[i].tref_id =
2254                 mov->tracks[mov->tracks[i].src_track].track_id;
2255         }
2256     }
2257
2258     mov_write_mvhd_tag(pb, mov);
2259     if (mov->mode != MODE_MOV && !mov->iods_skip)
2260         mov_write_iods_tag(pb, mov);
2261     for (i = 0; i < mov->nb_streams; i++) {
2262         if (mov->tracks[i].entry > 0 || mov->flags & FF_MOV_FLAG_FRAGMENT) {
2263             mov_write_trak_tag(pb, mov, &(mov->tracks[i]), i < s->nb_streams ? s->streams[i] : NULL);
2264         }
2265     }
2266     if (mov->flags & FF_MOV_FLAG_FRAGMENT)
2267         mov_write_mvex_tag(pb, mov); /* QuickTime requires trak to precede this */
2268
2269     if (mov->mode == MODE_PSP)
2270         mov_write_uuidusmt_tag(pb, s);
2271     else
2272         mov_write_udta_tag(pb, mov, s);
2273
2274     return update_size(pb, pos);
2275 }
2276
2277 static void param_write_int(AVIOContext *pb, const char *name, int value)
2278 {
2279     avio_printf(pb, "<param name=\"%s\" value=\"%d\" valuetype=\"data\"/>\n", name, value);
2280 }
2281
2282 static void param_write_string(AVIOContext *pb, const char *name, const char *value)
2283 {
2284     avio_printf(pb, "<param name=\"%s\" value=\"%s\" valuetype=\"data\"/>\n", name, value);
2285 }
2286
2287 static void param_write_hex(AVIOContext *pb, const char *name, const uint8_t *value, int len)
2288 {
2289     char buf[150];
2290     len = FFMIN(sizeof(buf) / 2 - 1, len);
2291     ff_data_to_hex(buf, value, len, 0);
2292     buf[2 * len] = '\0';
2293     avio_printf(pb, "<param name=\"%s\" value=\"%s\" valuetype=\"data\"/>\n", name, buf);
2294 }
2295
2296 static int mov_write_isml_manifest(AVIOContext *pb, MOVMuxContext *mov)
2297 {
2298     int64_t pos = avio_tell(pb);
2299     int i;
2300     const uint8_t uuid[] = {
2301         0xa5, 0xd4, 0x0b, 0x30, 0xe8, 0x14, 0x11, 0xdd,
2302         0xba, 0x2f, 0x08, 0x00, 0x20, 0x0c, 0x9a, 0x66
2303     };
2304
2305     avio_wb32(pb, 0);
2306     ffio_wfourcc(pb, "uuid");
2307     avio_write(pb, uuid, sizeof(uuid));
2308     avio_wb32(pb, 0);
2309
2310     avio_printf(pb, "<?xml version=\"1.0\" encoding=\"utf-8\"?>\n");
2311     avio_printf(pb, "<smil xmlns=\"http://www.w3.org/2001/SMIL20/Language\">\n");
2312     avio_printf(pb, "<head>\n");
2313     avio_printf(pb, "<meta name=\"creator\" content=\"%s\" />\n",
2314                     LIBAVFORMAT_IDENT);
2315     avio_printf(pb, "</head>\n");
2316     avio_printf(pb, "<body>\n");
2317     avio_printf(pb, "<switch>\n");
2318     for (i = 0; i < mov->nb_streams; i++) {
2319         MOVTrack *track = &mov->tracks[i];
2320         const char *type;
2321         /* track->track_id is initialized in write_moov, and thus isn't known
2322          * here yet */
2323         int track_id = i + 1;
2324
2325         if (track->enc->codec_type == AVMEDIA_TYPE_VIDEO) {
2326             type = "video";
2327         } else if (track->enc->codec_type == AVMEDIA_TYPE_AUDIO) {
2328             type = "audio";
2329         } else {
2330             continue;
2331         }
2332         avio_printf(pb, "<%s systemBitrate=\"%d\">\n", type,
2333                                                        track->enc->bit_rate);
2334         param_write_int(pb, "systemBitrate", track->enc->bit_rate);
2335         param_write_int(pb, "trackID", track_id);
2336         if (track->enc->codec_type == AVMEDIA_TYPE_VIDEO) {
2337             if (track->enc->codec_id == AV_CODEC_ID_H264) {
2338                 uint8_t *ptr;
2339                 int size = track->enc->extradata_size;
2340                 if (!ff_avc_write_annexb_extradata(track->enc->extradata, &ptr,
2341                                                    &size)) {
2342                     param_write_hex(pb, "CodecPrivateData",
2343                                     ptr ? ptr : track->enc->extradata,
2344                                     size);
2345                     av_free(ptr);
2346                 }
2347                 param_write_string(pb, "FourCC", "H264");
2348             } else if (track->enc->codec_id == AV_CODEC_ID_VC1) {
2349                 param_write_string(pb, "FourCC", "WVC1");
2350                 param_write_hex(pb, "CodecPrivateData", track->enc->extradata,
2351                                 track->enc->extradata_size);
2352             }
2353             param_write_int(pb, "MaxWidth", track->enc->width);
2354             param_write_int(pb, "MaxHeight", track->enc->height);
2355             param_write_int(pb, "DisplayWidth", track->enc->width);
2356             param_write_int(pb, "DisplayHeight", track->enc->height);
2357         } else {
2358             if (track->enc->codec_id == AV_CODEC_ID_AAC) {
2359                 param_write_string(pb, "FourCC", "AACL");
2360             } else if (track->enc->codec_id == AV_CODEC_ID_WMAPRO) {
2361                 param_write_string(pb, "FourCC", "WMAP");
2362             }
2363             param_write_hex(pb, "CodecPrivateData", track->enc->extradata,
2364                             track->enc->extradata_size);
2365             param_write_int(pb, "AudioTag", ff_codec_get_tag(ff_codec_wav_tags,
2366                                                              track->enc->codec_id));
2367             param_write_int(pb, "Channels", track->enc->channels);
2368             param_write_int(pb, "SamplingRate", track->enc->sample_rate);
2369             param_write_int(pb, "BitsPerSample", 16);
2370             param_write_int(pb, "PacketSize", track->enc->block_align ?
2371                                               track->enc->block_align : 4);
2372         }
2373         avio_printf(pb, "</%s>\n", type);
2374     }
2375     avio_printf(pb, "</switch>\n");
2376     avio_printf(pb, "</body>\n");
2377     avio_printf(pb, "</smil>\n");
2378
2379     return update_size(pb, pos);
2380 }
2381
2382 static int mov_write_mfhd_tag(AVIOContext *pb, MOVMuxContext *mov)
2383 {
2384     avio_wb32(pb, 16);
2385     ffio_wfourcc(pb, "mfhd");
2386     avio_wb32(pb, 0);
2387     avio_wb32(pb, mov->fragments);
2388     return 0;
2389 }
2390
2391 static int mov_write_tfhd_tag(AVIOContext *pb, MOVMuxContext *mov,
2392                               MOVTrack *track, int64_t moof_offset)
2393 {
2394     int64_t pos = avio_tell(pb);
2395     uint32_t flags = MOV_TFHD_DEFAULT_SIZE | MOV_TFHD_DEFAULT_DURATION |
2396                      MOV_TFHD_BASE_DATA_OFFSET;
2397     if (!track->entry) {
2398         flags |= MOV_TFHD_DURATION_IS_EMPTY;
2399     } else {
2400         flags |= MOV_TFHD_DEFAULT_FLAGS;
2401     }
2402     if (mov->flags & FF_MOV_FLAG_OMIT_TFHD_OFFSET)
2403         flags &= ~MOV_TFHD_BASE_DATA_OFFSET;
2404     if (mov->flags & FF_MOV_FLAG_DEFAULT_BASE_MOOF) {
2405         flags &= ~MOV_TFHD_BASE_DATA_OFFSET;
2406         flags |= MOV_TFHD_DEFAULT_BASE_IS_MOOF;
2407     }
2408
2409     /* Don't set a default sample size, the silverlight player refuses
2410      * to play files with that set. Don't set a default sample duration,
2411      * WMP freaks out if it is set. Don't set a base data offset, PIFF
2412      * file format says it MUST NOT be set. */
2413     if (track->mode == MODE_ISM)
2414         flags &= ~(MOV_TFHD_DEFAULT_SIZE | MOV_TFHD_DEFAULT_DURATION |
2415                    MOV_TFHD_BASE_DATA_OFFSET);
2416
2417     avio_wb32(pb, 0); /* size placeholder */
2418     ffio_wfourcc(pb, "tfhd");
2419     avio_w8(pb, 0); /* version */
2420     avio_wb24(pb, flags);
2421
2422     avio_wb32(pb, track->track_id); /* track-id */
2423     if (flags & MOV_TFHD_BASE_DATA_OFFSET)
2424         avio_wb64(pb, moof_offset);
2425     if (flags & MOV_TFHD_DEFAULT_DURATION) {
2426         track->default_duration = get_cluster_duration(track, 0);
2427         avio_wb32(pb, track->default_duration);
2428     }
2429     if (flags & MOV_TFHD_DEFAULT_SIZE) {
2430         track->default_size = track->entry ? track->cluster[0].size : 1;
2431         avio_wb32(pb, track->default_size);
2432     } else
2433         track->default_size = -1;
2434
2435     if (flags & MOV_TFHD_DEFAULT_FLAGS) {
2436         track->default_sample_flags =
2437             track->enc->codec_type == AVMEDIA_TYPE_VIDEO ?
2438             (MOV_FRAG_SAMPLE_FLAG_DEPENDS_YES | MOV_FRAG_SAMPLE_FLAG_IS_NON_SYNC) :
2439             MOV_FRAG_SAMPLE_FLAG_DEPENDS_NO;
2440         avio_wb32(pb, track->default_sample_flags);
2441     }
2442
2443     return update_size(pb, pos);
2444 }
2445
2446 static uint32_t get_sample_flags(MOVTrack *track, MOVIentry *entry)
2447 {
2448     return entry->flags & MOV_SYNC_SAMPLE ? MOV_FRAG_SAMPLE_FLAG_DEPENDS_NO :
2449            (MOV_FRAG_SAMPLE_FLAG_DEPENDS_YES | MOV_FRAG_SAMPLE_FLAG_IS_NON_SYNC);
2450 }
2451
2452 static int mov_write_trun_tag(AVIOContext *pb, MOVMuxContext *mov,
2453                               MOVTrack *track, int moof_size)
2454 {
2455     int64_t pos = avio_tell(pb);
2456     uint32_t flags = MOV_TRUN_DATA_OFFSET;
2457     int i;
2458
2459     for (i = 0; i < track->entry; i++) {
2460         if (get_cluster_duration(track, i) != track->default_duration)
2461             flags |= MOV_TRUN_SAMPLE_DURATION;
2462         if (track->cluster[i].size != track->default_size)
2463             flags |= MOV_TRUN_SAMPLE_SIZE;
2464         if (i > 0 && get_sample_flags(track, &track->cluster[i]) != track->default_sample_flags)
2465             flags |= MOV_TRUN_SAMPLE_FLAGS;
2466     }
2467     if (!(flags & MOV_TRUN_SAMPLE_FLAGS))
2468         flags |= MOV_TRUN_FIRST_SAMPLE_FLAGS;
2469     if (track->flags & MOV_TRACK_CTTS)
2470         flags |= MOV_TRUN_SAMPLE_CTS;
2471
2472     avio_wb32(pb, 0); /* size placeholder */
2473     ffio_wfourcc(pb, "trun");
2474     avio_w8(pb, 0); /* version */
2475     avio_wb24(pb, flags);
2476
2477     avio_wb32(pb, track->entry); /* sample count */
2478     if (mov->flags & FF_MOV_FLAG_OMIT_TFHD_OFFSET &&
2479         !(mov->flags & FF_MOV_FLAG_DEFAULT_BASE_MOOF) &&
2480         !mov->first_trun)
2481         avio_wb32(pb, 0); /* Later tracks follow immediately after the previous one */
2482     else
2483         avio_wb32(pb, moof_size + 8 + track->data_offset +
2484                       track->cluster[0].pos); /* data offset */
2485     if (flags & MOV_TRUN_FIRST_SAMPLE_FLAGS)
2486         avio_wb32(pb, get_sample_flags(track, &track->cluster[0]));
2487
2488     for (i = 0; i < track->entry; i++) {
2489         if (flags & MOV_TRUN_SAMPLE_DURATION)
2490             avio_wb32(pb, get_cluster_duration(track, i));
2491         if (flags & MOV_TRUN_SAMPLE_SIZE)
2492             avio_wb32(pb, track->cluster[i].size);
2493         if (flags & MOV_TRUN_SAMPLE_FLAGS)
2494             avio_wb32(pb, get_sample_flags(track, &track->cluster[i]));
2495         if (flags & MOV_TRUN_SAMPLE_CTS)
2496             avio_wb32(pb, track->cluster[i].cts);
2497     }
2498
2499     mov->first_trun = 0;
2500     return update_size(pb, pos);
2501 }
2502
2503 static int mov_write_tfxd_tag(AVIOContext *pb, MOVTrack *track)
2504 {
2505     int64_t pos = avio_tell(pb);
2506     const uint8_t uuid[] = {
2507         0x6d, 0x1d, 0x9b, 0x05, 0x42, 0xd5, 0x44, 0xe6,
2508         0x80, 0xe2, 0x14, 0x1d, 0xaf, 0xf7, 0x57, 0xb2
2509     };
2510
2511     avio_wb32(pb, 0); /* size placeholder */
2512     ffio_wfourcc(pb, "uuid");
2513     avio_write(pb, uuid, sizeof(uuid));
2514     avio_w8(pb, 1);
2515     avio_wb24(pb, 0);
2516     avio_wb64(pb, track->frag_start);
2517     avio_wb64(pb, track->start_dts + track->track_duration -
2518                   track->cluster[0].dts);
2519
2520     return update_size(pb, pos);
2521 }
2522
2523 static int mov_write_tfrf_tag(AVIOContext *pb, MOVMuxContext *mov,
2524                               MOVTrack *track, int entry)
2525 {
2526     int n = track->nb_frag_info - 1 - entry, i;
2527     int size = 8 + 16 + 4 + 1 + 16*n;
2528     const uint8_t uuid[] = {
2529         0xd4, 0x80, 0x7e, 0xf2, 0xca, 0x39, 0x46, 0x95,
2530         0x8e, 0x54, 0x26, 0xcb, 0x9e, 0x46, 0xa7, 0x9f
2531     };
2532
2533     if (entry < 0)
2534         return 0;
2535
2536     avio_seek(pb, track->frag_info[entry].tfrf_offset, SEEK_SET);
2537     avio_wb32(pb, size);
2538     ffio_wfourcc(pb, "uuid");
2539     avio_write(pb, uuid, sizeof(uuid));
2540     avio_w8(pb, 1);
2541     avio_wb24(pb, 0);
2542     avio_w8(pb, n);
2543     for (i = 0; i < n; i++) {
2544         int index = entry + 1 + i;
2545         avio_wb64(pb, track->frag_info[index].time);
2546         avio_wb64(pb, track->frag_info[index].duration);
2547     }
2548     if (n < mov->ism_lookahead) {
2549         int free_size = 16 * (mov->ism_lookahead - n);
2550         avio_wb32(pb, free_size);
2551         ffio_wfourcc(pb, "free");
2552         for (i = 0; i < free_size - 8; i++)
2553             avio_w8(pb, 0);
2554     }
2555
2556     return 0;
2557 }
2558
2559 static int mov_write_tfrf_tags(AVIOContext *pb, MOVMuxContext *mov,
2560                                MOVTrack *track)
2561 {
2562     int64_t pos = avio_tell(pb);
2563     int i;
2564     for (i = 0; i < mov->ism_lookahead; i++) {
2565         /* Update the tfrf tag for the last ism_lookahead fragments,
2566          * nb_frag_info - 1 is the next fragment to be written. */
2567         mov_write_tfrf_tag(pb, mov, track, track->nb_frag_info - 2 - i);
2568     }
2569     avio_seek(pb, pos, SEEK_SET);
2570     return 0;
2571 }
2572
2573 static int mov_add_tfra_entries(AVIOContext *pb, MOVMuxContext *mov, int tracks,
2574                                 int size)
2575 {
2576     int i;
2577     for (i = 0; i < mov->nb_streams; i++) {
2578         MOVTrack *track = &mov->tracks[i];
2579         MOVFragmentInfo *info;
2580         if ((tracks >= 0 && i != tracks) || !track->entry)
2581             continue;
2582         track->nb_frag_info++;
2583         if (track->nb_frag_info >= track->frag_info_capacity) {
2584             unsigned new_capacity = track->nb_frag_info + MOV_FRAG_INFO_ALLOC_INCREMENT;
2585             if (av_reallocp_array(&track->frag_info,
2586                                   new_capacity,
2587                                   sizeof(*track->frag_info)))
2588                 return AVERROR(ENOMEM);
2589             track->frag_info_capacity = new_capacity;
2590         }
2591         info = &track->frag_info[track->nb_frag_info - 1];
2592         info->offset   = avio_tell(pb);
2593         info->size     = size;
2594         // Try to recreate the original pts for the first packet
2595         // from the fields we have stored
2596         info->time     = track->start_dts + track->frag_start +
2597                          track->cluster[0].cts;
2598         // If the pts is less than zero, we will have trimmed
2599         // away parts of the media track using an edit list,
2600         // and the corresponding start presentation time is zero.
2601         if (info->time < 0)
2602             info->time = 0;
2603         info->duration = track->start_dts + track->track_duration -
2604                          track->cluster[0].dts;
2605         info->tfrf_offset = 0;
2606         mov_write_tfrf_tags(pb, mov, track);
2607     }
2608     return 0;
2609 }
2610
2611 static int mov_write_tfdt_tag(AVIOContext *pb, MOVTrack *track)
2612 {
2613     int64_t pos = avio_tell(pb);
2614
2615     avio_wb32(pb, 0); /* size */
2616     ffio_wfourcc(pb, "tfdt");
2617     avio_w8(pb, 1); /* version */
2618     avio_wb24(pb, 0);
2619     avio_wb64(pb, track->frag_start);
2620     return update_size(pb, pos);
2621 }
2622
2623 static int mov_write_traf_tag(AVIOContext *pb, MOVMuxContext *mov,
2624                               MOVTrack *track, int64_t moof_offset,
2625                               int moof_size)
2626 {
2627     int64_t pos = avio_tell(pb);
2628     avio_wb32(pb, 0); /* size placeholder */
2629     ffio_wfourcc(pb, "traf");
2630
2631     mov_write_tfhd_tag(pb, mov, track, moof_offset);
2632     if (mov->mode != MODE_ISM)
2633         mov_write_tfdt_tag(pb, track);
2634     mov_write_trun_tag(pb, mov, track, moof_size);
2635     if (mov->mode == MODE_ISM) {
2636         mov_write_tfxd_tag(pb, track);
2637
2638         if (mov->ism_lookahead) {
2639             int i, size = 16 + 4 + 1 + 16 * mov->ism_lookahead;
2640
2641             if (track->nb_frag_info > 0) {
2642                 MOVFragmentInfo *info = &track->frag_info[track->nb_frag_info - 1];
2643                 if (!info->tfrf_offset)
2644                     info->tfrf_offset = avio_tell(pb);
2645             }
2646             avio_wb32(pb, 8 + size);
2647             ffio_wfourcc(pb, "free");
2648             for (i = 0; i < size; i++)
2649                 avio_w8(pb, 0);
2650         }
2651     }
2652
2653     return update_size(pb, pos);
2654 }
2655
2656 static int mov_write_moof_tag_internal(AVIOContext *pb, MOVMuxContext *mov,
2657                                        int tracks, int moof_size)
2658 {
2659     int64_t pos = avio_tell(pb);
2660     int i;
2661
2662     avio_wb32(pb, 0); /* size placeholder */
2663     ffio_wfourcc(pb, "moof");
2664     mov->first_trun = 1;
2665
2666     mov_write_mfhd_tag(pb, mov);
2667     for (i = 0; i < mov->nb_streams; i++) {
2668         MOVTrack *track = &mov->tracks[i];
2669         if (tracks >= 0 && i != tracks)
2670             continue;
2671         if (!track->entry)
2672             continue;
2673         mov_write_traf_tag(pb, mov, track, pos, moof_size);
2674     }
2675
2676     return update_size(pb, pos);
2677 }
2678
2679 static int mov_write_sidx_tag(AVIOContext *pb,
2680                               MOVTrack *track, int ref_size, int total_sidx_size)
2681 {
2682     int64_t pos = avio_tell(pb), offset_pos, end_pos;
2683     int64_t presentation_time, duration, offset;
2684     int starts_with_SAP, i, entries;
2685
2686     if (track->entry) {
2687         entries = 1;
2688         presentation_time = track->start_dts + track->frag_start +
2689                             track->cluster[0].cts;
2690         duration = track->start_dts + track->track_duration -
2691                    track->cluster[0].dts;
2692         starts_with_SAP = track->cluster[0].flags & MOV_SYNC_SAMPLE;
2693     } else {
2694         entries = track->nb_frag_info;
2695         presentation_time = track->frag_info[0].time;
2696     }
2697
2698     // pts<0 should be cut away using edts
2699     if (presentation_time < 0)
2700         presentation_time = 0;
2701
2702     avio_wb32(pb, 0); /* size */
2703     ffio_wfourcc(pb, "sidx");
2704     avio_w8(pb, 1); /* version */
2705     avio_wb24(pb, 0);
2706     avio_wb32(pb, track->track_id); /* reference_ID */
2707     avio_wb32(pb, track->timescale); /* timescale */
2708     avio_wb64(pb, presentation_time); /* earliest_presentation_time */
2709     offset_pos = avio_tell(pb);
2710     avio_wb64(pb, 0); /* first_offset (offset to referenced moof) */
2711     avio_wb16(pb, 0); /* reserved */
2712
2713     avio_wb16(pb, entries); /* reference_count */
2714     for (i = 0; i < entries; i++) {
2715         if (!track->entry) {
2716             if (i > 1 && track->frag_info[i].offset != track->frag_info[i - 1].offset + track->frag_info[i - 1].size) {
2717                av_log(NULL, AV_LOG_ERROR, "Non-consecutive fragments, writing incorrect sidx\n");
2718             }
2719             duration = track->frag_info[i].duration;
2720             ref_size = track->frag_info[i].size;
2721             starts_with_SAP = 1;
2722         }
2723         avio_wb32(pb, (0 << 31) | (ref_size & 0x7fffffff)); /* reference_type (0 = media) | referenced_size */
2724         avio_wb32(pb, duration); /* subsegment_duration */
2725         avio_wb32(pb, (starts_with_SAP << 31) | (0 << 28) | 0); /* starts_with_SAP | SAP_type | SAP_delta_time */
2726     }
2727
2728     end_pos = avio_tell(pb);
2729     offset = pos + total_sidx_size - end_pos;
2730     avio_seek(pb, offset_pos, SEEK_SET);
2731     avio_wb64(pb, offset);
2732     avio_seek(pb, end_pos, SEEK_SET);
2733     return update_size(pb, pos);
2734 }
2735
2736 static int mov_write_sidx_tags(AVIOContext *pb, MOVMuxContext *mov,
2737                                int tracks, int ref_size)
2738 {
2739     int i, round, ret;
2740     AVIOContext *avio_buf;
2741     int total_size = 0;
2742     for (round = 0; round < 2; round++) {
2743         // First run one round to calculate the total size of all
2744         // sidx atoms.
2745         // This would be much simpler if we'd only write one sidx
2746         // atom, for the first track in the moof.
2747         if (round == 0) {
2748             if ((ret = ffio_open_null_buf(&avio_buf)) < 0)
2749                 return ret;
2750         } else {
2751             avio_buf = pb;
2752         }
2753         for (i = 0; i < mov->nb_streams; i++) {
2754             MOVTrack *track = &mov->tracks[i];
2755             if (tracks >= 0 && i != tracks)
2756                 continue;
2757             // When writing a sidx for the full file, entry is 0, but
2758             // we want to include all tracks. ref_size is 0 in this case,
2759             // since we read it from frag_info instead.
2760             if (!track->entry && ref_size > 0)
2761                 continue;
2762             total_size -= mov_write_sidx_tag(avio_buf, track, ref_size,
2763                                              total_size);
2764         }
2765         if (round == 0)
2766             total_size = ffio_close_null_buf(avio_buf);
2767     }
2768     return 0;
2769 }
2770
2771 static int mov_write_moof_tag(AVIOContext *pb, MOVMuxContext *mov, int tracks,
2772                               int64_t mdat_size)
2773 {
2774     AVIOContext *avio_buf;
2775     int ret, moof_size;
2776
2777     if ((ret = ffio_open_null_buf(&avio_buf)) < 0)
2778         return ret;
2779     mov_write_moof_tag_internal(avio_buf, mov, tracks, 0);
2780     moof_size = ffio_close_null_buf(avio_buf);
2781
2782     if (mov->flags & FF_MOV_FLAG_DASH && !(mov->flags & FF_MOV_FLAG_FASTSTART))
2783         mov_write_sidx_tags(pb, mov, tracks, moof_size + 8 + mdat_size);
2784
2785     if ((ret = mov_add_tfra_entries(pb, mov, tracks, moof_size + 8 + mdat_size)) < 0)
2786         return ret;
2787
2788     return mov_write_moof_tag_internal(pb, mov, tracks, moof_size);
2789 }
2790
2791 static int mov_write_tfra_tag(AVIOContext *pb, MOVTrack *track)
2792 {
2793     int64_t pos = avio_tell(pb);
2794     int i;
2795
2796     avio_wb32(pb, 0); /* size placeholder */
2797     ffio_wfourcc(pb, "tfra");
2798     avio_w8(pb, 1); /* version */
2799     avio_wb24(pb, 0);
2800
2801     avio_wb32(pb, track->track_id);
2802     avio_wb32(pb, 0); /* length of traf/trun/sample num */
2803     avio_wb32(pb, track->nb_frag_info);
2804     for (i = 0; i < track->nb_frag_info; i++) {
2805         avio_wb64(pb, track->frag_info[i].time);
2806         avio_wb64(pb, track->frag_info[i].offset + track->data_offset);
2807         avio_w8(pb, 1); /* traf number */
2808         avio_w8(pb, 1); /* trun number */
2809         avio_w8(pb, 1); /* sample number */
2810     }
2811
2812     return update_size(pb, pos);
2813 }
2814
2815 static int mov_write_mfra_tag(AVIOContext *pb, MOVMuxContext *mov)
2816 {
2817     int64_t pos = avio_tell(pb);
2818     int i;
2819
2820     avio_wb32(pb, 0); /* size placeholder */
2821     ffio_wfourcc(pb, "mfra");
2822     /* An empty mfra atom is enough to indicate to the publishing point that
2823      * the stream has ended. */
2824     if (mov->flags & FF_MOV_FLAG_ISML)
2825         return update_size(pb, pos);
2826
2827     for (i = 0; i < mov->nb_streams; i++) {
2828         MOVTrack *track = &mov->tracks[i];
2829         if (track->nb_frag_info)
2830             mov_write_tfra_tag(pb, track);
2831     }
2832
2833     avio_wb32(pb, 16);
2834     ffio_wfourcc(pb, "mfro");
2835     avio_wb32(pb, 0); /* version + flags */
2836     avio_wb32(pb, avio_tell(pb) + 4 - pos);
2837
2838     return update_size(pb, pos);
2839 }
2840
2841 static int mov_write_mdat_tag(AVIOContext *pb, MOVMuxContext *mov)
2842 {
2843     avio_wb32(pb, 8);    // placeholder for extended size field (64 bit)
2844     ffio_wfourcc(pb, mov->mode == MODE_MOV ? "wide" : "free");
2845
2846     mov->mdat_pos = avio_tell(pb);
2847     avio_wb32(pb, 0); /* size placeholder*/
2848     ffio_wfourcc(pb, "mdat");
2849     return 0;
2850 }
2851
2852 /* TODO: This needs to be more general */
2853 static int mov_write_ftyp_tag(AVIOContext *pb, AVFormatContext *s)
2854 {
2855     MOVMuxContext *mov = s->priv_data;
2856     int64_t pos = avio_tell(pb);
2857     int has_h264 = 0, has_video = 0;
2858     int minor = 0x200;
2859     int i;
2860
2861     for (i = 0; i < s->nb_streams; i++) {
2862         AVStream *st = s->streams[i];
2863         if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO)
2864             has_video = 1;
2865         if (st->codec->codec_id == AV_CODEC_ID_H264)
2866             has_h264 = 1;
2867     }
2868
2869     avio_wb32(pb, 0); /* size */
2870     ffio_wfourcc(pb, "ftyp");
2871
2872     if (mov->major_brand && strlen(mov->major_brand) >= 4)
2873         ffio_wfourcc(pb, mov->major_brand);
2874     else if (mov->mode == MODE_3GP) {
2875         ffio_wfourcc(pb, has_h264 ? "3gp6"  : "3gp4");
2876         minor =     has_h264 ?   0x100 :   0x200;
2877     } else if (mov->mode & MODE_3G2) {
2878         ffio_wfourcc(pb, has_h264 ? "3g2b"  : "3g2a");
2879         minor =     has_h264 ? 0x20000 : 0x10000;
2880     } else if (mov->mode == MODE_PSP)
2881         ffio_wfourcc(pb, "MSNV");
2882     else if (mov->mode == MODE_MP4 && mov->flags & FF_MOV_FLAG_DEFAULT_BASE_MOOF)
2883         ffio_wfourcc(pb, "iso5"); // Required when using default-base-is-moof
2884     else if (mov->mode == MODE_MP4)
2885         ffio_wfourcc(pb, "isom");
2886     else if (mov->mode == MODE_IPOD)
2887         ffio_wfourcc(pb, has_video ? "M4V ":"M4A ");
2888     else if (mov->mode == MODE_ISM)
2889         ffio_wfourcc(pb, "isml");
2890     else if (mov->mode == MODE_F4V)
2891         ffio_wfourcc(pb, "f4v ");
2892     else
2893         ffio_wfourcc(pb, "qt  ");
2894
2895     avio_wb32(pb, minor);
2896
2897     if (mov->mode == MODE_MOV)
2898         ffio_wfourcc(pb, "qt  ");
2899     else if (mov->mode == MODE_ISM) {
2900         ffio_wfourcc(pb, "piff");
2901     } else if (!(mov->flags & FF_MOV_FLAG_DEFAULT_BASE_MOOF)) {
2902         ffio_wfourcc(pb, "isom");
2903         ffio_wfourcc(pb, "iso2");
2904         if (has_h264)
2905             ffio_wfourcc(pb, "avc1");
2906     }
2907
2908     // We add tfdt atoms when fragmenting, signal this with the iso6 compatible
2909     // brand. This is compatible with users that don't understand tfdt.
2910     if (mov->flags & FF_MOV_FLAG_FRAGMENT && mov->mode != MODE_ISM)
2911         ffio_wfourcc(pb, "iso6");
2912
2913     if (mov->mode == MODE_3GP)
2914         ffio_wfourcc(pb, has_h264 ? "3gp6":"3gp4");
2915     else if (mov->mode & MODE_3G2)
2916         ffio_wfourcc(pb, has_h264 ? "3g2b":"3g2a");
2917     else if (mov->mode == MODE_PSP)
2918         ffio_wfourcc(pb, "MSNV");
2919     else if (mov->mode == MODE_MP4)
2920         ffio_wfourcc(pb, "mp41");
2921
2922     if (mov->flags & FF_MOV_FLAG_DASH && mov->flags & FF_MOV_FLAG_FASTSTART)
2923         ffio_wfourcc(pb, "dash");
2924
2925     return update_size(pb, pos);
2926 }
2927
2928 static void mov_write_uuidprof_tag(AVIOContext *pb, AVFormatContext *s)
2929 {
2930     AVStream       *video_st    = s->streams[0];
2931     AVCodecContext *video_codec = s->streams[0]->codec;
2932     AVCodecContext *audio_codec = s->streams[1]->codec;
2933     int audio_rate = audio_codec->sample_rate;
2934     // TODO: should be avg_frame_rate
2935     int frame_rate = ((video_st->time_base.den) * (0x10000)) / (video_st->time_base.num);
2936     int audio_kbitrate = audio_codec->bit_rate / 1000;
2937     int video_kbitrate = FFMIN(video_codec->bit_rate / 1000, 800 - audio_kbitrate);
2938
2939     avio_wb32(pb, 0x94); /* size */
2940     ffio_wfourcc(pb, "uuid");
2941     ffio_wfourcc(pb, "PROF");
2942
2943     avio_wb32(pb, 0x21d24fce); /* 96 bit UUID */
2944     avio_wb32(pb, 0xbb88695c);
2945     avio_wb32(pb, 0xfac9c740);
2946
2947     avio_wb32(pb, 0x0);  /* ? */
2948     avio_wb32(pb, 0x3);  /* 3 sections ? */
2949
2950     avio_wb32(pb, 0x14); /* size */
2951     ffio_wfourcc(pb, "FPRF");
2952     avio_wb32(pb, 0x0);  /* ? */
2953     avio_wb32(pb, 0x0);  /* ? */
2954     avio_wb32(pb, 0x0);  /* ? */
2955
2956     avio_wb32(pb, 0x2c);  /* size */
2957     ffio_wfourcc(pb, "APRF"); /* audio */
2958     avio_wb32(pb, 0x0);
2959     avio_wb32(pb, 0x2);   /* TrackID */
2960     ffio_wfourcc(pb, "mp4a");
2961     avio_wb32(pb, 0x20f);
2962     avio_wb32(pb, 0x0);
2963     avio_wb32(pb, audio_kbitrate);
2964     avio_wb32(pb, audio_kbitrate);
2965     avio_wb32(pb, audio_rate);
2966     avio_wb32(pb, audio_codec->channels);
2967
2968     avio_wb32(pb, 0x34);  /* size */
2969     ffio_wfourcc(pb, "VPRF");   /* video */
2970     avio_wb32(pb, 0x0);
2971     avio_wb32(pb, 0x1);    /* TrackID */
2972     if (video_codec->codec_id == AV_CODEC_ID_H264) {
2973         ffio_wfourcc(pb, "avc1");
2974         avio_wb16(pb, 0x014D);
2975         avio_wb16(pb, 0x0015);
2976     } else {
2977         ffio_wfourcc(pb, "mp4v");
2978         avio_wb16(pb, 0x0000);
2979         avio_wb16(pb, 0x0103);
2980     }
2981     avio_wb32(pb, 0x0);
2982     avio_wb32(pb, video_kbitrate);
2983     avio_wb32(pb, video_kbitrate);
2984     avio_wb32(pb, frame_rate);
2985     avio_wb32(pb, frame_rate);
2986     avio_wb16(pb, video_codec->width);
2987     avio_wb16(pb, video_codec->height);
2988     avio_wb32(pb, 0x010001); /* ? */
2989 }
2990
2991 static int mov_parse_mpeg2_frame(AVPacket *pkt, uint32_t *flags)
2992 {
2993     uint32_t c = -1;
2994     int i, closed_gop = 0;
2995
2996     for (i = 0; i < pkt->size - 4; i++) {
2997         c = (c << 8) + pkt->data[i];
2998         if (c == 0x1b8) { // gop
2999             closed_gop = pkt->data[i + 4] >> 6 & 0x01;
3000         } else if (c == 0x100) { // pic
3001             int temp_ref = (pkt->data[i + 1] << 2) | (pkt->data[i + 2] >> 6);
3002             if (!temp_ref || closed_gop) // I picture is not reordered
3003                 *flags = MOV_SYNC_SAMPLE;
3004             else
3005                 *flags = MOV_PARTIAL_SYNC_SAMPLE;
3006             break;
3007         }
3008     }
3009     return 0;
3010 }
3011
3012 static void mov_parse_vc1_frame(AVPacket *pkt, MOVTrack *trk, int fragment)
3013 {
3014     const uint8_t *start, *next, *end = pkt->data + pkt->size;
3015     int seq = 0, entry = 0;
3016     int key = pkt->flags & AV_PKT_FLAG_KEY;
3017     start = find_next_marker(pkt->data, end);
3018     for (next = start; next < end; start = next) {
3019         next = find_next_marker(start + 4, end);
3020         switch (AV_RB32(start)) {
3021         case VC1_CODE_SEQHDR:
3022             seq = 1;
3023             break;
3024         case VC1_CODE_ENTRYPOINT:
3025             entry = 1;
3026             break;
3027         case VC1_CODE_SLICE:
3028             trk->vc1_info.slices = 1;
3029             break;
3030         }
3031     }
3032     if (!trk->entry && !fragment) {
3033         /* First packet in first fragment */
3034         trk->vc1_info.first_packet_seq   = seq;
3035         trk->vc1_info.first_packet_entry = entry;
3036     } else if ((seq && !trk->vc1_info.packet_seq) ||
3037                (entry && !trk->vc1_info.packet_entry)) {
3038         int i;
3039         for (i = 0; i < trk->entry; i++)
3040             trk->cluster[i].flags &= ~MOV_SYNC_SAMPLE;
3041         trk->has_keyframes = 0;
3042         if (seq)
3043             trk->vc1_info.packet_seq = 1;
3044         if (entry)
3045             trk->vc1_info.packet_entry = 1;
3046         if (!fragment) {
3047             /* First fragment */
3048             if ((!seq   || trk->vc1_info.first_packet_seq) &&
3049                 (!entry || trk->vc1_info.first_packet_entry)) {
3050                 /* First packet had the same headers as this one, readd the
3051                  * sync sample flag. */
3052                 trk->cluster[0].flags |= MOV_SYNC_SAMPLE;
3053                 trk->has_keyframes = 1;
3054             }
3055         }
3056     }
3057     if (trk->vc1_info.packet_seq && trk->vc1_info.packet_entry)
3058         key = seq && entry;
3059     else if (trk->vc1_info.packet_seq)
3060         key = seq;
3061     else if (trk->vc1_info.packet_entry)
3062         key = entry;
3063     if (key) {
3064         trk->cluster[trk->entry].flags |= MOV_SYNC_SAMPLE;
3065         trk->has_keyframes++;
3066     }
3067 }
3068
3069 static int mov_flush_fragment(AVFormatContext *s)
3070 {
3071     MOVMuxContext *mov = s->priv_data;
3072     int i, first_track = -1;
3073     int64_t mdat_size = 0;
3074
3075     if (!(mov->flags & FF_MOV_FLAG_FRAGMENT))
3076         return 0;
3077
3078     if (!(mov->flags & FF_MOV_FLAG_EMPTY_MOOV) && mov->fragments == 0) {
3079         int64_t pos = avio_tell(s->pb);
3080         int ret;
3081         AVIOContext *moov_buf;
3082         uint8_t *buf;
3083         int buf_size;
3084
3085         for (i = 0; i < mov->nb_streams; i++)
3086             if (!mov->tracks[i].entry)
3087                 break;
3088         /* Don't write the initial moov unless all tracks have data */
3089         if (i < mov->nb_streams)
3090             return 0;
3091
3092         if ((ret = ffio_open_null_buf(&moov_buf)) < 0)
3093             return ret;
3094         mov_write_moov_tag(moov_buf, mov, s);
3095         buf_size = ffio_close_null_buf(moov_buf);
3096         for (i = 0; i < mov->nb_streams; i++)
3097             mov->tracks[i].data_offset = pos + buf_size + 8;
3098
3099         mov_write_moov_tag(s->pb, mov, s);
3100
3101         buf_size = avio_close_dyn_buf(mov->mdat_buf, &buf);
3102         mov->mdat_buf = NULL;
3103         avio_wb32(s->pb, buf_size + 8);
3104         ffio_wfourcc(s->pb, "mdat");
3105         avio_write(s->pb, buf, buf_size);
3106         av_free(buf);
3107
3108         mov->fragments++;
3109         mov->mdat_size = 0;
3110         for (i = 0; i < mov->nb_streams; i++) {
3111             if (mov->tracks[i].entry)
3112                 mov->tracks[i].frag_start += mov->tracks[i].start_dts +
3113                                              mov->tracks[i].track_duration -
3114                                              mov->tracks[i].cluster[0].dts;
3115             mov->tracks[i].entry = 0;
3116         }
3117         avio_flush(s->pb);
3118         return 0;
3119     }
3120
3121     for (i = 0; i < mov->nb_streams; i++) {
3122         MOVTrack *track = &mov->tracks[i];
3123         if (mov->flags & FF_MOV_FLAG_SEPARATE_MOOF)
3124             track->data_offset = 0;
3125         else
3126             track->data_offset = mdat_size;
3127         if (!track->mdat_buf)
3128             continue;
3129         mdat_size += avio_tell(track->mdat_buf);
3130         if (first_track < 0)
3131             first_track = i;
3132     }
3133
3134     if (!mdat_size)
3135         return 0;
3136
3137     for (i = 0; i < mov->nb_streams; i++) {
3138         MOVTrack *track = &mov->tracks[i];
3139         int buf_size, write_moof = 1, moof_tracks = -1;
3140         uint8_t *buf;
3141         int64_t duration = 0;
3142
3143         if (track->entry)
3144             duration = track->start_dts + track->track_duration -
3145                        track->cluster[0].dts;
3146         if (mov->flags & FF_MOV_FLAG_SEPARATE_MOOF) {
3147             if (!track->mdat_buf)
3148                 continue;
3149             mdat_size = avio_tell(track->mdat_buf);
3150             moof_tracks = i;
3151         } else {
3152             write_moof = i == first_track;
3153         }
3154
3155         if (write_moof) {
3156             avio_flush(s->pb);
3157
3158             mov_write_moof_tag(s->pb, mov, moof_tracks, mdat_size);
3159             mov->fragments++;
3160
3161             avio_wb32(s->pb, mdat_size + 8);
3162             ffio_wfourcc(s->pb, "mdat");
3163         }
3164
3165         if (track->entry)
3166             track->frag_start += duration;
3167         track->entry = 0;
3168         if (!track->mdat_buf)
3169             continue;
3170         buf_size = avio_close_dyn_buf(track->mdat_buf, &buf);
3171         track->mdat_buf = NULL;
3172
3173         avio_write(s->pb, buf, buf_size);
3174         av_free(buf);
3175     }
3176
3177     mov->mdat_size = 0;
3178
3179     avio_flush(s->pb);
3180     return 0;
3181 }
3182
3183 int ff_mov_write_packet(AVFormatContext *s, AVPacket *pkt)
3184 {
3185     MOVMuxContext *mov = s->priv_data;
3186     AVIOContext *pb = s->pb;
3187     MOVTrack *trk = &mov->tracks[pkt->stream_index];
3188     AVCodecContext *enc = trk->enc;
3189     unsigned int samples_in_chunk = 0;
3190     int size = pkt->size, ret = 0;
3191     uint8_t *reformatted_data = NULL;
3192
3193     if (mov->flags & FF_MOV_FLAG_FRAGMENT) {
3194         int ret;
3195         if (mov->fragments > 0) {
3196             if (!trk->mdat_buf) {
3197                 if ((ret = avio_open_dyn_buf(&trk->mdat_buf)) < 0)
3198                     return ret;
3199             }
3200             pb = trk->mdat_buf;
3201         } else {
3202             if (!mov->mdat_buf) {
3203                 if ((ret = avio_open_dyn_buf(&mov->mdat_buf)) < 0)
3204                     return ret;
3205             }
3206             pb = mov->mdat_buf;
3207         }
3208     }
3209
3210     if (enc->codec_id == AV_CODEC_ID_AMR_NB) {
3211         /* We must find out how many AMR blocks there are in one packet */
3212         static uint16_t packed_size[16] =
3213             {13, 14, 16, 18, 20, 21, 27, 32, 6, 0, 0, 0, 0, 0, 0, 1};
3214         int len = 0;
3215
3216         while (len < size && samples_in_chunk < 100) {
3217             len += packed_size[(pkt->data[len] >> 3) & 0x0F];
3218             samples_in_chunk++;
3219         }
3220         if (samples_in_chunk > 1) {
3221             av_log(s, AV_LOG_ERROR, "fatal error, input is not a single packet, implement a AVParser for it\n");
3222             return -1;
3223         }
3224     } else if (trk->sample_size)
3225         samples_in_chunk = size / trk->sample_size;
3226     else
3227         samples_in_chunk = 1;
3228
3229     /* copy extradata if it exists */
3230     if (trk->vos_len == 0 && enc->extradata_size > 0) {
3231         trk->vos_len  = enc->extradata_size;
3232         trk->vos_data = av_malloc(trk->vos_len);
3233         memcpy(trk->vos_data, enc->extradata, trk->vos_len);
3234     }
3235
3236     if (enc->codec_id == AV_CODEC_ID_H264 && trk->vos_len > 0 && *(uint8_t *)trk->vos_data != 1) {
3237         /* from x264 or from bytestream h264 */
3238         /* nal reformating needed */
3239         if (trk->hint_track >= 0 && trk->hint_track < mov->nb_streams) {
3240             ff_avc_parse_nal_units_buf(pkt->data, &reformatted_data,
3241                                        &size);
3242             avio_write(pb, reformatted_data, size);
3243         } else {
3244             size = ff_avc_parse_nal_units(pb, pkt->data, pkt->size);
3245         }
3246     } else if (enc->codec_id == AV_CODEC_ID_HEVC && trk->vos_len > 6 &&
3247                (AV_RB24(trk->vos_data) == 1 || AV_RB32(trk->vos_data) == 1)) {
3248         /* extradata is Annex B, assume the bitstream is too and convert it */
3249         if (trk->hint_track >= 0 && trk->hint_track < mov->nb_streams) {
3250             ff_hevc_annexb2mp4_buf(pkt->data, &reformatted_data, &size, 0, NULL);
3251             avio_write(pb, reformatted_data, size);
3252         } else {
3253             size = ff_hevc_annexb2mp4(pb, pkt->data, pkt->size, 0, NULL);
3254         }
3255     } else {
3256         avio_write(pb, pkt->data, size);
3257     }
3258
3259     if ((enc->codec_id == AV_CODEC_ID_DNXHD ||
3260          enc->codec_id == AV_CODEC_ID_AC3) && !trk->vos_len) {
3261         /* copy frame to create needed atoms */
3262         trk->vos_len  = size;
3263         trk->vos_data = av_malloc(size);
3264         if (!trk->vos_data) {
3265             ret = AVERROR(ENOMEM);
3266             goto err;
3267         }
3268         memcpy(trk->vos_data, pkt->data, size);
3269     }
3270
3271     if (trk->entry >= trk->cluster_capacity) {
3272         unsigned new_capacity = 2 * (trk->entry + MOV_INDEX_CLUSTER_SIZE);
3273         if (av_reallocp_array(&trk->cluster, new_capacity,
3274                               sizeof(*trk->cluster))) {
3275             ret = AVERROR(ENOMEM);
3276             goto err;
3277         }
3278         trk->cluster_capacity = new_capacity;
3279     }
3280
3281     trk->cluster[trk->entry].pos              = avio_tell(pb) - size;
3282     trk->cluster[trk->entry].samples_in_chunk = samples_in_chunk;
3283     trk->cluster[trk->entry].size             = size;
3284     trk->cluster[trk->entry].entries          = samples_in_chunk;
3285     trk->cluster[trk->entry].dts              = pkt->dts;
3286     if (!trk->entry && trk->start_dts != AV_NOPTS_VALUE) {
3287         if (!trk->frag_discont) {
3288             /* First packet of a new fragment. We already wrote the duration
3289              * of the last packet of the previous fragment based on track_duration,
3290              * which might not exactly match our dts. Therefore adjust the dts
3291              * of this packet to be what the previous packets duration implies. */
3292             trk->cluster[trk->entry].dts = trk->start_dts + trk->track_duration;
3293         } else {
3294             /* New fragment, but discontinuous from previous fragments.
3295              * Pretend the duration sum of the earlier fragments is
3296              * pkt->dts - trk->start_dts. */
3297             trk->frag_start = pkt->dts - trk->start_dts;
3298             trk->frag_discont = 0;
3299         }
3300     }
3301     if (!trk->entry && trk->start_dts == AV_NOPTS_VALUE && !mov->use_editlist &&
3302         s->avoid_negative_ts == AVFMT_AVOID_NEG_TS_MAKE_ZERO) {
3303         /* Not using edit lists and shifting the first track to start from zero.
3304          * If the other streams start from a later timestamp, we won't be able
3305          * to signal the difference in starting time without an edit list.
3306          * Thus move the timestamp for this first sample to 0, increasing
3307          * its duration instead. */
3308         trk->cluster[trk->entry].dts = trk->start_dts = 0;
3309     }
3310     if (trk->start_dts == AV_NOPTS_VALUE) {
3311         trk->start_dts = pkt->dts;
3312         if (trk->frag_discont) {
3313             /* Pretend the whole stream started at dts=0, with earlier framgents
3314              * already written, with a duration summing up to pkt->dts. */
3315             trk->frag_start   = pkt->dts;
3316             trk->start_dts    = 0;
3317             trk->frag_discont = 0;
3318         } else if (pkt->dts && mov->flags & FF_MOV_FLAG_EMPTY_MOOV)
3319             av_log(s, AV_LOG_WARNING,
3320                    "Track %d starts with a nonzero dts %"PRId64". This "
3321                    "currently isn't handled correctly in combination with "
3322                    "empty_moov.\n", pkt->stream_index, pkt->dts);
3323     }
3324     trk->track_duration = pkt->dts - trk->start_dts + pkt->duration;
3325
3326     if (pkt->pts == AV_NOPTS_VALUE) {
3327         av_log(s, AV_LOG_WARNING, "pts has no value\n");
3328         pkt->pts = pkt->dts;
3329     }
3330     if (pkt->dts != pkt->pts)
3331         trk->flags |= MOV_TRACK_CTTS;
3332     trk->cluster[trk->entry].cts   = pkt->pts - pkt->dts;
3333     trk->cluster[trk->entry].flags = 0;
3334     if (enc->codec_id == AV_CODEC_ID_VC1) {
3335         mov_parse_vc1_frame(pkt, trk, mov->fragments);
3336     } else if (pkt->flags & AV_PKT_FLAG_KEY) {
3337         if (mov->mode == MODE_MOV && enc->codec_id == AV_CODEC_ID_MPEG2VIDEO &&
3338             trk->entry > 0) { // force sync sample for the first key frame
3339             mov_parse_mpeg2_frame(pkt, &trk->cluster[trk->entry].flags);
3340             if (trk->cluster[trk->entry].flags & MOV_PARTIAL_SYNC_SAMPLE)
3341                 trk->flags |= MOV_TRACK_STPS;
3342         } else {
3343             trk->cluster[trk->entry].flags = MOV_SYNC_SAMPLE;
3344         }
3345         if (trk->cluster[trk->entry].flags & MOV_SYNC_SAMPLE)
3346             trk->has_keyframes++;
3347     }
3348     trk->entry++;
3349     trk->sample_count += samples_in_chunk;
3350     mov->mdat_size    += size;
3351
3352     if (trk->hint_track >= 0 && trk->hint_track < mov->nb_streams)
3353         ff_mov_add_hinted_packet(s, pkt, trk->hint_track, trk->entry,
3354                                  reformatted_data, size);
3355
3356 err:
3357     av_free(reformatted_data);
3358     return ret;
3359 }
3360
3361 static int mov_write_packet(AVFormatContext *s, AVPacket *pkt)
3362 {
3363     if (!pkt) {
3364         mov_flush_fragment(s);
3365         return 1;
3366     } else {
3367         MOVMuxContext *mov = s->priv_data;
3368         MOVTrack *trk = &mov->tracks[pkt->stream_index];
3369         AVCodecContext *enc = trk->enc;
3370         int64_t frag_duration = 0;
3371         int size = pkt->size;
3372
3373         if (!pkt->size)
3374             return 0;             /* Discard 0 sized packets */
3375
3376         if (mov->flags & FF_MOV_FLAG_FRAG_DISCONT) {
3377             int i;
3378             for (i = 0; i < s->nb_streams; i++)
3379                 mov->tracks[i].frag_discont = 1;
3380             mov->flags &= ~FF_MOV_FLAG_FRAG_DISCONT;
3381         }
3382
3383         if (trk->entry)
3384             frag_duration = av_rescale_q(pkt->dts - trk->cluster[0].dts,
3385                                          s->streams[pkt->stream_index]->time_base,
3386                                          AV_TIME_BASE_Q);
3387         if ((mov->max_fragment_duration &&
3388              frag_duration >= mov->max_fragment_duration) ||
3389              (mov->max_fragment_size && mov->mdat_size + size >= mov->max_fragment_size) ||
3390              (mov->flags & FF_MOV_FLAG_FRAG_KEYFRAME &&
3391               enc->codec_type == AVMEDIA_TYPE_VIDEO &&
3392               trk->entry && pkt->flags & AV_PKT_FLAG_KEY)) {
3393             if (frag_duration >= mov->min_fragment_duration)
3394                 mov_flush_fragment(s);
3395         }
3396
3397         return ff_mov_write_packet(s, pkt);
3398     }
3399 }
3400
3401 // QuickTime chapters involve an additional text track with the chapter names
3402 // as samples, and a tref pointing from the other tracks to the chapter one.
3403 static int mov_create_chapter_track(AVFormatContext *s, int tracknum)
3404 {
3405     MOVMuxContext *mov = s->priv_data;
3406     MOVTrack *track = &mov->tracks[tracknum];
3407     AVPacket pkt = { .stream_index = tracknum, .flags = AV_PKT_FLAG_KEY };
3408     int i, len;
3409     // These properties are required to make QT recognize the chapter track
3410     uint8_t chapter_properties[43] = { 0, 0, 0, 0, 0, 0, 0, 1, };
3411
3412     track->mode = mov->mode;
3413     track->tag = MKTAG('t','e','x','t');
3414     track->timescale = MOV_TIMESCALE;
3415     track->enc = avcodec_alloc_context3(NULL);
3416     if (!track->enc)
3417         return AVERROR(ENOMEM);
3418     track->enc->codec_type = AVMEDIA_TYPE_SUBTITLE;
3419     track->enc->extradata = av_malloc(sizeof(chapter_properties));
3420     if (!track->enc->extradata)
3421         return AVERROR(ENOMEM);
3422     track->enc->extradata_size = sizeof(chapter_properties);
3423     memcpy(track->enc->extradata, chapter_properties, sizeof(chapter_properties));
3424
3425     for (i = 0; i < s->nb_chapters; i++) {
3426         AVChapter *c = s->chapters[i];
3427         AVDictionaryEntry *t;
3428
3429         int64_t end = av_rescale_q(c->end, c->time_base, (AVRational){1,MOV_TIMESCALE});
3430         pkt.pts = pkt.dts = av_rescale_q(c->start, c->time_base, (AVRational){1,MOV_TIMESCALE});
3431         pkt.duration = end - pkt.dts;
3432
3433         if ((t = av_dict_get(c->metadata, "title", NULL, 0))) {
3434             const char encd[12] = {
3435                 0x00, 0x00, 0x00, 0x0C,
3436                 'e',  'n',  'c',  'd',
3437                 0x00, 0x00, 0x01, 0x00 };
3438             len      = strlen(t->value);
3439             pkt.size = len + 2 + 12;
3440             pkt.data = av_malloc(pkt.size);
3441             if (!pkt.data)
3442                 return AVERROR(ENOMEM);
3443             AV_WB16(pkt.data, len);
3444             memcpy(pkt.data + 2, t->value, len);
3445             memcpy(pkt.data + len + 2, encd, sizeof(encd));
3446             ff_mov_write_packet(s, &pkt);
3447             av_freep(&pkt.data);
3448         }
3449     }
3450
3451     return 0;
3452 }
3453
3454 /*
3455  * st->disposition controls the "enabled" flag in the tkhd tag.
3456  * QuickTime will not play a track if it is not enabled.  So make sure
3457  * that one track of each type (audio, video, subtitle) is enabled.
3458  *
3459  * Subtitles are special.  For audio and video, setting "enabled" also
3460  * makes the track "default" (i.e. it is rendered when played). For
3461  * subtitles, an "enabled" subtitle is not rendered by default, but
3462  * if no subtitle is enabled, the subtitle menu in QuickTime will be
3463  * empty!
3464  */
3465 static void enable_tracks(AVFormatContext *s)
3466 {
3467     MOVMuxContext *mov = s->priv_data;
3468     int i;
3469     int enabled[AVMEDIA_TYPE_NB];
3470     int first[AVMEDIA_TYPE_NB];
3471
3472     for (i = 0; i < AVMEDIA_TYPE_NB; i++) {
3473         enabled[i] = 0;
3474         first[i] = -1;
3475     }
3476
3477     for (i = 0; i < s->nb_streams; i++) {
3478         AVStream *st = s->streams[i];
3479
3480         if (st->codec->codec_type <= AVMEDIA_TYPE_UNKNOWN ||
3481             st->codec->codec_type >= AVMEDIA_TYPE_NB)
3482             continue;
3483
3484         if (first[st->codec->codec_type] < 0)
3485             first[st->codec->codec_type] = i;
3486         if (st->disposition & AV_DISPOSITION_DEFAULT) {
3487             mov->tracks[i].flags |= MOV_TRACK_ENABLED;
3488             enabled[st->codec->codec_type]++;
3489         }
3490     }
3491
3492     for (i = 0; i < AVMEDIA_TYPE_NB; i++) {
3493         switch (i) {
3494         case AVMEDIA_TYPE_VIDEO:
3495         case AVMEDIA_TYPE_AUDIO:
3496         case AVMEDIA_TYPE_SUBTITLE:
3497             if (enabled[i] > 1)
3498                 mov->per_stream_grouping = 1;
3499             if (!enabled[i] && first[i] >= 0)
3500                 mov->tracks[first[i]].flags |= MOV_TRACK_ENABLED;
3501             break;
3502         }
3503     }
3504 }
3505
3506 static void mov_free(AVFormatContext *s)
3507 {
3508     MOVMuxContext *mov = s->priv_data;
3509     int i;
3510
3511     if (mov->chapter_track) {
3512         if (mov->tracks[mov->chapter_track].enc)
3513             av_free(mov->tracks[mov->chapter_track].enc->extradata);
3514         av_freep(&mov->tracks[mov->chapter_track].enc);
3515     }
3516
3517     for (i = 0; i < mov->nb_streams; i++) {
3518         if (mov->tracks[i].tag == MKTAG('r','t','p',' '))
3519             ff_mov_close_hinting(&mov->tracks[i]);
3520         av_freep(&mov->tracks[i].cluster);
3521         av_freep(&mov->tracks[i].frag_info);
3522
3523         if (mov->tracks[i].vos_len)
3524             av_free(mov->tracks[i].vos_data);
3525     }
3526
3527     av_freep(&mov->tracks);
3528 }
3529
3530 static uint32_t rgb_to_yuv(uint32_t rgb)
3531 {
3532     uint8_t r, g, b;
3533     int y, cb, cr;
3534
3535     r = (rgb >> 16) & 0xFF;
3536     g = (rgb >>  8) & 0xFF;
3537     b = (rgb      ) & 0xFF;
3538
3539     y  = av_clip_uint8( 16. +  0.257 * r + 0.504 * g + 0.098 * b);
3540     cb = av_clip_uint8(128. -  0.148 * r - 0.291 * g + 0.439 * b);
3541     cr = av_clip_uint8(128. +  0.439 * r - 0.368 * g - 0.071 * b);
3542
3543     return (y << 16) | (cr << 8) | cb;
3544 }
3545
3546 static int mov_create_dvd_sub_decoder_specific_info(MOVTrack *track,
3547                                                     AVStream *st)
3548 {
3549     int i, width = 720, height = 480;
3550     int have_palette = 0, have_size = 0;
3551     uint32_t palette[16];
3552     char *cur = st->codec->extradata;
3553
3554     while (cur && *cur) {
3555         if (strncmp("palette:", cur, 8) == 0) {
3556             int i, count;
3557             count = sscanf(cur + 8,
3558                 "%06"PRIx32", %06"PRIx32", %06"PRIx32", %06"PRIx32", "
3559                 "%06"PRIx32", %06"PRIx32", %06"PRIx32", %06"PRIx32", "
3560                 "%06"PRIx32", %06"PRIx32", %06"PRIx32", %06"PRIx32", "
3561                 "%06"PRIx32", %06"PRIx32", %06"PRIx32", %06"PRIx32"",
3562                 &palette[ 0], &palette[ 1], &palette[ 2], &palette[ 3],
3563                 &palette[ 4], &palette[ 5], &palette[ 6], &palette[ 7],
3564                 &palette[ 8], &palette[ 9], &palette[10], &palette[11],
3565                 &palette[12], &palette[13], &palette[14], &palette[15]);
3566
3567             for (i = 0; i < count; i++) {
3568                 palette[i] = rgb_to_yuv(palette[i]);
3569             }
3570             have_palette = 1;
3571         } else if (!strncmp("size:", cur, 5)) {
3572             sscanf(cur + 5, "%dx%d", &width, &height);
3573             have_size = 1;
3574         }
3575         if (have_palette && have_size)
3576             break;
3577         cur += strcspn(cur, "\n\r");
3578         cur += strspn(cur, "\n\r");
3579     }
3580     if (have_palette) {
3581         track->vos_data = av_malloc(16*4);
3582         if (!track->vos_data)
3583             return AVERROR(ENOMEM);
3584         for (i = 0; i < 16; i++) {
3585             AV_WB32(track->vos_data + i * 4, palette[i]);
3586         }
3587         track->vos_len = 16 * 4;
3588     }
3589     st->codec->width = width;
3590     st->codec->height = track->height = height;
3591
3592     return 0;
3593 }
3594
3595 static int mov_write_header(AVFormatContext *s)
3596 {
3597     AVIOContext *pb = s->pb;
3598     MOVMuxContext *mov = s->priv_data;
3599     AVDictionaryEntry *t;
3600     int i, hint_track = 0;
3601
3602     mov->fc = s;
3603
3604     /* Default mode == MP4 */
3605     mov->mode = MODE_MP4;
3606
3607     if (s->oformat) {
3608         if (!strcmp("3gp", s->oformat->name)) mov->mode = MODE_3GP;
3609         else if (!strcmp("3g2", s->oformat->name)) mov->mode = MODE_3GP|MODE_3G2;
3610         else if (!strcmp("mov", s->oformat->name)) mov->mode = MODE_MOV;
3611         else if (!strcmp("psp", s->oformat->name)) mov->mode = MODE_PSP;
3612         else if (!strcmp("ipod",s->oformat->name)) mov->mode = MODE_IPOD;
3613         else if (!strcmp("ismv",s->oformat->name)) mov->mode = MODE_ISM;
3614         else if (!strcmp("f4v", s->oformat->name)) mov->mode = MODE_F4V;
3615     }
3616
3617     /* Set the FRAGMENT flag if any of the fragmentation methods are
3618      * enabled. */
3619     if (mov->max_fragment_duration || mov->max_fragment_size ||
3620         mov->flags & (FF_MOV_FLAG_EMPTY_MOOV |
3621                       FF_MOV_FLAG_FRAG_KEYFRAME |
3622                       FF_MOV_FLAG_FRAG_CUSTOM))
3623         mov->flags |= FF_MOV_FLAG_FRAGMENT;
3624
3625     /* Set other implicit flags immediately */
3626     if (mov->mode == MODE_ISM)
3627         mov->flags |= FF_MOV_FLAG_EMPTY_MOOV | FF_MOV_FLAG_SEPARATE_MOOF |
3628                       FF_MOV_FLAG_FRAGMENT;
3629     if (mov->flags & FF_MOV_FLAG_DASH)
3630         mov->flags |= FF_MOV_FLAG_FRAGMENT | FF_MOV_FLAG_EMPTY_MOOV |
3631                       FF_MOV_FLAG_DEFAULT_BASE_MOOF;
3632
3633     if (mov->use_editlist < 0) {
3634         mov->use_editlist = 1;
3635         if (mov->flags & FF_MOV_FLAG_FRAGMENT) {
3636             // If we can avoid needing an edit list by shifting the
3637             // tracks, prefer that over (trying to) write edit lists
3638             // in fragmented output.
3639             if (s->avoid_negative_ts == AVFMT_AVOID_NEG_TS_AUTO ||
3640                 s->avoid_negative_ts == AVFMT_AVOID_NEG_TS_MAKE_ZERO)
3641                 mov->use_editlist = 0;
3642         }
3643     }
3644     if (mov->flags & FF_MOV_FLAG_EMPTY_MOOV && mov->use_editlist)
3645         av_log(s, AV_LOG_WARNING, "No meaningful edit list will be written when using empty_moov\n");
3646
3647     if (!mov->use_editlist && s->avoid_negative_ts == AVFMT_AVOID_NEG_TS_AUTO)
3648         s->avoid_negative_ts = AVFMT_AVOID_NEG_TS_MAKE_ZERO;
3649
3650     /* Non-seekable output is ok if using fragmentation. If ism_lookahead
3651      * is enabled, we don't support non-seekable output at all. */
3652     if (!s->pb->seekable &&
3653         (!(mov->flags & FF_MOV_FLAG_FRAGMENT) || mov->ism_lookahead)) {
3654         av_log(s, AV_LOG_ERROR, "muxer does not support non seekable output\n");
3655         return AVERROR(EINVAL);
3656     }
3657
3658
3659     mov_write_ftyp_tag(pb,s);
3660     if (mov->mode == MODE_PSP) {
3661         if (s->nb_streams != 2) {
3662             av_log(s, AV_LOG_ERROR, "PSP mode need one video and one audio stream\n");
3663             return AVERROR(EINVAL);
3664         }
3665         mov_write_uuidprof_tag(pb, s);
3666     }
3667
3668     mov->nb_streams = s->nb_streams;
3669     if (mov->mode & (MODE_MP4|MODE_MOV|MODE_IPOD) && s->nb_chapters)
3670         mov->chapter_track = mov->nb_streams++;
3671
3672     if (mov->flags & FF_MOV_FLAG_RTP_HINT) {
3673         /* Add hint tracks for each audio and video stream */
3674         hint_track = mov->nb_streams;
3675         for (i = 0; i < s->nb_streams; i++) {
3676             AVStream *st = s->streams[i];
3677             if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO ||
3678                 st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
3679                 mov->nb_streams++;
3680             }
3681         }
3682     }
3683
3684     // Reserve an extra stream for chapters for the case where chapters
3685     // are written in the trailer
3686     mov->tracks = av_mallocz((mov->nb_streams + 1) * sizeof(*mov->tracks));
3687     if (!mov->tracks)
3688         return AVERROR(ENOMEM);
3689
3690     for (i = 0; i < s->nb_streams; i++) {
3691         AVStream *st= s->streams[i];
3692         MOVTrack *track= &mov->tracks[i];
3693         AVDictionaryEntry *lang = av_dict_get(st->metadata, "language", NULL,0);
3694
3695         track->st  = st;
3696         track->enc = st->codec;
3697         track->language = ff_mov_iso639_to_lang(lang?lang->value:"und", mov->mode!=MODE_MOV);
3698         if (track->language < 0)
3699             track->language = 0;
3700         track->mode = mov->mode;
3701         track->tag  = mov_find_codec_tag(s, track);
3702         if (!track->tag) {
3703             av_log(s, AV_LOG_ERROR, "track %d: could not find tag, "
3704                    "codec not currently supported in container\n", i);
3705             goto error;
3706         }
3707         /* If hinting of this track is enabled by a later hint track,
3708          * this is updated. */
3709         track->hint_track = -1;
3710         track->start_dts  = AV_NOPTS_VALUE;
3711         if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO) {
3712             if (track->tag == MKTAG('m','x','3','p') || track->tag == MKTAG('m','x','3','n') ||
3713                 track->tag == MKTAG('m','x','4','p') || track->tag == MKTAG('m','x','4','n') ||
3714                 track->tag == MKTAG('m','x','5','p') || track->tag == MKTAG('m','x','5','n')) {
3715                 if (st->codec->width != 720 || (st->codec->height != 608 && st->codec->height != 512)) {
3716                     av_log(s, AV_LOG_ERROR, "D-10/IMX must use 720x608 or 720x512 video resolution\n");
3717                     goto error;
3718                 }
3719                 track->height = track->tag >> 24 == 'n' ? 486 : 576;
3720             }
3721             track->timescale = st->time_base.den;
3722             if (track->mode == MODE_MOV && track->timescale > 100000)
3723                 av_log(s, AV_LOG_WARNING,
3724                        "WARNING codec timebase is very high. If duration is too long,\n"
3725                        "file may not be playable by quicktime. Specify a shorter timebase\n"
3726                        "or choose different container.\n");
3727         } else if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
3728             track->timescale = st->codec->sample_rate;
3729             /* set sample_size for PCM and ADPCM */
3730             if (av_get_bits_per_sample(st->codec->codec_id) ||
3731                 st->codec->codec_id == AV_CODEC_ID_ILBC) {
3732                 if (!st->codec->block_align) {
3733                     av_log(s, AV_LOG_ERROR, "track %d: codec block align is not set\n", i);
3734                     goto error;
3735                 }
3736                 track->sample_size = st->codec->block_align;
3737             }
3738             /* set audio_vbr for compressed audio */
3739             if (av_get_bits_per_sample(st->codec->codec_id) < 8) {
3740                 track->audio_vbr = 1;
3741             }
3742             if (track->mode != MODE_MOV &&
3743                 track->enc->codec_id == AV_CODEC_ID_MP3 && track->timescale < 16000) {
3744                 av_log(s, AV_LOG_ERROR, "track %d: muxing mp3 at %dhz is not supported\n",
3745                        i, track->enc->sample_rate);
3746                 goto error;
3747             }
3748         } else if (st->codec->codec_type == AVMEDIA_TYPE_SUBTITLE) {
3749             track->timescale = st->time_base.den;
3750         } else if (st->codec->codec_type == AVMEDIA_TYPE_DATA) {
3751             track->timescale = st->time_base.den;
3752         }
3753         if (!track->height)
3754             track->height = st->codec->height;
3755         /* The ism specific timescale isn't mandatory, but is assumed by
3756          * some tools, such as mp4split. */
3757         if (mov->mode == MODE_ISM)
3758             track->timescale = 10000000;
3759
3760         avpriv_set_pts_info(st, 64, 1, track->timescale);
3761
3762         /* copy extradata if it exists */
3763         if (st->codec->extradata_size) {
3764             if (st->codec->codec_id == AV_CODEC_ID_DVD_SUBTITLE)
3765                 mov_create_dvd_sub_decoder_specific_info(track, st);
3766             else {
3767                 track->vos_len  = st->codec->extradata_size;
3768                 track->vos_data = av_malloc(track->vos_len);
3769                 memcpy(track->vos_data, st->codec->extradata, track->vos_len);
3770             }
3771         }
3772     }
3773
3774     enable_tracks(s);
3775
3776     if (mov->flags & FF_MOV_FLAG_FRAGMENT) {
3777         /* If no fragmentation options have been set, set a default. */
3778         if (!(mov->flags & (FF_MOV_FLAG_FRAG_KEYFRAME |
3779                             FF_MOV_FLAG_FRAG_CUSTOM)) &&
3780             !mov->max_fragment_duration && !mov->max_fragment_size)
3781             mov->flags |= FF_MOV_FLAG_FRAG_KEYFRAME;
3782     } else {
3783         if (mov->flags & FF_MOV_FLAG_FASTSTART)
3784             mov->reserved_moov_pos = avio_tell(pb);
3785         mov_write_mdat_tag(pb, mov);
3786     }
3787
3788     if (t = av_dict_get(s->metadata, "creation_time", NULL, 0))
3789         mov->time = ff_iso8601_to_unix_time(t->value);
3790     if (mov->time)
3791         mov->time += 0x7C25B080; // 1970 based -> 1904 based
3792
3793     if (mov->chapter_track)
3794         if (mov_create_chapter_track(s, mov->chapter_track) < 0)
3795             goto error;
3796
3797     if (mov->flags & FF_MOV_FLAG_RTP_HINT) {
3798         /* Initialize the hint tracks for each audio and video stream */
3799         for (i = 0; i < s->nb_streams; i++) {
3800             AVStream *st = s->streams[i];
3801             if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO ||
3802                 st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
3803                 ff_mov_init_hinting(s, hint_track, i);
3804                 hint_track++;
3805             }
3806         }
3807     }
3808
3809     avio_flush(pb);
3810
3811     if (mov->flags & FF_MOV_FLAG_ISML)
3812         mov_write_isml_manifest(pb, mov);
3813
3814     if (mov->flags & FF_MOV_FLAG_EMPTY_MOOV) {
3815         mov_write_moov_tag(pb, mov, s);
3816         mov->fragments++;
3817         if (mov->flags & FF_MOV_FLAG_FASTSTART)
3818             mov->reserved_moov_pos = avio_tell(pb);
3819     }
3820
3821     return 0;
3822  error:
3823     mov_free(s);
3824     return -1;
3825 }
3826
3827 static int get_moov_size(AVFormatContext *s)
3828 {
3829     int ret;
3830     AVIOContext *moov_buf;
3831     MOVMuxContext *mov = s->priv_data;
3832
3833     if ((ret = ffio_open_null_buf(&moov_buf)) < 0)
3834         return ret;
3835     mov_write_moov_tag(moov_buf, mov, s);
3836     return ffio_close_null_buf(moov_buf);
3837 }
3838
3839 static int get_sidx_size(AVFormatContext *s)
3840 {
3841     int ret;
3842     AVIOContext *buf;
3843     MOVMuxContext *mov = s->priv_data;
3844
3845     if ((ret = ffio_open_null_buf(&buf)) < 0)
3846         return ret;
3847     mov_write_sidx_tags(buf, mov, -1, 0);
3848     return ffio_close_null_buf(buf);
3849 }
3850
3851 /*
3852  * This function gets the moov size if moved to the top of the file: the chunk
3853  * offset table can switch between stco (32-bit entries) to co64 (64-bit
3854  * entries) when the moov is moved to the beginning, so the size of the moov
3855  * would change. It also updates the chunk offset tables.
3856  */
3857 static int compute_moov_size(AVFormatContext *s)
3858 {
3859     int i, moov_size, moov_size2;
3860     MOVMuxContext *mov = s->priv_data;
3861
3862     moov_size = get_moov_size(s);
3863     if (moov_size < 0)
3864         return moov_size;
3865
3866     for (i = 0; i < mov->nb_streams; i++)
3867         mov->tracks[i].data_offset += moov_size;
3868
3869     moov_size2 = get_moov_size(s);
3870     if (moov_size2 < 0)
3871         return moov_size2;
3872
3873     /* if the size changed, we just switched from stco to co64 and need to
3874      * update the offsets */
3875     if (moov_size2 != moov_size)
3876         for (i = 0; i < mov->nb_streams; i++)
3877             mov->tracks[i].data_offset += moov_size2 - moov_size;
3878
3879     return moov_size2;
3880 }
3881
3882 static int compute_sidx_size(AVFormatContext *s)
3883 {
3884     int i, sidx_size;
3885     MOVMuxContext *mov = s->priv_data;
3886
3887     sidx_size = get_sidx_size(s);
3888     if (sidx_size < 0)
3889         return sidx_size;
3890
3891     for (i = 0; i < mov->nb_streams; i++)
3892         mov->tracks[i].data_offset += sidx_size;
3893
3894     return sidx_size;
3895 }
3896
3897 static int shift_data(AVFormatContext *s)
3898 {
3899     int ret = 0, moov_size;
3900     MOVMuxContext *mov = s->priv_data;
3901     int64_t pos, pos_end = avio_tell(s->pb);
3902     uint8_t *buf, *read_buf[2];
3903     int read_buf_id = 0;
3904     int read_size[2];
3905     AVIOContext *read_pb;
3906
3907     if (mov->flags & FF_MOV_FLAG_FRAGMENT)
3908         moov_size = compute_sidx_size(s);
3909     else
3910         moov_size = compute_moov_size(s);
3911     if (moov_size < 0)
3912         return moov_size;
3913
3914     buf = av_malloc(moov_size * 2);
3915     if (!buf)
3916         return AVERROR(ENOMEM);
3917     read_buf[0] = buf;
3918     read_buf[1] = buf + moov_size;
3919
3920     /* Shift the data: the AVIO context of the output can only be used for
3921      * writing, so we re-open the same output, but for reading. It also avoids
3922      * a read/seek/write/seek back and forth. */
3923     avio_flush(s->pb);
3924     ret = avio_open(&read_pb, s->filename, AVIO_FLAG_READ);
3925     if (ret < 0) {
3926         av_log(s, AV_LOG_ERROR, "Unable to re-open %s output file for "
3927                "the second pass (faststart)\n", s->filename);
3928         goto end;
3929     }
3930
3931     /* mark the end of the shift to up to the last data we wrote, and get ready
3932      * for writing */
3933     pos_end = avio_tell(s->pb);
3934     avio_seek(s->pb, mov->reserved_moov_pos + moov_size, SEEK_SET);
3935
3936     /* start reading at where the new moov will be placed */
3937     avio_seek(read_pb, mov->reserved_moov_pos, SEEK_SET);
3938     pos = avio_tell(read_pb);
3939
3940 #define READ_BLOCK do {                                                             \
3941     read_size[read_buf_id] = avio_read(read_pb, read_buf[read_buf_id], moov_size);  \
3942     read_buf_id ^= 1;                                                               \
3943 } while (0)
3944
3945     /* shift data by chunk of at most moov_size */
3946     READ_BLOCK;
3947     do {
3948         int n;
3949         READ_BLOCK;
3950         n = read_size[read_buf_id];
3951         if (n <= 0)
3952             break;
3953         avio_write(s->pb, read_buf[read_buf_id], n);
3954         pos += n;
3955     } while (pos < pos_end);
3956     avio_close(read_pb);
3957
3958 end:
3959     av_free(buf);
3960     return ret;
3961 }
3962
3963 static int mov_write_trailer(AVFormatContext *s)
3964 {
3965     MOVMuxContext *mov = s->priv_data;
3966     AVIOContext *pb = s->pb;
3967     int res = 0;
3968     int i;
3969     int64_t moov_pos;
3970
3971     // If there were no chapters when the header was written, but there
3972     // are chapters now, write them in the trailer.  This only works
3973     // when we are not doing fragments.
3974     if (!mov->chapter_track && !(mov->flags & FF_MOV_FLAG_FRAGMENT)) {
3975         if (mov->mode & (MODE_MP4|MODE_MOV|MODE_IPOD) && s->nb_chapters) {
3976             mov->chapter_track = mov->nb_streams++;
3977             if ((res = mov_create_chapter_track(s, mov->chapter_track)) < 0)
3978                 goto error;
3979         }
3980     }
3981
3982     if (!(mov->flags & FF_MOV_FLAG_FRAGMENT)) {
3983         moov_pos = avio_tell(pb);
3984
3985         /* Write size of mdat tag */
3986         if (mov->mdat_size + 8 <= UINT32_MAX) {
3987             avio_seek(pb, mov->mdat_pos, SEEK_SET);
3988             avio_wb32(pb, mov->mdat_size + 8);
3989         } else {
3990             /* overwrite 'wide' placeholder atom */
3991             avio_seek(pb, mov->mdat_pos - 8, SEEK_SET);
3992             /* special value: real atom size will be 64 bit value after
3993              * tag field */
3994             avio_wb32(pb, 1);
3995             ffio_wfourcc(pb, "mdat");
3996             avio_wb64(pb, mov->mdat_size + 16);
3997         }
3998         avio_seek(pb, moov_pos, SEEK_SET);
3999
4000         if (mov->flags & FF_MOV_FLAG_FASTSTART) {
4001             av_log(s, AV_LOG_INFO, "Starting second pass: moving the moov atom to the beginning of the file\n");
4002             res = shift_data(s);
4003             if (res == 0) {
4004                 avio_seek(pb, mov->reserved_moov_pos, SEEK_SET);
4005                 mov_write_moov_tag(pb, mov, s);
4006             }
4007         } else {
4008             mov_write_moov_tag(pb, mov, s);
4009         }
4010     } else {
4011         mov_flush_fragment(s);
4012         for (i = 0; i < mov->nb_streams; i++)
4013            mov->tracks[i].data_offset = 0;
4014         if (mov->flags & FF_MOV_FLAG_FASTSTART) {
4015             av_log(s, AV_LOG_INFO, "Starting second pass: inserting sidx atoms\n");
4016             res = shift_data(s);
4017             if (res == 0) {
4018                 int64_t end = avio_tell(pb);
4019                 avio_seek(pb, mov->reserved_moov_pos, SEEK_SET);
4020                 mov_write_sidx_tags(pb, mov, -1, 0);
4021                 avio_seek(pb, end, SEEK_SET);
4022                 mov_write_mfra_tag(pb, mov);
4023             }
4024         } else {
4025             mov_write_mfra_tag(pb, mov);
4026         }
4027     }
4028
4029     for (i = 0; i < mov->nb_streams; i++) {
4030         if (mov->flags & FF_MOV_FLAG_FRAGMENT &&
4031             mov->tracks[i].vc1_info.struct_offset && s->pb->seekable) {
4032             int64_t off = avio_tell(pb);
4033             uint8_t buf[7];
4034             if (mov_write_dvc1_structs(&mov->tracks[i], buf) >= 0) {
4035                 avio_seek(pb, mov->tracks[i].vc1_info.struct_offset, SEEK_SET);
4036                 avio_write(pb, buf, 7);
4037                 avio_seek(pb, off, SEEK_SET);
4038             }
4039         }
4040     }
4041
4042 error:
4043     mov_free(s);
4044
4045     return res;
4046 }
4047
4048 #if CONFIG_MOV_MUXER
4049 MOV_CLASS(mov)
4050 AVOutputFormat ff_mov_muxer = {
4051     .name              = "mov",
4052     .long_name         = NULL_IF_CONFIG_SMALL("QuickTime / MOV"),
4053     .extensions        = "mov",
4054     .priv_data_size    = sizeof(MOVMuxContext),
4055     .audio_codec       = AV_CODEC_ID_AAC,
4056     .video_codec       = CONFIG_LIBX264_ENCODER ?
4057                          AV_CODEC_ID_H264 : AV_CODEC_ID_MPEG4,
4058     .write_header      = mov_write_header,
4059     .write_packet      = mov_write_packet,
4060     .write_trailer     = mov_write_trailer,
4061     .flags             = AVFMT_GLOBALHEADER | AVFMT_ALLOW_FLUSH | AVFMT_TS_NEGATIVE,
4062     .codec_tag         = (const AVCodecTag* const []){
4063         ff_codec_movvideo_tags, ff_codec_movaudio_tags, 0
4064     },
4065     .priv_class        = &mov_muxer_class,
4066 };
4067 #endif
4068 #if CONFIG_TGP_MUXER
4069 MOV_CLASS(tgp)
4070 AVOutputFormat ff_tgp_muxer = {
4071     .name              = "3gp",
4072     .long_name         = NULL_IF_CONFIG_SMALL("3GP (3GPP file format)"),
4073     .extensions        = "3gp",
4074     .priv_data_size    = sizeof(MOVMuxContext),
4075     .audio_codec       = AV_CODEC_ID_AMR_NB,
4076     .video_codec       = AV_CODEC_ID_H263,
4077     .write_header      = mov_write_header,
4078     .write_packet      = mov_write_packet,
4079     .write_trailer     = mov_write_trailer,
4080     .flags             = AVFMT_GLOBALHEADER | AVFMT_ALLOW_FLUSH | AVFMT_TS_NEGATIVE,
4081     .codec_tag         = (const AVCodecTag* const []){ codec_3gp_tags, 0 },
4082     .priv_class        = &tgp_muxer_class,
4083 };
4084 #endif
4085 #if CONFIG_MP4_MUXER
4086 MOV_CLASS(mp4)
4087 AVOutputFormat ff_mp4_muxer = {
4088     .name              = "mp4",
4089     .long_name         = NULL_IF_CONFIG_SMALL("MP4 (MPEG-4 Part 14)"),
4090     .mime_type         = "application/mp4",
4091     .extensions        = "mp4",
4092     .priv_data_size    = sizeof(MOVMuxContext),
4093     .audio_codec       = AV_CODEC_ID_AAC,
4094     .video_codec       = CONFIG_LIBX264_ENCODER ?
4095                          AV_CODEC_ID_H264 : AV_CODEC_ID_MPEG4,
4096     .write_header      = mov_write_header,
4097     .write_packet      = mov_write_packet,
4098     .write_trailer     = mov_write_trailer,
4099     .flags             = AVFMT_GLOBALHEADER | AVFMT_ALLOW_FLUSH | AVFMT_TS_NEGATIVE,
4100     .codec_tag         = (const AVCodecTag* const []){ ff_mp4_obj_type, 0 },
4101     .priv_class        = &mp4_muxer_class,
4102 };
4103 #endif
4104 #if CONFIG_PSP_MUXER
4105 MOV_CLASS(psp)
4106 AVOutputFormat ff_psp_muxer = {
4107     .name              = "psp",
4108     .long_name         = NULL_IF_CONFIG_SMALL("PSP MP4 (MPEG-4 Part 14)"),
4109     .extensions        = "mp4,psp",
4110     .priv_data_size    = sizeof(MOVMuxContext),
4111     .audio_codec       = AV_CODEC_ID_AAC,
4112     .video_codec       = CONFIG_LIBX264_ENCODER ?
4113                          AV_CODEC_ID_H264 : AV_CODEC_ID_MPEG4,
4114     .write_header      = mov_write_header,
4115     .write_packet      = mov_write_packet,
4116     .write_trailer     = mov_write_trailer,
4117     .flags             = AVFMT_GLOBALHEADER | AVFMT_ALLOW_FLUSH | AVFMT_TS_NEGATIVE,
4118     .codec_tag         = (const AVCodecTag* const []){ ff_mp4_obj_type, 0 },
4119     .priv_class        = &psp_muxer_class,
4120 };
4121 #endif
4122 #if CONFIG_TG2_MUXER
4123 MOV_CLASS(tg2)
4124 AVOutputFormat ff_tg2_muxer = {
4125     .name              = "3g2",
4126     .long_name         = NULL_IF_CONFIG_SMALL("3GP2 (3GPP2 file format)"),
4127     .extensions        = "3g2",
4128     .priv_data_size    = sizeof(MOVMuxContext),
4129     .audio_codec       = AV_CODEC_ID_AMR_NB,
4130     .video_codec       = AV_CODEC_ID_H263,
4131     .write_header      = mov_write_header,
4132     .write_packet      = mov_write_packet,
4133     .write_trailer     = mov_write_trailer,
4134     .flags             = AVFMT_GLOBALHEADER | AVFMT_ALLOW_FLUSH | AVFMT_TS_NEGATIVE,
4135     .codec_tag         = (const AVCodecTag* const []){ codec_3gp_tags, 0 },
4136     .priv_class        = &tg2_muxer_class,
4137 };
4138 #endif
4139 #if CONFIG_IPOD_MUXER
4140 MOV_CLASS(ipod)
4141 AVOutputFormat ff_ipod_muxer = {
4142     .name              = "ipod",
4143     .long_name         = NULL_IF_CONFIG_SMALL("iPod H.264 MP4 (MPEG-4 Part 14)"),
4144     .mime_type         = "application/mp4",
4145     .extensions        = "m4v,m4a",
4146     .priv_data_size    = sizeof(MOVMuxContext),
4147     .audio_codec       = AV_CODEC_ID_AAC,
4148     .video_codec       = AV_CODEC_ID_H264,
4149     .write_header      = mov_write_header,
4150     .write_packet      = mov_write_packet,
4151     .write_trailer     = mov_write_trailer,
4152     .flags             = AVFMT_GLOBALHEADER | AVFMT_ALLOW_FLUSH | AVFMT_TS_NEGATIVE,
4153     .codec_tag         = (const AVCodecTag* const []){ codec_ipod_tags, 0 },
4154     .priv_class        = &ipod_muxer_class,
4155 };
4156 #endif
4157 #if CONFIG_ISMV_MUXER
4158 MOV_CLASS(ismv)
4159 AVOutputFormat ff_ismv_muxer = {
4160     .name              = "ismv",
4161     .long_name         = NULL_IF_CONFIG_SMALL("ISMV/ISMA (Smooth Streaming)"),
4162     .mime_type         = "application/mp4",
4163     .extensions        = "ismv,isma",
4164     .priv_data_size    = sizeof(MOVMuxContext),
4165     .audio_codec       = AV_CODEC_ID_AAC,
4166     .video_codec       = AV_CODEC_ID_H264,
4167     .write_header      = mov_write_header,
4168     .write_packet      = mov_write_packet,
4169     .write_trailer     = mov_write_trailer,
4170     .flags             = AVFMT_GLOBALHEADER | AVFMT_ALLOW_FLUSH | AVFMT_TS_NEGATIVE,
4171     .codec_tag         = (const AVCodecTag* const []){ ff_mp4_obj_type, 0 },
4172     .priv_class        = &ismv_muxer_class,
4173 };
4174 #endif
4175 #if CONFIG_F4V_MUXER
4176 MOV_CLASS(f4v)
4177 AVOutputFormat ff_f4v_muxer = {
4178     .name              = "f4v",
4179     .long_name         = NULL_IF_CONFIG_SMALL("F4V Adobe Flash Video"),
4180     .mime_type         = "application/f4v",
4181     .extensions        = "f4v",
4182     .priv_data_size    = sizeof(MOVMuxContext),
4183     .audio_codec       = AV_CODEC_ID_AAC,
4184     .video_codec       = AV_CODEC_ID_H264,
4185     .write_header      = mov_write_header,
4186     .write_packet      = mov_write_packet,
4187     .write_trailer     = mov_write_trailer,
4188     .flags             = AVFMT_GLOBALHEADER | AVFMT_ALLOW_FLUSH | AVFMT_TS_NEGATIVE,
4189     .codec_tag         = (const AVCodecTag* const []){ codec_f4v_tags, 0 },
4190     .priv_class        = &f4v_muxer_class,
4191 };
4192 #endif