]> git.sesse.net Git - ffmpeg/blob - libavformat/matroskaenc.c
avformat/matroskaenc: write a DisplayUnit element when aspect ratio is unknown
[ffmpeg] / libavformat / matroskaenc.c
1 /*
2  * Matroska muxer
3  * Copyright (c) 2007 David Conrad
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include <stdint.h>
23
24 #include "avc.h"
25 #include "hevc.h"
26 #include "avformat.h"
27 #include "avio_internal.h"
28 #include "avlanguage.h"
29 #include "flacenc.h"
30 #include "internal.h"
31 #include "isom.h"
32 #include "matroska.h"
33 #include "riff.h"
34 #include "subtitles.h"
35 #include "vorbiscomment.h"
36 #include "wv.h"
37
38 #include "libavutil/avstring.h"
39 #include "libavutil/channel_layout.h"
40 #include "libavutil/crc.h"
41 #include "libavutil/dict.h"
42 #include "libavutil/intfloat.h"
43 #include "libavutil/intreadwrite.h"
44 #include "libavutil/lfg.h"
45 #include "libavutil/mastering_display_metadata.h"
46 #include "libavutil/mathematics.h"
47 #include "libavutil/opt.h"
48 #include "libavutil/parseutils.h"
49 #include "libavutil/random_seed.h"
50 #include "libavutil/rational.h"
51 #include "libavutil/samplefmt.h"
52 #include "libavutil/sha.h"
53 #include "libavutil/stereo3d.h"
54
55 #include "libavcodec/xiph.h"
56 #include "libavcodec/mpeg4audio.h"
57 #include "libavcodec/internal.h"
58
59 typedef struct ebml_master {
60     int64_t         pos;                ///< absolute offset in the file where the master's elements start
61     int             sizebytes;          ///< how many bytes were reserved for the size
62 } ebml_master;
63
64 typedef struct mkv_seekhead_entry {
65     unsigned int    elementid;
66     uint64_t        segmentpos;
67 } mkv_seekhead_entry;
68
69 typedef struct mkv_seekhead {
70     int64_t                 filepos;
71     int64_t                 segment_offset;     ///< the file offset to the beginning of the segment
72     int                     reserved_size;      ///< -1 if appending to file
73     int                     max_entries;
74     mkv_seekhead_entry      *entries;
75     int                     num_entries;
76 } mkv_seekhead;
77
78 typedef struct mkv_cuepoint {
79     uint64_t        pts;
80     int             stream_idx;
81     int             tracknum;
82     int64_t         cluster_pos;        ///< file offset of the cluster containing the block
83     int64_t         relative_pos;       ///< relative offset from the position of the cluster containing the block
84     int64_t         duration;           ///< duration of the block according to time base
85 } mkv_cuepoint;
86
87 typedef struct mkv_cues {
88     int64_t         segment_offset;
89     mkv_cuepoint    *entries;
90     int             num_entries;
91 } mkv_cues;
92
93 typedef struct mkv_track {
94     int             write_dts;
95     int             has_cue;
96     int64_t         ts_offset;
97 } mkv_track;
98
99 typedef struct mkv_attachment {
100     int             stream_idx;
101     uint32_t        fileuid;
102 } mkv_attachment;
103
104 typedef struct mkv_attachments {
105     mkv_attachment  *entries;
106     int             num_entries;
107 } mkv_attachments;
108
109 #define MODE_MATROSKAv2 0x01
110 #define MODE_WEBM       0x02
111
112 /** Maximum number of tracks allowed in a Matroska file (with track numbers in
113  * range 1 to 126 (inclusive) */
114 #define MAX_TRACKS 126
115
116 typedef struct MatroskaMuxContext {
117     const AVClass  *class;
118     int             mode;
119     AVIOContext   *dyn_bc;
120     AVIOContext     *tags_bc;
121     ebml_master     tags;
122     AVIOContext     *info_bc;
123     ebml_master     info;
124     ebml_master     segment;
125     int64_t         segment_offset;
126     ebml_master     cluster;
127     int64_t         cluster_pos;        ///< file offset of the current cluster
128     int64_t         cluster_pts;
129     int64_t         duration_offset;
130     int64_t         duration;
131     mkv_seekhead    *main_seekhead;
132     mkv_cues        *cues;
133     mkv_track       *tracks;
134     mkv_attachments *attachments;
135
136     AVPacket        cur_audio_pkt;
137
138     int have_attachments;
139     int have_video;
140
141     int reserve_cues_space;
142     int cluster_size_limit;
143     int64_t cues_pos;
144     int64_t cluster_time_limit;
145     int is_dash;
146     int dash_track_number;
147     int is_live;
148     int write_crc;
149
150     uint32_t chapter_id_offset;
151     int wrote_chapters;
152
153     int64_t last_track_timestamp[MAX_TRACKS];
154
155     int64_t* stream_durations;
156     int64_t* stream_duration_offsets;
157
158     int allow_raw_vfw;
159 } MatroskaMuxContext;
160
161
162 /** 2 bytes * 3 for EBML IDs, 3 1-byte EBML lengths, 8 bytes for 64 bit
163  * offset, 4 bytes for target EBML ID */
164 #define MAX_SEEKENTRY_SIZE 21
165
166 /** per-cuepoint-track - 5 1-byte EBML IDs, 5 1-byte EBML sizes, 4
167  * 8-byte uint max */
168 #define MAX_CUETRACKPOS_SIZE 42
169
170 /** per-cuepoint - 2 1-byte EBML IDs, 2 1-byte EBML sizes, 8-byte uint max */
171 #define MAX_CUEPOINT_SIZE(num_tracks) 12 + MAX_CUETRACKPOS_SIZE * num_tracks
172
173 /** Seek preroll value for opus */
174 #define OPUS_SEEK_PREROLL 80000000
175
176 static int ebml_id_size(unsigned int id)
177 {
178     return (av_log2(id + 1) - 1) / 7 + 1;
179 }
180
181 static void put_ebml_id(AVIOContext *pb, unsigned int id)
182 {
183     int i = ebml_id_size(id);
184     while (i--)
185         avio_w8(pb, (uint8_t)(id >> (i * 8)));
186 }
187
188 /**
189  * Write an EBML size meaning "unknown size".
190  *
191  * @param bytes The number of bytes the size should occupy (maximum: 8).
192  */
193 static void put_ebml_size_unknown(AVIOContext *pb, int bytes)
194 {
195     av_assert0(bytes <= 8);
196     avio_w8(pb, 0x1ff >> bytes);
197     ffio_fill(pb, 0xff, bytes - 1);
198 }
199
200 /**
201  * Calculate how many bytes are needed to represent a given number in EBML.
202  */
203 static int ebml_num_size(uint64_t num)
204 {
205     int bytes = 1;
206     while ((num + 1) >> bytes * 7)
207         bytes++;
208     return bytes;
209 }
210
211 /**
212  * Write a number in EBML variable length format.
213  *
214  * @param bytes The number of bytes that need to be used to write the number.
215  *              If zero, any number of bytes can be used.
216  */
217 static void put_ebml_num(AVIOContext *pb, uint64_t num, int bytes)
218 {
219     int i, needed_bytes = ebml_num_size(num);
220
221     // sizes larger than this are currently undefined in EBML
222     av_assert0(num < (1ULL << 56) - 1);
223
224     if (bytes == 0)
225         // don't care how many bytes are used, so use the min
226         bytes = needed_bytes;
227     // the bytes needed to write the given size would exceed the bytes
228     // that we need to use, so write unknown size. This shouldn't happen.
229     av_assert0(bytes >= needed_bytes);
230
231     num |= 1ULL << bytes * 7;
232     for (i = bytes - 1; i >= 0; i--)
233         avio_w8(pb, (uint8_t)(num >> i * 8));
234 }
235
236 static void put_ebml_uint(AVIOContext *pb, unsigned int elementid, uint64_t val)
237 {
238     int i, bytes = 1;
239     uint64_t tmp = val;
240     while (tmp >>= 8)
241         bytes++;
242
243     put_ebml_id(pb, elementid);
244     put_ebml_num(pb, bytes, 0);
245     for (i = bytes - 1; i >= 0; i--)
246         avio_w8(pb, (uint8_t)(val >> i * 8));
247 }
248
249 static void put_ebml_sint(AVIOContext *pb, unsigned int elementid, int64_t val)
250 {
251     int i, bytes = 1;
252     uint64_t tmp = 2*(val < 0 ? val^-1 : val);
253
254     while (tmp>>=8) bytes++;
255
256     put_ebml_id(pb, elementid);
257     put_ebml_num(pb, bytes, 0);
258     for (i = bytes - 1; i >= 0; i--)
259         avio_w8(pb, (uint8_t)(val >> i * 8));
260 }
261
262 static void put_ebml_float(AVIOContext *pb, unsigned int elementid, double val)
263 {
264     put_ebml_id(pb, elementid);
265     put_ebml_num(pb, 8, 0);
266     avio_wb64(pb, av_double2int(val));
267 }
268
269 static void put_ebml_binary(AVIOContext *pb, unsigned int elementid,
270                             const void *buf, int size)
271 {
272     put_ebml_id(pb, elementid);
273     put_ebml_num(pb, size, 0);
274     avio_write(pb, buf, size);
275 }
276
277 static void put_ebml_string(AVIOContext *pb, unsigned int elementid,
278                             const char *str)
279 {
280     put_ebml_binary(pb, elementid, str, strlen(str));
281 }
282
283 /**
284  * Write a void element of a given size. Useful for reserving space in
285  * the file to be written to later.
286  *
287  * @param size The number of bytes to reserve, which must be at least 2.
288  */
289 static void put_ebml_void(AVIOContext *pb, uint64_t size)
290 {
291     int64_t currentpos = avio_tell(pb);
292
293     av_assert0(size >= 2);
294
295     put_ebml_id(pb, EBML_ID_VOID);
296     // we need to subtract the length needed to store the size from the
297     // size we need to reserve so 2 cases, we use 8 bytes to store the
298     // size if possible, 1 byte otherwise
299     if (size < 10)
300         put_ebml_num(pb, size - 2, 0);
301     else
302         put_ebml_num(pb, size - 9, 8);
303     ffio_fill(pb, 0, currentpos + size - avio_tell(pb));
304 }
305
306 static ebml_master start_ebml_master(AVIOContext *pb, unsigned int elementid,
307                                      uint64_t expectedsize)
308 {
309     int bytes = expectedsize ? ebml_num_size(expectedsize) : 8;
310     put_ebml_id(pb, elementid);
311     put_ebml_size_unknown(pb, bytes);
312     return (ebml_master) {avio_tell(pb), bytes };
313 }
314
315 static void end_ebml_master(AVIOContext *pb, ebml_master master)
316 {
317     int64_t pos = avio_tell(pb);
318
319     if (avio_seek(pb, master.pos - master.sizebytes, SEEK_SET) < 0)
320         return;
321     put_ebml_num(pb, pos - master.pos, master.sizebytes);
322     avio_seek(pb, pos, SEEK_SET);
323 }
324
325 static int start_ebml_master_crc32(AVIOContext *pb, AVIOContext **dyn_cp, ebml_master *master,
326                                    unsigned int elementid, uint64_t expectedsize)
327 {
328     int ret;
329
330     if ((ret = avio_open_dyn_buf(dyn_cp)) < 0)
331         return ret;
332
333     if (pb->seekable)
334         *master = start_ebml_master(pb, elementid, expectedsize);
335     else
336         *master = start_ebml_master(*dyn_cp, elementid, expectedsize);
337
338     return 0;
339 }
340
341 static void end_ebml_master_crc32(AVIOContext *pb, AVIOContext **dyn_cp, MatroskaMuxContext *mkv,
342                                   ebml_master master)
343 {
344     uint8_t *buf, crc[4];
345     int size;
346
347     if (pb->seekable) {
348         size = avio_close_dyn_buf(*dyn_cp, &buf);
349         if (mkv->write_crc && mkv->mode != MODE_WEBM) {
350             AV_WL32(crc, av_crc(av_crc_get_table(AV_CRC_32_IEEE_LE), UINT32_MAX, buf, size) ^ UINT32_MAX);
351             put_ebml_binary(pb, EBML_ID_CRC32, crc, sizeof(crc));
352         }
353         avio_write(pb, buf, size);
354         end_ebml_master(pb, master);
355     } else {
356         end_ebml_master(*dyn_cp, master);
357         size = avio_close_dyn_buf(*dyn_cp, &buf);
358         avio_write(pb, buf, size);
359     }
360     av_free(buf);
361     *dyn_cp = NULL;
362 }
363
364 static void put_xiph_size(AVIOContext *pb, int size)
365 {
366     ffio_fill(pb, 255, size / 255);
367     avio_w8(pb, size % 255);
368 }
369
370 /**
371  * Free the members allocated in the mux context.
372  */
373 static void mkv_free(MatroskaMuxContext *mkv) {
374     if (mkv->main_seekhead) {
375         av_freep(&mkv->main_seekhead->entries);
376         av_freep(&mkv->main_seekhead);
377     }
378     if (mkv->cues) {
379         av_freep(&mkv->cues->entries);
380         av_freep(&mkv->cues);
381     }
382     if (mkv->attachments) {
383         av_freep(&mkv->attachments->entries);
384         av_freep(&mkv->attachments);
385     }
386     av_freep(&mkv->tracks);
387     av_freep(&mkv->stream_durations);
388     av_freep(&mkv->stream_duration_offsets);
389 }
390
391 /**
392  * Initialize a mkv_seekhead element to be ready to index level 1 Matroska
393  * elements. If a maximum number of elements is specified, enough space
394  * will be reserved at the current file location to write a seek head of
395  * that size.
396  *
397  * @param segment_offset The absolute offset to the position in the file
398  *                       where the segment begins.
399  * @param numelements The maximum number of elements that will be indexed
400  *                    by this seek head, 0 if unlimited.
401  */
402 static mkv_seekhead *mkv_start_seekhead(AVIOContext *pb, int64_t segment_offset,
403                                         int numelements)
404 {
405     mkv_seekhead *new_seekhead = av_mallocz(sizeof(mkv_seekhead));
406     if (!new_seekhead)
407         return NULL;
408
409     new_seekhead->segment_offset = segment_offset;
410
411     if (numelements > 0) {
412         new_seekhead->filepos = avio_tell(pb);
413         // 21 bytes max for a seek entry, 10 bytes max for the SeekHead ID
414         // and size, 6 bytes for a CRC32 element, and 3 bytes to guarantee
415         // that an EBML void element will fit afterwards
416         new_seekhead->reserved_size = numelements * MAX_SEEKENTRY_SIZE + 19;
417         new_seekhead->max_entries   = numelements;
418         put_ebml_void(pb, new_seekhead->reserved_size);
419     }
420     return new_seekhead;
421 }
422
423 static int mkv_add_seekhead_entry(mkv_seekhead *seekhead, unsigned int elementid, uint64_t filepos)
424 {
425     mkv_seekhead_entry *entries = seekhead->entries;
426
427     // don't store more elements than we reserved space for
428     if (seekhead->max_entries > 0 && seekhead->max_entries <= seekhead->num_entries)
429         return -1;
430
431     entries = av_realloc_array(entries, seekhead->num_entries + 1, sizeof(mkv_seekhead_entry));
432     if (!entries)
433         return AVERROR(ENOMEM);
434     seekhead->entries = entries;
435
436     seekhead->entries[seekhead->num_entries].elementid    = elementid;
437     seekhead->entries[seekhead->num_entries++].segmentpos = filepos - seekhead->segment_offset;
438
439     return 0;
440 }
441
442 /**
443  * Write the seek head to the file and free it. If a maximum number of
444  * elements was specified to mkv_start_seekhead(), the seek head will
445  * be written at the location reserved for it. Otherwise, it is written
446  * at the current location in the file.
447  *
448  * @return The file offset where the seekhead was written,
449  * -1 if an error occurred.
450  */
451 static int64_t mkv_write_seekhead(AVIOContext *pb, MatroskaMuxContext *mkv)
452 {
453     AVIOContext *dyn_cp;
454     mkv_seekhead *seekhead = mkv->main_seekhead;
455     ebml_master metaseek, seekentry;
456     int64_t currentpos;
457     int i;
458
459     currentpos = avio_tell(pb);
460
461     if (seekhead->reserved_size > 0) {
462         if (avio_seek(pb, seekhead->filepos, SEEK_SET) < 0) {
463             currentpos = -1;
464             goto fail;
465         }
466     }
467
468     if (start_ebml_master_crc32(pb, &dyn_cp, &metaseek, MATROSKA_ID_SEEKHEAD,
469                                 seekhead->reserved_size) < 0) {
470         currentpos = -1;
471         goto fail;
472     }
473
474     for (i = 0; i < seekhead->num_entries; i++) {
475         mkv_seekhead_entry *entry = &seekhead->entries[i];
476
477         seekentry = start_ebml_master(dyn_cp, MATROSKA_ID_SEEKENTRY, MAX_SEEKENTRY_SIZE);
478
479         put_ebml_id(dyn_cp, MATROSKA_ID_SEEKID);
480         put_ebml_num(dyn_cp, ebml_id_size(entry->elementid), 0);
481         put_ebml_id(dyn_cp, entry->elementid);
482
483         put_ebml_uint(dyn_cp, MATROSKA_ID_SEEKPOSITION, entry->segmentpos);
484         end_ebml_master(dyn_cp, seekentry);
485     }
486     end_ebml_master_crc32(pb, &dyn_cp, mkv, metaseek);
487
488     if (seekhead->reserved_size > 0) {
489         uint64_t remaining = seekhead->filepos + seekhead->reserved_size - avio_tell(pb);
490         put_ebml_void(pb, remaining);
491         avio_seek(pb, currentpos, SEEK_SET);
492
493         currentpos = seekhead->filepos;
494     }
495 fail:
496     av_freep(&mkv->main_seekhead->entries);
497     av_freep(&mkv->main_seekhead);
498
499     return currentpos;
500 }
501
502 static mkv_cues *mkv_start_cues(int64_t segment_offset)
503 {
504     mkv_cues *cues = av_mallocz(sizeof(mkv_cues));
505     if (!cues)
506         return NULL;
507
508     cues->segment_offset = segment_offset;
509     return cues;
510 }
511
512 static int mkv_add_cuepoint(mkv_cues *cues, int stream, int tracknum, int64_t ts,
513                             int64_t cluster_pos, int64_t relative_pos, int64_t duration)
514 {
515     mkv_cuepoint *entries = cues->entries;
516
517     if (ts < 0)
518         return 0;
519
520     entries = av_realloc_array(entries, cues->num_entries + 1, sizeof(mkv_cuepoint));
521     if (!entries)
522         return AVERROR(ENOMEM);
523     cues->entries = entries;
524
525     cues->entries[cues->num_entries].pts           = ts;
526     cues->entries[cues->num_entries].stream_idx    = stream;
527     cues->entries[cues->num_entries].tracknum      = tracknum;
528     cues->entries[cues->num_entries].cluster_pos   = cluster_pos - cues->segment_offset;
529     cues->entries[cues->num_entries].relative_pos  = relative_pos;
530     cues->entries[cues->num_entries++].duration    = duration;
531
532     return 0;
533 }
534
535 static int64_t mkv_write_cues(AVFormatContext *s, mkv_cues *cues, mkv_track *tracks, int num_tracks)
536 {
537     MatroskaMuxContext *mkv = s->priv_data;
538     AVIOContext *dyn_cp, *pb = s->pb;
539     ebml_master cues_element;
540     int64_t currentpos;
541     int i, j, ret;
542
543     currentpos = avio_tell(pb);
544     ret = start_ebml_master_crc32(pb, &dyn_cp, &cues_element, MATROSKA_ID_CUES, 0);
545     if (ret < 0)
546         return ret;
547
548     for (i = 0; i < cues->num_entries; i++) {
549         ebml_master cuepoint, track_positions;
550         mkv_cuepoint *entry = &cues->entries[i];
551         uint64_t pts = entry->pts;
552         int ctp_nb = 0;
553
554         // Calculate the number of entries, so we know the element size
555         for (j = 0; j < num_tracks; j++)
556             tracks[j].has_cue = 0;
557         for (j = 0; j < cues->num_entries - i && entry[j].pts == pts; j++) {
558             int tracknum = entry[j].stream_idx;
559             av_assert0(tracknum>=0 && tracknum<num_tracks);
560             if (tracks[tracknum].has_cue && s->streams[tracknum]->codecpar->codec_type != AVMEDIA_TYPE_SUBTITLE)
561                 continue;
562             tracks[tracknum].has_cue = 1;
563             ctp_nb ++;
564         }
565
566         cuepoint = start_ebml_master(dyn_cp, MATROSKA_ID_POINTENTRY, MAX_CUEPOINT_SIZE(ctp_nb));
567         put_ebml_uint(dyn_cp, MATROSKA_ID_CUETIME, pts);
568
569         // put all the entries from different tracks that have the exact same
570         // timestamp into the same CuePoint
571         for (j = 0; j < num_tracks; j++)
572             tracks[j].has_cue = 0;
573         for (j = 0; j < cues->num_entries - i && entry[j].pts == pts; j++) {
574             int tracknum = entry[j].stream_idx;
575             av_assert0(tracknum>=0 && tracknum<num_tracks);
576             if (tracks[tracknum].has_cue && s->streams[tracknum]->codecpar->codec_type != AVMEDIA_TYPE_SUBTITLE)
577                 continue;
578             tracks[tracknum].has_cue = 1;
579             track_positions = start_ebml_master(dyn_cp, MATROSKA_ID_CUETRACKPOSITION, MAX_CUETRACKPOS_SIZE);
580             put_ebml_uint(dyn_cp, MATROSKA_ID_CUETRACK           , entry[j].tracknum   );
581             put_ebml_uint(dyn_cp, MATROSKA_ID_CUECLUSTERPOSITION , entry[j].cluster_pos);
582             put_ebml_uint(dyn_cp, MATROSKA_ID_CUERELATIVEPOSITION, entry[j].relative_pos);
583             if (entry[j].duration != -1)
584                 put_ebml_uint(dyn_cp, MATROSKA_ID_CUEDURATION    , entry[j].duration);
585             end_ebml_master(dyn_cp, track_positions);
586         }
587         i += j - 1;
588         end_ebml_master(dyn_cp, cuepoint);
589     }
590     end_ebml_master_crc32(pb, &dyn_cp, mkv, cues_element);
591
592     return currentpos;
593 }
594
595 static int put_xiph_codecpriv(AVFormatContext *s, AVIOContext *pb, AVCodecParameters *par)
596 {
597     const uint8_t *header_start[3];
598     int header_len[3];
599     int first_header_size;
600     int j;
601
602     if (par->codec_id == AV_CODEC_ID_VORBIS)
603         first_header_size = 30;
604     else
605         first_header_size = 42;
606
607     if (avpriv_split_xiph_headers(par->extradata, par->extradata_size,
608                               first_header_size, header_start, header_len) < 0) {
609         av_log(s, AV_LOG_ERROR, "Extradata corrupt.\n");
610         return -1;
611     }
612
613     avio_w8(pb, 2);                    // number packets - 1
614     for (j = 0; j < 2; j++) {
615         put_xiph_size(pb, header_len[j]);
616     }
617     for (j = 0; j < 3; j++)
618         avio_write(pb, header_start[j], header_len[j]);
619
620     return 0;
621 }
622
623 static int put_wv_codecpriv(AVIOContext *pb, AVCodecParameters *par)
624 {
625     if (par->extradata && par->extradata_size == 2)
626         avio_write(pb, par->extradata, 2);
627     else
628         avio_wl16(pb, 0x403); // fallback to the version mentioned in matroska specs
629     return 0;
630 }
631
632 static int put_flac_codecpriv(AVFormatContext *s,
633                               AVIOContext *pb, AVCodecParameters *par)
634 {
635     int write_comment = (par->channel_layout &&
636                          !(par->channel_layout & ~0x3ffffULL) &&
637                          !ff_flac_is_native_layout(par->channel_layout));
638     int ret = ff_flac_write_header(pb, par->extradata, par->extradata_size,
639                                    !write_comment);
640
641     if (ret < 0)
642         return ret;
643
644     if (write_comment) {
645         const char *vendor = (s->flags & AVFMT_FLAG_BITEXACT) ?
646                              "Lavf" : LIBAVFORMAT_IDENT;
647         AVDictionary *dict = NULL;
648         uint8_t buf[32], *data, *p;
649         int64_t len;
650
651         snprintf(buf, sizeof(buf), "0x%"PRIx64, par->channel_layout);
652         av_dict_set(&dict, "WAVEFORMATEXTENSIBLE_CHANNEL_MASK", buf, 0);
653
654         len = ff_vorbiscomment_length(dict, vendor);
655         if (len >= ((1<<24) - 4))
656             return AVERROR(EINVAL);
657
658         data = av_malloc(len + 4);
659         if (!data) {
660             av_dict_free(&dict);
661             return AVERROR(ENOMEM);
662         }
663
664         data[0] = 0x84;
665         AV_WB24(data + 1, len);
666
667         p = data + 4;
668         ff_vorbiscomment_write(&p, &dict, vendor);
669
670         avio_write(pb, data, len + 4);
671
672         av_freep(&data);
673         av_dict_free(&dict);
674     }
675
676     return 0;
677 }
678
679 static int get_aac_sample_rates(AVFormatContext *s, AVCodecParameters *par,
680                                 int *sample_rate, int *output_sample_rate)
681 {
682     MPEG4AudioConfig mp4ac;
683
684     if (avpriv_mpeg4audio_get_config(&mp4ac, par->extradata,
685                                      par->extradata_size * 8, 1) < 0) {
686         av_log(s, AV_LOG_ERROR,
687                "Error parsing AAC extradata, unable to determine samplerate.\n");
688         return AVERROR(EINVAL);
689     }
690
691     *sample_rate        = mp4ac.sample_rate;
692     *output_sample_rate = mp4ac.ext_sample_rate;
693     return 0;
694 }
695
696 static int mkv_write_native_codecprivate(AVFormatContext *s,
697                                          AVCodecParameters *par,
698                                          AVIOContext *dyn_cp)
699 {
700     switch (par->codec_id) {
701     case AV_CODEC_ID_VORBIS:
702     case AV_CODEC_ID_THEORA:
703         return put_xiph_codecpriv(s, dyn_cp, par);
704     case AV_CODEC_ID_FLAC:
705         return put_flac_codecpriv(s, dyn_cp, par);
706     case AV_CODEC_ID_WAVPACK:
707         return put_wv_codecpriv(dyn_cp, par);
708     case AV_CODEC_ID_H264:
709         return ff_isom_write_avcc(dyn_cp, par->extradata,
710                                   par->extradata_size);
711     case AV_CODEC_ID_HEVC:
712         ff_isom_write_hvcc(dyn_cp, par->extradata,
713                            par->extradata_size, 0);
714         return 0;
715     case AV_CODEC_ID_ALAC:
716         if (par->extradata_size < 36) {
717             av_log(s, AV_LOG_ERROR,
718                    "Invalid extradata found, ALAC expects a 36-byte "
719                    "QuickTime atom.");
720             return AVERROR_INVALIDDATA;
721         } else
722             avio_write(dyn_cp, par->extradata + 12,
723                        par->extradata_size - 12);
724         break;
725     default:
726         if (par->codec_id == AV_CODEC_ID_PRORES &&
727             ff_codec_get_id(ff_codec_movvideo_tags, par->codec_tag) == AV_CODEC_ID_PRORES) {
728             avio_wl32(dyn_cp, par->codec_tag);
729         } else if (par->extradata_size && par->codec_id != AV_CODEC_ID_TTA)
730             avio_write(dyn_cp, par->extradata, par->extradata_size);
731     }
732
733     return 0;
734 }
735
736 static int mkv_write_codecprivate(AVFormatContext *s, AVIOContext *pb,
737                                   AVCodecParameters *par,
738                                   int native_id, int qt_id)
739 {
740     AVIOContext *dyn_cp;
741     uint8_t *codecpriv;
742     int ret, codecpriv_size;
743
744     ret = avio_open_dyn_buf(&dyn_cp);
745     if (ret < 0)
746         return ret;
747
748     if (native_id) {
749         ret = mkv_write_native_codecprivate(s, par, dyn_cp);
750     } else if (par->codec_type == AVMEDIA_TYPE_VIDEO) {
751         if (qt_id) {
752             if (!par->codec_tag)
753                 par->codec_tag = ff_codec_get_tag(ff_codec_movvideo_tags,
754                                                     par->codec_id);
755                 if (   ff_codec_get_id(ff_codec_movvideo_tags, par->codec_tag) == par->codec_id
756                     && (!par->extradata_size || ff_codec_get_id(ff_codec_movvideo_tags, AV_RL32(par->extradata + 4)) != par->codec_id)
757                 ) {
758                     int i;
759                     avio_wb32(dyn_cp, 0x5a + par->extradata_size);
760                     avio_wl32(dyn_cp, par->codec_tag);
761                     for(i = 0; i < 0x5a - 8; i++)
762                         avio_w8(dyn_cp, 0);
763                 }
764                 avio_write(dyn_cp, par->extradata, par->extradata_size);
765         } else {
766             if (!ff_codec_get_tag(ff_codec_bmp_tags, par->codec_id))
767                 av_log(s, AV_LOG_WARNING, "codec %s is not supported by this format\n",
768                        avcodec_get_name(par->codec_id));
769
770             if (!par->codec_tag)
771                 par->codec_tag = ff_codec_get_tag(ff_codec_bmp_tags,
772                                                   par->codec_id);
773             if (!par->codec_tag && par->codec_id != AV_CODEC_ID_RAWVIDEO) {
774                 av_log(s, AV_LOG_ERROR, "No bmp codec tag found for codec %s\n",
775                        avcodec_get_name(par->codec_id));
776                 ret = AVERROR(EINVAL);
777             }
778
779             ff_put_bmp_header(dyn_cp, par, ff_codec_bmp_tags, 0, 0);
780         }
781     } else if (par->codec_type == AVMEDIA_TYPE_AUDIO) {
782         unsigned int tag;
783         tag = ff_codec_get_tag(ff_codec_wav_tags, par->codec_id);
784         if (!tag) {
785             av_log(s, AV_LOG_ERROR, "No wav codec tag found for codec %s\n",
786                    avcodec_get_name(par->codec_id));
787             ret = AVERROR(EINVAL);
788         }
789         if (!par->codec_tag)
790             par->codec_tag = tag;
791
792         ff_put_wav_header(s, dyn_cp, par, FF_PUT_WAV_HEADER_FORCE_WAVEFORMATEX);
793     }
794
795     codecpriv_size = avio_close_dyn_buf(dyn_cp, &codecpriv);
796     if (codecpriv_size)
797         put_ebml_binary(pb, MATROSKA_ID_CODECPRIVATE, codecpriv,
798                         codecpriv_size);
799     av_free(codecpriv);
800     return ret;
801 }
802
803 static int mkv_write_video_color(AVIOContext *pb, AVCodecParameters *par, AVStream *st) {
804     AVIOContext *dyn_cp;
805     uint8_t *colorinfo_ptr;
806     int side_data_size = 0;
807     int ret, colorinfo_size;
808     const uint8_t *side_data = av_stream_get_side_data(
809         st, AV_PKT_DATA_MASTERING_DISPLAY_METADATA, &side_data_size);
810
811     ret = avio_open_dyn_buf(&dyn_cp);
812     if (ret < 0)
813         return ret;
814
815     if (par->color_trc != AVCOL_TRC_UNSPECIFIED &&
816         par->color_trc < AVCOL_TRC_NB) {
817         put_ebml_uint(dyn_cp, MATROSKA_ID_VIDEOCOLORTRANSFERCHARACTERISTICS,
818                       par->color_trc);
819     }
820     if (par->color_space != AVCOL_SPC_UNSPECIFIED &&
821         par->color_space < AVCOL_SPC_NB) {
822         put_ebml_uint(dyn_cp, MATROSKA_ID_VIDEOCOLORMATRIXCOEFF, par->color_space);
823     }
824     if (par->color_primaries != AVCOL_PRI_UNSPECIFIED &&
825         par->color_primaries < AVCOL_PRI_NB) {
826         put_ebml_uint(dyn_cp, MATROSKA_ID_VIDEOCOLORPRIMARIES, par->color_primaries);
827     }
828     if (par->color_range != AVCOL_RANGE_UNSPECIFIED &&
829         par->color_range < AVCOL_RANGE_NB) {
830         put_ebml_uint(dyn_cp, MATROSKA_ID_VIDEOCOLORRANGE, par->color_range);
831     }
832     if (side_data_size == sizeof(AVMasteringDisplayMetadata)) {
833         ebml_master meta_element = start_ebml_master(
834             dyn_cp, MATROSKA_ID_VIDEOCOLORMASTERINGMETA, 0);
835         const AVMasteringDisplayMetadata *metadata =
836             (const AVMasteringDisplayMetadata*)side_data;
837         if (metadata->has_primaries) {
838             put_ebml_float(dyn_cp, MATROSKA_ID_VIDEOCOLOR_RX,
839                            av_q2d(metadata->display_primaries[0][0]));
840             put_ebml_float(dyn_cp, MATROSKA_ID_VIDEOCOLOR_RY,
841                            av_q2d(metadata->display_primaries[0][1]));
842             put_ebml_float(dyn_cp, MATROSKA_ID_VIDEOCOLOR_GX,
843                            av_q2d(metadata->display_primaries[1][0]));
844             put_ebml_float(dyn_cp, MATROSKA_ID_VIDEOCOLOR_GY,
845                            av_q2d(metadata->display_primaries[1][1]));
846             put_ebml_float(dyn_cp, MATROSKA_ID_VIDEOCOLOR_BX,
847                            av_q2d(metadata->display_primaries[2][0]));
848             put_ebml_float(dyn_cp, MATROSKA_ID_VIDEOCOLOR_BY,
849                            av_q2d(metadata->display_primaries[2][1]));
850             put_ebml_float(dyn_cp, MATROSKA_ID_VIDEOCOLOR_WHITEX,
851                            av_q2d(metadata->white_point[0]));
852             put_ebml_float(dyn_cp, MATROSKA_ID_VIDEOCOLOR_WHITEY,
853                            av_q2d(metadata->white_point[1]));
854         }
855         if (metadata->has_luminance) {
856             put_ebml_float(dyn_cp, MATROSKA_ID_VIDEOCOLOR_LUMINANCEMAX,
857                            av_q2d(metadata->max_luminance));
858             put_ebml_float(dyn_cp, MATROSKA_ID_VIDEOCOLOR_LUMINANCEMIN,
859                            av_q2d(metadata->min_luminance));
860         }
861         end_ebml_master(dyn_cp, meta_element);
862     }
863
864     colorinfo_size = avio_close_dyn_buf(dyn_cp, &colorinfo_ptr);
865     if (colorinfo_size) {
866         ebml_master colorinfo = start_ebml_master(pb, MATROSKA_ID_VIDEOCOLOR, 0);
867         avio_write(pb, colorinfo_ptr, colorinfo_size);
868         end_ebml_master(pb, colorinfo);
869     }
870     av_free(colorinfo_ptr);
871     return 0;
872 }
873
874 static void mkv_write_field_order(AVIOContext *pb, int mode,
875                                   enum AVFieldOrder field_order)
876 {
877     switch (field_order) {
878     case AV_FIELD_UNKNOWN:
879         break;
880     case AV_FIELD_PROGRESSIVE:
881         put_ebml_uint(pb, MATROSKA_ID_VIDEOFLAGINTERLACED,
882                       MATROSKA_VIDEO_INTERLACE_FLAG_PROGRESSIVE);
883         break;
884     case AV_FIELD_TT:
885     case AV_FIELD_BB:
886     case AV_FIELD_TB:
887     case AV_FIELD_BT:
888         put_ebml_uint(pb, MATROSKA_ID_VIDEOFLAGINTERLACED,
889                       MATROSKA_VIDEO_INTERLACE_FLAG_INTERLACED);
890         if (mode != MODE_WEBM) {
891             switch (field_order) {
892             case AV_FIELD_TT:
893                 put_ebml_uint(pb, MATROSKA_ID_VIDEOFIELDORDER,
894                               MATROSKA_VIDEO_FIELDORDER_TT);
895                 break;
896             case AV_FIELD_BB:
897                 put_ebml_uint(pb, MATROSKA_ID_VIDEOFIELDORDER,
898                               MATROSKA_VIDEO_FIELDORDER_BB);
899                 break;
900             case AV_FIELD_TB:
901                 put_ebml_uint(pb, MATROSKA_ID_VIDEOFIELDORDER,
902                               MATROSKA_VIDEO_FIELDORDER_TB);
903                 break;
904             case AV_FIELD_BT:
905                 put_ebml_uint(pb, MATROSKA_ID_VIDEOFIELDORDER,
906                               MATROSKA_VIDEO_FIELDORDER_BT);
907                 break;
908             }
909         }
910     }
911 }
912
913 static int mkv_write_stereo_mode(AVFormatContext *s, AVIOContext *pb,
914                                  AVStream *st, int mode, int *h_width, int *h_height)
915 {
916     int i;
917     int ret = 0;
918     AVDictionaryEntry *tag;
919     MatroskaVideoStereoModeType format = MATROSKA_VIDEO_STEREOMODE_TYPE_NB;
920
921     *h_width = 1;
922     *h_height = 1;
923     // convert metadata into proper side data and add it to the stream
924     if ((tag = av_dict_get(st->metadata, "stereo_mode", NULL, 0)) ||
925         (tag = av_dict_get( s->metadata, "stereo_mode", NULL, 0))) {
926         int stereo_mode = atoi(tag->value);
927
928         for (i=0; i<MATROSKA_VIDEO_STEREOMODE_TYPE_NB; i++)
929             if (!strcmp(tag->value, ff_matroska_video_stereo_mode[i])){
930                 stereo_mode = i;
931                 break;
932             }
933
934         if (stereo_mode < MATROSKA_VIDEO_STEREOMODE_TYPE_NB &&
935             stereo_mode != 10 && stereo_mode != 12) {
936             int ret = ff_mkv_stereo3d_conv(st, stereo_mode);
937             if (ret < 0)
938                 return ret;
939         }
940     }
941
942     // iterate to find the stereo3d side data
943     for (i = 0; i < st->nb_side_data; i++) {
944         AVPacketSideData sd = st->side_data[i];
945         if (sd.type == AV_PKT_DATA_STEREO3D) {
946             AVStereo3D *stereo = (AVStereo3D *)sd.data;
947
948             switch (stereo->type) {
949             case AV_STEREO3D_2D:
950                 format = MATROSKA_VIDEO_STEREOMODE_TYPE_MONO;
951                 break;
952             case AV_STEREO3D_SIDEBYSIDE:
953                 format = (stereo->flags & AV_STEREO3D_FLAG_INVERT)
954                     ? MATROSKA_VIDEO_STEREOMODE_TYPE_RIGHT_LEFT
955                     : MATROSKA_VIDEO_STEREOMODE_TYPE_LEFT_RIGHT;
956                 *h_width = 2;
957                 break;
958             case AV_STEREO3D_TOPBOTTOM:
959                 format = MATROSKA_VIDEO_STEREOMODE_TYPE_TOP_BOTTOM;
960                 if (stereo->flags & AV_STEREO3D_FLAG_INVERT)
961                     format--;
962                 *h_height = 2;
963                 break;
964             case AV_STEREO3D_CHECKERBOARD:
965                 format = MATROSKA_VIDEO_STEREOMODE_TYPE_CHECKERBOARD_LR;
966                 if (stereo->flags & AV_STEREO3D_FLAG_INVERT)
967                     format--;
968                 break;
969             case AV_STEREO3D_LINES:
970                 format = MATROSKA_VIDEO_STEREOMODE_TYPE_ROW_INTERLEAVED_LR;
971                 if (stereo->flags & AV_STEREO3D_FLAG_INVERT)
972                     format--;
973                 *h_height = 2;
974                 break;
975             case AV_STEREO3D_COLUMNS:
976                 format = MATROSKA_VIDEO_STEREOMODE_TYPE_COL_INTERLEAVED_LR;
977                 if (stereo->flags & AV_STEREO3D_FLAG_INVERT)
978                     format--;
979                 *h_width = 2;
980                 break;
981             case AV_STEREO3D_FRAMESEQUENCE:
982                 format = MATROSKA_VIDEO_STEREOMODE_TYPE_BOTH_EYES_BLOCK_LR;
983                 if (stereo->flags & AV_STEREO3D_FLAG_INVERT)
984                     format++;
985                 break;
986             }
987             break;
988         }
989     }
990
991     if (format == MATROSKA_VIDEO_STEREOMODE_TYPE_NB)
992         return ret;
993
994     // if webm, do not write unsupported modes
995     if ((mode == MODE_WEBM &&
996         format > MATROSKA_VIDEO_STEREOMODE_TYPE_TOP_BOTTOM &&
997         format != MATROSKA_VIDEO_STEREOMODE_TYPE_RIGHT_LEFT)
998         || format >= MATROSKA_VIDEO_STEREOMODE_TYPE_NB) {
999         av_log(s, AV_LOG_ERROR,
1000                "The specified stereo mode is not valid.\n");
1001         format = MATROSKA_VIDEO_STEREOMODE_TYPE_NB;
1002         return AVERROR(EINVAL);
1003     }
1004
1005     // write StereoMode if format is valid
1006     put_ebml_uint(pb, MATROSKA_ID_VIDEOSTEREOMODE, format);
1007
1008     return ret;
1009 }
1010
1011 static int mkv_write_track(AVFormatContext *s, MatroskaMuxContext *mkv,
1012                            int i, AVIOContext *pb, int default_stream_exists)
1013 {
1014     AVStream *st = s->streams[i];
1015     AVCodecParameters *par = st->codecpar;
1016     ebml_master subinfo, track;
1017     int native_id = 0;
1018     int qt_id = 0;
1019     int bit_depth = av_get_bits_per_sample(par->codec_id);
1020     int sample_rate = par->sample_rate;
1021     int output_sample_rate = 0;
1022     int display_width_div = 1;
1023     int display_height_div = 1;
1024     int j, ret;
1025     AVDictionaryEntry *tag;
1026
1027     if (par->codec_type == AVMEDIA_TYPE_ATTACHMENT) {
1028         mkv->have_attachments = 1;
1029         return 0;
1030     }
1031
1032     if (par->codec_type == AVMEDIA_TYPE_AUDIO) {
1033         if (!bit_depth && par->codec_id != AV_CODEC_ID_ADPCM_G726) {
1034             if (par->bits_per_raw_sample)
1035                 bit_depth = par->bits_per_raw_sample;
1036             else
1037                 bit_depth = av_get_bytes_per_sample(par->format) << 3;
1038         }
1039         if (!bit_depth)
1040             bit_depth = par->bits_per_coded_sample;
1041     }
1042
1043     if (par->codec_id == AV_CODEC_ID_AAC) {
1044         ret = get_aac_sample_rates(s, par, &sample_rate, &output_sample_rate);
1045         if (ret < 0)
1046             return ret;
1047     }
1048
1049     track = start_ebml_master(pb, MATROSKA_ID_TRACKENTRY, 0);
1050     put_ebml_uint (pb, MATROSKA_ID_TRACKNUMBER,
1051                    mkv->is_dash ? mkv->dash_track_number : i + 1);
1052     put_ebml_uint (pb, MATROSKA_ID_TRACKUID,
1053                    mkv->is_dash ? mkv->dash_track_number : i + 1);
1054     put_ebml_uint (pb, MATROSKA_ID_TRACKFLAGLACING , 0);    // no lacing (yet)
1055
1056     if ((tag = av_dict_get(st->metadata, "title", NULL, 0)))
1057         put_ebml_string(pb, MATROSKA_ID_TRACKNAME, tag->value);
1058     tag = av_dict_get(st->metadata, "language", NULL, 0);
1059     if (mkv->mode != MODE_WEBM || par->codec_id != AV_CODEC_ID_WEBVTT) {
1060         put_ebml_string(pb, MATROSKA_ID_TRACKLANGUAGE, tag && tag->value ? tag->value:"und");
1061     } else if (tag && tag->value) {
1062         put_ebml_string(pb, MATROSKA_ID_TRACKLANGUAGE, tag->value);
1063     }
1064
1065     // The default value for TRACKFLAGDEFAULT is 1, so add element
1066     // if we need to clear it.
1067     if (default_stream_exists && !(st->disposition & AV_DISPOSITION_DEFAULT))
1068         put_ebml_uint(pb, MATROSKA_ID_TRACKFLAGDEFAULT, !!(st->disposition & AV_DISPOSITION_DEFAULT));
1069
1070     if (st->disposition & AV_DISPOSITION_FORCED)
1071         put_ebml_uint(pb, MATROSKA_ID_TRACKFLAGFORCED, 1);
1072
1073     if (mkv->mode == MODE_WEBM && par->codec_id == AV_CODEC_ID_WEBVTT) {
1074         const char *codec_id;
1075         if (st->disposition & AV_DISPOSITION_CAPTIONS) {
1076             codec_id = "D_WEBVTT/CAPTIONS";
1077             native_id = MATROSKA_TRACK_TYPE_SUBTITLE;
1078         } else if (st->disposition & AV_DISPOSITION_DESCRIPTIONS) {
1079             codec_id = "D_WEBVTT/DESCRIPTIONS";
1080             native_id = MATROSKA_TRACK_TYPE_METADATA;
1081         } else if (st->disposition & AV_DISPOSITION_METADATA) {
1082             codec_id = "D_WEBVTT/METADATA";
1083             native_id = MATROSKA_TRACK_TYPE_METADATA;
1084         } else {
1085             codec_id = "D_WEBVTT/SUBTITLES";
1086             native_id = MATROSKA_TRACK_TYPE_SUBTITLE;
1087         }
1088         put_ebml_string(pb, MATROSKA_ID_CODECID, codec_id);
1089     } else {
1090         // look for a codec ID string specific to mkv to use,
1091         // if none are found, use AVI codes
1092         for (j = 0; ff_mkv_codec_tags[j].id != AV_CODEC_ID_NONE; j++) {
1093             if (ff_mkv_codec_tags[j].id == par->codec_id) {
1094                 put_ebml_string(pb, MATROSKA_ID_CODECID, ff_mkv_codec_tags[j].str);
1095                 native_id = 1;
1096                 break;
1097             }
1098         }
1099         if (par->codec_id == AV_CODEC_ID_RAWVIDEO && !par->codec_tag) {
1100             if (mkv->allow_raw_vfw) {
1101                 native_id = 0;
1102             } else {
1103                 av_log(s, AV_LOG_ERROR, "Raw RGB is not supported Natively in Matroska, you can use AVI or NUT or\n"
1104                                         "If you would like to store it anyway using VFW mode, enable allow_raw_vfw (-allow_raw_vfw 1)\n");
1105                 return AVERROR(EINVAL);
1106             }
1107         }
1108     }
1109
1110     if (par->codec_type == AVMEDIA_TYPE_AUDIO && par->initial_padding && par->codec_id == AV_CODEC_ID_OPUS) {
1111         int64_t codecdelay = av_rescale_q(par->initial_padding,
1112                                           (AVRational){ 1, 48000 },
1113                                           (AVRational){ 1, 1000000000 });
1114         if (codecdelay < 0) {
1115             av_log(s, AV_LOG_ERROR, "Initial padding is invalid\n");
1116             return AVERROR(EINVAL);
1117         }
1118 //         mkv->tracks[i].ts_offset = av_rescale_q(par->initial_padding,
1119 //                                                 (AVRational){ 1, par->sample_rate },
1120 //                                                 st->time_base);
1121
1122         put_ebml_uint(pb, MATROSKA_ID_CODECDELAY, codecdelay);
1123     }
1124     if (par->codec_id == AV_CODEC_ID_OPUS) {
1125         put_ebml_uint(pb, MATROSKA_ID_SEEKPREROLL, OPUS_SEEK_PREROLL);
1126     }
1127
1128     if (mkv->mode == MODE_WEBM && !(par->codec_id == AV_CODEC_ID_VP8 ||
1129                                     par->codec_id == AV_CODEC_ID_VP9 ||
1130                                     par->codec_id == AV_CODEC_ID_OPUS ||
1131                                     par->codec_id == AV_CODEC_ID_VORBIS ||
1132                                     par->codec_id == AV_CODEC_ID_WEBVTT)) {
1133         av_log(s, AV_LOG_ERROR,
1134                "Only VP8 or VP9 video and Vorbis or Opus audio and WebVTT subtitles are supported for WebM.\n");
1135         return AVERROR(EINVAL);
1136     }
1137
1138     switch (par->codec_type) {
1139     case AVMEDIA_TYPE_VIDEO:
1140         mkv->have_video = 1;
1141         put_ebml_uint(pb, MATROSKA_ID_TRACKTYPE, MATROSKA_TRACK_TYPE_VIDEO);
1142
1143         if(   st->avg_frame_rate.num > 0 && st->avg_frame_rate.den > 0
1144            && av_cmp_q(av_inv_q(st->avg_frame_rate), st->time_base) > 0)
1145             put_ebml_uint(pb, MATROSKA_ID_TRACKDEFAULTDURATION, 1000000000LL * st->avg_frame_rate.den / st->avg_frame_rate.num);
1146         else
1147             put_ebml_uint(pb, MATROSKA_ID_TRACKDEFAULTDURATION, 1000000000LL * st->time_base.num / st->time_base.den);
1148
1149         if (!native_id &&
1150             ff_codec_get_tag(ff_codec_movvideo_tags, par->codec_id) &&
1151             ((!ff_codec_get_tag(ff_codec_bmp_tags,   par->codec_id) && par->codec_id != AV_CODEC_ID_RAWVIDEO) ||
1152              par->codec_id == AV_CODEC_ID_SVQ1 ||
1153              par->codec_id == AV_CODEC_ID_SVQ3 ||
1154              par->codec_id == AV_CODEC_ID_CINEPAK))
1155             qt_id = 1;
1156
1157         if (qt_id)
1158             put_ebml_string(pb, MATROSKA_ID_CODECID, "V_QUICKTIME");
1159         else if (!native_id) {
1160             // if there is no mkv-specific codec ID, use VFW mode
1161             put_ebml_string(pb, MATROSKA_ID_CODECID, "V_MS/VFW/FOURCC");
1162             mkv->tracks[i].write_dts = 1;
1163             s->internal->avoid_negative_ts_use_pts = 0;
1164         }
1165
1166         subinfo = start_ebml_master(pb, MATROSKA_ID_TRACKVIDEO, 0);
1167
1168         put_ebml_uint (pb, MATROSKA_ID_VIDEOPIXELWIDTH , par->width);
1169         put_ebml_uint (pb, MATROSKA_ID_VIDEOPIXELHEIGHT, par->height);
1170
1171         mkv_write_field_order(pb, mkv->mode, par->field_order);
1172
1173         // check both side data and metadata for stereo information,
1174         // write the result to the bitstream if any is found
1175         ret = mkv_write_stereo_mode(s, pb, st, mkv->mode,
1176                                     &display_width_div,
1177                                     &display_height_div);
1178         if (ret < 0)
1179             return ret;
1180
1181         if (((tag = av_dict_get(st->metadata, "alpha_mode", NULL, 0)) && atoi(tag->value)) ||
1182             ((tag = av_dict_get( s->metadata, "alpha_mode", NULL, 0)) && atoi(tag->value)) ||
1183             (par->format == AV_PIX_FMT_YUVA420P)) {
1184             put_ebml_uint(pb, MATROSKA_ID_VIDEOALPHAMODE, 1);
1185         }
1186
1187         // write DisplayWidth and DisplayHeight, they contain the size of
1188         // a single source view and/or the display aspect ratio
1189         if (st->sample_aspect_ratio.num) {
1190             int64_t d_width = av_rescale(par->width, st->sample_aspect_ratio.num, st->sample_aspect_ratio.den);
1191             if (d_width > INT_MAX) {
1192                 av_log(s, AV_LOG_ERROR, "Overflow in display width\n");
1193                 return AVERROR(EINVAL);
1194             }
1195             put_ebml_uint(pb, MATROSKA_ID_VIDEODISPLAYWIDTH , d_width / display_width_div);
1196             put_ebml_uint(pb, MATROSKA_ID_VIDEODISPLAYHEIGHT, par->height / display_height_div);
1197         } else if (display_width_div != 1 || display_height_div != 1) {
1198             put_ebml_uint(pb, MATROSKA_ID_VIDEODISPLAYWIDTH , par->width / display_width_div);
1199             put_ebml_uint(pb, MATROSKA_ID_VIDEODISPLAYHEIGHT, par->height / display_height_div);
1200         } else
1201             put_ebml_uint(pb, MATROSKA_ID_VIDEODISPLAYUNIT, MATROSKA_VIDEO_DISPLAYUNIT_UNKNOWN);
1202
1203         if (par->codec_id == AV_CODEC_ID_RAWVIDEO) {
1204             uint32_t color_space = av_le2ne32(par->codec_tag);
1205             put_ebml_binary(pb, MATROSKA_ID_VIDEOCOLORSPACE, &color_space, sizeof(color_space));
1206         }
1207         if (s->strict_std_compliance <= FF_COMPLIANCE_UNOFFICIAL) {
1208             ret = mkv_write_video_color(pb, par, st);
1209             if (ret < 0)
1210                 return ret;
1211         }
1212         end_ebml_master(pb, subinfo);
1213         break;
1214
1215     case AVMEDIA_TYPE_AUDIO:
1216         put_ebml_uint(pb, MATROSKA_ID_TRACKTYPE, MATROSKA_TRACK_TYPE_AUDIO);
1217
1218         if (!native_id)
1219             // no mkv-specific ID, use ACM mode
1220             put_ebml_string(pb, MATROSKA_ID_CODECID, "A_MS/ACM");
1221
1222         subinfo = start_ebml_master(pb, MATROSKA_ID_TRACKAUDIO, 0);
1223         put_ebml_uint  (pb, MATROSKA_ID_AUDIOCHANNELS    , par->channels);
1224         put_ebml_float (pb, MATROSKA_ID_AUDIOSAMPLINGFREQ, sample_rate);
1225         if (output_sample_rate)
1226             put_ebml_float(pb, MATROSKA_ID_AUDIOOUTSAMPLINGFREQ, output_sample_rate);
1227         if (bit_depth)
1228             put_ebml_uint(pb, MATROSKA_ID_AUDIOBITDEPTH, bit_depth);
1229         end_ebml_master(pb, subinfo);
1230         break;
1231
1232     case AVMEDIA_TYPE_SUBTITLE:
1233         if (!native_id) {
1234             av_log(s, AV_LOG_ERROR, "Subtitle codec %d is not supported.\n", par->codec_id);
1235             return AVERROR(ENOSYS);
1236         }
1237
1238         if (mkv->mode != MODE_WEBM || par->codec_id != AV_CODEC_ID_WEBVTT)
1239             native_id = MATROSKA_TRACK_TYPE_SUBTITLE;
1240
1241         put_ebml_uint(pb, MATROSKA_ID_TRACKTYPE, native_id);
1242         break;
1243     default:
1244         av_log(s, AV_LOG_ERROR, "Only audio, video, and subtitles are supported for Matroska.\n");
1245         return AVERROR(EINVAL);
1246     }
1247
1248     if (mkv->mode != MODE_WEBM || par->codec_id != AV_CODEC_ID_WEBVTT) {
1249         ret = mkv_write_codecprivate(s, pb, par, native_id, qt_id);
1250         if (ret < 0)
1251             return ret;
1252     }
1253
1254     end_ebml_master(pb, track);
1255
1256     return 0;
1257 }
1258
1259 static int mkv_write_tracks(AVFormatContext *s)
1260 {
1261     MatroskaMuxContext *mkv = s->priv_data;
1262     AVIOContext *dyn_cp, *pb = s->pb;
1263     ebml_master tracks;
1264     int i, ret, default_stream_exists = 0;
1265
1266     ret = mkv_add_seekhead_entry(mkv->main_seekhead, MATROSKA_ID_TRACKS, avio_tell(pb));
1267     if (ret < 0)
1268         return ret;
1269
1270     ret = start_ebml_master_crc32(pb, &dyn_cp, &tracks, MATROSKA_ID_TRACKS, 0);
1271     if (ret < 0)
1272         return ret;
1273
1274     for (i = 0; i < s->nb_streams; i++) {
1275         AVStream *st = s->streams[i];
1276         default_stream_exists |= st->disposition & AV_DISPOSITION_DEFAULT;
1277     }
1278     for (i = 0; i < s->nb_streams; i++) {
1279         ret = mkv_write_track(s, mkv, i, dyn_cp, default_stream_exists);
1280         if (ret < 0)
1281             return ret;
1282     }
1283     end_ebml_master_crc32(pb, &dyn_cp, mkv, tracks);
1284     return 0;
1285 }
1286
1287 static int mkv_write_chapters(AVFormatContext *s)
1288 {
1289     MatroskaMuxContext *mkv = s->priv_data;
1290     AVIOContext *dyn_cp, *pb = s->pb;
1291     ebml_master chapters, editionentry;
1292     AVRational scale = {1, 1E9};
1293     int i, ret;
1294
1295     if (!s->nb_chapters || mkv->wrote_chapters)
1296         return 0;
1297
1298     ret = mkv_add_seekhead_entry(mkv->main_seekhead, MATROSKA_ID_CHAPTERS, avio_tell(pb));
1299     if (ret < 0) return ret;
1300
1301     ret = start_ebml_master_crc32(pb, &dyn_cp, &chapters, MATROSKA_ID_CHAPTERS, 0);
1302     if (ret < 0) return ret;
1303
1304     editionentry = start_ebml_master(dyn_cp, MATROSKA_ID_EDITIONENTRY, 0);
1305     put_ebml_uint(dyn_cp, MATROSKA_ID_EDITIONFLAGDEFAULT, 1);
1306     put_ebml_uint(dyn_cp, MATROSKA_ID_EDITIONFLAGHIDDEN , 0);
1307     for (i = 0; i < s->nb_chapters; i++) {
1308         ebml_master chapteratom, chapterdisplay;
1309         AVChapter *c     = s->chapters[i];
1310         int64_t chapterstart = av_rescale_q(c->start, c->time_base, scale);
1311         int64_t chapterend   = av_rescale_q(c->end,   c->time_base, scale);
1312         AVDictionaryEntry *t = NULL;
1313         if (chapterstart < 0 || chapterstart > chapterend || chapterend < 0) {
1314             av_log(s, AV_LOG_ERROR,
1315                    "Invalid chapter start (%"PRId64") or end (%"PRId64").\n",
1316                    chapterstart, chapterend);
1317             return AVERROR_INVALIDDATA;
1318         }
1319
1320         chapteratom = start_ebml_master(dyn_cp, MATROSKA_ID_CHAPTERATOM, 0);
1321         put_ebml_uint(dyn_cp, MATROSKA_ID_CHAPTERUID, c->id + mkv->chapter_id_offset);
1322         put_ebml_uint(dyn_cp, MATROSKA_ID_CHAPTERTIMESTART, chapterstart);
1323         put_ebml_uint(dyn_cp, MATROSKA_ID_CHAPTERTIMEEND, chapterend);
1324         put_ebml_uint(dyn_cp, MATROSKA_ID_CHAPTERFLAGHIDDEN , 0);
1325         put_ebml_uint(dyn_cp, MATROSKA_ID_CHAPTERFLAGENABLED, 1);
1326         if ((t = av_dict_get(c->metadata, "title", NULL, 0))) {
1327             chapterdisplay = start_ebml_master(dyn_cp, MATROSKA_ID_CHAPTERDISPLAY, 0);
1328             put_ebml_string(dyn_cp, MATROSKA_ID_CHAPSTRING, t->value);
1329             put_ebml_string(dyn_cp, MATROSKA_ID_CHAPLANG  , "und");
1330             end_ebml_master(dyn_cp, chapterdisplay);
1331         }
1332         end_ebml_master(dyn_cp, chapteratom);
1333     }
1334     end_ebml_master(dyn_cp, editionentry);
1335     end_ebml_master_crc32(pb, &dyn_cp, mkv, chapters);
1336
1337     mkv->wrote_chapters = 1;
1338     return 0;
1339 }
1340
1341 static int mkv_write_simpletag(AVIOContext *pb, AVDictionaryEntry *t)
1342 {
1343     uint8_t *key = av_strdup(t->key);
1344     uint8_t *p   = key;
1345     const uint8_t *lang = NULL;
1346     ebml_master tag;
1347
1348     if (!key)
1349         return AVERROR(ENOMEM);
1350
1351     if ((p = strrchr(p, '-')) &&
1352         (lang = ff_convert_lang_to(p + 1, AV_LANG_ISO639_2_BIBL)))
1353         *p = 0;
1354
1355     p = key;
1356     while (*p) {
1357         if (*p == ' ')
1358             *p = '_';
1359         else if (*p >= 'a' && *p <= 'z')
1360             *p -= 'a' - 'A';
1361         p++;
1362     }
1363
1364     tag = start_ebml_master(pb, MATROSKA_ID_SIMPLETAG, 0);
1365     put_ebml_string(pb, MATROSKA_ID_TAGNAME, key);
1366     if (lang)
1367         put_ebml_string(pb, MATROSKA_ID_TAGLANG, lang);
1368     put_ebml_string(pb, MATROSKA_ID_TAGSTRING, t->value);
1369     end_ebml_master(pb, tag);
1370
1371     av_freep(&key);
1372     return 0;
1373 }
1374
1375 static int mkv_write_tag_targets(AVFormatContext *s,
1376                                  unsigned int elementid, unsigned int uid,
1377                                  ebml_master *tags, ebml_master* tag)
1378 {
1379     AVIOContext *pb;
1380     MatroskaMuxContext *mkv = s->priv_data;
1381     ebml_master targets;
1382     int ret;
1383
1384     if (!tags->pos) {
1385         ret = mkv_add_seekhead_entry(mkv->main_seekhead, MATROSKA_ID_TAGS, avio_tell(s->pb));
1386         if (ret < 0) return ret;
1387
1388         start_ebml_master_crc32(s->pb, &mkv->tags_bc, tags, MATROSKA_ID_TAGS, 0);
1389     }
1390     pb = mkv->tags_bc;
1391
1392     *tag     = start_ebml_master(pb, MATROSKA_ID_TAG,       0);
1393     targets = start_ebml_master(pb, MATROSKA_ID_TAGTARGETS, 0);
1394     if (elementid)
1395         put_ebml_uint(pb, elementid, uid);
1396     end_ebml_master(pb, targets);
1397     return 0;
1398 }
1399
1400 static int mkv_check_tag_name(const char *name, unsigned int elementid)
1401 {
1402     return av_strcasecmp(name, "title") &&
1403            av_strcasecmp(name, "stereo_mode") &&
1404            av_strcasecmp(name, "creation_time") &&
1405            av_strcasecmp(name, "encoding_tool") &&
1406            av_strcasecmp(name, "duration") &&
1407            (elementid != MATROSKA_ID_TAGTARGETS_TRACKUID ||
1408             av_strcasecmp(name, "language")) &&
1409            (elementid != MATROSKA_ID_TAGTARGETS_ATTACHUID ||
1410             (av_strcasecmp(name, "filename") &&
1411              av_strcasecmp(name, "mimetype")));
1412 }
1413
1414 static int mkv_write_tag(AVFormatContext *s, AVDictionary *m, unsigned int elementid,
1415                          unsigned int uid, ebml_master *tags)
1416 {
1417     MatroskaMuxContext *mkv = s->priv_data;
1418     ebml_master tag;
1419     int ret;
1420     AVDictionaryEntry *t = NULL;
1421
1422     ret = mkv_write_tag_targets(s, elementid, uid, tags, &tag);
1423     if (ret < 0)
1424         return ret;
1425
1426     while ((t = av_dict_get(m, "", t, AV_DICT_IGNORE_SUFFIX))) {
1427         if (mkv_check_tag_name(t->key, elementid)) {
1428             ret = mkv_write_simpletag(mkv->tags_bc, t);
1429             if (ret < 0)
1430                 return ret;
1431         }
1432     }
1433
1434     end_ebml_master(mkv->tags_bc, tag);
1435     return 0;
1436 }
1437
1438 static int mkv_check_tag(AVDictionary *m, unsigned int elementid)
1439 {
1440     AVDictionaryEntry *t = NULL;
1441
1442     while ((t = av_dict_get(m, "", t, AV_DICT_IGNORE_SUFFIX)))
1443         if (mkv_check_tag_name(t->key, elementid))
1444             return 1;
1445
1446     return 0;
1447 }
1448
1449 static int mkv_write_tags(AVFormatContext *s)
1450 {
1451     MatroskaMuxContext *mkv = s->priv_data;
1452     int i, ret;
1453
1454     ff_metadata_conv_ctx(s, ff_mkv_metadata_conv, NULL);
1455
1456     if (mkv_check_tag(s->metadata, 0)) {
1457         ret = mkv_write_tag(s, s->metadata, 0, 0, &mkv->tags);
1458         if (ret < 0) return ret;
1459     }
1460
1461     for (i = 0; i < s->nb_streams; i++) {
1462         AVStream *st = s->streams[i];
1463
1464         if (st->codecpar->codec_type == AVMEDIA_TYPE_ATTACHMENT)
1465             continue;
1466
1467         if (!mkv_check_tag(st->metadata, MATROSKA_ID_TAGTARGETS_TRACKUID))
1468             continue;
1469
1470         ret = mkv_write_tag(s, st->metadata, MATROSKA_ID_TAGTARGETS_TRACKUID, i + 1, &mkv->tags);
1471         if (ret < 0) return ret;
1472     }
1473
1474     if (s->pb->seekable && !mkv->is_live) {
1475         for (i = 0; i < s->nb_streams; i++) {
1476             AVIOContext *pb;
1477             AVStream *st = s->streams[i];
1478             ebml_master tag_target;
1479             ebml_master tag;
1480
1481             if (st->codecpar->codec_type == AVMEDIA_TYPE_ATTACHMENT)
1482                 continue;
1483
1484             mkv_write_tag_targets(s, MATROSKA_ID_TAGTARGETS_TRACKUID, i + 1, &mkv->tags, &tag_target);
1485             pb = mkv->tags_bc;
1486
1487             tag = start_ebml_master(pb, MATROSKA_ID_SIMPLETAG, 0);
1488             put_ebml_string(pb, MATROSKA_ID_TAGNAME, "DURATION");
1489             mkv->stream_duration_offsets[i] = avio_tell(pb);
1490
1491             // Reserve space to write duration as a 20-byte string.
1492             // 2 (ebml id) + 1 (data size) + 20 (data)
1493             put_ebml_void(pb, 23);
1494             end_ebml_master(pb, tag);
1495             end_ebml_master(pb, tag_target);
1496         }
1497     }
1498
1499     for (i = 0; i < s->nb_chapters; i++) {
1500         AVChapter *ch = s->chapters[i];
1501
1502         if (!mkv_check_tag(ch->metadata, MATROSKA_ID_TAGTARGETS_CHAPTERUID))
1503             continue;
1504
1505         ret = mkv_write_tag(s, ch->metadata, MATROSKA_ID_TAGTARGETS_CHAPTERUID, ch->id + mkv->chapter_id_offset, &mkv->tags);
1506         if (ret < 0) return ret;
1507     }
1508
1509     if (mkv->have_attachments) {
1510         for (i = 0; i < mkv->attachments->num_entries; i++) {
1511             mkv_attachment *attachment = &mkv->attachments->entries[i];
1512             AVStream *st = s->streams[attachment->stream_idx];
1513
1514             if (!mkv_check_tag(st->metadata, MATROSKA_ID_TAGTARGETS_ATTACHUID))
1515                 continue;
1516
1517             ret = mkv_write_tag(s, st->metadata, MATROSKA_ID_TAGTARGETS_ATTACHUID, attachment->fileuid, &mkv->tags);
1518             if (ret < 0)
1519                 return ret;
1520         }
1521     }
1522
1523     if (mkv->tags.pos) {
1524         if (s->pb->seekable && !mkv->is_live)
1525             put_ebml_void(s->pb, avio_tell(mkv->tags_bc) + ((mkv->write_crc && mkv->mode != MODE_WEBM) ? 2 /* ebml id + data size */ + 4 /* CRC32 */ : 0));
1526         else
1527             end_ebml_master_crc32(s->pb, &mkv->tags_bc, mkv, mkv->tags);
1528     }
1529     return 0;
1530 }
1531
1532 static int mkv_write_attachments(AVFormatContext *s)
1533 {
1534     MatroskaMuxContext *mkv = s->priv_data;
1535     AVIOContext *dyn_cp, *pb = s->pb;
1536     ebml_master attachments;
1537     AVLFG c;
1538     int i, ret;
1539
1540     if (!mkv->have_attachments)
1541         return 0;
1542
1543     mkv->attachments = av_mallocz(sizeof(*mkv->attachments));
1544     if (!mkv->attachments)
1545         return ret;
1546
1547     av_lfg_init(&c, av_get_random_seed());
1548
1549     ret = mkv_add_seekhead_entry(mkv->main_seekhead, MATROSKA_ID_ATTACHMENTS, avio_tell(pb));
1550     if (ret < 0) return ret;
1551
1552     ret = start_ebml_master_crc32(pb, &dyn_cp, &attachments, MATROSKA_ID_ATTACHMENTS, 0);
1553     if (ret < 0) return ret;
1554
1555     for (i = 0; i < s->nb_streams; i++) {
1556         AVStream *st = s->streams[i];
1557         ebml_master attached_file;
1558         mkv_attachment *attachment = mkv->attachments->entries;
1559         AVDictionaryEntry *t;
1560         const char *mimetype = NULL;
1561         uint32_t fileuid;
1562
1563         if (st->codecpar->codec_type != AVMEDIA_TYPE_ATTACHMENT)
1564             continue;
1565
1566         attachment = av_realloc_array(attachment, mkv->attachments->num_entries + 1, sizeof(mkv_attachment));
1567         if (!attachment)
1568             return AVERROR(ENOMEM);
1569         mkv->attachments->entries = attachment;
1570
1571         attached_file = start_ebml_master(dyn_cp, MATROSKA_ID_ATTACHEDFILE, 0);
1572
1573         if (t = av_dict_get(st->metadata, "title", NULL, 0))
1574             put_ebml_string(dyn_cp, MATROSKA_ID_FILEDESC, t->value);
1575         if (!(t = av_dict_get(st->metadata, "filename", NULL, 0))) {
1576             av_log(s, AV_LOG_ERROR, "Attachment stream %d has no filename tag.\n", i);
1577             return AVERROR(EINVAL);
1578         }
1579         put_ebml_string(dyn_cp, MATROSKA_ID_FILENAME, t->value);
1580         if (t = av_dict_get(st->metadata, "mimetype", NULL, 0))
1581             mimetype = t->value;
1582         else if (st->codecpar->codec_id != AV_CODEC_ID_NONE ) {
1583             int i;
1584             for (i = 0; ff_mkv_mime_tags[i].id != AV_CODEC_ID_NONE; i++)
1585                 if (ff_mkv_mime_tags[i].id == st->codecpar->codec_id) {
1586                     mimetype = ff_mkv_mime_tags[i].str;
1587                     break;
1588                 }
1589             for (i = 0; ff_mkv_image_mime_tags[i].id != AV_CODEC_ID_NONE; i++)
1590                 if (ff_mkv_image_mime_tags[i].id == st->codecpar->codec_id) {
1591                     mimetype = ff_mkv_image_mime_tags[i].str;
1592                     break;
1593                 }
1594         }
1595         if (!mimetype) {
1596             av_log(s, AV_LOG_ERROR, "Attachment stream %d has no mimetype tag and "
1597                                     "it cannot be deduced from the codec id.\n", i);
1598             return AVERROR(EINVAL);
1599         }
1600
1601         if (s->flags & AVFMT_FLAG_BITEXACT) {
1602             struct AVSHA *sha = av_sha_alloc();
1603             uint8_t digest[20];
1604             if (!sha)
1605                 return AVERROR(ENOMEM);
1606             av_sha_init(sha, 160);
1607             av_sha_update(sha, st->codecpar->extradata, st->codecpar->extradata_size);
1608             av_sha_final(sha, digest);
1609             av_free(sha);
1610             fileuid = AV_RL32(digest);
1611         } else {
1612             fileuid = av_lfg_get(&c);
1613         }
1614         av_log(s, AV_LOG_VERBOSE, "Using %.8"PRIx32" for attachment %d\n",
1615                fileuid, mkv->attachments->num_entries);
1616
1617         put_ebml_string(dyn_cp, MATROSKA_ID_FILEMIMETYPE, mimetype);
1618         put_ebml_binary(dyn_cp, MATROSKA_ID_FILEDATA, st->codecpar->extradata, st->codecpar->extradata_size);
1619         put_ebml_uint(dyn_cp, MATROSKA_ID_FILEUID, fileuid);
1620         end_ebml_master(dyn_cp, attached_file);
1621
1622         mkv->attachments->entries[mkv->attachments->num_entries].stream_idx = i;
1623         mkv->attachments->entries[mkv->attachments->num_entries++].fileuid  = fileuid;
1624     }
1625     end_ebml_master_crc32(pb, &dyn_cp, mkv, attachments);
1626
1627     return 0;
1628 }
1629
1630 static int64_t get_metadata_duration(AVFormatContext *s)
1631 {
1632     int i = 0;
1633     int64_t max = 0;
1634     int64_t us;
1635
1636     AVDictionaryEntry *explicitDuration = av_dict_get(s->metadata, "DURATION", NULL, 0);
1637     if (explicitDuration && (av_parse_time(&us, explicitDuration->value, 1) == 0) && us > 0) {
1638         av_log(s, AV_LOG_DEBUG, "get_metadata_duration found duration in context metadata: %" PRId64 "\n", us);
1639         return us;
1640     }
1641
1642     for (i = 0; i < s->nb_streams; i++) {
1643         int64_t us;
1644         AVDictionaryEntry *duration = av_dict_get(s->streams[i]->metadata, "DURATION", NULL, 0);
1645
1646         if (duration && (av_parse_time(&us, duration->value, 1) == 0))
1647             max = FFMAX(max, us);
1648     }
1649
1650     av_log(s, AV_LOG_DEBUG, "get_metadata_duration returned: %" PRId64 "\n", max);
1651     return max;
1652 }
1653
1654 static int mkv_write_header(AVFormatContext *s)
1655 {
1656     MatroskaMuxContext *mkv = s->priv_data;
1657     AVIOContext *pb = s->pb;
1658     ebml_master ebml_header;
1659     AVDictionaryEntry *tag;
1660     int ret, i, version = 2;
1661     int64_t creation_time;
1662
1663     if (!strcmp(s->oformat->name, "webm"))
1664         mkv->mode = MODE_WEBM;
1665     else
1666         mkv->mode = MODE_MATROSKAv2;
1667
1668     if (mkv->mode != MODE_WEBM ||
1669         av_dict_get(s->metadata, "stereo_mode", NULL, 0) ||
1670         av_dict_get(s->metadata, "alpha_mode", NULL, 0))
1671         version = 4;
1672
1673     for (i = 0; i < s->nb_streams; i++) {
1674         if (s->streams[i]->codecpar->codec_id == AV_CODEC_ID_ATRAC3 ||
1675             s->streams[i]->codecpar->codec_id == AV_CODEC_ID_COOK ||
1676             s->streams[i]->codecpar->codec_id == AV_CODEC_ID_RA_288 ||
1677             s->streams[i]->codecpar->codec_id == AV_CODEC_ID_SIPR ||
1678             s->streams[i]->codecpar->codec_id == AV_CODEC_ID_RV10 ||
1679             s->streams[i]->codecpar->codec_id == AV_CODEC_ID_RV20) {
1680             av_log(s, AV_LOG_ERROR,
1681                    "The Matroska muxer does not yet support muxing %s\n",
1682                    avcodec_get_name(s->streams[i]->codecpar->codec_id));
1683             return AVERROR_PATCHWELCOME;
1684         }
1685         if (s->streams[i]->codecpar->codec_id == AV_CODEC_ID_OPUS ||
1686             av_dict_get(s->streams[i]->metadata, "stereo_mode", NULL, 0) ||
1687             av_dict_get(s->streams[i]->metadata, "alpha_mode", NULL, 0))
1688             version = 4;
1689     }
1690
1691     mkv->tracks = av_mallocz_array(s->nb_streams, sizeof(*mkv->tracks));
1692     if (!mkv->tracks) {
1693         ret = AVERROR(ENOMEM);
1694         goto fail;
1695     }
1696     ebml_header = start_ebml_master(pb, EBML_ID_HEADER, 0);
1697     put_ebml_uint   (pb, EBML_ID_EBMLVERSION        ,           1);
1698     put_ebml_uint   (pb, EBML_ID_EBMLREADVERSION    ,           1);
1699     put_ebml_uint   (pb, EBML_ID_EBMLMAXIDLENGTH    ,           4);
1700     put_ebml_uint   (pb, EBML_ID_EBMLMAXSIZELENGTH  ,           8);
1701     put_ebml_string (pb, EBML_ID_DOCTYPE            , s->oformat->name);
1702     put_ebml_uint   (pb, EBML_ID_DOCTYPEVERSION     ,     version);
1703     put_ebml_uint   (pb, EBML_ID_DOCTYPEREADVERSION ,           2);
1704     end_ebml_master(pb, ebml_header);
1705
1706     mkv->segment = start_ebml_master(pb, MATROSKA_ID_SEGMENT, 0);
1707     mkv->segment_offset = avio_tell(pb);
1708
1709     // we write 2 seek heads - one at the end of the file to point to each
1710     // cluster, and one at the beginning to point to all other level one
1711     // elements (including the seek head at the end of the file), which
1712     // isn't more than 10 elements if we only write one of each other
1713     // currently defined level 1 element
1714     mkv->main_seekhead    = mkv_start_seekhead(pb, mkv->segment_offset, 10);
1715     if (!mkv->main_seekhead) {
1716         ret = AVERROR(ENOMEM);
1717         goto fail;
1718     }
1719
1720     ret = mkv_add_seekhead_entry(mkv->main_seekhead, MATROSKA_ID_INFO, avio_tell(pb));
1721     if (ret < 0) goto fail;
1722
1723     ret = start_ebml_master_crc32(pb, &mkv->info_bc, &mkv->info, MATROSKA_ID_INFO, 0);
1724     if (ret < 0)
1725         return ret;
1726     pb = mkv->info_bc;
1727
1728     put_ebml_uint(pb, MATROSKA_ID_TIMECODESCALE, 1000000);
1729     if ((tag = av_dict_get(s->metadata, "title", NULL, 0)))
1730         put_ebml_string(pb, MATROSKA_ID_TITLE, tag->value);
1731     if (!(s->flags & AVFMT_FLAG_BITEXACT)) {
1732         put_ebml_string(pb, MATROSKA_ID_MUXINGAPP, LIBAVFORMAT_IDENT);
1733         if ((tag = av_dict_get(s->metadata, "encoding_tool", NULL, 0)))
1734             put_ebml_string(pb, MATROSKA_ID_WRITINGAPP, tag->value);
1735         else
1736             put_ebml_string(pb, MATROSKA_ID_WRITINGAPP, LIBAVFORMAT_IDENT);
1737
1738         if (mkv->mode != MODE_WEBM) {
1739             uint32_t segment_uid[4];
1740             AVLFG lfg;
1741
1742             av_lfg_init(&lfg, av_get_random_seed());
1743
1744             for (i = 0; i < 4; i++)
1745                 segment_uid[i] = av_lfg_get(&lfg);
1746
1747             put_ebml_binary(pb, MATROSKA_ID_SEGMENTUID, segment_uid, 16);
1748         }
1749     } else {
1750         const char *ident = "Lavf";
1751         put_ebml_string(pb, MATROSKA_ID_MUXINGAPP , ident);
1752         put_ebml_string(pb, MATROSKA_ID_WRITINGAPP, ident);
1753     }
1754
1755     if (ff_parse_creation_time_metadata(s, &creation_time, 0) > 0) {
1756         // Adjust time so it's relative to 2001-01-01 and convert to nanoseconds.
1757         int64_t date_utc = (creation_time - 978307200000000LL) * 1000;
1758         uint8_t date_utc_buf[8];
1759         AV_WB64(date_utc_buf, date_utc);
1760         put_ebml_binary(pb, MATROSKA_ID_DATEUTC, date_utc_buf, 8);
1761     }
1762
1763     // reserve space for the duration
1764     mkv->duration = 0;
1765     mkv->duration_offset = avio_tell(pb);
1766     if (!mkv->is_live) {
1767         int64_t metadata_duration = get_metadata_duration(s);
1768
1769         if (s->duration > 0) {
1770             int64_t scaledDuration = av_rescale(s->duration, 1000, AV_TIME_BASE);
1771             put_ebml_float(pb, MATROSKA_ID_DURATION, scaledDuration);
1772             av_log(s, AV_LOG_DEBUG, "Write early duration from recording time = %" PRIu64 "\n", scaledDuration);
1773         } else if (metadata_duration > 0) {
1774             int64_t scaledDuration = av_rescale(metadata_duration, 1000, AV_TIME_BASE);
1775             put_ebml_float(pb, MATROSKA_ID_DURATION, scaledDuration);
1776             av_log(s, AV_LOG_DEBUG, "Write early duration from metadata = %" PRIu64 "\n", scaledDuration);
1777         } else {
1778             put_ebml_void(pb, 11);              // assumes double-precision float to be written
1779         }
1780     }
1781     if (s->pb->seekable)
1782         put_ebml_void(s->pb, avio_tell(pb) + ((mkv->write_crc && mkv->mode != MODE_WEBM) ? 2 /* ebml id + data size */ + 4 /* CRC32 */ : 0));
1783     else
1784         end_ebml_master_crc32(s->pb, &mkv->info_bc, mkv, mkv->info);
1785     pb = s->pb;
1786
1787     // initialize stream_duration fields
1788     mkv->stream_durations = av_mallocz(s->nb_streams * sizeof(int64_t));
1789     mkv->stream_duration_offsets = av_mallocz(s->nb_streams * sizeof(int64_t));
1790
1791     ret = mkv_write_tracks(s);
1792     if (ret < 0)
1793         goto fail;
1794
1795     for (i = 0; i < s->nb_chapters; i++)
1796         mkv->chapter_id_offset = FFMAX(mkv->chapter_id_offset, 1LL - s->chapters[i]->id);
1797
1798     if (mkv->mode != MODE_WEBM) {
1799         ret = mkv_write_chapters(s);
1800         if (ret < 0)
1801             goto fail;
1802
1803         ret = mkv_write_attachments(s);
1804         if (ret < 0)
1805             goto fail;
1806
1807         ret = mkv_write_tags(s);
1808         if (ret < 0)
1809             goto fail;
1810     }
1811
1812     if (!s->pb->seekable && !mkv->is_live)
1813         mkv_write_seekhead(pb, mkv);
1814
1815     mkv->cues = mkv_start_cues(mkv->segment_offset);
1816     if (!mkv->cues) {
1817         ret = AVERROR(ENOMEM);
1818         goto fail;
1819     }
1820     if (pb->seekable && mkv->reserve_cues_space) {
1821         mkv->cues_pos = avio_tell(pb);
1822         put_ebml_void(pb, mkv->reserve_cues_space);
1823     }
1824
1825     av_init_packet(&mkv->cur_audio_pkt);
1826     mkv->cur_audio_pkt.size = 0;
1827     mkv->cluster_pos = -1;
1828
1829     avio_flush(pb);
1830
1831     // start a new cluster every 5 MB or 5 sec, or 32k / 1 sec for streaming or
1832     // after 4k and on a keyframe
1833     if (pb->seekable) {
1834         if (mkv->cluster_time_limit < 0)
1835             mkv->cluster_time_limit = 5000;
1836         if (mkv->cluster_size_limit < 0)
1837             mkv->cluster_size_limit = 5 * 1024 * 1024;
1838     } else {
1839         if (mkv->cluster_time_limit < 0)
1840             mkv->cluster_time_limit = 1000;
1841         if (mkv->cluster_size_limit < 0)
1842             mkv->cluster_size_limit = 32 * 1024;
1843     }
1844
1845     return 0;
1846 fail:
1847     mkv_free(mkv);
1848     return ret;
1849 }
1850
1851 static int mkv_blockgroup_size(int pkt_size)
1852 {
1853     int size = pkt_size + 4;
1854     size += ebml_num_size(size);
1855     size += 2;              // EBML ID for block and block duration
1856     size += 8;              // max size of block duration
1857     size += ebml_num_size(size);
1858     size += 1;              // blockgroup EBML ID
1859     return size;
1860 }
1861
1862 static int mkv_strip_wavpack(const uint8_t *src, uint8_t **pdst, int *size)
1863 {
1864     uint8_t *dst;
1865     int srclen = *size;
1866     int offset = 0;
1867     int ret;
1868
1869     dst = av_malloc(srclen);
1870     if (!dst)
1871         return AVERROR(ENOMEM);
1872
1873     while (srclen >= WV_HEADER_SIZE) {
1874         WvHeader header;
1875
1876         ret = ff_wv_parse_header(&header, src);
1877         if (ret < 0)
1878             goto fail;
1879         src    += WV_HEADER_SIZE;
1880         srclen -= WV_HEADER_SIZE;
1881
1882         if (srclen < header.blocksize) {
1883             ret = AVERROR_INVALIDDATA;
1884             goto fail;
1885         }
1886
1887         if (header.initial) {
1888             AV_WL32(dst + offset, header.samples);
1889             offset += 4;
1890         }
1891         AV_WL32(dst + offset,     header.flags);
1892         AV_WL32(dst + offset + 4, header.crc);
1893         offset += 8;
1894
1895         if (!(header.initial && header.final)) {
1896             AV_WL32(dst + offset, header.blocksize);
1897             offset += 4;
1898         }
1899
1900         memcpy(dst + offset, src, header.blocksize);
1901         src    += header.blocksize;
1902         srclen -= header.blocksize;
1903         offset += header.blocksize;
1904     }
1905
1906     *pdst = dst;
1907     *size = offset;
1908
1909     return 0;
1910 fail:
1911     av_freep(&dst);
1912     return ret;
1913 }
1914
1915 static void mkv_write_block(AVFormatContext *s, AVIOContext *pb,
1916                             unsigned int blockid, AVPacket *pkt, int keyframe)
1917 {
1918     MatroskaMuxContext *mkv = s->priv_data;
1919     AVCodecParameters *par = s->streams[pkt->stream_index]->codecpar;
1920     uint8_t *data = NULL, *side_data = NULL;
1921     int offset = 0, size = pkt->size, side_data_size = 0;
1922     int64_t ts = mkv->tracks[pkt->stream_index].write_dts ? pkt->dts : pkt->pts;
1923     uint64_t additional_id = 0;
1924     int64_t discard_padding = 0;
1925     uint8_t track_number = (mkv->is_dash ? mkv->dash_track_number : (pkt->stream_index + 1));
1926     ebml_master block_group, block_additions, block_more;
1927
1928     av_log(s, AV_LOG_DEBUG, "Writing block at offset %" PRIu64 ", size %d, "
1929            "pts %" PRId64 ", dts %" PRId64 ", duration %" PRId64 ", keyframe %d\n",
1930            avio_tell(pb), pkt->size, pkt->pts, pkt->dts, pkt->duration,
1931            keyframe != 0);
1932     if (par->codec_id == AV_CODEC_ID_H264 && par->extradata_size > 0 &&
1933         (AV_RB24(par->extradata) == 1 || AV_RB32(par->extradata) == 1))
1934         ff_avc_parse_nal_units_buf(pkt->data, &data, &size);
1935     else if (par->codec_id == AV_CODEC_ID_HEVC && par->extradata_size > 6 &&
1936              (AV_RB24(par->extradata) == 1 || AV_RB32(par->extradata) == 1))
1937         /* extradata is Annex B, assume the bitstream is too and convert it */
1938         ff_hevc_annexb2mp4_buf(pkt->data, &data, &size, 0, NULL);
1939     else if (par->codec_id == AV_CODEC_ID_WAVPACK) {
1940         int ret = mkv_strip_wavpack(pkt->data, &data, &size);
1941         if (ret < 0) {
1942             av_log(s, AV_LOG_ERROR, "Error stripping a WavPack packet.\n");
1943             return;
1944         }
1945     } else
1946         data = pkt->data;
1947
1948     if (par->codec_id == AV_CODEC_ID_PRORES && size >= 8) {
1949         /* Matroska specification requires to remove the first QuickTime atom
1950          */
1951         size  -= 8;
1952         offset = 8;
1953     }
1954
1955     side_data = av_packet_get_side_data(pkt,
1956                                         AV_PKT_DATA_SKIP_SAMPLES,
1957                                         &side_data_size);
1958
1959     if (side_data && side_data_size >= 10) {
1960         discard_padding = av_rescale_q(AV_RL32(side_data + 4),
1961                                        (AVRational){1, par->sample_rate},
1962                                        (AVRational){1, 1000000000});
1963     }
1964
1965     side_data = av_packet_get_side_data(pkt,
1966                                         AV_PKT_DATA_MATROSKA_BLOCKADDITIONAL,
1967                                         &side_data_size);
1968     if (side_data) {
1969         additional_id = AV_RB64(side_data);
1970         side_data += 8;
1971         side_data_size -= 8;
1972     }
1973
1974     if ((side_data_size && additional_id == 1) || discard_padding) {
1975         block_group = start_ebml_master(pb, MATROSKA_ID_BLOCKGROUP, 0);
1976         blockid = MATROSKA_ID_BLOCK;
1977     }
1978
1979     put_ebml_id(pb, blockid);
1980     put_ebml_num(pb, size + 4, 0);
1981     // this assumes stream_index is less than 126
1982     avio_w8(pb, 0x80 | track_number);
1983     avio_wb16(pb, ts - mkv->cluster_pts);
1984     avio_w8(pb, (blockid == MATROSKA_ID_SIMPLEBLOCK && keyframe) ? (1 << 7) : 0);
1985     avio_write(pb, data + offset, size);
1986     if (data != pkt->data)
1987         av_free(data);
1988
1989     if (blockid == MATROSKA_ID_BLOCK && !keyframe) {
1990         put_ebml_sint(pb, MATROSKA_ID_BLOCKREFERENCE,
1991                       mkv->last_track_timestamp[track_number - 1]);
1992     }
1993     mkv->last_track_timestamp[track_number - 1] = ts - mkv->cluster_pts;
1994
1995     if (discard_padding) {
1996         put_ebml_sint(pb, MATROSKA_ID_DISCARDPADDING, discard_padding);
1997     }
1998
1999     if (side_data_size && additional_id == 1) {
2000         block_additions = start_ebml_master(pb, MATROSKA_ID_BLOCKADDITIONS, 0);
2001         block_more = start_ebml_master(pb, MATROSKA_ID_BLOCKMORE, 0);
2002         put_ebml_uint(pb, MATROSKA_ID_BLOCKADDID, 1);
2003         put_ebml_id(pb, MATROSKA_ID_BLOCKADDITIONAL);
2004         put_ebml_num(pb, side_data_size, 0);
2005         avio_write(pb, side_data, side_data_size);
2006         end_ebml_master(pb, block_more);
2007         end_ebml_master(pb, block_additions);
2008     }
2009     if ((side_data_size && additional_id == 1) || discard_padding) {
2010         end_ebml_master(pb, block_group);
2011     }
2012 }
2013
2014 static int mkv_write_vtt_blocks(AVFormatContext *s, AVIOContext *pb, AVPacket *pkt)
2015 {
2016     MatroskaMuxContext *mkv = s->priv_data;
2017     ebml_master blockgroup;
2018     int id_size, settings_size, size;
2019     uint8_t *id, *settings;
2020     int64_t ts = mkv->tracks[pkt->stream_index].write_dts ? pkt->dts : pkt->pts;
2021     const int flags = 0;
2022
2023     id_size = 0;
2024     id = av_packet_get_side_data(pkt, AV_PKT_DATA_WEBVTT_IDENTIFIER,
2025                                  &id_size);
2026
2027     settings_size = 0;
2028     settings = av_packet_get_side_data(pkt, AV_PKT_DATA_WEBVTT_SETTINGS,
2029                                        &settings_size);
2030
2031     size = id_size + 1 + settings_size + 1 + pkt->size;
2032
2033     av_log(s, AV_LOG_DEBUG, "Writing block at offset %" PRIu64 ", size %d, "
2034            "pts %" PRId64 ", dts %" PRId64 ", duration %" PRId64 ", flags %d\n",
2035            avio_tell(pb), size, pkt->pts, pkt->dts, pkt->duration, flags);
2036
2037     blockgroup = start_ebml_master(pb, MATROSKA_ID_BLOCKGROUP, mkv_blockgroup_size(size));
2038
2039     put_ebml_id(pb, MATROSKA_ID_BLOCK);
2040     put_ebml_num(pb, size + 4, 0);
2041     avio_w8(pb, 0x80 | (pkt->stream_index + 1));     // this assumes stream_index is less than 126
2042     avio_wb16(pb, ts - mkv->cluster_pts);
2043     avio_w8(pb, flags);
2044     avio_printf(pb, "%.*s\n%.*s\n%.*s", id_size, id, settings_size, settings, pkt->size, pkt->data);
2045
2046     put_ebml_uint(pb, MATROSKA_ID_BLOCKDURATION, pkt->duration);
2047     end_ebml_master(pb, blockgroup);
2048
2049     return pkt->duration;
2050 }
2051
2052 static void mkv_start_new_cluster(AVFormatContext *s, AVPacket *pkt)
2053 {
2054     MatroskaMuxContext *mkv = s->priv_data;
2055
2056     end_ebml_master_crc32(s->pb, &mkv->dyn_bc, mkv, mkv->cluster);
2057     mkv->cluster_pos = -1;
2058     if (s->pb->seekable)
2059         av_log(s, AV_LOG_DEBUG,
2060                "Starting new cluster at offset %" PRIu64 " bytes, "
2061                "pts %" PRIu64 "dts %" PRIu64 "\n",
2062                avio_tell(s->pb), pkt->pts, pkt->dts);
2063     else
2064         av_log(s, AV_LOG_DEBUG, "Starting new cluster, "
2065                "pts %" PRIu64 "dts %" PRIu64 "\n",
2066                pkt->pts, pkt->dts);
2067     avio_flush(s->pb);
2068 }
2069
2070 static int mkv_write_packet_internal(AVFormatContext *s, AVPacket *pkt, int add_cue)
2071 {
2072     MatroskaMuxContext *mkv = s->priv_data;
2073     AVIOContext *pb         = s->pb;
2074     AVCodecParameters *par  = s->streams[pkt->stream_index]->codecpar;
2075     int keyframe            = !!(pkt->flags & AV_PKT_FLAG_KEY);
2076     int duration            = pkt->duration;
2077     int ret;
2078     int64_t ts = mkv->tracks[pkt->stream_index].write_dts ? pkt->dts : pkt->pts;
2079     int64_t relative_packet_pos;
2080     int dash_tracknum = mkv->is_dash ? mkv->dash_track_number : pkt->stream_index + 1;
2081
2082     if (ts == AV_NOPTS_VALUE) {
2083         av_log(s, AV_LOG_ERROR, "Can't write packet with unknown timestamp\n");
2084         return AVERROR(EINVAL);
2085     }
2086     ts += mkv->tracks[pkt->stream_index].ts_offset;
2087
2088     if (mkv->cluster_pos != -1) {
2089         int64_t cluster_time = ts - mkv->cluster_pts + mkv->tracks[pkt->stream_index].ts_offset;
2090         if ((int16_t)cluster_time != cluster_time) {
2091             av_log(s, AV_LOG_WARNING, "Starting new cluster due to timestamp\n");
2092             mkv_start_new_cluster(s, pkt);
2093         }
2094     }
2095
2096     if (mkv->cluster_pos == -1) {
2097         mkv->cluster_pos = avio_tell(s->pb);
2098         ret = start_ebml_master_crc32(s->pb, &mkv->dyn_bc, &mkv->cluster, MATROSKA_ID_CLUSTER, 0);
2099         if (ret < 0)
2100             return ret;
2101         put_ebml_uint(mkv->dyn_bc, MATROSKA_ID_CLUSTERTIMECODE, FFMAX(0, ts));
2102         mkv->cluster_pts = FFMAX(0, ts);
2103     }
2104     pb = mkv->dyn_bc;
2105
2106     relative_packet_pos = avio_tell(s->pb) - mkv->cluster.pos + avio_tell(pb);
2107
2108     if (par->codec_type != AVMEDIA_TYPE_SUBTITLE) {
2109         mkv_write_block(s, pb, MATROSKA_ID_SIMPLEBLOCK, pkt, keyframe);
2110         if (s->pb->seekable && (par->codec_type == AVMEDIA_TYPE_VIDEO && keyframe || add_cue)) {
2111             ret = mkv_add_cuepoint(mkv->cues, pkt->stream_index, dash_tracknum, ts, mkv->cluster_pos, relative_packet_pos, -1);
2112             if (ret < 0) return ret;
2113         }
2114     } else {
2115         if (par->codec_id == AV_CODEC_ID_WEBVTT) {
2116             duration = mkv_write_vtt_blocks(s, pb, pkt);
2117         } else {
2118             ebml_master blockgroup = start_ebml_master(pb, MATROSKA_ID_BLOCKGROUP,
2119                                                        mkv_blockgroup_size(pkt->size));
2120
2121 #if FF_API_CONVERGENCE_DURATION
2122 FF_DISABLE_DEPRECATION_WARNINGS
2123             /* For backward compatibility, prefer convergence_duration. */
2124             if (pkt->convergence_duration > 0) {
2125                 duration = pkt->convergence_duration;
2126             }
2127 FF_ENABLE_DEPRECATION_WARNINGS
2128 #endif
2129             /* All subtitle blocks are considered to be keyframes. */
2130             mkv_write_block(s, pb, MATROSKA_ID_BLOCK, pkt, 1);
2131             put_ebml_uint(pb, MATROSKA_ID_BLOCKDURATION, duration);
2132             end_ebml_master(pb, blockgroup);
2133         }
2134
2135         if (s->pb->seekable) {
2136             ret = mkv_add_cuepoint(mkv->cues, pkt->stream_index, dash_tracknum, ts,
2137                                    mkv->cluster_pos, relative_packet_pos, duration);
2138             if (ret < 0)
2139                 return ret;
2140         }
2141     }
2142
2143     mkv->duration = FFMAX(mkv->duration, ts + duration);
2144
2145     if (mkv->stream_durations)
2146         mkv->stream_durations[pkt->stream_index] =
2147             FFMAX(mkv->stream_durations[pkt->stream_index], ts + duration);
2148
2149     return 0;
2150 }
2151
2152 static int mkv_write_packet(AVFormatContext *s, AVPacket *pkt)
2153 {
2154     MatroskaMuxContext *mkv = s->priv_data;
2155     int codec_type          = s->streams[pkt->stream_index]->codecpar->codec_type;
2156     int keyframe            = !!(pkt->flags & AV_PKT_FLAG_KEY);
2157     int cluster_size;
2158     int64_t cluster_time;
2159     int ret;
2160     int start_new_cluster;
2161
2162     if (mkv->tracks[pkt->stream_index].write_dts)
2163         cluster_time = pkt->dts - mkv->cluster_pts;
2164     else
2165         cluster_time = pkt->pts - mkv->cluster_pts;
2166     cluster_time += mkv->tracks[pkt->stream_index].ts_offset;
2167
2168     // start a new cluster every 5 MB or 5 sec, or 32k / 1 sec for streaming or
2169     // after 4k and on a keyframe
2170     cluster_size = avio_tell(mkv->dyn_bc);
2171
2172     if (mkv->is_dash && codec_type == AVMEDIA_TYPE_VIDEO) {
2173         // WebM DASH specification states that the first block of every cluster
2174         // has to be a key frame. So for DASH video, we only create a cluster
2175         // on seeing key frames.
2176         start_new_cluster = keyframe;
2177     } else if (mkv->is_dash && codec_type == AVMEDIA_TYPE_AUDIO &&
2178                (mkv->cluster_pos == -1 ||
2179                 cluster_time > mkv->cluster_time_limit)) {
2180         // For DASH audio, we create a Cluster based on cluster_time_limit
2181         start_new_cluster = 1;
2182     } else if (!mkv->is_dash &&
2183                (cluster_size > mkv->cluster_size_limit ||
2184                 cluster_time > mkv->cluster_time_limit ||
2185                 (codec_type == AVMEDIA_TYPE_VIDEO && keyframe &&
2186                  cluster_size > 4 * 1024))) {
2187         start_new_cluster = 1;
2188     } else {
2189         start_new_cluster = 0;
2190     }
2191
2192     if (mkv->cluster_pos != -1 && start_new_cluster) {
2193         mkv_start_new_cluster(s, pkt);
2194     }
2195
2196     if (!mkv->cluster_pos)
2197         avio_write_marker(s->pb,
2198                           av_rescale_q(pkt->dts, s->streams[pkt->stream_index]->time_base, AV_TIME_BASE_Q),
2199                           keyframe && (mkv->have_video ? codec_type == AVMEDIA_TYPE_VIDEO : 1) ? AVIO_DATA_MARKER_SYNC_POINT : AVIO_DATA_MARKER_BOUNDARY_POINT);
2200
2201     // check if we have an audio packet cached
2202     if (mkv->cur_audio_pkt.size > 0) {
2203         // for DASH audio, a CuePoint has to be added when there is a new cluster.
2204         ret = mkv_write_packet_internal(s, &mkv->cur_audio_pkt,
2205                                         mkv->is_dash ? start_new_cluster : 0);
2206         av_packet_unref(&mkv->cur_audio_pkt);
2207         if (ret < 0) {
2208             av_log(s, AV_LOG_ERROR,
2209                    "Could not write cached audio packet ret:%d\n", ret);
2210             return ret;
2211         }
2212     }
2213
2214     // buffer an audio packet to ensure the packet containing the video
2215     // keyframe's timecode is contained in the same cluster for WebM
2216     if (codec_type == AVMEDIA_TYPE_AUDIO) {
2217         ret = av_packet_ref(&mkv->cur_audio_pkt, pkt);
2218     } else
2219         ret = mkv_write_packet_internal(s, pkt, 0);
2220     return ret;
2221 }
2222
2223 static int mkv_write_flush_packet(AVFormatContext *s, AVPacket *pkt)
2224 {
2225     MatroskaMuxContext *mkv = s->priv_data;
2226
2227     if (!pkt) {
2228         if (mkv->cluster_pos != -1) {
2229             end_ebml_master_crc32(s->pb, &mkv->dyn_bc, mkv, mkv->cluster);
2230             mkv->cluster_pos = -1;
2231             if (s->pb->seekable)
2232                 av_log(s, AV_LOG_DEBUG,
2233                        "Flushing cluster at offset %" PRIu64 " bytes\n",
2234                        avio_tell(s->pb));
2235             else
2236                 av_log(s, AV_LOG_DEBUG, "Flushing cluster\n");
2237             avio_flush(s->pb);
2238         }
2239         return 1;
2240     }
2241     return mkv_write_packet(s, pkt);
2242 }
2243
2244 static int mkv_write_trailer(AVFormatContext *s)
2245 {
2246     MatroskaMuxContext *mkv = s->priv_data;
2247     AVIOContext *pb = s->pb;
2248     int64_t currentpos, cuespos;
2249     int ret;
2250
2251     // check if we have an audio packet cached
2252     if (mkv->cur_audio_pkt.size > 0) {
2253         ret = mkv_write_packet_internal(s, &mkv->cur_audio_pkt, 0);
2254         av_packet_unref(&mkv->cur_audio_pkt);
2255         if (ret < 0) {
2256             av_log(s, AV_LOG_ERROR,
2257                    "Could not write cached audio packet ret:%d\n", ret);
2258             return ret;
2259         }
2260     }
2261
2262     if (mkv->dyn_bc) {
2263         end_ebml_master_crc32(pb, &mkv->dyn_bc, mkv, mkv->cluster);
2264     }
2265
2266     if (mkv->mode != MODE_WEBM) {
2267         ret = mkv_write_chapters(s);
2268         if (ret < 0)
2269             return ret;
2270     }
2271
2272     if (pb->seekable) {
2273         if (mkv->cues->num_entries) {
2274             if (mkv->reserve_cues_space) {
2275                 int64_t cues_end;
2276
2277                 currentpos = avio_tell(pb);
2278                 avio_seek(pb, mkv->cues_pos, SEEK_SET);
2279
2280                 cuespos  = mkv_write_cues(s, mkv->cues, mkv->tracks, s->nb_streams);
2281                 cues_end = avio_tell(pb);
2282                 if (cues_end > cuespos + mkv->reserve_cues_space) {
2283                     av_log(s, AV_LOG_ERROR,
2284                            "Insufficient space reserved for cues: %d "
2285                            "(needed: %" PRId64 ").\n",
2286                            mkv->reserve_cues_space, cues_end - cuespos);
2287                     return AVERROR(EINVAL);
2288                 }
2289
2290                 if (cues_end < cuespos + mkv->reserve_cues_space)
2291                     put_ebml_void(pb, mkv->reserve_cues_space -
2292                                   (cues_end - cuespos));
2293
2294                 avio_seek(pb, currentpos, SEEK_SET);
2295             } else {
2296                 cuespos = mkv_write_cues(s, mkv->cues, mkv->tracks, s->nb_streams);
2297             }
2298
2299             ret = mkv_add_seekhead_entry(mkv->main_seekhead, MATROSKA_ID_CUES,
2300                                          cuespos);
2301             if (ret < 0)
2302                 return ret;
2303         }
2304
2305         mkv_write_seekhead(pb, mkv);
2306
2307         // update the duration
2308         av_log(s, AV_LOG_DEBUG, "end duration = %" PRIu64 "\n", mkv->duration);
2309         currentpos = avio_tell(pb);
2310         avio_seek(mkv->info_bc, mkv->duration_offset, SEEK_SET);
2311         put_ebml_float(mkv->info_bc, MATROSKA_ID_DURATION, mkv->duration);
2312         avio_seek(pb, mkv->info.pos, SEEK_SET);
2313         end_ebml_master_crc32(pb, &mkv->info_bc, mkv, mkv->info);
2314
2315         // update stream durations
2316         if (!mkv->is_live && mkv->stream_durations) {
2317             int i;
2318             int64_t curr = avio_tell(mkv->tags_bc);
2319             for (i = 0; i < s->nb_streams; ++i) {
2320                 AVStream *st = s->streams[i];
2321
2322                 if (mkv->stream_duration_offsets[i] > 0) {
2323                     double duration_sec = mkv->stream_durations[i] * av_q2d(st->time_base);
2324                     char duration_string[20] = "";
2325
2326                     av_log(s, AV_LOG_DEBUG, "stream %d end duration = %" PRIu64 "\n", i,
2327                            mkv->stream_durations[i]);
2328
2329                     avio_seek(mkv->tags_bc, mkv->stream_duration_offsets[i], SEEK_SET);
2330
2331                     snprintf(duration_string, 20, "%02d:%02d:%012.9f",
2332                              (int) duration_sec / 3600, ((int) duration_sec / 60) % 60,
2333                              fmod(duration_sec, 60));
2334
2335                     put_ebml_binary(mkv->tags_bc, MATROSKA_ID_TAGSTRING, duration_string, 20);
2336                 }
2337             }
2338             avio_seek(mkv->tags_bc, curr, SEEK_SET);
2339         }
2340         if (mkv->tags.pos && !mkv->is_live) {
2341             avio_seek(pb, mkv->tags.pos, SEEK_SET);
2342             end_ebml_master_crc32(pb, &mkv->tags_bc, mkv, mkv->tags);
2343         }
2344
2345         avio_seek(pb, currentpos, SEEK_SET);
2346     }
2347
2348     if (!mkv->is_live) {
2349         end_ebml_master(pb, mkv->segment);
2350     }
2351
2352     mkv_free(mkv);
2353     return 0;
2354 }
2355
2356 static int mkv_query_codec(enum AVCodecID codec_id, int std_compliance)
2357 {
2358     int i;
2359     for (i = 0; ff_mkv_codec_tags[i].id != AV_CODEC_ID_NONE; i++)
2360         if (ff_mkv_codec_tags[i].id == codec_id)
2361             return 1;
2362
2363     if (std_compliance < FF_COMPLIANCE_NORMAL) {
2364         enum AVMediaType type = avcodec_get_type(codec_id);
2365         // mkv theoretically supports any video/audio through VFW/ACM
2366         if (type == AVMEDIA_TYPE_VIDEO || type == AVMEDIA_TYPE_AUDIO)
2367             return 1;
2368     }
2369
2370     return 0;
2371 }
2372
2373 static int mkv_init(struct AVFormatContext *s)
2374 {
2375     int i;
2376
2377     if (s->avoid_negative_ts < 0) {
2378         s->avoid_negative_ts = 1;
2379         s->internal->avoid_negative_ts_use_pts = 1;
2380     }
2381
2382     for (i = 0; i < s->nb_streams; i++) {
2383         // ms precision is the de-facto standard timescale for mkv files
2384         avpriv_set_pts_info(s->streams[i], 64, 1, 1000);
2385     }
2386
2387     return 0;
2388 }
2389
2390 static int mkv_check_bitstream(struct AVFormatContext *s, const AVPacket *pkt)
2391 {
2392     int ret = 1;
2393     AVStream *st = s->streams[pkt->stream_index];
2394
2395     if (st->codecpar->codec_id == AV_CODEC_ID_AAC) {
2396         if (pkt->size > 2 && (AV_RB16(pkt->data) & 0xfff0) == 0xfff0)
2397             ret = ff_stream_add_bitstream_filter(st, "aac_adtstoasc", NULL);
2398     } else if (st->codecpar->codec_id == AV_CODEC_ID_VP9) {
2399         ret = ff_stream_add_bitstream_filter(st, "vp9_superframe", NULL);
2400     }
2401
2402     return ret;
2403 }
2404
2405 static const AVCodecTag additional_audio_tags[] = {
2406     { AV_CODEC_ID_ALAC,      0XFFFFFFFF },
2407     { AV_CODEC_ID_EAC3,      0XFFFFFFFF },
2408     { AV_CODEC_ID_MLP,       0xFFFFFFFF },
2409     { AV_CODEC_ID_OPUS,      0xFFFFFFFF },
2410     { AV_CODEC_ID_PCM_S16BE, 0xFFFFFFFF },
2411     { AV_CODEC_ID_PCM_S24BE, 0xFFFFFFFF },
2412     { AV_CODEC_ID_PCM_S32BE, 0xFFFFFFFF },
2413     { AV_CODEC_ID_QDM2,      0xFFFFFFFF },
2414     { AV_CODEC_ID_RA_144,    0xFFFFFFFF },
2415     { AV_CODEC_ID_RA_288,    0xFFFFFFFF },
2416     { AV_CODEC_ID_COOK,      0xFFFFFFFF },
2417     { AV_CODEC_ID_TRUEHD,    0xFFFFFFFF },
2418     { AV_CODEC_ID_NONE,      0xFFFFFFFF }
2419 };
2420
2421 static const AVCodecTag additional_video_tags[] = {
2422     { AV_CODEC_ID_RV10,      0xFFFFFFFF },
2423     { AV_CODEC_ID_RV20,      0xFFFFFFFF },
2424     { AV_CODEC_ID_RV30,      0xFFFFFFFF },
2425     { AV_CODEC_ID_RV40,      0xFFFFFFFF },
2426     { AV_CODEC_ID_VP9,       0xFFFFFFFF },
2427     { AV_CODEC_ID_NONE,      0xFFFFFFFF }
2428 };
2429
2430 static const AVCodecTag additional_subtitle_tags[] = {
2431     { AV_CODEC_ID_DVB_SUBTITLE,      0xFFFFFFFF },
2432     { AV_CODEC_ID_HDMV_PGS_SUBTITLE, 0xFFFFFFFF },
2433     { AV_CODEC_ID_NONE,              0xFFFFFFFF }
2434 };
2435
2436 #define OFFSET(x) offsetof(MatroskaMuxContext, x)
2437 #define FLAGS AV_OPT_FLAG_ENCODING_PARAM
2438 static const AVOption options[] = {
2439     { "reserve_index_space", "Reserve a given amount of space (in bytes) at the beginning of the file for the index (cues).", OFFSET(reserve_cues_space), AV_OPT_TYPE_INT,   { .i64 = 0 },   0, INT_MAX,   FLAGS },
2440     { "cluster_size_limit",  "Store at most the provided amount of bytes in a cluster. ",                                     OFFSET(cluster_size_limit), AV_OPT_TYPE_INT  , { .i64 = -1 }, -1, INT_MAX,   FLAGS },
2441     { "cluster_time_limit",  "Store at most the provided number of milliseconds in a cluster.",                               OFFSET(cluster_time_limit), AV_OPT_TYPE_INT64, { .i64 = -1 }, -1, INT64_MAX, FLAGS },
2442     { "dash", "Create a WebM file conforming to WebM DASH specification", OFFSET(is_dash), AV_OPT_TYPE_BOOL, { .i64 = 0 }, 0, 1, FLAGS },
2443     { "dash_track_number", "Track number for the DASH stream", OFFSET(dash_track_number), AV_OPT_TYPE_INT, { .i64 = 1 }, 0, 127, FLAGS },
2444     { "live", "Write files assuming it is a live stream.", OFFSET(is_live), AV_OPT_TYPE_BOOL, { .i64 = 0 }, 0, 1, FLAGS },
2445     { "allow_raw_vfw", "allow RAW VFW mode", OFFSET(allow_raw_vfw), AV_OPT_TYPE_BOOL, { .i64 = 0 }, 0, 1, FLAGS },
2446     { "write_crc32", "write a CRC32 element inside every Level 1 element", OFFSET(write_crc), AV_OPT_TYPE_BOOL, { .i64 = 1 }, 0, 1, FLAGS },
2447     { NULL },
2448 };
2449
2450 #if CONFIG_MATROSKA_MUXER
2451 static const AVClass matroska_class = {
2452     .class_name = "matroska muxer",
2453     .item_name  = av_default_item_name,
2454     .option     = options,
2455     .version    = LIBAVUTIL_VERSION_INT,
2456 };
2457
2458 AVOutputFormat ff_matroska_muxer = {
2459     .name              = "matroska",
2460     .long_name         = NULL_IF_CONFIG_SMALL("Matroska"),
2461     .mime_type         = "video/x-matroska",
2462     .extensions        = "mkv",
2463     .priv_data_size    = sizeof(MatroskaMuxContext),
2464     .audio_codec       = CONFIG_LIBVORBIS_ENCODER ?
2465                          AV_CODEC_ID_VORBIS : AV_CODEC_ID_AC3,
2466     .video_codec       = CONFIG_LIBX264_ENCODER ?
2467                          AV_CODEC_ID_H264 : AV_CODEC_ID_MPEG4,
2468     .init              = mkv_init,
2469     .write_header      = mkv_write_header,
2470     .write_packet      = mkv_write_flush_packet,
2471     .write_trailer     = mkv_write_trailer,
2472     .flags             = AVFMT_GLOBALHEADER | AVFMT_VARIABLE_FPS |
2473                          AVFMT_TS_NONSTRICT | AVFMT_ALLOW_FLUSH,
2474     .codec_tag         = (const AVCodecTag* const []){
2475          ff_codec_bmp_tags, ff_codec_wav_tags,
2476          additional_audio_tags, additional_video_tags, additional_subtitle_tags, 0
2477     },
2478     .subtitle_codec    = AV_CODEC_ID_ASS,
2479     .query_codec       = mkv_query_codec,
2480     .check_bitstream   = mkv_check_bitstream,
2481     .priv_class        = &matroska_class,
2482 };
2483 #endif
2484
2485 #if CONFIG_WEBM_MUXER
2486 static const AVClass webm_class = {
2487     .class_name = "webm muxer",
2488     .item_name  = av_default_item_name,
2489     .option     = options,
2490     .version    = LIBAVUTIL_VERSION_INT,
2491 };
2492
2493 AVOutputFormat ff_webm_muxer = {
2494     .name              = "webm",
2495     .long_name         = NULL_IF_CONFIG_SMALL("WebM"),
2496     .mime_type         = "video/webm",
2497     .extensions        = "webm",
2498     .priv_data_size    = sizeof(MatroskaMuxContext),
2499     .audio_codec       = CONFIG_LIBOPUS_ENCODER ? AV_CODEC_ID_OPUS : AV_CODEC_ID_VORBIS,
2500     .video_codec       = CONFIG_LIBVPX_VP9_ENCODER? AV_CODEC_ID_VP9 : AV_CODEC_ID_VP8,
2501     .subtitle_codec    = AV_CODEC_ID_WEBVTT,
2502     .init              = mkv_init,
2503     .write_header      = mkv_write_header,
2504     .write_packet      = mkv_write_flush_packet,
2505     .write_trailer     = mkv_write_trailer,
2506     .check_bitstream   = mkv_check_bitstream,
2507     .flags             = AVFMT_GLOBALHEADER | AVFMT_VARIABLE_FPS |
2508                          AVFMT_TS_NONSTRICT | AVFMT_ALLOW_FLUSH,
2509     .priv_class        = &webm_class,
2510 };
2511 #endif
2512
2513 #if CONFIG_MATROSKA_AUDIO_MUXER
2514 static const AVClass mka_class = {
2515     .class_name = "matroska audio muxer",
2516     .item_name  = av_default_item_name,
2517     .option     = options,
2518     .version    = LIBAVUTIL_VERSION_INT,
2519 };
2520 AVOutputFormat ff_matroska_audio_muxer = {
2521     .name              = "matroska",
2522     .long_name         = NULL_IF_CONFIG_SMALL("Matroska Audio"),
2523     .mime_type         = "audio/x-matroska",
2524     .extensions        = "mka",
2525     .priv_data_size    = sizeof(MatroskaMuxContext),
2526     .audio_codec       = CONFIG_LIBVORBIS_ENCODER ?
2527                          AV_CODEC_ID_VORBIS : AV_CODEC_ID_AC3,
2528     .video_codec       = AV_CODEC_ID_NONE,
2529     .init              = mkv_init,
2530     .write_header      = mkv_write_header,
2531     .write_packet      = mkv_write_flush_packet,
2532     .write_trailer     = mkv_write_trailer,
2533     .check_bitstream   = mkv_check_bitstream,
2534     .flags             = AVFMT_GLOBALHEADER | AVFMT_TS_NONSTRICT |
2535                          AVFMT_ALLOW_FLUSH,
2536     .codec_tag         = (const AVCodecTag* const []){
2537         ff_codec_wav_tags, additional_audio_tags, 0
2538     },
2539     .priv_class        = &mka_class,
2540 };
2541 #endif