]> git.sesse.net Git - ffmpeg/blob - libavformat/matroskaenc.c
avformat/matroskaenc: write a CRC32 element on Info
[ffmpeg] / libavformat / matroskaenc.c
1 /*
2  * Matroska muxer
3  * Copyright (c) 2007 David Conrad
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include <stdint.h>
23
24 #include "avc.h"
25 #include "hevc.h"
26 #include "avformat.h"
27 #include "avio_internal.h"
28 #include "avlanguage.h"
29 #include "flacenc.h"
30 #include "internal.h"
31 #include "isom.h"
32 #include "matroska.h"
33 #include "riff.h"
34 #include "subtitles.h"
35 #include "vorbiscomment.h"
36 #include "wv.h"
37
38 #include "libavutil/avstring.h"
39 #include "libavutil/channel_layout.h"
40 #include "libavutil/crc.h"
41 #include "libavutil/dict.h"
42 #include "libavutil/intfloat.h"
43 #include "libavutil/intreadwrite.h"
44 #include "libavutil/lfg.h"
45 #include "libavutil/mastering_display_metadata.h"
46 #include "libavutil/mathematics.h"
47 #include "libavutil/opt.h"
48 #include "libavutil/parseutils.h"
49 #include "libavutil/random_seed.h"
50 #include "libavutil/rational.h"
51 #include "libavutil/samplefmt.h"
52 #include "libavutil/sha.h"
53 #include "libavutil/stereo3d.h"
54
55 #include "libavcodec/xiph.h"
56 #include "libavcodec/mpeg4audio.h"
57 #include "libavcodec/internal.h"
58
59 typedef struct ebml_master {
60     int64_t         pos;                ///< absolute offset in the file where the master's elements start
61     int             sizebytes;          ///< how many bytes were reserved for the size
62 } ebml_master;
63
64 typedef struct mkv_seekhead_entry {
65     unsigned int    elementid;
66     uint64_t        segmentpos;
67 } mkv_seekhead_entry;
68
69 typedef struct mkv_seekhead {
70     int64_t                 filepos;
71     int64_t                 segment_offset;     ///< the file offset to the beginning of the segment
72     int                     reserved_size;      ///< -1 if appending to file
73     int                     max_entries;
74     mkv_seekhead_entry      *entries;
75     int                     num_entries;
76 } mkv_seekhead;
77
78 typedef struct mkv_cuepoint {
79     uint64_t        pts;
80     int             stream_idx;
81     int             tracknum;
82     int64_t         cluster_pos;        ///< file offset of the cluster containing the block
83     int64_t         relative_pos;       ///< relative offset from the position of the cluster containing the block
84     int64_t         duration;           ///< duration of the block according to time base
85 } mkv_cuepoint;
86
87 typedef struct mkv_cues {
88     int64_t         segment_offset;
89     mkv_cuepoint    *entries;
90     int             num_entries;
91 } mkv_cues;
92
93 typedef struct mkv_track {
94     int             write_dts;
95     int             has_cue;
96     int64_t         ts_offset;
97 } mkv_track;
98
99 #define MODE_MATROSKAv2 0x01
100 #define MODE_WEBM       0x02
101
102 /** Maximum number of tracks allowed in a Matroska file (with track numbers in
103  * range 1 to 126 (inclusive) */
104 #define MAX_TRACKS 126
105
106 typedef struct MatroskaMuxContext {
107     const AVClass  *class;
108     int             mode;
109     AVIOContext   *dyn_bc;
110     AVIOContext     *tags_bc;
111     ebml_master     tags;
112     AVIOContext     *info_bc;
113     ebml_master     info;
114     ebml_master     segment;
115     int64_t         segment_offset;
116     ebml_master     cluster;
117     int64_t         cluster_pos;        ///< file offset of the current cluster
118     int64_t         cluster_pts;
119     int64_t         duration_offset;
120     int64_t         duration;
121     mkv_seekhead    *main_seekhead;
122     mkv_cues        *cues;
123     mkv_track       *tracks;
124
125     AVPacket        cur_audio_pkt;
126
127     int have_attachments;
128     int have_video;
129
130     int reserve_cues_space;
131     int cluster_size_limit;
132     int64_t cues_pos;
133     int64_t cluster_time_limit;
134     int is_dash;
135     int dash_track_number;
136     int is_live;
137
138     uint32_t chapter_id_offset;
139     int wrote_chapters;
140
141     int64_t last_track_timestamp[MAX_TRACKS];
142
143     int64_t* stream_durations;
144     int64_t* stream_duration_offsets;
145
146     int allow_raw_vfw;
147 } MatroskaMuxContext;
148
149
150 /** 2 bytes * 3 for EBML IDs, 3 1-byte EBML lengths, 8 bytes for 64 bit
151  * offset, 4 bytes for target EBML ID */
152 #define MAX_SEEKENTRY_SIZE 21
153
154 /** per-cuepoint-track - 5 1-byte EBML IDs, 5 1-byte EBML sizes, 4
155  * 8-byte uint max */
156 #define MAX_CUETRACKPOS_SIZE 42
157
158 /** per-cuepoint - 2 1-byte EBML IDs, 2 1-byte EBML sizes, 8-byte uint max */
159 #define MAX_CUEPOINT_SIZE(num_tracks) 12 + MAX_CUETRACKPOS_SIZE * num_tracks
160
161 /** Seek preroll value for opus */
162 #define OPUS_SEEK_PREROLL 80000000
163
164 static int ebml_id_size(unsigned int id)
165 {
166     return (av_log2(id + 1) - 1) / 7 + 1;
167 }
168
169 static void put_ebml_id(AVIOContext *pb, unsigned int id)
170 {
171     int i = ebml_id_size(id);
172     while (i--)
173         avio_w8(pb, (uint8_t)(id >> (i * 8)));
174 }
175
176 /**
177  * Write an EBML size meaning "unknown size".
178  *
179  * @param bytes The number of bytes the size should occupy (maximum: 8).
180  */
181 static void put_ebml_size_unknown(AVIOContext *pb, int bytes)
182 {
183     av_assert0(bytes <= 8);
184     avio_w8(pb, 0x1ff >> bytes);
185     ffio_fill(pb, 0xff, bytes - 1);
186 }
187
188 /**
189  * Calculate how many bytes are needed to represent a given number in EBML.
190  */
191 static int ebml_num_size(uint64_t num)
192 {
193     int bytes = 1;
194     while ((num + 1) >> bytes * 7)
195         bytes++;
196     return bytes;
197 }
198
199 /**
200  * Write a number in EBML variable length format.
201  *
202  * @param bytes The number of bytes that need to be used to write the number.
203  *              If zero, any number of bytes can be used.
204  */
205 static void put_ebml_num(AVIOContext *pb, uint64_t num, int bytes)
206 {
207     int i, needed_bytes = ebml_num_size(num);
208
209     // sizes larger than this are currently undefined in EBML
210     av_assert0(num < (1ULL << 56) - 1);
211
212     if (bytes == 0)
213         // don't care how many bytes are used, so use the min
214         bytes = needed_bytes;
215     // the bytes needed to write the given size would exceed the bytes
216     // that we need to use, so write unknown size. This shouldn't happen.
217     av_assert0(bytes >= needed_bytes);
218
219     num |= 1ULL << bytes * 7;
220     for (i = bytes - 1; i >= 0; i--)
221         avio_w8(pb, (uint8_t)(num >> i * 8));
222 }
223
224 static void put_ebml_uint(AVIOContext *pb, unsigned int elementid, uint64_t val)
225 {
226     int i, bytes = 1;
227     uint64_t tmp = val;
228     while (tmp >>= 8)
229         bytes++;
230
231     put_ebml_id(pb, elementid);
232     put_ebml_num(pb, bytes, 0);
233     for (i = bytes - 1; i >= 0; i--)
234         avio_w8(pb, (uint8_t)(val >> i * 8));
235 }
236
237 static void put_ebml_sint(AVIOContext *pb, unsigned int elementid, int64_t val)
238 {
239     int i, bytes = 1;
240     uint64_t tmp = 2*(val < 0 ? val^-1 : val);
241
242     while (tmp>>=8) bytes++;
243
244     put_ebml_id(pb, elementid);
245     put_ebml_num(pb, bytes, 0);
246     for (i = bytes - 1; i >= 0; i--)
247         avio_w8(pb, (uint8_t)(val >> i * 8));
248 }
249
250 static void put_ebml_float(AVIOContext *pb, unsigned int elementid, double val)
251 {
252     put_ebml_id(pb, elementid);
253     put_ebml_num(pb, 8, 0);
254     avio_wb64(pb, av_double2int(val));
255 }
256
257 static void put_ebml_binary(AVIOContext *pb, unsigned int elementid,
258                             const void *buf, int size)
259 {
260     put_ebml_id(pb, elementid);
261     put_ebml_num(pb, size, 0);
262     avio_write(pb, buf, size);
263 }
264
265 static void put_ebml_string(AVIOContext *pb, unsigned int elementid,
266                             const char *str)
267 {
268     put_ebml_binary(pb, elementid, str, strlen(str));
269 }
270
271 /**
272  * Write a void element of a given size. Useful for reserving space in
273  * the file to be written to later.
274  *
275  * @param size The number of bytes to reserve, which must be at least 2.
276  */
277 static void put_ebml_void(AVIOContext *pb, uint64_t size)
278 {
279     int64_t currentpos = avio_tell(pb);
280
281     av_assert0(size >= 2);
282
283     put_ebml_id(pb, EBML_ID_VOID);
284     // we need to subtract the length needed to store the size from the
285     // size we need to reserve so 2 cases, we use 8 bytes to store the
286     // size if possible, 1 byte otherwise
287     if (size < 10)
288         put_ebml_num(pb, size - 2, 0);
289     else
290         put_ebml_num(pb, size - 9, 8);
291     ffio_fill(pb, 0, currentpos + size - avio_tell(pb));
292 }
293
294 static ebml_master start_ebml_master(AVIOContext *pb, unsigned int elementid,
295                                      uint64_t expectedsize)
296 {
297     int bytes = expectedsize ? ebml_num_size(expectedsize) : 8;
298     put_ebml_id(pb, elementid);
299     put_ebml_size_unknown(pb, bytes);
300     return (ebml_master) {avio_tell(pb), bytes };
301 }
302
303 static void end_ebml_master(AVIOContext *pb, ebml_master master)
304 {
305     int64_t pos = avio_tell(pb);
306
307     if (avio_seek(pb, master.pos - master.sizebytes, SEEK_SET) < 0)
308         return;
309     put_ebml_num(pb, pos - master.pos, master.sizebytes);
310     avio_seek(pb, pos, SEEK_SET);
311 }
312
313 static int start_ebml_master_crc32(AVIOContext *pb, AVIOContext **dyn_cp, ebml_master *master,
314                                    unsigned int elementid, uint64_t expectedsize)
315 {
316     int ret;
317
318     if (ret = avio_open_dyn_buf(dyn_cp) < 0)
319         return ret;
320
321     if (pb->seekable)
322         *master = start_ebml_master(pb, elementid, expectedsize);
323     else
324         *master = start_ebml_master(*dyn_cp, elementid, expectedsize);
325
326     return 0;
327 }
328
329 static void end_ebml_master_crc32(AVIOContext *pb, AVIOContext **dyn_cp, MatroskaMuxContext *mkv,
330                                   ebml_master master)
331 {
332     uint8_t *buf, crc[4];
333     int size;
334
335     if (pb->seekable) {
336         size = avio_close_dyn_buf(*dyn_cp, &buf);
337         if (mkv->mode != MODE_WEBM) {
338             AV_WL32(crc, av_crc(av_crc_get_table(AV_CRC_32_IEEE_LE), UINT32_MAX, buf, size) ^ UINT32_MAX);
339             put_ebml_binary(pb, EBML_ID_CRC32, crc, sizeof(crc));
340         }
341         avio_write(pb, buf, size);
342         end_ebml_master(pb, master);
343     } else {
344         end_ebml_master(*dyn_cp, master);
345         size = avio_close_dyn_buf(*dyn_cp, &buf);
346         avio_write(pb, buf, size);
347     }
348     av_free(buf);
349     *dyn_cp = NULL;
350 }
351
352 static void put_xiph_size(AVIOContext *pb, int size)
353 {
354     ffio_fill(pb, 255, size / 255);
355     avio_w8(pb, size % 255);
356 }
357
358 /**
359  * Free the members allocated in the mux context.
360  */
361 static void mkv_free(MatroskaMuxContext *mkv) {
362     if (mkv->main_seekhead) {
363         av_freep(&mkv->main_seekhead->entries);
364         av_freep(&mkv->main_seekhead);
365     }
366     if (mkv->cues) {
367         av_freep(&mkv->cues->entries);
368         av_freep(&mkv->cues);
369     }
370     av_freep(&mkv->tracks);
371     av_freep(&mkv->stream_durations);
372     av_freep(&mkv->stream_duration_offsets);
373 }
374
375 /**
376  * Initialize a mkv_seekhead element to be ready to index level 1 Matroska
377  * elements. If a maximum number of elements is specified, enough space
378  * will be reserved at the current file location to write a seek head of
379  * that size.
380  *
381  * @param segment_offset The absolute offset to the position in the file
382  *                       where the segment begins.
383  * @param numelements The maximum number of elements that will be indexed
384  *                    by this seek head, 0 if unlimited.
385  */
386 static mkv_seekhead *mkv_start_seekhead(AVIOContext *pb, int64_t segment_offset,
387                                         int numelements)
388 {
389     mkv_seekhead *new_seekhead = av_mallocz(sizeof(mkv_seekhead));
390     if (!new_seekhead)
391         return NULL;
392
393     new_seekhead->segment_offset = segment_offset;
394
395     if (numelements > 0) {
396         new_seekhead->filepos = avio_tell(pb);
397         // 21 bytes max for a seek entry, 10 bytes max for the SeekHead ID
398         // and size, 6 bytes for a CRC32 element, and 3 bytes to guarantee
399         // that an EBML void element will fit afterwards
400         new_seekhead->reserved_size = numelements * MAX_SEEKENTRY_SIZE + 19;
401         new_seekhead->max_entries   = numelements;
402         put_ebml_void(pb, new_seekhead->reserved_size);
403     }
404     return new_seekhead;
405 }
406
407 static int mkv_add_seekhead_entry(mkv_seekhead *seekhead, unsigned int elementid, uint64_t filepos)
408 {
409     mkv_seekhead_entry *entries = seekhead->entries;
410
411     // don't store more elements than we reserved space for
412     if (seekhead->max_entries > 0 && seekhead->max_entries <= seekhead->num_entries)
413         return -1;
414
415     entries = av_realloc_array(entries, seekhead->num_entries + 1, sizeof(mkv_seekhead_entry));
416     if (!entries)
417         return AVERROR(ENOMEM);
418     seekhead->entries = entries;
419
420     seekhead->entries[seekhead->num_entries].elementid    = elementid;
421     seekhead->entries[seekhead->num_entries++].segmentpos = filepos - seekhead->segment_offset;
422
423     return 0;
424 }
425
426 /**
427  * Write the seek head to the file and free it. If a maximum number of
428  * elements was specified to mkv_start_seekhead(), the seek head will
429  * be written at the location reserved for it. Otherwise, it is written
430  * at the current location in the file.
431  *
432  * @return The file offset where the seekhead was written,
433  * -1 if an error occurred.
434  */
435 static int64_t mkv_write_seekhead(AVIOContext *pb, MatroskaMuxContext *mkv)
436 {
437     AVIOContext *dyn_cp;
438     mkv_seekhead *seekhead = mkv->main_seekhead;
439     ebml_master metaseek, seekentry;
440     int64_t currentpos;
441     int i;
442
443     currentpos = avio_tell(pb);
444
445     if (seekhead->reserved_size > 0) {
446         if (avio_seek(pb, seekhead->filepos, SEEK_SET) < 0) {
447             currentpos = -1;
448             goto fail;
449         }
450     }
451
452     if (start_ebml_master_crc32(pb, &dyn_cp, &metaseek, MATROSKA_ID_SEEKHEAD,
453                                 seekhead->reserved_size) < 0) {
454         currentpos = -1;
455         goto fail;
456     }
457
458     for (i = 0; i < seekhead->num_entries; i++) {
459         mkv_seekhead_entry *entry = &seekhead->entries[i];
460
461         seekentry = start_ebml_master(dyn_cp, MATROSKA_ID_SEEKENTRY, MAX_SEEKENTRY_SIZE);
462
463         put_ebml_id(dyn_cp, MATROSKA_ID_SEEKID);
464         put_ebml_num(dyn_cp, ebml_id_size(entry->elementid), 0);
465         put_ebml_id(dyn_cp, entry->elementid);
466
467         put_ebml_uint(dyn_cp, MATROSKA_ID_SEEKPOSITION, entry->segmentpos);
468         end_ebml_master(dyn_cp, seekentry);
469     }
470     end_ebml_master_crc32(pb, &dyn_cp, mkv, metaseek);
471
472     if (seekhead->reserved_size > 0) {
473         uint64_t remaining = seekhead->filepos + seekhead->reserved_size - avio_tell(pb);
474         put_ebml_void(pb, remaining);
475         avio_seek(pb, currentpos, SEEK_SET);
476
477         currentpos = seekhead->filepos;
478     }
479 fail:
480     av_freep(&mkv->main_seekhead->entries);
481     av_freep(&mkv->main_seekhead);
482
483     return currentpos;
484 }
485
486 static mkv_cues *mkv_start_cues(int64_t segment_offset)
487 {
488     mkv_cues *cues = av_mallocz(sizeof(mkv_cues));
489     if (!cues)
490         return NULL;
491
492     cues->segment_offset = segment_offset;
493     return cues;
494 }
495
496 static int mkv_add_cuepoint(mkv_cues *cues, int stream, int tracknum, int64_t ts,
497                             int64_t cluster_pos, int64_t relative_pos, int64_t duration)
498 {
499     mkv_cuepoint *entries = cues->entries;
500
501     if (ts < 0)
502         return 0;
503
504     entries = av_realloc_array(entries, cues->num_entries + 1, sizeof(mkv_cuepoint));
505     if (!entries)
506         return AVERROR(ENOMEM);
507     cues->entries = entries;
508
509     cues->entries[cues->num_entries].pts           = ts;
510     cues->entries[cues->num_entries].stream_idx    = stream;
511     cues->entries[cues->num_entries].tracknum      = tracknum;
512     cues->entries[cues->num_entries].cluster_pos   = cluster_pos - cues->segment_offset;
513     cues->entries[cues->num_entries].relative_pos  = relative_pos;
514     cues->entries[cues->num_entries++].duration    = duration;
515
516     return 0;
517 }
518
519 static int64_t mkv_write_cues(AVFormatContext *s, mkv_cues *cues, mkv_track *tracks, int num_tracks)
520 {
521     MatroskaMuxContext *mkv = s->priv_data;
522     AVIOContext *dyn_cp, *pb = s->pb;
523     ebml_master cues_element;
524     int64_t currentpos;
525     int i, j, ret;
526
527     currentpos = avio_tell(pb);
528     ret = start_ebml_master_crc32(pb, &dyn_cp, &cues_element, MATROSKA_ID_CUES, 0);
529     if (ret < 0)
530         return ret;
531
532     for (i = 0; i < cues->num_entries; i++) {
533         ebml_master cuepoint, track_positions;
534         mkv_cuepoint *entry = &cues->entries[i];
535         uint64_t pts = entry->pts;
536         int ctp_nb = 0;
537
538         // Calculate the number of entries, so we know the element size
539         for (j = 0; j < num_tracks; j++)
540             tracks[j].has_cue = 0;
541         for (j = 0; j < cues->num_entries - i && entry[j].pts == pts; j++) {
542             int tracknum = entry[j].stream_idx;
543             av_assert0(tracknum>=0 && tracknum<num_tracks);
544             if (tracks[tracknum].has_cue && s->streams[tracknum]->codecpar->codec_type != AVMEDIA_TYPE_SUBTITLE)
545                 continue;
546             tracks[tracknum].has_cue = 1;
547             ctp_nb ++;
548         }
549
550         cuepoint = start_ebml_master(dyn_cp, MATROSKA_ID_POINTENTRY, MAX_CUEPOINT_SIZE(ctp_nb));
551         put_ebml_uint(dyn_cp, MATROSKA_ID_CUETIME, pts);
552
553         // put all the entries from different tracks that have the exact same
554         // timestamp into the same CuePoint
555         for (j = 0; j < num_tracks; j++)
556             tracks[j].has_cue = 0;
557         for (j = 0; j < cues->num_entries - i && entry[j].pts == pts; j++) {
558             int tracknum = entry[j].stream_idx;
559             av_assert0(tracknum>=0 && tracknum<num_tracks);
560             if (tracks[tracknum].has_cue && s->streams[tracknum]->codecpar->codec_type != AVMEDIA_TYPE_SUBTITLE)
561                 continue;
562             tracks[tracknum].has_cue = 1;
563             track_positions = start_ebml_master(dyn_cp, MATROSKA_ID_CUETRACKPOSITION, MAX_CUETRACKPOS_SIZE);
564             put_ebml_uint(dyn_cp, MATROSKA_ID_CUETRACK           , entry[j].tracknum   );
565             put_ebml_uint(dyn_cp, MATROSKA_ID_CUECLUSTERPOSITION , entry[j].cluster_pos);
566             put_ebml_uint(dyn_cp, MATROSKA_ID_CUERELATIVEPOSITION, entry[j].relative_pos);
567             if (entry[j].duration != -1)
568                 put_ebml_uint(dyn_cp, MATROSKA_ID_CUEDURATION    , entry[j].duration);
569             end_ebml_master(dyn_cp, track_positions);
570         }
571         i += j - 1;
572         end_ebml_master(dyn_cp, cuepoint);
573     }
574     end_ebml_master_crc32(pb, &dyn_cp, mkv, cues_element);
575
576     return currentpos;
577 }
578
579 static int put_xiph_codecpriv(AVFormatContext *s, AVIOContext *pb, AVCodecParameters *par)
580 {
581     const uint8_t *header_start[3];
582     int header_len[3];
583     int first_header_size;
584     int j;
585
586     if (par->codec_id == AV_CODEC_ID_VORBIS)
587         first_header_size = 30;
588     else
589         first_header_size = 42;
590
591     if (avpriv_split_xiph_headers(par->extradata, par->extradata_size,
592                               first_header_size, header_start, header_len) < 0) {
593         av_log(s, AV_LOG_ERROR, "Extradata corrupt.\n");
594         return -1;
595     }
596
597     avio_w8(pb, 2);                    // number packets - 1
598     for (j = 0; j < 2; j++) {
599         put_xiph_size(pb, header_len[j]);
600     }
601     for (j = 0; j < 3; j++)
602         avio_write(pb, header_start[j], header_len[j]);
603
604     return 0;
605 }
606
607 static int put_wv_codecpriv(AVIOContext *pb, AVCodecParameters *par)
608 {
609     if (par->extradata && par->extradata_size == 2)
610         avio_write(pb, par->extradata, 2);
611     else
612         avio_wl16(pb, 0x403); // fallback to the version mentioned in matroska specs
613     return 0;
614 }
615
616 static int put_flac_codecpriv(AVFormatContext *s,
617                               AVIOContext *pb, AVCodecParameters *par)
618 {
619     int write_comment = (par->channel_layout &&
620                          !(par->channel_layout & ~0x3ffffULL) &&
621                          !ff_flac_is_native_layout(par->channel_layout));
622     int ret = ff_flac_write_header(pb, par->extradata, par->extradata_size,
623                                    !write_comment);
624
625     if (ret < 0)
626         return ret;
627
628     if (write_comment) {
629         const char *vendor = (s->flags & AVFMT_FLAG_BITEXACT) ?
630                              "Lavf" : LIBAVFORMAT_IDENT;
631         AVDictionary *dict = NULL;
632         uint8_t buf[32], *data, *p;
633         int64_t len;
634
635         snprintf(buf, sizeof(buf), "0x%"PRIx64, par->channel_layout);
636         av_dict_set(&dict, "WAVEFORMATEXTENSIBLE_CHANNEL_MASK", buf, 0);
637
638         len = ff_vorbiscomment_length(dict, vendor);
639         if (len >= ((1<<24) - 4))
640             return AVERROR(EINVAL);
641
642         data = av_malloc(len + 4);
643         if (!data) {
644             av_dict_free(&dict);
645             return AVERROR(ENOMEM);
646         }
647
648         data[0] = 0x84;
649         AV_WB24(data + 1, len);
650
651         p = data + 4;
652         ff_vorbiscomment_write(&p, &dict, vendor);
653
654         avio_write(pb, data, len + 4);
655
656         av_freep(&data);
657         av_dict_free(&dict);
658     }
659
660     return 0;
661 }
662
663 static int get_aac_sample_rates(AVFormatContext *s, AVCodecParameters *par,
664                                 int *sample_rate, int *output_sample_rate)
665 {
666     MPEG4AudioConfig mp4ac;
667
668     if (avpriv_mpeg4audio_get_config(&mp4ac, par->extradata,
669                                      par->extradata_size * 8, 1) < 0) {
670         av_log(s, AV_LOG_ERROR,
671                "Error parsing AAC extradata, unable to determine samplerate.\n");
672         return AVERROR(EINVAL);
673     }
674
675     *sample_rate        = mp4ac.sample_rate;
676     *output_sample_rate = mp4ac.ext_sample_rate;
677     return 0;
678 }
679
680 static int mkv_write_native_codecprivate(AVFormatContext *s,
681                                          AVCodecParameters *par,
682                                          AVIOContext *dyn_cp)
683 {
684     switch (par->codec_id) {
685     case AV_CODEC_ID_VORBIS:
686     case AV_CODEC_ID_THEORA:
687         return put_xiph_codecpriv(s, dyn_cp, par);
688     case AV_CODEC_ID_FLAC:
689         return put_flac_codecpriv(s, dyn_cp, par);
690     case AV_CODEC_ID_WAVPACK:
691         return put_wv_codecpriv(dyn_cp, par);
692     case AV_CODEC_ID_H264:
693         return ff_isom_write_avcc(dyn_cp, par->extradata,
694                                   par->extradata_size);
695     case AV_CODEC_ID_HEVC:
696         ff_isom_write_hvcc(dyn_cp, par->extradata,
697                            par->extradata_size, 0);
698         return 0;
699     case AV_CODEC_ID_ALAC:
700         if (par->extradata_size < 36) {
701             av_log(s, AV_LOG_ERROR,
702                    "Invalid extradata found, ALAC expects a 36-byte "
703                    "QuickTime atom.");
704             return AVERROR_INVALIDDATA;
705         } else
706             avio_write(dyn_cp, par->extradata + 12,
707                        par->extradata_size - 12);
708         break;
709     default:
710         if (par->codec_id == AV_CODEC_ID_PRORES &&
711             ff_codec_get_id(ff_codec_movvideo_tags, par->codec_tag) == AV_CODEC_ID_PRORES) {
712             avio_wl32(dyn_cp, par->codec_tag);
713         } else if (par->extradata_size && par->codec_id != AV_CODEC_ID_TTA)
714             avio_write(dyn_cp, par->extradata, par->extradata_size);
715     }
716
717     return 0;
718 }
719
720 static int mkv_write_codecprivate(AVFormatContext *s, AVIOContext *pb,
721                                   AVCodecParameters *par,
722                                   int native_id, int qt_id)
723 {
724     AVIOContext *dyn_cp;
725     uint8_t *codecpriv;
726     int ret, codecpriv_size;
727
728     ret = avio_open_dyn_buf(&dyn_cp);
729     if (ret < 0)
730         return ret;
731
732     if (native_id) {
733         ret = mkv_write_native_codecprivate(s, par, dyn_cp);
734     } else if (par->codec_type == AVMEDIA_TYPE_VIDEO) {
735         if (qt_id) {
736             if (!par->codec_tag)
737                 par->codec_tag = ff_codec_get_tag(ff_codec_movvideo_tags,
738                                                     par->codec_id);
739             if (par->extradata_size) {
740                 if (   ff_codec_get_id(ff_codec_movvideo_tags, par->codec_tag) == par->codec_id
741                     && ff_codec_get_id(ff_codec_movvideo_tags, AV_RL32(par->extradata + 4)) != par->codec_id
742                 ) {
743                     int i;
744                     avio_wb32(dyn_cp, 0x5a + par->extradata_size);
745                     avio_wl32(dyn_cp, par->codec_tag);
746                     for(i = 0; i < 0x5a - 8; i++)
747                         avio_w8(dyn_cp, 0);
748                 }
749                 avio_write(dyn_cp, par->extradata, par->extradata_size);
750             }
751         } else {
752             if (!ff_codec_get_tag(ff_codec_bmp_tags, par->codec_id))
753                 av_log(s, AV_LOG_WARNING, "codec %s is not supported by this format\n",
754                        avcodec_get_name(par->codec_id));
755
756             if (!par->codec_tag)
757                 par->codec_tag = ff_codec_get_tag(ff_codec_bmp_tags,
758                                                   par->codec_id);
759             if (!par->codec_tag && par->codec_id != AV_CODEC_ID_RAWVIDEO) {
760                 av_log(s, AV_LOG_ERROR, "No bmp codec tag found for codec %s\n",
761                        avcodec_get_name(par->codec_id));
762                 ret = AVERROR(EINVAL);
763             }
764
765             ff_put_bmp_header(dyn_cp, par, ff_codec_bmp_tags, 0, 0);
766         }
767     } else if (par->codec_type == AVMEDIA_TYPE_AUDIO) {
768         unsigned int tag;
769         tag = ff_codec_get_tag(ff_codec_wav_tags, par->codec_id);
770         if (!tag) {
771             av_log(s, AV_LOG_ERROR, "No wav codec tag found for codec %s\n",
772                    avcodec_get_name(par->codec_id));
773             ret = AVERROR(EINVAL);
774         }
775         if (!par->codec_tag)
776             par->codec_tag = tag;
777
778         ff_put_wav_header(s, dyn_cp, par, FF_PUT_WAV_HEADER_FORCE_WAVEFORMATEX);
779     }
780
781     codecpriv_size = avio_close_dyn_buf(dyn_cp, &codecpriv);
782     if (codecpriv_size)
783         put_ebml_binary(pb, MATROSKA_ID_CODECPRIVATE, codecpriv,
784                         codecpriv_size);
785     av_free(codecpriv);
786     return ret;
787 }
788
789 static int mkv_write_video_color(AVIOContext *pb, AVCodecParameters *par, AVStream *st) {
790     AVIOContext *dyn_cp;
791     uint8_t *colorinfo_ptr;
792     int side_data_size = 0;
793     int ret, colorinfo_size;
794     const uint8_t *side_data = av_stream_get_side_data(
795         st, AV_PKT_DATA_MASTERING_DISPLAY_METADATA, &side_data_size);
796
797     ret = avio_open_dyn_buf(&dyn_cp);
798     if (ret < 0)
799         return ret;
800
801     if (par->color_trc != AVCOL_TRC_UNSPECIFIED &&
802         par->color_trc < AVCOL_TRC_NB) {
803         put_ebml_uint(dyn_cp, MATROSKA_ID_VIDEOCOLORTRANSFERCHARACTERISTICS,
804                       par->color_trc);
805     }
806     if (par->color_space != AVCOL_SPC_UNSPECIFIED &&
807         par->color_space < AVCOL_SPC_NB) {
808         put_ebml_uint(dyn_cp, MATROSKA_ID_VIDEOCOLORMATRIXCOEFF, par->color_space);
809     }
810     if (par->color_primaries != AVCOL_PRI_UNSPECIFIED &&
811         par->color_primaries < AVCOL_PRI_NB) {
812         put_ebml_uint(dyn_cp, MATROSKA_ID_VIDEOCOLORPRIMARIES, par->color_primaries);
813     }
814     if (par->color_range != AVCOL_RANGE_UNSPECIFIED &&
815         par->color_range < AVCOL_RANGE_NB) {
816         put_ebml_uint(dyn_cp, MATROSKA_ID_VIDEOCOLORRANGE, par->color_range);
817     }
818     if (side_data_size == sizeof(AVMasteringDisplayMetadata)) {
819         ebml_master meta_element = start_ebml_master(
820             dyn_cp, MATROSKA_ID_VIDEOCOLORMASTERINGMETA, 0);
821         const AVMasteringDisplayMetadata *metadata =
822             (const AVMasteringDisplayMetadata*)side_data;
823         if (metadata->has_primaries) {
824             put_ebml_float(dyn_cp, MATROSKA_ID_VIDEOCOLOR_RX,
825                            av_q2d(metadata->display_primaries[0][0]));
826             put_ebml_float(dyn_cp, MATROSKA_ID_VIDEOCOLOR_RY,
827                            av_q2d(metadata->display_primaries[0][1]));
828             put_ebml_float(dyn_cp, MATROSKA_ID_VIDEOCOLOR_GX,
829                            av_q2d(metadata->display_primaries[1][0]));
830             put_ebml_float(dyn_cp, MATROSKA_ID_VIDEOCOLOR_GY,
831                            av_q2d(metadata->display_primaries[1][1]));
832             put_ebml_float(dyn_cp, MATROSKA_ID_VIDEOCOLOR_BX,
833                            av_q2d(metadata->display_primaries[2][0]));
834             put_ebml_float(dyn_cp, MATROSKA_ID_VIDEOCOLOR_BY,
835                            av_q2d(metadata->display_primaries[2][1]));
836             put_ebml_float(dyn_cp, MATROSKA_ID_VIDEOCOLOR_WHITEX,
837                            av_q2d(metadata->white_point[0]));
838             put_ebml_float(dyn_cp, MATROSKA_ID_VIDEOCOLOR_WHITEY,
839                            av_q2d(metadata->white_point[1]));
840         }
841         if (metadata->has_luminance) {
842             put_ebml_float(dyn_cp, MATROSKA_ID_VIDEOCOLOR_LUMINANCEMAX,
843                            av_q2d(metadata->max_luminance));
844             put_ebml_float(dyn_cp, MATROSKA_ID_VIDEOCOLOR_LUMINANCEMIN,
845                            av_q2d(metadata->min_luminance));
846         }
847         end_ebml_master(dyn_cp, meta_element);
848     }
849
850     colorinfo_size = avio_close_dyn_buf(dyn_cp, &colorinfo_ptr);
851     if (colorinfo_size) {
852         ebml_master colorinfo = start_ebml_master(pb, MATROSKA_ID_VIDEOCOLOR, 0);
853         avio_write(pb, colorinfo_ptr, colorinfo_size);
854         end_ebml_master(pb, colorinfo);
855     }
856     av_free(colorinfo_ptr);
857     return 0;
858 }
859
860 static void mkv_write_field_order(AVIOContext *pb, int mode,
861                                   enum AVFieldOrder field_order)
862 {
863     switch (field_order) {
864     case AV_FIELD_UNKNOWN:
865         put_ebml_uint(pb, MATROSKA_ID_VIDEOFLAGINTERLACED,
866                       MATROSKA_VIDEO_INTERLACE_FLAG_UNDETERMINED);
867         break;
868     case AV_FIELD_PROGRESSIVE:
869         put_ebml_uint(pb, MATROSKA_ID_VIDEOFLAGINTERLACED,
870                       MATROSKA_VIDEO_INTERLACE_FLAG_PROGRESSIVE);
871         break;
872     case AV_FIELD_TT:
873     case AV_FIELD_BB:
874     case AV_FIELD_TB:
875     case AV_FIELD_BT:
876         put_ebml_uint(pb, MATROSKA_ID_VIDEOFLAGINTERLACED,
877                       MATROSKA_VIDEO_INTERLACE_FLAG_INTERLACED);
878         if (mode != MODE_WEBM) {
879             switch (field_order) {
880             case AV_FIELD_TT:
881                 put_ebml_uint(pb, MATROSKA_ID_VIDEOFIELDORDER,
882                               MATROSKA_VIDEO_FIELDORDER_TT);
883                 break;
884             case AV_FIELD_BB:
885                 put_ebml_uint(pb, MATROSKA_ID_VIDEOFIELDORDER,
886                               MATROSKA_VIDEO_FIELDORDER_BB);
887                 break;
888             case AV_FIELD_TB:
889                 put_ebml_uint(pb, MATROSKA_ID_VIDEOFIELDORDER,
890                               MATROSKA_VIDEO_FIELDORDER_TB);
891                 break;
892             case AV_FIELD_BT:
893                 put_ebml_uint(pb, MATROSKA_ID_VIDEOFIELDORDER,
894                               MATROSKA_VIDEO_FIELDORDER_BT);
895                 break;
896             }
897         }
898     }
899 }
900
901 static int mkv_write_stereo_mode(AVFormatContext *s, AVIOContext *pb,
902                                  AVStream *st, int mode, int *h_width, int *h_height)
903 {
904     int i;
905     int ret = 0;
906     AVDictionaryEntry *tag;
907     MatroskaVideoStereoModeType format = MATROSKA_VIDEO_STEREOMODE_TYPE_NB;
908
909     *h_width = 1;
910     *h_height = 1;
911     // convert metadata into proper side data and add it to the stream
912     if ((tag = av_dict_get(st->metadata, "stereo_mode", NULL, 0)) ||
913         (tag = av_dict_get( s->metadata, "stereo_mode", NULL, 0))) {
914         int stereo_mode = atoi(tag->value);
915
916         for (i=0; i<MATROSKA_VIDEO_STEREOMODE_TYPE_NB; i++)
917             if (!strcmp(tag->value, ff_matroska_video_stereo_mode[i])){
918                 stereo_mode = i;
919                 break;
920             }
921
922         if (stereo_mode < MATROSKA_VIDEO_STEREOMODE_TYPE_NB &&
923             stereo_mode != 10 && stereo_mode != 12) {
924             int ret = ff_mkv_stereo3d_conv(st, stereo_mode);
925             if (ret < 0)
926                 return ret;
927         }
928     }
929
930     // iterate to find the stereo3d side data
931     for (i = 0; i < st->nb_side_data; i++) {
932         AVPacketSideData sd = st->side_data[i];
933         if (sd.type == AV_PKT_DATA_STEREO3D) {
934             AVStereo3D *stereo = (AVStereo3D *)sd.data;
935
936             switch (stereo->type) {
937             case AV_STEREO3D_2D:
938                 format = MATROSKA_VIDEO_STEREOMODE_TYPE_MONO;
939                 break;
940             case AV_STEREO3D_SIDEBYSIDE:
941                 format = (stereo->flags & AV_STEREO3D_FLAG_INVERT)
942                     ? MATROSKA_VIDEO_STEREOMODE_TYPE_RIGHT_LEFT
943                     : MATROSKA_VIDEO_STEREOMODE_TYPE_LEFT_RIGHT;
944                 *h_width = 2;
945                 break;
946             case AV_STEREO3D_TOPBOTTOM:
947                 format = MATROSKA_VIDEO_STEREOMODE_TYPE_TOP_BOTTOM;
948                 if (stereo->flags & AV_STEREO3D_FLAG_INVERT)
949                     format--;
950                 *h_height = 2;
951                 break;
952             case AV_STEREO3D_CHECKERBOARD:
953                 format = MATROSKA_VIDEO_STEREOMODE_TYPE_CHECKERBOARD_LR;
954                 if (stereo->flags & AV_STEREO3D_FLAG_INVERT)
955                     format--;
956                 break;
957             case AV_STEREO3D_LINES:
958                 format = MATROSKA_VIDEO_STEREOMODE_TYPE_ROW_INTERLEAVED_LR;
959                 if (stereo->flags & AV_STEREO3D_FLAG_INVERT)
960                     format--;
961                 *h_height = 2;
962                 break;
963             case AV_STEREO3D_COLUMNS:
964                 format = MATROSKA_VIDEO_STEREOMODE_TYPE_COL_INTERLEAVED_LR;
965                 if (stereo->flags & AV_STEREO3D_FLAG_INVERT)
966                     format--;
967                 *h_width = 2;
968                 break;
969             case AV_STEREO3D_FRAMESEQUENCE:
970                 format = MATROSKA_VIDEO_STEREOMODE_TYPE_BOTH_EYES_BLOCK_LR;
971                 if (stereo->flags & AV_STEREO3D_FLAG_INVERT)
972                     format++;
973                 break;
974             }
975             break;
976         }
977     }
978
979     if (format == MATROSKA_VIDEO_STEREOMODE_TYPE_NB)
980         return ret;
981
982     // if webm, do not write unsupported modes
983     if ((mode == MODE_WEBM &&
984         format > MATROSKA_VIDEO_STEREOMODE_TYPE_TOP_BOTTOM &&
985         format != MATROSKA_VIDEO_STEREOMODE_TYPE_RIGHT_LEFT)
986         || format >= MATROSKA_VIDEO_STEREOMODE_TYPE_NB) {
987         av_log(s, AV_LOG_ERROR,
988                "The specified stereo mode is not valid.\n");
989         format = MATROSKA_VIDEO_STEREOMODE_TYPE_NB;
990         return AVERROR(EINVAL);
991     }
992
993     // write StereoMode if format is valid
994     put_ebml_uint(pb, MATROSKA_ID_VIDEOSTEREOMODE, format);
995
996     return ret;
997 }
998
999 static int mkv_write_track(AVFormatContext *s, MatroskaMuxContext *mkv,
1000                            int i, AVIOContext *pb, int default_stream_exists)
1001 {
1002     AVStream *st = s->streams[i];
1003     AVCodecParameters *par = st->codecpar;
1004     ebml_master subinfo, track;
1005     int native_id = 0;
1006     int qt_id = 0;
1007     int bit_depth = av_get_bits_per_sample(par->codec_id);
1008     int sample_rate = par->sample_rate;
1009     int output_sample_rate = 0;
1010     int display_width_div = 1;
1011     int display_height_div = 1;
1012     int j, ret;
1013     AVDictionaryEntry *tag;
1014
1015     if (par->codec_type == AVMEDIA_TYPE_ATTACHMENT) {
1016         mkv->have_attachments = 1;
1017         return 0;
1018     }
1019
1020     if (par->codec_type == AVMEDIA_TYPE_AUDIO) {
1021         if (!bit_depth && par->codec_id != AV_CODEC_ID_ADPCM_G726) {
1022             if (par->bits_per_raw_sample)
1023                 bit_depth = par->bits_per_raw_sample;
1024             else
1025                 bit_depth = av_get_bytes_per_sample(par->format) << 3;
1026         }
1027         if (!bit_depth)
1028             bit_depth = par->bits_per_coded_sample;
1029     }
1030
1031     if (par->codec_id == AV_CODEC_ID_AAC) {
1032         ret = get_aac_sample_rates(s, par, &sample_rate, &output_sample_rate);
1033         if (ret < 0)
1034             return ret;
1035     }
1036
1037     track = start_ebml_master(pb, MATROSKA_ID_TRACKENTRY, 0);
1038     put_ebml_uint (pb, MATROSKA_ID_TRACKNUMBER,
1039                    mkv->is_dash ? mkv->dash_track_number : i + 1);
1040     put_ebml_uint (pb, MATROSKA_ID_TRACKUID,
1041                    mkv->is_dash ? mkv->dash_track_number : i + 1);
1042     put_ebml_uint (pb, MATROSKA_ID_TRACKFLAGLACING , 0);    // no lacing (yet)
1043
1044     if ((tag = av_dict_get(st->metadata, "title", NULL, 0)))
1045         put_ebml_string(pb, MATROSKA_ID_TRACKNAME, tag->value);
1046     tag = av_dict_get(st->metadata, "language", NULL, 0);
1047     if (mkv->mode != MODE_WEBM || par->codec_id != AV_CODEC_ID_WEBVTT) {
1048         put_ebml_string(pb, MATROSKA_ID_TRACKLANGUAGE, tag && tag->value ? tag->value:"und");
1049     } else if (tag && tag->value) {
1050         put_ebml_string(pb, MATROSKA_ID_TRACKLANGUAGE, tag->value);
1051     }
1052
1053     // The default value for TRACKFLAGDEFAULT is 1, so add element
1054     // if we need to clear it.
1055     if (default_stream_exists && !(st->disposition & AV_DISPOSITION_DEFAULT))
1056         put_ebml_uint(pb, MATROSKA_ID_TRACKFLAGDEFAULT, !!(st->disposition & AV_DISPOSITION_DEFAULT));
1057
1058     if (st->disposition & AV_DISPOSITION_FORCED)
1059         put_ebml_uint(pb, MATROSKA_ID_TRACKFLAGFORCED, 1);
1060
1061     if (mkv->mode == MODE_WEBM && par->codec_id == AV_CODEC_ID_WEBVTT) {
1062         const char *codec_id;
1063         if (st->disposition & AV_DISPOSITION_CAPTIONS) {
1064             codec_id = "D_WEBVTT/CAPTIONS";
1065             native_id = MATROSKA_TRACK_TYPE_SUBTITLE;
1066         } else if (st->disposition & AV_DISPOSITION_DESCRIPTIONS) {
1067             codec_id = "D_WEBVTT/DESCRIPTIONS";
1068             native_id = MATROSKA_TRACK_TYPE_METADATA;
1069         } else if (st->disposition & AV_DISPOSITION_METADATA) {
1070             codec_id = "D_WEBVTT/METADATA";
1071             native_id = MATROSKA_TRACK_TYPE_METADATA;
1072         } else {
1073             codec_id = "D_WEBVTT/SUBTITLES";
1074             native_id = MATROSKA_TRACK_TYPE_SUBTITLE;
1075         }
1076         put_ebml_string(pb, MATROSKA_ID_CODECID, codec_id);
1077     } else {
1078         // look for a codec ID string specific to mkv to use,
1079         // if none are found, use AVI codes
1080         for (j = 0; ff_mkv_codec_tags[j].id != AV_CODEC_ID_NONE; j++) {
1081             if (ff_mkv_codec_tags[j].id == par->codec_id) {
1082                 put_ebml_string(pb, MATROSKA_ID_CODECID, ff_mkv_codec_tags[j].str);
1083                 native_id = 1;
1084                 break;
1085             }
1086         }
1087         if (par->codec_id == AV_CODEC_ID_RAWVIDEO && !par->codec_tag) {
1088             if (mkv->allow_raw_vfw) {
1089                 native_id = 0;
1090             } else {
1091                 av_log(s, AV_LOG_ERROR, "Raw RGB is not supported Natively in Matroska, you can use AVI or NUT or\n"
1092                                         "If you would like to store it anyway using VFW mode, enable allow_raw_vfw (-allow_raw_vfw 1)\n");
1093                 return AVERROR(EINVAL);
1094             }
1095         }
1096     }
1097
1098     if (par->codec_type == AVMEDIA_TYPE_AUDIO && par->initial_padding && par->codec_id == AV_CODEC_ID_OPUS) {
1099         int64_t codecdelay = av_rescale_q(par->initial_padding,
1100                                           (AVRational){ 1, 48000 },
1101                                           (AVRational){ 1, 1000000000 });
1102         if (codecdelay < 0) {
1103             av_log(s, AV_LOG_ERROR, "Initial padding is invalid\n");
1104             return AVERROR(EINVAL);
1105         }
1106 //         mkv->tracks[i].ts_offset = av_rescale_q(par->initial_padding,
1107 //                                                 (AVRational){ 1, par->sample_rate },
1108 //                                                 st->time_base);
1109
1110         put_ebml_uint(pb, MATROSKA_ID_CODECDELAY, codecdelay);
1111     }
1112     if (par->codec_id == AV_CODEC_ID_OPUS) {
1113         put_ebml_uint(pb, MATROSKA_ID_SEEKPREROLL, OPUS_SEEK_PREROLL);
1114     }
1115
1116     if (mkv->mode == MODE_WEBM && !(par->codec_id == AV_CODEC_ID_VP8 ||
1117                                     par->codec_id == AV_CODEC_ID_VP9 ||
1118                                     par->codec_id == AV_CODEC_ID_OPUS ||
1119                                     par->codec_id == AV_CODEC_ID_VORBIS ||
1120                                     par->codec_id == AV_CODEC_ID_WEBVTT)) {
1121         av_log(s, AV_LOG_ERROR,
1122                "Only VP8 or VP9 video and Vorbis or Opus audio and WebVTT subtitles are supported for WebM.\n");
1123         return AVERROR(EINVAL);
1124     }
1125
1126     switch (par->codec_type) {
1127     case AVMEDIA_TYPE_VIDEO:
1128         mkv->have_video = 1;
1129         put_ebml_uint(pb, MATROSKA_ID_TRACKTYPE, MATROSKA_TRACK_TYPE_VIDEO);
1130
1131         if(   st->avg_frame_rate.num > 0 && st->avg_frame_rate.den > 0
1132            && av_cmp_q(av_inv_q(st->avg_frame_rate), st->time_base) > 0)
1133             put_ebml_uint(pb, MATROSKA_ID_TRACKDEFAULTDURATION, 1000000000LL * st->avg_frame_rate.den / st->avg_frame_rate.num);
1134         else
1135             put_ebml_uint(pb, MATROSKA_ID_TRACKDEFAULTDURATION, 1000000000LL * st->time_base.num / st->time_base.den);
1136
1137         if (!native_id &&
1138             ff_codec_get_tag(ff_codec_movvideo_tags, par->codec_id) &&
1139             ((!ff_codec_get_tag(ff_codec_bmp_tags,   par->codec_id) && par->codec_id != AV_CODEC_ID_RAWVIDEO) ||
1140              par->codec_id == AV_CODEC_ID_SVQ1 ||
1141              par->codec_id == AV_CODEC_ID_SVQ3 ||
1142              par->codec_id == AV_CODEC_ID_CINEPAK))
1143             qt_id = 1;
1144
1145         if (qt_id)
1146             put_ebml_string(pb, MATROSKA_ID_CODECID, "V_QUICKTIME");
1147         else if (!native_id) {
1148             // if there is no mkv-specific codec ID, use VFW mode
1149             put_ebml_string(pb, MATROSKA_ID_CODECID, "V_MS/VFW/FOURCC");
1150             mkv->tracks[i].write_dts = 1;
1151             s->internal->avoid_negative_ts_use_pts = 0;
1152         }
1153
1154         subinfo = start_ebml_master(pb, MATROSKA_ID_TRACKVIDEO, 0);
1155
1156         put_ebml_uint (pb, MATROSKA_ID_VIDEOPIXELWIDTH , par->width);
1157         put_ebml_uint (pb, MATROSKA_ID_VIDEOPIXELHEIGHT, par->height);
1158
1159         mkv_write_field_order(pb, mkv->mode, par->field_order);
1160
1161         // check both side data and metadata for stereo information,
1162         // write the result to the bitstream if any is found
1163         ret = mkv_write_stereo_mode(s, pb, st, mkv->mode,
1164                                     &display_width_div,
1165                                     &display_height_div);
1166         if (ret < 0)
1167             return ret;
1168
1169         if (((tag = av_dict_get(st->metadata, "alpha_mode", NULL, 0)) && atoi(tag->value)) ||
1170             ((tag = av_dict_get( s->metadata, "alpha_mode", NULL, 0)) && atoi(tag->value)) ||
1171             (par->format == AV_PIX_FMT_YUVA420P)) {
1172             put_ebml_uint(pb, MATROSKA_ID_VIDEOALPHAMODE, 1);
1173         }
1174
1175         // write DisplayWidth and DisplayHeight, they contain the size of
1176         // a single source view and/or the display aspect ratio
1177         if (st->sample_aspect_ratio.num) {
1178             int64_t d_width = av_rescale(par->width, st->sample_aspect_ratio.num, st->sample_aspect_ratio.den);
1179             if (d_width > INT_MAX) {
1180                 av_log(s, AV_LOG_ERROR, "Overflow in display width\n");
1181                 return AVERROR(EINVAL);
1182             }
1183             put_ebml_uint(pb, MATROSKA_ID_VIDEODISPLAYWIDTH , d_width / display_width_div);
1184             put_ebml_uint(pb, MATROSKA_ID_VIDEODISPLAYHEIGHT, par->height / display_height_div);
1185         } else if (display_width_div != 1 || display_height_div != 1) {
1186             put_ebml_uint(pb, MATROSKA_ID_VIDEODISPLAYWIDTH , par->width / display_width_div);
1187             put_ebml_uint(pb, MATROSKA_ID_VIDEODISPLAYHEIGHT, par->height / display_height_div);
1188         }
1189
1190         if (par->codec_id == AV_CODEC_ID_RAWVIDEO) {
1191             uint32_t color_space = av_le2ne32(par->codec_tag);
1192             put_ebml_binary(pb, MATROSKA_ID_VIDEOCOLORSPACE, &color_space, sizeof(color_space));
1193         }
1194         if (s->strict_std_compliance <= FF_COMPLIANCE_UNOFFICIAL) {
1195             ret = mkv_write_video_color(pb, par, st);
1196             if (ret < 0)
1197                 return ret;
1198         }
1199         end_ebml_master(pb, subinfo);
1200         break;
1201
1202     case AVMEDIA_TYPE_AUDIO:
1203         put_ebml_uint(pb, MATROSKA_ID_TRACKTYPE, MATROSKA_TRACK_TYPE_AUDIO);
1204
1205         if (!native_id)
1206             // no mkv-specific ID, use ACM mode
1207             put_ebml_string(pb, MATROSKA_ID_CODECID, "A_MS/ACM");
1208
1209         subinfo = start_ebml_master(pb, MATROSKA_ID_TRACKAUDIO, 0);
1210         put_ebml_uint  (pb, MATROSKA_ID_AUDIOCHANNELS    , par->channels);
1211         put_ebml_float (pb, MATROSKA_ID_AUDIOSAMPLINGFREQ, sample_rate);
1212         if (output_sample_rate)
1213             put_ebml_float(pb, MATROSKA_ID_AUDIOOUTSAMPLINGFREQ, output_sample_rate);
1214         if (bit_depth)
1215             put_ebml_uint(pb, MATROSKA_ID_AUDIOBITDEPTH, bit_depth);
1216         end_ebml_master(pb, subinfo);
1217         break;
1218
1219     case AVMEDIA_TYPE_SUBTITLE:
1220         if (!native_id) {
1221             av_log(s, AV_LOG_ERROR, "Subtitle codec %d is not supported.\n", par->codec_id);
1222             return AVERROR(ENOSYS);
1223         }
1224
1225         if (mkv->mode != MODE_WEBM || par->codec_id != AV_CODEC_ID_WEBVTT)
1226             native_id = MATROSKA_TRACK_TYPE_SUBTITLE;
1227
1228         put_ebml_uint(pb, MATROSKA_ID_TRACKTYPE, native_id);
1229         break;
1230     default:
1231         av_log(s, AV_LOG_ERROR, "Only audio, video, and subtitles are supported for Matroska.\n");
1232         return AVERROR(EINVAL);
1233     }
1234
1235     if (mkv->mode != MODE_WEBM || par->codec_id != AV_CODEC_ID_WEBVTT) {
1236         ret = mkv_write_codecprivate(s, pb, par, native_id, qt_id);
1237         if (ret < 0)
1238             return ret;
1239     }
1240
1241     end_ebml_master(pb, track);
1242
1243     return 0;
1244 }
1245
1246 static int mkv_write_tracks(AVFormatContext *s)
1247 {
1248     MatroskaMuxContext *mkv = s->priv_data;
1249     AVIOContext *dyn_cp, *pb = s->pb;
1250     ebml_master tracks;
1251     int i, ret, default_stream_exists = 0;
1252
1253     ret = mkv_add_seekhead_entry(mkv->main_seekhead, MATROSKA_ID_TRACKS, avio_tell(pb));
1254     if (ret < 0)
1255         return ret;
1256
1257     ret = start_ebml_master_crc32(pb, &dyn_cp, &tracks, MATROSKA_ID_TRACKS, 0);
1258     if (ret < 0)
1259         return ret;
1260
1261     for (i = 0; i < s->nb_streams; i++) {
1262         AVStream *st = s->streams[i];
1263         default_stream_exists |= st->disposition & AV_DISPOSITION_DEFAULT;
1264     }
1265     for (i = 0; i < s->nb_streams; i++) {
1266         ret = mkv_write_track(s, mkv, i, dyn_cp, default_stream_exists);
1267         if (ret < 0)
1268             return ret;
1269     }
1270     end_ebml_master_crc32(pb, &dyn_cp, mkv, tracks);
1271     return 0;
1272 }
1273
1274 static int mkv_write_chapters(AVFormatContext *s)
1275 {
1276     MatroskaMuxContext *mkv = s->priv_data;
1277     AVIOContext *dyn_cp, *pb = s->pb;
1278     ebml_master chapters, editionentry;
1279     AVRational scale = {1, 1E9};
1280     int i, ret;
1281
1282     if (!s->nb_chapters || mkv->wrote_chapters)
1283         return 0;
1284
1285     ret = mkv_add_seekhead_entry(mkv->main_seekhead, MATROSKA_ID_CHAPTERS, avio_tell(pb));
1286     if (ret < 0) return ret;
1287
1288     ret = start_ebml_master_crc32(pb, &dyn_cp, &chapters, MATROSKA_ID_CHAPTERS, 0);
1289     if (ret < 0) return ret;
1290
1291     editionentry = start_ebml_master(dyn_cp, MATROSKA_ID_EDITIONENTRY, 0);
1292     put_ebml_uint(dyn_cp, MATROSKA_ID_EDITIONFLAGDEFAULT, 1);
1293     put_ebml_uint(dyn_cp, MATROSKA_ID_EDITIONFLAGHIDDEN , 0);
1294     for (i = 0; i < s->nb_chapters; i++) {
1295         ebml_master chapteratom, chapterdisplay;
1296         AVChapter *c     = s->chapters[i];
1297         int64_t chapterstart = av_rescale_q(c->start, c->time_base, scale);
1298         int64_t chapterend   = av_rescale_q(c->end,   c->time_base, scale);
1299         AVDictionaryEntry *t = NULL;
1300         if (chapterstart < 0 || chapterstart > chapterend || chapterend < 0) {
1301             av_log(s, AV_LOG_ERROR,
1302                    "Invalid chapter start (%"PRId64") or end (%"PRId64").\n",
1303                    chapterstart, chapterend);
1304             return AVERROR_INVALIDDATA;
1305         }
1306
1307         chapteratom = start_ebml_master(dyn_cp, MATROSKA_ID_CHAPTERATOM, 0);
1308         put_ebml_uint(dyn_cp, MATROSKA_ID_CHAPTERUID, c->id + mkv->chapter_id_offset);
1309         put_ebml_uint(dyn_cp, MATROSKA_ID_CHAPTERTIMESTART, chapterstart);
1310         put_ebml_uint(dyn_cp, MATROSKA_ID_CHAPTERTIMEEND, chapterend);
1311         put_ebml_uint(dyn_cp, MATROSKA_ID_CHAPTERFLAGHIDDEN , 0);
1312         put_ebml_uint(dyn_cp, MATROSKA_ID_CHAPTERFLAGENABLED, 1);
1313         if ((t = av_dict_get(c->metadata, "title", NULL, 0))) {
1314             chapterdisplay = start_ebml_master(dyn_cp, MATROSKA_ID_CHAPTERDISPLAY, 0);
1315             put_ebml_string(dyn_cp, MATROSKA_ID_CHAPSTRING, t->value);
1316             put_ebml_string(dyn_cp, MATROSKA_ID_CHAPLANG  , "und");
1317             end_ebml_master(dyn_cp, chapterdisplay);
1318         }
1319         end_ebml_master(dyn_cp, chapteratom);
1320     }
1321     end_ebml_master(dyn_cp, editionentry);
1322     end_ebml_master_crc32(pb, &dyn_cp, mkv, chapters);
1323
1324     mkv->wrote_chapters = 1;
1325     return 0;
1326 }
1327
1328 static int mkv_write_simpletag(AVIOContext *pb, AVDictionaryEntry *t)
1329 {
1330     uint8_t *key = av_strdup(t->key);
1331     uint8_t *p   = key;
1332     const uint8_t *lang = NULL;
1333     ebml_master tag;
1334
1335     if (!key)
1336         return AVERROR(ENOMEM);
1337
1338     if ((p = strrchr(p, '-')) &&
1339         (lang = ff_convert_lang_to(p + 1, AV_LANG_ISO639_2_BIBL)))
1340         *p = 0;
1341
1342     p = key;
1343     while (*p) {
1344         if (*p == ' ')
1345             *p = '_';
1346         else if (*p >= 'a' && *p <= 'z')
1347             *p -= 'a' - 'A';
1348         p++;
1349     }
1350
1351     tag = start_ebml_master(pb, MATROSKA_ID_SIMPLETAG, 0);
1352     put_ebml_string(pb, MATROSKA_ID_TAGNAME, key);
1353     if (lang)
1354         put_ebml_string(pb, MATROSKA_ID_TAGLANG, lang);
1355     put_ebml_string(pb, MATROSKA_ID_TAGSTRING, t->value);
1356     end_ebml_master(pb, tag);
1357
1358     av_freep(&key);
1359     return 0;
1360 }
1361
1362 static int mkv_write_tag_targets(AVFormatContext *s,
1363                                  unsigned int elementid, unsigned int uid,
1364                                  ebml_master *tags, ebml_master* tag)
1365 {
1366     AVIOContext *pb;
1367     MatroskaMuxContext *mkv = s->priv_data;
1368     ebml_master targets;
1369     int ret;
1370
1371     if (!tags->pos) {
1372         ret = mkv_add_seekhead_entry(mkv->main_seekhead, MATROSKA_ID_TAGS, avio_tell(s->pb));
1373         if (ret < 0) return ret;
1374
1375         start_ebml_master_crc32(s->pb, &mkv->tags_bc, tags, MATROSKA_ID_TAGS, 0);
1376     }
1377     pb = mkv->tags_bc;
1378
1379     *tag     = start_ebml_master(pb, MATROSKA_ID_TAG,       0);
1380     targets = start_ebml_master(pb, MATROSKA_ID_TAGTARGETS, 0);
1381     if (elementid)
1382         put_ebml_uint(pb, elementid, uid);
1383     end_ebml_master(pb, targets);
1384     return 0;
1385 }
1386
1387 static int mkv_check_tag_name(const char *name, unsigned int elementid)
1388 {
1389     return av_strcasecmp(name, "title") &&
1390            av_strcasecmp(name, "stereo_mode") &&
1391            av_strcasecmp(name, "creation_time") &&
1392            av_strcasecmp(name, "encoding_tool") &&
1393            av_strcasecmp(name, "duration") &&
1394            (elementid != MATROSKA_ID_TAGTARGETS_TRACKUID ||
1395             av_strcasecmp(name, "language"));
1396 }
1397
1398 static int mkv_write_tag(AVFormatContext *s, AVDictionary *m, unsigned int elementid,
1399                          unsigned int uid, ebml_master *tags)
1400 {
1401     MatroskaMuxContext *mkv = s->priv_data;
1402     ebml_master tag;
1403     int ret;
1404     AVDictionaryEntry *t = NULL;
1405
1406     ret = mkv_write_tag_targets(s, elementid, uid, tags, &tag);
1407     if (ret < 0)
1408         return ret;
1409
1410     while ((t = av_dict_get(m, "", t, AV_DICT_IGNORE_SUFFIX))) {
1411         if (mkv_check_tag_name(t->key, elementid)) {
1412             ret = mkv_write_simpletag(mkv->tags_bc, t);
1413             if (ret < 0)
1414                 return ret;
1415         }
1416     }
1417
1418     end_ebml_master(mkv->tags_bc, tag);
1419     return 0;
1420 }
1421
1422 static int mkv_check_tag(AVDictionary *m, unsigned int elementid)
1423 {
1424     AVDictionaryEntry *t = NULL;
1425
1426     while ((t = av_dict_get(m, "", t, AV_DICT_IGNORE_SUFFIX)))
1427         if (mkv_check_tag_name(t->key, elementid))
1428             return 1;
1429
1430     return 0;
1431 }
1432
1433 static int mkv_write_tags(AVFormatContext *s)
1434 {
1435     MatroskaMuxContext *mkv = s->priv_data;
1436     int i, ret;
1437
1438     ff_metadata_conv_ctx(s, ff_mkv_metadata_conv, NULL);
1439
1440     if (mkv_check_tag(s->metadata, 0)) {
1441         ret = mkv_write_tag(s, s->metadata, 0, 0, &mkv->tags);
1442         if (ret < 0) return ret;
1443     }
1444
1445     for (i = 0; i < s->nb_streams; i++) {
1446         AVStream *st = s->streams[i];
1447
1448         if (!mkv_check_tag(st->metadata, MATROSKA_ID_TAGTARGETS_TRACKUID))
1449             continue;
1450
1451         ret = mkv_write_tag(s, st->metadata, MATROSKA_ID_TAGTARGETS_TRACKUID, i + 1, &mkv->tags);
1452         if (ret < 0) return ret;
1453     }
1454
1455     if (s->pb->seekable && !mkv->is_live) {
1456         for (i = 0; i < s->nb_streams; i++) {
1457             AVIOContext *pb;
1458             ebml_master tag_target;
1459             ebml_master tag;
1460
1461             mkv_write_tag_targets(s, MATROSKA_ID_TAGTARGETS_TRACKUID, i + 1, &mkv->tags, &tag_target);
1462             pb = mkv->tags_bc;
1463
1464             tag = start_ebml_master(pb, MATROSKA_ID_SIMPLETAG, 0);
1465             put_ebml_string(pb, MATROSKA_ID_TAGNAME, "DURATION");
1466             mkv->stream_duration_offsets[i] = avio_tell(pb);
1467
1468             // Reserve space to write duration as a 20-byte string.
1469             // 2 (ebml id) + 1 (data size) + 20 (data)
1470             put_ebml_void(pb, 23);
1471             end_ebml_master(pb, tag);
1472             end_ebml_master(pb, tag_target);
1473         }
1474     }
1475
1476     for (i = 0; i < s->nb_chapters; i++) {
1477         AVChapter *ch = s->chapters[i];
1478
1479         if (!mkv_check_tag(ch->metadata, MATROSKA_ID_TAGTARGETS_CHAPTERUID))
1480             continue;
1481
1482         ret = mkv_write_tag(s, ch->metadata, MATROSKA_ID_TAGTARGETS_CHAPTERUID, ch->id + mkv->chapter_id_offset, &mkv->tags);
1483         if (ret < 0) return ret;
1484     }
1485
1486     if (mkv->tags.pos) {
1487         if (s->pb->seekable && !mkv->is_live)
1488             put_ebml_void(s->pb, avio_tell(mkv->tags_bc) + ((mkv->mode != MODE_WEBM) ? 2 /* ebml id + data size */ + 4 /* CRC32 */ : 0));
1489         else
1490             end_ebml_master_crc32(s->pb, &mkv->tags_bc, mkv, mkv->tags);
1491     }
1492     return 0;
1493 }
1494
1495 static int mkv_write_attachments(AVFormatContext *s)
1496 {
1497     MatroskaMuxContext *mkv = s->priv_data;
1498     AVIOContext *dyn_cp, *pb = s->pb;
1499     ebml_master attachments;
1500     AVLFG c;
1501     int i, ret;
1502
1503     if (!mkv->have_attachments)
1504         return 0;
1505
1506     av_lfg_init(&c, av_get_random_seed());
1507
1508     ret = mkv_add_seekhead_entry(mkv->main_seekhead, MATROSKA_ID_ATTACHMENTS, avio_tell(pb));
1509     if (ret < 0) return ret;
1510
1511     ret = start_ebml_master_crc32(pb, &dyn_cp, &attachments, MATROSKA_ID_ATTACHMENTS, 0);
1512     if (ret < 0) return ret;
1513
1514     for (i = 0; i < s->nb_streams; i++) {
1515         AVStream *st = s->streams[i];
1516         ebml_master attached_file;
1517         AVDictionaryEntry *t;
1518         const char *mimetype = NULL;
1519         uint64_t fileuid;
1520
1521         if (st->codecpar->codec_type != AVMEDIA_TYPE_ATTACHMENT)
1522             continue;
1523
1524         attached_file = start_ebml_master(dyn_cp, MATROSKA_ID_ATTACHEDFILE, 0);
1525
1526         if (t = av_dict_get(st->metadata, "title", NULL, 0))
1527             put_ebml_string(dyn_cp, MATROSKA_ID_FILEDESC, t->value);
1528         if (!(t = av_dict_get(st->metadata, "filename", NULL, 0))) {
1529             av_log(s, AV_LOG_ERROR, "Attachment stream %d has no filename tag.\n", i);
1530             return AVERROR(EINVAL);
1531         }
1532         put_ebml_string(dyn_cp, MATROSKA_ID_FILENAME, t->value);
1533         if (t = av_dict_get(st->metadata, "mimetype", NULL, 0))
1534             mimetype = t->value;
1535         else if (st->codecpar->codec_id != AV_CODEC_ID_NONE ) {
1536             int i;
1537             for (i = 0; ff_mkv_mime_tags[i].id != AV_CODEC_ID_NONE; i++)
1538                 if (ff_mkv_mime_tags[i].id == st->codecpar->codec_id) {
1539                     mimetype = ff_mkv_mime_tags[i].str;
1540                     break;
1541                 }
1542             for (i = 0; ff_mkv_image_mime_tags[i].id != AV_CODEC_ID_NONE; i++)
1543                 if (ff_mkv_image_mime_tags[i].id == st->codecpar->codec_id) {
1544                     mimetype = ff_mkv_image_mime_tags[i].str;
1545                     break;
1546                 }
1547         }
1548         if (!mimetype) {
1549             av_log(s, AV_LOG_ERROR, "Attachment stream %d has no mimetype tag and "
1550                                     "it cannot be deduced from the codec id.\n", i);
1551             return AVERROR(EINVAL);
1552         }
1553
1554         if (s->flags & AVFMT_FLAG_BITEXACT) {
1555             struct AVSHA *sha = av_sha_alloc();
1556             uint8_t digest[20];
1557             if (!sha)
1558                 return AVERROR(ENOMEM);
1559             av_sha_init(sha, 160);
1560             av_sha_update(sha, st->codecpar->extradata, st->codecpar->extradata_size);
1561             av_sha_final(sha, digest);
1562             av_free(sha);
1563             fileuid = AV_RL64(digest);
1564         } else {
1565             fileuid = av_lfg_get(&c);
1566         }
1567         av_log(s, AV_LOG_VERBOSE, "Using %.16"PRIx64" for attachment %d\n",
1568                fileuid, i);
1569
1570         put_ebml_string(dyn_cp, MATROSKA_ID_FILEMIMETYPE, mimetype);
1571         put_ebml_binary(dyn_cp, MATROSKA_ID_FILEDATA, st->codecpar->extradata, st->codecpar->extradata_size);
1572         put_ebml_uint(dyn_cp, MATROSKA_ID_FILEUID, fileuid);
1573         end_ebml_master(dyn_cp, attached_file);
1574     }
1575     end_ebml_master_crc32(pb, &dyn_cp, mkv, attachments);
1576
1577     return 0;
1578 }
1579
1580 static int64_t get_metadata_duration(AVFormatContext *s)
1581 {
1582     int i = 0;
1583     int64_t max = 0;
1584     int64_t us;
1585
1586     AVDictionaryEntry *explicitDuration = av_dict_get(s->metadata, "DURATION", NULL, 0);
1587     if (explicitDuration && (av_parse_time(&us, explicitDuration->value, 1) == 0) && us > 0) {
1588         av_log(s, AV_LOG_DEBUG, "get_metadata_duration found duration in context metadata: %" PRId64 "\n", us);
1589         return us;
1590     }
1591
1592     for (i = 0; i < s->nb_streams; i++) {
1593         int64_t us;
1594         AVDictionaryEntry *duration = av_dict_get(s->streams[i]->metadata, "DURATION", NULL, 0);
1595
1596         if (duration && (av_parse_time(&us, duration->value, 1) == 0))
1597             max = FFMAX(max, us);
1598     }
1599
1600     av_log(s, AV_LOG_DEBUG, "get_metadata_duration returned: %" PRId64 "\n", max);
1601     return max;
1602 }
1603
1604 static int mkv_write_header(AVFormatContext *s)
1605 {
1606     MatroskaMuxContext *mkv = s->priv_data;
1607     AVIOContext *pb = s->pb;
1608     ebml_master ebml_header;
1609     AVDictionaryEntry *tag;
1610     int ret, i, version = 2;
1611     int64_t creation_time;
1612
1613     if (!strcmp(s->oformat->name, "webm"))
1614         mkv->mode = MODE_WEBM;
1615     else
1616         mkv->mode = MODE_MATROSKAv2;
1617
1618     if (mkv->mode != MODE_WEBM ||
1619         av_dict_get(s->metadata, "stereo_mode", NULL, 0) ||
1620         av_dict_get(s->metadata, "alpha_mode", NULL, 0))
1621         version = 4;
1622
1623     for (i = 0; i < s->nb_streams; i++) {
1624         if (s->streams[i]->codecpar->codec_id == AV_CODEC_ID_ATRAC3 ||
1625             s->streams[i]->codecpar->codec_id == AV_CODEC_ID_COOK ||
1626             s->streams[i]->codecpar->codec_id == AV_CODEC_ID_RA_288 ||
1627             s->streams[i]->codecpar->codec_id == AV_CODEC_ID_SIPR ||
1628             s->streams[i]->codecpar->codec_id == AV_CODEC_ID_RV10 ||
1629             s->streams[i]->codecpar->codec_id == AV_CODEC_ID_RV20) {
1630             av_log(s, AV_LOG_ERROR,
1631                    "The Matroska muxer does not yet support muxing %s\n",
1632                    avcodec_get_name(s->streams[i]->codecpar->codec_id));
1633             return AVERROR_PATCHWELCOME;
1634         }
1635         if (s->streams[i]->codecpar->codec_id == AV_CODEC_ID_OPUS ||
1636             av_dict_get(s->streams[i]->metadata, "stereo_mode", NULL, 0) ||
1637             av_dict_get(s->streams[i]->metadata, "alpha_mode", NULL, 0))
1638             version = 4;
1639     }
1640
1641     mkv->tracks = av_mallocz_array(s->nb_streams, sizeof(*mkv->tracks));
1642     if (!mkv->tracks) {
1643         ret = AVERROR(ENOMEM);
1644         goto fail;
1645     }
1646     ebml_header = start_ebml_master(pb, EBML_ID_HEADER, 0);
1647     put_ebml_uint   (pb, EBML_ID_EBMLVERSION        ,           1);
1648     put_ebml_uint   (pb, EBML_ID_EBMLREADVERSION    ,           1);
1649     put_ebml_uint   (pb, EBML_ID_EBMLMAXIDLENGTH    ,           4);
1650     put_ebml_uint   (pb, EBML_ID_EBMLMAXSIZELENGTH  ,           8);
1651     put_ebml_string (pb, EBML_ID_DOCTYPE            , s->oformat->name);
1652     put_ebml_uint   (pb, EBML_ID_DOCTYPEVERSION     ,     version);
1653     put_ebml_uint   (pb, EBML_ID_DOCTYPEREADVERSION ,           2);
1654     end_ebml_master(pb, ebml_header);
1655
1656     mkv->segment = start_ebml_master(pb, MATROSKA_ID_SEGMENT, 0);
1657     mkv->segment_offset = avio_tell(pb);
1658
1659     // we write 2 seek heads - one at the end of the file to point to each
1660     // cluster, and one at the beginning to point to all other level one
1661     // elements (including the seek head at the end of the file), which
1662     // isn't more than 10 elements if we only write one of each other
1663     // currently defined level 1 element
1664     mkv->main_seekhead    = mkv_start_seekhead(pb, mkv->segment_offset, 10);
1665     if (!mkv->main_seekhead) {
1666         ret = AVERROR(ENOMEM);
1667         goto fail;
1668     }
1669
1670     ret = mkv_add_seekhead_entry(mkv->main_seekhead, MATROSKA_ID_INFO, avio_tell(pb));
1671     if (ret < 0) goto fail;
1672
1673     ret = start_ebml_master_crc32(pb, &mkv->info_bc, &mkv->info, MATROSKA_ID_INFO, 0);
1674     if (ret < 0)
1675         return ret;
1676     pb = mkv->info_bc;
1677
1678     put_ebml_uint(pb, MATROSKA_ID_TIMECODESCALE, 1000000);
1679     if ((tag = av_dict_get(s->metadata, "title", NULL, 0)))
1680         put_ebml_string(pb, MATROSKA_ID_TITLE, tag->value);
1681     if (!(s->flags & AVFMT_FLAG_BITEXACT)) {
1682         put_ebml_string(pb, MATROSKA_ID_MUXINGAPP, LIBAVFORMAT_IDENT);
1683         if ((tag = av_dict_get(s->metadata, "encoding_tool", NULL, 0)))
1684             put_ebml_string(pb, MATROSKA_ID_WRITINGAPP, tag->value);
1685         else
1686             put_ebml_string(pb, MATROSKA_ID_WRITINGAPP, LIBAVFORMAT_IDENT);
1687
1688         if (mkv->mode != MODE_WEBM) {
1689             uint32_t segment_uid[4];
1690             AVLFG lfg;
1691
1692             av_lfg_init(&lfg, av_get_random_seed());
1693
1694             for (i = 0; i < 4; i++)
1695                 segment_uid[i] = av_lfg_get(&lfg);
1696
1697             put_ebml_binary(pb, MATROSKA_ID_SEGMENTUID, segment_uid, 16);
1698         }
1699     } else {
1700         const char *ident = "Lavf";
1701         put_ebml_string(pb, MATROSKA_ID_MUXINGAPP , ident);
1702         put_ebml_string(pb, MATROSKA_ID_WRITINGAPP, ident);
1703     }
1704
1705     if (ff_parse_creation_time_metadata(s, &creation_time, 0) > 0) {
1706         // Adjust time so it's relative to 2001-01-01 and convert to nanoseconds.
1707         int64_t date_utc = (creation_time - 978307200000000LL) * 1000;
1708         uint8_t date_utc_buf[8];
1709         AV_WB64(date_utc_buf, date_utc);
1710         put_ebml_binary(pb, MATROSKA_ID_DATEUTC, date_utc_buf, 8);
1711     }
1712
1713     // reserve space for the duration
1714     mkv->duration = 0;
1715     mkv->duration_offset = avio_tell(pb);
1716     if (!mkv->is_live) {
1717         int64_t metadata_duration = get_metadata_duration(s);
1718
1719         if (s->duration > 0) {
1720             int64_t scaledDuration = av_rescale(s->duration, 1000, AV_TIME_BASE);
1721             put_ebml_float(pb, MATROSKA_ID_DURATION, scaledDuration);
1722             av_log(s, AV_LOG_DEBUG, "Write early duration from recording time = %" PRIu64 "\n", scaledDuration);
1723         } else if (metadata_duration > 0) {
1724             int64_t scaledDuration = av_rescale(metadata_duration, 1000, AV_TIME_BASE);
1725             put_ebml_float(pb, MATROSKA_ID_DURATION, scaledDuration);
1726             av_log(s, AV_LOG_DEBUG, "Write early duration from metadata = %" PRIu64 "\n", scaledDuration);
1727         } else {
1728             put_ebml_void(pb, 11);              // assumes double-precision float to be written
1729         }
1730     }
1731     if (s->pb->seekable)
1732         put_ebml_void(s->pb, avio_tell(pb) + ((mkv->mode != MODE_WEBM) ? 2 /* ebml id + data size */ + 4 /* CRC32 */ : 0));
1733     else
1734         end_ebml_master_crc32(s->pb, &mkv->info_bc, mkv, mkv->info);
1735     pb = s->pb;
1736
1737     // initialize stream_duration fields
1738     mkv->stream_durations = av_mallocz(s->nb_streams * sizeof(int64_t));
1739     mkv->stream_duration_offsets = av_mallocz(s->nb_streams * sizeof(int64_t));
1740
1741     ret = mkv_write_tracks(s);
1742     if (ret < 0)
1743         goto fail;
1744
1745     for (i = 0; i < s->nb_chapters; i++)
1746         mkv->chapter_id_offset = FFMAX(mkv->chapter_id_offset, 1LL - s->chapters[i]->id);
1747
1748     if (mkv->mode != MODE_WEBM) {
1749         ret = mkv_write_chapters(s);
1750         if (ret < 0)
1751             goto fail;
1752
1753         ret = mkv_write_tags(s);
1754         if (ret < 0)
1755             goto fail;
1756
1757         ret = mkv_write_attachments(s);
1758         if (ret < 0)
1759             goto fail;
1760     }
1761
1762     if (!s->pb->seekable && !mkv->is_live)
1763         mkv_write_seekhead(pb, mkv);
1764
1765     mkv->cues = mkv_start_cues(mkv->segment_offset);
1766     if (!mkv->cues) {
1767         ret = AVERROR(ENOMEM);
1768         goto fail;
1769     }
1770     if (pb->seekable && mkv->reserve_cues_space) {
1771         mkv->cues_pos = avio_tell(pb);
1772         put_ebml_void(pb, mkv->reserve_cues_space);
1773     }
1774
1775     av_init_packet(&mkv->cur_audio_pkt);
1776     mkv->cur_audio_pkt.size = 0;
1777     mkv->cluster_pos = -1;
1778
1779     avio_flush(pb);
1780
1781     // start a new cluster every 5 MB or 5 sec, or 32k / 1 sec for streaming or
1782     // after 4k and on a keyframe
1783     if (pb->seekable) {
1784         if (mkv->cluster_time_limit < 0)
1785             mkv->cluster_time_limit = 5000;
1786         if (mkv->cluster_size_limit < 0)
1787             mkv->cluster_size_limit = 5 * 1024 * 1024;
1788     } else {
1789         if (mkv->cluster_time_limit < 0)
1790             mkv->cluster_time_limit = 1000;
1791         if (mkv->cluster_size_limit < 0)
1792             mkv->cluster_size_limit = 32 * 1024;
1793     }
1794
1795     return 0;
1796 fail:
1797     mkv_free(mkv);
1798     return ret;
1799 }
1800
1801 static int mkv_blockgroup_size(int pkt_size)
1802 {
1803     int size = pkt_size + 4;
1804     size += ebml_num_size(size);
1805     size += 2;              // EBML ID for block and block duration
1806     size += 8;              // max size of block duration
1807     size += ebml_num_size(size);
1808     size += 1;              // blockgroup EBML ID
1809     return size;
1810 }
1811
1812 static int mkv_strip_wavpack(const uint8_t *src, uint8_t **pdst, int *size)
1813 {
1814     uint8_t *dst;
1815     int srclen = *size;
1816     int offset = 0;
1817     int ret;
1818
1819     dst = av_malloc(srclen);
1820     if (!dst)
1821         return AVERROR(ENOMEM);
1822
1823     while (srclen >= WV_HEADER_SIZE) {
1824         WvHeader header;
1825
1826         ret = ff_wv_parse_header(&header, src);
1827         if (ret < 0)
1828             goto fail;
1829         src    += WV_HEADER_SIZE;
1830         srclen -= WV_HEADER_SIZE;
1831
1832         if (srclen < header.blocksize) {
1833             ret = AVERROR_INVALIDDATA;
1834             goto fail;
1835         }
1836
1837         if (header.initial) {
1838             AV_WL32(dst + offset, header.samples);
1839             offset += 4;
1840         }
1841         AV_WL32(dst + offset,     header.flags);
1842         AV_WL32(dst + offset + 4, header.crc);
1843         offset += 8;
1844
1845         if (!(header.initial && header.final)) {
1846             AV_WL32(dst + offset, header.blocksize);
1847             offset += 4;
1848         }
1849
1850         memcpy(dst + offset, src, header.blocksize);
1851         src    += header.blocksize;
1852         srclen -= header.blocksize;
1853         offset += header.blocksize;
1854     }
1855
1856     *pdst = dst;
1857     *size = offset;
1858
1859     return 0;
1860 fail:
1861     av_freep(&dst);
1862     return ret;
1863 }
1864
1865 static void mkv_write_block(AVFormatContext *s, AVIOContext *pb,
1866                             unsigned int blockid, AVPacket *pkt, int keyframe)
1867 {
1868     MatroskaMuxContext *mkv = s->priv_data;
1869     AVCodecParameters *par = s->streams[pkt->stream_index]->codecpar;
1870     uint8_t *data = NULL, *side_data = NULL;
1871     int offset = 0, size = pkt->size, side_data_size = 0;
1872     int64_t ts = mkv->tracks[pkt->stream_index].write_dts ? pkt->dts : pkt->pts;
1873     uint64_t additional_id = 0;
1874     int64_t discard_padding = 0;
1875     uint8_t track_number = (mkv->is_dash ? mkv->dash_track_number : (pkt->stream_index + 1));
1876     ebml_master block_group, block_additions, block_more;
1877
1878     av_log(s, AV_LOG_DEBUG, "Writing block at offset %" PRIu64 ", size %d, "
1879            "pts %" PRId64 ", dts %" PRId64 ", duration %" PRId64 ", keyframe %d\n",
1880            avio_tell(pb), pkt->size, pkt->pts, pkt->dts, pkt->duration,
1881            keyframe != 0);
1882     if (par->codec_id == AV_CODEC_ID_H264 && par->extradata_size > 0 &&
1883         (AV_RB24(par->extradata) == 1 || AV_RB32(par->extradata) == 1))
1884         ff_avc_parse_nal_units_buf(pkt->data, &data, &size);
1885     else if (par->codec_id == AV_CODEC_ID_HEVC && par->extradata_size > 6 &&
1886              (AV_RB24(par->extradata) == 1 || AV_RB32(par->extradata) == 1))
1887         /* extradata is Annex B, assume the bitstream is too and convert it */
1888         ff_hevc_annexb2mp4_buf(pkt->data, &data, &size, 0, NULL);
1889     else if (par->codec_id == AV_CODEC_ID_WAVPACK) {
1890         int ret = mkv_strip_wavpack(pkt->data, &data, &size);
1891         if (ret < 0) {
1892             av_log(s, AV_LOG_ERROR, "Error stripping a WavPack packet.\n");
1893             return;
1894         }
1895     } else
1896         data = pkt->data;
1897
1898     if (par->codec_id == AV_CODEC_ID_PRORES && size >= 8) {
1899         /* Matroska specification requires to remove the first QuickTime atom
1900          */
1901         size  -= 8;
1902         offset = 8;
1903     }
1904
1905     side_data = av_packet_get_side_data(pkt,
1906                                         AV_PKT_DATA_SKIP_SAMPLES,
1907                                         &side_data_size);
1908
1909     if (side_data && side_data_size >= 10) {
1910         discard_padding = av_rescale_q(AV_RL32(side_data + 4),
1911                                        (AVRational){1, par->sample_rate},
1912                                        (AVRational){1, 1000000000});
1913     }
1914
1915     side_data = av_packet_get_side_data(pkt,
1916                                         AV_PKT_DATA_MATROSKA_BLOCKADDITIONAL,
1917                                         &side_data_size);
1918     if (side_data) {
1919         additional_id = AV_RB64(side_data);
1920         side_data += 8;
1921         side_data_size -= 8;
1922     }
1923
1924     if ((side_data_size && additional_id == 1) || discard_padding) {
1925         block_group = start_ebml_master(pb, MATROSKA_ID_BLOCKGROUP, 0);
1926         blockid = MATROSKA_ID_BLOCK;
1927     }
1928
1929     put_ebml_id(pb, blockid);
1930     put_ebml_num(pb, size + 4, 0);
1931     // this assumes stream_index is less than 126
1932     avio_w8(pb, 0x80 | track_number);
1933     avio_wb16(pb, ts - mkv->cluster_pts);
1934     avio_w8(pb, (blockid == MATROSKA_ID_SIMPLEBLOCK && keyframe) ? (1 << 7) : 0);
1935     avio_write(pb, data + offset, size);
1936     if (data != pkt->data)
1937         av_free(data);
1938
1939     if (blockid == MATROSKA_ID_BLOCK && !keyframe) {
1940         put_ebml_sint(pb, MATROSKA_ID_BLOCKREFERENCE,
1941                       mkv->last_track_timestamp[track_number - 1]);
1942     }
1943     mkv->last_track_timestamp[track_number - 1] = ts - mkv->cluster_pts;
1944
1945     if (discard_padding) {
1946         put_ebml_sint(pb, MATROSKA_ID_DISCARDPADDING, discard_padding);
1947     }
1948
1949     if (side_data_size && additional_id == 1) {
1950         block_additions = start_ebml_master(pb, MATROSKA_ID_BLOCKADDITIONS, 0);
1951         block_more = start_ebml_master(pb, MATROSKA_ID_BLOCKMORE, 0);
1952         put_ebml_uint(pb, MATROSKA_ID_BLOCKADDID, 1);
1953         put_ebml_id(pb, MATROSKA_ID_BLOCKADDITIONAL);
1954         put_ebml_num(pb, side_data_size, 0);
1955         avio_write(pb, side_data, side_data_size);
1956         end_ebml_master(pb, block_more);
1957         end_ebml_master(pb, block_additions);
1958     }
1959     if ((side_data_size && additional_id == 1) || discard_padding) {
1960         end_ebml_master(pb, block_group);
1961     }
1962 }
1963
1964 static int mkv_write_vtt_blocks(AVFormatContext *s, AVIOContext *pb, AVPacket *pkt)
1965 {
1966     MatroskaMuxContext *mkv = s->priv_data;
1967     ebml_master blockgroup;
1968     int id_size, settings_size, size;
1969     uint8_t *id, *settings;
1970     int64_t ts = mkv->tracks[pkt->stream_index].write_dts ? pkt->dts : pkt->pts;
1971     const int flags = 0;
1972
1973     id_size = 0;
1974     id = av_packet_get_side_data(pkt, AV_PKT_DATA_WEBVTT_IDENTIFIER,
1975                                  &id_size);
1976
1977     settings_size = 0;
1978     settings = av_packet_get_side_data(pkt, AV_PKT_DATA_WEBVTT_SETTINGS,
1979                                        &settings_size);
1980
1981     size = id_size + 1 + settings_size + 1 + pkt->size;
1982
1983     av_log(s, AV_LOG_DEBUG, "Writing block at offset %" PRIu64 ", size %d, "
1984            "pts %" PRId64 ", dts %" PRId64 ", duration %" PRId64 ", flags %d\n",
1985            avio_tell(pb), size, pkt->pts, pkt->dts, pkt->duration, flags);
1986
1987     blockgroup = start_ebml_master(pb, MATROSKA_ID_BLOCKGROUP, mkv_blockgroup_size(size));
1988
1989     put_ebml_id(pb, MATROSKA_ID_BLOCK);
1990     put_ebml_num(pb, size + 4, 0);
1991     avio_w8(pb, 0x80 | (pkt->stream_index + 1));     // this assumes stream_index is less than 126
1992     avio_wb16(pb, ts - mkv->cluster_pts);
1993     avio_w8(pb, flags);
1994     avio_printf(pb, "%.*s\n%.*s\n%.*s", id_size, id, settings_size, settings, pkt->size, pkt->data);
1995
1996     put_ebml_uint(pb, MATROSKA_ID_BLOCKDURATION, pkt->duration);
1997     end_ebml_master(pb, blockgroup);
1998
1999     return pkt->duration;
2000 }
2001
2002 static void mkv_start_new_cluster(AVFormatContext *s, AVPacket *pkt)
2003 {
2004     MatroskaMuxContext *mkv = s->priv_data;
2005
2006     end_ebml_master_crc32(s->pb, &mkv->dyn_bc, mkv, mkv->cluster);
2007     mkv->cluster_pos = -1;
2008     if (s->pb->seekable)
2009         av_log(s, AV_LOG_DEBUG,
2010                "Starting new cluster at offset %" PRIu64 " bytes, "
2011                "pts %" PRIu64 "dts %" PRIu64 "\n",
2012                avio_tell(s->pb), pkt->pts, pkt->dts);
2013     else
2014         av_log(s, AV_LOG_DEBUG, "Starting new cluster, "
2015                "pts %" PRIu64 "dts %" PRIu64 "\n",
2016                pkt->pts, pkt->dts);
2017     avio_flush(s->pb);
2018 }
2019
2020 static int mkv_write_packet_internal(AVFormatContext *s, AVPacket *pkt, int add_cue)
2021 {
2022     MatroskaMuxContext *mkv = s->priv_data;
2023     AVIOContext *pb         = s->pb;
2024     AVCodecParameters *par  = s->streams[pkt->stream_index]->codecpar;
2025     int keyframe            = !!(pkt->flags & AV_PKT_FLAG_KEY);
2026     int duration            = pkt->duration;
2027     int ret;
2028     int64_t ts = mkv->tracks[pkt->stream_index].write_dts ? pkt->dts : pkt->pts;
2029     int64_t relative_packet_pos;
2030     int dash_tracknum = mkv->is_dash ? mkv->dash_track_number : pkt->stream_index + 1;
2031
2032     if (ts == AV_NOPTS_VALUE) {
2033         av_log(s, AV_LOG_ERROR, "Can't write packet with unknown timestamp\n");
2034         return AVERROR(EINVAL);
2035     }
2036     ts += mkv->tracks[pkt->stream_index].ts_offset;
2037
2038     if (mkv->cluster_pos != -1) {
2039         int64_t cluster_time = ts - mkv->cluster_pts + mkv->tracks[pkt->stream_index].ts_offset;
2040         if ((int16_t)cluster_time != cluster_time) {
2041             av_log(s, AV_LOG_WARNING, "Starting new cluster due to timestamp\n");
2042             mkv_start_new_cluster(s, pkt);
2043         }
2044     }
2045
2046     if (mkv->cluster_pos == -1) {
2047         mkv->cluster_pos = avio_tell(s->pb);
2048         ret = start_ebml_master_crc32(s->pb, &mkv->dyn_bc, &mkv->cluster, MATROSKA_ID_CLUSTER, 0);
2049         if (ret < 0)
2050             return ret;
2051         put_ebml_uint(mkv->dyn_bc, MATROSKA_ID_CLUSTERTIMECODE, FFMAX(0, ts));
2052         mkv->cluster_pts = FFMAX(0, ts);
2053     }
2054     pb = mkv->dyn_bc;
2055
2056     relative_packet_pos = avio_tell(s->pb) - mkv->cluster.pos + avio_tell(pb);
2057
2058     if (par->codec_type != AVMEDIA_TYPE_SUBTITLE) {
2059         mkv_write_block(s, pb, MATROSKA_ID_SIMPLEBLOCK, pkt, keyframe);
2060         if (s->pb->seekable && (par->codec_type == AVMEDIA_TYPE_VIDEO && keyframe || add_cue)) {
2061             ret = mkv_add_cuepoint(mkv->cues, pkt->stream_index, dash_tracknum, ts, mkv->cluster_pos, relative_packet_pos, -1);
2062             if (ret < 0) return ret;
2063         }
2064     } else {
2065         if (par->codec_id == AV_CODEC_ID_WEBVTT) {
2066             duration = mkv_write_vtt_blocks(s, pb, pkt);
2067         } else {
2068             ebml_master blockgroup = start_ebml_master(pb, MATROSKA_ID_BLOCKGROUP,
2069                                                        mkv_blockgroup_size(pkt->size));
2070
2071 #if FF_API_CONVERGENCE_DURATION
2072 FF_DISABLE_DEPRECATION_WARNINGS
2073             /* For backward compatibility, prefer convergence_duration. */
2074             if (pkt->convergence_duration > 0) {
2075                 duration = pkt->convergence_duration;
2076             }
2077 FF_ENABLE_DEPRECATION_WARNINGS
2078 #endif
2079             /* All subtitle blocks are considered to be keyframes. */
2080             mkv_write_block(s, pb, MATROSKA_ID_BLOCK, pkt, 1);
2081             put_ebml_uint(pb, MATROSKA_ID_BLOCKDURATION, duration);
2082             end_ebml_master(pb, blockgroup);
2083         }
2084
2085         if (s->pb->seekable) {
2086             ret = mkv_add_cuepoint(mkv->cues, pkt->stream_index, dash_tracknum, ts,
2087                                    mkv->cluster_pos, relative_packet_pos, duration);
2088             if (ret < 0)
2089                 return ret;
2090         }
2091     }
2092
2093     mkv->duration = FFMAX(mkv->duration, ts + duration);
2094
2095     if (mkv->stream_durations)
2096         mkv->stream_durations[pkt->stream_index] =
2097             FFMAX(mkv->stream_durations[pkt->stream_index], ts + duration);
2098
2099     return 0;
2100 }
2101
2102 static int mkv_write_packet(AVFormatContext *s, AVPacket *pkt)
2103 {
2104     MatroskaMuxContext *mkv = s->priv_data;
2105     int codec_type          = s->streams[pkt->stream_index]->codecpar->codec_type;
2106     int keyframe            = !!(pkt->flags & AV_PKT_FLAG_KEY);
2107     int cluster_size;
2108     int64_t cluster_time;
2109     int ret;
2110     int start_new_cluster;
2111
2112     if (mkv->tracks[pkt->stream_index].write_dts)
2113         cluster_time = pkt->dts - mkv->cluster_pts;
2114     else
2115         cluster_time = pkt->pts - mkv->cluster_pts;
2116     cluster_time += mkv->tracks[pkt->stream_index].ts_offset;
2117
2118     // start a new cluster every 5 MB or 5 sec, or 32k / 1 sec for streaming or
2119     // after 4k and on a keyframe
2120     cluster_size = avio_tell(mkv->dyn_bc);
2121
2122     if (mkv->is_dash && codec_type == AVMEDIA_TYPE_VIDEO) {
2123         // WebM DASH specification states that the first block of every cluster
2124         // has to be a key frame. So for DASH video, we only create a cluster
2125         // on seeing key frames.
2126         start_new_cluster = keyframe;
2127     } else if (mkv->is_dash && codec_type == AVMEDIA_TYPE_AUDIO &&
2128                (mkv->cluster_pos == -1 ||
2129                 cluster_time > mkv->cluster_time_limit)) {
2130         // For DASH audio, we create a Cluster based on cluster_time_limit
2131         start_new_cluster = 1;
2132     } else if (!mkv->is_dash &&
2133                (cluster_size > mkv->cluster_size_limit ||
2134                 cluster_time > mkv->cluster_time_limit ||
2135                 (codec_type == AVMEDIA_TYPE_VIDEO && keyframe &&
2136                  cluster_size > 4 * 1024))) {
2137         start_new_cluster = 1;
2138     } else {
2139         start_new_cluster = 0;
2140     }
2141
2142     if (mkv->cluster_pos != -1 && start_new_cluster) {
2143         mkv_start_new_cluster(s, pkt);
2144     }
2145
2146     if (!mkv->cluster_pos)
2147         avio_write_marker(s->pb,
2148                           av_rescale_q(pkt->dts, s->streams[pkt->stream_index]->time_base, AV_TIME_BASE_Q),
2149                           keyframe && (mkv->have_video ? codec_type == AVMEDIA_TYPE_VIDEO : 1) ? AVIO_DATA_MARKER_SYNC_POINT : AVIO_DATA_MARKER_BOUNDARY_POINT);
2150
2151     // check if we have an audio packet cached
2152     if (mkv->cur_audio_pkt.size > 0) {
2153         // for DASH audio, a CuePoint has to be added when there is a new cluster.
2154         ret = mkv_write_packet_internal(s, &mkv->cur_audio_pkt,
2155                                         mkv->is_dash ? start_new_cluster : 0);
2156         av_packet_unref(&mkv->cur_audio_pkt);
2157         if (ret < 0) {
2158             av_log(s, AV_LOG_ERROR,
2159                    "Could not write cached audio packet ret:%d\n", ret);
2160             return ret;
2161         }
2162     }
2163
2164     // buffer an audio packet to ensure the packet containing the video
2165     // keyframe's timecode is contained in the same cluster for WebM
2166     if (codec_type == AVMEDIA_TYPE_AUDIO) {
2167         ret = av_packet_ref(&mkv->cur_audio_pkt, pkt);
2168     } else
2169         ret = mkv_write_packet_internal(s, pkt, 0);
2170     return ret;
2171 }
2172
2173 static int mkv_write_flush_packet(AVFormatContext *s, AVPacket *pkt)
2174 {
2175     MatroskaMuxContext *mkv = s->priv_data;
2176
2177     if (!pkt) {
2178         if (mkv->cluster_pos != -1) {
2179             end_ebml_master_crc32(s->pb, &mkv->dyn_bc, mkv, mkv->cluster);
2180             mkv->cluster_pos = -1;
2181             if (s->pb->seekable)
2182                 av_log(s, AV_LOG_DEBUG,
2183                        "Flushing cluster at offset %" PRIu64 " bytes\n",
2184                        avio_tell(s->pb));
2185             else
2186                 av_log(s, AV_LOG_DEBUG, "Flushing cluster\n");
2187             avio_flush(s->pb);
2188         }
2189         return 1;
2190     }
2191     return mkv_write_packet(s, pkt);
2192 }
2193
2194 static int mkv_write_trailer(AVFormatContext *s)
2195 {
2196     MatroskaMuxContext *mkv = s->priv_data;
2197     AVIOContext *pb = s->pb;
2198     int64_t currentpos, cuespos;
2199     int ret;
2200
2201     // check if we have an audio packet cached
2202     if (mkv->cur_audio_pkt.size > 0) {
2203         ret = mkv_write_packet_internal(s, &mkv->cur_audio_pkt, 0);
2204         av_packet_unref(&mkv->cur_audio_pkt);
2205         if (ret < 0) {
2206             av_log(s, AV_LOG_ERROR,
2207                    "Could not write cached audio packet ret:%d\n", ret);
2208             return ret;
2209         }
2210     }
2211
2212     if (mkv->dyn_bc) {
2213         end_ebml_master_crc32(pb, &mkv->dyn_bc, mkv, mkv->cluster);
2214     }
2215
2216     if (mkv->mode != MODE_WEBM) {
2217         ret = mkv_write_chapters(s);
2218         if (ret < 0)
2219             return ret;
2220     }
2221
2222     if (pb->seekable) {
2223         if (mkv->cues->num_entries) {
2224             if (mkv->reserve_cues_space) {
2225                 int64_t cues_end;
2226
2227                 currentpos = avio_tell(pb);
2228                 avio_seek(pb, mkv->cues_pos, SEEK_SET);
2229
2230                 cuespos  = mkv_write_cues(s, mkv->cues, mkv->tracks, s->nb_streams);
2231                 cues_end = avio_tell(pb);
2232                 if (cues_end > cuespos + mkv->reserve_cues_space) {
2233                     av_log(s, AV_LOG_ERROR,
2234                            "Insufficient space reserved for cues: %d "
2235                            "(needed: %" PRId64 ").\n",
2236                            mkv->reserve_cues_space, cues_end - cuespos);
2237                     return AVERROR(EINVAL);
2238                 }
2239
2240                 if (cues_end < cuespos + mkv->reserve_cues_space)
2241                     put_ebml_void(pb, mkv->reserve_cues_space -
2242                                   (cues_end - cuespos));
2243
2244                 avio_seek(pb, currentpos, SEEK_SET);
2245             } else {
2246                 cuespos = mkv_write_cues(s, mkv->cues, mkv->tracks, s->nb_streams);
2247             }
2248
2249             ret = mkv_add_seekhead_entry(mkv->main_seekhead, MATROSKA_ID_CUES,
2250                                          cuespos);
2251             if (ret < 0)
2252                 return ret;
2253         }
2254
2255         mkv_write_seekhead(pb, mkv);
2256
2257         // update the duration
2258         av_log(s, AV_LOG_DEBUG, "end duration = %" PRIu64 "\n", mkv->duration);
2259         currentpos = avio_tell(pb);
2260         avio_seek(mkv->info_bc, mkv->duration_offset, SEEK_SET);
2261         put_ebml_float(mkv->info_bc, MATROSKA_ID_DURATION, mkv->duration);
2262         avio_seek(pb, mkv->info.pos, SEEK_SET);
2263         end_ebml_master_crc32(pb, &mkv->info_bc, mkv, mkv->info);
2264
2265         // update stream durations
2266         if (mkv->stream_durations) {
2267             int i;
2268             for (i = 0; i < s->nb_streams; ++i) {
2269                 AVStream *st = s->streams[i];
2270                 double duration_sec = mkv->stream_durations[i] * av_q2d(st->time_base);
2271                 char duration_string[20] = "";
2272
2273                 av_log(s, AV_LOG_DEBUG, "stream %d end duration = %" PRIu64 "\n", i,
2274                        mkv->stream_durations[i]);
2275
2276                 if (!mkv->is_live && mkv->stream_duration_offsets[i] > 0) {
2277                     avio_seek(mkv->tags_bc, mkv->stream_duration_offsets[i], SEEK_SET);
2278
2279                     snprintf(duration_string, 20, "%02d:%02d:%012.9f",
2280                              (int) duration_sec / 3600, ((int) duration_sec / 60) % 60,
2281                              fmod(duration_sec, 60));
2282
2283                     put_ebml_binary(mkv->tags_bc, MATROSKA_ID_TAGSTRING, duration_string, 20);
2284                 }
2285             }
2286         }
2287         if (mkv->tags.pos && !mkv->is_live) {
2288             avio_seek(pb, mkv->tags.pos, SEEK_SET);
2289             end_ebml_master_crc32(pb, &mkv->tags_bc, mkv, mkv->tags);
2290         }
2291
2292         avio_seek(pb, currentpos, SEEK_SET);
2293     }
2294
2295     if (!mkv->is_live) {
2296         end_ebml_master(pb, mkv->segment);
2297     }
2298
2299     mkv_free(mkv);
2300     return 0;
2301 }
2302
2303 static int mkv_query_codec(enum AVCodecID codec_id, int std_compliance)
2304 {
2305     int i;
2306     for (i = 0; ff_mkv_codec_tags[i].id != AV_CODEC_ID_NONE; i++)
2307         if (ff_mkv_codec_tags[i].id == codec_id)
2308             return 1;
2309
2310     if (std_compliance < FF_COMPLIANCE_NORMAL) {
2311         enum AVMediaType type = avcodec_get_type(codec_id);
2312         // mkv theoretically supports any video/audio through VFW/ACM
2313         if (type == AVMEDIA_TYPE_VIDEO || type == AVMEDIA_TYPE_AUDIO)
2314             return 1;
2315     }
2316
2317     return 0;
2318 }
2319
2320 static int mkv_init(struct AVFormatContext *s)
2321 {
2322     int i;
2323
2324     if (s->avoid_negative_ts < 0) {
2325         s->avoid_negative_ts = 1;
2326         s->internal->avoid_negative_ts_use_pts = 1;
2327     }
2328
2329     for (i = 0; i < s->nb_streams; i++) {
2330         // ms precision is the de-facto standard timescale for mkv files
2331         avpriv_set_pts_info(s->streams[i], 64, 1, 1000);
2332     }
2333
2334     return 0;
2335 }
2336
2337 static int mkv_check_bitstream(struct AVFormatContext *s, const AVPacket *pkt)
2338 {
2339     int ret = 1;
2340     AVStream *st = s->streams[pkt->stream_index];
2341
2342     if (st->codecpar->codec_id == AV_CODEC_ID_AAC) {
2343         if (pkt->size > 2 && (AV_RB16(pkt->data) & 0xfff0) == 0xfff0)
2344             ret = ff_stream_add_bitstream_filter(st, "aac_adtstoasc", NULL);
2345     } else if (st->codecpar->codec_id == AV_CODEC_ID_VP9) {
2346         ret = ff_stream_add_bitstream_filter(st, "vp9_superframe", NULL);
2347     }
2348
2349     return ret;
2350 }
2351
2352 static const AVCodecTag additional_audio_tags[] = {
2353     { AV_CODEC_ID_ALAC,      0XFFFFFFFF },
2354     { AV_CODEC_ID_EAC3,      0XFFFFFFFF },
2355     { AV_CODEC_ID_MLP,       0xFFFFFFFF },
2356     { AV_CODEC_ID_OPUS,      0xFFFFFFFF },
2357     { AV_CODEC_ID_PCM_S16BE, 0xFFFFFFFF },
2358     { AV_CODEC_ID_PCM_S24BE, 0xFFFFFFFF },
2359     { AV_CODEC_ID_PCM_S32BE, 0xFFFFFFFF },
2360     { AV_CODEC_ID_QDM2,      0xFFFFFFFF },
2361     { AV_CODEC_ID_RA_144,    0xFFFFFFFF },
2362     { AV_CODEC_ID_RA_288,    0xFFFFFFFF },
2363     { AV_CODEC_ID_COOK,      0xFFFFFFFF },
2364     { AV_CODEC_ID_TRUEHD,    0xFFFFFFFF },
2365     { AV_CODEC_ID_NONE,      0xFFFFFFFF }
2366 };
2367
2368 static const AVCodecTag additional_video_tags[] = {
2369     { AV_CODEC_ID_RV10,      0xFFFFFFFF },
2370     { AV_CODEC_ID_RV20,      0xFFFFFFFF },
2371     { AV_CODEC_ID_RV30,      0xFFFFFFFF },
2372     { AV_CODEC_ID_RV40,      0xFFFFFFFF },
2373     { AV_CODEC_ID_VP9,       0xFFFFFFFF },
2374     { AV_CODEC_ID_NONE,      0xFFFFFFFF }
2375 };
2376
2377 static const AVCodecTag additional_subtitle_tags[] = {
2378     { AV_CODEC_ID_DVB_SUBTITLE,      0xFFFFFFFF },
2379     { AV_CODEC_ID_HDMV_PGS_SUBTITLE, 0xFFFFFFFF },
2380     { AV_CODEC_ID_NONE,              0xFFFFFFFF }
2381 };
2382
2383 #define OFFSET(x) offsetof(MatroskaMuxContext, x)
2384 #define FLAGS AV_OPT_FLAG_ENCODING_PARAM
2385 static const AVOption options[] = {
2386     { "reserve_index_space", "Reserve a given amount of space (in bytes) at the beginning of the file for the index (cues).", OFFSET(reserve_cues_space), AV_OPT_TYPE_INT,   { .i64 = 0 },   0, INT_MAX,   FLAGS },
2387     { "cluster_size_limit",  "Store at most the provided amount of bytes in a cluster. ",                                     OFFSET(cluster_size_limit), AV_OPT_TYPE_INT  , { .i64 = -1 }, -1, INT_MAX,   FLAGS },
2388     { "cluster_time_limit",  "Store at most the provided number of milliseconds in a cluster.",                               OFFSET(cluster_time_limit), AV_OPT_TYPE_INT64, { .i64 = -1 }, -1, INT64_MAX, FLAGS },
2389     { "dash", "Create a WebM file conforming to WebM DASH specification", OFFSET(is_dash), AV_OPT_TYPE_BOOL, { .i64 = 0 }, 0, 1, FLAGS },
2390     { "dash_track_number", "Track number for the DASH stream", OFFSET(dash_track_number), AV_OPT_TYPE_INT, { .i64 = 1 }, 0, 127, FLAGS },
2391     { "live", "Write files assuming it is a live stream.", OFFSET(is_live), AV_OPT_TYPE_BOOL, { .i64 = 0 }, 0, 1, FLAGS },
2392     { "allow_raw_vfw", "allow RAW VFW mode", OFFSET(allow_raw_vfw), AV_OPT_TYPE_BOOL, { .i64 = 0 }, 0, 1, FLAGS },
2393     { NULL },
2394 };
2395
2396 #if CONFIG_MATROSKA_MUXER
2397 static const AVClass matroska_class = {
2398     .class_name = "matroska muxer",
2399     .item_name  = av_default_item_name,
2400     .option     = options,
2401     .version    = LIBAVUTIL_VERSION_INT,
2402 };
2403
2404 AVOutputFormat ff_matroska_muxer = {
2405     .name              = "matroska",
2406     .long_name         = NULL_IF_CONFIG_SMALL("Matroska"),
2407     .mime_type         = "video/x-matroska",
2408     .extensions        = "mkv",
2409     .priv_data_size    = sizeof(MatroskaMuxContext),
2410     .audio_codec       = CONFIG_LIBVORBIS_ENCODER ?
2411                          AV_CODEC_ID_VORBIS : AV_CODEC_ID_AC3,
2412     .video_codec       = CONFIG_LIBX264_ENCODER ?
2413                          AV_CODEC_ID_H264 : AV_CODEC_ID_MPEG4,
2414     .init              = mkv_init,
2415     .write_header      = mkv_write_header,
2416     .write_packet      = mkv_write_flush_packet,
2417     .write_trailer     = mkv_write_trailer,
2418     .flags             = AVFMT_GLOBALHEADER | AVFMT_VARIABLE_FPS |
2419                          AVFMT_TS_NONSTRICT | AVFMT_ALLOW_FLUSH,
2420     .codec_tag         = (const AVCodecTag* const []){
2421          ff_codec_bmp_tags, ff_codec_wav_tags,
2422          additional_audio_tags, additional_video_tags, additional_subtitle_tags, 0
2423     },
2424     .subtitle_codec    = AV_CODEC_ID_ASS,
2425     .query_codec       = mkv_query_codec,
2426     .check_bitstream   = mkv_check_bitstream,
2427     .priv_class        = &matroska_class,
2428 };
2429 #endif
2430
2431 #if CONFIG_WEBM_MUXER
2432 static const AVClass webm_class = {
2433     .class_name = "webm muxer",
2434     .item_name  = av_default_item_name,
2435     .option     = options,
2436     .version    = LIBAVUTIL_VERSION_INT,
2437 };
2438
2439 AVOutputFormat ff_webm_muxer = {
2440     .name              = "webm",
2441     .long_name         = NULL_IF_CONFIG_SMALL("WebM"),
2442     .mime_type         = "video/webm",
2443     .extensions        = "webm",
2444     .priv_data_size    = sizeof(MatroskaMuxContext),
2445     .audio_codec       = CONFIG_LIBOPUS_ENCODER ? AV_CODEC_ID_OPUS : AV_CODEC_ID_VORBIS,
2446     .video_codec       = CONFIG_LIBVPX_VP9_ENCODER? AV_CODEC_ID_VP9 : AV_CODEC_ID_VP8,
2447     .subtitle_codec    = AV_CODEC_ID_WEBVTT,
2448     .init              = mkv_init,
2449     .write_header      = mkv_write_header,
2450     .write_packet      = mkv_write_flush_packet,
2451     .write_trailer     = mkv_write_trailer,
2452     .check_bitstream   = mkv_check_bitstream,
2453     .flags             = AVFMT_GLOBALHEADER | AVFMT_VARIABLE_FPS |
2454                          AVFMT_TS_NONSTRICT | AVFMT_ALLOW_FLUSH,
2455     .priv_class        = &webm_class,
2456 };
2457 #endif
2458
2459 #if CONFIG_MATROSKA_AUDIO_MUXER
2460 static const AVClass mka_class = {
2461     .class_name = "matroska audio muxer",
2462     .item_name  = av_default_item_name,
2463     .option     = options,
2464     .version    = LIBAVUTIL_VERSION_INT,
2465 };
2466 AVOutputFormat ff_matroska_audio_muxer = {
2467     .name              = "matroska",
2468     .long_name         = NULL_IF_CONFIG_SMALL("Matroska Audio"),
2469     .mime_type         = "audio/x-matroska",
2470     .extensions        = "mka",
2471     .priv_data_size    = sizeof(MatroskaMuxContext),
2472     .audio_codec       = CONFIG_LIBVORBIS_ENCODER ?
2473                          AV_CODEC_ID_VORBIS : AV_CODEC_ID_AC3,
2474     .video_codec       = AV_CODEC_ID_NONE,
2475     .init              = mkv_init,
2476     .write_header      = mkv_write_header,
2477     .write_packet      = mkv_write_flush_packet,
2478     .write_trailer     = mkv_write_trailer,
2479     .check_bitstream   = mkv_check_bitstream,
2480     .flags             = AVFMT_GLOBALHEADER | AVFMT_TS_NONSTRICT |
2481                          AVFMT_ALLOW_FLUSH,
2482     .codec_tag         = (const AVCodecTag* const []){
2483         ff_codec_wav_tags, additional_audio_tags, 0
2484     },
2485     .priv_class        = &mka_class,
2486 };
2487 #endif