]> git.sesse.net Git - ffmpeg/blob - libavformat/mxfdec.c
aacenc: use constants to set AAC coder
[ffmpeg] / libavformat / mxfdec.c
1 /*
2  * MXF demuxer.
3  * Copyright (c) 2006 SmartJog S.A., Baptiste Coudurier <baptiste dot coudurier at smartjog dot com>
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 /*
23  * References
24  * SMPTE 336M KLV Data Encoding Protocol Using Key-Length-Value
25  * SMPTE 377M MXF File Format Specifications
26  * SMPTE 378M Operational Pattern 1a
27  * SMPTE 379M MXF Generic Container
28  * SMPTE 381M Mapping MPEG Streams into the MXF Generic Container
29  * SMPTE 382M Mapping AES3 and Broadcast Wave Audio into the MXF Generic Container
30  * SMPTE 383M Mapping DV-DIF Data to the MXF Generic Container
31  *
32  * Principle
33  * Search for Track numbers which will identify essence element KLV packets.
34  * Search for SourcePackage which define tracks which contains Track numbers.
35  * Material Package contains tracks with reference to SourcePackage tracks.
36  * Search for Descriptors (Picture, Sound) which contains codec info and parameters.
37  * Assign Descriptors to correct Tracks.
38  *
39  * Metadata reading functions read Local Tags, get InstanceUID(0x3C0A) then add MetaDataSet to MXFContext.
40  * Metadata parsing resolves Strong References to objects.
41  *
42  * Simple demuxer, only OP1A supported and some files might not work at all.
43  * Only tracks with associated descriptors will be decoded. "Highly Desirable" SMPTE 377M D.1
44  */
45
46 #include "libavutil/aes.h"
47 #include "libavutil/avassert.h"
48 #include "libavutil/mathematics.h"
49 #include "libavcodec/bytestream.h"
50 #include "libavutil/timecode.h"
51 #include "avformat.h"
52 #include "internal.h"
53 #include "mxf.h"
54
55 typedef enum {
56     Header,
57     BodyPartition,
58     Footer
59 } MXFPartitionType;
60
61 typedef enum {
62     OP1a = 1,
63     OP1b,
64     OP1c,
65     OP2a,
66     OP2b,
67     OP2c,
68     OP3a,
69     OP3b,
70     OP3c,
71     OPAtom,
72     OPSONYOpt,  /* FATE sample, violates the spec in places */
73 } MXFOP;
74
75 typedef struct {
76     int closed;
77     int complete;
78     MXFPartitionType type;
79     uint64_t previous_partition;
80     int index_sid;
81     int body_sid;
82     int64_t this_partition;
83     int64_t essence_offset;         ///< absolute offset of essence
84     int64_t essence_length;
85     int32_t kag_size;
86     int64_t header_byte_count;
87     int64_t index_byte_count;
88     int pack_length;
89 } MXFPartition;
90
91 typedef struct {
92     UID uid;
93     enum MXFMetadataSetType type;
94     UID source_container_ul;
95 } MXFCryptoContext;
96
97 typedef struct {
98     UID uid;
99     enum MXFMetadataSetType type;
100     UID source_package_uid;
101     UID data_definition_ul;
102     int64_t duration;
103     int64_t start_position;
104     int source_track_id;
105 } MXFStructuralComponent;
106
107 typedef struct {
108     UID uid;
109     enum MXFMetadataSetType type;
110     UID data_definition_ul;
111     UID *structural_components_refs;
112     int structural_components_count;
113     int64_t duration;
114 } MXFSequence;
115
116 typedef struct {
117     UID uid;
118     enum MXFMetadataSetType type;
119     int drop_frame;
120     int start_frame;
121     struct AVRational rate;
122     AVTimecode tc;
123 } MXFTimecodeComponent;
124
125 typedef struct {
126     UID uid;
127     enum MXFMetadataSetType type;
128     MXFSequence *sequence; /* mandatory, and only one */
129     UID sequence_ref;
130     int track_id;
131     uint8_t track_number[4];
132     AVRational edit_rate;
133     int intra_only;
134     uint64_t sample_count;
135     int64_t original_duration;  ///< duration before multiplying st->duration by SampleRate/EditRate
136 } MXFTrack;
137
138 typedef struct {
139     UID uid;
140     enum MXFMetadataSetType type;
141     UID essence_container_ul;
142     UID essence_codec_ul;
143     AVRational sample_rate;
144     AVRational aspect_ratio;
145     int width;
146     int height; /* Field height, not frame height */
147     int frame_layout; /* See MXFFrameLayout enum */
148     int channels;
149     int bits_per_sample;
150     int field_dominance;
151     unsigned int component_depth;
152     unsigned int horiz_subsampling;
153     unsigned int vert_subsampling;
154     UID *sub_descriptors_refs;
155     int sub_descriptors_count;
156     int linked_track_id;
157     uint8_t *extradata;
158     int extradata_size;
159     enum AVPixelFormat pix_fmt;
160 } MXFDescriptor;
161
162 typedef struct {
163     UID uid;
164     enum MXFMetadataSetType type;
165     int edit_unit_byte_count;
166     int index_sid;
167     int body_sid;
168     AVRational index_edit_rate;
169     uint64_t index_start_position;
170     uint64_t index_duration;
171     int8_t *temporal_offset_entries;
172     int *flag_entries;
173     uint64_t *stream_offset_entries;
174     int nb_index_entries;
175 } MXFIndexTableSegment;
176
177 typedef struct {
178     UID uid;
179     enum MXFMetadataSetType type;
180     UID package_uid;
181     UID *tracks_refs;
182     int tracks_count;
183     MXFDescriptor *descriptor; /* only one */
184     UID descriptor_ref;
185 } MXFPackage;
186
187 typedef struct {
188     UID uid;
189     enum MXFMetadataSetType type;
190 } MXFMetadataSet;
191
192 /* decoded index table */
193 typedef struct {
194     int index_sid;
195     int body_sid;
196     int nb_ptses;               /* number of PTSes or total duration of index */
197     int64_t first_dts;          /* DTS = EditUnit + first_dts */
198     int64_t *ptses;             /* maps EditUnit -> PTS */
199     int nb_segments;
200     MXFIndexTableSegment **segments;    /* sorted by IndexStartPosition */
201     AVIndexEntry *fake_index;   /* used for calling ff_index_search_timestamp() */
202 } MXFIndexTable;
203
204 typedef struct {
205     MXFPartition *partitions;
206     unsigned partitions_count;
207     MXFOP op;
208     UID *packages_refs;
209     int packages_count;
210     MXFMetadataSet **metadata_sets;
211     int metadata_sets_count;
212     AVFormatContext *fc;
213     struct AVAES *aesc;
214     uint8_t *local_tags;
215     int local_tags_count;
216     uint64_t footer_partition;
217     KLVPacket current_klv_data;
218     int current_klv_index;
219     int run_in;
220     MXFPartition *current_partition;
221     int parsing_backward;
222     int64_t last_forward_tell;
223     int last_forward_partition;
224     int current_edit_unit;
225     int nb_index_tables;
226     MXFIndexTable *index_tables;
227     int edit_units_per_packet;      ///< how many edit units to read at a time (PCM, OPAtom)
228 } MXFContext;
229
230 enum MXFWrappingScheme {
231     Frame,
232     Clip,
233 };
234
235 /* NOTE: klv_offset is not set (-1) for local keys */
236 typedef int MXFMetadataReadFunc(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset);
237
238 typedef struct {
239     const UID key;
240     MXFMetadataReadFunc *read;
241     int ctx_size;
242     enum MXFMetadataSetType type;
243 } MXFMetadataReadTableEntry;
244
245 static int mxf_read_close(AVFormatContext *s);
246
247 /* partial keys to match */
248 static const uint8_t mxf_header_partition_pack_key[]       = { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02 };
249 static const uint8_t mxf_essence_element_key[]             = { 0x06,0x0e,0x2b,0x34,0x01,0x02,0x01,0x01,0x0d,0x01,0x03,0x01 };
250 static const uint8_t mxf_avid_essence_element_key[]        = { 0x06,0x0e,0x2b,0x34,0x01,0x02,0x01,0x01,0x0e,0x04,0x03,0x01 };
251 static const uint8_t mxf_system_item_key[]                 = { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0D,0x01,0x03,0x01,0x04 };
252 static const uint8_t mxf_klv_key[]                         = { 0x06,0x0e,0x2b,0x34 };
253 /* complete keys to match */
254 static const uint8_t mxf_crypto_source_container_ul[]      = { 0x06,0x0e,0x2b,0x34,0x01,0x01,0x01,0x09,0x06,0x01,0x01,0x02,0x02,0x00,0x00,0x00 };
255 static const uint8_t mxf_encrypted_triplet_key[]           = { 0x06,0x0e,0x2b,0x34,0x02,0x04,0x01,0x07,0x0d,0x01,0x03,0x01,0x02,0x7e,0x01,0x00 };
256 static const uint8_t mxf_encrypted_essence_container[]     = { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x07,0x0d,0x01,0x03,0x01,0x02,0x0b,0x01,0x00 };
257 static const uint8_t mxf_sony_mpeg4_extradata[]            = { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x01,0x0e,0x06,0x06,0x02,0x02,0x01,0x00,0x00 };
258
259 #define IS_KLV_KEY(x, y) (!memcmp(x, y, sizeof(y)))
260
261 static int64_t klv_decode_ber_length(AVIOContext *pb)
262 {
263     uint64_t size = avio_r8(pb);
264     if (size & 0x80) { /* long form */
265         int bytes_num = size & 0x7f;
266         /* SMPTE 379M 5.3.4 guarantee that bytes_num must not exceed 8 bytes */
267         if (bytes_num > 8)
268             return AVERROR_INVALIDDATA;
269         size = 0;
270         while (bytes_num--)
271             size = size << 8 | avio_r8(pb);
272     }
273     return size;
274 }
275
276 static int mxf_read_sync(AVIOContext *pb, const uint8_t *key, unsigned size)
277 {
278     int i, b;
279     for (i = 0; i < size && !url_feof(pb); i++) {
280         b = avio_r8(pb);
281         if (b == key[0])
282             i = 0;
283         else if (b != key[i])
284             i = -1;
285     }
286     return i == size;
287 }
288
289 static int klv_read_packet(KLVPacket *klv, AVIOContext *pb)
290 {
291     if (!mxf_read_sync(pb, mxf_klv_key, 4))
292         return AVERROR_INVALIDDATA;
293     klv->offset = avio_tell(pb) - 4;
294     memcpy(klv->key, mxf_klv_key, 4);
295     avio_read(pb, klv->key + 4, 12);
296     klv->length = klv_decode_ber_length(pb);
297     return klv->length == -1 ? -1 : 0;
298 }
299
300 static int mxf_get_stream_index(AVFormatContext *s, KLVPacket *klv)
301 {
302     int i;
303
304     for (i = 0; i < s->nb_streams; i++) {
305         MXFTrack *track = s->streams[i]->priv_data;
306         /* SMPTE 379M 7.3 */
307         if (!memcmp(klv->key + sizeof(mxf_essence_element_key), track->track_number, sizeof(track->track_number)))
308             return i;
309     }
310     /* return 0 if only one stream, for OP Atom files with 0 as track number */
311     return s->nb_streams == 1 ? 0 : -1;
312 }
313
314 /* XXX: use AVBitStreamFilter */
315 static int mxf_get_d10_aes3_packet(AVIOContext *pb, AVStream *st, AVPacket *pkt, int64_t length)
316 {
317     const uint8_t *buf_ptr, *end_ptr;
318     uint8_t *data_ptr;
319     int i;
320
321     if (length > 61444) /* worst case PAL 1920 samples 8 channels */
322         return AVERROR_INVALIDDATA;
323     length = av_get_packet(pb, pkt, length);
324     if (length < 0)
325         return length;
326     data_ptr = pkt->data;
327     end_ptr = pkt->data + length;
328     buf_ptr = pkt->data + 4; /* skip SMPTE 331M header */
329     for (; buf_ptr + st->codec->channels*4 <= end_ptr; ) {
330         for (i = 0; i < st->codec->channels; i++) {
331             uint32_t sample = bytestream_get_le32(&buf_ptr);
332             if (st->codec->bits_per_coded_sample == 24)
333                 bytestream_put_le24(&data_ptr, (sample >> 4) & 0xffffff);
334             else
335                 bytestream_put_le16(&data_ptr, (sample >> 12) & 0xffff);
336         }
337         buf_ptr += 32 - st->codec->channels*4; // always 8 channels stored SMPTE 331M
338     }
339     av_shrink_packet(pkt, data_ptr - pkt->data);
340     return 0;
341 }
342
343 static int mxf_decrypt_triplet(AVFormatContext *s, AVPacket *pkt, KLVPacket *klv)
344 {
345     static const uint8_t checkv[16] = {0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b};
346     MXFContext *mxf = s->priv_data;
347     AVIOContext *pb = s->pb;
348     int64_t end = avio_tell(pb) + klv->length;
349     int64_t size;
350     uint64_t orig_size;
351     uint64_t plaintext_size;
352     uint8_t ivec[16];
353     uint8_t tmpbuf[16];
354     int index;
355
356     if (!mxf->aesc && s->key && s->keylen == 16) {
357         mxf->aesc = av_aes_alloc();
358         if (!mxf->aesc)
359             return AVERROR(ENOMEM);
360         av_aes_init(mxf->aesc, s->key, 128, 1);
361     }
362     // crypto context
363     avio_skip(pb, klv_decode_ber_length(pb));
364     // plaintext offset
365     klv_decode_ber_length(pb);
366     plaintext_size = avio_rb64(pb);
367     // source klv key
368     klv_decode_ber_length(pb);
369     avio_read(pb, klv->key, 16);
370     if (!IS_KLV_KEY(klv, mxf_essence_element_key))
371         return AVERROR_INVALIDDATA;
372     index = mxf_get_stream_index(s, klv);
373     if (index < 0)
374         return AVERROR_INVALIDDATA;
375     // source size
376     klv_decode_ber_length(pb);
377     orig_size = avio_rb64(pb);
378     if (orig_size < plaintext_size)
379         return AVERROR_INVALIDDATA;
380     // enc. code
381     size = klv_decode_ber_length(pb);
382     if (size < 32 || size - 32 < orig_size)
383         return AVERROR_INVALIDDATA;
384     avio_read(pb, ivec, 16);
385     avio_read(pb, tmpbuf, 16);
386     if (mxf->aesc)
387         av_aes_crypt(mxf->aesc, tmpbuf, tmpbuf, 1, ivec, 1);
388     if (memcmp(tmpbuf, checkv, 16))
389         av_log(s, AV_LOG_ERROR, "probably incorrect decryption key\n");
390     size -= 32;
391     size = av_get_packet(pb, pkt, size);
392     if (size < 0)
393         return size;
394     else if (size < plaintext_size)
395         return AVERROR_INVALIDDATA;
396     size -= plaintext_size;
397     if (mxf->aesc)
398         av_aes_crypt(mxf->aesc, &pkt->data[plaintext_size],
399                      &pkt->data[plaintext_size], size >> 4, ivec, 1);
400     av_shrink_packet(pkt, orig_size);
401     pkt->stream_index = index;
402     avio_skip(pb, end - avio_tell(pb));
403     return 0;
404 }
405
406 static int mxf_read_primer_pack(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
407 {
408     MXFContext *mxf = arg;
409     int item_num = avio_rb32(pb);
410     int item_len = avio_rb32(pb);
411
412     if (item_len != 18) {
413         avpriv_request_sample(pb, "Primer pack item length %d", item_len);
414         return AVERROR_PATCHWELCOME;
415     }
416     if (item_num > 65536) {
417         av_log(mxf->fc, AV_LOG_ERROR, "item_num %d is too large\n", item_num);
418         return AVERROR_INVALIDDATA;
419     }
420     mxf->local_tags = av_calloc(item_num, item_len);
421     if (!mxf->local_tags)
422         return AVERROR(ENOMEM);
423     mxf->local_tags_count = item_num;
424     avio_read(pb, mxf->local_tags, item_num*item_len);
425     return 0;
426 }
427
428 static int mxf_read_partition_pack(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
429 {
430     MXFContext *mxf = arg;
431     MXFPartition *partition, *tmp_part;
432     UID op;
433     uint64_t footer_partition;
434     uint32_t nb_essence_containers;
435
436     tmp_part = av_realloc_array(mxf->partitions, mxf->partitions_count + 1, sizeof(*mxf->partitions));
437     if (!tmp_part)
438         return AVERROR(ENOMEM);
439     mxf->partitions = tmp_part;
440
441     if (mxf->parsing_backward) {
442         /* insert the new partition pack in the middle
443          * this makes the entries in mxf->partitions sorted by offset */
444         memmove(&mxf->partitions[mxf->last_forward_partition+1],
445                 &mxf->partitions[mxf->last_forward_partition],
446                 (mxf->partitions_count - mxf->last_forward_partition)*sizeof(*mxf->partitions));
447         partition = mxf->current_partition = &mxf->partitions[mxf->last_forward_partition];
448     } else {
449         mxf->last_forward_partition++;
450         partition = mxf->current_partition = &mxf->partitions[mxf->partitions_count];
451     }
452
453     memset(partition, 0, sizeof(*partition));
454     mxf->partitions_count++;
455     partition->pack_length = avio_tell(pb) - klv_offset + size;
456
457     switch(uid[13]) {
458     case 2:
459         partition->type = Header;
460         break;
461     case 3:
462         partition->type = BodyPartition;
463         break;
464     case 4:
465         partition->type = Footer;
466         break;
467     default:
468         av_log(mxf->fc, AV_LOG_ERROR, "unknown partition type %i\n", uid[13]);
469         return AVERROR_INVALIDDATA;
470     }
471
472     /* consider both footers to be closed (there is only Footer and CompleteFooter) */
473     partition->closed = partition->type == Footer || !(uid[14] & 1);
474     partition->complete = uid[14] > 2;
475     avio_skip(pb, 4);
476     partition->kag_size = avio_rb32(pb);
477     partition->this_partition = avio_rb64(pb);
478     partition->previous_partition = avio_rb64(pb);
479     footer_partition = avio_rb64(pb);
480     partition->header_byte_count = avio_rb64(pb);
481     partition->index_byte_count = avio_rb64(pb);
482     partition->index_sid = avio_rb32(pb);
483     avio_skip(pb, 8);
484     partition->body_sid = avio_rb32(pb);
485     avio_read(pb, op, sizeof(UID));
486     nb_essence_containers = avio_rb32(pb);
487
488     /* some files don'thave FooterPartition set in every partition */
489     if (footer_partition) {
490         if (mxf->footer_partition && mxf->footer_partition != footer_partition) {
491             av_log(mxf->fc, AV_LOG_ERROR,
492                    "inconsistent FooterPartition value: %"PRIu64" != %"PRIu64"\n",
493                    mxf->footer_partition, footer_partition);
494         } else {
495             mxf->footer_partition = footer_partition;
496         }
497     }
498
499     av_dlog(mxf->fc,
500             "PartitionPack: ThisPartition = 0x%"PRIX64
501             ", PreviousPartition = 0x%"PRIX64", "
502             "FooterPartition = 0x%"PRIX64", IndexSID = %i, BodySID = %i\n",
503             partition->this_partition,
504             partition->previous_partition, footer_partition,
505             partition->index_sid, partition->body_sid);
506
507     /* sanity check PreviousPartition if set */
508     if (partition->previous_partition &&
509         mxf->run_in + partition->previous_partition >= klv_offset) {
510         av_log(mxf->fc, AV_LOG_ERROR,
511                "PreviousPartition points to this partition or forward\n");
512         return AVERROR_INVALIDDATA;
513     }
514
515     if      (op[12] == 1 && op[13] == 1) mxf->op = OP1a;
516     else if (op[12] == 1 && op[13] == 2) mxf->op = OP1b;
517     else if (op[12] == 1 && op[13] == 3) mxf->op = OP1c;
518     else if (op[12] == 2 && op[13] == 1) mxf->op = OP2a;
519     else if (op[12] == 2 && op[13] == 2) mxf->op = OP2b;
520     else if (op[12] == 2 && op[13] == 3) mxf->op = OP2c;
521     else if (op[12] == 3 && op[13] == 1) mxf->op = OP3a;
522     else if (op[12] == 3 && op[13] == 2) mxf->op = OP3b;
523     else if (op[12] == 3 && op[13] == 3) mxf->op = OP3c;
524     else if (op[12] == 64&& op[13] == 1) mxf->op = OPSONYOpt;
525     else if (op[12] == 0x10) {
526         /* SMPTE 390m: "There shall be exactly one essence container"
527          * The following block deals with files that violate this, namely:
528          * 2011_DCPTEST_24FPS.V.mxf - two ECs, OP1a
529          * abcdefghiv016f56415e.mxf - zero ECs, OPAtom, output by Avid AirSpeed */
530         if (nb_essence_containers != 1) {
531             MXFOP op = nb_essence_containers ? OP1a : OPAtom;
532
533             /* only nag once */
534             if (!mxf->op)
535                 av_log(mxf->fc, AV_LOG_WARNING, "\"OPAtom\" with %u ECs - assuming %s\n",
536                        nb_essence_containers, op == OP1a ? "OP1a" : "OPAtom");
537
538             mxf->op = op;
539         } else
540             mxf->op = OPAtom;
541     } else {
542         av_log(mxf->fc, AV_LOG_ERROR, "unknown operational pattern: %02xh %02xh - guessing OP1a\n", op[12], op[13]);
543         mxf->op = OP1a;
544     }
545
546     if (partition->kag_size <= 0 || partition->kag_size > (1 << 20)) {
547         av_log(mxf->fc, AV_LOG_WARNING, "invalid KAGSize %i - guessing ", partition->kag_size);
548
549         if (mxf->op == OPSONYOpt)
550             partition->kag_size = 512;
551         else
552             partition->kag_size = 1;
553
554         av_log(mxf->fc, AV_LOG_WARNING, "%i\n", partition->kag_size);
555     }
556
557     return 0;
558 }
559
560 static int mxf_add_metadata_set(MXFContext *mxf, void *metadata_set)
561 {
562     MXFMetadataSet **tmp;
563
564     tmp = av_realloc_array(mxf->metadata_sets, mxf->metadata_sets_count + 1, sizeof(*mxf->metadata_sets));
565     if (!tmp)
566         return AVERROR(ENOMEM);
567     mxf->metadata_sets = tmp;
568     mxf->metadata_sets[mxf->metadata_sets_count] = metadata_set;
569     mxf->metadata_sets_count++;
570     return 0;
571 }
572
573 static int mxf_read_cryptographic_context(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
574 {
575     MXFCryptoContext *cryptocontext = arg;
576     if (size != 16)
577         return AVERROR_INVALIDDATA;
578     if (IS_KLV_KEY(uid, mxf_crypto_source_container_ul))
579         avio_read(pb, cryptocontext->source_container_ul, 16);
580     return 0;
581 }
582
583 static int mxf_read_content_storage(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
584 {
585     MXFContext *mxf = arg;
586     switch (tag) {
587     case 0x1901:
588         mxf->packages_count = avio_rb32(pb);
589         mxf->packages_refs = av_calloc(mxf->packages_count, sizeof(UID));
590         if (!mxf->packages_refs)
591             return AVERROR(ENOMEM);
592         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
593         avio_read(pb, (uint8_t *)mxf->packages_refs, mxf->packages_count * sizeof(UID));
594         break;
595     }
596     return 0;
597 }
598
599 static int mxf_read_source_clip(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
600 {
601     MXFStructuralComponent *source_clip = arg;
602     switch(tag) {
603     case 0x0202:
604         source_clip->duration = avio_rb64(pb);
605         break;
606     case 0x1201:
607         source_clip->start_position = avio_rb64(pb);
608         break;
609     case 0x1101:
610         /* UMID, only get last 16 bytes */
611         avio_skip(pb, 16);
612         avio_read(pb, source_clip->source_package_uid, 16);
613         break;
614     case 0x1102:
615         source_clip->source_track_id = avio_rb32(pb);
616         break;
617     }
618     return 0;
619 }
620
621 static int mxf_read_material_package(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
622 {
623     MXFPackage *package = arg;
624     switch(tag) {
625     case 0x4403:
626         package->tracks_count = avio_rb32(pb);
627         package->tracks_refs = av_calloc(package->tracks_count, sizeof(UID));
628         if (!package->tracks_refs)
629             return AVERROR(ENOMEM);
630         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
631         avio_read(pb, (uint8_t *)package->tracks_refs, package->tracks_count * sizeof(UID));
632         break;
633     }
634     return 0;
635 }
636
637 static int mxf_read_timecode_component(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
638 {
639     MXFTimecodeComponent *mxf_timecode = arg;
640     switch(tag) {
641     case 0x1501:
642         mxf_timecode->start_frame = avio_rb64(pb);
643         break;
644     case 0x1502:
645         mxf_timecode->rate = (AVRational){avio_rb16(pb), 1};
646         break;
647     case 0x1503:
648         mxf_timecode->drop_frame = avio_r8(pb);
649         break;
650     }
651     return 0;
652 }
653
654 static int mxf_read_track(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
655 {
656     MXFTrack *track = arg;
657     switch(tag) {
658     case 0x4801:
659         track->track_id = avio_rb32(pb);
660         break;
661     case 0x4804:
662         avio_read(pb, track->track_number, 4);
663         break;
664     case 0x4B01:
665         track->edit_rate.num = avio_rb32(pb);
666         track->edit_rate.den = avio_rb32(pb);
667         break;
668     case 0x4803:
669         avio_read(pb, track->sequence_ref, 16);
670         break;
671     }
672     return 0;
673 }
674
675 static int mxf_read_sequence(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
676 {
677     MXFSequence *sequence = arg;
678     switch(tag) {
679     case 0x0202:
680         sequence->duration = avio_rb64(pb);
681         break;
682     case 0x0201:
683         avio_read(pb, sequence->data_definition_ul, 16);
684         break;
685     case 0x1001:
686         sequence->structural_components_count = avio_rb32(pb);
687         sequence->structural_components_refs = av_calloc(sequence->structural_components_count, sizeof(UID));
688         if (!sequence->structural_components_refs)
689             return AVERROR(ENOMEM);
690         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
691         avio_read(pb, (uint8_t *)sequence->structural_components_refs, sequence->structural_components_count * sizeof(UID));
692         break;
693     }
694     return 0;
695 }
696
697 static int mxf_read_source_package(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
698 {
699     MXFPackage *package = arg;
700     switch(tag) {
701     case 0x4403:
702         package->tracks_count = avio_rb32(pb);
703         package->tracks_refs = av_calloc(package->tracks_count, sizeof(UID));
704         if (!package->tracks_refs)
705             return AVERROR(ENOMEM);
706         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
707         avio_read(pb, (uint8_t *)package->tracks_refs, package->tracks_count * sizeof(UID));
708         break;
709     case 0x4401:
710         /* UMID, only get last 16 bytes */
711         avio_skip(pb, 16);
712         avio_read(pb, package->package_uid, 16);
713         break;
714     case 0x4701:
715         avio_read(pb, package->descriptor_ref, 16);
716         break;
717     }
718     return 0;
719 }
720
721 static int mxf_read_index_entry_array(AVIOContext *pb, MXFIndexTableSegment *segment)
722 {
723     int i, length;
724
725     segment->nb_index_entries = avio_rb32(pb);
726
727     length = avio_rb32(pb);
728
729     if (!(segment->temporal_offset_entries=av_calloc(segment->nb_index_entries, sizeof(*segment->temporal_offset_entries))) ||
730         !(segment->flag_entries          = av_calloc(segment->nb_index_entries, sizeof(*segment->flag_entries))) ||
731         !(segment->stream_offset_entries = av_calloc(segment->nb_index_entries, sizeof(*segment->stream_offset_entries))))
732         return AVERROR(ENOMEM);
733
734     for (i = 0; i < segment->nb_index_entries; i++) {
735         segment->temporal_offset_entries[i] = avio_r8(pb);
736         avio_r8(pb);                                        /* KeyFrameOffset */
737         segment->flag_entries[i] = avio_r8(pb);
738         segment->stream_offset_entries[i] = avio_rb64(pb);
739         avio_skip(pb, length - 11);
740     }
741     return 0;
742 }
743
744 static int mxf_read_index_table_segment(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
745 {
746     MXFIndexTableSegment *segment = arg;
747     switch(tag) {
748     case 0x3F05:
749         segment->edit_unit_byte_count = avio_rb32(pb);
750         av_dlog(NULL, "EditUnitByteCount %d\n", segment->edit_unit_byte_count);
751         break;
752     case 0x3F06:
753         segment->index_sid = avio_rb32(pb);
754         av_dlog(NULL, "IndexSID %d\n", segment->index_sid);
755         break;
756     case 0x3F07:
757         segment->body_sid = avio_rb32(pb);
758         av_dlog(NULL, "BodySID %d\n", segment->body_sid);
759         break;
760     case 0x3F0A:
761         av_dlog(NULL, "IndexEntryArray found\n");
762         return mxf_read_index_entry_array(pb, segment);
763     case 0x3F0B:
764         segment->index_edit_rate.num = avio_rb32(pb);
765         segment->index_edit_rate.den = avio_rb32(pb);
766         av_dlog(NULL, "IndexEditRate %d/%d\n", segment->index_edit_rate.num,
767                 segment->index_edit_rate.den);
768         break;
769     case 0x3F0C:
770         segment->index_start_position = avio_rb64(pb);
771         av_dlog(NULL, "IndexStartPosition %"PRId64"\n", segment->index_start_position);
772         break;
773     case 0x3F0D:
774         segment->index_duration = avio_rb64(pb);
775         av_dlog(NULL, "IndexDuration %"PRId64"\n", segment->index_duration);
776         break;
777     }
778     return 0;
779 }
780
781 static void mxf_read_pixel_layout(AVIOContext *pb, MXFDescriptor *descriptor)
782 {
783     int code, value, ofs = 0;
784     char layout[16] = {0}; /* not for printing, may end up not terminated on purpose */
785
786     do {
787         code = avio_r8(pb);
788         value = avio_r8(pb);
789         av_dlog(NULL, "pixel layout: code %#x\n", code);
790
791         if (ofs <= 14) {
792             layout[ofs++] = code;
793             layout[ofs++] = value;
794         } else
795             break;  /* don't read byte by byte on sneaky files filled with lots of non-zeroes */
796     } while (code != 0); /* SMPTE 377M E.2.46 */
797
798     ff_mxf_decode_pixel_layout(layout, &descriptor->pix_fmt);
799 }
800
801 static int mxf_read_generic_descriptor(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
802 {
803     MXFDescriptor *descriptor = arg;
804     descriptor->pix_fmt = AV_PIX_FMT_NONE;
805     switch(tag) {
806     case 0x3F01:
807         descriptor->sub_descriptors_count = avio_rb32(pb);
808         descriptor->sub_descriptors_refs = av_calloc(descriptor->sub_descriptors_count, sizeof(UID));
809         if (!descriptor->sub_descriptors_refs)
810             return AVERROR(ENOMEM);
811         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
812         avio_read(pb, (uint8_t *)descriptor->sub_descriptors_refs, descriptor->sub_descriptors_count * sizeof(UID));
813         break;
814     case 0x3004:
815         avio_read(pb, descriptor->essence_container_ul, 16);
816         break;
817     case 0x3006:
818         descriptor->linked_track_id = avio_rb32(pb);
819         break;
820     case 0x3201: /* PictureEssenceCoding */
821         avio_read(pb, descriptor->essence_codec_ul, 16);
822         break;
823     case 0x3203:
824         descriptor->width = avio_rb32(pb);
825         break;
826     case 0x3202:
827         descriptor->height = avio_rb32(pb);
828         break;
829     case 0x320C:
830         descriptor->frame_layout = avio_r8(pb);
831         break;
832     case 0x320E:
833         descriptor->aspect_ratio.num = avio_rb32(pb);
834         descriptor->aspect_ratio.den = avio_rb32(pb);
835         break;
836     case 0x3212:
837         descriptor->field_dominance = avio_r8(pb);
838         break;
839     case 0x3301:
840         descriptor->component_depth = avio_rb32(pb);
841         break;
842     case 0x3302:
843         descriptor->horiz_subsampling = avio_rb32(pb);
844         break;
845     case 0x3308:
846         descriptor->vert_subsampling = avio_rb32(pb);
847         break;
848     case 0x3D03:
849         descriptor->sample_rate.num = avio_rb32(pb);
850         descriptor->sample_rate.den = avio_rb32(pb);
851         break;
852     case 0x3D06: /* SoundEssenceCompression */
853         avio_read(pb, descriptor->essence_codec_ul, 16);
854         break;
855     case 0x3D07:
856         descriptor->channels = avio_rb32(pb);
857         break;
858     case 0x3D01:
859         descriptor->bits_per_sample = avio_rb32(pb);
860         break;
861     case 0x3401:
862         mxf_read_pixel_layout(pb, descriptor);
863         break;
864     default:
865         /* Private uid used by SONY C0023S01.mxf */
866         if (IS_KLV_KEY(uid, mxf_sony_mpeg4_extradata)) {
867             if (descriptor->extradata)
868                 av_log(NULL, AV_LOG_WARNING, "Duplicate sony_mpeg4_extradata\n");
869             av_free(descriptor->extradata);
870             descriptor->extradata_size = 0;
871             descriptor->extradata = av_malloc(size);
872             if (!descriptor->extradata)
873                 return AVERROR(ENOMEM);
874             descriptor->extradata_size = size;
875             avio_read(pb, descriptor->extradata, size);
876         }
877         break;
878     }
879     return 0;
880 }
881
882 /*
883  * Match an uid independently of the version byte and up to len common bytes
884  * Returns: boolean
885  */
886 static int mxf_match_uid(const UID key, const UID uid, int len)
887 {
888     int i;
889     for (i = 0; i < len; i++) {
890         if (i != 7 && key[i] != uid[i])
891             return 0;
892     }
893     return 1;
894 }
895
896 static const MXFCodecUL *mxf_get_codec_ul(const MXFCodecUL *uls, UID *uid)
897 {
898     while (uls->uid[0]) {
899         if(mxf_match_uid(uls->uid, *uid, uls->matching_len))
900             break;
901         uls++;
902     }
903     return uls;
904 }
905
906 static void *mxf_resolve_strong_ref(MXFContext *mxf, UID *strong_ref, enum MXFMetadataSetType type)
907 {
908     int i;
909
910     if (!strong_ref)
911         return NULL;
912     for (i = 0; i < mxf->metadata_sets_count; i++) {
913         if (!memcmp(*strong_ref, mxf->metadata_sets[i]->uid, 16) &&
914             (type == AnyType || mxf->metadata_sets[i]->type == type)) {
915             return mxf->metadata_sets[i];
916         }
917     }
918     return NULL;
919 }
920
921 static const MXFCodecUL mxf_picture_essence_container_uls[] = {
922     // video essence container uls
923     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x02,0x0D,0x01,0x03,0x01,0x02,0x04,0x60,0x01 }, 14, AV_CODEC_ID_MPEG2VIDEO }, /* MPEG-ES Frame wrapped */
924     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x01,0x0D,0x01,0x03,0x01,0x02,0x02,0x41,0x01 }, 14,    AV_CODEC_ID_DVVIDEO }, /* DV 625 25mbps */
925     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x01,0x0D,0x01,0x03,0x01,0x02,0x05,0x00,0x00 }, 14,   AV_CODEC_ID_RAWVIDEO }, /* Uncompressed Picture */
926     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 },  0,      AV_CODEC_ID_NONE },
927 };
928
929 /* EC ULs for intra-only formats */
930 static const MXFCodecUL mxf_intra_only_essence_container_uls[] = {
931     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x01,0x0D,0x01,0x03,0x01,0x02,0x01,0x00,0x00 }, 14, AV_CODEC_ID_MPEG2VIDEO }, /* MXF-GC SMPTE D-10 Mappings */
932     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 },  0,       AV_CODEC_ID_NONE },
933 };
934
935 /* intra-only PictureEssenceCoding ULs, where no corresponding EC UL exists */
936 static const MXFCodecUL mxf_intra_only_picture_essence_coding_uls[] = {
937     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x0A,0x04,0x01,0x02,0x02,0x01,0x32,0x00,0x00 }, 14,       AV_CODEC_ID_H264 }, /* H.264/MPEG-4 AVC Intra Profiles */
938     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 },  0,       AV_CODEC_ID_NONE },
939 };
940
941 static const MXFCodecUL mxf_sound_essence_container_uls[] = {
942     // sound essence container uls
943     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x01,0x0D,0x01,0x03,0x01,0x02,0x06,0x01,0x00 }, 14, AV_CODEC_ID_PCM_S16LE }, /* BWF Frame wrapped */
944     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x02,0x0D,0x01,0x03,0x01,0x02,0x04,0x40,0x01 }, 14,       AV_CODEC_ID_MP2 }, /* MPEG-ES Frame wrapped, 0x40 ??? stream id */
945     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x01,0x0D,0x01,0x03,0x01,0x02,0x01,0x01,0x01 }, 14, AV_CODEC_ID_PCM_S16LE }, /* D-10 Mapping 50Mbps PAL Extended Template */
946     { { 0x06,0x0E,0x2B,0x34,0x01,0x01,0x01,0xFF,0x4B,0x46,0x41,0x41,0x00,0x0D,0x4D,0x4F }, 14, AV_CODEC_ID_PCM_S16LE }, /* 0001GL00.MXF.A1.mxf_opatom.mxf */
947     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 },  0,      AV_CODEC_ID_NONE },
948 };
949
950 static int mxf_get_sorted_table_segments(MXFContext *mxf, int *nb_sorted_segments, MXFIndexTableSegment ***sorted_segments)
951 {
952     int i, j, nb_segments = 0;
953     MXFIndexTableSegment **unsorted_segments;
954     int last_body_sid = -1, last_index_sid = -1, last_index_start = -1;
955
956     /* count number of segments, allocate arrays and copy unsorted segments */
957     for (i = 0; i < mxf->metadata_sets_count; i++)
958         if (mxf->metadata_sets[i]->type == IndexTableSegment)
959             nb_segments++;
960
961     if (!nb_segments)
962         return AVERROR_INVALIDDATA;
963
964     if (!(unsorted_segments = av_calloc(nb_segments, sizeof(*unsorted_segments))) ||
965         !(*sorted_segments  = av_calloc(nb_segments, sizeof(**sorted_segments)))) {
966         av_freep(sorted_segments);
967         av_free(unsorted_segments);
968         return AVERROR(ENOMEM);
969     }
970
971     for (i = j = 0; i < mxf->metadata_sets_count; i++)
972         if (mxf->metadata_sets[i]->type == IndexTableSegment)
973             unsorted_segments[j++] = (MXFIndexTableSegment*)mxf->metadata_sets[i];
974
975     *nb_sorted_segments = 0;
976
977     /* sort segments by {BodySID, IndexSID, IndexStartPosition}, remove duplicates while we're at it */
978     for (i = 0; i < nb_segments; i++) {
979         int best = -1, best_body_sid = -1, best_index_sid = -1, best_index_start = -1;
980         uint64_t best_index_duration = 0;
981
982         for (j = 0; j < nb_segments; j++) {
983             MXFIndexTableSegment *s = unsorted_segments[j];
984
985             /* Require larger BosySID, IndexSID or IndexStartPosition then the previous entry. This removes duplicates.
986              * We want the smallest values for the keys than what we currently have, unless this is the first such entry this time around.
987              * If we come across an entry with the same IndexStartPosition but larger IndexDuration, then we'll prefer it over the one we currently have.
988              */
989             if ((i == 0     || s->body_sid > last_body_sid || s->index_sid > last_index_sid || s->index_start_position > last_index_start) &&
990                 (best == -1 || s->body_sid < best_body_sid || s->index_sid < best_index_sid || s->index_start_position < best_index_start ||
991                 (s->index_start_position == best_index_start && s->index_duration > best_index_duration))) {
992                 best             = j;
993                 best_body_sid    = s->body_sid;
994                 best_index_sid   = s->index_sid;
995                 best_index_start = s->index_start_position;
996                 best_index_duration = s->index_duration;
997             }
998         }
999
1000         /* no suitable entry found -> we're done */
1001         if (best == -1)
1002             break;
1003
1004         (*sorted_segments)[(*nb_sorted_segments)++] = unsorted_segments[best];
1005         last_body_sid    = best_body_sid;
1006         last_index_sid   = best_index_sid;
1007         last_index_start = best_index_start;
1008     }
1009
1010     av_free(unsorted_segments);
1011
1012     return 0;
1013 }
1014
1015 /**
1016  * Computes the absolute file offset of the given essence container offset
1017  */
1018 static int mxf_absolute_bodysid_offset(MXFContext *mxf, int body_sid, int64_t offset, int64_t *offset_out)
1019 {
1020     int x;
1021     int64_t offset_in = offset;     /* for logging */
1022
1023     for (x = 0; x < mxf->partitions_count; x++) {
1024         MXFPartition *p = &mxf->partitions[x];
1025
1026         if (p->body_sid != body_sid)
1027             continue;
1028
1029         if (offset < p->essence_length || !p->essence_length) {
1030             *offset_out = p->essence_offset + offset;
1031             return 0;
1032         }
1033
1034         offset -= p->essence_length;
1035     }
1036
1037     av_log(mxf->fc, AV_LOG_ERROR,
1038            "failed to find absolute offset of %"PRIX64" in BodySID %i - partial file?\n",
1039            offset_in, body_sid);
1040
1041     return AVERROR_INVALIDDATA;
1042 }
1043
1044 /**
1045  * Returns the end position of the essence container with given BodySID, or zero if unknown
1046  */
1047 static int64_t mxf_essence_container_end(MXFContext *mxf, int body_sid)
1048 {
1049     int x;
1050     int64_t ret = 0;
1051
1052     for (x = 0; x < mxf->partitions_count; x++) {
1053         MXFPartition *p = &mxf->partitions[x];
1054
1055         if (p->body_sid != body_sid)
1056             continue;
1057
1058         if (!p->essence_length)
1059             return 0;
1060
1061         ret = p->essence_offset + p->essence_length;
1062     }
1063
1064     return ret;
1065 }
1066
1067 /* EditUnit -> absolute offset */
1068 static int mxf_edit_unit_absolute_offset(MXFContext *mxf, MXFIndexTable *index_table, int64_t edit_unit, int64_t *edit_unit_out, int64_t *offset_out, int nag)
1069 {
1070     int i;
1071     int64_t offset_temp = 0;
1072
1073     for (i = 0; i < index_table->nb_segments; i++) {
1074         MXFIndexTableSegment *s = index_table->segments[i];
1075
1076         edit_unit = FFMAX(edit_unit, s->index_start_position);  /* clamp if trying to seek before start */
1077
1078         if (edit_unit < s->index_start_position + s->index_duration) {
1079             int64_t index = edit_unit - s->index_start_position;
1080
1081             if (s->edit_unit_byte_count)
1082                 offset_temp += s->edit_unit_byte_count * index;
1083             else if (s->nb_index_entries) {
1084                 if (s->nb_index_entries == 2 * s->index_duration + 1)
1085                     index *= 2;     /* Avid index */
1086
1087                 if (index < 0 || index >= s->nb_index_entries) {
1088                     av_log(mxf->fc, AV_LOG_ERROR, "IndexSID %i segment at %"PRId64" IndexEntryArray too small\n",
1089                            index_table->index_sid, s->index_start_position);
1090                     return AVERROR_INVALIDDATA;
1091                 }
1092
1093                 offset_temp = s->stream_offset_entries[index];
1094             } else {
1095                 av_log(mxf->fc, AV_LOG_ERROR, "IndexSID %i segment at %"PRId64" missing EditUnitByteCount and IndexEntryArray\n",
1096                        index_table->index_sid, s->index_start_position);
1097                 return AVERROR_INVALIDDATA;
1098             }
1099
1100             if (edit_unit_out)
1101                 *edit_unit_out = edit_unit;
1102
1103             return mxf_absolute_bodysid_offset(mxf, index_table->body_sid, offset_temp, offset_out);
1104         } else {
1105             /* EditUnitByteCount == 0 for VBR indexes, which is fine since they use explicit StreamOffsets */
1106             offset_temp += s->edit_unit_byte_count * s->index_duration;
1107         }
1108     }
1109
1110     if (nag)
1111         av_log(mxf->fc, AV_LOG_ERROR, "failed to map EditUnit %"PRId64" in IndexSID %i to an offset\n", edit_unit, index_table->index_sid);
1112
1113     return AVERROR_INVALIDDATA;
1114 }
1115
1116 static int mxf_compute_ptses_fake_index(MXFContext *mxf, MXFIndexTable *index_table)
1117 {
1118     int i, j, x;
1119     int8_t max_temporal_offset = -128;
1120
1121     /* first compute how many entries we have */
1122     for (i = 0; i < index_table->nb_segments; i++) {
1123         MXFIndexTableSegment *s = index_table->segments[i];
1124
1125         if (!s->nb_index_entries) {
1126             index_table->nb_ptses = 0;
1127             return 0;                               /* no TemporalOffsets */
1128         }
1129
1130         index_table->nb_ptses += s->index_duration;
1131     }
1132
1133     /* paranoid check */
1134     if (index_table->nb_ptses <= 0)
1135         return 0;
1136
1137     if (!(index_table->ptses      = av_calloc(index_table->nb_ptses, sizeof(int64_t))) ||
1138         !(index_table->fake_index = av_calloc(index_table->nb_ptses, sizeof(AVIndexEntry)))) {
1139         av_freep(&index_table->ptses);
1140         return AVERROR(ENOMEM);
1141     }
1142
1143     /* we may have a few bad TemporalOffsets
1144      * make sure the corresponding PTSes don't have the bogus value 0 */
1145     for (x = 0; x < index_table->nb_ptses; x++)
1146         index_table->ptses[x] = AV_NOPTS_VALUE;
1147
1148     /**
1149      * We have this:
1150      *
1151      * x  TemporalOffset
1152      * 0:  0
1153      * 1:  1
1154      * 2:  1
1155      * 3: -2
1156      * 4:  1
1157      * 5:  1
1158      * 6: -2
1159      *
1160      * We want to transform it into this:
1161      *
1162      * x  DTS PTS
1163      * 0: -1   0
1164      * 1:  0   3
1165      * 2:  1   1
1166      * 3:  2   2
1167      * 4:  3   6
1168      * 5:  4   4
1169      * 6:  5   5
1170      *
1171      * We do this by bucket sorting x by x+TemporalOffset[x] into mxf->ptses,
1172      * then settings mxf->first_dts = -max(TemporalOffset[x]).
1173      * The latter makes DTS <= PTS.
1174      */
1175     for (i = x = 0; i < index_table->nb_segments; i++) {
1176         MXFIndexTableSegment *s = index_table->segments[i];
1177         int index_delta = 1;
1178         int n = s->nb_index_entries;
1179
1180         if (s->nb_index_entries == 2 * s->index_duration + 1) {
1181             index_delta = 2;    /* Avid index */
1182             /* ignore the last entry - it's the size of the essence container */
1183             n--;
1184         }
1185
1186         for (j = 0; j < n; j += index_delta, x++) {
1187             int offset = s->temporal_offset_entries[j] / index_delta;
1188             int index  = x + offset;
1189
1190             if (x >= index_table->nb_ptses) {
1191                 av_log(mxf->fc, AV_LOG_ERROR,
1192                        "x >= nb_ptses - IndexEntryCount %i < IndexDuration %"PRId64"?\n",
1193                        s->nb_index_entries, s->index_duration);
1194                 break;
1195             }
1196
1197             index_table->fake_index[x].timestamp = x;
1198             index_table->fake_index[x].flags = !(s->flag_entries[j] & 0x30) ? AVINDEX_KEYFRAME : 0;
1199
1200             if (index < 0 || index >= index_table->nb_ptses) {
1201                 av_log(mxf->fc, AV_LOG_ERROR,
1202                        "index entry %i + TemporalOffset %i = %i, which is out of bounds\n",
1203                        x, offset, index);
1204                 continue;
1205             }
1206
1207             index_table->ptses[index] = x;
1208             max_temporal_offset = FFMAX(max_temporal_offset, offset);
1209         }
1210     }
1211
1212     index_table->first_dts = -max_temporal_offset;
1213
1214     return 0;
1215 }
1216
1217 /**
1218  * Sorts and collects index table segments into index tables.
1219  * Also computes PTSes if possible.
1220  */
1221 static int mxf_compute_index_tables(MXFContext *mxf)
1222 {
1223     int i, j, k, ret, nb_sorted_segments;
1224     MXFIndexTableSegment **sorted_segments = NULL;
1225
1226     if ((ret = mxf_get_sorted_table_segments(mxf, &nb_sorted_segments, &sorted_segments)) ||
1227         nb_sorted_segments <= 0) {
1228         av_log(mxf->fc, AV_LOG_WARNING, "broken or empty index\n");
1229         return 0;
1230     }
1231
1232     /* sanity check and count unique BodySIDs/IndexSIDs */
1233     for (i = 0; i < nb_sorted_segments; i++) {
1234         if (i == 0 || sorted_segments[i-1]->index_sid != sorted_segments[i]->index_sid)
1235             mxf->nb_index_tables++;
1236         else if (sorted_segments[i-1]->body_sid != sorted_segments[i]->body_sid) {
1237             av_log(mxf->fc, AV_LOG_ERROR, "found inconsistent BodySID\n");
1238             ret = AVERROR_INVALIDDATA;
1239             goto finish_decoding_index;
1240         }
1241     }
1242
1243     if (!(mxf->index_tables = av_calloc(mxf->nb_index_tables, sizeof(MXFIndexTable)))) {
1244         av_log(mxf->fc, AV_LOG_ERROR, "failed to allocate index tables\n");
1245         ret = AVERROR(ENOMEM);
1246         goto finish_decoding_index;
1247     }
1248
1249     /* distribute sorted segments to index tables */
1250     for (i = j = 0; i < nb_sorted_segments; i++) {
1251         if (i != 0 && sorted_segments[i-1]->index_sid != sorted_segments[i]->index_sid) {
1252             /* next IndexSID */
1253             j++;
1254         }
1255
1256         mxf->index_tables[j].nb_segments++;
1257     }
1258
1259     for (i = j = 0; j < mxf->nb_index_tables; i += mxf->index_tables[j++].nb_segments) {
1260         MXFIndexTable *t = &mxf->index_tables[j];
1261
1262         if (!(t->segments = av_calloc(t->nb_segments, sizeof(MXFIndexTableSegment*)))) {
1263             av_log(mxf->fc, AV_LOG_ERROR, "failed to allocate IndexTableSegment pointer array\n");
1264             ret = AVERROR(ENOMEM);
1265             goto finish_decoding_index;
1266         }
1267
1268         if (sorted_segments[i]->index_start_position)
1269             av_log(mxf->fc, AV_LOG_WARNING, "IndexSID %i starts at EditUnit %"PRId64" - seeking may not work as expected\n",
1270                    sorted_segments[i]->index_sid, sorted_segments[i]->index_start_position);
1271
1272         memcpy(t->segments, &sorted_segments[i], t->nb_segments * sizeof(MXFIndexTableSegment*));
1273         t->index_sid = sorted_segments[i]->index_sid;
1274         t->body_sid = sorted_segments[i]->body_sid;
1275
1276         if ((ret = mxf_compute_ptses_fake_index(mxf, t)) < 0)
1277             goto finish_decoding_index;
1278
1279         /* fix zero IndexDurations */
1280         for (k = 0; k < t->nb_segments; k++) {
1281             if (t->segments[k]->index_duration)
1282                 continue;
1283
1284             if (t->nb_segments > 1)
1285                 av_log(mxf->fc, AV_LOG_WARNING, "IndexSID %i segment %i has zero IndexDuration and there's more than one segment\n",
1286                        t->index_sid, k);
1287
1288             if (mxf->fc->nb_streams <= 0) {
1289                 av_log(mxf->fc, AV_LOG_WARNING, "no streams?\n");
1290                 break;
1291             }
1292
1293             /* assume the first stream's duration is reasonable
1294              * leave index_duration = 0 on further segments in case we have any (unlikely)
1295              */
1296             t->segments[k]->index_duration = mxf->fc->streams[0]->duration;
1297             break;
1298         }
1299     }
1300
1301     ret = 0;
1302 finish_decoding_index:
1303     av_free(sorted_segments);
1304     return ret;
1305 }
1306
1307 static int mxf_is_intra_only(MXFDescriptor *descriptor)
1308 {
1309     return mxf_get_codec_ul(mxf_intra_only_essence_container_uls,
1310                             &descriptor->essence_container_ul)->id != AV_CODEC_ID_NONE ||
1311            mxf_get_codec_ul(mxf_intra_only_picture_essence_coding_uls,
1312                             &descriptor->essence_codec_ul)->id     != AV_CODEC_ID_NONE;
1313 }
1314
1315 static int mxf_add_timecode_metadata(AVDictionary **pm, const char *key, AVTimecode *tc)
1316 {
1317     char buf[AV_TIMECODE_STR_SIZE];
1318     av_dict_set(pm, key, av_timecode_make_string(tc, buf, 0), 0);
1319
1320     return 0;
1321 }
1322
1323 static int mxf_parse_structural_metadata(MXFContext *mxf)
1324 {
1325     MXFPackage *material_package = NULL;
1326     MXFPackage *temp_package = NULL;
1327     int i, j, k, ret;
1328
1329     av_dlog(mxf->fc, "metadata sets count %d\n", mxf->metadata_sets_count);
1330     /* TODO: handle multiple material packages (OP3x) */
1331     for (i = 0; i < mxf->packages_count; i++) {
1332         material_package = mxf_resolve_strong_ref(mxf, &mxf->packages_refs[i], MaterialPackage);
1333         if (material_package) break;
1334     }
1335     if (!material_package) {
1336         av_log(mxf->fc, AV_LOG_ERROR, "no material package found\n");
1337         return AVERROR_INVALIDDATA;
1338     }
1339
1340     for (i = 0; i < material_package->tracks_count; i++) {
1341         MXFPackage *source_package = NULL;
1342         MXFTrack *material_track = NULL;
1343         MXFTrack *source_track = NULL;
1344         MXFTrack *temp_track = NULL;
1345         MXFDescriptor *descriptor = NULL;
1346         MXFStructuralComponent *component = NULL;
1347         MXFTimecodeComponent *mxf_tc = NULL;
1348         UID *essence_container_ul = NULL;
1349         const MXFCodecUL *codec_ul = NULL;
1350         const MXFCodecUL *container_ul = NULL;
1351         const MXFCodecUL *pix_fmt_ul = NULL;
1352         AVStream *st;
1353         AVTimecode tc;
1354         int flags;
1355
1356         if (!(material_track = mxf_resolve_strong_ref(mxf, &material_package->tracks_refs[i], Track))) {
1357             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve material track strong ref\n");
1358             continue;
1359         }
1360
1361         if ((component = mxf_resolve_strong_ref(mxf, &material_track->sequence_ref, TimecodeComponent))) {
1362             mxf_tc = (MXFTimecodeComponent*)component;
1363             flags = mxf_tc->drop_frame == 1 ? AV_TIMECODE_FLAG_DROPFRAME : 0;
1364             if (av_timecode_init(&tc, mxf_tc->rate, flags, mxf_tc->start_frame, mxf->fc) == 0) {
1365                 mxf_add_timecode_metadata(&mxf->fc->metadata, "timecode", &tc);
1366             }
1367         }
1368
1369         if (!(material_track->sequence = mxf_resolve_strong_ref(mxf, &material_track->sequence_ref, Sequence))) {
1370             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve material track sequence strong ref\n");
1371             continue;
1372         }
1373
1374         for (j = 0; j < material_track->sequence->structural_components_count; j++) {
1375             component = mxf_resolve_strong_ref(mxf, &material_track->sequence->structural_components_refs[j], TimecodeComponent);
1376             if (!component)
1377                 continue;
1378
1379             mxf_tc = (MXFTimecodeComponent*)component;
1380             flags = mxf_tc->drop_frame == 1 ? AV_TIMECODE_FLAG_DROPFRAME : 0;
1381             if (av_timecode_init(&tc, mxf_tc->rate, flags, mxf_tc->start_frame, mxf->fc) == 0) {
1382                 mxf_add_timecode_metadata(&mxf->fc->metadata, "timecode", &tc);
1383                 break;
1384             }
1385         }
1386
1387         /* TODO: handle multiple source clips */
1388         for (j = 0; j < material_track->sequence->structural_components_count; j++) {
1389             component = mxf_resolve_strong_ref(mxf, &material_track->sequence->structural_components_refs[j], SourceClip);
1390             if (!component)
1391                 continue;
1392
1393             for (k = 0; k < mxf->packages_count; k++) {
1394                 temp_package = mxf_resolve_strong_ref(mxf, &mxf->packages_refs[k], SourcePackage);
1395                 if (!temp_package)
1396                     continue;
1397                 if (!memcmp(temp_package->package_uid, component->source_package_uid, 16)) {
1398                     source_package = temp_package;
1399                     break;
1400                 }
1401             }
1402             if (!source_package) {
1403                 av_dlog(mxf->fc, "material track %d: no corresponding source package found\n", material_track->track_id);
1404                 break;
1405             }
1406             for (k = 0; k < source_package->tracks_count; k++) {
1407                 if (!(temp_track = mxf_resolve_strong_ref(mxf, &source_package->tracks_refs[k], Track))) {
1408                     av_log(mxf->fc, AV_LOG_ERROR, "could not resolve source track strong ref\n");
1409                     ret = AVERROR_INVALIDDATA;
1410                     goto fail_and_free;
1411                 }
1412                 if (temp_track->track_id == component->source_track_id) {
1413                     source_track = temp_track;
1414                     break;
1415                 }
1416             }
1417             if (!source_track) {
1418                 av_log(mxf->fc, AV_LOG_ERROR, "material track %d: no corresponding source track found\n", material_track->track_id);
1419                 break;
1420             }
1421         }
1422         if (!source_track || !component)
1423             continue;
1424
1425         if (!(source_track->sequence = mxf_resolve_strong_ref(mxf, &source_track->sequence_ref, Sequence))) {
1426             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve source track sequence strong ref\n");
1427             ret = AVERROR_INVALIDDATA;
1428             goto fail_and_free;
1429         }
1430
1431         /* 0001GL00.MXF.A1.mxf_opatom.mxf has the same SourcePackageID as 0001GL.MXF.V1.mxf_opatom.mxf
1432          * This would result in both files appearing to have two streams. Work around this by sanity checking DataDefinition */
1433         if (memcmp(material_track->sequence->data_definition_ul, source_track->sequence->data_definition_ul, 16)) {
1434             av_log(mxf->fc, AV_LOG_ERROR, "material track %d: DataDefinition mismatch\n", material_track->track_id);
1435             continue;
1436         }
1437
1438         st = avformat_new_stream(mxf->fc, NULL);
1439         if (!st) {
1440             av_log(mxf->fc, AV_LOG_ERROR, "could not allocate stream\n");
1441             ret = AVERROR(ENOMEM);
1442             goto fail_and_free;
1443         }
1444         st->id = source_track->track_id;
1445         st->priv_data = source_track;
1446         source_track->original_duration = st->duration = component->duration;
1447         if (st->duration == -1)
1448             st->duration = AV_NOPTS_VALUE;
1449         st->start_time = component->start_position;
1450         if (material_track->edit_rate.num <= 0 || material_track->edit_rate.den <= 0) {
1451             av_log(mxf->fc, AV_LOG_WARNING,
1452                    "invalid edit rate (%d/%d) found on stream #%d, defaulting to 25/1\n",
1453                    material_track->edit_rate.num, material_track->edit_rate.den, st->index);
1454             material_track->edit_rate = (AVRational){25, 1};
1455         }
1456         avpriv_set_pts_info(st, 64, material_track->edit_rate.den, material_track->edit_rate.num);
1457
1458         /* ensure SourceTrack EditRate == MaterialTrack EditRate since only the former is accessible via st->priv_data */
1459         source_track->edit_rate = material_track->edit_rate;
1460
1461         PRINT_KEY(mxf->fc, "data definition   ul", source_track->sequence->data_definition_ul);
1462         codec_ul = mxf_get_codec_ul(ff_mxf_data_definition_uls, &source_track->sequence->data_definition_ul);
1463         st->codec->codec_type = codec_ul->id;
1464
1465         source_package->descriptor = mxf_resolve_strong_ref(mxf, &source_package->descriptor_ref, AnyType);
1466         if (source_package->descriptor) {
1467             if (source_package->descriptor->type == MultipleDescriptor) {
1468                 for (j = 0; j < source_package->descriptor->sub_descriptors_count; j++) {
1469                     MXFDescriptor *sub_descriptor = mxf_resolve_strong_ref(mxf, &source_package->descriptor->sub_descriptors_refs[j], Descriptor);
1470
1471                     if (!sub_descriptor) {
1472                         av_log(mxf->fc, AV_LOG_ERROR, "could not resolve sub descriptor strong ref\n");
1473                         continue;
1474                     }
1475                     if (sub_descriptor->linked_track_id == source_track->track_id) {
1476                         descriptor = sub_descriptor;
1477                         break;
1478                     }
1479                 }
1480             } else if (source_package->descriptor->type == Descriptor)
1481                 descriptor = source_package->descriptor;
1482         }
1483         if (!descriptor) {
1484             av_log(mxf->fc, AV_LOG_INFO, "source track %d: stream %d, no descriptor found\n", source_track->track_id, st->index);
1485             continue;
1486         }
1487         PRINT_KEY(mxf->fc, "essence codec     ul", descriptor->essence_codec_ul);
1488         PRINT_KEY(mxf->fc, "essence container ul", descriptor->essence_container_ul);
1489         essence_container_ul = &descriptor->essence_container_ul;
1490         /* HACK: replacing the original key with mxf_encrypted_essence_container
1491          * is not allowed according to s429-6, try to find correct information anyway */
1492         if (IS_KLV_KEY(essence_container_ul, mxf_encrypted_essence_container)) {
1493             av_log(mxf->fc, AV_LOG_INFO, "broken encrypted mxf file\n");
1494             for (k = 0; k < mxf->metadata_sets_count; k++) {
1495                 MXFMetadataSet *metadata = mxf->metadata_sets[k];
1496                 if (metadata->type == CryptoContext) {
1497                     essence_container_ul = &((MXFCryptoContext *)metadata)->source_container_ul;
1498                     break;
1499                 }
1500             }
1501         }
1502
1503         /* TODO: drop PictureEssenceCoding and SoundEssenceCompression, only check EssenceContainer */
1504         codec_ul = mxf_get_codec_ul(ff_mxf_codec_uls, &descriptor->essence_codec_ul);
1505         st->codec->codec_id = (enum AVCodecID)codec_ul->id;
1506         av_log(mxf->fc, AV_LOG_VERBOSE, "%s: Universal Label: ",
1507                avcodec_get_name(st->codec->codec_id));
1508         for (k = 0; k < 16; k++) {
1509             av_log(mxf->fc, AV_LOG_VERBOSE, "%.2x",
1510                    descriptor->essence_codec_ul[k]);
1511             if (!(k+1 & 19) || k == 5)
1512                 av_log(mxf->fc, AV_LOG_VERBOSE, ".");
1513         }
1514         av_log(mxf->fc, AV_LOG_VERBOSE, "\n");
1515         if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO) {
1516             source_track->intra_only = mxf_is_intra_only(descriptor);
1517             container_ul = mxf_get_codec_ul(mxf_picture_essence_container_uls, essence_container_ul);
1518             if (st->codec->codec_id == AV_CODEC_ID_NONE)
1519                 st->codec->codec_id = container_ul->id;
1520             st->codec->width = descriptor->width;
1521             st->codec->height = descriptor->height; /* Field height, not frame height */
1522             switch (descriptor->frame_layout) {
1523                 case SegmentedFrame:
1524                     /* This one is a weird layout I don't fully understand. */
1525                     av_log(mxf->fc, AV_LOG_INFO, "SegmentedFrame layout isn't currently supported\n");
1526                     break;
1527                 case FullFrame:
1528                     st->codec->field_order = AV_FIELD_PROGRESSIVE;
1529                     break;
1530                 case OneField:
1531                     /* Every other line is stored and needs to be duplicated. */
1532                     av_log(mxf->fc, AV_LOG_INFO, "OneField frame layout isn't currently supported\n");
1533                     break; /* The correct thing to do here is fall through, but by breaking we might be
1534                               able to decode some streams at half the vertical resolution, rather than not al all.
1535                               It's also for compatibility with the old behavior. */
1536                 case MixedFields:
1537                     break;
1538                 case SeparateFields:
1539                     st->codec->height *= 2; /* Turn field height into frame height. */
1540                     break;
1541                 default:
1542                     av_log(mxf->fc, AV_LOG_INFO, "Unknown frame layout type: %d\n", descriptor->frame_layout);
1543             }
1544             if (st->codec->codec_id == AV_CODEC_ID_RAWVIDEO) {
1545                 st->codec->pix_fmt = descriptor->pix_fmt;
1546                 if (st->codec->pix_fmt == AV_PIX_FMT_NONE) {
1547                     pix_fmt_ul = mxf_get_codec_ul(ff_mxf_pixel_format_uls,
1548                                                   &descriptor->essence_codec_ul);
1549                     st->codec->pix_fmt = (enum AVPixelFormat)pix_fmt_ul->id;
1550                     if (st->codec->pix_fmt == AV_PIX_FMT_NONE) {
1551                         /* support files created before RP224v10 by defaulting to UYVY422
1552                            if subsampling is 4:2:2 and component depth is 8-bit */
1553                         if (descriptor->horiz_subsampling == 2 &&
1554                             descriptor->vert_subsampling == 1 &&
1555                             descriptor->component_depth == 8) {
1556                             st->codec->pix_fmt = AV_PIX_FMT_UYVY422;
1557                         }
1558                     }
1559                 }
1560             }
1561             st->need_parsing = AVSTREAM_PARSE_HEADERS;
1562         } else if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
1563             container_ul = mxf_get_codec_ul(mxf_sound_essence_container_uls, essence_container_ul);
1564             /* Only overwrite existing codec ID if it is unset or A-law, which is the default according to SMPTE RP 224. */
1565             if (st->codec->codec_id == AV_CODEC_ID_NONE || (st->codec->codec_id == AV_CODEC_ID_PCM_ALAW && (enum AVCodecID)container_ul->id != AV_CODEC_ID_NONE))
1566                 st->codec->codec_id = (enum AVCodecID)container_ul->id;
1567             st->codec->channels = descriptor->channels;
1568             st->codec->bits_per_coded_sample = descriptor->bits_per_sample;
1569
1570             if (descriptor->sample_rate.den > 0) {
1571                 avpriv_set_pts_info(st, 64, descriptor->sample_rate.den, descriptor->sample_rate.num);
1572                 st->codec->sample_rate = descriptor->sample_rate.num / descriptor->sample_rate.den;
1573             } else {
1574                 av_log(mxf->fc, AV_LOG_WARNING, "invalid sample rate (%d/%d) found for stream #%d, time base forced to 1/48000\n",
1575                        descriptor->sample_rate.num, descriptor->sample_rate.den, st->index);
1576                 avpriv_set_pts_info(st, 64, 1, 48000);
1577             }
1578
1579             /* if duration is set, rescale it from EditRate to SampleRate */
1580             if (st->duration != AV_NOPTS_VALUE)
1581                 st->duration = av_rescale_q(st->duration, av_inv_q(material_track->edit_rate), st->time_base);
1582
1583             /* TODO: implement AV_CODEC_ID_RAWAUDIO */
1584             if (st->codec->codec_id == AV_CODEC_ID_PCM_S16LE) {
1585                 if (descriptor->bits_per_sample > 16 && descriptor->bits_per_sample <= 24)
1586                     st->codec->codec_id = AV_CODEC_ID_PCM_S24LE;
1587                 else if (descriptor->bits_per_sample == 32)
1588                     st->codec->codec_id = AV_CODEC_ID_PCM_S32LE;
1589             } else if (st->codec->codec_id == AV_CODEC_ID_PCM_S16BE) {
1590                 if (descriptor->bits_per_sample > 16 && descriptor->bits_per_sample <= 24)
1591                     st->codec->codec_id = AV_CODEC_ID_PCM_S24BE;
1592                 else if (descriptor->bits_per_sample == 32)
1593                     st->codec->codec_id = AV_CODEC_ID_PCM_S32BE;
1594             } else if (st->codec->codec_id == AV_CODEC_ID_MP2) {
1595                 st->need_parsing = AVSTREAM_PARSE_FULL;
1596             }
1597         }
1598         if (descriptor->extradata) {
1599             st->codec->extradata = av_mallocz(descriptor->extradata_size + FF_INPUT_BUFFER_PADDING_SIZE);
1600             if (st->codec->extradata) {
1601                 memcpy(st->codec->extradata, descriptor->extradata, descriptor->extradata_size);
1602                 st->codec->extradata_size = descriptor->extradata_size;
1603             }
1604         } else if(st->codec->codec_id == AV_CODEC_ID_H264) {
1605             ff_generate_avci_extradata(st);
1606         }
1607         if (st->codec->codec_type != AVMEDIA_TYPE_DATA && (*essence_container_ul)[15] > 0x01) {
1608             /* TODO: decode timestamps */
1609             st->need_parsing = AVSTREAM_PARSE_TIMESTAMPS;
1610         }
1611     }
1612
1613     ret = 0;
1614 fail_and_free:
1615     return ret;
1616 }
1617
1618 static int mxf_read_utf16_string(AVIOContext *pb, int size, char** str)
1619 {
1620     int ret;
1621     size_t buf_size;
1622
1623     if (size < 0)
1624         return AVERROR(EINVAL);
1625
1626     buf_size = size + size/2 + 1;
1627     *str = av_malloc(buf_size);
1628     if (!*str)
1629         return AVERROR(ENOMEM);
1630
1631     if ((ret = avio_get_str16be(pb, size, *str, buf_size)) < 0) {
1632         av_freep(str);
1633         return ret;
1634     }
1635
1636     return ret;
1637 }
1638
1639 static int mxf_uid_to_str(UID uid, char **str)
1640 {
1641     int i;
1642     char *p;
1643     p = *str = av_mallocz(sizeof(UID) * 2 + 4 + 1);
1644     if (!p)
1645         return AVERROR(ENOMEM);
1646     for (i = 0; i < sizeof(UID); i++) {
1647         snprintf(p, 2 + 1, "%.2x", uid[i]);
1648         p += 2;
1649         if (i == 3 || i == 5 || i == 7 || i == 9) {
1650             snprintf(p, 1 + 1, "-");
1651             p++;
1652         }
1653     }
1654     return 0;
1655 }
1656
1657 static int mxf_timestamp_to_str(uint64_t timestamp, char **str)
1658 {
1659     struct tm time = {0};
1660     time.tm_year = (timestamp >> 48) - 1900;
1661     time.tm_mon  = (timestamp >> 40 & 0xFF) - 1;
1662     time.tm_mday = (timestamp >> 32 & 0xFF);
1663     time.tm_hour = (timestamp >> 24 & 0xFF);
1664     time.tm_min  = (timestamp >> 16 & 0xFF);
1665     time.tm_sec  = (timestamp >> 8  & 0xFF);
1666
1667     /* ensure month/day are valid */
1668     time.tm_mon  = FFMAX(time.tm_mon, 0);
1669     time.tm_mday = FFMAX(time.tm_mday, 1);
1670
1671     *str = av_mallocz(32);
1672     if (!*str)
1673         return AVERROR(ENOMEM);
1674     strftime(*str, 32, "%Y-%m-%d %H:%M:%S", &time);
1675
1676     return 0;
1677 }
1678
1679 #define SET_STR_METADATA(pb, name, str) do { \
1680     if ((ret = mxf_read_utf16_string(pb, size, &str)) < 0) \
1681         return ret; \
1682     av_dict_set(&s->metadata, name, str, AV_DICT_DONT_STRDUP_VAL); \
1683 } while (0)
1684
1685 #define SET_UID_METADATA(pb, name, var, str) do { \
1686     avio_read(pb, var, 16); \
1687     if ((ret = mxf_uid_to_str(var, &str)) < 0) \
1688         return ret; \
1689     av_dict_set(&s->metadata, name, str, AV_DICT_DONT_STRDUP_VAL); \
1690 } while (0)
1691
1692 #define SET_TS_METADATA(pb, name, var, str) do { \
1693     var = avio_rb64(pb); \
1694     if ((ret = mxf_timestamp_to_str(var, &str)) < 0) \
1695         return ret; \
1696     av_dict_set(&s->metadata, name, str, AV_DICT_DONT_STRDUP_VAL); \
1697 } while (0)
1698
1699 static int mxf_read_identification_metadata(void *arg, AVIOContext *pb, int tag, int size, UID _uid, int64_t klv_offset)
1700 {
1701     MXFContext *mxf = arg;
1702     AVFormatContext *s = mxf->fc;
1703     int ret;
1704     UID uid = { 0 };
1705     char *str = NULL;
1706     uint64_t ts;
1707     switch (tag) {
1708     case 0x3C01:
1709         SET_STR_METADATA(pb, "company_name", str);
1710         break;
1711     case 0x3C02:
1712         SET_STR_METADATA(pb, "product_name", str);
1713         break;
1714     case 0x3C04:
1715         SET_STR_METADATA(pb, "product_version", str);
1716         break;
1717     case 0x3C05:
1718         SET_UID_METADATA(pb, "product_uid", uid, str);
1719         break;
1720     case 0x3C06:
1721         SET_TS_METADATA(pb, "modification_date", ts, str);
1722         break;
1723     case 0x3C08:
1724         SET_STR_METADATA(pb, "application_platform", str);
1725         break;
1726     case 0x3C09:
1727         SET_UID_METADATA(pb, "generation_uid", uid, str);
1728         break;
1729     case 0x3C0A:
1730         SET_UID_METADATA(pb, "uid", uid, str);
1731         break;
1732     }
1733     return 0;
1734 }
1735
1736 static const MXFMetadataReadTableEntry mxf_metadata_read_table[] = {
1737     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x05,0x01,0x00 }, mxf_read_primer_pack },
1738     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x01,0x00 }, mxf_read_partition_pack },
1739     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x02,0x00 }, mxf_read_partition_pack },
1740     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x03,0x00 }, mxf_read_partition_pack },
1741     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x04,0x00 }, mxf_read_partition_pack },
1742     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x01,0x00 }, mxf_read_partition_pack },
1743     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x02,0x00 }, mxf_read_partition_pack },
1744     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x03,0x00 }, mxf_read_partition_pack },
1745     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x04,0x00 }, mxf_read_partition_pack },
1746     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x04,0x02,0x00 }, mxf_read_partition_pack },
1747     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x04,0x04,0x00 }, mxf_read_partition_pack },
1748     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0D,0x01,0x01,0x01,0x01,0x01,0x30,0x00 }, mxf_read_identification_metadata },
1749     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x18,0x00 }, mxf_read_content_storage, 0, AnyType },
1750     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x37,0x00 }, mxf_read_source_package, sizeof(MXFPackage), SourcePackage },
1751     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x36,0x00 }, mxf_read_material_package, sizeof(MXFPackage), MaterialPackage },
1752     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x0F,0x00 }, mxf_read_sequence, sizeof(MXFSequence), Sequence },
1753     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x11,0x00 }, mxf_read_source_clip, sizeof(MXFStructuralComponent), SourceClip },
1754     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x44,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), MultipleDescriptor },
1755     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x42,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* Generic Sound */
1756     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x28,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* CDCI */
1757     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x29,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* RGBA */
1758     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x51,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* MPEG 2 Video */
1759     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x48,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* Wave */
1760     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x47,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* AES3 */
1761     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x3A,0x00 }, mxf_read_track, sizeof(MXFTrack), Track }, /* Static Track */
1762     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x3B,0x00 }, mxf_read_track, sizeof(MXFTrack), Track }, /* Generic Track */
1763     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x14,0x00 }, mxf_read_timecode_component, sizeof(MXFTimecodeComponent), TimecodeComponent },
1764     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x04,0x01,0x02,0x02,0x00,0x00 }, mxf_read_cryptographic_context, sizeof(MXFCryptoContext), CryptoContext },
1765     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x10,0x01,0x00 }, mxf_read_index_table_segment, sizeof(MXFIndexTableSegment), IndexTableSegment },
1766     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 }, NULL, 0, AnyType },
1767 };
1768
1769 static int mxf_read_local_tags(MXFContext *mxf, KLVPacket *klv, MXFMetadataReadFunc *read_child, int ctx_size, enum MXFMetadataSetType type)
1770 {
1771     AVIOContext *pb = mxf->fc->pb;
1772     MXFMetadataSet *ctx = ctx_size ? av_mallocz(ctx_size) : mxf;
1773     uint64_t klv_end = avio_tell(pb) + klv->length;
1774
1775     if (!ctx)
1776         return AVERROR(ENOMEM);
1777     while (avio_tell(pb) + 4 < klv_end && !url_feof(pb)) {
1778         int ret;
1779         int tag = avio_rb16(pb);
1780         int size = avio_rb16(pb); /* KLV specified by 0x53 */
1781         uint64_t next = avio_tell(pb) + size;
1782         UID uid = {0};
1783
1784         av_dlog(mxf->fc, "local tag %#04x size %d\n", tag, size);
1785         if (!size) { /* ignore empty tag, needed for some files with empty UMID tag */
1786             av_log(mxf->fc, AV_LOG_ERROR, "local tag %#04x with 0 size\n", tag);
1787             continue;
1788         }
1789         if (tag > 0x7FFF) { /* dynamic tag */
1790             int i;
1791             for (i = 0; i < mxf->local_tags_count; i++) {
1792                 int local_tag = AV_RB16(mxf->local_tags+i*18);
1793                 if (local_tag == tag) {
1794                     memcpy(uid, mxf->local_tags+i*18+2, 16);
1795                     av_dlog(mxf->fc, "local tag %#04x\n", local_tag);
1796                     PRINT_KEY(mxf->fc, "uid", uid);
1797                 }
1798             }
1799         }
1800         if (ctx_size && tag == 0x3C0A)
1801             avio_read(pb, ctx->uid, 16);
1802         else if ((ret = read_child(ctx, pb, tag, size, uid, -1)) < 0)
1803             return ret;
1804
1805         /* Accept the 64k local set limit being exceeded (Avid). Don't accept
1806          * it extending past the end of the KLV though (zzuf5.mxf). */
1807         if (avio_tell(pb) > klv_end) {
1808             if (ctx_size)
1809                 av_free(ctx);
1810
1811             av_log(mxf->fc, AV_LOG_ERROR,
1812                    "local tag %#04x extends past end of local set @ %#"PRIx64"\n",
1813                    tag, klv->offset);
1814             return AVERROR_INVALIDDATA;
1815         } else if (avio_tell(pb) <= next)   /* only seek forward, else this can loop for a long time */
1816             avio_seek(pb, next, SEEK_SET);
1817     }
1818     if (ctx_size) ctx->type = type;
1819     return ctx_size ? mxf_add_metadata_set(mxf, ctx) : 0;
1820 }
1821
1822 /**
1823  * Seeks to the previous partition, if possible
1824  * @return <= 0 if we should stop parsing, > 0 if we should keep going
1825  */
1826 static int mxf_seek_to_previous_partition(MXFContext *mxf)
1827 {
1828     AVIOContext *pb = mxf->fc->pb;
1829
1830     if (!mxf->current_partition ||
1831         mxf->run_in + mxf->current_partition->previous_partition <= mxf->last_forward_tell)
1832         return 0;   /* we've parsed all partitions */
1833
1834     /* seek to previous partition */
1835     avio_seek(pb, mxf->run_in + mxf->current_partition->previous_partition, SEEK_SET);
1836     mxf->current_partition = NULL;
1837
1838     av_dlog(mxf->fc, "seeking to previous partition\n");
1839
1840     return 1;
1841 }
1842
1843 /**
1844  * Called when essence is encountered
1845  * @return <= 0 if we should stop parsing, > 0 if we should keep going
1846  */
1847 static int mxf_parse_handle_essence(MXFContext *mxf)
1848 {
1849     AVIOContext *pb = mxf->fc->pb;
1850     int64_t ret;
1851
1852     if (mxf->parsing_backward) {
1853         return mxf_seek_to_previous_partition(mxf);
1854     } else {
1855         if (!mxf->footer_partition) {
1856             av_dlog(mxf->fc, "no footer\n");
1857             return 0;
1858         }
1859
1860         av_dlog(mxf->fc, "seeking to footer\n");
1861
1862         /* remember where we were so we don't end up seeking further back than this */
1863         mxf->last_forward_tell = avio_tell(pb);
1864
1865         if (!pb->seekable) {
1866             av_log(mxf->fc, AV_LOG_INFO, "file is not seekable - not parsing footer\n");
1867             return -1;
1868         }
1869
1870         /* seek to footer partition and parse backward */
1871         if ((ret = avio_seek(pb, mxf->run_in + mxf->footer_partition, SEEK_SET)) < 0) {
1872             av_log(mxf->fc, AV_LOG_ERROR, "failed to seek to footer @ 0x%"PRIx64" (%"PRId64") - partial file?\n",
1873                    mxf->run_in + mxf->footer_partition, ret);
1874             return ret;
1875         }
1876
1877         mxf->current_partition = NULL;
1878         mxf->parsing_backward = 1;
1879     }
1880
1881     return 1;
1882 }
1883
1884 /**
1885  * Called when the next partition or EOF is encountered
1886  * @return <= 0 if we should stop parsing, > 0 if we should keep going
1887  */
1888 static int mxf_parse_handle_partition_or_eof(MXFContext *mxf)
1889 {
1890     return mxf->parsing_backward ? mxf_seek_to_previous_partition(mxf) : 1;
1891 }
1892
1893 /**
1894  * Figures out the proper offset and length of the essence container in each partition
1895  */
1896 static void mxf_compute_essence_containers(MXFContext *mxf)
1897 {
1898     int x;
1899
1900     /* everything is already correct */
1901     if (mxf->op == OPAtom)
1902         return;
1903
1904     for (x = 0; x < mxf->partitions_count; x++) {
1905         MXFPartition *p = &mxf->partitions[x];
1906
1907         if (!p->body_sid)
1908             continue;       /* BodySID == 0 -> no essence */
1909
1910         if (x >= mxf->partitions_count - 1)
1911             break;          /* last partition - can't compute length (and we don't need to) */
1912
1913         /* essence container spans to the next partition */
1914         p->essence_length = mxf->partitions[x+1].this_partition - p->essence_offset;
1915
1916         if (p->essence_length < 0) {
1917             /* next ThisPartition < essence_offset */
1918             p->essence_length = 0;
1919             av_log(mxf->fc, AV_LOG_ERROR,
1920                    "partition %i: bad ThisPartition = %"PRIX64"\n",
1921                    x+1, mxf->partitions[x+1].this_partition);
1922         }
1923     }
1924 }
1925
1926 static int64_t round_to_kag(int64_t position, int kag_size)
1927 {
1928     /* TODO: account for run-in? the spec isn't clear whether KAG should account for it */
1929     /* NOTE: kag_size may be any integer between 1 - 2^10 */
1930     int64_t ret = (position / kag_size) * kag_size;
1931     return ret == position ? ret : ret + kag_size;
1932 }
1933
1934 static int is_pcm(enum AVCodecID codec_id)
1935 {
1936     /* we only care about "normal" PCM codecs until we get samples */
1937     return codec_id >= AV_CODEC_ID_PCM_S16LE && codec_id < AV_CODEC_ID_PCM_S24DAUD;
1938 }
1939
1940 /**
1941  * Deal with the case where for some audio atoms EditUnitByteCount is
1942  * very small (2, 4..). In those cases we should read more than one
1943  * sample per call to mxf_read_packet().
1944  */
1945 static void mxf_handle_small_eubc(AVFormatContext *s)
1946 {
1947     MXFContext *mxf = s->priv_data;
1948
1949     /* assuming non-OPAtom == frame wrapped
1950      * no sane writer would wrap 2 byte PCM packets with 20 byte headers.. */
1951     if (mxf->op != OPAtom)
1952         return;
1953
1954     /* expect PCM with exactly one index table segment and a small (< 32) EUBC */
1955     if (s->nb_streams != 1                                     ||
1956         s->streams[0]->codec->codec_type != AVMEDIA_TYPE_AUDIO ||
1957         !is_pcm(s->streams[0]->codec->codec_id)                ||
1958         mxf->nb_index_tables != 1                              ||
1959         mxf->index_tables[0].nb_segments != 1                  ||
1960         mxf->index_tables[0].segments[0]->edit_unit_byte_count >= 32)
1961         return;
1962
1963     /* arbitrarily default to 48 kHz PAL audio frame size */
1964     /* TODO: We could compute this from the ratio between the audio
1965      *       and video edit rates for 48 kHz NTSC we could use the
1966      *       1802-1802-1802-1802-1801 pattern. */
1967     mxf->edit_units_per_packet = 1920;
1968 }
1969
1970 static int mxf_read_header(AVFormatContext *s)
1971 {
1972     MXFContext *mxf = s->priv_data;
1973     KLVPacket klv;
1974     int64_t essence_offset = 0;
1975     int ret;
1976
1977     mxf->last_forward_tell = INT64_MAX;
1978     mxf->edit_units_per_packet = 1;
1979
1980     if (!mxf_read_sync(s->pb, mxf_header_partition_pack_key, 14)) {
1981         av_log(s, AV_LOG_ERROR, "could not find header partition pack key\n");
1982         return AVERROR_INVALIDDATA;
1983     }
1984     avio_seek(s->pb, -14, SEEK_CUR);
1985     mxf->fc = s;
1986     mxf->run_in = avio_tell(s->pb);
1987
1988     while (!url_feof(s->pb)) {
1989         const MXFMetadataReadTableEntry *metadata;
1990
1991         if (klv_read_packet(&klv, s->pb) < 0) {
1992             /* EOF - seek to previous partition or stop */
1993             if(mxf_parse_handle_partition_or_eof(mxf) <= 0)
1994                 break;
1995             else
1996                 continue;
1997         }
1998
1999         PRINT_KEY(s, "read header", klv.key);
2000         av_dlog(s, "size %"PRIu64" offset %#"PRIx64"\n", klv.length, klv.offset);
2001         if (IS_KLV_KEY(klv.key, mxf_encrypted_triplet_key) ||
2002             IS_KLV_KEY(klv.key, mxf_essence_element_key) ||
2003             IS_KLV_KEY(klv.key, mxf_avid_essence_element_key) ||
2004             IS_KLV_KEY(klv.key, mxf_system_item_key)) {
2005
2006             if (!mxf->current_partition) {
2007                 av_log(mxf->fc, AV_LOG_ERROR, "found essence prior to first PartitionPack\n");
2008                 return AVERROR_INVALIDDATA;
2009             }
2010
2011             if (!mxf->current_partition->essence_offset) {
2012                 /* for OP1a we compute essence_offset
2013                  * for OPAtom we point essence_offset after the KL (usually op1a_essence_offset + 20 or 25)
2014                  * TODO: for OP1a we could eliminate this entire if statement, always stopping parsing at op1a_essence_offset
2015                  *       for OPAtom we still need the actual essence_offset though (the KL's length can vary)
2016                  */
2017                 int64_t op1a_essence_offset =
2018                     round_to_kag(mxf->current_partition->this_partition +
2019                                  mxf->current_partition->pack_length,       mxf->current_partition->kag_size) +
2020                     round_to_kag(mxf->current_partition->header_byte_count, mxf->current_partition->kag_size) +
2021                     round_to_kag(mxf->current_partition->index_byte_count,  mxf->current_partition->kag_size);
2022
2023                 if (mxf->op == OPAtom) {
2024                     /* point essence_offset to the actual data
2025                     * OPAtom has all the essence in one big KLV
2026                     */
2027                     mxf->current_partition->essence_offset = avio_tell(s->pb);
2028                     mxf->current_partition->essence_length = klv.length;
2029                 } else {
2030                     /* NOTE: op1a_essence_offset may be less than to klv.offset (C0023S01.mxf)  */
2031                     mxf->current_partition->essence_offset = op1a_essence_offset;
2032                 }
2033             }
2034
2035             if (!essence_offset)
2036                 essence_offset = klv.offset;
2037
2038             /* seek to footer, previous partition or stop */
2039             if (mxf_parse_handle_essence(mxf) <= 0)
2040                 break;
2041             continue;
2042         } else if (!memcmp(klv.key, mxf_header_partition_pack_key, 13) &&
2043                    klv.key[13] >= 2 && klv.key[13] <= 4 && mxf->current_partition) {
2044             /* next partition pack - keep going, seek to previous partition or stop */
2045             if(mxf_parse_handle_partition_or_eof(mxf) <= 0)
2046                 break;
2047             else if (mxf->parsing_backward)
2048                 continue;
2049             /* we're still parsing forward. proceed to parsing this partition pack */
2050         }
2051
2052         for (metadata = mxf_metadata_read_table; metadata->read; metadata++) {
2053             if (IS_KLV_KEY(klv.key, metadata->key)) {
2054                 int res;
2055                 if (klv.key[5] == 0x53) {
2056                     res = mxf_read_local_tags(mxf, &klv, metadata->read, metadata->ctx_size, metadata->type);
2057                 } else {
2058                     uint64_t next = avio_tell(s->pb) + klv.length;
2059                     res = metadata->read(mxf, s->pb, 0, klv.length, klv.key, klv.offset);
2060
2061                     /* only seek forward, else this can loop for a long time */
2062                     if (avio_tell(s->pb) > next) {
2063                         av_log(s, AV_LOG_ERROR, "read past end of KLV @ %#"PRIx64"\n",
2064                                klv.offset);
2065                         return AVERROR_INVALIDDATA;
2066                     }
2067
2068                     avio_seek(s->pb, next, SEEK_SET);
2069                 }
2070                 if (res < 0) {
2071                     av_log(s, AV_LOG_ERROR, "error reading header metadata\n");
2072                     return res;
2073                 }
2074                 break;
2075             }
2076         }
2077         if (!metadata->read)
2078             avio_skip(s->pb, klv.length);
2079     }
2080     /* FIXME avoid seek */
2081     if (!essence_offset)  {
2082         av_log(s, AV_LOG_ERROR, "no essence\n");
2083         return AVERROR_INVALIDDATA;
2084     }
2085     avio_seek(s->pb, essence_offset, SEEK_SET);
2086
2087     mxf_compute_essence_containers(mxf);
2088
2089     /* we need to do this before computing the index tables
2090      * to be able to fill in zero IndexDurations with st->duration */
2091     if ((ret = mxf_parse_structural_metadata(mxf)) < 0)
2092         goto fail;
2093
2094     if ((ret = mxf_compute_index_tables(mxf)) < 0)
2095         goto fail;
2096
2097     if (mxf->nb_index_tables > 1) {
2098         /* TODO: look up which IndexSID to use via EssenceContainerData */
2099         av_log(mxf->fc, AV_LOG_INFO, "got %i index tables - only the first one (IndexSID %i) will be used\n",
2100                mxf->nb_index_tables, mxf->index_tables[0].index_sid);
2101     } else if (mxf->nb_index_tables == 0 && mxf->op == OPAtom) {
2102         av_log(mxf->fc, AV_LOG_ERROR, "cannot demux OPAtom without an index\n");
2103         ret = AVERROR_INVALIDDATA;
2104         goto fail;
2105     }
2106
2107     mxf_handle_small_eubc(s);
2108
2109     return 0;
2110 fail:
2111     mxf_read_close(s);
2112
2113     return ret;
2114 }
2115
2116 /**
2117  * Sets mxf->current_edit_unit based on what offset we're currently at.
2118  * @return next_ofs if OK, <0 on error
2119  */
2120 static int64_t mxf_set_current_edit_unit(MXFContext *mxf, int64_t current_offset)
2121 {
2122     int64_t last_ofs = -1, next_ofs = -1;
2123     MXFIndexTable *t = &mxf->index_tables[0];
2124
2125     /* this is called from the OP1a demuxing logic, which means there
2126      * may be no index tables */
2127     if (mxf->nb_index_tables <= 0)
2128         return -1;
2129
2130     /* find mxf->current_edit_unit so that the next edit unit starts ahead of current_offset */
2131     while (mxf->current_edit_unit >= 0) {
2132         if (mxf_edit_unit_absolute_offset(mxf, t, mxf->current_edit_unit + 1, NULL, &next_ofs, 0) < 0)
2133             return -1;
2134
2135         if (next_ofs <= last_ofs) {
2136             /* large next_ofs didn't change or current_edit_unit wrapped
2137              * around this fixes the infinite loop on zzuf3.mxf */
2138             av_log(mxf->fc, AV_LOG_ERROR,
2139                    "next_ofs didn't change. not deriving packet timestamps\n");
2140             return -1;
2141         }
2142
2143         if (next_ofs > current_offset)
2144             break;
2145
2146         last_ofs = next_ofs;
2147         mxf->current_edit_unit++;
2148     }
2149
2150     /* not checking mxf->current_edit_unit >= t->nb_ptses here since CBR files may lack IndexEntryArrays */
2151     if (mxf->current_edit_unit < 0)
2152         return -1;
2153
2154     return next_ofs;
2155 }
2156
2157 static int mxf_compute_sample_count(MXFContext *mxf, int stream_index, uint64_t *sample_count)
2158 {
2159     int i, total = 0, size = 0;
2160     AVStream *st = mxf->fc->streams[stream_index];
2161     MXFTrack *track = st->priv_data;
2162     AVRational time_base = av_inv_q(track->edit_rate);
2163     AVRational sample_rate = av_inv_q(st->time_base);
2164     const MXFSamplesPerFrame *spf = NULL;
2165
2166     if ((sample_rate.num / sample_rate.den) == 48000)
2167         spf = ff_mxf_get_samples_per_frame(mxf->fc, time_base);
2168     if (!spf) {
2169         int remainder = (sample_rate.num * time_base.num) % (time_base.den * sample_rate.den);
2170         *sample_count = av_q2d(av_mul_q((AVRational){mxf->current_edit_unit, 1},
2171                                         av_mul_q(sample_rate, time_base)));
2172         if (remainder)
2173             av_log(mxf->fc, AV_LOG_WARNING,
2174                    "seeking detected on stream #%d with time base (%d/%d) and sample rate (%d/%d), audio pts won't be accurate.\n",
2175                    stream_index, time_base.num, time_base.den, sample_rate.num, sample_rate.den);
2176         return 0;
2177     }
2178
2179     while (spf->samples_per_frame[size]) {
2180         total += spf->samples_per_frame[size];
2181         size++;
2182     }
2183
2184     av_assert2(size);
2185
2186     *sample_count = (mxf->current_edit_unit / size) * (uint64_t)total;
2187     for (i = 0; i < mxf->current_edit_unit % size; i++) {
2188         *sample_count += spf->samples_per_frame[i];
2189     }
2190
2191     return 0;
2192 }
2193
2194 static int mxf_set_audio_pts(MXFContext *mxf, AVCodecContext *codec, AVPacket *pkt)
2195 {
2196     MXFTrack *track = mxf->fc->streams[pkt->stream_index]->priv_data;
2197     pkt->pts = track->sample_count;
2198     if (codec->channels <= 0 || av_get_bits_per_sample(codec->codec_id) <= 0)
2199         return AVERROR(EINVAL);
2200     track->sample_count += pkt->size / (codec->channels * (int64_t)av_get_bits_per_sample(codec->codec_id) / 8);
2201     return 0;
2202 }
2203
2204 static int mxf_read_packet_old(AVFormatContext *s, AVPacket *pkt)
2205 {
2206     KLVPacket klv;
2207     MXFContext *mxf = s->priv_data;
2208
2209     while (klv_read_packet(&klv, s->pb) == 0) {
2210         int ret;
2211         PRINT_KEY(s, "read packet", klv.key);
2212         av_dlog(s, "size %"PRIu64" offset %#"PRIx64"\n", klv.length, klv.offset);
2213         if (IS_KLV_KEY(klv.key, mxf_encrypted_triplet_key)) {
2214             ret = mxf_decrypt_triplet(s, pkt, &klv);
2215             if (ret < 0) {
2216                 av_log(s, AV_LOG_ERROR, "invalid encoded triplet\n");
2217                 return AVERROR_INVALIDDATA;
2218             }
2219             return 0;
2220         }
2221         if (IS_KLV_KEY(klv.key, mxf_essence_element_key) ||
2222             IS_KLV_KEY(klv.key, mxf_avid_essence_element_key)) {
2223             int index = mxf_get_stream_index(s, &klv);
2224             int64_t next_ofs, next_klv;
2225             AVStream *st;
2226             MXFTrack *track;
2227             AVCodecContext *codec;
2228
2229             if (index < 0) {
2230                 av_log(s, AV_LOG_ERROR, "error getting stream index %d\n", AV_RB32(klv.key+12));
2231                 goto skip;
2232             }
2233
2234             st = s->streams[index];
2235             track = st->priv_data;
2236
2237             if (s->streams[index]->discard == AVDISCARD_ALL)
2238                 goto skip;
2239
2240             next_klv = avio_tell(s->pb) + klv.length;
2241             next_ofs = mxf_set_current_edit_unit(mxf, klv.offset);
2242
2243             if (next_ofs >= 0 && next_klv > next_ofs) {
2244                 /* if this check is hit then it's possible OPAtom was treated as OP1a
2245                  * truncate the packet since it's probably very large (>2 GiB is common) */
2246                 avpriv_request_sample(s,
2247                                       "OPAtom misinterpreted as OP1a?"
2248                                       "KLV for edit unit %i extending into "
2249                                       "next edit unit",
2250                                       mxf->current_edit_unit);
2251                 klv.length = next_ofs - avio_tell(s->pb);
2252             }
2253
2254             /* check for 8 channels AES3 element */
2255             if (klv.key[12] == 0x06 && klv.key[13] == 0x01 && klv.key[14] == 0x10) {
2256                 if (mxf_get_d10_aes3_packet(s->pb, s->streams[index], pkt, klv.length) < 0) {
2257                     av_log(s, AV_LOG_ERROR, "error reading D-10 aes3 frame\n");
2258                     return AVERROR_INVALIDDATA;
2259                 }
2260             } else {
2261                 ret = av_get_packet(s->pb, pkt, klv.length);
2262                 if (ret < 0)
2263                     return ret;
2264             }
2265             pkt->stream_index = index;
2266             pkt->pos = klv.offset;
2267
2268             codec = s->streams[index]->codec;
2269             if (codec->codec_type == AVMEDIA_TYPE_VIDEO && next_ofs >= 0) {
2270                 /* mxf->current_edit_unit good - see if we have an index table to derive timestamps from */
2271                 MXFIndexTable *t = &mxf->index_tables[0];
2272
2273                 if (mxf->nb_index_tables >= 1 && mxf->current_edit_unit < t->nb_ptses) {
2274                     pkt->dts = mxf->current_edit_unit + t->first_dts;
2275                     pkt->pts = t->ptses[mxf->current_edit_unit];
2276                 } else if (track->intra_only) {
2277                     /* intra-only -> PTS = EditUnit.
2278                      * let utils.c figure out DTS since it can be < PTS if low_delay = 0 (Sony IMX30) */
2279                     pkt->pts = mxf->current_edit_unit;
2280                 }
2281             } else if (codec->codec_type == AVMEDIA_TYPE_AUDIO) {
2282                 int ret = mxf_set_audio_pts(mxf, codec, pkt);
2283                 if (ret < 0)
2284                     return ret;
2285             }
2286
2287             /* seek for truncated packets */
2288             avio_seek(s->pb, next_klv, SEEK_SET);
2289
2290             return 0;
2291         } else
2292         skip:
2293             avio_skip(s->pb, klv.length);
2294     }
2295     return url_feof(s->pb) ? AVERROR_EOF : -1;
2296 }
2297
2298 static int mxf_read_packet(AVFormatContext *s, AVPacket *pkt)
2299 {
2300     MXFContext *mxf = s->priv_data;
2301     int ret, size;
2302     int64_t ret64, pos, next_pos;
2303     AVStream *st;
2304     MXFIndexTable *t;
2305     int edit_units;
2306
2307     if (mxf->op != OPAtom)
2308         return mxf_read_packet_old(s, pkt);
2309
2310     /* OPAtom - clip wrapped demuxing */
2311     /* NOTE: mxf_read_header() makes sure nb_index_tables > 0 for OPAtom */
2312     st = s->streams[0];
2313     t = &mxf->index_tables[0];
2314
2315     if (mxf->current_edit_unit >= st->duration)
2316         return AVERROR_EOF;
2317
2318     edit_units = FFMIN(mxf->edit_units_per_packet, st->duration - mxf->current_edit_unit);
2319
2320     if ((ret = mxf_edit_unit_absolute_offset(mxf, t, mxf->current_edit_unit, NULL, &pos, 1)) < 0)
2321         return ret;
2322
2323     /* compute size by finding the next edit unit or the end of the essence container
2324      * not pretty, but it works */
2325     if ((ret = mxf_edit_unit_absolute_offset(mxf, t, mxf->current_edit_unit + edit_units, NULL, &next_pos, 0)) < 0 &&
2326         (next_pos = mxf_essence_container_end(mxf, t->body_sid)) <= 0) {
2327         av_log(s, AV_LOG_ERROR, "unable to compute the size of the last packet\n");
2328         return AVERROR_INVALIDDATA;
2329     }
2330
2331     if ((size = next_pos - pos) <= 0) {
2332         av_log(s, AV_LOG_ERROR, "bad size: %i\n", size);
2333         return AVERROR_INVALIDDATA;
2334     }
2335
2336     if ((ret64 = avio_seek(s->pb, pos, SEEK_SET)) < 0)
2337         return ret64;
2338
2339     if ((size = av_get_packet(s->pb, pkt, size)) < 0)
2340         return size;
2341
2342     pkt->stream_index = 0;
2343
2344     if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO && t->ptses &&
2345         mxf->current_edit_unit >= 0 && mxf->current_edit_unit < t->nb_ptses) {
2346         pkt->dts = mxf->current_edit_unit + t->first_dts;
2347         pkt->pts = t->ptses[mxf->current_edit_unit];
2348     } else if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
2349         int ret = mxf_set_audio_pts(mxf, st->codec, pkt);
2350         if (ret < 0)
2351             return ret;
2352     }
2353
2354     mxf->current_edit_unit += edit_units;
2355
2356     return 0;
2357 }
2358
2359 static int mxf_read_close(AVFormatContext *s)
2360 {
2361     MXFContext *mxf = s->priv_data;
2362     MXFIndexTableSegment *seg;
2363     int i;
2364
2365     av_freep(&mxf->packages_refs);
2366
2367     for (i = 0; i < s->nb_streams; i++)
2368         s->streams[i]->priv_data = NULL;
2369
2370     for (i = 0; i < mxf->metadata_sets_count; i++) {
2371         switch (mxf->metadata_sets[i]->type) {
2372         case Descriptor:
2373             av_freep(&((MXFDescriptor *)mxf->metadata_sets[i])->extradata);
2374             break;
2375         case MultipleDescriptor:
2376             av_freep(&((MXFDescriptor *)mxf->metadata_sets[i])->sub_descriptors_refs);
2377             break;
2378         case Sequence:
2379             av_freep(&((MXFSequence *)mxf->metadata_sets[i])->structural_components_refs);
2380             break;
2381         case SourcePackage:
2382         case MaterialPackage:
2383             av_freep(&((MXFPackage *)mxf->metadata_sets[i])->tracks_refs);
2384             break;
2385         case IndexTableSegment:
2386             seg = (MXFIndexTableSegment *)mxf->metadata_sets[i];
2387             av_freep(&seg->temporal_offset_entries);
2388             av_freep(&seg->flag_entries);
2389             av_freep(&seg->stream_offset_entries);
2390             break;
2391         default:
2392             break;
2393         }
2394         av_freep(&mxf->metadata_sets[i]);
2395     }
2396     av_freep(&mxf->partitions);
2397     av_freep(&mxf->metadata_sets);
2398     av_freep(&mxf->aesc);
2399     av_freep(&mxf->local_tags);
2400
2401     if (mxf->index_tables) {
2402         for (i = 0; i < mxf->nb_index_tables; i++) {
2403             av_freep(&mxf->index_tables[i].segments);
2404             av_freep(&mxf->index_tables[i].ptses);
2405             av_freep(&mxf->index_tables[i].fake_index);
2406         }
2407     }
2408     av_freep(&mxf->index_tables);
2409
2410     return 0;
2411 }
2412
2413 static int mxf_probe(AVProbeData *p) {
2414     const uint8_t *bufp = p->buf;
2415     const uint8_t *end = p->buf + p->buf_size;
2416
2417     if (p->buf_size < sizeof(mxf_header_partition_pack_key))
2418         return 0;
2419
2420     /* Must skip Run-In Sequence and search for MXF header partition pack key SMPTE 377M 5.5 */
2421     end -= sizeof(mxf_header_partition_pack_key);
2422     for (; bufp < end; bufp++) {
2423         if (IS_KLV_KEY(bufp, mxf_header_partition_pack_key))
2424             return AVPROBE_SCORE_MAX;
2425     }
2426     return 0;
2427 }
2428
2429 /* rudimentary byte seek */
2430 /* XXX: use MXF Index */
2431 static int mxf_read_seek(AVFormatContext *s, int stream_index, int64_t sample_time, int flags)
2432 {
2433     AVStream *st = s->streams[stream_index];
2434     int64_t seconds;
2435     MXFContext* mxf = s->priv_data;
2436     int64_t seekpos;
2437     int i, ret;
2438     int64_t ret64;
2439     MXFIndexTable *t;
2440     MXFTrack *source_track = st->priv_data;
2441
2442     /* if audio then truncate sample_time to EditRate */
2443     if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO)
2444         sample_time = av_rescale_q(sample_time, st->time_base, av_inv_q(source_track->edit_rate));
2445
2446     if (mxf->nb_index_tables <= 0) {
2447     if (!s->bit_rate)
2448         return AVERROR_INVALIDDATA;
2449     if (sample_time < 0)
2450         sample_time = 0;
2451     seconds = av_rescale(sample_time, st->time_base.num, st->time_base.den);
2452
2453     if ((ret64 = avio_seek(s->pb, (s->bit_rate * seconds) >> 3, SEEK_SET)) < 0)
2454         return ret64;
2455     ff_update_cur_dts(s, st, sample_time);
2456     mxf->current_edit_unit = sample_time;
2457     } else {
2458         t = &mxf->index_tables[0];
2459
2460         /* clamp above zero, else ff_index_search_timestamp() returns negative
2461          * this also means we allow seeking before the start */
2462         sample_time = FFMAX(sample_time, 0);
2463
2464         if (t->fake_index) {
2465             /* behave as if we have a proper index */
2466             if ((sample_time = ff_index_search_timestamp(t->fake_index, t->nb_ptses, sample_time, flags)) < 0)
2467                 return sample_time;
2468         } else {
2469             /* no IndexEntryArray (one or more CBR segments)
2470              * make sure we don't seek past the end */
2471             sample_time = FFMIN(sample_time, source_track->original_duration - 1);
2472         }
2473
2474         if ((ret = mxf_edit_unit_absolute_offset(mxf, t, sample_time, &sample_time, &seekpos, 1)) << 0)
2475             return ret;
2476
2477         ff_update_cur_dts(s, st, sample_time);
2478         mxf->current_edit_unit = sample_time;
2479         avio_seek(s->pb, seekpos, SEEK_SET);
2480     }
2481
2482     // Update all tracks sample count
2483     for (i = 0; i < s->nb_streams; i++) {
2484         AVStream *cur_st = s->streams[i];
2485         MXFTrack *cur_track = cur_st->priv_data;
2486         uint64_t current_sample_count = 0;
2487         if (cur_st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
2488             ret = mxf_compute_sample_count(mxf, i, &current_sample_count);
2489             if (ret < 0)
2490                 return ret;
2491
2492             cur_track->sample_count = current_sample_count;
2493         }
2494     }
2495     return 0;
2496 }
2497
2498 AVInputFormat ff_mxf_demuxer = {
2499     .name           = "mxf",
2500     .long_name      = NULL_IF_CONFIG_SMALL("MXF (Material eXchange Format)"),
2501     .priv_data_size = sizeof(MXFContext),
2502     .read_probe     = mxf_probe,
2503     .read_header    = mxf_read_header,
2504     .read_packet    = mxf_read_packet,
2505     .read_close     = mxf_read_close,
2506     .read_seek      = mxf_read_seek,
2507 };