]> git.sesse.net Git - ffmpeg/blob - libavformat/mxfdec.c
Merge remote-tracking branch 'qatar/master'
[ffmpeg] / libavformat / mxfdec.c
1 /*
2  * MXF demuxer.
3  * Copyright (c) 2006 SmartJog S.A., Baptiste Coudurier <baptiste dot coudurier at smartjog dot com>
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 /*
23  * References
24  * SMPTE 336M KLV Data Encoding Protocol Using Key-Length-Value
25  * SMPTE 377M MXF File Format Specifications
26  * SMPTE 378M Operational Pattern 1a
27  * SMPTE 379M MXF Generic Container
28  * SMPTE 381M Mapping MPEG Streams into the MXF Generic Container
29  * SMPTE 382M Mapping AES3 and Broadcast Wave Audio into the MXF Generic Container
30  * SMPTE 383M Mapping DV-DIF Data to the MXF Generic Container
31  *
32  * Principle
33  * Search for Track numbers which will identify essence element KLV packets.
34  * Search for SourcePackage which define tracks which contains Track numbers.
35  * Material Package contains tracks with reference to SourcePackage tracks.
36  * Search for Descriptors (Picture, Sound) which contains codec info and parameters.
37  * Assign Descriptors to correct Tracks.
38  *
39  * Metadata reading functions read Local Tags, get InstanceUID(0x3C0A) then add MetaDataSet to MXFContext.
40  * Metadata parsing resolves Strong References to objects.
41  *
42  * Simple demuxer, only OP1A supported and some files might not work at all.
43  * Only tracks with associated descriptors will be decoded. "Highly Desirable" SMPTE 377M D.1
44  */
45
46 //#define DEBUG
47
48 #include "libavutil/aes.h"
49 #include "libavutil/mathematics.h"
50 #include "libavcodec/bytestream.h"
51 #include "avformat.h"
52 #include "internal.h"
53 #include "mxf.h"
54
55 typedef enum {
56     Header,
57     BodyPartition,
58     Footer
59 } MXFPartitionType;
60
61 typedef enum {
62     OP1a = 1,
63     OP1b,
64     OP1c,
65     OP2a,
66     OP2b,
67     OP2c,
68     OP3a,
69     OP3b,
70     OP3c,
71     OPAtom,
72     OPSONYOpt,  /* FATE sample, violates the spec in places */
73 } MXFOP;
74
75 typedef struct {
76     int closed;
77     int complete;
78     MXFPartitionType type;
79     uint64_t previous_partition;
80     int index_sid;
81     int body_sid;
82     int64_t this_partition;
83     int64_t essence_offset;         ///< absolute offset of essence
84     int64_t essence_length;
85     int32_t kag_size;
86     int64_t header_byte_count;
87     int64_t index_byte_count;
88     int pack_length;
89 } MXFPartition;
90
91 typedef struct {
92     UID uid;
93     enum MXFMetadataSetType type;
94     UID source_container_ul;
95 } MXFCryptoContext;
96
97 typedef struct {
98     UID uid;
99     enum MXFMetadataSetType type;
100     UID source_package_uid;
101     UID data_definition_ul;
102     int64_t duration;
103     int64_t start_position;
104     int source_track_id;
105 } MXFStructuralComponent;
106
107 typedef struct {
108     UID uid;
109     enum MXFMetadataSetType type;
110     UID data_definition_ul;
111     UID *structural_components_refs;
112     int structural_components_count;
113     int64_t duration;
114 } MXFSequence;
115
116 typedef struct {
117     UID uid;
118     enum MXFMetadataSetType type;
119     MXFSequence *sequence; /* mandatory, and only one */
120     UID sequence_ref;
121     int track_id;
122     uint8_t track_number[4];
123     AVRational edit_rate;
124 } MXFTrack;
125
126 typedef struct {
127     UID uid;
128     enum MXFMetadataSetType type;
129     UID essence_container_ul;
130     UID essence_codec_ul;
131     AVRational sample_rate;
132     AVRational aspect_ratio;
133     int width;
134     int height;
135     int channels;
136     int bits_per_sample;
137     UID *sub_descriptors_refs;
138     int sub_descriptors_count;
139     int linked_track_id;
140     uint8_t *extradata;
141     int extradata_size;
142     enum PixelFormat pix_fmt;
143 } MXFDescriptor;
144
145 typedef struct {
146     UID uid;
147     enum MXFMetadataSetType type;
148     int edit_unit_byte_count;
149     int index_sid;
150     int body_sid;
151     AVRational index_edit_rate;
152     uint64_t index_start_position;
153     uint64_t index_duration;
154     int8_t *temporal_offset_entries;
155     int *flag_entries;
156     uint64_t *stream_offset_entries;
157     int nb_index_entries;
158 } MXFIndexTableSegment;
159
160 typedef struct {
161     UID uid;
162     enum MXFMetadataSetType type;
163     UID package_uid;
164     UID *tracks_refs;
165     int tracks_count;
166     MXFDescriptor *descriptor; /* only one */
167     UID descriptor_ref;
168 } MXFPackage;
169
170 typedef struct {
171     UID uid;
172     enum MXFMetadataSetType type;
173 } MXFMetadataSet;
174
175 /* decoded index table */
176 typedef struct {
177     int index_sid;
178     int body_sid;
179     int nb_ptses;               /* number of PTSes or total duration of index */
180     int64_t first_dts;          /* DTS = EditUnit + first_dts */
181     int64_t *ptses;             /* maps EditUnit -> PTS */
182     int nb_segments;
183     MXFIndexTableSegment **segments;    /* sorted by IndexStartPosition */
184     AVIndexEntry *fake_index;   /* used for calling ff_index_search_timestamp() */
185 } MXFIndexTable;
186
187 typedef struct {
188     MXFPartition *partitions;
189     unsigned partitions_count;
190     MXFOP op;
191     UID *packages_refs;
192     int packages_count;
193     MXFMetadataSet **metadata_sets;
194     int metadata_sets_count;
195     AVFormatContext *fc;
196     struct AVAES *aesc;
197     uint8_t *local_tags;
198     int local_tags_count;
199     uint64_t footer_partition;
200     KLVPacket current_klv_data;
201     int current_klv_index;
202     int run_in;
203     MXFPartition *current_partition;
204     int parsing_backward;
205     int64_t last_forward_tell;
206     int last_forward_partition;
207     int current_edit_unit;
208     int nb_index_tables;
209     MXFIndexTable *index_tables;
210     int edit_units_per_packet;      ///< how many edit units to read at a time (PCM, OPAtom)
211 } MXFContext;
212
213 enum MXFWrappingScheme {
214     Frame,
215     Clip,
216 };
217
218 /* NOTE: klv_offset is not set (-1) for local keys */
219 typedef int MXFMetadataReadFunc(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset);
220
221 typedef struct {
222     const UID key;
223     MXFMetadataReadFunc *read;
224     int ctx_size;
225     enum MXFMetadataSetType type;
226 } MXFMetadataReadTableEntry;
227
228 /* partial keys to match */
229 static const uint8_t mxf_header_partition_pack_key[]       = { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02 };
230 static const uint8_t mxf_essence_element_key[]             = { 0x06,0x0e,0x2b,0x34,0x01,0x02,0x01,0x01,0x0d,0x01,0x03,0x01 };
231 static const uint8_t mxf_avid_essence_element_key[]        = { 0x06,0x0e,0x2b,0x34,0x01,0x02,0x01,0x01,0x0e,0x04,0x03,0x01 };
232 static const uint8_t mxf_system_item_key[]                 = { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0D,0x01,0x03,0x01,0x04 };
233 static const uint8_t mxf_klv_key[]                         = { 0x06,0x0e,0x2b,0x34 };
234 /* complete keys to match */
235 static const uint8_t mxf_crypto_source_container_ul[]      = { 0x06,0x0e,0x2b,0x34,0x01,0x01,0x01,0x09,0x06,0x01,0x01,0x02,0x02,0x00,0x00,0x00 };
236 static const uint8_t mxf_encrypted_triplet_key[]           = { 0x06,0x0e,0x2b,0x34,0x02,0x04,0x01,0x07,0x0d,0x01,0x03,0x01,0x02,0x7e,0x01,0x00 };
237 static const uint8_t mxf_encrypted_essence_container[]     = { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x07,0x0d,0x01,0x03,0x01,0x02,0x0b,0x01,0x00 };
238 static const uint8_t mxf_sony_mpeg4_extradata[]            = { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x01,0x0e,0x06,0x06,0x02,0x02,0x01,0x00,0x00 };
239
240 #define IS_KLV_KEY(x, y) (!memcmp(x, y, sizeof(y)))
241
242 static int64_t klv_decode_ber_length(AVIOContext *pb)
243 {
244     uint64_t size = avio_r8(pb);
245     if (size & 0x80) { /* long form */
246         int bytes_num = size & 0x7f;
247         /* SMPTE 379M 5.3.4 guarantee that bytes_num must not exceed 8 bytes */
248         if (bytes_num > 8)
249             return AVERROR_INVALIDDATA;
250         size = 0;
251         while (bytes_num--)
252             size = size << 8 | avio_r8(pb);
253     }
254     return size;
255 }
256
257 static int mxf_read_sync(AVIOContext *pb, const uint8_t *key, unsigned size)
258 {
259     int i, b;
260     for (i = 0; i < size && !url_feof(pb); i++) {
261         b = avio_r8(pb);
262         if (b == key[0])
263             i = 0;
264         else if (b != key[i])
265             i = -1;
266     }
267     return i == size;
268 }
269
270 static int klv_read_packet(KLVPacket *klv, AVIOContext *pb)
271 {
272     if (!mxf_read_sync(pb, mxf_klv_key, 4))
273         return AVERROR_INVALIDDATA;
274     klv->offset = avio_tell(pb) - 4;
275     memcpy(klv->key, mxf_klv_key, 4);
276     avio_read(pb, klv->key + 4, 12);
277     klv->length = klv_decode_ber_length(pb);
278     return klv->length == -1 ? -1 : 0;
279 }
280
281 static int mxf_get_stream_index(AVFormatContext *s, KLVPacket *klv)
282 {
283     int i;
284
285     for (i = 0; i < s->nb_streams; i++) {
286         MXFTrack *track = s->streams[i]->priv_data;
287         /* SMPTE 379M 7.3 */
288         if (!memcmp(klv->key + sizeof(mxf_essence_element_key), track->track_number, sizeof(track->track_number)))
289             return i;
290     }
291     /* return 0 if only one stream, for OP Atom files with 0 as track number */
292     return s->nb_streams == 1 ? 0 : -1;
293 }
294
295 /* XXX: use AVBitStreamFilter */
296 static int mxf_get_d10_aes3_packet(AVIOContext *pb, AVStream *st, AVPacket *pkt, int64_t length)
297 {
298     const uint8_t *buf_ptr, *end_ptr;
299     uint8_t *data_ptr;
300     int i;
301
302     if (length > 61444) /* worst case PAL 1920 samples 8 channels */
303         return AVERROR_INVALIDDATA;
304     length = av_get_packet(pb, pkt, length);
305     if (length < 0)
306         return length;
307     data_ptr = pkt->data;
308     end_ptr = pkt->data + length;
309     buf_ptr = pkt->data + 4; /* skip SMPTE 331M header */
310     for (; buf_ptr + st->codec->channels*4 < end_ptr; ) {
311         for (i = 0; i < st->codec->channels; i++) {
312             uint32_t sample = bytestream_get_le32(&buf_ptr);
313             if (st->codec->bits_per_coded_sample == 24)
314                 bytestream_put_le24(&data_ptr, (sample >> 4) & 0xffffff);
315             else
316                 bytestream_put_le16(&data_ptr, (sample >> 12) & 0xffff);
317         }
318         buf_ptr += 32 - st->codec->channels*4; // always 8 channels stored SMPTE 331M
319     }
320     av_shrink_packet(pkt, data_ptr - pkt->data);
321     return 0;
322 }
323
324 static int mxf_decrypt_triplet(AVFormatContext *s, AVPacket *pkt, KLVPacket *klv)
325 {
326     static const uint8_t checkv[16] = {0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b};
327     MXFContext *mxf = s->priv_data;
328     AVIOContext *pb = s->pb;
329     int64_t end = avio_tell(pb) + klv->length;
330     int64_t size;
331     uint64_t orig_size;
332     uint64_t plaintext_size;
333     uint8_t ivec[16];
334     uint8_t tmpbuf[16];
335     int index;
336
337     if (!mxf->aesc && s->key && s->keylen == 16) {
338         mxf->aesc = av_malloc(av_aes_size);
339         if (!mxf->aesc)
340             return AVERROR(ENOMEM);
341         av_aes_init(mxf->aesc, s->key, 128, 1);
342     }
343     // crypto context
344     avio_skip(pb, klv_decode_ber_length(pb));
345     // plaintext offset
346     klv_decode_ber_length(pb);
347     plaintext_size = avio_rb64(pb);
348     // source klv key
349     klv_decode_ber_length(pb);
350     avio_read(pb, klv->key, 16);
351     if (!IS_KLV_KEY(klv, mxf_essence_element_key))
352         return AVERROR_INVALIDDATA;
353     index = mxf_get_stream_index(s, klv);
354     if (index < 0)
355         return AVERROR_INVALIDDATA;
356     // source size
357     klv_decode_ber_length(pb);
358     orig_size = avio_rb64(pb);
359     if (orig_size < plaintext_size)
360         return AVERROR_INVALIDDATA;
361     // enc. code
362     size = klv_decode_ber_length(pb);
363     if (size < 32 || size - 32 < orig_size)
364         return AVERROR_INVALIDDATA;
365     avio_read(pb, ivec, 16);
366     avio_read(pb, tmpbuf, 16);
367     if (mxf->aesc)
368         av_aes_crypt(mxf->aesc, tmpbuf, tmpbuf, 1, ivec, 1);
369     if (memcmp(tmpbuf, checkv, 16))
370         av_log(s, AV_LOG_ERROR, "probably incorrect decryption key\n");
371     size -= 32;
372     size = av_get_packet(pb, pkt, size);
373     if (size < 0)
374         return size;
375     else if (size < plaintext_size)
376         return AVERROR_INVALIDDATA;
377     size -= plaintext_size;
378     if (mxf->aesc)
379         av_aes_crypt(mxf->aesc, &pkt->data[plaintext_size],
380                      &pkt->data[plaintext_size], size >> 4, ivec, 1);
381     av_shrink_packet(pkt, orig_size);
382     pkt->stream_index = index;
383     avio_skip(pb, end - avio_tell(pb));
384     return 0;
385 }
386
387 static int mxf_read_primer_pack(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
388 {
389     MXFContext *mxf = arg;
390     int item_num = avio_rb32(pb);
391     int item_len = avio_rb32(pb);
392
393     if (item_len != 18) {
394         av_log_ask_for_sample(pb, "unsupported primer pack item length %d\n",
395                               item_len);
396         return AVERROR_PATCHWELCOME;
397     }
398     if (item_num > UINT_MAX / item_len)
399         return AVERROR_INVALIDDATA;
400     mxf->local_tags_count = item_num;
401     mxf->local_tags = av_malloc(item_num*item_len);
402     if (!mxf->local_tags)
403         return AVERROR(ENOMEM);
404     avio_read(pb, mxf->local_tags, item_num*item_len);
405     return 0;
406 }
407
408 static int mxf_read_partition_pack(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
409 {
410     MXFContext *mxf = arg;
411     MXFPartition *partition, *tmp_part;
412     UID op;
413     uint64_t footer_partition;
414     uint32_t nb_essence_containers;
415
416     if (mxf->partitions_count+1 >= UINT_MAX / sizeof(*mxf->partitions))
417         return AVERROR(ENOMEM);
418
419     tmp_part = av_realloc(mxf->partitions, (mxf->partitions_count + 1) * sizeof(*mxf->partitions));
420     if (!tmp_part)
421         return AVERROR(ENOMEM);
422     mxf->partitions = tmp_part;
423
424     if (mxf->parsing_backward) {
425         /* insert the new partition pack in the middle
426          * this makes the entries in mxf->partitions sorted by offset */
427         memmove(&mxf->partitions[mxf->last_forward_partition+1],
428                 &mxf->partitions[mxf->last_forward_partition],
429                 (mxf->partitions_count - mxf->last_forward_partition)*sizeof(*mxf->partitions));
430         partition = mxf->current_partition = &mxf->partitions[mxf->last_forward_partition];
431     } else {
432         mxf->last_forward_partition++;
433         partition = mxf->current_partition = &mxf->partitions[mxf->partitions_count];
434     }
435
436     memset(partition, 0, sizeof(*partition));
437     mxf->partitions_count++;
438     partition->pack_length = avio_tell(pb) - klv_offset + size;
439
440     switch(uid[13]) {
441     case 2:
442         partition->type = Header;
443         break;
444     case 3:
445         partition->type = BodyPartition;
446         break;
447     case 4:
448         partition->type = Footer;
449         break;
450     default:
451         av_log(mxf->fc, AV_LOG_ERROR, "unknown partition type %i\n", uid[13]);
452         return AVERROR_INVALIDDATA;
453     }
454
455     /* consider both footers to be closed (there is only Footer and CompleteFooter) */
456     partition->closed = partition->type == Footer || !(uid[14] & 1);
457     partition->complete = uid[14] > 2;
458     avio_skip(pb, 4);
459     partition->kag_size = avio_rb32(pb);
460     partition->this_partition = avio_rb64(pb);
461     partition->previous_partition = avio_rb64(pb);
462     footer_partition = avio_rb64(pb);
463     partition->header_byte_count = avio_rb64(pb);
464     partition->index_byte_count = avio_rb64(pb);
465     partition->index_sid = avio_rb32(pb);
466     avio_skip(pb, 8);
467     partition->body_sid = avio_rb32(pb);
468     avio_read(pb, op, sizeof(UID));
469     nb_essence_containers = avio_rb32(pb);
470
471     /* some files don'thave FooterPartition set in every partition */
472     if (footer_partition) {
473         if (mxf->footer_partition && mxf->footer_partition != footer_partition) {
474             av_log(mxf->fc, AV_LOG_ERROR,
475                    "inconsistent FooterPartition value: %"PRIu64" != %"PRIu64"\n",
476                    mxf->footer_partition, footer_partition);
477         } else {
478             mxf->footer_partition = footer_partition;
479         }
480     }
481
482     av_dlog(mxf->fc,
483             "PartitionPack: ThisPartition = 0x%"PRIX64
484             ", PreviousPartition = 0x%"PRIX64", "
485             "FooterPartition = 0x%"PRIX64", IndexSID = %i, BodySID = %i\n",
486             partition->this_partition,
487             partition->previous_partition, footer_partition,
488             partition->index_sid, partition->body_sid);
489
490     /* sanity check PreviousPartition if set */
491     if (partition->previous_partition &&
492         mxf->run_in + partition->previous_partition >= klv_offset) {
493         av_log(mxf->fc, AV_LOG_ERROR, "PreviousPartition points to this partition or forward\n");
494         return AVERROR_INVALIDDATA;
495     }
496
497     if      (op[12] == 1 && op[13] == 1) mxf->op = OP1a;
498     else if (op[12] == 1 && op[13] == 2) mxf->op = OP1b;
499     else if (op[12] == 1 && op[13] == 3) mxf->op = OP1c;
500     else if (op[12] == 2 && op[13] == 1) mxf->op = OP2a;
501     else if (op[12] == 2 && op[13] == 2) mxf->op = OP2b;
502     else if (op[12] == 2 && op[13] == 3) mxf->op = OP2c;
503     else if (op[12] == 3 && op[13] == 1) mxf->op = OP3a;
504     else if (op[12] == 3 && op[13] == 2) mxf->op = OP3b;
505     else if (op[12] == 3 && op[13] == 3) mxf->op = OP3c;
506     else if (op[12] == 64&& op[13] == 1) mxf->op = OPSONYOpt;
507     else if (op[12] == 0x10) {
508         /* SMPTE 390m: "There shall be exactly one essence container"
509          * 2011_DCPTEST_24FPS.V.mxf violates this and is frame wrapped, hence why we assume OP1a */
510         if (nb_essence_containers != 1) {
511             /* only nag once */
512             if (!mxf->op)
513                 av_log(mxf->fc, AV_LOG_WARNING, "\"OPAtom\" with %u ECs - assuming OP1a\n", nb_essence_containers);
514
515             mxf->op = OP1a;
516         } else
517             mxf->op = OPAtom;
518     } else {
519         av_log(mxf->fc, AV_LOG_ERROR, "unknown operational pattern: %02xh %02xh - guessing OP1a\n", op[12], op[13]);
520         mxf->op = OP1a;
521     }
522
523     if (partition->kag_size <= 0 || partition->kag_size > (1 << 20)) {
524         av_log(mxf->fc, AV_LOG_WARNING, "invalid KAGSize %i - guessing ", partition->kag_size);
525
526         if (mxf->op == OPSONYOpt)
527             partition->kag_size = 512;
528         else
529             partition->kag_size = 1;
530
531         av_log(mxf->fc, AV_LOG_WARNING, "%i\n", partition->kag_size);
532     }
533
534     return 0;
535 }
536
537 static int mxf_add_metadata_set(MXFContext *mxf, void *metadata_set)
538 {
539     MXFMetadataSet **tmp;
540     if (mxf->metadata_sets_count+1 >= UINT_MAX / sizeof(*mxf->metadata_sets))
541         return AVERROR(ENOMEM);
542     tmp = av_realloc(mxf->metadata_sets, (mxf->metadata_sets_count + 1) * sizeof(*mxf->metadata_sets));
543     if (!tmp)
544         return AVERROR(ENOMEM);
545     mxf->metadata_sets = tmp;
546     mxf->metadata_sets[mxf->metadata_sets_count] = metadata_set;
547     mxf->metadata_sets_count++;
548     return 0;
549 }
550
551 static int mxf_read_cryptographic_context(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
552 {
553     MXFCryptoContext *cryptocontext = arg;
554     if (size != 16)
555         return AVERROR_INVALIDDATA;
556     if (IS_KLV_KEY(uid, mxf_crypto_source_container_ul))
557         avio_read(pb, cryptocontext->source_container_ul, 16);
558     return 0;
559 }
560
561 static int mxf_read_content_storage(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
562 {
563     MXFContext *mxf = arg;
564     switch (tag) {
565     case 0x1901:
566         mxf->packages_count = avio_rb32(pb);
567         if (mxf->packages_count >= UINT_MAX / sizeof(UID))
568             return AVERROR_INVALIDDATA;
569         mxf->packages_refs = av_malloc(mxf->packages_count * sizeof(UID));
570         if (!mxf->packages_refs)
571             return AVERROR(ENOMEM);
572         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
573         avio_read(pb, (uint8_t *)mxf->packages_refs, mxf->packages_count * sizeof(UID));
574         break;
575     }
576     return 0;
577 }
578
579 static int mxf_read_source_clip(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
580 {
581     MXFStructuralComponent *source_clip = arg;
582     switch(tag) {
583     case 0x0202:
584         source_clip->duration = avio_rb64(pb);
585         break;
586     case 0x1201:
587         source_clip->start_position = avio_rb64(pb);
588         break;
589     case 0x1101:
590         /* UMID, only get last 16 bytes */
591         avio_skip(pb, 16);
592         avio_read(pb, source_clip->source_package_uid, 16);
593         break;
594     case 0x1102:
595         source_clip->source_track_id = avio_rb32(pb);
596         break;
597     }
598     return 0;
599 }
600
601 static int mxf_read_material_package(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
602 {
603     MXFPackage *package = arg;
604     switch(tag) {
605     case 0x4403:
606         package->tracks_count = avio_rb32(pb);
607         if (package->tracks_count >= UINT_MAX / sizeof(UID))
608             return AVERROR_INVALIDDATA;
609         package->tracks_refs = av_malloc(package->tracks_count * sizeof(UID));
610         if (!package->tracks_refs)
611             return AVERROR(ENOMEM);
612         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
613         avio_read(pb, (uint8_t *)package->tracks_refs, package->tracks_count * sizeof(UID));
614         break;
615     }
616     return 0;
617 }
618
619 static int mxf_read_track(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
620 {
621     MXFTrack *track = arg;
622     switch(tag) {
623     case 0x4801:
624         track->track_id = avio_rb32(pb);
625         break;
626     case 0x4804:
627         avio_read(pb, track->track_number, 4);
628         break;
629     case 0x4B01:
630         track->edit_rate.den = avio_rb32(pb);
631         track->edit_rate.num = avio_rb32(pb);
632         break;
633     case 0x4803:
634         avio_read(pb, track->sequence_ref, 16);
635         break;
636     }
637     return 0;
638 }
639
640 static int mxf_read_sequence(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
641 {
642     MXFSequence *sequence = arg;
643     switch(tag) {
644     case 0x0202:
645         sequence->duration = avio_rb64(pb);
646         break;
647     case 0x0201:
648         avio_read(pb, sequence->data_definition_ul, 16);
649         break;
650     case 0x1001:
651         sequence->structural_components_count = avio_rb32(pb);
652         if (sequence->structural_components_count >= UINT_MAX / sizeof(UID))
653             return AVERROR_INVALIDDATA;
654         sequence->structural_components_refs = av_malloc(sequence->structural_components_count * sizeof(UID));
655         if (!sequence->structural_components_refs)
656             return AVERROR(ENOMEM);
657         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
658         avio_read(pb, (uint8_t *)sequence->structural_components_refs, sequence->structural_components_count * sizeof(UID));
659         break;
660     }
661     return 0;
662 }
663
664 static int mxf_read_source_package(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
665 {
666     MXFPackage *package = arg;
667     switch(tag) {
668     case 0x4403:
669         package->tracks_count = avio_rb32(pb);
670         if (package->tracks_count >= UINT_MAX / sizeof(UID))
671             return AVERROR_INVALIDDATA;
672         package->tracks_refs = av_malloc(package->tracks_count * sizeof(UID));
673         if (!package->tracks_refs)
674             return AVERROR(ENOMEM);
675         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
676         avio_read(pb, (uint8_t *)package->tracks_refs, package->tracks_count * sizeof(UID));
677         break;
678     case 0x4401:
679         /* UMID, only get last 16 bytes */
680         avio_skip(pb, 16);
681         avio_read(pb, package->package_uid, 16);
682         break;
683     case 0x4701:
684         avio_read(pb, package->descriptor_ref, 16);
685         break;
686     }
687     return 0;
688 }
689
690 static int mxf_read_index_entry_array(AVIOContext *pb, MXFIndexTableSegment *segment)
691 {
692     int i, length;
693
694     segment->nb_index_entries = avio_rb32(pb);
695     length = avio_rb32(pb);
696
697     if (!(segment->temporal_offset_entries=av_calloc(segment->nb_index_entries, sizeof(*segment->temporal_offset_entries))) ||
698         !(segment->flag_entries          = av_calloc(segment->nb_index_entries, sizeof(*segment->flag_entries))) ||
699         !(segment->stream_offset_entries = av_calloc(segment->nb_index_entries, sizeof(*segment->stream_offset_entries))))
700         return AVERROR(ENOMEM);
701
702     for (i = 0; i < segment->nb_index_entries; i++) {
703         segment->temporal_offset_entries[i] = avio_r8(pb);
704         avio_r8(pb);                                        /* KeyFrameOffset */
705         segment->flag_entries[i] = avio_r8(pb);
706         segment->stream_offset_entries[i] = avio_rb64(pb);
707         avio_skip(pb, length - 11);
708     }
709     return 0;
710 }
711
712 static int mxf_read_index_table_segment(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
713 {
714     MXFIndexTableSegment *segment = arg;
715     switch(tag) {
716     case 0x3F05:
717         segment->edit_unit_byte_count = avio_rb32(pb);
718         av_dlog(NULL, "EditUnitByteCount %d\n", segment->edit_unit_byte_count);
719         break;
720     case 0x3F06:
721         segment->index_sid = avio_rb32(pb);
722         av_dlog(NULL, "IndexSID %d\n", segment->index_sid);
723         break;
724     case 0x3F07:
725         segment->body_sid = avio_rb32(pb);
726         av_dlog(NULL, "BodySID %d\n", segment->body_sid);
727         break;
728     case 0x3F0A:
729         av_dlog(NULL, "IndexEntryArray found\n");
730         return mxf_read_index_entry_array(pb, segment);
731     case 0x3F0B:
732         segment->index_edit_rate.num = avio_rb32(pb);
733         segment->index_edit_rate.den = avio_rb32(pb);
734         av_dlog(NULL, "IndexEditRate %d/%d\n", segment->index_edit_rate.num,
735                 segment->index_edit_rate.den);
736         break;
737     case 0x3F0C:
738         segment->index_start_position = avio_rb64(pb);
739         av_dlog(NULL, "IndexStartPosition %"PRId64"\n", segment->index_start_position);
740         break;
741     case 0x3F0D:
742         segment->index_duration = avio_rb64(pb);
743         av_dlog(NULL, "IndexDuration %"PRId64"\n", segment->index_duration);
744         break;
745     }
746     return 0;
747 }
748
749 static void mxf_read_pixel_layout(AVIOContext *pb, MXFDescriptor *descriptor)
750 {
751     int code, value, ofs = 0;
752     char layout[16] = {0};
753
754     do {
755         code = avio_r8(pb);
756         value = avio_r8(pb);
757         av_dlog(NULL, "pixel layout: code %#x\n", code);
758
759         if (ofs < 16) {
760             layout[ofs++] = code;
761             layout[ofs++] = value;
762         }
763     } while (code != 0); /* SMPTE 377M E.2.46 */
764
765     ff_mxf_decode_pixel_layout(layout, &descriptor->pix_fmt);
766 }
767
768 static int mxf_read_generic_descriptor(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
769 {
770     MXFDescriptor *descriptor = arg;
771     switch(tag) {
772     case 0x3F01:
773         descriptor->sub_descriptors_count = avio_rb32(pb);
774         if (descriptor->sub_descriptors_count >= UINT_MAX / sizeof(UID))
775             return AVERROR_INVALIDDATA;
776         descriptor->sub_descriptors_refs = av_malloc(descriptor->sub_descriptors_count * sizeof(UID));
777         if (!descriptor->sub_descriptors_refs)
778             return AVERROR(ENOMEM);
779         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
780         avio_read(pb, (uint8_t *)descriptor->sub_descriptors_refs, descriptor->sub_descriptors_count * sizeof(UID));
781         break;
782     case 0x3004:
783         avio_read(pb, descriptor->essence_container_ul, 16);
784         break;
785     case 0x3006:
786         descriptor->linked_track_id = avio_rb32(pb);
787         break;
788     case 0x3201: /* PictureEssenceCoding */
789         avio_read(pb, descriptor->essence_codec_ul, 16);
790         break;
791     case 0x3203:
792         descriptor->width = avio_rb32(pb);
793         break;
794     case 0x3202:
795         descriptor->height = avio_rb32(pb);
796         break;
797     case 0x320E:
798         descriptor->aspect_ratio.num = avio_rb32(pb);
799         descriptor->aspect_ratio.den = avio_rb32(pb);
800         break;
801     case 0x3D03:
802         descriptor->sample_rate.num = avio_rb32(pb);
803         descriptor->sample_rate.den = avio_rb32(pb);
804         break;
805     case 0x3D06: /* SoundEssenceCompression */
806         avio_read(pb, descriptor->essence_codec_ul, 16);
807         break;
808     case 0x3D07:
809         descriptor->channels = avio_rb32(pb);
810         break;
811     case 0x3D01:
812         descriptor->bits_per_sample = avio_rb32(pb);
813         break;
814     case 0x3401:
815         mxf_read_pixel_layout(pb, descriptor);
816         break;
817     default:
818         /* Private uid used by SONY C0023S01.mxf */
819         if (IS_KLV_KEY(uid, mxf_sony_mpeg4_extradata)) {
820             descriptor->extradata = av_malloc(size + FF_INPUT_BUFFER_PADDING_SIZE);
821             if (!descriptor->extradata)
822                 return AVERROR(ENOMEM);
823             descriptor->extradata_size = size;
824             avio_read(pb, descriptor->extradata, size);
825         }
826         break;
827     }
828     return 0;
829 }
830
831 /*
832  * Match an uid independently of the version byte and up to len common bytes
833  * Returns: boolean
834  */
835 static int mxf_match_uid(const UID key, const UID uid, int len)
836 {
837     int i;
838     for (i = 0; i < len; i++) {
839         if (i != 7 && key[i] != uid[i])
840             return 0;
841     }
842     return 1;
843 }
844
845 static const MXFCodecUL *mxf_get_codec_ul(const MXFCodecUL *uls, UID *uid)
846 {
847     while (uls->uid[0]) {
848         if(mxf_match_uid(uls->uid, *uid, uls->matching_len))
849             break;
850         uls++;
851     }
852     return uls;
853 }
854
855 static void *mxf_resolve_strong_ref(MXFContext *mxf, UID *strong_ref, enum MXFMetadataSetType type)
856 {
857     int i;
858
859     if (!strong_ref)
860         return NULL;
861     for (i = 0; i < mxf->metadata_sets_count; i++) {
862         if (!memcmp(*strong_ref, mxf->metadata_sets[i]->uid, 16) &&
863             (type == AnyType || mxf->metadata_sets[i]->type == type)) {
864             return mxf->metadata_sets[i];
865         }
866     }
867     return NULL;
868 }
869
870 static const MXFCodecUL mxf_picture_essence_container_uls[] = {
871     // video essence container uls
872     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x02,0x0D,0x01,0x03,0x01,0x02,0x04,0x60,0x01 }, 14, CODEC_ID_MPEG2VIDEO }, /* MPEG-ES Frame wrapped */
873     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x01,0x0D,0x01,0x03,0x01,0x02,0x02,0x41,0x01 }, 14,    CODEC_ID_DVVIDEO }, /* DV 625 25mbps */
874     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 },  0,      CODEC_ID_NONE },
875 };
876 static const MXFCodecUL mxf_sound_essence_container_uls[] = {
877     // sound essence container uls
878     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x01,0x0D,0x01,0x03,0x01,0x02,0x06,0x01,0x00 }, 14, CODEC_ID_PCM_S16LE }, /* BWF Frame wrapped */
879     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x02,0x0D,0x01,0x03,0x01,0x02,0x04,0x40,0x01 }, 14,       CODEC_ID_MP2 }, /* MPEG-ES Frame wrapped, 0x40 ??? stream id */
880     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x01,0x0D,0x01,0x03,0x01,0x02,0x01,0x01,0x01 }, 14, CODEC_ID_PCM_S16LE }, /* D-10 Mapping 50Mbps PAL Extended Template */
881     { { 0x06,0x0E,0x2B,0x34,0x01,0x01,0x01,0xFF,0x4B,0x46,0x41,0x41,0x00,0x0D,0x4D,0x4F }, 14, CODEC_ID_PCM_S16LE }, /* 0001GL00.MXF.A1.mxf_opatom.mxf */
882     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 },  0,      CODEC_ID_NONE },
883 };
884
885 static int mxf_get_sorted_table_segments(MXFContext *mxf, int *nb_sorted_segments, MXFIndexTableSegment ***sorted_segments)
886 {
887     int i, j, nb_segments = 0;
888     MXFIndexTableSegment **unsorted_segments;
889     int last_body_sid = -1, last_index_sid = -1, last_index_start = -1;
890
891     /* count number of segments, allocate arrays and copy unsorted segments */
892     for (i = 0; i < mxf->metadata_sets_count; i++)
893         if (mxf->metadata_sets[i]->type == IndexTableSegment)
894             nb_segments++;
895
896     if (!(unsorted_segments = av_calloc(nb_segments, sizeof(*unsorted_segments))) ||
897         !(*sorted_segments  = av_calloc(nb_segments, sizeof(**sorted_segments)))) {
898         av_freep(sorted_segments);
899         av_free(unsorted_segments);
900         return AVERROR(ENOMEM);
901     }
902
903     for (i = j = 0; i < mxf->metadata_sets_count; i++)
904         if (mxf->metadata_sets[i]->type == IndexTableSegment)
905             unsorted_segments[j++] = (MXFIndexTableSegment*)mxf->metadata_sets[i];
906
907     *nb_sorted_segments = 0;
908
909     /* sort segments by {BodySID, IndexSID, IndexStartPosition}, remove duplicates while we're at it */
910     for (i = 0; i < nb_segments; i++) {
911         int best = -1, best_body_sid = -1, best_index_sid = -1, best_index_start = -1;
912
913         for (j = 0; j < nb_segments; j++) {
914             MXFIndexTableSegment *s = unsorted_segments[j];
915
916             /* Require larger BosySID, IndexSID or IndexStartPosition then the previous entry. This removes duplicates.
917              * We want the smallest values for the keys than what we currently have, unless this is the first such entry this time around.
918              */
919             if ((i == 0     || s->body_sid > last_body_sid || s->index_sid > last_index_sid || s->index_start_position > last_index_start) &&
920                 (best == -1 || s->body_sid < best_body_sid || s->index_sid < best_index_sid || s->index_start_position < best_index_start)) {
921                 best             = j;
922                 best_body_sid    = s->body_sid;
923                 best_index_sid   = s->index_sid;
924                 best_index_start = s->index_start_position;
925             }
926         }
927
928         /* no suitable entry found -> we're done */
929         if (best == -1)
930             break;
931
932         (*sorted_segments)[(*nb_sorted_segments)++] = unsorted_segments[best];
933         last_body_sid    = best_body_sid;
934         last_index_sid   = best_index_sid;
935         last_index_start = best_index_start;
936     }
937
938     av_free(unsorted_segments);
939
940     return 0;
941 }
942
943 /**
944  * Computes the absolute file offset of the given essence container offset
945  */
946 static int mxf_absolute_bodysid_offset(MXFContext *mxf, int body_sid, int64_t offset, int64_t *offset_out)
947 {
948     int x;
949     int64_t offset_in = offset;     /* for logging */
950
951     for (x = 0; x < mxf->partitions_count; x++) {
952         MXFPartition *p = &mxf->partitions[x];
953
954         if (p->body_sid != body_sid)
955             continue;
956
957         if (offset < p->essence_length || !p->essence_length) {
958             *offset_out = p->essence_offset + offset;
959             return 0;
960         }
961
962         offset -= p->essence_length;
963     }
964
965     av_log(mxf->fc, AV_LOG_ERROR,
966            "failed to find absolute offset of %"PRIX64" in BodySID %i - partial file?\n",
967            offset_in, body_sid);
968
969     return AVERROR_INVALIDDATA;
970 }
971
972 /**
973  * Returns the end position of the essence container with given BodySID, or zero if unknown
974  */
975 static int64_t mxf_essence_container_end(MXFContext *mxf, int body_sid)
976 {
977     int x;
978     int64_t ret = 0;
979
980     for (x = 0; x < mxf->partitions_count; x++) {
981         MXFPartition *p = &mxf->partitions[x];
982
983         if (p->body_sid != body_sid)
984             continue;
985
986         if (!p->essence_length)
987             return 0;
988
989         ret = p->essence_offset + p->essence_length;
990     }
991
992     return ret;
993 }
994
995 /* EditUnit -> absolute offset */
996 static int mxf_edit_unit_absolute_offset(MXFContext *mxf, MXFIndexTable *index_table, int64_t edit_unit, int64_t *edit_unit_out, int64_t *offset_out, int nag)
997 {
998     int i;
999     int64_t offset_temp = 0;
1000
1001     for (i = 0; i < index_table->nb_segments; i++) {
1002         MXFIndexTableSegment *s = index_table->segments[i];
1003
1004         edit_unit = FFMAX(edit_unit, s->index_start_position);  /* clamp if trying to seek before start */
1005
1006         if (edit_unit < s->index_start_position + s->index_duration) {
1007             int64_t index = edit_unit - s->index_start_position;
1008
1009             if (s->edit_unit_byte_count)
1010                 offset_temp += s->edit_unit_byte_count * index;
1011             else if (s->nb_index_entries) {
1012                 if (s->nb_index_entries == 2 * s->index_duration + 1)
1013                     index *= 2;     /* Avid index */
1014
1015                 if (index < 0 || index > s->nb_index_entries) {
1016                     av_log(mxf->fc, AV_LOG_ERROR, "IndexSID %i segment at %"PRId64" IndexEntryArray too small\n",
1017                            index_table->index_sid, s->index_start_position);
1018                     return AVERROR_INVALIDDATA;
1019                 }
1020
1021                 offset_temp = s->stream_offset_entries[index];
1022             } else {
1023                 av_log(mxf->fc, AV_LOG_ERROR, "IndexSID %i segment at %"PRId64" missing EditUnitByteCount and IndexEntryArray\n",
1024                        index_table->index_sid, s->index_start_position);
1025                 return AVERROR_INVALIDDATA;
1026             }
1027
1028             if (edit_unit_out)
1029                 *edit_unit_out = edit_unit;
1030
1031             return mxf_absolute_bodysid_offset(mxf, index_table->body_sid, offset_temp, offset_out);
1032         } else {
1033             /* EditUnitByteCount == 0 for VBR indexes, which is fine since they use explicit StreamOffsets */
1034             offset_temp += s->edit_unit_byte_count * s->index_duration;
1035         }
1036     }
1037
1038     if (nag)
1039         av_log(mxf->fc, AV_LOG_ERROR, "failed to map EditUnit %"PRId64" in IndexSID %i to an offset\n", edit_unit, index_table->index_sid);
1040
1041     return AVERROR_INVALIDDATA;
1042 }
1043
1044 static int mxf_compute_ptses_fake_index(MXFContext *mxf, MXFIndexTable *index_table)
1045 {
1046     int i, j, x;
1047     int8_t max_temporal_offset = -128;
1048
1049     /* first compute how many entries we have */
1050     for (i = 0; i < index_table->nb_segments; i++) {
1051         MXFIndexTableSegment *s = index_table->segments[i];
1052
1053         if (!s->nb_index_entries) {
1054             index_table->nb_ptses = 0;
1055             return 0;                               /* no TemporalOffsets */
1056         }
1057
1058         index_table->nb_ptses += s->index_duration;
1059     }
1060
1061     /* paranoid check */
1062     if (index_table->nb_ptses <= 0)
1063         return 0;
1064
1065     if (!(index_table->ptses      = av_calloc(index_table->nb_ptses, sizeof(int64_t))) ||
1066         !(index_table->fake_index = av_calloc(index_table->nb_ptses, sizeof(AVIndexEntry)))) {
1067         av_freep(&index_table->ptses);
1068         return AVERROR(ENOMEM);
1069     }
1070
1071     /* we may have a few bad TemporalOffsets
1072      * make sure the corresponding PTSes don't have the bogus value 0 */
1073     for (x = 0; x < index_table->nb_ptses; x++)
1074         index_table->ptses[x] = AV_NOPTS_VALUE;
1075
1076     /**
1077      * We have this:
1078      *
1079      * x  TemporalOffset
1080      * 0:  0
1081      * 1:  1
1082      * 2:  1
1083      * 3: -2
1084      * 4:  1
1085      * 5:  1
1086      * 6: -2
1087      *
1088      * We want to transform it into this:
1089      *
1090      * x  DTS PTS
1091      * 0: -1   0
1092      * 1:  0   3
1093      * 2:  1   1
1094      * 3:  2   2
1095      * 4:  3   6
1096      * 5:  4   4
1097      * 6:  5   5
1098      *
1099      * We do this by bucket sorting x by x+TemporalOffset[x] into mxf->ptses,
1100      * then settings mxf->first_dts = -max(TemporalOffset[x]).
1101      * The latter makes DTS <= PTS.
1102      */
1103     for (i = x = 0; i < index_table->nb_segments; i++) {
1104         MXFIndexTableSegment *s = index_table->segments[i];
1105         int index_delta = 1;
1106         int n = s->nb_index_entries;
1107
1108         if (s->nb_index_entries == 2 * s->index_duration + 1) {
1109             index_delta = 2;    /* Avid index */
1110
1111             /* ignore the last entry - it's the size of the essence container */
1112             n--;
1113         }
1114
1115         for (j = 0; j < n; j += index_delta, x++) {
1116             int offset = s->temporal_offset_entries[j] / index_delta;
1117             int index  = x + offset;
1118
1119             if (x >= index_table->nb_ptses) {
1120                 av_log(mxf->fc, AV_LOG_ERROR, "x >= nb_ptses - IndexEntryCount %i < IndexDuration %"PRId64"?\n",
1121                        s->nb_index_entries, s->index_duration);
1122                 break;
1123             }
1124
1125             index_table->fake_index[x].timestamp = x;
1126             index_table->fake_index[x].flags = !(s->flag_entries[j] & 0x30) ? AVINDEX_KEYFRAME : 0;
1127
1128             if (index < 0 || index >= index_table->nb_ptses) {
1129                 av_log(mxf->fc, AV_LOG_ERROR,
1130                        "index entry %i + TemporalOffset %i = %i, which is out of bounds\n",
1131                        x, offset, index);
1132                 continue;
1133             }
1134
1135             index_table->ptses[index] = x;
1136             max_temporal_offset = FFMAX(max_temporal_offset, offset);
1137         }
1138     }
1139
1140     index_table->first_dts = -max_temporal_offset;
1141
1142     return 0;
1143 }
1144
1145 /**
1146  * Sorts and collects index table segments into index tables.
1147  * Also computes PTSes if possible.
1148  */
1149 static int mxf_compute_index_tables(MXFContext *mxf)
1150 {
1151     int i, j, k, ret, nb_sorted_segments;
1152     MXFIndexTableSegment **sorted_segments = NULL;
1153
1154     if ((ret = mxf_get_sorted_table_segments(mxf, &nb_sorted_segments, &sorted_segments)) ||
1155         nb_sorted_segments <= 0) {
1156         av_log(mxf->fc, AV_LOG_WARNING, "broken or empty index\n");
1157         return 0;
1158     }
1159
1160     /* sanity check and count unique BodySIDs/IndexSIDs */
1161     for (i = 0; i < nb_sorted_segments; i++) {
1162         if (i == 0 || sorted_segments[i-1]->index_sid != sorted_segments[i]->index_sid)
1163             mxf->nb_index_tables++;
1164         else if (sorted_segments[i-1]->body_sid != sorted_segments[i]->body_sid) {
1165             av_log(mxf->fc, AV_LOG_ERROR, "found inconsistent BodySID\n");
1166             ret = AVERROR_INVALIDDATA;
1167             goto finish_decoding_index;
1168         }
1169     }
1170
1171     if (!(mxf->index_tables = av_calloc(mxf->nb_index_tables, sizeof(MXFIndexTable)))) {
1172         av_log(mxf->fc, AV_LOG_ERROR, "failed to allocate index tables\n");
1173         ret = AVERROR(ENOMEM);
1174         goto finish_decoding_index;
1175     }
1176
1177     /* distribute sorted segments to index tables */
1178     for (i = j = 0; i < nb_sorted_segments; i++) {
1179         if (i != 0 && sorted_segments[i-1]->index_sid != sorted_segments[i]->index_sid) {
1180             /* next IndexSID */
1181             j++;
1182         }
1183
1184         mxf->index_tables[j].nb_segments++;
1185     }
1186
1187     for (i = j = 0; j < mxf->nb_index_tables; i += mxf->index_tables[j++].nb_segments) {
1188         MXFIndexTable *t = &mxf->index_tables[j];
1189
1190         if (!(t->segments = av_calloc(t->nb_segments, sizeof(MXFIndexTableSegment*)))) {
1191             av_log(mxf->fc, AV_LOG_ERROR, "failed to allocate IndexTableSegment pointer array\n");
1192             ret = AVERROR(ENOMEM);
1193             goto finish_decoding_index;
1194         }
1195
1196         if (sorted_segments[i]->index_start_position)
1197             av_log(mxf->fc, AV_LOG_WARNING, "IndexSID %i starts at EditUnit %"PRId64" - seeking may not work as expected\n",
1198                    sorted_segments[i]->index_sid, sorted_segments[i]->index_start_position);
1199
1200         memcpy(t->segments, &sorted_segments[i], t->nb_segments * sizeof(MXFIndexTableSegment*));
1201         t->index_sid = sorted_segments[i]->index_sid;
1202         t->body_sid = sorted_segments[i]->body_sid;
1203
1204         if ((ret = mxf_compute_ptses_fake_index(mxf, t)) < 0)
1205             goto finish_decoding_index;
1206
1207         /* fix zero IndexDurations */
1208         for (k = 0; k < t->nb_segments; k++) {
1209             if (t->segments[k]->index_duration)
1210                 continue;
1211
1212             if (t->nb_segments > 1)
1213                 av_log(mxf->fc, AV_LOG_WARNING, "IndexSID %i segment %i has zero IndexDuration and there's more than one segment\n",
1214                        t->index_sid, k);
1215
1216             if (mxf->fc->nb_streams <= 0) {
1217                 av_log(mxf->fc, AV_LOG_WARNING, "no streams?\n");
1218                 break;
1219             }
1220
1221             /* assume the first stream's duration is reasonable
1222              * leave index_duration = 0 on further segments in case we have any (unlikely)
1223              */
1224             t->segments[k]->index_duration = mxf->fc->streams[0]->duration;
1225             break;
1226         }
1227     }
1228
1229     ret = 0;
1230 finish_decoding_index:
1231     av_free(sorted_segments);
1232     return ret;
1233 }
1234
1235 static int mxf_parse_structural_metadata(MXFContext *mxf)
1236 {
1237     MXFPackage *material_package = NULL;
1238     MXFPackage *temp_package = NULL;
1239     int i, j, k, ret;
1240
1241     av_dlog(mxf->fc, "metadata sets count %d\n", mxf->metadata_sets_count);
1242     /* TODO: handle multiple material packages (OP3x) */
1243     for (i = 0; i < mxf->packages_count; i++) {
1244         material_package = mxf_resolve_strong_ref(mxf, &mxf->packages_refs[i], MaterialPackage);
1245         if (material_package) break;
1246     }
1247     if (!material_package) {
1248         av_log(mxf->fc, AV_LOG_ERROR, "no material package found\n");
1249         return AVERROR_INVALIDDATA;
1250     }
1251
1252     for (i = 0; i < material_package->tracks_count; i++) {
1253         MXFPackage *source_package = NULL;
1254         MXFTrack *material_track = NULL;
1255         MXFTrack *source_track = NULL;
1256         MXFTrack *temp_track = NULL;
1257         MXFDescriptor *descriptor = NULL;
1258         MXFStructuralComponent *component = NULL;
1259         UID *essence_container_ul = NULL;
1260         const MXFCodecUL *codec_ul = NULL;
1261         const MXFCodecUL *container_ul = NULL;
1262         AVStream *st;
1263
1264         if (!(material_track = mxf_resolve_strong_ref(mxf, &material_package->tracks_refs[i], Track))) {
1265             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve material track strong ref\n");
1266             continue;
1267         }
1268
1269         if (!(material_track->sequence = mxf_resolve_strong_ref(mxf, &material_track->sequence_ref, Sequence))) {
1270             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve material track sequence strong ref\n");
1271             continue;
1272         }
1273
1274         /* TODO: handle multiple source clips */
1275         for (j = 0; j < material_track->sequence->structural_components_count; j++) {
1276             /* TODO: handle timecode component */
1277             component = mxf_resolve_strong_ref(mxf, &material_track->sequence->structural_components_refs[j], SourceClip);
1278             if (!component)
1279                 continue;
1280
1281             for (k = 0; k < mxf->packages_count; k++) {
1282                 temp_package = mxf_resolve_strong_ref(mxf, &mxf->packages_refs[k], SourcePackage);
1283                 if (!temp_package)
1284                     continue;
1285                 if (!memcmp(temp_package->package_uid, component->source_package_uid, 16)) {
1286                     source_package = temp_package;
1287                     break;
1288                 }
1289             }
1290             if (!source_package) {
1291                 av_dlog(mxf->fc, "material track %d: no corresponding source package found\n", material_track->track_id);
1292                 break;
1293             }
1294             for (k = 0; k < source_package->tracks_count; k++) {
1295                 if (!(temp_track = mxf_resolve_strong_ref(mxf, &source_package->tracks_refs[k], Track))) {
1296                     av_log(mxf->fc, AV_LOG_ERROR, "could not resolve source track strong ref\n");
1297                     ret = AVERROR_INVALIDDATA;
1298                     goto fail_and_free;
1299                 }
1300                 if (temp_track->track_id == component->source_track_id) {
1301                     source_track = temp_track;
1302                     break;
1303                 }
1304             }
1305             if (!source_track) {
1306                 av_log(mxf->fc, AV_LOG_ERROR, "material track %d: no corresponding source track found\n", material_track->track_id);
1307                 break;
1308             }
1309         }
1310         if (!source_track || !component)
1311             continue;
1312
1313         if (!(source_track->sequence = mxf_resolve_strong_ref(mxf, &source_track->sequence_ref, Sequence))) {
1314             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve source track sequence strong ref\n");
1315             ret = AVERROR_INVALIDDATA;
1316             goto fail_and_free;
1317         }
1318
1319         /* 0001GL00.MXF.A1.mxf_opatom.mxf has the same SourcePackageID as 0001GL.MXF.V1.mxf_opatom.mxf
1320          * This would result in both files appearing to have two streams. Work around this by sanity checking DataDefinition */
1321         if (memcmp(material_track->sequence->data_definition_ul, source_track->sequence->data_definition_ul, 16)) {
1322             av_log(mxf->fc, AV_LOG_ERROR, "material track %d: DataDefinition mismatch\n", material_track->track_id);
1323             continue;
1324         }
1325
1326         st = avformat_new_stream(mxf->fc, NULL);
1327         if (!st) {
1328             av_log(mxf->fc, AV_LOG_ERROR, "could not allocate stream\n");
1329             ret = AVERROR(ENOMEM);
1330             goto fail_and_free;
1331         }
1332         st->id = source_track->track_id;
1333         st->priv_data = source_track;
1334         st->duration = component->duration;
1335         if (st->duration == -1)
1336             st->duration = AV_NOPTS_VALUE;
1337         st->start_time = component->start_position;
1338         avpriv_set_pts_info(st, 64, material_track->edit_rate.num, material_track->edit_rate.den);
1339
1340         PRINT_KEY(mxf->fc, "data definition   ul", source_track->sequence->data_definition_ul);
1341         codec_ul = mxf_get_codec_ul(ff_mxf_data_definition_uls, &source_track->sequence->data_definition_ul);
1342         st->codec->codec_type = codec_ul->id;
1343
1344         source_package->descriptor = mxf_resolve_strong_ref(mxf, &source_package->descriptor_ref, AnyType);
1345         if (source_package->descriptor) {
1346             if (source_package->descriptor->type == MultipleDescriptor) {
1347                 for (j = 0; j < source_package->descriptor->sub_descriptors_count; j++) {
1348                     MXFDescriptor *sub_descriptor = mxf_resolve_strong_ref(mxf, &source_package->descriptor->sub_descriptors_refs[j], Descriptor);
1349
1350                     if (!sub_descriptor) {
1351                         av_log(mxf->fc, AV_LOG_ERROR, "could not resolve sub descriptor strong ref\n");
1352                         continue;
1353                     }
1354                     if (sub_descriptor->linked_track_id == source_track->track_id) {
1355                         descriptor = sub_descriptor;
1356                         break;
1357                     }
1358                 }
1359             } else if (source_package->descriptor->type == Descriptor)
1360                 descriptor = source_package->descriptor;
1361         }
1362         if (!descriptor) {
1363             av_log(mxf->fc, AV_LOG_INFO, "source track %d: stream %d, no descriptor found\n", source_track->track_id, st->index);
1364             continue;
1365         }
1366         PRINT_KEY(mxf->fc, "essence codec     ul", descriptor->essence_codec_ul);
1367         PRINT_KEY(mxf->fc, "essence container ul", descriptor->essence_container_ul);
1368         essence_container_ul = &descriptor->essence_container_ul;
1369         /* HACK: replacing the original key with mxf_encrypted_essence_container
1370          * is not allowed according to s429-6, try to find correct information anyway */
1371         if (IS_KLV_KEY(essence_container_ul, mxf_encrypted_essence_container)) {
1372             av_log(mxf->fc, AV_LOG_INFO, "broken encrypted mxf file\n");
1373             for (k = 0; k < mxf->metadata_sets_count; k++) {
1374                 MXFMetadataSet *metadata = mxf->metadata_sets[k];
1375                 if (metadata->type == CryptoContext) {
1376                     essence_container_ul = &((MXFCryptoContext *)metadata)->source_container_ul;
1377                     break;
1378                 }
1379             }
1380         }
1381
1382         /* TODO: drop PictureEssenceCoding and SoundEssenceCompression, only check EssenceContainer */
1383         codec_ul = mxf_get_codec_ul(ff_mxf_codec_uls, &descriptor->essence_codec_ul);
1384         st->codec->codec_id = codec_ul->id;
1385         if (descriptor->extradata) {
1386             st->codec->extradata = descriptor->extradata;
1387             st->codec->extradata_size = descriptor->extradata_size;
1388         }
1389         if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO) {
1390             container_ul = mxf_get_codec_ul(mxf_picture_essence_container_uls, essence_container_ul);
1391             if (st->codec->codec_id == CODEC_ID_NONE)
1392                 st->codec->codec_id = container_ul->id;
1393             st->codec->width = descriptor->width;
1394             st->codec->height = descriptor->height;
1395             if (st->codec->codec_id == CODEC_ID_RAWVIDEO)
1396                 st->codec->pix_fmt = descriptor->pix_fmt;
1397             st->need_parsing = AVSTREAM_PARSE_HEADERS;
1398         } else if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
1399             container_ul = mxf_get_codec_ul(mxf_sound_essence_container_uls, essence_container_ul);
1400             if (st->codec->codec_id == CODEC_ID_NONE)
1401                 st->codec->codec_id = container_ul->id;
1402             st->codec->channels = descriptor->channels;
1403             st->codec->bits_per_coded_sample = descriptor->bits_per_sample;
1404             if (descriptor->sample_rate.den > 0)
1405             st->codec->sample_rate = descriptor->sample_rate.num / descriptor->sample_rate.den;
1406             /* TODO: implement CODEC_ID_RAWAUDIO */
1407             if (st->codec->codec_id == CODEC_ID_PCM_S16LE) {
1408                 if (descriptor->bits_per_sample > 16 && descriptor->bits_per_sample <= 24)
1409                     st->codec->codec_id = CODEC_ID_PCM_S24LE;
1410                 else if (descriptor->bits_per_sample == 32)
1411                     st->codec->codec_id = CODEC_ID_PCM_S32LE;
1412             } else if (st->codec->codec_id == CODEC_ID_PCM_S16BE) {
1413                 if (descriptor->bits_per_sample > 16 && descriptor->bits_per_sample <= 24)
1414                     st->codec->codec_id = CODEC_ID_PCM_S24BE;
1415                 else if (descriptor->bits_per_sample == 32)
1416                     st->codec->codec_id = CODEC_ID_PCM_S32BE;
1417             } else if (st->codec->codec_id == CODEC_ID_MP2) {
1418                 st->need_parsing = AVSTREAM_PARSE_FULL;
1419             }
1420         }
1421         if (st->codec->codec_type != AVMEDIA_TYPE_DATA && (*essence_container_ul)[15] > 0x01) {
1422             /* TODO: decode timestamps */
1423             st->need_parsing = AVSTREAM_PARSE_TIMESTAMPS;
1424         }
1425     }
1426
1427     ret = 0;
1428 fail_and_free:
1429     return ret;
1430 }
1431
1432 static const MXFMetadataReadTableEntry mxf_metadata_read_table[] = {
1433     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x05,0x01,0x00 }, mxf_read_primer_pack },
1434     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x01,0x00 }, mxf_read_partition_pack },
1435     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x02,0x00 }, mxf_read_partition_pack },
1436     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x03,0x00 }, mxf_read_partition_pack },
1437     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x04,0x00 }, mxf_read_partition_pack },
1438     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x01,0x00 }, mxf_read_partition_pack },
1439     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x02,0x00 }, mxf_read_partition_pack },
1440     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x03,0x00 }, mxf_read_partition_pack },
1441     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x04,0x00 }, mxf_read_partition_pack },
1442     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x04,0x02,0x00 }, mxf_read_partition_pack },
1443     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x04,0x04,0x00 }, mxf_read_partition_pack },
1444     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x18,0x00 }, mxf_read_content_storage, 0, AnyType },
1445     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x37,0x00 }, mxf_read_source_package, sizeof(MXFPackage), SourcePackage },
1446     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x36,0x00 }, mxf_read_material_package, sizeof(MXFPackage), MaterialPackage },
1447     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x0F,0x00 }, mxf_read_sequence, sizeof(MXFSequence), Sequence },
1448     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x11,0x00 }, mxf_read_source_clip, sizeof(MXFStructuralComponent), SourceClip },
1449     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x44,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), MultipleDescriptor },
1450     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x42,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* Generic Sound */
1451     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x28,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* CDCI */
1452     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x29,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* RGBA */
1453     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x51,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* MPEG 2 Video */
1454     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x48,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* Wave */
1455     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x47,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* AES3 */
1456     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x3A,0x00 }, mxf_read_track, sizeof(MXFTrack), Track }, /* Static Track */
1457     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x3B,0x00 }, mxf_read_track, sizeof(MXFTrack), Track }, /* Generic Track */
1458     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x04,0x01,0x02,0x02,0x00,0x00 }, mxf_read_cryptographic_context, sizeof(MXFCryptoContext), CryptoContext },
1459     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x10,0x01,0x00 }, mxf_read_index_table_segment, sizeof(MXFIndexTableSegment), IndexTableSegment },
1460     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 }, NULL, 0, AnyType },
1461 };
1462
1463 static int mxf_read_local_tags(MXFContext *mxf, KLVPacket *klv, MXFMetadataReadFunc *read_child, int ctx_size, enum MXFMetadataSetType type)
1464 {
1465     AVIOContext *pb = mxf->fc->pb;
1466     MXFMetadataSet *ctx = ctx_size ? av_mallocz(ctx_size) : mxf;
1467     uint64_t klv_end = avio_tell(pb) + klv->length;
1468
1469     if (!ctx)
1470         return AVERROR(ENOMEM);
1471     while (avio_tell(pb) + 4 < klv_end && !url_feof(pb)) {
1472         int ret;
1473         int tag = avio_rb16(pb);
1474         int size = avio_rb16(pb); /* KLV specified by 0x53 */
1475         uint64_t next = avio_tell(pb) + size;
1476         UID uid = {0};
1477
1478         av_dlog(mxf->fc, "local tag %#04x size %d\n", tag, size);
1479         if (!size) { /* ignore empty tag, needed for some files with empty UMID tag */
1480             av_log(mxf->fc, AV_LOG_ERROR, "local tag %#04x with 0 size\n", tag);
1481             continue;
1482         }
1483         if (tag > 0x7FFF) { /* dynamic tag */
1484             int i;
1485             for (i = 0; i < mxf->local_tags_count; i++) {
1486                 int local_tag = AV_RB16(mxf->local_tags+i*18);
1487                 if (local_tag == tag) {
1488                     memcpy(uid, mxf->local_tags+i*18+2, 16);
1489                     av_dlog(mxf->fc, "local tag %#04x\n", local_tag);
1490                     PRINT_KEY(mxf->fc, "uid", uid);
1491                 }
1492             }
1493         }
1494         if (ctx_size && tag == 0x3C0A)
1495             avio_read(pb, ctx->uid, 16);
1496         else if ((ret = read_child(ctx, pb, tag, size, uid, -1)) < 0)
1497             return ret;
1498
1499         /* accept the 64k local set limit being exceeded (Avid)
1500          * don't accept it extending past the end of the KLV though (zzuf5.mxf) */
1501         if (avio_tell(pb) > klv_end) {
1502             av_log(mxf->fc, AV_LOG_ERROR, "local tag %#04x extends past end of local set @ %#"PRIx64"\n",
1503                    tag, klv->offset);
1504             return AVERROR_INVALIDDATA;
1505         } else if (avio_tell(pb) <= next)   /* only seek forward, else this can loop for a long time */
1506         avio_seek(pb, next, SEEK_SET);
1507     }
1508     if (ctx_size) ctx->type = type;
1509     return ctx_size ? mxf_add_metadata_set(mxf, ctx) : 0;
1510 }
1511
1512 /**
1513  * Seeks to the previous partition, if possible
1514  * @return <= 0 if we should stop parsing, > 0 if we should keep going
1515  */
1516 static int mxf_seek_to_previous_partition(MXFContext *mxf)
1517 {
1518     AVIOContext *pb = mxf->fc->pb;
1519
1520     if (!mxf->current_partition ||
1521         mxf->run_in + mxf->current_partition->previous_partition <= mxf->last_forward_tell)
1522         return 0;   /* we've parsed all partitions */
1523
1524     /* seek to previous partition */
1525     avio_seek(pb, mxf->run_in + mxf->current_partition->previous_partition, SEEK_SET);
1526     mxf->current_partition = NULL;
1527
1528     av_dlog(mxf->fc, "seeking to previous partition\n");
1529
1530     return 1;
1531 }
1532
1533 /**
1534  * Called when essence is encountered
1535  * @return <= 0 if we should stop parsing, > 0 if we should keep going
1536  */
1537 static int mxf_parse_handle_essence(MXFContext *mxf)
1538 {
1539     AVIOContext *pb = mxf->fc->pb;
1540     int64_t ret;
1541
1542     if (mxf->parsing_backward) {
1543         return mxf_seek_to_previous_partition(mxf);
1544     } else {
1545         if (!mxf->footer_partition) {
1546             av_dlog(mxf->fc, "no footer\n");
1547             return 0;
1548         }
1549
1550         av_dlog(mxf->fc, "seeking to footer\n");
1551
1552         /* remember where we were so we don't end up seeking further back than this */
1553         mxf->last_forward_tell = avio_tell(pb);
1554
1555         if (!pb->seekable) {
1556             av_log(mxf->fc, AV_LOG_INFO, "file is not seekable - not parsing footer\n");
1557             return -1;
1558         }
1559
1560         /* seek to footer partition and parse backward */
1561         if ((ret = avio_seek(pb, mxf->run_in + mxf->footer_partition, SEEK_SET)) < 0) {
1562             av_log(mxf->fc, AV_LOG_ERROR, "failed to seek to footer @ 0x%"PRIx64" (%"PRId64") - partial file?\n",
1563                    mxf->run_in + mxf->footer_partition, ret);
1564             return ret;
1565         }
1566
1567         mxf->current_partition = NULL;
1568         mxf->parsing_backward = 1;
1569     }
1570
1571     return 1;
1572 }
1573
1574 /**
1575  * Called when the next partition or EOF is encountered
1576  * @return <= 0 if we should stop parsing, > 0 if we should keep going
1577  */
1578 static int mxf_parse_handle_partition_or_eof(MXFContext *mxf)
1579 {
1580     return mxf->parsing_backward ? mxf_seek_to_previous_partition(mxf) : 1;
1581 }
1582
1583 /**
1584  * Figures out the proper offset and length of the essence container in each partition
1585  */
1586 static void mxf_compute_essence_containers(MXFContext *mxf)
1587 {
1588     int x;
1589
1590     /* everything is already correct */
1591     if (mxf->op == OPAtom)
1592         return;
1593
1594     for (x = 0; x < mxf->partitions_count; x++) {
1595         MXFPartition *p = &mxf->partitions[x];
1596
1597         if (!p->body_sid)
1598             continue;       /* BodySID == 0 -> no essence */
1599
1600         if (x >= mxf->partitions_count - 1)
1601             break;          /* last partition - can't compute length (and we don't need to) */
1602
1603         /* essence container spans to the next partition */
1604         p->essence_length = mxf->partitions[x+1].this_partition - p->essence_offset;
1605
1606         if (p->essence_length < 0) {
1607             /* next ThisPartition < essence_offset */
1608             p->essence_length = 0;
1609             av_log(mxf->fc, AV_LOG_ERROR,
1610                    "partition %i: bad ThisPartition = %"PRIX64"\n",
1611                    x+1, mxf->partitions[x+1].this_partition);
1612         }
1613     }
1614 }
1615
1616 static int64_t round_to_kag(int64_t position, int kag_size)
1617 {
1618     /* TODO: account for run-in? the spec isn't clear whether KAG should account for it */
1619     /* NOTE: kag_size may be any integer between 1 - 2^10 */
1620     int64_t ret = (position / kag_size) * kag_size;
1621     return ret == position ? ret : ret + kag_size;
1622 }
1623
1624 static int is_pcm(enum CodecID codec_id)
1625 {
1626     /* we only care about "normal" PCM codecs until we get samples */
1627     return codec_id >= CODEC_ID_PCM_S16LE && codec_id < CODEC_ID_PCM_S24DAUD;
1628 }
1629
1630 /**
1631  * Deals with the case where for some audio atoms EditUnitByteCount is very small (2, 4..).
1632  * In those cases we should read more than one sample per call to mxf_read_packet().
1633  */
1634 static void mxf_handle_small_eubc(AVFormatContext *s)
1635 {
1636     MXFContext *mxf = s->priv_data;
1637
1638     /* assuming non-OPAtom == frame wrapped
1639      * no sane writer would wrap 2 byte PCM packets with 20 byte headers.. */
1640     if (mxf->op != OPAtom)
1641         return;
1642
1643     /* expect PCM with exactly one index table segment and a small (< 32) EUBC */
1644     if (s->nb_streams != 1 || s->streams[0]->codec->codec_type != AVMEDIA_TYPE_AUDIO ||
1645         !is_pcm(s->streams[0]->codec->codec_id) || mxf->nb_index_tables != 1 ||
1646         mxf->index_tables[0].nb_segments != 1 ||
1647         mxf->index_tables[0].segments[0]->edit_unit_byte_count >= 32)
1648         return;
1649
1650     /* arbitrarily default to 48 kHz PAL audio frame size */
1651     /* TODO: we could compute this from the ratio between the audio and video edit rates
1652      *       for 48 kHz NTSC we could use the 1802-1802-1802-1802-1801 pattern */
1653     mxf->edit_units_per_packet = 1920;
1654 }
1655
1656 static int mxf_read_header(AVFormatContext *s)
1657 {
1658     MXFContext *mxf = s->priv_data;
1659     KLVPacket klv;
1660     int64_t essence_offset = 0;
1661     int ret;
1662
1663     mxf->last_forward_tell = INT64_MAX;
1664     mxf->edit_units_per_packet = 1;
1665
1666     if (!mxf_read_sync(s->pb, mxf_header_partition_pack_key, 14)) {
1667         av_log(s, AV_LOG_ERROR, "could not find header partition pack key\n");
1668         return AVERROR_INVALIDDATA;
1669     }
1670     avio_seek(s->pb, -14, SEEK_CUR);
1671     mxf->fc = s;
1672     mxf->run_in = avio_tell(s->pb);
1673
1674     while (!url_feof(s->pb)) {
1675         const MXFMetadataReadTableEntry *metadata;
1676
1677         if (klv_read_packet(&klv, s->pb) < 0) {
1678             /* EOF - seek to previous partition or stop */
1679             if(mxf_parse_handle_partition_or_eof(mxf) <= 0)
1680                 break;
1681             else
1682                 continue;
1683         }
1684
1685         PRINT_KEY(s, "read header", klv.key);
1686         av_dlog(s, "size %"PRIu64" offset %#"PRIx64"\n", klv.length, klv.offset);
1687         if (IS_KLV_KEY(klv.key, mxf_encrypted_triplet_key) ||
1688             IS_KLV_KEY(klv.key, mxf_essence_element_key) ||
1689             IS_KLV_KEY(klv.key, mxf_avid_essence_element_key) ||
1690             IS_KLV_KEY(klv.key, mxf_system_item_key)) {
1691
1692             if (!mxf->current_partition) {
1693                 av_log(mxf->fc, AV_LOG_ERROR, "found essence prior to first PartitionPack\n");
1694                 return AVERROR_INVALIDDATA;
1695             }
1696
1697             if (!mxf->current_partition->essence_offset) {
1698                 /* for OP1a we compute essence_offset
1699                  * for OPAtom we point essence_offset after the KL (usually op1a_essence_offset + 20 or 25)
1700                  * TODO: for OP1a we could eliminate this entire if statement, always stopping parsing at op1a_essence_offset
1701                  *       for OPAtom we still need the actual essence_offset though (the KL's length can vary)
1702                  */
1703                 int64_t op1a_essence_offset =
1704                     round_to_kag(mxf->current_partition->this_partition +
1705                                  mxf->current_partition->pack_length,       mxf->current_partition->kag_size) +
1706                     round_to_kag(mxf->current_partition->header_byte_count, mxf->current_partition->kag_size) +
1707                     round_to_kag(mxf->current_partition->index_byte_count,  mxf->current_partition->kag_size);
1708
1709                 if (mxf->op == OPAtom) {
1710                     /* point essence_offset to the actual data
1711                     * OPAtom has all the essence in one big KLV
1712                     */
1713                     mxf->current_partition->essence_offset = avio_tell(s->pb);
1714                     mxf->current_partition->essence_length = klv.length;
1715                 } else {
1716                     /* NOTE: op1a_essence_offset may be less than to klv.offset (C0023S01.mxf)  */
1717                     mxf->current_partition->essence_offset = op1a_essence_offset;
1718                 }
1719             }
1720
1721             if (!essence_offset)
1722                 essence_offset = klv.offset;
1723
1724             /* seek to footer, previous partition or stop */
1725             if (mxf_parse_handle_essence(mxf) <= 0)
1726                 break;
1727             continue;
1728         } else if (!memcmp(klv.key, mxf_header_partition_pack_key, 13) &&
1729                    klv.key[13] >= 2 && klv.key[13] <= 4 && mxf->current_partition) {
1730             /* next partition pack - keep going, seek to previous partition or stop */
1731             if(mxf_parse_handle_partition_or_eof(mxf) <= 0)
1732                 break;
1733         }
1734
1735         for (metadata = mxf_metadata_read_table; metadata->read; metadata++) {
1736             if (IS_KLV_KEY(klv.key, metadata->key)) {
1737                 int res;
1738                 if (klv.key[5] == 0x53) {
1739                     res = mxf_read_local_tags(mxf, &klv, metadata->read, metadata->ctx_size, metadata->type);
1740                 } else {
1741                     uint64_t next = avio_tell(s->pb) + klv.length;
1742                     res = metadata->read(mxf, s->pb, 0, klv.length, klv.key, klv.offset);
1743
1744                     /* only seek forward, else this can loop for a long time */
1745                     if (avio_tell(s->pb) > next) {
1746                         av_log(s, AV_LOG_ERROR, "read past end of KLV @ %#"PRIx64"\n",
1747                                klv.offset);
1748                         return AVERROR_INVALIDDATA;
1749                     }
1750
1751                     avio_seek(s->pb, next, SEEK_SET);
1752                 }
1753                 if (res < 0) {
1754                     av_log(s, AV_LOG_ERROR, "error reading header metadata\n");
1755                     return res;
1756                 }
1757                 break;
1758             }
1759         }
1760         if (!metadata->read)
1761             avio_skip(s->pb, klv.length);
1762     }
1763     /* FIXME avoid seek */
1764     if (!essence_offset)  {
1765         av_log(s, AV_LOG_ERROR, "no essence\n");
1766         return AVERROR_INVALIDDATA;
1767     }
1768     avio_seek(s->pb, essence_offset, SEEK_SET);
1769
1770     mxf_compute_essence_containers(mxf);
1771
1772     /* we need to do this before computing the index tables
1773      * to be able to fill in zero IndexDurations with st->duration */
1774     if ((ret = mxf_parse_structural_metadata(mxf)) < 0)
1775         return ret;
1776
1777     if ((ret = mxf_compute_index_tables(mxf)) < 0)
1778         return ret;
1779
1780     if (mxf->nb_index_tables > 1) {
1781         /* TODO: look up which IndexSID to use via EssenceContainerData */
1782         av_log(mxf->fc, AV_LOG_INFO, "got %i index tables - only the first one (IndexSID %i) will be used\n",
1783                mxf->nb_index_tables, mxf->index_tables[0].index_sid);
1784     } else if (mxf->nb_index_tables == 0 && mxf->op == OPAtom) {
1785         av_log(mxf->fc, AV_LOG_ERROR, "cannot demux OPAtom without an index\n");
1786         return AVERROR_INVALIDDATA;
1787     }
1788
1789     mxf_handle_small_eubc(s);
1790
1791     return 0;
1792 }
1793
1794 /**
1795  * Computes DTS and PTS for the given video packet based on its offset.
1796  */
1797 static void mxf_packet_timestamps(MXFContext *mxf, AVPacket *pkt)
1798 {
1799     int64_t last_ofs = -1, next_ofs;
1800     MXFIndexTable *t = &mxf->index_tables[0];
1801
1802     /* this is called from the OP1a demuxing logic, which means there may be no index tables */
1803     if (mxf->nb_index_tables <= 0)
1804         return;
1805
1806     /* find mxf->current_edit_unit so that the next edit unit starts ahead of pkt->pos */
1807     while (mxf->current_edit_unit >= 0) {
1808         if (mxf_edit_unit_absolute_offset(mxf, t, mxf->current_edit_unit + 1, NULL, &next_ofs, 0) < 0)
1809             break;
1810
1811         if (next_ofs <= last_ofs) {
1812             /* large next_ofs didn't change or current_edit_unit wrapped around
1813              * this fixes the infinite loop on zzuf3.mxf */
1814             av_log(mxf->fc, AV_LOG_ERROR, "next_ofs didn't change. not deriving packet timestamps\n");
1815             return;
1816         }
1817
1818         if (next_ofs > pkt->pos)
1819             break;
1820
1821         last_ofs = next_ofs;
1822         mxf->current_edit_unit++;
1823     }
1824
1825     if (mxf->current_edit_unit < 0 || mxf->current_edit_unit >= t->nb_ptses)
1826         return;
1827
1828     pkt->dts = mxf->current_edit_unit + t->first_dts;
1829     pkt->pts = t->ptses[mxf->current_edit_unit];
1830 }
1831
1832 static int mxf_read_packet_old(AVFormatContext *s, AVPacket *pkt)
1833 {
1834     KLVPacket klv;
1835
1836     while (!url_feof(s->pb)) {
1837         int ret;
1838         if (klv_read_packet(&klv, s->pb) < 0)
1839             return -1;
1840         PRINT_KEY(s, "read packet", klv.key);
1841         av_dlog(s, "size %"PRIu64" offset %#"PRIx64"\n", klv.length, klv.offset);
1842         if (IS_KLV_KEY(klv.key, mxf_encrypted_triplet_key)) {
1843             ret = mxf_decrypt_triplet(s, pkt, &klv);
1844             if (ret < 0) {
1845                 av_log(s, AV_LOG_ERROR, "invalid encoded triplet\n");
1846                 return AVERROR_INVALIDDATA;
1847             }
1848             return 0;
1849         }
1850         if (IS_KLV_KEY(klv.key, mxf_essence_element_key) ||
1851             IS_KLV_KEY(klv.key, mxf_avid_essence_element_key)) {
1852             int index = mxf_get_stream_index(s, &klv);
1853             if (index < 0) {
1854                 av_log(s, AV_LOG_ERROR, "error getting stream index %d\n", AV_RB32(klv.key+12));
1855                 goto skip;
1856             }
1857             if (s->streams[index]->discard == AVDISCARD_ALL)
1858                 goto skip;
1859             /* check for 8 channels AES3 element */
1860             if (klv.key[12] == 0x06 && klv.key[13] == 0x01 && klv.key[14] == 0x10) {
1861                 if (mxf_get_d10_aes3_packet(s->pb, s->streams[index], pkt, klv.length) < 0) {
1862                     av_log(s, AV_LOG_ERROR, "error reading D-10 aes3 frame\n");
1863                     return AVERROR_INVALIDDATA;
1864                 }
1865             } else {
1866                 ret = av_get_packet(s->pb, pkt, klv.length);
1867                 if (ret < 0)
1868                     return ret;
1869             }
1870             pkt->stream_index = index;
1871             pkt->pos = klv.offset;
1872
1873             if (s->streams[index]->codec->codec_type == AVMEDIA_TYPE_VIDEO)
1874                 mxf_packet_timestamps(s->priv_data, pkt);   /* offset -> EditUnit -> DTS/PTS */
1875
1876             return 0;
1877         } else
1878         skip:
1879             avio_skip(s->pb, klv.length);
1880     }
1881     return AVERROR_EOF;
1882 }
1883
1884 static int mxf_read_packet(AVFormatContext *s, AVPacket *pkt)
1885 {
1886     MXFContext *mxf = s->priv_data;
1887     int ret, size;
1888     int64_t ret64, pos, next_pos;
1889     AVStream *st;
1890     MXFIndexTable *t;
1891     int edit_units;
1892
1893     if (mxf->op != OPAtom)
1894         return mxf_read_packet_old(s, pkt);
1895
1896     /* OPAtom - clip wrapped demuxing */
1897     /* NOTE: mxf_read_header() makes sure nb_index_tables > 0 for OPAtom */
1898     st = s->streams[0];
1899     t = &mxf->index_tables[0];
1900
1901     if (mxf->current_edit_unit >= st->duration)
1902         return AVERROR_EOF;
1903
1904     edit_units = FFMIN(mxf->edit_units_per_packet, st->duration - mxf->current_edit_unit);
1905
1906     if ((ret = mxf_edit_unit_absolute_offset(mxf, t, mxf->current_edit_unit, NULL, &pos, 1)) < 0)
1907         return ret;
1908
1909     /* compute size by finding the next edit unit or the end of the essence container
1910      * not pretty, but it works */
1911     if ((ret = mxf_edit_unit_absolute_offset(mxf, t, mxf->current_edit_unit + edit_units, NULL, &next_pos, 0)) < 0 &&
1912         (next_pos = mxf_essence_container_end(mxf, t->body_sid)) <= 0) {
1913         av_log(s, AV_LOG_ERROR, "unable to compute the size of the last packet\n");
1914         return AVERROR_INVALIDDATA;
1915     }
1916
1917     if ((size = next_pos - pos) <= 0) {
1918         av_log(s, AV_LOG_ERROR, "bad size: %i\n", size);
1919         return AVERROR_INVALIDDATA;
1920     }
1921
1922     if ((ret64 = avio_seek(s->pb, pos, SEEK_SET)) < 0)
1923         return ret64;
1924
1925         if ((ret = av_get_packet(s->pb, pkt, size)) != size)
1926             return ret < 0 ? ret : AVERROR_EOF;
1927
1928     if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO && t->ptses &&
1929         mxf->current_edit_unit >= 0 && mxf->current_edit_unit < t->nb_ptses) {
1930         pkt->dts = mxf->current_edit_unit + t->first_dts;
1931         pkt->pts = t->ptses[mxf->current_edit_unit];
1932     }
1933
1934     pkt->stream_index = 0;
1935     mxf->current_edit_unit += edit_units;
1936
1937     return 0;
1938 }
1939
1940 static int mxf_read_close(AVFormatContext *s)
1941 {
1942     MXFContext *mxf = s->priv_data;
1943     MXFIndexTableSegment *seg;
1944     int i;
1945
1946     av_freep(&mxf->packages_refs);
1947
1948     for (i = 0; i < s->nb_streams; i++)
1949         s->streams[i]->priv_data = NULL;
1950
1951     for (i = 0; i < mxf->metadata_sets_count; i++) {
1952         switch (mxf->metadata_sets[i]->type) {
1953         case MultipleDescriptor:
1954             av_freep(&((MXFDescriptor *)mxf->metadata_sets[i])->sub_descriptors_refs);
1955             break;
1956         case Sequence:
1957             av_freep(&((MXFSequence *)mxf->metadata_sets[i])->structural_components_refs);
1958             break;
1959         case SourcePackage:
1960         case MaterialPackage:
1961             av_freep(&((MXFPackage *)mxf->metadata_sets[i])->tracks_refs);
1962             break;
1963         case IndexTableSegment:
1964             seg = (MXFIndexTableSegment *)mxf->metadata_sets[i];
1965             av_freep(&seg->temporal_offset_entries);
1966             av_freep(&seg->flag_entries);
1967             av_freep(&seg->stream_offset_entries);
1968             break;
1969         default:
1970             break;
1971         }
1972         av_freep(&mxf->metadata_sets[i]);
1973     }
1974     av_freep(&mxf->partitions);
1975     av_freep(&mxf->metadata_sets);
1976     av_freep(&mxf->aesc);
1977     av_freep(&mxf->local_tags);
1978
1979     for (i = 0; i < mxf->nb_index_tables; i++) {
1980         av_freep(&mxf->index_tables[i].segments);
1981         av_freep(&mxf->index_tables[i].ptses);
1982         av_freep(&mxf->index_tables[i].fake_index);
1983     }
1984     av_freep(&mxf->index_tables);
1985
1986     return 0;
1987 }
1988
1989 static int mxf_probe(AVProbeData *p) {
1990     uint8_t *bufp = p->buf;
1991     uint8_t *end = p->buf + p->buf_size;
1992
1993     if (p->buf_size < sizeof(mxf_header_partition_pack_key))
1994         return 0;
1995
1996     /* Must skip Run-In Sequence and search for MXF header partition pack key SMPTE 377M 5.5 */
1997     end -= sizeof(mxf_header_partition_pack_key);
1998     for (; bufp < end; bufp++) {
1999         if (IS_KLV_KEY(bufp, mxf_header_partition_pack_key))
2000             return AVPROBE_SCORE_MAX;
2001     }
2002     return 0;
2003 }
2004
2005 /* rudimentary byte seek */
2006 /* XXX: use MXF Index */
2007 static int mxf_read_seek(AVFormatContext *s, int stream_index, int64_t sample_time, int flags)
2008 {
2009     AVStream *st = s->streams[stream_index];
2010     int64_t seconds;
2011     MXFContext* mxf = s->priv_data;
2012     int64_t seekpos;
2013     int ret;
2014     MXFIndexTable *t;
2015
2016     if (mxf->index_tables <= 0) {
2017     if (!s->bit_rate)
2018         return AVERROR_INVALIDDATA;
2019     if (sample_time < 0)
2020         sample_time = 0;
2021     seconds = av_rescale(sample_time, st->time_base.num, st->time_base.den);
2022
2023     if ((ret = avio_seek(s->pb, (s->bit_rate * seconds) >> 3, SEEK_SET)) < 0)
2024         return ret;
2025     ff_update_cur_dts(s, st, sample_time);
2026     } else {
2027         t = &mxf->index_tables[0];
2028
2029         /* clamp above zero, else ff_index_search_timestamp() returns negative
2030          * this also means we allow seeking before the start */
2031         sample_time = FFMAX(sample_time, 0);
2032
2033         if (t->fake_index) {
2034             /* behave as if we have a proper index */
2035             if ((sample_time = ff_index_search_timestamp(t->fake_index, t->nb_ptses, sample_time, flags)) < 0)
2036                 return sample_time;
2037         } else {
2038             /* no IndexEntryArray (one or more CBR segments)
2039              * make sure we don't seek past the end */
2040             sample_time = FFMIN(sample_time, st->duration - 1);
2041         }
2042
2043         if ((ret = mxf_edit_unit_absolute_offset(mxf, t, sample_time, &sample_time, &seekpos, 1)) << 0)
2044             return ret;
2045
2046         ff_update_cur_dts(s, st, sample_time);
2047         mxf->current_edit_unit = sample_time;
2048         avio_seek(s->pb, seekpos, SEEK_SET);
2049     }
2050     return 0;
2051 }
2052
2053 AVInputFormat ff_mxf_demuxer = {
2054     .name           = "mxf",
2055     .long_name      = NULL_IF_CONFIG_SMALL("Material eXchange Format"),
2056     .priv_data_size = sizeof(MXFContext),
2057     .read_probe     = mxf_probe,
2058     .read_header    = mxf_read_header,
2059     .read_packet    = mxf_read_packet,
2060     .read_close     = mxf_read_close,
2061     .read_seek      = mxf_read_seek,
2062 };