]> git.sesse.net Git - ffmpeg/blob - libavformat/mxfdec.c
vsrx_mptestsrc: remove duplicate config_props init.
[ffmpeg] / libavformat / mxfdec.c
1 /*
2  * MXF demuxer.
3  * Copyright (c) 2006 SmartJog S.A., Baptiste Coudurier <baptiste dot coudurier at smartjog dot com>
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 /*
23  * References
24  * SMPTE 336M KLV Data Encoding Protocol Using Key-Length-Value
25  * SMPTE 377M MXF File Format Specifications
26  * SMPTE 378M Operational Pattern 1a
27  * SMPTE 379M MXF Generic Container
28  * SMPTE 381M Mapping MPEG Streams into the MXF Generic Container
29  * SMPTE 382M Mapping AES3 and Broadcast Wave Audio into the MXF Generic Container
30  * SMPTE 383M Mapping DV-DIF Data to the MXF Generic Container
31  *
32  * Principle
33  * Search for Track numbers which will identify essence element KLV packets.
34  * Search for SourcePackage which define tracks which contains Track numbers.
35  * Material Package contains tracks with reference to SourcePackage tracks.
36  * Search for Descriptors (Picture, Sound) which contains codec info and parameters.
37  * Assign Descriptors to correct Tracks.
38  *
39  * Metadata reading functions read Local Tags, get InstanceUID(0x3C0A) then add MetaDataSet to MXFContext.
40  * Metadata parsing resolves Strong References to objects.
41  *
42  * Simple demuxer, only OP1A supported and some files might not work at all.
43  * Only tracks with associated descriptors will be decoded. "Highly Desirable" SMPTE 377M D.1
44  */
45
46 //#define DEBUG
47
48 #include "libavutil/aes.h"
49 #include "libavutil/mathematics.h"
50 #include "libavcodec/bytestream.h"
51 #include "avformat.h"
52 #include "internal.h"
53 #include "mxf.h"
54
55 typedef enum {
56     Header,
57     BodyPartition,
58     Footer
59 } MXFPartitionType;
60
61 typedef enum {
62     OP1a = 1,
63     OP1b,
64     OP1c,
65     OP2a,
66     OP2b,
67     OP2c,
68     OP3a,
69     OP3b,
70     OP3c,
71     OPAtom,
72     OPSONYOpt,  /* FATE sample, violates the spec in places */
73 } MXFOP;
74
75 typedef struct {
76     int closed;
77     int complete;
78     MXFPartitionType type;
79     uint64_t previous_partition;
80     int index_sid;
81     int body_sid;
82     int64_t this_partition;
83     int64_t essence_offset;         ///< absolute offset of essence
84     int64_t essence_length;
85     int32_t kag_size;
86     int64_t header_byte_count;
87     int64_t index_byte_count;
88     int pack_length;
89 } MXFPartition;
90
91 typedef struct {
92     UID uid;
93     enum MXFMetadataSetType type;
94     UID source_container_ul;
95 } MXFCryptoContext;
96
97 typedef struct {
98     UID uid;
99     enum MXFMetadataSetType type;
100     UID source_package_uid;
101     UID data_definition_ul;
102     int64_t duration;
103     int64_t start_position;
104     int source_track_id;
105 } MXFStructuralComponent;
106
107 typedef struct {
108     UID uid;
109     enum MXFMetadataSetType type;
110     UID data_definition_ul;
111     UID *structural_components_refs;
112     int structural_components_count;
113     int64_t duration;
114 } MXFSequence;
115
116 typedef struct {
117     UID uid;
118     enum MXFMetadataSetType type;
119     MXFSequence *sequence; /* mandatory, and only one */
120     UID sequence_ref;
121     int track_id;
122     uint8_t track_number[4];
123     AVRational edit_rate;
124 } MXFTrack;
125
126 typedef struct {
127     UID uid;
128     enum MXFMetadataSetType type;
129     UID essence_container_ul;
130     UID essence_codec_ul;
131     AVRational sample_rate;
132     AVRational aspect_ratio;
133     int width;
134     int height;
135     int channels;
136     int bits_per_sample;
137     unsigned int component_depth;
138     unsigned int horiz_subsampling;
139     unsigned int vert_subsampling;
140     UID *sub_descriptors_refs;
141     int sub_descriptors_count;
142     int linked_track_id;
143     uint8_t *extradata;
144     int extradata_size;
145     enum PixelFormat pix_fmt;
146 } MXFDescriptor;
147
148 typedef struct {
149     UID uid;
150     enum MXFMetadataSetType type;
151     int edit_unit_byte_count;
152     int index_sid;
153     int body_sid;
154     AVRational index_edit_rate;
155     uint64_t index_start_position;
156     uint64_t index_duration;
157     int8_t *temporal_offset_entries;
158     int *flag_entries;
159     uint64_t *stream_offset_entries;
160     int nb_index_entries;
161 } MXFIndexTableSegment;
162
163 typedef struct {
164     UID uid;
165     enum MXFMetadataSetType type;
166     UID package_uid;
167     UID *tracks_refs;
168     int tracks_count;
169     MXFDescriptor *descriptor; /* only one */
170     UID descriptor_ref;
171 } MXFPackage;
172
173 typedef struct {
174     UID uid;
175     enum MXFMetadataSetType type;
176 } MXFMetadataSet;
177
178 /* decoded index table */
179 typedef struct {
180     int index_sid;
181     int body_sid;
182     int nb_ptses;               /* number of PTSes or total duration of index */
183     int64_t first_dts;          /* DTS = EditUnit + first_dts */
184     int64_t *ptses;             /* maps EditUnit -> PTS */
185     int nb_segments;
186     MXFIndexTableSegment **segments;    /* sorted by IndexStartPosition */
187     AVIndexEntry *fake_index;   /* used for calling ff_index_search_timestamp() */
188 } MXFIndexTable;
189
190 typedef struct {
191     MXFPartition *partitions;
192     unsigned partitions_count;
193     MXFOP op;
194     UID *packages_refs;
195     int packages_count;
196     MXFMetadataSet **metadata_sets;
197     int metadata_sets_count;
198     AVFormatContext *fc;
199     struct AVAES *aesc;
200     uint8_t *local_tags;
201     int local_tags_count;
202     uint64_t footer_partition;
203     KLVPacket current_klv_data;
204     int current_klv_index;
205     int run_in;
206     MXFPartition *current_partition;
207     int parsing_backward;
208     int64_t last_forward_tell;
209     int last_forward_partition;
210     int current_edit_unit;
211     int nb_index_tables;
212     MXFIndexTable *index_tables;
213     int edit_units_per_packet;      ///< how many edit units to read at a time (PCM, OPAtom)
214 } MXFContext;
215
216 enum MXFWrappingScheme {
217     Frame,
218     Clip,
219 };
220
221 /* NOTE: klv_offset is not set (-1) for local keys */
222 typedef int MXFMetadataReadFunc(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset);
223
224 typedef struct {
225     const UID key;
226     MXFMetadataReadFunc *read;
227     int ctx_size;
228     enum MXFMetadataSetType type;
229 } MXFMetadataReadTableEntry;
230
231 /* partial keys to match */
232 static const uint8_t mxf_header_partition_pack_key[]       = { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02 };
233 static const uint8_t mxf_essence_element_key[]             = { 0x06,0x0e,0x2b,0x34,0x01,0x02,0x01,0x01,0x0d,0x01,0x03,0x01 };
234 static const uint8_t mxf_avid_essence_element_key[]        = { 0x06,0x0e,0x2b,0x34,0x01,0x02,0x01,0x01,0x0e,0x04,0x03,0x01 };
235 static const uint8_t mxf_system_item_key[]                 = { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0D,0x01,0x03,0x01,0x04 };
236 static const uint8_t mxf_klv_key[]                         = { 0x06,0x0e,0x2b,0x34 };
237 /* complete keys to match */
238 static const uint8_t mxf_crypto_source_container_ul[]      = { 0x06,0x0e,0x2b,0x34,0x01,0x01,0x01,0x09,0x06,0x01,0x01,0x02,0x02,0x00,0x00,0x00 };
239 static const uint8_t mxf_encrypted_triplet_key[]           = { 0x06,0x0e,0x2b,0x34,0x02,0x04,0x01,0x07,0x0d,0x01,0x03,0x01,0x02,0x7e,0x01,0x00 };
240 static const uint8_t mxf_encrypted_essence_container[]     = { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x07,0x0d,0x01,0x03,0x01,0x02,0x0b,0x01,0x00 };
241 static const uint8_t mxf_sony_mpeg4_extradata[]            = { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x01,0x0e,0x06,0x06,0x02,0x02,0x01,0x00,0x00 };
242
243 #define IS_KLV_KEY(x, y) (!memcmp(x, y, sizeof(y)))
244
245 static int64_t klv_decode_ber_length(AVIOContext *pb)
246 {
247     uint64_t size = avio_r8(pb);
248     if (size & 0x80) { /* long form */
249         int bytes_num = size & 0x7f;
250         /* SMPTE 379M 5.3.4 guarantee that bytes_num must not exceed 8 bytes */
251         if (bytes_num > 8)
252             return AVERROR_INVALIDDATA;
253         size = 0;
254         while (bytes_num--)
255             size = size << 8 | avio_r8(pb);
256     }
257     return size;
258 }
259
260 static int mxf_read_sync(AVIOContext *pb, const uint8_t *key, unsigned size)
261 {
262     int i, b;
263     for (i = 0; i < size && !url_feof(pb); i++) {
264         b = avio_r8(pb);
265         if (b == key[0])
266             i = 0;
267         else if (b != key[i])
268             i = -1;
269     }
270     return i == size;
271 }
272
273 static int klv_read_packet(KLVPacket *klv, AVIOContext *pb)
274 {
275     if (!mxf_read_sync(pb, mxf_klv_key, 4))
276         return AVERROR_INVALIDDATA;
277     klv->offset = avio_tell(pb) - 4;
278     memcpy(klv->key, mxf_klv_key, 4);
279     avio_read(pb, klv->key + 4, 12);
280     klv->length = klv_decode_ber_length(pb);
281     return klv->length == -1 ? -1 : 0;
282 }
283
284 static int mxf_get_stream_index(AVFormatContext *s, KLVPacket *klv)
285 {
286     int i;
287
288     for (i = 0; i < s->nb_streams; i++) {
289         MXFTrack *track = s->streams[i]->priv_data;
290         /* SMPTE 379M 7.3 */
291         if (!memcmp(klv->key + sizeof(mxf_essence_element_key), track->track_number, sizeof(track->track_number)))
292             return i;
293     }
294     /* return 0 if only one stream, for OP Atom files with 0 as track number */
295     return s->nb_streams == 1 ? 0 : -1;
296 }
297
298 /* XXX: use AVBitStreamFilter */
299 static int mxf_get_d10_aes3_packet(AVIOContext *pb, AVStream *st, AVPacket *pkt, int64_t length)
300 {
301     const uint8_t *buf_ptr, *end_ptr;
302     uint8_t *data_ptr;
303     int i;
304
305     if (length > 61444) /* worst case PAL 1920 samples 8 channels */
306         return AVERROR_INVALIDDATA;
307     length = av_get_packet(pb, pkt, length);
308     if (length < 0)
309         return length;
310     data_ptr = pkt->data;
311     end_ptr = pkt->data + length;
312     buf_ptr = pkt->data + 4; /* skip SMPTE 331M header */
313     for (; buf_ptr + st->codec->channels*4 < end_ptr; ) {
314         for (i = 0; i < st->codec->channels; i++) {
315             uint32_t sample = bytestream_get_le32(&buf_ptr);
316             if (st->codec->bits_per_coded_sample == 24)
317                 bytestream_put_le24(&data_ptr, (sample >> 4) & 0xffffff);
318             else
319                 bytestream_put_le16(&data_ptr, (sample >> 12) & 0xffff);
320         }
321         buf_ptr += 32 - st->codec->channels*4; // always 8 channels stored SMPTE 331M
322     }
323     av_shrink_packet(pkt, data_ptr - pkt->data);
324     return 0;
325 }
326
327 static int mxf_decrypt_triplet(AVFormatContext *s, AVPacket *pkt, KLVPacket *klv)
328 {
329     static const uint8_t checkv[16] = {0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b};
330     MXFContext *mxf = s->priv_data;
331     AVIOContext *pb = s->pb;
332     int64_t end = avio_tell(pb) + klv->length;
333     int64_t size;
334     uint64_t orig_size;
335     uint64_t plaintext_size;
336     uint8_t ivec[16];
337     uint8_t tmpbuf[16];
338     int index;
339
340     if (!mxf->aesc && s->key && s->keylen == 16) {
341         mxf->aesc = av_malloc(av_aes_size);
342         if (!mxf->aesc)
343             return AVERROR(ENOMEM);
344         av_aes_init(mxf->aesc, s->key, 128, 1);
345     }
346     // crypto context
347     avio_skip(pb, klv_decode_ber_length(pb));
348     // plaintext offset
349     klv_decode_ber_length(pb);
350     plaintext_size = avio_rb64(pb);
351     // source klv key
352     klv_decode_ber_length(pb);
353     avio_read(pb, klv->key, 16);
354     if (!IS_KLV_KEY(klv, mxf_essence_element_key))
355         return AVERROR_INVALIDDATA;
356     index = mxf_get_stream_index(s, klv);
357     if (index < 0)
358         return AVERROR_INVALIDDATA;
359     // source size
360     klv_decode_ber_length(pb);
361     orig_size = avio_rb64(pb);
362     if (orig_size < plaintext_size)
363         return AVERROR_INVALIDDATA;
364     // enc. code
365     size = klv_decode_ber_length(pb);
366     if (size < 32 || size - 32 < orig_size)
367         return AVERROR_INVALIDDATA;
368     avio_read(pb, ivec, 16);
369     avio_read(pb, tmpbuf, 16);
370     if (mxf->aesc)
371         av_aes_crypt(mxf->aesc, tmpbuf, tmpbuf, 1, ivec, 1);
372     if (memcmp(tmpbuf, checkv, 16))
373         av_log(s, AV_LOG_ERROR, "probably incorrect decryption key\n");
374     size -= 32;
375     size = av_get_packet(pb, pkt, size);
376     if (size < 0)
377         return size;
378     else if (size < plaintext_size)
379         return AVERROR_INVALIDDATA;
380     size -= plaintext_size;
381     if (mxf->aesc)
382         av_aes_crypt(mxf->aesc, &pkt->data[plaintext_size],
383                      &pkt->data[plaintext_size], size >> 4, ivec, 1);
384     av_shrink_packet(pkt, orig_size);
385     pkt->stream_index = index;
386     avio_skip(pb, end - avio_tell(pb));
387     return 0;
388 }
389
390 static int mxf_read_primer_pack(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
391 {
392     MXFContext *mxf = arg;
393     int item_num = avio_rb32(pb);
394     int item_len = avio_rb32(pb);
395
396     if (item_len != 18) {
397         av_log_ask_for_sample(pb, "unsupported primer pack item length %d\n",
398                               item_len);
399         return AVERROR_PATCHWELCOME;
400     }
401     if (item_num > UINT_MAX / item_len)
402         return AVERROR_INVALIDDATA;
403     mxf->local_tags_count = item_num;
404     mxf->local_tags = av_malloc(item_num*item_len);
405     if (!mxf->local_tags)
406         return AVERROR(ENOMEM);
407     avio_read(pb, mxf->local_tags, item_num*item_len);
408     return 0;
409 }
410
411 static int mxf_read_partition_pack(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
412 {
413     MXFContext *mxf = arg;
414     MXFPartition *partition, *tmp_part;
415     UID op;
416     uint64_t footer_partition;
417     uint32_t nb_essence_containers;
418
419     if (mxf->partitions_count+1 >= UINT_MAX / sizeof(*mxf->partitions))
420         return AVERROR(ENOMEM);
421
422     tmp_part = av_realloc(mxf->partitions, (mxf->partitions_count + 1) * sizeof(*mxf->partitions));
423     if (!tmp_part)
424         return AVERROR(ENOMEM);
425     mxf->partitions = tmp_part;
426
427     if (mxf->parsing_backward) {
428         /* insert the new partition pack in the middle
429          * this makes the entries in mxf->partitions sorted by offset */
430         memmove(&mxf->partitions[mxf->last_forward_partition+1],
431                 &mxf->partitions[mxf->last_forward_partition],
432                 (mxf->partitions_count - mxf->last_forward_partition)*sizeof(*mxf->partitions));
433         partition = mxf->current_partition = &mxf->partitions[mxf->last_forward_partition];
434     } else {
435         mxf->last_forward_partition++;
436         partition = mxf->current_partition = &mxf->partitions[mxf->partitions_count];
437     }
438
439     memset(partition, 0, sizeof(*partition));
440     mxf->partitions_count++;
441     partition->pack_length = avio_tell(pb) - klv_offset + size;
442
443     switch(uid[13]) {
444     case 2:
445         partition->type = Header;
446         break;
447     case 3:
448         partition->type = BodyPartition;
449         break;
450     case 4:
451         partition->type = Footer;
452         break;
453     default:
454         av_log(mxf->fc, AV_LOG_ERROR, "unknown partition type %i\n", uid[13]);
455         return AVERROR_INVALIDDATA;
456     }
457
458     /* consider both footers to be closed (there is only Footer and CompleteFooter) */
459     partition->closed = partition->type == Footer || !(uid[14] & 1);
460     partition->complete = uid[14] > 2;
461     avio_skip(pb, 4);
462     partition->kag_size = avio_rb32(pb);
463     partition->this_partition = avio_rb64(pb);
464     partition->previous_partition = avio_rb64(pb);
465     footer_partition = avio_rb64(pb);
466     partition->header_byte_count = avio_rb64(pb);
467     partition->index_byte_count = avio_rb64(pb);
468     partition->index_sid = avio_rb32(pb);
469     avio_skip(pb, 8);
470     partition->body_sid = avio_rb32(pb);
471     avio_read(pb, op, sizeof(UID));
472     nb_essence_containers = avio_rb32(pb);
473
474     /* some files don'thave FooterPartition set in every partition */
475     if (footer_partition) {
476         if (mxf->footer_partition && mxf->footer_partition != footer_partition) {
477             av_log(mxf->fc, AV_LOG_ERROR,
478                    "inconsistent FooterPartition value: %"PRIu64" != %"PRIu64"\n",
479                    mxf->footer_partition, footer_partition);
480         } else {
481             mxf->footer_partition = footer_partition;
482         }
483     }
484
485     av_dlog(mxf->fc,
486             "PartitionPack: ThisPartition = 0x%"PRIX64
487             ", PreviousPartition = 0x%"PRIX64", "
488             "FooterPartition = 0x%"PRIX64", IndexSID = %i, BodySID = %i\n",
489             partition->this_partition,
490             partition->previous_partition, footer_partition,
491             partition->index_sid, partition->body_sid);
492
493     /* sanity check PreviousPartition if set */
494     if (partition->previous_partition &&
495         mxf->run_in + partition->previous_partition >= klv_offset) {
496         av_log(mxf->fc, AV_LOG_ERROR,
497                "PreviousPartition points to this partition or forward\n");
498         return AVERROR_INVALIDDATA;
499     }
500
501     if      (op[12] == 1 && op[13] == 1) mxf->op = OP1a;
502     else if (op[12] == 1 && op[13] == 2) mxf->op = OP1b;
503     else if (op[12] == 1 && op[13] == 3) mxf->op = OP1c;
504     else if (op[12] == 2 && op[13] == 1) mxf->op = OP2a;
505     else if (op[12] == 2 && op[13] == 2) mxf->op = OP2b;
506     else if (op[12] == 2 && op[13] == 3) mxf->op = OP2c;
507     else if (op[12] == 3 && op[13] == 1) mxf->op = OP3a;
508     else if (op[12] == 3 && op[13] == 2) mxf->op = OP3b;
509     else if (op[12] == 3 && op[13] == 3) mxf->op = OP3c;
510     else if (op[12] == 64&& op[13] == 1) mxf->op = OPSONYOpt;
511     else if (op[12] == 0x10) {
512         /* SMPTE 390m: "There shall be exactly one essence container"
513          * 2011_DCPTEST_24FPS.V.mxf violates this and is frame wrapped, hence why we assume OP1a */
514         if (nb_essence_containers != 1) {
515             /* only nag once */
516             if (!mxf->op)
517                 av_log(mxf->fc, AV_LOG_WARNING, "\"OPAtom\" with %u ECs - assuming OP1a\n", nb_essence_containers);
518
519             mxf->op = OP1a;
520         } else
521             mxf->op = OPAtom;
522     } else {
523         av_log(mxf->fc, AV_LOG_ERROR, "unknown operational pattern: %02xh %02xh - guessing OP1a\n", op[12], op[13]);
524         mxf->op = OP1a;
525     }
526
527     if (partition->kag_size <= 0 || partition->kag_size > (1 << 20)) {
528         av_log(mxf->fc, AV_LOG_WARNING, "invalid KAGSize %i - guessing ", partition->kag_size);
529
530         if (mxf->op == OPSONYOpt)
531             partition->kag_size = 512;
532         else
533             partition->kag_size = 1;
534
535         av_log(mxf->fc, AV_LOG_WARNING, "%i\n", partition->kag_size);
536     }
537
538     return 0;
539 }
540
541 static int mxf_add_metadata_set(MXFContext *mxf, void *metadata_set)
542 {
543     MXFMetadataSet **tmp;
544     if (mxf->metadata_sets_count+1 >= UINT_MAX / sizeof(*mxf->metadata_sets))
545         return AVERROR(ENOMEM);
546     tmp = av_realloc(mxf->metadata_sets, (mxf->metadata_sets_count + 1) * sizeof(*mxf->metadata_sets));
547     if (!tmp)
548         return AVERROR(ENOMEM);
549     mxf->metadata_sets = tmp;
550     mxf->metadata_sets[mxf->metadata_sets_count] = metadata_set;
551     mxf->metadata_sets_count++;
552     return 0;
553 }
554
555 static int mxf_read_cryptographic_context(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
556 {
557     MXFCryptoContext *cryptocontext = arg;
558     if (size != 16)
559         return AVERROR_INVALIDDATA;
560     if (IS_KLV_KEY(uid, mxf_crypto_source_container_ul))
561         avio_read(pb, cryptocontext->source_container_ul, 16);
562     return 0;
563 }
564
565 static int mxf_read_content_storage(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
566 {
567     MXFContext *mxf = arg;
568     switch (tag) {
569     case 0x1901:
570         mxf->packages_count = avio_rb32(pb);
571         if (mxf->packages_count >= UINT_MAX / sizeof(UID))
572             return AVERROR_INVALIDDATA;
573         mxf->packages_refs = av_malloc(mxf->packages_count * sizeof(UID));
574         if (!mxf->packages_refs)
575             return AVERROR(ENOMEM);
576         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
577         avio_read(pb, (uint8_t *)mxf->packages_refs, mxf->packages_count * sizeof(UID));
578         break;
579     }
580     return 0;
581 }
582
583 static int mxf_read_source_clip(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
584 {
585     MXFStructuralComponent *source_clip = arg;
586     switch(tag) {
587     case 0x0202:
588         source_clip->duration = avio_rb64(pb);
589         break;
590     case 0x1201:
591         source_clip->start_position = avio_rb64(pb);
592         break;
593     case 0x1101:
594         /* UMID, only get last 16 bytes */
595         avio_skip(pb, 16);
596         avio_read(pb, source_clip->source_package_uid, 16);
597         break;
598     case 0x1102:
599         source_clip->source_track_id = avio_rb32(pb);
600         break;
601     }
602     return 0;
603 }
604
605 static int mxf_read_material_package(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
606 {
607     MXFPackage *package = arg;
608     switch(tag) {
609     case 0x4403:
610         package->tracks_count = avio_rb32(pb);
611         if (package->tracks_count >= UINT_MAX / sizeof(UID))
612             return AVERROR_INVALIDDATA;
613         package->tracks_refs = av_malloc(package->tracks_count * sizeof(UID));
614         if (!package->tracks_refs)
615             return AVERROR(ENOMEM);
616         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
617         avio_read(pb, (uint8_t *)package->tracks_refs, package->tracks_count * sizeof(UID));
618         break;
619     }
620     return 0;
621 }
622
623 static int mxf_read_track(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
624 {
625     MXFTrack *track = arg;
626     switch(tag) {
627     case 0x4801:
628         track->track_id = avio_rb32(pb);
629         break;
630     case 0x4804:
631         avio_read(pb, track->track_number, 4);
632         break;
633     case 0x4B01:
634         track->edit_rate.num = avio_rb32(pb);
635         track->edit_rate.den = avio_rb32(pb);
636         break;
637     case 0x4803:
638         avio_read(pb, track->sequence_ref, 16);
639         break;
640     }
641     return 0;
642 }
643
644 static int mxf_read_sequence(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
645 {
646     MXFSequence *sequence = arg;
647     switch(tag) {
648     case 0x0202:
649         sequence->duration = avio_rb64(pb);
650         break;
651     case 0x0201:
652         avio_read(pb, sequence->data_definition_ul, 16);
653         break;
654     case 0x1001:
655         sequence->structural_components_count = avio_rb32(pb);
656         if (sequence->structural_components_count >= UINT_MAX / sizeof(UID))
657             return AVERROR_INVALIDDATA;
658         sequence->structural_components_refs = av_malloc(sequence->structural_components_count * sizeof(UID));
659         if (!sequence->structural_components_refs)
660             return AVERROR(ENOMEM);
661         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
662         avio_read(pb, (uint8_t *)sequence->structural_components_refs, sequence->structural_components_count * sizeof(UID));
663         break;
664     }
665     return 0;
666 }
667
668 static int mxf_read_source_package(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
669 {
670     MXFPackage *package = arg;
671     switch(tag) {
672     case 0x4403:
673         package->tracks_count = avio_rb32(pb);
674         if (package->tracks_count >= UINT_MAX / sizeof(UID))
675             return AVERROR_INVALIDDATA;
676         package->tracks_refs = av_malloc(package->tracks_count * sizeof(UID));
677         if (!package->tracks_refs)
678             return AVERROR(ENOMEM);
679         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
680         avio_read(pb, (uint8_t *)package->tracks_refs, package->tracks_count * sizeof(UID));
681         break;
682     case 0x4401:
683         /* UMID, only get last 16 bytes */
684         avio_skip(pb, 16);
685         avio_read(pb, package->package_uid, 16);
686         break;
687     case 0x4701:
688         avio_read(pb, package->descriptor_ref, 16);
689         break;
690     }
691     return 0;
692 }
693
694 static int mxf_read_index_entry_array(AVIOContext *pb, MXFIndexTableSegment *segment)
695 {
696     int i, length;
697
698     segment->nb_index_entries = avio_rb32(pb);
699     length = avio_rb32(pb);
700
701     if (!(segment->temporal_offset_entries=av_calloc(segment->nb_index_entries, sizeof(*segment->temporal_offset_entries))) ||
702         !(segment->flag_entries          = av_calloc(segment->nb_index_entries, sizeof(*segment->flag_entries))) ||
703         !(segment->stream_offset_entries = av_calloc(segment->nb_index_entries, sizeof(*segment->stream_offset_entries))))
704         return AVERROR(ENOMEM);
705
706     for (i = 0; i < segment->nb_index_entries; i++) {
707         segment->temporal_offset_entries[i] = avio_r8(pb);
708         avio_r8(pb);                                        /* KeyFrameOffset */
709         segment->flag_entries[i] = avio_r8(pb);
710         segment->stream_offset_entries[i] = avio_rb64(pb);
711         avio_skip(pb, length - 11);
712     }
713     return 0;
714 }
715
716 static int mxf_read_index_table_segment(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
717 {
718     MXFIndexTableSegment *segment = arg;
719     switch(tag) {
720     case 0x3F05:
721         segment->edit_unit_byte_count = avio_rb32(pb);
722         av_dlog(NULL, "EditUnitByteCount %d\n", segment->edit_unit_byte_count);
723         break;
724     case 0x3F06:
725         segment->index_sid = avio_rb32(pb);
726         av_dlog(NULL, "IndexSID %d\n", segment->index_sid);
727         break;
728     case 0x3F07:
729         segment->body_sid = avio_rb32(pb);
730         av_dlog(NULL, "BodySID %d\n", segment->body_sid);
731         break;
732     case 0x3F0A:
733         av_dlog(NULL, "IndexEntryArray found\n");
734         return mxf_read_index_entry_array(pb, segment);
735     case 0x3F0B:
736         segment->index_edit_rate.num = avio_rb32(pb);
737         segment->index_edit_rate.den = avio_rb32(pb);
738         av_dlog(NULL, "IndexEditRate %d/%d\n", segment->index_edit_rate.num,
739                 segment->index_edit_rate.den);
740         break;
741     case 0x3F0C:
742         segment->index_start_position = avio_rb64(pb);
743         av_dlog(NULL, "IndexStartPosition %"PRId64"\n", segment->index_start_position);
744         break;
745     case 0x3F0D:
746         segment->index_duration = avio_rb64(pb);
747         av_dlog(NULL, "IndexDuration %"PRId64"\n", segment->index_duration);
748         break;
749     }
750     return 0;
751 }
752
753 static void mxf_read_pixel_layout(AVIOContext *pb, MXFDescriptor *descriptor)
754 {
755     int code, value, ofs = 0;
756     char layout[16] = {0};
757
758     do {
759         code = avio_r8(pb);
760         value = avio_r8(pb);
761         av_dlog(NULL, "pixel layout: code %#x\n", code);
762
763         if (ofs < 16) {
764             layout[ofs++] = code;
765             layout[ofs++] = value;
766         }
767     } while (code != 0); /* SMPTE 377M E.2.46 */
768
769     ff_mxf_decode_pixel_layout(layout, &descriptor->pix_fmt);
770 }
771
772 static int mxf_read_generic_descriptor(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
773 {
774     MXFDescriptor *descriptor = arg;
775     descriptor->pix_fmt = PIX_FMT_NONE;
776     switch(tag) {
777     case 0x3F01:
778         descriptor->sub_descriptors_count = avio_rb32(pb);
779         if (descriptor->sub_descriptors_count >= UINT_MAX / sizeof(UID))
780             return AVERROR_INVALIDDATA;
781         descriptor->sub_descriptors_refs = av_malloc(descriptor->sub_descriptors_count * sizeof(UID));
782         if (!descriptor->sub_descriptors_refs)
783             return AVERROR(ENOMEM);
784         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
785         avio_read(pb, (uint8_t *)descriptor->sub_descriptors_refs, descriptor->sub_descriptors_count * sizeof(UID));
786         break;
787     case 0x3004:
788         avio_read(pb, descriptor->essence_container_ul, 16);
789         break;
790     case 0x3006:
791         descriptor->linked_track_id = avio_rb32(pb);
792         break;
793     case 0x3201: /* PictureEssenceCoding */
794         avio_read(pb, descriptor->essence_codec_ul, 16);
795         break;
796     case 0x3203:
797         descriptor->width = avio_rb32(pb);
798         break;
799     case 0x3202:
800         descriptor->height = avio_rb32(pb);
801         break;
802     case 0x320E:
803         descriptor->aspect_ratio.num = avio_rb32(pb);
804         descriptor->aspect_ratio.den = avio_rb32(pb);
805         break;
806     case 0x3301:
807         descriptor->component_depth = avio_rb32(pb);
808         break;
809     case 0x3302:
810         descriptor->horiz_subsampling = avio_rb32(pb);
811         break;
812     case 0x3308:
813         descriptor->vert_subsampling = avio_rb32(pb);
814         break;
815     case 0x3D03:
816         descriptor->sample_rate.num = avio_rb32(pb);
817         descriptor->sample_rate.den = avio_rb32(pb);
818         break;
819     case 0x3D06: /* SoundEssenceCompression */
820         avio_read(pb, descriptor->essence_codec_ul, 16);
821         break;
822     case 0x3D07:
823         descriptor->channels = avio_rb32(pb);
824         break;
825     case 0x3D01:
826         descriptor->bits_per_sample = avio_rb32(pb);
827         break;
828     case 0x3401:
829         mxf_read_pixel_layout(pb, descriptor);
830         break;
831     default:
832         /* Private uid used by SONY C0023S01.mxf */
833         if (IS_KLV_KEY(uid, mxf_sony_mpeg4_extradata)) {
834             descriptor->extradata = av_malloc(size + FF_INPUT_BUFFER_PADDING_SIZE);
835             if (!descriptor->extradata)
836                 return AVERROR(ENOMEM);
837             descriptor->extradata_size = size;
838             avio_read(pb, descriptor->extradata, size);
839         }
840         break;
841     }
842     return 0;
843 }
844
845 /*
846  * Match an uid independently of the version byte and up to len common bytes
847  * Returns: boolean
848  */
849 static int mxf_match_uid(const UID key, const UID uid, int len)
850 {
851     int i;
852     for (i = 0; i < len; i++) {
853         if (i != 7 && key[i] != uid[i])
854             return 0;
855     }
856     return 1;
857 }
858
859 static const MXFCodecUL *mxf_get_codec_ul(const MXFCodecUL *uls, UID *uid)
860 {
861     while (uls->uid[0]) {
862         if(mxf_match_uid(uls->uid, *uid, uls->matching_len))
863             break;
864         uls++;
865     }
866     return uls;
867 }
868
869 static void *mxf_resolve_strong_ref(MXFContext *mxf, UID *strong_ref, enum MXFMetadataSetType type)
870 {
871     int i;
872
873     if (!strong_ref)
874         return NULL;
875     for (i = 0; i < mxf->metadata_sets_count; i++) {
876         if (!memcmp(*strong_ref, mxf->metadata_sets[i]->uid, 16) &&
877             (type == AnyType || mxf->metadata_sets[i]->type == type)) {
878             return mxf->metadata_sets[i];
879         }
880     }
881     return NULL;
882 }
883
884 static const MXFCodecUL mxf_picture_essence_container_uls[] = {
885     // video essence container uls
886     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x02,0x0D,0x01,0x03,0x01,0x02,0x04,0x60,0x01 }, 14, CODEC_ID_MPEG2VIDEO }, /* MPEG-ES Frame wrapped */
887     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x01,0x0D,0x01,0x03,0x01,0x02,0x02,0x41,0x01 }, 14,    CODEC_ID_DVVIDEO }, /* DV 625 25mbps */
888     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x01,0x0D,0x01,0x03,0x01,0x02,0x05,0x00,0x00 }, 14,   CODEC_ID_RAWVIDEO }, /* Uncompressed Picture */
889     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 },  0,      CODEC_ID_NONE },
890 };
891 static const MXFCodecUL mxf_sound_essence_container_uls[] = {
892     // sound essence container uls
893     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x01,0x0D,0x01,0x03,0x01,0x02,0x06,0x01,0x00 }, 14, CODEC_ID_PCM_S16LE }, /* BWF Frame wrapped */
894     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x02,0x0D,0x01,0x03,0x01,0x02,0x04,0x40,0x01 }, 14,       CODEC_ID_MP2 }, /* MPEG-ES Frame wrapped, 0x40 ??? stream id */
895     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x01,0x0D,0x01,0x03,0x01,0x02,0x01,0x01,0x01 }, 14, CODEC_ID_PCM_S16LE }, /* D-10 Mapping 50Mbps PAL Extended Template */
896     { { 0x06,0x0E,0x2B,0x34,0x01,0x01,0x01,0xFF,0x4B,0x46,0x41,0x41,0x00,0x0D,0x4D,0x4F }, 14, CODEC_ID_PCM_S16LE }, /* 0001GL00.MXF.A1.mxf_opatom.mxf */
897     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 },  0,      CODEC_ID_NONE },
898 };
899
900 static int mxf_get_sorted_table_segments(MXFContext *mxf, int *nb_sorted_segments, MXFIndexTableSegment ***sorted_segments)
901 {
902     int i, j, nb_segments = 0;
903     MXFIndexTableSegment **unsorted_segments;
904     int last_body_sid = -1, last_index_sid = -1, last_index_start = -1;
905
906     /* count number of segments, allocate arrays and copy unsorted segments */
907     for (i = 0; i < mxf->metadata_sets_count; i++)
908         if (mxf->metadata_sets[i]->type == IndexTableSegment)
909             nb_segments++;
910
911     if (!(unsorted_segments = av_calloc(nb_segments, sizeof(*unsorted_segments))) ||
912         !(*sorted_segments  = av_calloc(nb_segments, sizeof(**sorted_segments)))) {
913         av_freep(sorted_segments);
914         av_free(unsorted_segments);
915         return AVERROR(ENOMEM);
916     }
917
918     for (i = j = 0; i < mxf->metadata_sets_count; i++)
919         if (mxf->metadata_sets[i]->type == IndexTableSegment)
920             unsorted_segments[j++] = (MXFIndexTableSegment*)mxf->metadata_sets[i];
921
922     *nb_sorted_segments = 0;
923
924     /* sort segments by {BodySID, IndexSID, IndexStartPosition}, remove duplicates while we're at it */
925     for (i = 0; i < nb_segments; i++) {
926         int best = -1, best_body_sid = -1, best_index_sid = -1, best_index_start = -1;
927
928         for (j = 0; j < nb_segments; j++) {
929             MXFIndexTableSegment *s = unsorted_segments[j];
930
931             /* Require larger BosySID, IndexSID or IndexStartPosition then the previous entry. This removes duplicates.
932              * We want the smallest values for the keys than what we currently have, unless this is the first such entry this time around.
933              */
934             if ((i == 0     || s->body_sid > last_body_sid || s->index_sid > last_index_sid || s->index_start_position > last_index_start) &&
935                 (best == -1 || s->body_sid < best_body_sid || s->index_sid < best_index_sid || s->index_start_position < best_index_start)) {
936                 best             = j;
937                 best_body_sid    = s->body_sid;
938                 best_index_sid   = s->index_sid;
939                 best_index_start = s->index_start_position;
940             }
941         }
942
943         /* no suitable entry found -> we're done */
944         if (best == -1)
945             break;
946
947         (*sorted_segments)[(*nb_sorted_segments)++] = unsorted_segments[best];
948         last_body_sid    = best_body_sid;
949         last_index_sid   = best_index_sid;
950         last_index_start = best_index_start;
951     }
952
953     av_free(unsorted_segments);
954
955     return 0;
956 }
957
958 /**
959  * Computes the absolute file offset of the given essence container offset
960  */
961 static int mxf_absolute_bodysid_offset(MXFContext *mxf, int body_sid, int64_t offset, int64_t *offset_out)
962 {
963     int x;
964     int64_t offset_in = offset;     /* for logging */
965
966     for (x = 0; x < mxf->partitions_count; x++) {
967         MXFPartition *p = &mxf->partitions[x];
968
969         if (p->body_sid != body_sid)
970             continue;
971
972         if (offset < p->essence_length || !p->essence_length) {
973             *offset_out = p->essence_offset + offset;
974             return 0;
975         }
976
977         offset -= p->essence_length;
978     }
979
980     av_log(mxf->fc, AV_LOG_ERROR,
981            "failed to find absolute offset of %"PRIX64" in BodySID %i - partial file?\n",
982            offset_in, body_sid);
983
984     return AVERROR_INVALIDDATA;
985 }
986
987 /**
988  * Returns the end position of the essence container with given BodySID, or zero if unknown
989  */
990 static int64_t mxf_essence_container_end(MXFContext *mxf, int body_sid)
991 {
992     int x;
993     int64_t ret = 0;
994
995     for (x = 0; x < mxf->partitions_count; x++) {
996         MXFPartition *p = &mxf->partitions[x];
997
998         if (p->body_sid != body_sid)
999             continue;
1000
1001         if (!p->essence_length)
1002             return 0;
1003
1004         ret = p->essence_offset + p->essence_length;
1005     }
1006
1007     return ret;
1008 }
1009
1010 /* EditUnit -> absolute offset */
1011 static int mxf_edit_unit_absolute_offset(MXFContext *mxf, MXFIndexTable *index_table, int64_t edit_unit, int64_t *edit_unit_out, int64_t *offset_out, int nag)
1012 {
1013     int i;
1014     int64_t offset_temp = 0;
1015
1016     for (i = 0; i < index_table->nb_segments; i++) {
1017         MXFIndexTableSegment *s = index_table->segments[i];
1018
1019         edit_unit = FFMAX(edit_unit, s->index_start_position);  /* clamp if trying to seek before start */
1020
1021         if (edit_unit < s->index_start_position + s->index_duration) {
1022             int64_t index = edit_unit - s->index_start_position;
1023
1024             if (s->edit_unit_byte_count)
1025                 offset_temp += s->edit_unit_byte_count * index;
1026             else if (s->nb_index_entries) {
1027                 if (s->nb_index_entries == 2 * s->index_duration + 1)
1028                     index *= 2;     /* Avid index */
1029
1030                 if (index < 0 || index > s->nb_index_entries) {
1031                     av_log(mxf->fc, AV_LOG_ERROR, "IndexSID %i segment at %"PRId64" IndexEntryArray too small\n",
1032                            index_table->index_sid, s->index_start_position);
1033                     return AVERROR_INVALIDDATA;
1034                 }
1035
1036                 offset_temp = s->stream_offset_entries[index];
1037             } else {
1038                 av_log(mxf->fc, AV_LOG_ERROR, "IndexSID %i segment at %"PRId64" missing EditUnitByteCount and IndexEntryArray\n",
1039                        index_table->index_sid, s->index_start_position);
1040                 return AVERROR_INVALIDDATA;
1041             }
1042
1043             if (edit_unit_out)
1044                 *edit_unit_out = edit_unit;
1045
1046             return mxf_absolute_bodysid_offset(mxf, index_table->body_sid, offset_temp, offset_out);
1047         } else {
1048             /* EditUnitByteCount == 0 for VBR indexes, which is fine since they use explicit StreamOffsets */
1049             offset_temp += s->edit_unit_byte_count * s->index_duration;
1050         }
1051     }
1052
1053     if (nag)
1054         av_log(mxf->fc, AV_LOG_ERROR, "failed to map EditUnit %"PRId64" in IndexSID %i to an offset\n", edit_unit, index_table->index_sid);
1055
1056     return AVERROR_INVALIDDATA;
1057 }
1058
1059 static int mxf_compute_ptses_fake_index(MXFContext *mxf, MXFIndexTable *index_table)
1060 {
1061     int i, j, x;
1062     int8_t max_temporal_offset = -128;
1063
1064     /* first compute how many entries we have */
1065     for (i = 0; i < index_table->nb_segments; i++) {
1066         MXFIndexTableSegment *s = index_table->segments[i];
1067
1068         if (!s->nb_index_entries) {
1069             index_table->nb_ptses = 0;
1070             return 0;                               /* no TemporalOffsets */
1071         }
1072
1073         index_table->nb_ptses += s->index_duration;
1074     }
1075
1076     /* paranoid check */
1077     if (index_table->nb_ptses <= 0)
1078         return 0;
1079
1080     if (!(index_table->ptses      = av_calloc(index_table->nb_ptses, sizeof(int64_t))) ||
1081         !(index_table->fake_index = av_calloc(index_table->nb_ptses, sizeof(AVIndexEntry)))) {
1082         av_freep(&index_table->ptses);
1083         return AVERROR(ENOMEM);
1084     }
1085
1086     /* we may have a few bad TemporalOffsets
1087      * make sure the corresponding PTSes don't have the bogus value 0 */
1088     for (x = 0; x < index_table->nb_ptses; x++)
1089         index_table->ptses[x] = AV_NOPTS_VALUE;
1090
1091     /**
1092      * We have this:
1093      *
1094      * x  TemporalOffset
1095      * 0:  0
1096      * 1:  1
1097      * 2:  1
1098      * 3: -2
1099      * 4:  1
1100      * 5:  1
1101      * 6: -2
1102      *
1103      * We want to transform it into this:
1104      *
1105      * x  DTS PTS
1106      * 0: -1   0
1107      * 1:  0   3
1108      * 2:  1   1
1109      * 3:  2   2
1110      * 4:  3   6
1111      * 5:  4   4
1112      * 6:  5   5
1113      *
1114      * We do this by bucket sorting x by x+TemporalOffset[x] into mxf->ptses,
1115      * then settings mxf->first_dts = -max(TemporalOffset[x]).
1116      * The latter makes DTS <= PTS.
1117      */
1118     for (i = x = 0; i < index_table->nb_segments; i++) {
1119         MXFIndexTableSegment *s = index_table->segments[i];
1120         int index_delta = 1;
1121         int n = s->nb_index_entries;
1122
1123         if (s->nb_index_entries == 2 * s->index_duration + 1) {
1124             index_delta = 2;    /* Avid index */
1125             /* ignore the last entry - it's the size of the essence container */
1126             n--;
1127         }
1128
1129         for (j = 0; j < n; j += index_delta, x++) {
1130             int offset = s->temporal_offset_entries[j] / index_delta;
1131             int index  = x + offset;
1132
1133             if (x >= index_table->nb_ptses) {
1134                 av_log(mxf->fc, AV_LOG_ERROR,
1135                        "x >= nb_ptses - IndexEntryCount %i < IndexDuration %"PRId64"?\n",
1136                        s->nb_index_entries, s->index_duration);
1137                 break;
1138             }
1139
1140             index_table->fake_index[x].timestamp = x;
1141             index_table->fake_index[x].flags = !(s->flag_entries[j] & 0x30) ? AVINDEX_KEYFRAME : 0;
1142
1143             if (index < 0 || index >= index_table->nb_ptses) {
1144                 av_log(mxf->fc, AV_LOG_ERROR,
1145                        "index entry %i + TemporalOffset %i = %i, which is out of bounds\n",
1146                        x, offset, index);
1147                 continue;
1148             }
1149
1150             index_table->ptses[index] = x;
1151             max_temporal_offset = FFMAX(max_temporal_offset, offset);
1152         }
1153     }
1154
1155     index_table->first_dts = -max_temporal_offset;
1156
1157     return 0;
1158 }
1159
1160 /**
1161  * Sorts and collects index table segments into index tables.
1162  * Also computes PTSes if possible.
1163  */
1164 static int mxf_compute_index_tables(MXFContext *mxf)
1165 {
1166     int i, j, k, ret, nb_sorted_segments;
1167     MXFIndexTableSegment **sorted_segments = NULL;
1168
1169     if ((ret = mxf_get_sorted_table_segments(mxf, &nb_sorted_segments, &sorted_segments)) ||
1170         nb_sorted_segments <= 0) {
1171         av_log(mxf->fc, AV_LOG_WARNING, "broken or empty index\n");
1172         return 0;
1173     }
1174
1175     /* sanity check and count unique BodySIDs/IndexSIDs */
1176     for (i = 0; i < nb_sorted_segments; i++) {
1177         if (i == 0 || sorted_segments[i-1]->index_sid != sorted_segments[i]->index_sid)
1178             mxf->nb_index_tables++;
1179         else if (sorted_segments[i-1]->body_sid != sorted_segments[i]->body_sid) {
1180             av_log(mxf->fc, AV_LOG_ERROR, "found inconsistent BodySID\n");
1181             ret = AVERROR_INVALIDDATA;
1182             goto finish_decoding_index;
1183         }
1184     }
1185
1186     if (!(mxf->index_tables = av_calloc(mxf->nb_index_tables, sizeof(MXFIndexTable)))) {
1187         av_log(mxf->fc, AV_LOG_ERROR, "failed to allocate index tables\n");
1188         ret = AVERROR(ENOMEM);
1189         goto finish_decoding_index;
1190     }
1191
1192     /* distribute sorted segments to index tables */
1193     for (i = j = 0; i < nb_sorted_segments; i++) {
1194         if (i != 0 && sorted_segments[i-1]->index_sid != sorted_segments[i]->index_sid) {
1195             /* next IndexSID */
1196             j++;
1197         }
1198
1199         mxf->index_tables[j].nb_segments++;
1200     }
1201
1202     for (i = j = 0; j < mxf->nb_index_tables; i += mxf->index_tables[j++].nb_segments) {
1203         MXFIndexTable *t = &mxf->index_tables[j];
1204
1205         if (!(t->segments = av_calloc(t->nb_segments, sizeof(MXFIndexTableSegment*)))) {
1206             av_log(mxf->fc, AV_LOG_ERROR, "failed to allocate IndexTableSegment pointer array\n");
1207             ret = AVERROR(ENOMEM);
1208             goto finish_decoding_index;
1209         }
1210
1211         if (sorted_segments[i]->index_start_position)
1212             av_log(mxf->fc, AV_LOG_WARNING, "IndexSID %i starts at EditUnit %"PRId64" - seeking may not work as expected\n",
1213                    sorted_segments[i]->index_sid, sorted_segments[i]->index_start_position);
1214
1215         memcpy(t->segments, &sorted_segments[i], t->nb_segments * sizeof(MXFIndexTableSegment*));
1216         t->index_sid = sorted_segments[i]->index_sid;
1217         t->body_sid = sorted_segments[i]->body_sid;
1218
1219         if ((ret = mxf_compute_ptses_fake_index(mxf, t)) < 0)
1220             goto finish_decoding_index;
1221
1222         /* fix zero IndexDurations */
1223         for (k = 0; k < t->nb_segments; k++) {
1224             if (t->segments[k]->index_duration)
1225                 continue;
1226
1227             if (t->nb_segments > 1)
1228                 av_log(mxf->fc, AV_LOG_WARNING, "IndexSID %i segment %i has zero IndexDuration and there's more than one segment\n",
1229                        t->index_sid, k);
1230
1231             if (mxf->fc->nb_streams <= 0) {
1232                 av_log(mxf->fc, AV_LOG_WARNING, "no streams?\n");
1233                 break;
1234             }
1235
1236             /* assume the first stream's duration is reasonable
1237              * leave index_duration = 0 on further segments in case we have any (unlikely)
1238              */
1239             t->segments[k]->index_duration = mxf->fc->streams[0]->duration;
1240             break;
1241         }
1242     }
1243
1244     ret = 0;
1245 finish_decoding_index:
1246     av_free(sorted_segments);
1247     return ret;
1248 }
1249
1250 static int mxf_parse_structural_metadata(MXFContext *mxf)
1251 {
1252     MXFPackage *material_package = NULL;
1253     MXFPackage *temp_package = NULL;
1254     int i, j, k, ret;
1255
1256     av_dlog(mxf->fc, "metadata sets count %d\n", mxf->metadata_sets_count);
1257     /* TODO: handle multiple material packages (OP3x) */
1258     for (i = 0; i < mxf->packages_count; i++) {
1259         material_package = mxf_resolve_strong_ref(mxf, &mxf->packages_refs[i], MaterialPackage);
1260         if (material_package) break;
1261     }
1262     if (!material_package) {
1263         av_log(mxf->fc, AV_LOG_ERROR, "no material package found\n");
1264         return AVERROR_INVALIDDATA;
1265     }
1266
1267     for (i = 0; i < material_package->tracks_count; i++) {
1268         MXFPackage *source_package = NULL;
1269         MXFTrack *material_track = NULL;
1270         MXFTrack *source_track = NULL;
1271         MXFTrack *temp_track = NULL;
1272         MXFDescriptor *descriptor = NULL;
1273         MXFStructuralComponent *component = NULL;
1274         UID *essence_container_ul = NULL;
1275         const MXFCodecUL *codec_ul = NULL;
1276         const MXFCodecUL *container_ul = NULL;
1277         const MXFCodecUL *pix_fmt_ul = NULL;
1278         AVStream *st;
1279
1280         if (!(material_track = mxf_resolve_strong_ref(mxf, &material_package->tracks_refs[i], Track))) {
1281             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve material track strong ref\n");
1282             continue;
1283         }
1284
1285         if (!(material_track->sequence = mxf_resolve_strong_ref(mxf, &material_track->sequence_ref, Sequence))) {
1286             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve material track sequence strong ref\n");
1287             continue;
1288         }
1289
1290         /* TODO: handle multiple source clips */
1291         for (j = 0; j < material_track->sequence->structural_components_count; j++) {
1292             /* TODO: handle timecode component */
1293             component = mxf_resolve_strong_ref(mxf, &material_track->sequence->structural_components_refs[j], SourceClip);
1294             if (!component)
1295                 continue;
1296
1297             for (k = 0; k < mxf->packages_count; k++) {
1298                 temp_package = mxf_resolve_strong_ref(mxf, &mxf->packages_refs[k], SourcePackage);
1299                 if (!temp_package)
1300                     continue;
1301                 if (!memcmp(temp_package->package_uid, component->source_package_uid, 16)) {
1302                     source_package = temp_package;
1303                     break;
1304                 }
1305             }
1306             if (!source_package) {
1307                 av_dlog(mxf->fc, "material track %d: no corresponding source package found\n", material_track->track_id);
1308                 break;
1309             }
1310             for (k = 0; k < source_package->tracks_count; k++) {
1311                 if (!(temp_track = mxf_resolve_strong_ref(mxf, &source_package->tracks_refs[k], Track))) {
1312                     av_log(mxf->fc, AV_LOG_ERROR, "could not resolve source track strong ref\n");
1313                     ret = AVERROR_INVALIDDATA;
1314                     goto fail_and_free;
1315                 }
1316                 if (temp_track->track_id == component->source_track_id) {
1317                     source_track = temp_track;
1318                     break;
1319                 }
1320             }
1321             if (!source_track) {
1322                 av_log(mxf->fc, AV_LOG_ERROR, "material track %d: no corresponding source track found\n", material_track->track_id);
1323                 break;
1324             }
1325         }
1326         if (!source_track || !component)
1327             continue;
1328
1329         if (!(source_track->sequence = mxf_resolve_strong_ref(mxf, &source_track->sequence_ref, Sequence))) {
1330             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve source track sequence strong ref\n");
1331             ret = AVERROR_INVALIDDATA;
1332             goto fail_and_free;
1333         }
1334
1335         /* 0001GL00.MXF.A1.mxf_opatom.mxf has the same SourcePackageID as 0001GL.MXF.V1.mxf_opatom.mxf
1336          * This would result in both files appearing to have two streams. Work around this by sanity checking DataDefinition */
1337         if (memcmp(material_track->sequence->data_definition_ul, source_track->sequence->data_definition_ul, 16)) {
1338             av_log(mxf->fc, AV_LOG_ERROR, "material track %d: DataDefinition mismatch\n", material_track->track_id);
1339             continue;
1340         }
1341
1342         st = avformat_new_stream(mxf->fc, NULL);
1343         if (!st) {
1344             av_log(mxf->fc, AV_LOG_ERROR, "could not allocate stream\n");
1345             ret = AVERROR(ENOMEM);
1346             goto fail_and_free;
1347         }
1348         st->id = source_track->track_id;
1349         st->priv_data = source_track;
1350         st->duration = component->duration;
1351         if (st->duration == -1)
1352             st->duration = AV_NOPTS_VALUE;
1353         st->start_time = component->start_position;
1354         avpriv_set_pts_info(st, 64, material_track->edit_rate.den, material_track->edit_rate.num);
1355
1356         PRINT_KEY(mxf->fc, "data definition   ul", source_track->sequence->data_definition_ul);
1357         codec_ul = mxf_get_codec_ul(ff_mxf_data_definition_uls, &source_track->sequence->data_definition_ul);
1358         st->codec->codec_type = codec_ul->id;
1359
1360         source_package->descriptor = mxf_resolve_strong_ref(mxf, &source_package->descriptor_ref, AnyType);
1361         if (source_package->descriptor) {
1362             if (source_package->descriptor->type == MultipleDescriptor) {
1363                 for (j = 0; j < source_package->descriptor->sub_descriptors_count; j++) {
1364                     MXFDescriptor *sub_descriptor = mxf_resolve_strong_ref(mxf, &source_package->descriptor->sub_descriptors_refs[j], Descriptor);
1365
1366                     if (!sub_descriptor) {
1367                         av_log(mxf->fc, AV_LOG_ERROR, "could not resolve sub descriptor strong ref\n");
1368                         continue;
1369                     }
1370                     if (sub_descriptor->linked_track_id == source_track->track_id) {
1371                         descriptor = sub_descriptor;
1372                         break;
1373                     }
1374                 }
1375             } else if (source_package->descriptor->type == Descriptor)
1376                 descriptor = source_package->descriptor;
1377         }
1378         if (!descriptor) {
1379             av_log(mxf->fc, AV_LOG_INFO, "source track %d: stream %d, no descriptor found\n", source_track->track_id, st->index);
1380             continue;
1381         }
1382         PRINT_KEY(mxf->fc, "essence codec     ul", descriptor->essence_codec_ul);
1383         PRINT_KEY(mxf->fc, "essence container ul", descriptor->essence_container_ul);
1384         essence_container_ul = &descriptor->essence_container_ul;
1385         /* HACK: replacing the original key with mxf_encrypted_essence_container
1386          * is not allowed according to s429-6, try to find correct information anyway */
1387         if (IS_KLV_KEY(essence_container_ul, mxf_encrypted_essence_container)) {
1388             av_log(mxf->fc, AV_LOG_INFO, "broken encrypted mxf file\n");
1389             for (k = 0; k < mxf->metadata_sets_count; k++) {
1390                 MXFMetadataSet *metadata = mxf->metadata_sets[k];
1391                 if (metadata->type == CryptoContext) {
1392                     essence_container_ul = &((MXFCryptoContext *)metadata)->source_container_ul;
1393                     break;
1394                 }
1395             }
1396         }
1397
1398         /* TODO: drop PictureEssenceCoding and SoundEssenceCompression, only check EssenceContainer */
1399         codec_ul = mxf_get_codec_ul(ff_mxf_codec_uls, &descriptor->essence_codec_ul);
1400         st->codec->codec_id = codec_ul->id;
1401         if (descriptor->extradata) {
1402             st->codec->extradata = descriptor->extradata;
1403             st->codec->extradata_size = descriptor->extradata_size;
1404         }
1405         if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO) {
1406             container_ul = mxf_get_codec_ul(mxf_picture_essence_container_uls, essence_container_ul);
1407             if (st->codec->codec_id == CODEC_ID_NONE)
1408                 st->codec->codec_id = container_ul->id;
1409             st->codec->width = descriptor->width;
1410             st->codec->height = descriptor->height;
1411             if (st->codec->codec_id == CODEC_ID_RAWVIDEO) {
1412                 st->codec->pix_fmt = descriptor->pix_fmt;
1413                 if (st->codec->pix_fmt == PIX_FMT_NONE) {
1414                     pix_fmt_ul = mxf_get_codec_ul(ff_mxf_pixel_format_uls, &descriptor->essence_codec_ul);
1415                     st->codec->pix_fmt = pix_fmt_ul->id;
1416                     if (st->codec->pix_fmt == PIX_FMT_NONE) {
1417                         /* support files created before RP224v10 by defaulting to UYVY422
1418                            if subsampling is 4:2:2 and component depth is 8-bit */
1419                         if (descriptor->horiz_subsampling == 2 &&
1420                             descriptor->vert_subsampling == 1 &&
1421                             descriptor->component_depth == 8) {
1422                             st->codec->pix_fmt = PIX_FMT_UYVY422;
1423                         }
1424                     }
1425                 }
1426             }
1427             st->need_parsing = AVSTREAM_PARSE_HEADERS;
1428         } else if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
1429             container_ul = mxf_get_codec_ul(mxf_sound_essence_container_uls, essence_container_ul);
1430             if (st->codec->codec_id == CODEC_ID_NONE)
1431                 st->codec->codec_id = container_ul->id;
1432             st->codec->channels = descriptor->channels;
1433             st->codec->bits_per_coded_sample = descriptor->bits_per_sample;
1434
1435             if (descriptor->sample_rate.den > 0)
1436                 st->codec->sample_rate = descriptor->sample_rate.num / descriptor->sample_rate.den;
1437
1438             /* TODO: implement CODEC_ID_RAWAUDIO */
1439             if (st->codec->codec_id == CODEC_ID_PCM_S16LE) {
1440                 if (descriptor->bits_per_sample > 16 && descriptor->bits_per_sample <= 24)
1441                     st->codec->codec_id = CODEC_ID_PCM_S24LE;
1442                 else if (descriptor->bits_per_sample == 32)
1443                     st->codec->codec_id = CODEC_ID_PCM_S32LE;
1444             } else if (st->codec->codec_id == CODEC_ID_PCM_S16BE) {
1445                 if (descriptor->bits_per_sample > 16 && descriptor->bits_per_sample <= 24)
1446                     st->codec->codec_id = CODEC_ID_PCM_S24BE;
1447                 else if (descriptor->bits_per_sample == 32)
1448                     st->codec->codec_id = CODEC_ID_PCM_S32BE;
1449             } else if (st->codec->codec_id == CODEC_ID_MP2) {
1450                 st->need_parsing = AVSTREAM_PARSE_FULL;
1451             }
1452         }
1453         if (st->codec->codec_type != AVMEDIA_TYPE_DATA && (*essence_container_ul)[15] > 0x01) {
1454             /* TODO: decode timestamps */
1455             st->need_parsing = AVSTREAM_PARSE_TIMESTAMPS;
1456         }
1457     }
1458
1459     ret = 0;
1460 fail_and_free:
1461     return ret;
1462 }
1463
1464 static const MXFMetadataReadTableEntry mxf_metadata_read_table[] = {
1465     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x05,0x01,0x00 }, mxf_read_primer_pack },
1466     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x01,0x00 }, mxf_read_partition_pack },
1467     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x02,0x00 }, mxf_read_partition_pack },
1468     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x03,0x00 }, mxf_read_partition_pack },
1469     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x04,0x00 }, mxf_read_partition_pack },
1470     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x01,0x00 }, mxf_read_partition_pack },
1471     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x02,0x00 }, mxf_read_partition_pack },
1472     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x03,0x00 }, mxf_read_partition_pack },
1473     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x04,0x00 }, mxf_read_partition_pack },
1474     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x04,0x02,0x00 }, mxf_read_partition_pack },
1475     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x04,0x04,0x00 }, mxf_read_partition_pack },
1476     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x18,0x00 }, mxf_read_content_storage, 0, AnyType },
1477     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x37,0x00 }, mxf_read_source_package, sizeof(MXFPackage), SourcePackage },
1478     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x36,0x00 }, mxf_read_material_package, sizeof(MXFPackage), MaterialPackage },
1479     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x0F,0x00 }, mxf_read_sequence, sizeof(MXFSequence), Sequence },
1480     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x11,0x00 }, mxf_read_source_clip, sizeof(MXFStructuralComponent), SourceClip },
1481     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x44,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), MultipleDescriptor },
1482     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x42,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* Generic Sound */
1483     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x28,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* CDCI */
1484     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x29,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* RGBA */
1485     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x51,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* MPEG 2 Video */
1486     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x48,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* Wave */
1487     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x47,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* AES3 */
1488     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x3A,0x00 }, mxf_read_track, sizeof(MXFTrack), Track }, /* Static Track */
1489     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x3B,0x00 }, mxf_read_track, sizeof(MXFTrack), Track }, /* Generic Track */
1490     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x04,0x01,0x02,0x02,0x00,0x00 }, mxf_read_cryptographic_context, sizeof(MXFCryptoContext), CryptoContext },
1491     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x10,0x01,0x00 }, mxf_read_index_table_segment, sizeof(MXFIndexTableSegment), IndexTableSegment },
1492     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 }, NULL, 0, AnyType },
1493 };
1494
1495 static int mxf_read_local_tags(MXFContext *mxf, KLVPacket *klv, MXFMetadataReadFunc *read_child, int ctx_size, enum MXFMetadataSetType type)
1496 {
1497     AVIOContext *pb = mxf->fc->pb;
1498     MXFMetadataSet *ctx = ctx_size ? av_mallocz(ctx_size) : mxf;
1499     uint64_t klv_end = avio_tell(pb) + klv->length;
1500
1501     if (!ctx)
1502         return AVERROR(ENOMEM);
1503     while (avio_tell(pb) + 4 < klv_end && !url_feof(pb)) {
1504         int ret;
1505         int tag = avio_rb16(pb);
1506         int size = avio_rb16(pb); /* KLV specified by 0x53 */
1507         uint64_t next = avio_tell(pb) + size;
1508         UID uid = {0};
1509
1510         av_dlog(mxf->fc, "local tag %#04x size %d\n", tag, size);
1511         if (!size) { /* ignore empty tag, needed for some files with empty UMID tag */
1512             av_log(mxf->fc, AV_LOG_ERROR, "local tag %#04x with 0 size\n", tag);
1513             continue;
1514         }
1515         if (tag > 0x7FFF) { /* dynamic tag */
1516             int i;
1517             for (i = 0; i < mxf->local_tags_count; i++) {
1518                 int local_tag = AV_RB16(mxf->local_tags+i*18);
1519                 if (local_tag == tag) {
1520                     memcpy(uid, mxf->local_tags+i*18+2, 16);
1521                     av_dlog(mxf->fc, "local tag %#04x\n", local_tag);
1522                     PRINT_KEY(mxf->fc, "uid", uid);
1523                 }
1524             }
1525         }
1526         if (ctx_size && tag == 0x3C0A)
1527             avio_read(pb, ctx->uid, 16);
1528         else if ((ret = read_child(ctx, pb, tag, size, uid, -1)) < 0)
1529             return ret;
1530
1531         /* Accept the 64k local set limit being exceeded (Avid). Don't accept
1532          * it extending past the end of the KLV though (zzuf5.mxf). */
1533         if (avio_tell(pb) > klv_end) {
1534             av_log(mxf->fc, AV_LOG_ERROR,
1535                    "local tag %#04x extends past end of local set @ %#"PRIx64"\n",
1536                    tag, klv->offset);
1537             return AVERROR_INVALIDDATA;
1538         } else if (avio_tell(pb) <= next)   /* only seek forward, else this can loop for a long time */
1539             avio_seek(pb, next, SEEK_SET);
1540     }
1541     if (ctx_size) ctx->type = type;
1542     return ctx_size ? mxf_add_metadata_set(mxf, ctx) : 0;
1543 }
1544
1545 /**
1546  * Seeks to the previous partition, if possible
1547  * @return <= 0 if we should stop parsing, > 0 if we should keep going
1548  */
1549 static int mxf_seek_to_previous_partition(MXFContext *mxf)
1550 {
1551     AVIOContext *pb = mxf->fc->pb;
1552
1553     if (!mxf->current_partition ||
1554         mxf->run_in + mxf->current_partition->previous_partition <= mxf->last_forward_tell)
1555         return 0;   /* we've parsed all partitions */
1556
1557     /* seek to previous partition */
1558     avio_seek(pb, mxf->run_in + mxf->current_partition->previous_partition, SEEK_SET);
1559     mxf->current_partition = NULL;
1560
1561     av_dlog(mxf->fc, "seeking to previous partition\n");
1562
1563     return 1;
1564 }
1565
1566 /**
1567  * Called when essence is encountered
1568  * @return <= 0 if we should stop parsing, > 0 if we should keep going
1569  */
1570 static int mxf_parse_handle_essence(MXFContext *mxf)
1571 {
1572     AVIOContext *pb = mxf->fc->pb;
1573     int64_t ret;
1574
1575     if (mxf->parsing_backward) {
1576         return mxf_seek_to_previous_partition(mxf);
1577     } else {
1578         if (!mxf->footer_partition) {
1579             av_dlog(mxf->fc, "no footer\n");
1580             return 0;
1581         }
1582
1583         av_dlog(mxf->fc, "seeking to footer\n");
1584
1585         /* remember where we were so we don't end up seeking further back than this */
1586         mxf->last_forward_tell = avio_tell(pb);
1587
1588         if (!pb->seekable) {
1589             av_log(mxf->fc, AV_LOG_INFO, "file is not seekable - not parsing footer\n");
1590             return -1;
1591         }
1592
1593         /* seek to footer partition and parse backward */
1594         if ((ret = avio_seek(pb, mxf->run_in + mxf->footer_partition, SEEK_SET)) < 0) {
1595             av_log(mxf->fc, AV_LOG_ERROR, "failed to seek to footer @ 0x%"PRIx64" (%"PRId64") - partial file?\n",
1596                    mxf->run_in + mxf->footer_partition, ret);
1597             return ret;
1598         }
1599
1600         mxf->current_partition = NULL;
1601         mxf->parsing_backward = 1;
1602     }
1603
1604     return 1;
1605 }
1606
1607 /**
1608  * Called when the next partition or EOF is encountered
1609  * @return <= 0 if we should stop parsing, > 0 if we should keep going
1610  */
1611 static int mxf_parse_handle_partition_or_eof(MXFContext *mxf)
1612 {
1613     return mxf->parsing_backward ? mxf_seek_to_previous_partition(mxf) : 1;
1614 }
1615
1616 /**
1617  * Figures out the proper offset and length of the essence container in each partition
1618  */
1619 static void mxf_compute_essence_containers(MXFContext *mxf)
1620 {
1621     int x;
1622
1623     /* everything is already correct */
1624     if (mxf->op == OPAtom)
1625         return;
1626
1627     for (x = 0; x < mxf->partitions_count; x++) {
1628         MXFPartition *p = &mxf->partitions[x];
1629
1630         if (!p->body_sid)
1631             continue;       /* BodySID == 0 -> no essence */
1632
1633         if (x >= mxf->partitions_count - 1)
1634             break;          /* last partition - can't compute length (and we don't need to) */
1635
1636         /* essence container spans to the next partition */
1637         p->essence_length = mxf->partitions[x+1].this_partition - p->essence_offset;
1638
1639         if (p->essence_length < 0) {
1640             /* next ThisPartition < essence_offset */
1641             p->essence_length = 0;
1642             av_log(mxf->fc, AV_LOG_ERROR,
1643                    "partition %i: bad ThisPartition = %"PRIX64"\n",
1644                    x+1, mxf->partitions[x+1].this_partition);
1645         }
1646     }
1647 }
1648
1649 static int64_t round_to_kag(int64_t position, int kag_size)
1650 {
1651     /* TODO: account for run-in? the spec isn't clear whether KAG should account for it */
1652     /* NOTE: kag_size may be any integer between 1 - 2^10 */
1653     int64_t ret = (position / kag_size) * kag_size;
1654     return ret == position ? ret : ret + kag_size;
1655 }
1656
1657 static int is_pcm(enum CodecID codec_id)
1658 {
1659     /* we only care about "normal" PCM codecs until we get samples */
1660     return codec_id >= CODEC_ID_PCM_S16LE && codec_id < CODEC_ID_PCM_S24DAUD;
1661 }
1662
1663 /**
1664  * Deal with the case where for some audio atoms EditUnitByteCount is
1665  * very small (2, 4..). In those cases we should read more than one
1666  * sample per call to mxf_read_packet().
1667  */
1668 static void mxf_handle_small_eubc(AVFormatContext *s)
1669 {
1670     MXFContext *mxf = s->priv_data;
1671
1672     /* assuming non-OPAtom == frame wrapped
1673      * no sane writer would wrap 2 byte PCM packets with 20 byte headers.. */
1674     if (mxf->op != OPAtom)
1675         return;
1676
1677     /* expect PCM with exactly one index table segment and a small (< 32) EUBC */
1678     if (s->nb_streams != 1                                     ||
1679         s->streams[0]->codec->codec_type != AVMEDIA_TYPE_AUDIO ||
1680         !is_pcm(s->streams[0]->codec->codec_id)                ||
1681         mxf->nb_index_tables != 1                              ||
1682         mxf->index_tables[0].nb_segments != 1                  ||
1683         mxf->index_tables[0].segments[0]->edit_unit_byte_count >= 32)
1684         return;
1685
1686     /* arbitrarily default to 48 kHz PAL audio frame size */
1687     /* TODO: We could compute this from the ratio between the audio
1688      *       and video edit rates for 48 kHz NTSC we could use the
1689      *       1802-1802-1802-1802-1801 pattern. */
1690     mxf->edit_units_per_packet = 1920;
1691 }
1692
1693 static int mxf_read_header(AVFormatContext *s)
1694 {
1695     MXFContext *mxf = s->priv_data;
1696     KLVPacket klv;
1697     int64_t essence_offset = 0;
1698     int ret;
1699
1700     mxf->last_forward_tell = INT64_MAX;
1701     mxf->edit_units_per_packet = 1;
1702
1703     if (!mxf_read_sync(s->pb, mxf_header_partition_pack_key, 14)) {
1704         av_log(s, AV_LOG_ERROR, "could not find header partition pack key\n");
1705         return AVERROR_INVALIDDATA;
1706     }
1707     avio_seek(s->pb, -14, SEEK_CUR);
1708     mxf->fc = s;
1709     mxf->run_in = avio_tell(s->pb);
1710
1711     while (!url_feof(s->pb)) {
1712         const MXFMetadataReadTableEntry *metadata;
1713
1714         if (klv_read_packet(&klv, s->pb) < 0) {
1715             /* EOF - seek to previous partition or stop */
1716             if(mxf_parse_handle_partition_or_eof(mxf) <= 0)
1717                 break;
1718             else
1719                 continue;
1720         }
1721
1722         PRINT_KEY(s, "read header", klv.key);
1723         av_dlog(s, "size %"PRIu64" offset %#"PRIx64"\n", klv.length, klv.offset);
1724         if (IS_KLV_KEY(klv.key, mxf_encrypted_triplet_key) ||
1725             IS_KLV_KEY(klv.key, mxf_essence_element_key) ||
1726             IS_KLV_KEY(klv.key, mxf_avid_essence_element_key) ||
1727             IS_KLV_KEY(klv.key, mxf_system_item_key)) {
1728
1729             if (!mxf->current_partition) {
1730                 av_log(mxf->fc, AV_LOG_ERROR, "found essence prior to first PartitionPack\n");
1731                 return AVERROR_INVALIDDATA;
1732             }
1733
1734             if (!mxf->current_partition->essence_offset) {
1735                 /* for OP1a we compute essence_offset
1736                  * for OPAtom we point essence_offset after the KL (usually op1a_essence_offset + 20 or 25)
1737                  * TODO: for OP1a we could eliminate this entire if statement, always stopping parsing at op1a_essence_offset
1738                  *       for OPAtom we still need the actual essence_offset though (the KL's length can vary)
1739                  */
1740                 int64_t op1a_essence_offset =
1741                     round_to_kag(mxf->current_partition->this_partition +
1742                                  mxf->current_partition->pack_length,       mxf->current_partition->kag_size) +
1743                     round_to_kag(mxf->current_partition->header_byte_count, mxf->current_partition->kag_size) +
1744                     round_to_kag(mxf->current_partition->index_byte_count,  mxf->current_partition->kag_size);
1745
1746                 if (mxf->op == OPAtom) {
1747                     /* point essence_offset to the actual data
1748                     * OPAtom has all the essence in one big KLV
1749                     */
1750                     mxf->current_partition->essence_offset = avio_tell(s->pb);
1751                     mxf->current_partition->essence_length = klv.length;
1752                 } else {
1753                     /* NOTE: op1a_essence_offset may be less than to klv.offset (C0023S01.mxf)  */
1754                     mxf->current_partition->essence_offset = op1a_essence_offset;
1755                 }
1756             }
1757
1758             if (!essence_offset)
1759                 essence_offset = klv.offset;
1760
1761             /* seek to footer, previous partition or stop */
1762             if (mxf_parse_handle_essence(mxf) <= 0)
1763                 break;
1764             continue;
1765         } else if (!memcmp(klv.key, mxf_header_partition_pack_key, 13) &&
1766                    klv.key[13] >= 2 && klv.key[13] <= 4 && mxf->current_partition) {
1767             /* next partition pack - keep going, seek to previous partition or stop */
1768             if(mxf_parse_handle_partition_or_eof(mxf) <= 0)
1769                 break;
1770         }
1771
1772         for (metadata = mxf_metadata_read_table; metadata->read; metadata++) {
1773             if (IS_KLV_KEY(klv.key, metadata->key)) {
1774                 int res;
1775                 if (klv.key[5] == 0x53) {
1776                     res = mxf_read_local_tags(mxf, &klv, metadata->read, metadata->ctx_size, metadata->type);
1777                 } else {
1778                     uint64_t next = avio_tell(s->pb) + klv.length;
1779                     res = metadata->read(mxf, s->pb, 0, klv.length, klv.key, klv.offset);
1780
1781                     /* only seek forward, else this can loop for a long time */
1782                     if (avio_tell(s->pb) > next) {
1783                         av_log(s, AV_LOG_ERROR, "read past end of KLV @ %#"PRIx64"\n",
1784                                klv.offset);
1785                         return AVERROR_INVALIDDATA;
1786                     }
1787
1788                     avio_seek(s->pb, next, SEEK_SET);
1789                 }
1790                 if (res < 0) {
1791                     av_log(s, AV_LOG_ERROR, "error reading header metadata\n");
1792                     return res;
1793                 }
1794                 break;
1795             }
1796         }
1797         if (!metadata->read)
1798             avio_skip(s->pb, klv.length);
1799     }
1800     /* FIXME avoid seek */
1801     if (!essence_offset)  {
1802         av_log(s, AV_LOG_ERROR, "no essence\n");
1803         return AVERROR_INVALIDDATA;
1804     }
1805     avio_seek(s->pb, essence_offset, SEEK_SET);
1806
1807     mxf_compute_essence_containers(mxf);
1808
1809     /* we need to do this before computing the index tables
1810      * to be able to fill in zero IndexDurations with st->duration */
1811     if ((ret = mxf_parse_structural_metadata(mxf)) < 0)
1812         return ret;
1813
1814     if ((ret = mxf_compute_index_tables(mxf)) < 0)
1815         return ret;
1816
1817     if (mxf->nb_index_tables > 1) {
1818         /* TODO: look up which IndexSID to use via EssenceContainerData */
1819         av_log(mxf->fc, AV_LOG_INFO, "got %i index tables - only the first one (IndexSID %i) will be used\n",
1820                mxf->nb_index_tables, mxf->index_tables[0].index_sid);
1821     } else if (mxf->nb_index_tables == 0 && mxf->op == OPAtom) {
1822         av_log(mxf->fc, AV_LOG_ERROR, "cannot demux OPAtom without an index\n");
1823         return AVERROR_INVALIDDATA;
1824     }
1825
1826     mxf_handle_small_eubc(s);
1827
1828     return 0;
1829 }
1830
1831 /**
1832  * Computes DTS and PTS for the given video packet based on its offset.
1833  */
1834 static void mxf_packet_timestamps(MXFContext *mxf, AVPacket *pkt)
1835 {
1836     int64_t last_ofs = -1, next_ofs;
1837     MXFIndexTable *t = &mxf->index_tables[0];
1838
1839     /* this is called from the OP1a demuxing logic, which means there
1840      * may be no index tables */
1841     if (mxf->nb_index_tables <= 0)
1842         return;
1843
1844     /* find mxf->current_edit_unit so that the next edit unit starts ahead of pkt->pos */
1845     while (mxf->current_edit_unit >= 0) {
1846         if (mxf_edit_unit_absolute_offset(mxf, t, mxf->current_edit_unit + 1, NULL, &next_ofs, 0) < 0)
1847             break;
1848
1849         if (next_ofs <= last_ofs) {
1850             /* large next_ofs didn't change or current_edit_unit wrapped
1851              * around this fixes the infinite loop on zzuf3.mxf */
1852             av_log(mxf->fc, AV_LOG_ERROR,
1853                    "next_ofs didn't change. not deriving packet timestamps\n");
1854             return;
1855         }
1856
1857         if (next_ofs > pkt->pos)
1858             break;
1859
1860         last_ofs = next_ofs;
1861         mxf->current_edit_unit++;
1862     }
1863
1864     if (mxf->current_edit_unit < 0 || mxf->current_edit_unit >= t->nb_ptses)
1865         return;
1866
1867     pkt->dts = mxf->current_edit_unit + t->first_dts;
1868     pkt->pts = t->ptses[mxf->current_edit_unit];
1869 }
1870
1871 static int mxf_read_packet_old(AVFormatContext *s, AVPacket *pkt)
1872 {
1873     KLVPacket klv;
1874
1875     while (!url_feof(s->pb)) {
1876         int ret;
1877         if (klv_read_packet(&klv, s->pb) < 0)
1878             return -1;
1879         PRINT_KEY(s, "read packet", klv.key);
1880         av_dlog(s, "size %"PRIu64" offset %#"PRIx64"\n", klv.length, klv.offset);
1881         if (IS_KLV_KEY(klv.key, mxf_encrypted_triplet_key)) {
1882             ret = mxf_decrypt_triplet(s, pkt, &klv);
1883             if (ret < 0) {
1884                 av_log(s, AV_LOG_ERROR, "invalid encoded triplet\n");
1885                 return AVERROR_INVALIDDATA;
1886             }
1887             return 0;
1888         }
1889         if (IS_KLV_KEY(klv.key, mxf_essence_element_key) ||
1890             IS_KLV_KEY(klv.key, mxf_avid_essence_element_key)) {
1891             int index = mxf_get_stream_index(s, &klv);
1892             if (index < 0) {
1893                 av_log(s, AV_LOG_ERROR, "error getting stream index %d\n", AV_RB32(klv.key+12));
1894                 goto skip;
1895             }
1896             if (s->streams[index]->discard == AVDISCARD_ALL)
1897                 goto skip;
1898             /* check for 8 channels AES3 element */
1899             if (klv.key[12] == 0x06 && klv.key[13] == 0x01 && klv.key[14] == 0x10) {
1900                 if (mxf_get_d10_aes3_packet(s->pb, s->streams[index], pkt, klv.length) < 0) {
1901                     av_log(s, AV_LOG_ERROR, "error reading D-10 aes3 frame\n");
1902                     return AVERROR_INVALIDDATA;
1903                 }
1904             } else {
1905                 ret = av_get_packet(s->pb, pkt, klv.length);
1906                 if (ret < 0)
1907                     return ret;
1908             }
1909             pkt->stream_index = index;
1910             pkt->pos = klv.offset;
1911
1912             if (s->streams[index]->codec->codec_type == AVMEDIA_TYPE_VIDEO)
1913                 mxf_packet_timestamps(s->priv_data, pkt);   /* offset -> EditUnit -> DTS/PTS */
1914
1915             return 0;
1916         } else
1917         skip:
1918             avio_skip(s->pb, klv.length);
1919     }
1920     return AVERROR_EOF;
1921 }
1922
1923 static int mxf_read_packet(AVFormatContext *s, AVPacket *pkt)
1924 {
1925     MXFContext *mxf = s->priv_data;
1926     int ret, size;
1927     int64_t ret64, pos, next_pos;
1928     AVStream *st;
1929     MXFIndexTable *t;
1930     int edit_units;
1931
1932     if (mxf->op != OPAtom)
1933         return mxf_read_packet_old(s, pkt);
1934
1935     /* OPAtom - clip wrapped demuxing */
1936     /* NOTE: mxf_read_header() makes sure nb_index_tables > 0 for OPAtom */
1937     st = s->streams[0];
1938     t = &mxf->index_tables[0];
1939
1940     if (mxf->current_edit_unit >= st->duration)
1941         return AVERROR_EOF;
1942
1943     edit_units = FFMIN(mxf->edit_units_per_packet, st->duration - mxf->current_edit_unit);
1944
1945     if ((ret = mxf_edit_unit_absolute_offset(mxf, t, mxf->current_edit_unit, NULL, &pos, 1)) < 0)
1946         return ret;
1947
1948     /* compute size by finding the next edit unit or the end of the essence container
1949      * not pretty, but it works */
1950     if ((ret = mxf_edit_unit_absolute_offset(mxf, t, mxf->current_edit_unit + edit_units, NULL, &next_pos, 0)) < 0 &&
1951         (next_pos = mxf_essence_container_end(mxf, t->body_sid)) <= 0) {
1952         av_log(s, AV_LOG_ERROR, "unable to compute the size of the last packet\n");
1953         return AVERROR_INVALIDDATA;
1954     }
1955
1956     if ((size = next_pos - pos) <= 0) {
1957         av_log(s, AV_LOG_ERROR, "bad size: %i\n", size);
1958         return AVERROR_INVALIDDATA;
1959     }
1960
1961     if ((ret64 = avio_seek(s->pb, pos, SEEK_SET)) < 0)
1962         return ret64;
1963
1964         if ((ret = av_get_packet(s->pb, pkt, size)) != size)
1965             return ret < 0 ? ret : AVERROR_EOF;
1966
1967     if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO && t->ptses &&
1968         mxf->current_edit_unit >= 0 && mxf->current_edit_unit < t->nb_ptses) {
1969         pkt->dts = mxf->current_edit_unit + t->first_dts;
1970         pkt->pts = t->ptses[mxf->current_edit_unit];
1971     }
1972
1973     pkt->stream_index = 0;
1974     mxf->current_edit_unit += edit_units;
1975
1976     return 0;
1977 }
1978
1979 static int mxf_read_close(AVFormatContext *s)
1980 {
1981     MXFContext *mxf = s->priv_data;
1982     MXFIndexTableSegment *seg;
1983     int i;
1984
1985     av_freep(&mxf->packages_refs);
1986
1987     for (i = 0; i < s->nb_streams; i++)
1988         s->streams[i]->priv_data = NULL;
1989
1990     for (i = 0; i < mxf->metadata_sets_count; i++) {
1991         switch (mxf->metadata_sets[i]->type) {
1992         case MultipleDescriptor:
1993             av_freep(&((MXFDescriptor *)mxf->metadata_sets[i])->sub_descriptors_refs);
1994             break;
1995         case Sequence:
1996             av_freep(&((MXFSequence *)mxf->metadata_sets[i])->structural_components_refs);
1997             break;
1998         case SourcePackage:
1999         case MaterialPackage:
2000             av_freep(&((MXFPackage *)mxf->metadata_sets[i])->tracks_refs);
2001             break;
2002         case IndexTableSegment:
2003             seg = (MXFIndexTableSegment *)mxf->metadata_sets[i];
2004             av_freep(&seg->temporal_offset_entries);
2005             av_freep(&seg->flag_entries);
2006             av_freep(&seg->stream_offset_entries);
2007             break;
2008         default:
2009             break;
2010         }
2011         av_freep(&mxf->metadata_sets[i]);
2012     }
2013     av_freep(&mxf->partitions);
2014     av_freep(&mxf->metadata_sets);
2015     av_freep(&mxf->aesc);
2016     av_freep(&mxf->local_tags);
2017
2018     for (i = 0; i < mxf->nb_index_tables; i++) {
2019         av_freep(&mxf->index_tables[i].segments);
2020         av_freep(&mxf->index_tables[i].ptses);
2021         av_freep(&mxf->index_tables[i].fake_index);
2022     }
2023     av_freep(&mxf->index_tables);
2024
2025     return 0;
2026 }
2027
2028 static int mxf_probe(AVProbeData *p) {
2029     uint8_t *bufp = p->buf;
2030     uint8_t *end = p->buf + p->buf_size;
2031
2032     if (p->buf_size < sizeof(mxf_header_partition_pack_key))
2033         return 0;
2034
2035     /* Must skip Run-In Sequence and search for MXF header partition pack key SMPTE 377M 5.5 */
2036     end -= sizeof(mxf_header_partition_pack_key);
2037     for (; bufp < end; bufp++) {
2038         if (IS_KLV_KEY(bufp, mxf_header_partition_pack_key))
2039             return AVPROBE_SCORE_MAX;
2040     }
2041     return 0;
2042 }
2043
2044 /* rudimentary byte seek */
2045 /* XXX: use MXF Index */
2046 static int mxf_read_seek(AVFormatContext *s, int stream_index, int64_t sample_time, int flags)
2047 {
2048     AVStream *st = s->streams[stream_index];
2049     int64_t seconds;
2050     MXFContext* mxf = s->priv_data;
2051     int64_t seekpos;
2052     int ret;
2053     MXFIndexTable *t;
2054
2055     if (mxf->index_tables <= 0) {
2056     if (!s->bit_rate)
2057         return AVERROR_INVALIDDATA;
2058     if (sample_time < 0)
2059         sample_time = 0;
2060     seconds = av_rescale(sample_time, st->time_base.num, st->time_base.den);
2061
2062     if ((ret = avio_seek(s->pb, (s->bit_rate * seconds) >> 3, SEEK_SET)) < 0)
2063         return ret;
2064     ff_update_cur_dts(s, st, sample_time);
2065     } else {
2066         t = &mxf->index_tables[0];
2067
2068         /* clamp above zero, else ff_index_search_timestamp() returns negative
2069          * this also means we allow seeking before the start */
2070         sample_time = FFMAX(sample_time, 0);
2071
2072         if (t->fake_index) {
2073             /* behave as if we have a proper index */
2074             if ((sample_time = ff_index_search_timestamp(t->fake_index, t->nb_ptses, sample_time, flags)) < 0)
2075                 return sample_time;
2076         } else {
2077             /* no IndexEntryArray (one or more CBR segments)
2078              * make sure we don't seek past the end */
2079             sample_time = FFMIN(sample_time, st->duration - 1);
2080         }
2081
2082         if ((ret = mxf_edit_unit_absolute_offset(mxf, t, sample_time, &sample_time, &seekpos, 1)) << 0)
2083             return ret;
2084
2085         ff_update_cur_dts(s, st, sample_time);
2086         mxf->current_edit_unit = sample_time;
2087         avio_seek(s->pb, seekpos, SEEK_SET);
2088     }
2089     return 0;
2090 }
2091
2092 AVInputFormat ff_mxf_demuxer = {
2093     .name           = "mxf",
2094     .long_name      = NULL_IF_CONFIG_SMALL("Material eXchange Format"),
2095     .priv_data_size = sizeof(MXFContext),
2096     .read_probe     = mxf_probe,
2097     .read_header    = mxf_read_header,
2098     .read_packet    = mxf_read_packet,
2099     .read_close     = mxf_read_close,
2100     .read_seek      = mxf_read_seek,
2101 };