]> git.sesse.net Git - ffmpeg/blob - libavformat/mxfdec.c
riff: add "SM4V" FourCC
[ffmpeg] / libavformat / mxfdec.c
1 /*
2  * MXF demuxer.
3  * Copyright (c) 2006 SmartJog S.A., Baptiste Coudurier <baptiste dot coudurier at smartjog dot com>
4  *
5  * This file is part of Libav.
6  *
7  * Libav is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * Libav is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with Libav; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 /*
23  * References
24  * SMPTE 336M KLV Data Encoding Protocol Using Key-Length-Value
25  * SMPTE 377M MXF File Format Specifications
26  * SMPTE 378M Operational Pattern 1a
27  * SMPTE 379M MXF Generic Container
28  * SMPTE 381M Mapping MPEG Streams into the MXF Generic Container
29  * SMPTE 382M Mapping AES3 and Broadcast Wave Audio into the MXF Generic Container
30  * SMPTE 383M Mapping DV-DIF Data to the MXF Generic Container
31  *
32  * Principle
33  * Search for Track numbers which will identify essence element KLV packets.
34  * Search for SourcePackage which define tracks which contains Track numbers.
35  * Material Package contains tracks with reference to SourcePackage tracks.
36  * Search for Descriptors (Picture, Sound) which contains codec info and parameters.
37  * Assign Descriptors to correct Tracks.
38  *
39  * Metadata reading functions read Local Tags, get InstanceUID(0x3C0A) then add MetaDataSet to MXFContext.
40  * Metadata parsing resolves Strong References to objects.
41  *
42  * Simple demuxer, only OP1A supported and some files might not work at all.
43  * Only tracks with associated descriptors will be decoded. "Highly Desirable" SMPTE 377M D.1
44  */
45
46 #include <inttypes.h>
47
48 #include "libavutil/aes.h"
49 #include "libavutil/mathematics.h"
50 #include "libavcodec/bytestream.h"
51 #include "avformat.h"
52 #include "internal.h"
53 #include "mxf.h"
54
55 typedef enum {
56     Header,
57     BodyPartition,
58     Footer
59 } MXFPartitionType;
60
61 typedef enum {
62     OP1a = 1,
63     OP1b,
64     OP1c,
65     OP2a,
66     OP2b,
67     OP2c,
68     OP3a,
69     OP3b,
70     OP3c,
71     OPAtom,
72     OPSonyOpt,  /* FATE sample, violates the spec in places */
73 } MXFOP;
74
75 typedef struct {
76     int closed;
77     int complete;
78     MXFPartitionType type;
79     uint64_t previous_partition;
80     int index_sid;
81     int body_sid;
82     int64_t this_partition;
83     int64_t essence_offset;         ///< absolute offset of essence
84     int64_t essence_length;
85     int32_t kag_size;
86     int64_t header_byte_count;
87     int64_t index_byte_count;
88     int pack_length;
89 } MXFPartition;
90
91 typedef struct {
92     UID uid;
93     enum MXFMetadataSetType type;
94     UID source_container_ul;
95 } MXFCryptoContext;
96
97 typedef struct {
98     UID uid;
99     enum MXFMetadataSetType type;
100     UID source_package_uid;
101     UID data_definition_ul;
102     int64_t duration;
103     int64_t start_position;
104     int source_track_id;
105 } MXFStructuralComponent;
106
107 typedef struct {
108     UID uid;
109     enum MXFMetadataSetType type;
110     UID data_definition_ul;
111     UID *structural_components_refs;
112     int structural_components_count;
113     int64_t duration;
114 } MXFSequence;
115
116 typedef struct {
117     UID uid;
118     enum MXFMetadataSetType type;
119     MXFSequence *sequence; /* mandatory, and only one */
120     UID sequence_ref;
121     int track_id;
122     uint8_t track_number[4];
123     AVRational edit_rate;
124     int intra_only;
125     uint64_t sample_count;
126     int64_t original_duration; /* st->duration in SampleRate/EditRate units */
127 } MXFTrack;
128
129 typedef struct {
130     UID uid;
131     enum MXFMetadataSetType type;
132     UID essence_container_ul;
133     UID essence_codec_ul;
134     AVRational sample_rate;
135     AVRational aspect_ratio;
136     int width;
137     int height; /* Field height, not frame height */
138     int frame_layout; /* See MXFFrameLayout enum */
139 #define MXF_TFF 1
140 #define MXF_BFF 2
141     int field_dominance;
142     int channels;
143     int bits_per_sample;
144     unsigned int component_depth;
145     unsigned int horiz_subsampling;
146     unsigned int vert_subsampling;
147     UID *sub_descriptors_refs;
148     int sub_descriptors_count;
149     int linked_track_id;
150     uint8_t *extradata;
151     int extradata_size;
152     enum AVPixelFormat pix_fmt;
153 } MXFDescriptor;
154
155 typedef struct {
156     UID uid;
157     enum MXFMetadataSetType type;
158     int edit_unit_byte_count;
159     int index_sid;
160     int body_sid;
161     AVRational index_edit_rate;
162     uint64_t index_start_position;
163     uint64_t index_duration;
164     int8_t *temporal_offset_entries;
165     int *flag_entries;
166     uint64_t *stream_offset_entries;
167     int nb_index_entries;
168 } MXFIndexTableSegment;
169
170 typedef struct {
171     UID uid;
172     enum MXFMetadataSetType type;
173     UID package_uid;
174     UID *tracks_refs;
175     int tracks_count;
176     MXFDescriptor *descriptor; /* only one */
177     UID descriptor_ref;
178 } MXFPackage;
179
180 typedef struct {
181     UID uid;
182     enum MXFMetadataSetType type;
183 } MXFMetadataSet;
184
185 /* decoded index table */
186 typedef struct {
187     int index_sid;
188     int body_sid;
189     int nb_ptses;               /* number of PTSes or total duration of index */
190     int64_t first_dts;          /* DTS = EditUnit + first_dts */
191     int64_t *ptses;             /* maps EditUnit -> PTS */
192     int nb_segments;
193     MXFIndexTableSegment **segments;    /* sorted by IndexStartPosition */
194     AVIndexEntry *fake_index;   /* used for calling ff_index_search_timestamp() */
195 } MXFIndexTable;
196
197 typedef struct {
198     MXFPartition *partitions;
199     unsigned partitions_count;
200     MXFOP op;
201     UID *packages_refs;
202     int packages_count;
203     MXFMetadataSet **metadata_sets;
204     int metadata_sets_count;
205     AVFormatContext *fc;
206     struct AVAES *aesc;
207     uint8_t *local_tags;
208     int local_tags_count;
209     uint64_t last_partition;
210     uint64_t footer_partition;
211     KLVPacket current_klv_data;
212     int current_klv_index;
213     int run_in;
214     MXFPartition *current_partition;
215     int parsing_backward;
216     int64_t last_forward_tell;
217     int last_forward_partition;
218     int current_edit_unit;
219     int nb_index_tables;
220     MXFIndexTable *index_tables;
221     int edit_units_per_packet;      ///< how many edit units to read at a time (PCM, OPAtom)
222 } MXFContext;
223
224 enum MXFWrappingScheme {
225     Frame,
226     Clip,
227 };
228
229 /* NOTE: klv_offset is not set (-1) for local keys */
230 typedef int MXFMetadataReadFunc(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset);
231
232 typedef struct {
233     const UID key;
234     MXFMetadataReadFunc *read;
235     int ctx_size;
236     enum MXFMetadataSetType type;
237 } MXFMetadataReadTableEntry;
238
239 /* partial keys to match */
240 static const uint8_t mxf_header_partition_pack_key[]       = { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02 };
241 static const uint8_t mxf_essence_element_key[]             = { 0x06,0x0e,0x2b,0x34,0x01,0x02,0x01,0x01,0x0d,0x01,0x03,0x01 };
242 static const uint8_t mxf_avid_essence_element_key[]        = { 0x06,0x0e,0x2b,0x34,0x01,0x02,0x01,0x01,0x0e,0x04,0x03,0x01 };
243 static const uint8_t mxf_system_item_key[]                 = { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x03,0x01,0x04 };
244 static const uint8_t mxf_klv_key[]                         = { 0x06,0x0e,0x2b,0x34 };
245 /* complete keys to match */
246 static const uint8_t mxf_crypto_source_container_ul[]      = { 0x06,0x0e,0x2b,0x34,0x01,0x01,0x01,0x09,0x06,0x01,0x01,0x02,0x02,0x00,0x00,0x00 };
247 static const uint8_t mxf_encrypted_triplet_key[]           = { 0x06,0x0e,0x2b,0x34,0x02,0x04,0x01,0x07,0x0d,0x01,0x03,0x01,0x02,0x7e,0x01,0x00 };
248 static const uint8_t mxf_encrypted_essence_container[]     = { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x07,0x0d,0x01,0x03,0x01,0x02,0x0b,0x01,0x00 };
249 static const uint8_t mxf_random_index_pack_key[]           = { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x11,0x01,0x00 };
250 static const uint8_t mxf_sony_mpeg4_extradata[]            = { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x01,0x0e,0x06,0x06,0x02,0x02,0x01,0x00,0x00 };
251
252 #define IS_KLV_KEY(x, y) (!memcmp(x, y, sizeof(y)))
253
254 static int64_t klv_decode_ber_length(AVIOContext *pb)
255 {
256     uint64_t size = avio_r8(pb);
257     if (size & 0x80) { /* long form */
258         int bytes_num = size & 0x7f;
259         /* SMPTE 379M 5.3.4 guarantee that bytes_num must not exceed 8 bytes */
260         if (bytes_num > 8)
261             return AVERROR_INVALIDDATA;
262         size = 0;
263         while (bytes_num--)
264             size = size << 8 | avio_r8(pb);
265     }
266     return size;
267 }
268
269 static int mxf_read_sync(AVIOContext *pb, const uint8_t *key, unsigned size)
270 {
271     int i, b;
272     for (i = 0; i < size && !pb->eof_reached; i++) {
273         b = avio_r8(pb);
274         if (b == key[0])
275             i = 0;
276         else if (b != key[i])
277             i = -1;
278     }
279     return i == size;
280 }
281
282 static int klv_read_packet(KLVPacket *klv, AVIOContext *pb)
283 {
284     if (!mxf_read_sync(pb, mxf_klv_key, 4))
285         return AVERROR_INVALIDDATA;
286     klv->offset = avio_tell(pb) - 4;
287     memcpy(klv->key, mxf_klv_key, 4);
288     avio_read(pb, klv->key + 4, 12);
289     klv->length = klv_decode_ber_length(pb);
290     return klv->length == -1 ? -1 : 0;
291 }
292
293 static int mxf_get_stream_index(AVFormatContext *s, KLVPacket *klv)
294 {
295     int i;
296
297     for (i = 0; i < s->nb_streams; i++) {
298         MXFTrack *track = s->streams[i]->priv_data;
299         /* SMPTE 379M 7.3 */
300         if (!memcmp(klv->key + sizeof(mxf_essence_element_key), track->track_number, sizeof(track->track_number)))
301             return i;
302     }
303     /* return 0 if only one stream, for OP Atom files with 0 as track number */
304     return s->nb_streams == 1 ? 0 : -1;
305 }
306
307 /* XXX: use AVBitStreamFilter */
308 static int mxf_get_d10_aes3_packet(AVIOContext *pb, AVStream *st, AVPacket *pkt, int64_t length)
309 {
310     const uint8_t *buf_ptr, *end_ptr;
311     uint8_t *data_ptr;
312     int i;
313
314     if (length > 61444) /* worst case PAL 1920 samples 8 channels */
315         return AVERROR_INVALIDDATA;
316     length = av_get_packet(pb, pkt, length);
317     if (length < 0)
318         return length;
319     data_ptr = pkt->data;
320     end_ptr = pkt->data + length;
321     buf_ptr = pkt->data + 4; /* skip SMPTE 331M header */
322     for (; end_ptr - buf_ptr >= st->codec->channels * 4; ) {
323         for (i = 0; i < st->codec->channels; i++) {
324             uint32_t sample = bytestream_get_le32(&buf_ptr);
325             if (st->codec->bits_per_coded_sample == 24)
326                 bytestream_put_le24(&data_ptr, (sample >> 4) & 0xffffff);
327             else
328                 bytestream_put_le16(&data_ptr, (sample >> 12) & 0xffff);
329         }
330         buf_ptr += 32 - st->codec->channels*4; // always 8 channels stored SMPTE 331M
331     }
332     av_shrink_packet(pkt, data_ptr - pkt->data);
333     return 0;
334 }
335
336 static int mxf_decrypt_triplet(AVFormatContext *s, AVPacket *pkt, KLVPacket *klv)
337 {
338     static const uint8_t checkv[16] = {0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b};
339     MXFContext *mxf = s->priv_data;
340     AVIOContext *pb = s->pb;
341     int64_t end = avio_tell(pb) + klv->length;
342     int64_t size;
343     uint64_t orig_size;
344     uint64_t plaintext_size;
345     uint8_t ivec[16];
346     uint8_t tmpbuf[16];
347     int index;
348
349     if (!mxf->aesc && s->key && s->keylen == 16) {
350         mxf->aesc = av_aes_alloc();
351         if (!mxf->aesc)
352             return AVERROR(ENOMEM);
353         av_aes_init(mxf->aesc, s->key, 128, 1);
354     }
355     // crypto context
356     avio_skip(pb, klv_decode_ber_length(pb));
357     // plaintext offset
358     klv_decode_ber_length(pb);
359     plaintext_size = avio_rb64(pb);
360     // source klv key
361     klv_decode_ber_length(pb);
362     avio_read(pb, klv->key, 16);
363     if (!IS_KLV_KEY(klv, mxf_essence_element_key))
364         return AVERROR_INVALIDDATA;
365     index = mxf_get_stream_index(s, klv);
366     if (index < 0)
367         return AVERROR_INVALIDDATA;
368     // source size
369     klv_decode_ber_length(pb);
370     orig_size = avio_rb64(pb);
371     if (orig_size < plaintext_size)
372         return AVERROR_INVALIDDATA;
373     // enc. code
374     size = klv_decode_ber_length(pb);
375     if (size < 32 || size - 32 < orig_size)
376         return AVERROR_INVALIDDATA;
377     avio_read(pb, ivec, 16);
378     avio_read(pb, tmpbuf, 16);
379     if (mxf->aesc)
380         av_aes_crypt(mxf->aesc, tmpbuf, tmpbuf, 1, ivec, 1);
381     if (memcmp(tmpbuf, checkv, 16))
382         av_log(s, AV_LOG_ERROR, "probably incorrect decryption key\n");
383     size -= 32;
384     size = av_get_packet(pb, pkt, size);
385     if (size < 0)
386         return size;
387     else if (size < plaintext_size)
388         return AVERROR_INVALIDDATA;
389     size -= plaintext_size;
390     if (mxf->aesc)
391         av_aes_crypt(mxf->aesc, &pkt->data[plaintext_size],
392                      &pkt->data[plaintext_size], size >> 4, ivec, 1);
393     av_shrink_packet(pkt, orig_size);
394     pkt->stream_index = index;
395     avio_skip(pb, end - avio_tell(pb));
396     return 0;
397 }
398
399 static int mxf_read_primer_pack(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
400 {
401     MXFContext *mxf = arg;
402     int item_num = avio_rb32(pb);
403     int item_len = avio_rb32(pb);
404
405     if (item_len != 18) {
406         avpriv_request_sample(pb, "Primer pack item length %d", item_len);
407         return AVERROR_PATCHWELCOME;
408     }
409     if (item_num > UINT_MAX / item_len)
410         return AVERROR_INVALIDDATA;
411     mxf->local_tags_count = item_num;
412     mxf->local_tags = av_malloc(item_num*item_len);
413     if (!mxf->local_tags)
414         return AVERROR(ENOMEM);
415     avio_read(pb, mxf->local_tags, item_num*item_len);
416     return 0;
417 }
418
419 static int mxf_read_partition_pack(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
420 {
421     MXFContext *mxf = arg;
422     MXFPartition *partition;
423     UID op;
424     uint64_t footer_partition;
425     uint32_t nb_essence_containers;
426     int err;
427
428     if ((err = av_reallocp_array(&mxf->partitions, mxf->partitions_count + 1,
429                                  sizeof(*mxf->partitions))) < 0) {
430         mxf->partitions_count = 0;
431         return err;
432     }
433
434     if (mxf->parsing_backward) {
435         /* insert the new partition pack in the middle
436          * this makes the entries in mxf->partitions sorted by offset */
437         memmove(&mxf->partitions[mxf->last_forward_partition+1],
438                 &mxf->partitions[mxf->last_forward_partition],
439                 (mxf->partitions_count - mxf->last_forward_partition)*sizeof(*mxf->partitions));
440         partition = mxf->current_partition = &mxf->partitions[mxf->last_forward_partition];
441     } else {
442         mxf->last_forward_partition++;
443         partition = mxf->current_partition = &mxf->partitions[mxf->partitions_count];
444     }
445
446     memset(partition, 0, sizeof(*partition));
447     mxf->partitions_count++;
448     partition->pack_length = avio_tell(pb) - klv_offset + size;
449
450     switch(uid[13]) {
451     case 2:
452         partition->type = Header;
453         break;
454     case 3:
455         partition->type = BodyPartition;
456         break;
457     case 4:
458         partition->type = Footer;
459         break;
460     default:
461         av_log(mxf->fc, AV_LOG_ERROR, "unknown partition type %i\n", uid[13]);
462         return AVERROR_INVALIDDATA;
463     }
464
465     /* consider both footers to be closed (there is only Footer and CompleteFooter) */
466     partition->closed = partition->type == Footer || !(uid[14] & 1);
467     partition->complete = uid[14] > 2;
468     avio_skip(pb, 4);
469     partition->kag_size = avio_rb32(pb);
470     partition->this_partition = avio_rb64(pb);
471     partition->previous_partition = avio_rb64(pb);
472     footer_partition = avio_rb64(pb);
473     partition->header_byte_count = avio_rb64(pb);
474     partition->index_byte_count = avio_rb64(pb);
475     partition->index_sid = avio_rb32(pb);
476     avio_skip(pb, 8);
477     partition->body_sid = avio_rb32(pb);
478     avio_read(pb, op, sizeof(UID));
479     nb_essence_containers = avio_rb32(pb);
480
481     if (partition->this_partition &&
482         partition->previous_partition == partition->this_partition) {
483         av_log(mxf->fc, AV_LOG_ERROR,
484                "PreviousPartition equal to ThisPartition %"PRIx64"\n",
485                partition->previous_partition);
486         /* override with the actual previous partition offset */
487         if (!mxf->parsing_backward && mxf->last_forward_partition > 1) {
488             MXFPartition *prev =
489                 mxf->partitions + mxf->last_forward_partition - 2;
490             partition->previous_partition = prev->this_partition;
491         }
492         /* if no previous body partition are found point to the header
493          * partition */
494         if (partition->previous_partition == partition->this_partition)
495             partition->previous_partition = 0;
496         av_log(mxf->fc, AV_LOG_ERROR,
497                "Overriding PreviousPartition with %"PRIx64"\n",
498                partition->previous_partition);
499     }
500
501     /* some files don'thave FooterPartition set in every partition */
502     if (footer_partition) {
503         if (mxf->footer_partition && mxf->footer_partition != footer_partition) {
504             av_log(mxf->fc, AV_LOG_ERROR,
505                    "inconsistent FooterPartition value: %"PRIu64" != %"PRIu64"\n",
506                    mxf->footer_partition, footer_partition);
507         } else {
508             mxf->footer_partition = footer_partition;
509         }
510     }
511
512     av_dlog(mxf->fc,
513             "PartitionPack: ThisPartition = 0x%"PRIX64
514             ", PreviousPartition = 0x%"PRIX64", "
515             "FooterPartition = 0x%"PRIX64", IndexSID = %i, BodySID = %i\n",
516             partition->this_partition,
517             partition->previous_partition, footer_partition,
518             partition->index_sid, partition->body_sid);
519
520     /* sanity check PreviousPartition if set */
521     if (partition->previous_partition &&
522         mxf->run_in + partition->previous_partition >= klv_offset) {
523         av_log(mxf->fc, AV_LOG_ERROR,
524                "PreviousPartition points to this partition or forward\n");
525         return AVERROR_INVALIDDATA;
526     }
527
528     if      (op[12] == 1 && op[13] == 1) mxf->op = OP1a;
529     else if (op[12] == 1 && op[13] == 2) mxf->op = OP1b;
530     else if (op[12] == 1 && op[13] == 3) mxf->op = OP1c;
531     else if (op[12] == 2 && op[13] == 1) mxf->op = OP2a;
532     else if (op[12] == 2 && op[13] == 2) mxf->op = OP2b;
533     else if (op[12] == 2 && op[13] == 3) mxf->op = OP2c;
534     else if (op[12] == 3 && op[13] == 1) mxf->op = OP3a;
535     else if (op[12] == 3 && op[13] == 2) mxf->op = OP3b;
536     else if (op[12] == 3 && op[13] == 3) mxf->op = OP3c;
537     else if (op[12] == 64&& op[13] == 1) mxf->op = OPSonyOpt;
538     else if (op[12] == 0x10) {
539         /* SMPTE 390m: "There shall be exactly one essence container"
540          * The following block deals with files that violate this, namely:
541          * 2011_DCPTEST_24FPS.V.mxf - two ECs, OP1a
542          * abcdefghiv016f56415e.mxf - zero ECs, OPAtom, output by Avid AirSpeed */
543         if (nb_essence_containers != 1) {
544             MXFOP op = nb_essence_containers ? OP1a : OPAtom;
545
546             /* only nag once */
547             if (!mxf->op)
548                 av_log(mxf->fc, AV_LOG_WARNING,
549                        "\"OPAtom\" with %"PRIu32" ECs - assuming %s\n",
550                        nb_essence_containers,
551                        op == OP1a ? "OP1a" : "OPAtom");
552
553             mxf->op = op;
554         } else
555             mxf->op = OPAtom;
556     } else {
557         av_log(mxf->fc, AV_LOG_ERROR, "unknown operational pattern: %02xh %02xh - guessing OP1a\n", op[12], op[13]);
558         mxf->op = OP1a;
559     }
560
561     if (partition->kag_size <= 0 || partition->kag_size > (1 << 20)) {
562         av_log(mxf->fc, AV_LOG_WARNING, "invalid KAGSize %"PRId32" - guessing ",
563                partition->kag_size);
564
565         if (mxf->op == OPSonyOpt)
566             partition->kag_size = 512;
567         else
568             partition->kag_size = 1;
569
570         av_log(mxf->fc, AV_LOG_WARNING, "%"PRId32"\n", partition->kag_size);
571     }
572
573     return 0;
574 }
575
576 static int mxf_add_metadata_set(MXFContext *mxf, void *metadata_set)
577 {
578     int err;
579
580     if ((err = av_reallocp_array(&mxf->metadata_sets, mxf->metadata_sets_count + 1,
581                                  sizeof(*mxf->metadata_sets))) < 0) {
582         mxf->metadata_sets_count = 0;
583         return err;
584     }
585     mxf->metadata_sets[mxf->metadata_sets_count] = metadata_set;
586     mxf->metadata_sets_count++;
587     return 0;
588 }
589
590 static int mxf_read_cryptographic_context(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
591 {
592     MXFCryptoContext *cryptocontext = arg;
593     if (size != 16)
594         return AVERROR_INVALIDDATA;
595     if (IS_KLV_KEY(uid, mxf_crypto_source_container_ul))
596         avio_read(pb, cryptocontext->source_container_ul, 16);
597     return 0;
598 }
599
600 static int mxf_read_content_storage(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
601 {
602     MXFContext *mxf = arg;
603     switch (tag) {
604     case 0x1901:
605         mxf->packages_count = avio_rb32(pb);
606         if (mxf->packages_count >= UINT_MAX / sizeof(UID))
607             return AVERROR_INVALIDDATA;
608         mxf->packages_refs = av_malloc(mxf->packages_count * sizeof(UID));
609         if (!mxf->packages_refs)
610             return AVERROR(ENOMEM);
611         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
612         avio_read(pb, (uint8_t *)mxf->packages_refs, mxf->packages_count * sizeof(UID));
613         break;
614     }
615     return 0;
616 }
617
618 static int mxf_read_source_clip(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
619 {
620     MXFStructuralComponent *source_clip = arg;
621     switch(tag) {
622     case 0x0202:
623         source_clip->duration = avio_rb64(pb);
624         break;
625     case 0x1201:
626         source_clip->start_position = avio_rb64(pb);
627         break;
628     case 0x1101:
629         /* UMID, only get last 16 bytes */
630         avio_skip(pb, 16);
631         avio_read(pb, source_clip->source_package_uid, 16);
632         break;
633     case 0x1102:
634         source_clip->source_track_id = avio_rb32(pb);
635         break;
636     }
637     return 0;
638 }
639
640 static int mxf_read_material_package(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
641 {
642     MXFPackage *package = arg;
643     switch(tag) {
644     case 0x4403:
645         package->tracks_count = avio_rb32(pb);
646         if (package->tracks_count >= UINT_MAX / sizeof(UID))
647             return AVERROR_INVALIDDATA;
648         package->tracks_refs = av_malloc(package->tracks_count * sizeof(UID));
649         if (!package->tracks_refs)
650             return AVERROR(ENOMEM);
651         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
652         avio_read(pb, (uint8_t *)package->tracks_refs, package->tracks_count * sizeof(UID));
653         break;
654     }
655     return 0;
656 }
657
658 static int mxf_read_track(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
659 {
660     MXFTrack *track = arg;
661     switch(tag) {
662     case 0x4801:
663         track->track_id = avio_rb32(pb);
664         break;
665     case 0x4804:
666         avio_read(pb, track->track_number, 4);
667         break;
668     case 0x4b01:
669         track->edit_rate.num = avio_rb32(pb);
670         track->edit_rate.den = avio_rb32(pb);
671         break;
672     case 0x4803:
673         avio_read(pb, track->sequence_ref, 16);
674         break;
675     }
676     return 0;
677 }
678
679 static int mxf_read_sequence(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
680 {
681     MXFSequence *sequence = arg;
682     switch(tag) {
683     case 0x0202:
684         sequence->duration = avio_rb64(pb);
685         break;
686     case 0x0201:
687         avio_read(pb, sequence->data_definition_ul, 16);
688         break;
689     case 0x1001:
690         sequence->structural_components_count = avio_rb32(pb);
691         if (sequence->structural_components_count >= UINT_MAX / sizeof(UID))
692             return AVERROR_INVALIDDATA;
693         sequence->structural_components_refs = av_malloc(sequence->structural_components_count * sizeof(UID));
694         if (!sequence->structural_components_refs)
695             return AVERROR(ENOMEM);
696         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
697         avio_read(pb, (uint8_t *)sequence->structural_components_refs, sequence->structural_components_count * sizeof(UID));
698         break;
699     }
700     return 0;
701 }
702
703 static int mxf_read_source_package(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
704 {
705     MXFPackage *package = arg;
706     switch(tag) {
707     case 0x4403:
708         package->tracks_count = avio_rb32(pb);
709         if (package->tracks_count >= UINT_MAX / sizeof(UID))
710             return AVERROR_INVALIDDATA;
711         package->tracks_refs = av_malloc(package->tracks_count * sizeof(UID));
712         if (!package->tracks_refs)
713             return AVERROR(ENOMEM);
714         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
715         avio_read(pb, (uint8_t *)package->tracks_refs, package->tracks_count * sizeof(UID));
716         break;
717     case 0x4401:
718         /* UMID, only get last 16 bytes */
719         avio_skip(pb, 16);
720         avio_read(pb, package->package_uid, 16);
721         break;
722     case 0x4701:
723         avio_read(pb, package->descriptor_ref, 16);
724         break;
725     }
726     return 0;
727 }
728
729 static int mxf_read_index_entry_array(AVIOContext *pb, MXFIndexTableSegment *segment)
730 {
731     int i, length;
732
733     segment->nb_index_entries = avio_rb32(pb);
734     if (!segment->nb_index_entries)
735         return 0;
736     else if (segment->nb_index_entries < 0 ||
737              segment->nb_index_entries >
738              (INT_MAX / sizeof(*segment->stream_offset_entries)))
739         return AVERROR(ENOMEM);
740
741     length = avio_rb32(pb);
742
743     segment->temporal_offset_entries = av_mallocz(segment->nb_index_entries *
744                                  sizeof(*segment->temporal_offset_entries));
745     segment->flag_entries            = av_mallocz(segment->nb_index_entries *
746                                  sizeof(*segment->flag_entries));
747     segment->stream_offset_entries   = av_mallocz(segment->nb_index_entries *
748                                  sizeof(*segment->stream_offset_entries));
749
750     if (!segment->flag_entries || !segment->stream_offset_entries ||
751         !segment->temporal_offset_entries) {
752         av_freep(&segment->flag_entries);
753         av_freep(&segment->stream_offset_entries);
754         av_freep(&segment->temporal_offset_entries);
755         return AVERROR(ENOMEM);
756     }
757
758     for (i = 0; i < segment->nb_index_entries; i++) {
759         segment->temporal_offset_entries[i] = avio_r8(pb);
760         avio_r8(pb);                                        /* KeyFrameOffset */
761         segment->flag_entries[i] = avio_r8(pb);
762         segment->stream_offset_entries[i] = avio_rb64(pb);
763         avio_skip(pb, length - 11);
764     }
765     return 0;
766 }
767
768 static int mxf_read_index_table_segment(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
769 {
770     MXFIndexTableSegment *segment = arg;
771     switch(tag) {
772     case 0x3F05:
773         segment->edit_unit_byte_count = avio_rb32(pb);
774         av_dlog(NULL, "EditUnitByteCount %d\n", segment->edit_unit_byte_count);
775         break;
776     case 0x3F06:
777         segment->index_sid = avio_rb32(pb);
778         av_dlog(NULL, "IndexSID %d\n", segment->index_sid);
779         break;
780     case 0x3F07:
781         segment->body_sid = avio_rb32(pb);
782         av_dlog(NULL, "BodySID %d\n", segment->body_sid);
783         break;
784     case 0x3F0A:
785         av_dlog(NULL, "IndexEntryArray found\n");
786         return mxf_read_index_entry_array(pb, segment);
787     case 0x3F0B:
788         segment->index_edit_rate.num = avio_rb32(pb);
789         segment->index_edit_rate.den = avio_rb32(pb);
790         av_dlog(NULL, "IndexEditRate %d/%d\n", segment->index_edit_rate.num,
791                 segment->index_edit_rate.den);
792         break;
793     case 0x3F0C:
794         segment->index_start_position = avio_rb64(pb);
795         av_dlog(NULL, "IndexStartPosition %"PRId64"\n", segment->index_start_position);
796         break;
797     case 0x3F0D:
798         segment->index_duration = avio_rb64(pb);
799         av_dlog(NULL, "IndexDuration %"PRId64"\n", segment->index_duration);
800         break;
801     }
802     return 0;
803 }
804
805 static void mxf_read_pixel_layout(AVIOContext *pb, MXFDescriptor *descriptor)
806 {
807     int code, value, ofs = 0;
808     char layout[16] = {0};
809
810     do {
811         code = avio_r8(pb);
812         value = avio_r8(pb);
813         av_dlog(NULL, "pixel layout: code %#x\n", code);
814
815         if (ofs < 16) {
816             layout[ofs++] = code;
817             layout[ofs++] = value;
818         }
819     } while (code != 0); /* SMPTE 377M E.2.46 */
820
821     ff_mxf_decode_pixel_layout(layout, &descriptor->pix_fmt);
822 }
823
824 static int mxf_read_generic_descriptor(void *arg, AVIOContext *pb, int tag, int size, UID uid, int64_t klv_offset)
825 {
826     MXFDescriptor *descriptor = arg;
827     descriptor->pix_fmt = AV_PIX_FMT_NONE;
828     switch(tag) {
829     case 0x3F01:
830         descriptor->sub_descriptors_count = avio_rb32(pb);
831         if (descriptor->sub_descriptors_count >= UINT_MAX / sizeof(UID))
832             return AVERROR_INVALIDDATA;
833         descriptor->sub_descriptors_refs = av_malloc(descriptor->sub_descriptors_count * sizeof(UID));
834         if (!descriptor->sub_descriptors_refs)
835             return AVERROR(ENOMEM);
836         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
837         avio_read(pb, (uint8_t *)descriptor->sub_descriptors_refs, descriptor->sub_descriptors_count * sizeof(UID));
838         break;
839     case 0x3004:
840         avio_read(pb, descriptor->essence_container_ul, 16);
841         break;
842     case 0x3006:
843         descriptor->linked_track_id = avio_rb32(pb);
844         break;
845     case 0x3201: /* PictureEssenceCoding */
846         avio_read(pb, descriptor->essence_codec_ul, 16);
847         break;
848     case 0x3203:
849         descriptor->width = avio_rb32(pb);
850         break;
851     case 0x3202:
852         descriptor->height = avio_rb32(pb);
853         break;
854     case 0x320C:
855         descriptor->frame_layout = avio_r8(pb);
856         break;
857     case 0x320E:
858         descriptor->aspect_ratio.num = avio_rb32(pb);
859         descriptor->aspect_ratio.den = avio_rb32(pb);
860         break;
861     case 0x3212:
862         descriptor->field_dominance = avio_r8(pb);
863         break;
864     case 0x3301:
865         descriptor->component_depth = avio_rb32(pb);
866         break;
867     case 0x3302:
868         descriptor->horiz_subsampling = avio_rb32(pb);
869         break;
870     case 0x3308:
871         descriptor->vert_subsampling = avio_rb32(pb);
872         break;
873     case 0x3D03:
874         descriptor->sample_rate.num = avio_rb32(pb);
875         descriptor->sample_rate.den = avio_rb32(pb);
876         break;
877     case 0x3D06: /* SoundEssenceCompression */
878         avio_read(pb, descriptor->essence_codec_ul, 16);
879         break;
880     case 0x3D07:
881         descriptor->channels = avio_rb32(pb);
882         break;
883     case 0x3D01:
884         descriptor->bits_per_sample = avio_rb32(pb);
885         break;
886     case 0x3401:
887         mxf_read_pixel_layout(pb, descriptor);
888         break;
889     default:
890         /* Private uid used by SONY C0023S01.mxf */
891         if (IS_KLV_KEY(uid, mxf_sony_mpeg4_extradata)) {
892             av_free(descriptor->extradata);
893             descriptor->extradata_size = 0;
894             descriptor->extradata = av_malloc(size + FF_INPUT_BUFFER_PADDING_SIZE);
895             if (!descriptor->extradata)
896                 return AVERROR(ENOMEM);
897             descriptor->extradata_size = size;
898             avio_read(pb, descriptor->extradata, size);
899         }
900         break;
901     }
902     return 0;
903 }
904
905 /*
906  * Match an uid independently of the version byte and up to len common bytes
907  * Returns: boolean
908  */
909 static int mxf_match_uid(const UID key, const UID uid, int len)
910 {
911     int i;
912     for (i = 0; i < len; i++) {
913         if (i != 7 && key[i] != uid[i])
914             return 0;
915     }
916     return 1;
917 }
918
919 static const MXFCodecUL *mxf_get_codec_ul(const MXFCodecUL *uls, UID *uid)
920 {
921     while (uls->uid[0]) {
922         if(mxf_match_uid(uls->uid, *uid, uls->matching_len))
923             break;
924         uls++;
925     }
926     return uls;
927 }
928
929 static void *mxf_resolve_strong_ref(MXFContext *mxf, UID *strong_ref, enum MXFMetadataSetType type)
930 {
931     int i;
932
933     if (!strong_ref)
934         return NULL;
935     for (i = 0; i < mxf->metadata_sets_count; i++) {
936         if (!memcmp(*strong_ref, mxf->metadata_sets[i]->uid, 16) &&
937             (type == AnyType || mxf->metadata_sets[i]->type == type)) {
938             return mxf->metadata_sets[i];
939         }
940     }
941     return NULL;
942 }
943
944 static const MXFCodecUL mxf_picture_essence_container_uls[] = {
945     // video essence container uls
946     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x02,0x0d,0x01,0x03,0x01,0x02,0x04,0x60,0x01 }, 14, AV_CODEC_ID_MPEG2VIDEO }, /* MPEG-ES Frame wrapped */
947     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x01,0x0d,0x01,0x03,0x01,0x02,0x02,0x41,0x01 }, 14,    AV_CODEC_ID_DVVIDEO }, /* DV 625 25mbps */
948     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x01,0x0d,0x01,0x03,0x01,0x02,0x05,0x00,0x00 }, 14,   AV_CODEC_ID_RAWVIDEO }, /* Uncompressed Picture */
949     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 },  0,      AV_CODEC_ID_NONE },
950 };
951
952 /* EC ULs for intra-only formats */
953 static const MXFCodecUL mxf_intra_only_essence_container_uls[] = {
954     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x01,0x0d,0x01,0x03,0x01,0x02,0x01,0x00,0x00 }, 14, AV_CODEC_ID_MPEG2VIDEO }, /* MXF-GC SMPTE D-10 Mappings */
955     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 },  0,       AV_CODEC_ID_NONE },
956 };
957
958 /* intra-only PictureEssenceCoding ULs, where no corresponding EC UL exists */
959 static const MXFCodecUL mxf_intra_only_picture_essence_coding_uls[] = {
960     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x0A,0x04,0x01,0x02,0x02,0x01,0x32,0x00,0x00 }, 14,       AV_CODEC_ID_H264 }, /* H.264/MPEG-4 AVC Intra Profiles */
961     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x07,0x04,0x01,0x02,0x02,0x03,0x01,0x01,0x00 }, 14,   AV_CODEC_ID_JPEG2000 }, /* JPEG2000 Codestream */
962     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 },  0,       AV_CODEC_ID_NONE },
963 };
964
965 static const MXFCodecUL mxf_sound_essence_container_uls[] = {
966     // sound essence container uls
967     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x01,0x0d,0x01,0x03,0x01,0x02,0x06,0x01,0x00 }, 14, AV_CODEC_ID_PCM_S16LE }, /* BWF Frame wrapped */
968     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x02,0x0d,0x01,0x03,0x01,0x02,0x04,0x40,0x01 }, 14,       AV_CODEC_ID_MP2 }, /* MPEG-ES Frame wrapped, 0x40 ??? stream id */
969     { { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x01,0x0d,0x01,0x03,0x01,0x02,0x01,0x01,0x01 }, 14, AV_CODEC_ID_PCM_S16LE }, /* D-10 Mapping 50Mbps PAL Extended Template */
970     { { 0x06,0x0e,0x2b,0x34,0x01,0x01,0x01,0xff,0x4b,0x46,0x41,0x41,0x00,0x0d,0x4d,0x4F }, 14, AV_CODEC_ID_PCM_S16LE }, /* 0001GL00.MXF.A1.mxf_opatom.mxf */
971     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 },  0,      AV_CODEC_ID_NONE },
972 };
973
974 static int mxf_get_sorted_table_segments(MXFContext *mxf, int *nb_sorted_segments, MXFIndexTableSegment ***sorted_segments)
975 {
976     int i, j, nb_segments = 0;
977     MXFIndexTableSegment **unsorted_segments;
978     int last_body_sid = -1, last_index_sid = -1, last_index_start = -1;
979
980     /* count number of segments, allocate arrays and copy unsorted segments */
981     for (i = 0; i < mxf->metadata_sets_count; i++)
982         if (mxf->metadata_sets[i]->type == IndexTableSegment)
983             nb_segments++;
984
985     if (!nb_segments)
986         return AVERROR_INVALIDDATA;
987
988     *sorted_segments  = av_mallocz(nb_segments * sizeof(**sorted_segments));
989     unsorted_segments = av_mallocz(nb_segments * sizeof(*unsorted_segments));
990     if (!*sorted_segments || !unsorted_segments) {
991         av_freep(sorted_segments);
992         av_free(unsorted_segments);
993         return AVERROR(ENOMEM);
994     }
995
996     for (i = j = 0; i < mxf->metadata_sets_count; i++)
997         if (mxf->metadata_sets[i]->type == IndexTableSegment)
998             unsorted_segments[j++] = (MXFIndexTableSegment*)mxf->metadata_sets[i];
999
1000     *nb_sorted_segments = 0;
1001
1002     /* sort segments by {BodySID, IndexSID, IndexStartPosition}, remove duplicates while we're at it */
1003     for (i = 0; i < nb_segments; i++) {
1004         int best = -1, best_body_sid = -1, best_index_sid = -1, best_index_start = -1;
1005         uint64_t best_index_duration = 0;
1006
1007         for (j = 0; j < nb_segments; j++) {
1008             MXFIndexTableSegment *s = unsorted_segments[j];
1009
1010             /* Require larger BosySID, IndexSID or IndexStartPosition then the previous entry. This removes duplicates.
1011              * We want the smallest values for the keys than what we currently have, unless this is the first such entry this time around.
1012              * If we come across an entry with the same IndexStartPosition but larger IndexDuration, then we'll prefer it over the one we currently have.
1013              */
1014             if ((i == 0     || s->body_sid > last_body_sid || s->index_sid > last_index_sid || s->index_start_position > last_index_start) &&
1015                 (best == -1 || s->body_sid < best_body_sid || s->index_sid < best_index_sid || s->index_start_position < best_index_start ||
1016                 (s->index_start_position == best_index_start && s->index_duration > best_index_duration))) {
1017                 best             = j;
1018                 best_body_sid    = s->body_sid;
1019                 best_index_sid   = s->index_sid;
1020                 best_index_start = s->index_start_position;
1021                 best_index_duration = s->index_duration;
1022             }
1023         }
1024
1025         /* no suitable entry found -> we're done */
1026         if (best == -1)
1027             break;
1028
1029         (*sorted_segments)[(*nb_sorted_segments)++] = unsorted_segments[best];
1030         last_body_sid    = best_body_sid;
1031         last_index_sid   = best_index_sid;
1032         last_index_start = best_index_start;
1033     }
1034
1035     av_free(unsorted_segments);
1036
1037     return 0;
1038 }
1039
1040 /**
1041  * Computes the absolute file offset of the given essence container offset
1042  */
1043 static int mxf_absolute_bodysid_offset(MXFContext *mxf, int body_sid, int64_t offset, int64_t *offset_out)
1044 {
1045     int x;
1046     int64_t offset_in = offset;     /* for logging */
1047
1048     for (x = 0; x < mxf->partitions_count; x++) {
1049         MXFPartition *p = &mxf->partitions[x];
1050
1051         if (p->body_sid != body_sid)
1052             continue;
1053
1054         if (offset < p->essence_length || !p->essence_length) {
1055             *offset_out = p->essence_offset + offset;
1056             return 0;
1057         }
1058
1059         offset -= p->essence_length;
1060     }
1061
1062     av_log(mxf->fc, AV_LOG_ERROR,
1063            "failed to find absolute offset of %"PRIX64" in BodySID %i - partial file?\n",
1064            offset_in, body_sid);
1065
1066     return AVERROR_INVALIDDATA;
1067 }
1068
1069 /**
1070  * Returns the end position of the essence container with given BodySID, or zero if unknown
1071  */
1072 static int64_t mxf_essence_container_end(MXFContext *mxf, int body_sid)
1073 {
1074     int x;
1075     int64_t ret = 0;
1076
1077     for (x = 0; x < mxf->partitions_count; x++) {
1078         MXFPartition *p = &mxf->partitions[x];
1079
1080         if (p->body_sid != body_sid)
1081             continue;
1082
1083         if (!p->essence_length)
1084             return 0;
1085
1086         ret = p->essence_offset + p->essence_length;
1087     }
1088
1089     return ret;
1090 }
1091
1092 /* EditUnit -> absolute offset */
1093 static int mxf_edit_unit_absolute_offset(MXFContext *mxf, MXFIndexTable *index_table, int64_t edit_unit, int64_t *edit_unit_out, int64_t *offset_out, int nag)
1094 {
1095     int i;
1096     int64_t offset_temp = 0;
1097
1098     for (i = 0; i < index_table->nb_segments; i++) {
1099         MXFIndexTableSegment *s = index_table->segments[i];
1100
1101         edit_unit = FFMAX(edit_unit, s->index_start_position);  /* clamp if trying to seek before start */
1102
1103         if (edit_unit < s->index_start_position + s->index_duration) {
1104             int64_t index = edit_unit - s->index_start_position;
1105
1106             if (s->edit_unit_byte_count)
1107                 offset_temp += s->edit_unit_byte_count * index;
1108             else if (s->nb_index_entries) {
1109                 if (s->nb_index_entries == 2 * s->index_duration + 1)
1110                     index *= 2;     /* Avid index */
1111
1112                 if (index < 0 || index >= s->nb_index_entries) {
1113                     av_log(mxf->fc, AV_LOG_ERROR, "IndexSID %i segment at %"PRId64" IndexEntryArray too small\n",
1114                            index_table->index_sid, s->index_start_position);
1115                     return AVERROR_INVALIDDATA;
1116                 }
1117
1118                 offset_temp = s->stream_offset_entries[index];
1119             } else {
1120                 av_log(mxf->fc, AV_LOG_ERROR, "IndexSID %i segment at %"PRId64" missing EditUnitByteCount and IndexEntryArray\n",
1121                        index_table->index_sid, s->index_start_position);
1122                 return AVERROR_INVALIDDATA;
1123             }
1124
1125             if (edit_unit_out)
1126                 *edit_unit_out = edit_unit;
1127
1128             return mxf_absolute_bodysid_offset(mxf, index_table->body_sid, offset_temp, offset_out);
1129         } else {
1130             /* EditUnitByteCount == 0 for VBR indexes, which is fine since they use explicit StreamOffsets */
1131             offset_temp += s->edit_unit_byte_count * s->index_duration;
1132         }
1133     }
1134
1135     if (nag)
1136         av_log(mxf->fc, AV_LOG_ERROR, "failed to map EditUnit %"PRId64" in IndexSID %i to an offset\n", edit_unit, index_table->index_sid);
1137
1138     return AVERROR_INVALIDDATA;
1139 }
1140
1141 static int mxf_compute_ptses_fake_index(MXFContext *mxf, MXFIndexTable *index_table)
1142 {
1143     int i, j, x;
1144     int8_t max_temporal_offset = -128;
1145
1146     /* first compute how many entries we have */
1147     for (i = 0; i < index_table->nb_segments; i++) {
1148         MXFIndexTableSegment *s = index_table->segments[i];
1149
1150         if (!s->nb_index_entries) {
1151             index_table->nb_ptses = 0;
1152             return 0;                               /* no TemporalOffsets */
1153         }
1154
1155         index_table->nb_ptses += s->index_duration;
1156     }
1157
1158     /* paranoid check */
1159     if (index_table->nb_ptses <= 0)
1160         return 0;
1161
1162     if (index_table->nb_ptses > INT_MAX / sizeof(AVIndexEntry))
1163         return AVERROR(ENOMEM);
1164
1165     index_table->ptses      = av_mallocz(index_table->nb_ptses *
1166                                          sizeof(int64_t));
1167     index_table->fake_index = av_mallocz(index_table->nb_ptses *
1168                                          sizeof(AVIndexEntry));
1169     if (!index_table->ptses || !index_table->fake_index) {
1170         av_freep(&index_table->ptses);
1171         return AVERROR(ENOMEM);
1172     }
1173
1174     /* we may have a few bad TemporalOffsets
1175      * make sure the corresponding PTSes don't have the bogus value 0 */
1176     for (x = 0; x < index_table->nb_ptses; x++)
1177         index_table->ptses[x] = AV_NOPTS_VALUE;
1178
1179     /**
1180      * We have this:
1181      *
1182      * x  TemporalOffset
1183      * 0:  0
1184      * 1:  1
1185      * 2:  1
1186      * 3: -2
1187      * 4:  1
1188      * 5:  1
1189      * 6: -2
1190      *
1191      * We want to transform it into this:
1192      *
1193      * x  DTS PTS
1194      * 0: -1   0
1195      * 1:  0   3
1196      * 2:  1   1
1197      * 3:  2   2
1198      * 4:  3   6
1199      * 5:  4   4
1200      * 6:  5   5
1201      *
1202      * We do this by bucket sorting x by x+TemporalOffset[x] into mxf->ptses,
1203      * then settings mxf->first_dts = -max(TemporalOffset[x]).
1204      * The latter makes DTS <= PTS.
1205      */
1206     for (i = x = 0; i < index_table->nb_segments; i++) {
1207         MXFIndexTableSegment *s = index_table->segments[i];
1208         int index_delta = 1;
1209         int n = s->nb_index_entries;
1210
1211         if (s->nb_index_entries == 2 * s->index_duration + 1) {
1212             index_delta = 2;    /* Avid index */
1213             /* ignore the last entry - it's the size of the essence container */
1214             n--;
1215         }
1216
1217         for (j = 0; j < n; j += index_delta, x++) {
1218             int offset = s->temporal_offset_entries[j] / index_delta;
1219             int index  = x + offset;
1220
1221             if (x >= index_table->nb_ptses) {
1222                 av_log(mxf->fc, AV_LOG_ERROR,
1223                        "x >= nb_ptses - IndexEntryCount %i < IndexDuration %"PRId64"?\n",
1224                        s->nb_index_entries, s->index_duration);
1225                 break;
1226             }
1227
1228             index_table->fake_index[x].timestamp = x;
1229             index_table->fake_index[x].flags = !(s->flag_entries[j] & 0x30) ? AVINDEX_KEYFRAME : 0;
1230
1231             if (index < 0 || index >= index_table->nb_ptses) {
1232                 av_log(mxf->fc, AV_LOG_ERROR,
1233                        "index entry %i + TemporalOffset %i = %i, which is out of bounds\n",
1234                        x, offset, index);
1235                 continue;
1236             }
1237
1238             index_table->ptses[index] = x;
1239             max_temporal_offset = FFMAX(max_temporal_offset, offset);
1240         }
1241     }
1242
1243     index_table->first_dts = -max_temporal_offset;
1244
1245     return 0;
1246 }
1247
1248 /**
1249  * Sorts and collects index table segments into index tables.
1250  * Also computes PTSes if possible.
1251  */
1252 static int mxf_compute_index_tables(MXFContext *mxf)
1253 {
1254     int i, j, k, ret, nb_sorted_segments;
1255     MXFIndexTableSegment **sorted_segments = NULL;
1256
1257     if ((ret = mxf_get_sorted_table_segments(mxf, &nb_sorted_segments, &sorted_segments)) ||
1258         nb_sorted_segments <= 0) {
1259         av_log(mxf->fc, AV_LOG_WARNING, "broken or empty index\n");
1260         return 0;
1261     }
1262
1263     /* sanity check and count unique BodySIDs/IndexSIDs */
1264     for (i = 0; i < nb_sorted_segments; i++) {
1265         if (i == 0 || sorted_segments[i-1]->index_sid != sorted_segments[i]->index_sid)
1266             mxf->nb_index_tables++;
1267         else if (sorted_segments[i-1]->body_sid != sorted_segments[i]->body_sid) {
1268             av_log(mxf->fc, AV_LOG_ERROR, "found inconsistent BodySID\n");
1269             ret = AVERROR_INVALIDDATA;
1270             goto finish_decoding_index;
1271         }
1272     }
1273
1274     mxf->index_tables = av_mallocz_array(mxf->nb_index_tables,
1275                                          sizeof(*mxf->index_tables));
1276     if (!mxf->index_tables) {
1277         av_log(mxf->fc, AV_LOG_ERROR, "failed to allocate index tables\n");
1278         ret = AVERROR(ENOMEM);
1279         goto finish_decoding_index;
1280     }
1281
1282     /* distribute sorted segments to index tables */
1283     for (i = j = 0; i < nb_sorted_segments; i++) {
1284         if (i != 0 && sorted_segments[i-1]->index_sid != sorted_segments[i]->index_sid) {
1285             /* next IndexSID */
1286             j++;
1287         }
1288
1289         mxf->index_tables[j].nb_segments++;
1290     }
1291
1292     for (i = j = 0; j < mxf->nb_index_tables; i += mxf->index_tables[j++].nb_segments) {
1293         MXFIndexTable *t = &mxf->index_tables[j];
1294
1295         t->segments = av_mallocz_array(t->nb_segments,
1296                                        sizeof(*t->segments));
1297
1298         if (!t->segments) {
1299             av_log(mxf->fc, AV_LOG_ERROR, "failed to allocate IndexTableSegment"
1300                    " pointer array\n");
1301             ret = AVERROR(ENOMEM);
1302             goto finish_decoding_index;
1303         }
1304
1305         if (sorted_segments[i]->index_start_position)
1306             av_log(mxf->fc, AV_LOG_WARNING, "IndexSID %i starts at EditUnit %"PRId64" - seeking may not work as expected\n",
1307                    sorted_segments[i]->index_sid, sorted_segments[i]->index_start_position);
1308
1309         memcpy(t->segments, &sorted_segments[i], t->nb_segments * sizeof(MXFIndexTableSegment*));
1310         t->index_sid = sorted_segments[i]->index_sid;
1311         t->body_sid = sorted_segments[i]->body_sid;
1312
1313         if ((ret = mxf_compute_ptses_fake_index(mxf, t)) < 0)
1314             goto finish_decoding_index;
1315
1316         /* fix zero IndexDurations */
1317         for (k = 0; k < t->nb_segments; k++) {
1318             if (t->segments[k]->index_duration)
1319                 continue;
1320
1321             if (t->nb_segments > 1)
1322                 av_log(mxf->fc, AV_LOG_WARNING, "IndexSID %i segment %i has zero IndexDuration and there's more than one segment\n",
1323                        t->index_sid, k);
1324
1325             if (mxf->fc->nb_streams <= 0) {
1326                 av_log(mxf->fc, AV_LOG_WARNING, "no streams?\n");
1327                 break;
1328             }
1329
1330             /* assume the first stream's duration is reasonable
1331              * leave index_duration = 0 on further segments in case we have any (unlikely)
1332              */
1333             t->segments[k]->index_duration = mxf->fc->streams[0]->duration;
1334             break;
1335         }
1336     }
1337
1338     ret = 0;
1339 finish_decoding_index:
1340     av_free(sorted_segments);
1341     return ret;
1342 }
1343
1344 static int mxf_is_intra_only(MXFDescriptor *d)
1345 {
1346     return mxf_get_codec_ul(mxf_intra_only_essence_container_uls,
1347                             &d->essence_container_ul)->id != AV_CODEC_ID_NONE ||
1348            mxf_get_codec_ul(mxf_intra_only_picture_essence_coding_uls,
1349                             &d->essence_codec_ul)->id     != AV_CODEC_ID_NONE;
1350 }
1351
1352 static int mxf_parse_structural_metadata(MXFContext *mxf)
1353 {
1354     MXFPackage *material_package = NULL;
1355     MXFPackage *temp_package = NULL;
1356     int i, j, k, ret;
1357
1358     av_dlog(mxf->fc, "metadata sets count %d\n", mxf->metadata_sets_count);
1359     /* TODO: handle multiple material packages (OP3x) */
1360     for (i = 0; i < mxf->packages_count; i++) {
1361         material_package = mxf_resolve_strong_ref(mxf, &mxf->packages_refs[i], MaterialPackage);
1362         if (material_package) break;
1363     }
1364     if (!material_package) {
1365         av_log(mxf->fc, AV_LOG_ERROR, "no material package found\n");
1366         return AVERROR_INVALIDDATA;
1367     }
1368
1369     for (i = 0; i < material_package->tracks_count; i++) {
1370         MXFPackage *source_package = NULL;
1371         MXFTrack *material_track = NULL;
1372         MXFTrack *source_track = NULL;
1373         MXFTrack *temp_track = NULL;
1374         MXFDescriptor *descriptor = NULL;
1375         MXFStructuralComponent *component = NULL;
1376         UID *essence_container_ul = NULL;
1377         const MXFCodecUL *codec_ul = NULL;
1378         const MXFCodecUL *container_ul = NULL;
1379         const MXFCodecUL *pix_fmt_ul = NULL;
1380         AVStream *st;
1381
1382         if (!(material_track = mxf_resolve_strong_ref(mxf, &material_package->tracks_refs[i], Track))) {
1383             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve material track strong ref\n");
1384             continue;
1385         }
1386
1387         if (!(material_track->sequence = mxf_resolve_strong_ref(mxf, &material_track->sequence_ref, Sequence))) {
1388             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve material track sequence strong ref\n");
1389             continue;
1390         }
1391
1392         /* TODO: handle multiple source clips */
1393         for (j = 0; j < material_track->sequence->structural_components_count; j++) {
1394             /* TODO: handle timecode component */
1395             component = mxf_resolve_strong_ref(mxf, &material_track->sequence->structural_components_refs[j], SourceClip);
1396             if (!component)
1397                 continue;
1398
1399             for (k = 0; k < mxf->packages_count; k++) {
1400                 temp_package = mxf_resolve_strong_ref(mxf, &mxf->packages_refs[k], SourcePackage);
1401                 if (!temp_package)
1402                     continue;
1403                 if (!memcmp(temp_package->package_uid, component->source_package_uid, 16)) {
1404                     source_package = temp_package;
1405                     break;
1406                 }
1407             }
1408             if (!source_package) {
1409                 av_dlog(mxf->fc, "material track %d: no corresponding source package found\n", material_track->track_id);
1410                 break;
1411             }
1412             for (k = 0; k < source_package->tracks_count; k++) {
1413                 if (!(temp_track = mxf_resolve_strong_ref(mxf, &source_package->tracks_refs[k], Track))) {
1414                     av_log(mxf->fc, AV_LOG_ERROR, "could not resolve source track strong ref\n");
1415                     ret = AVERROR_INVALIDDATA;
1416                     goto fail_and_free;
1417                 }
1418                 if (temp_track->track_id == component->source_track_id) {
1419                     source_track = temp_track;
1420                     break;
1421                 }
1422             }
1423             if (!source_track) {
1424                 av_log(mxf->fc, AV_LOG_ERROR, "material track %d: no corresponding source track found\n", material_track->track_id);
1425                 break;
1426             }
1427         }
1428         if (!source_track || !component)
1429             continue;
1430
1431         if (!(source_track->sequence = mxf_resolve_strong_ref(mxf, &source_track->sequence_ref, Sequence))) {
1432             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve source track sequence strong ref\n");
1433             ret = AVERROR_INVALIDDATA;
1434             goto fail_and_free;
1435         }
1436
1437         /* 0001GL00.MXF.A1.mxf_opatom.mxf has the same SourcePackageID as 0001GL.MXF.V1.mxf_opatom.mxf
1438          * This would result in both files appearing to have two streams. Work around this by sanity checking DataDefinition */
1439         if (memcmp(material_track->sequence->data_definition_ul, source_track->sequence->data_definition_ul, 16)) {
1440             av_log(mxf->fc, AV_LOG_ERROR, "material track %d: DataDefinition mismatch\n", material_track->track_id);
1441             continue;
1442         }
1443
1444         st = avformat_new_stream(mxf->fc, NULL);
1445         if (!st) {
1446             av_log(mxf->fc, AV_LOG_ERROR, "could not allocate stream\n");
1447             ret = AVERROR(ENOMEM);
1448             goto fail_and_free;
1449         }
1450         st->id = source_track->track_id;
1451         st->priv_data = source_track;
1452         source_track->original_duration = st->duration = component->duration;
1453         if (st->duration == -1)
1454             st->duration = AV_NOPTS_VALUE;
1455         st->start_time = component->start_position;
1456         if (material_track->edit_rate.num <= 0 ||
1457             material_track->edit_rate.den <= 0) {
1458             av_log(mxf->fc, AV_LOG_WARNING,
1459                    "Invalid edit rate (%d/%d) found on stream #%d, "
1460                    "defaulting to 25/1\n",
1461                    material_track->edit_rate.num,
1462                    material_track->edit_rate.den, st->index);
1463             material_track->edit_rate = (AVRational){25, 1};
1464         }
1465         avpriv_set_pts_info(st, 64, material_track->edit_rate.den, material_track->edit_rate.num);
1466
1467         /* ensure SourceTrack EditRate == MaterialTrack EditRate since only
1468          * the former is accessible via st->priv_data */
1469         source_track->edit_rate = material_track->edit_rate;
1470
1471         PRINT_KEY(mxf->fc, "data definition   ul", source_track->sequence->data_definition_ul);
1472         codec_ul = mxf_get_codec_ul(ff_mxf_data_definition_uls, &source_track->sequence->data_definition_ul);
1473         st->codec->codec_type = codec_ul->id;
1474
1475         source_package->descriptor = mxf_resolve_strong_ref(mxf, &source_package->descriptor_ref, AnyType);
1476         if (source_package->descriptor) {
1477             if (source_package->descriptor->type == MultipleDescriptor) {
1478                 for (j = 0; j < source_package->descriptor->sub_descriptors_count; j++) {
1479                     MXFDescriptor *sub_descriptor = mxf_resolve_strong_ref(mxf, &source_package->descriptor->sub_descriptors_refs[j], Descriptor);
1480
1481                     if (!sub_descriptor) {
1482                         av_log(mxf->fc, AV_LOG_ERROR, "could not resolve sub descriptor strong ref\n");
1483                         continue;
1484                     }
1485                     if (sub_descriptor->linked_track_id == source_track->track_id) {
1486                         descriptor = sub_descriptor;
1487                         break;
1488                     }
1489                 }
1490             } else if (source_package->descriptor->type == Descriptor)
1491                 descriptor = source_package->descriptor;
1492         }
1493         if (!descriptor) {
1494             av_log(mxf->fc, AV_LOG_INFO, "source track %d: stream %d, no descriptor found\n", source_track->track_id, st->index);
1495             continue;
1496         }
1497         PRINT_KEY(mxf->fc, "essence codec     ul", descriptor->essence_codec_ul);
1498         PRINT_KEY(mxf->fc, "essence container ul", descriptor->essence_container_ul);
1499         essence_container_ul = &descriptor->essence_container_ul;
1500         /* HACK: replacing the original key with mxf_encrypted_essence_container
1501          * is not allowed according to s429-6, try to find correct information anyway */
1502         if (IS_KLV_KEY(essence_container_ul, mxf_encrypted_essence_container)) {
1503             av_log(mxf->fc, AV_LOG_INFO, "broken encrypted mxf file\n");
1504             for (k = 0; k < mxf->metadata_sets_count; k++) {
1505                 MXFMetadataSet *metadata = mxf->metadata_sets[k];
1506                 if (metadata->type == CryptoContext) {
1507                     essence_container_ul = &((MXFCryptoContext *)metadata)->source_container_ul;
1508                     break;
1509                 }
1510             }
1511         }
1512
1513         /* TODO: drop PictureEssenceCoding and SoundEssenceCompression, only check EssenceContainer */
1514         codec_ul = mxf_get_codec_ul(ff_mxf_codec_uls, &descriptor->essence_codec_ul);
1515         st->codec->codec_id = codec_ul->id;
1516
1517         if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO) {
1518             source_track->intra_only = mxf_is_intra_only(descriptor);
1519             container_ul = mxf_get_codec_ul(mxf_picture_essence_container_uls, essence_container_ul);
1520             if (st->codec->codec_id == AV_CODEC_ID_NONE)
1521                 st->codec->codec_id = container_ul->id;
1522             st->codec->width = descriptor->width;
1523             /* Field height, not frame height */
1524             st->codec->height = descriptor->height;
1525             switch (descriptor->frame_layout) {
1526                 case SegmentedFrame:
1527                     /* This one is a weird layout I don't fully understand. */
1528                     av_log(mxf->fc, AV_LOG_INFO,
1529                            "SegmentedFrame layout isn't currently supported\n");
1530                     break;
1531                 case FullFrame:
1532                     st->codec->field_order = AV_FIELD_PROGRESSIVE;
1533                     break;
1534                 case OneField:
1535                     /* Every other line is stored and needs to be duplicated. */
1536                     av_log(mxf->fc, AV_LOG_INFO,
1537                            "OneField frame layout isn't currently supported\n");
1538                     break;
1539                     /* The correct thing to do here is fall through, but by
1540                      * breaking we might be able to decode some streams at half
1541                      * the vertical resolution, rather than not al all.
1542                      * It's also for compatibility with the old behavior. */
1543                 case SeparateFields:
1544                 case MixedFields:
1545                     switch (descriptor->field_dominance) {
1546                     case MXF_TFF:
1547                         st->codec->field_order = AV_FIELD_TT;
1548                         break;
1549                     case MXF_BFF:
1550                         st->codec->field_order = AV_FIELD_BB;
1551                         break;
1552                     default:
1553                         avpriv_request_sample(mxf->fc,
1554                                               "Field dominance %d support",
1555                                               descriptor->field_dominance);
1556                         break;
1557                     }
1558                     /* Turn field height into frame height. */
1559                     st->codec->height *= 2;
1560                 default:
1561                     av_log(mxf->fc, AV_LOG_INFO,
1562                            "Unknown frame layout type: %d\n",
1563                            descriptor->frame_layout);
1564             }
1565             if (st->codec->codec_id == AV_CODEC_ID_RAWVIDEO) {
1566                 st->codec->pix_fmt = descriptor->pix_fmt;
1567                 if (st->codec->pix_fmt == AV_PIX_FMT_NONE) {
1568                     pix_fmt_ul = mxf_get_codec_ul(ff_mxf_pixel_format_uls,
1569                                                   &descriptor->essence_codec_ul);
1570                     st->codec->pix_fmt = pix_fmt_ul->id;
1571                     if (st->codec->pix_fmt == AV_PIX_FMT_NONE) {
1572                         /* support files created before RP224v10 by defaulting to UYVY422
1573                            if subsampling is 4:2:2 and component depth is 8-bit */
1574                         if (descriptor->horiz_subsampling == 2 &&
1575                             descriptor->vert_subsampling == 1 &&
1576                             descriptor->component_depth == 8) {
1577                             st->codec->pix_fmt = AV_PIX_FMT_UYVY422;
1578                         }
1579                     }
1580                 }
1581             }
1582             st->need_parsing = AVSTREAM_PARSE_HEADERS;
1583         } else if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
1584             container_ul = mxf_get_codec_ul(mxf_sound_essence_container_uls, essence_container_ul);
1585             if (st->codec->codec_id == AV_CODEC_ID_NONE)
1586                 st->codec->codec_id = container_ul->id;
1587             st->codec->channels = descriptor->channels;
1588             st->codec->bits_per_coded_sample = descriptor->bits_per_sample;
1589
1590             if (descriptor->sample_rate.den > 0) {
1591                 st->codec->sample_rate = descriptor->sample_rate.num / descriptor->sample_rate.den;
1592                 avpriv_set_pts_info(st, 64, descriptor->sample_rate.den, descriptor->sample_rate.num);
1593             } else {
1594                 av_log(mxf->fc, AV_LOG_WARNING, "invalid sample rate (%d/%d) "
1595                        "found for stream #%d, time base forced to 1/48000\n",
1596                        descriptor->sample_rate.num, descriptor->sample_rate.den,
1597                        st->index);
1598                 avpriv_set_pts_info(st, 64, 1, 48000);
1599             }
1600
1601             /* if duration is set, rescale it from EditRate to SampleRate */
1602             if (st->duration != AV_NOPTS_VALUE)
1603                 st->duration = av_rescale_q(st->duration,
1604                                             av_inv_q(material_track->edit_rate),
1605                                             st->time_base);
1606
1607             /* TODO: implement AV_CODEC_ID_RAWAUDIO */
1608             if (st->codec->codec_id == AV_CODEC_ID_PCM_S16LE) {
1609                 if (descriptor->bits_per_sample > 16 && descriptor->bits_per_sample <= 24)
1610                     st->codec->codec_id = AV_CODEC_ID_PCM_S24LE;
1611                 else if (descriptor->bits_per_sample == 32)
1612                     st->codec->codec_id = AV_CODEC_ID_PCM_S32LE;
1613             } else if (st->codec->codec_id == AV_CODEC_ID_PCM_S16BE) {
1614                 if (descriptor->bits_per_sample > 16 && descriptor->bits_per_sample <= 24)
1615                     st->codec->codec_id = AV_CODEC_ID_PCM_S24BE;
1616                 else if (descriptor->bits_per_sample == 32)
1617                     st->codec->codec_id = AV_CODEC_ID_PCM_S32BE;
1618             } else if (st->codec->codec_id == AV_CODEC_ID_MP2) {
1619                 st->need_parsing = AVSTREAM_PARSE_FULL;
1620             }
1621         }
1622         if (descriptor->extradata) {
1623             st->codec->extradata = av_mallocz(descriptor->extradata_size + FF_INPUT_BUFFER_PADDING_SIZE);
1624             if (st->codec->extradata) {
1625                 memcpy(st->codec->extradata, descriptor->extradata, descriptor->extradata_size);
1626                 st->codec->extradata_size = descriptor->extradata_size;
1627             }
1628         } else if (st->codec->codec_id == AV_CODEC_ID_H264) {
1629             ret = ff_generate_avci_extradata(st);
1630             if (ret < 0)
1631                 return ret;
1632         }
1633         if (st->codec->codec_type != AVMEDIA_TYPE_DATA && (*essence_container_ul)[15] > 0x01) {
1634             /* TODO: decode timestamps */
1635             st->need_parsing = AVSTREAM_PARSE_TIMESTAMPS;
1636         }
1637     }
1638
1639     ret = 0;
1640 fail_and_free:
1641     return ret;
1642 }
1643
1644 static int mxf_read_utf16_string(AVIOContext *pb, int size, char** str)
1645 {
1646     int ret;
1647     size_t buf_size;
1648
1649     if (size < 0)
1650         return AVERROR(EINVAL);
1651
1652     buf_size = size + size / 2 + 1;
1653     *str = av_malloc(buf_size);
1654     if (!*str)
1655         return AVERROR(ENOMEM);
1656
1657     if ((ret = avio_get_str16be(pb, size, *str, buf_size)) < 0) {
1658         av_freep(str);
1659         return ret;
1660     }
1661
1662     return ret;
1663 }
1664
1665 static int mxf_uid_to_str(UID uid, char **str)
1666 {
1667     int i;
1668     char *p;
1669     p = *str = av_mallocz(sizeof(UID) * 2 + 4 + 1);
1670     if (!p)
1671         return AVERROR(ENOMEM);
1672     for (i = 0; i < sizeof(UID); i++) {
1673         snprintf(p, 2 + 1, "%.2x", uid[i]);
1674         p += 2;
1675         if (i == 3 || i == 5 || i == 7 || i == 9) {
1676             snprintf(p, 1 + 1, "-");
1677             p++;
1678         }
1679     }
1680     return 0;
1681 }
1682
1683 static int mxf_timestamp_to_str(uint64_t timestamp, char **str)
1684 {
1685     struct tm time = { 0 };
1686     time.tm_year = (timestamp >> 48) - 1900;
1687     time.tm_mon  = (timestamp >> 40 & 0xFF) - 1;
1688     time.tm_mday = (timestamp >> 32 & 0xFF);
1689     time.tm_hour = (timestamp >> 24 & 0xFF);
1690     time.tm_min  = (timestamp >> 16 & 0xFF);
1691     time.tm_sec  = (timestamp >> 8  & 0xFF);
1692
1693     /* msvcrt versions of strftime calls the invalid parameter handler
1694      * (aborting the process if one isn't set) if the parameters are out
1695      * of range. */
1696     time.tm_mon  = av_clip(time.tm_mon,  0, 11);
1697     time.tm_mday = av_clip(time.tm_mday, 1, 31);
1698     time.tm_hour = av_clip(time.tm_hour, 0, 23);
1699     time.tm_min  = av_clip(time.tm_min,  0, 59);
1700     time.tm_sec  = av_clip(time.tm_sec,  0, 59);
1701
1702     *str = av_mallocz(32);
1703     if (!*str)
1704         return AVERROR(ENOMEM);
1705     strftime(*str, 32, "%Y-%m-%d %H:%M:%S", &time);
1706
1707     return 0;
1708 }
1709
1710 #define SET_STR_METADATA(pb, name, str) do { \
1711     if ((ret = mxf_read_utf16_string(pb, size, &str)) < 0) \
1712         return ret; \
1713     av_dict_set(&s->metadata, name, str, AV_DICT_DONT_STRDUP_VAL); \
1714 } while (0)
1715
1716 #define SET_UID_METADATA(pb, name, var, str) do { \
1717     avio_read(pb, var, 16); \
1718     if ((ret = mxf_uid_to_str(var, &str)) < 0) \
1719         return ret; \
1720     av_dict_set(&s->metadata, name, str, AV_DICT_DONT_STRDUP_VAL); \
1721 } while (0)
1722
1723 #define SET_TS_METADATA(pb, name, var, str) do { \
1724     var = avio_rb64(pb); \
1725     if ((ret = mxf_timestamp_to_str(var, &str)) < 0) \
1726         return ret; \
1727     av_dict_set(&s->metadata, name, str, AV_DICT_DONT_STRDUP_VAL); \
1728 } while (0)
1729
1730 static int mxf_read_identification_metadata(void *arg, AVIOContext *pb, int tag, int size, UID _uid, int64_t klv_offset)
1731 {
1732     MXFContext *mxf = arg;
1733     AVFormatContext *s = mxf->fc;
1734     int ret;
1735     UID uid = { 0 };
1736     char *str = NULL;
1737     uint64_t ts;
1738     switch (tag) {
1739     case 0x3C01:
1740         SET_STR_METADATA(pb, "company_name", str);
1741         break;
1742     case 0x3C02:
1743         SET_STR_METADATA(pb, "product_name", str);
1744         break;
1745     case 0x3C04:
1746         SET_STR_METADATA(pb, "product_version", str);
1747         break;
1748     case 0x3C05:
1749         SET_UID_METADATA(pb, "product_uid", uid, str);
1750         break;
1751     case 0x3C06:
1752         SET_TS_METADATA(pb, "modification_date", ts, str);
1753         break;
1754     case 0x3C08:
1755         SET_STR_METADATA(pb, "application_platform", str);
1756         break;
1757     case 0x3C09:
1758         SET_UID_METADATA(pb, "generation_uid", uid, str);
1759         break;
1760     case 0x3C0A:
1761         SET_UID_METADATA(pb, "uid", uid, str);
1762         break;
1763     }
1764     return 0;
1765 }
1766
1767 static const MXFMetadataReadTableEntry mxf_metadata_read_table[] = {
1768     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x05,0x01,0x00 }, mxf_read_primer_pack },
1769 //    { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x2f,0x00 }, mxf_read_preface_pack },
1770     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x01,0x00 }, mxf_read_partition_pack },
1771     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x02,0x00 }, mxf_read_partition_pack },
1772     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x03,0x00 }, mxf_read_partition_pack },
1773     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x04,0x00 }, mxf_read_partition_pack },
1774     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x01,0x00 }, mxf_read_partition_pack },
1775     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x02,0x00 }, mxf_read_partition_pack },
1776     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x03,0x00 }, mxf_read_partition_pack },
1777     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x04,0x00 }, mxf_read_partition_pack },
1778     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x04,0x02,0x00 }, mxf_read_partition_pack },
1779     { { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x04,0x04,0x00 }, mxf_read_partition_pack },
1780     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x30,0x00 }, mxf_read_identification_metadata },
1781     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x18,0x00 }, mxf_read_content_storage, 0, AnyType },
1782     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x37,0x00 }, mxf_read_source_package, sizeof(MXFPackage), SourcePackage },
1783     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x36,0x00 }, mxf_read_material_package, sizeof(MXFPackage), MaterialPackage },
1784     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x0F,0x00 }, mxf_read_sequence, sizeof(MXFSequence), Sequence },
1785     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x11,0x00 }, mxf_read_source_clip, sizeof(MXFStructuralComponent), SourceClip },
1786     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x44,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), MultipleDescriptor },
1787     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x42,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* Generic Sound */
1788     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x28,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* CDCI */
1789     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x29,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* RGBA */
1790     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x51,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* MPEG 2 Video */
1791     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x48,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* Wave */
1792     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x47,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* AES3 */
1793     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x3A,0x00 }, mxf_read_track, sizeof(MXFTrack), Track }, /* Static Track */
1794     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x3B,0x00 }, mxf_read_track, sizeof(MXFTrack), Track }, /* Generic Track */
1795     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x04,0x01,0x02,0x02,0x00,0x00 }, mxf_read_cryptographic_context, sizeof(MXFCryptoContext), CryptoContext },
1796     { { 0x06,0x0e,0x2b,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x10,0x01,0x00 }, mxf_read_index_table_segment, sizeof(MXFIndexTableSegment), IndexTableSegment },
1797     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 }, NULL, 0, AnyType },
1798 };
1799
1800 static int mxf_read_local_tags(MXFContext *mxf, KLVPacket *klv, MXFMetadataReadFunc *read_child, int ctx_size, enum MXFMetadataSetType type)
1801 {
1802     AVIOContext *pb = mxf->fc->pb;
1803     MXFMetadataSet *ctx = ctx_size ? av_mallocz(ctx_size) : mxf;
1804     uint64_t klv_end = avio_tell(pb) + klv->length;
1805
1806     if (!ctx)
1807         return AVERROR(ENOMEM);
1808     while (avio_tell(pb) + 4 < klv_end && !pb->eof_reached) {
1809         int ret;
1810         int tag = avio_rb16(pb);
1811         int size = avio_rb16(pb); /* KLV specified by 0x53 */
1812         uint64_t next = avio_tell(pb) + size;
1813         UID uid = {0};
1814
1815         av_dlog(mxf->fc, "local tag %#04x size %d\n", tag, size);
1816         if (!size) { /* ignore empty tag, needed for some files with empty UMID tag */
1817             av_log(mxf->fc, AV_LOG_ERROR, "local tag %#04x with 0 size\n", tag);
1818             continue;
1819         }
1820         if (tag > 0x7FFF) { /* dynamic tag */
1821             int i;
1822             for (i = 0; i < mxf->local_tags_count; i++) {
1823                 int local_tag = AV_RB16(mxf->local_tags+i*18);
1824                 if (local_tag == tag) {
1825                     memcpy(uid, mxf->local_tags+i*18+2, 16);
1826                     av_dlog(mxf->fc, "local tag %#04x\n", local_tag);
1827                     PRINT_KEY(mxf->fc, "uid", uid);
1828                 }
1829             }
1830         }
1831         if (ctx_size && tag == 0x3C0A)
1832             avio_read(pb, ctx->uid, 16);
1833         else if ((ret = read_child(ctx, pb, tag, size, uid, -1)) < 0)
1834             return ret;
1835
1836         /* Accept the 64k local set limit being exceeded (Avid). Don't accept
1837          * it extending past the end of the KLV though (zzuf5.mxf). */
1838         if (avio_tell(pb) > klv_end) {
1839             if (ctx_size)
1840                 av_free(ctx);
1841
1842             av_log(mxf->fc, AV_LOG_ERROR,
1843                    "local tag %#04x extends past end of local set @ %#"PRIx64"\n",
1844                    tag, klv->offset);
1845             return AVERROR_INVALIDDATA;
1846         } else if (avio_tell(pb) <= next)   /* only seek forward, else this can loop for a long time */
1847             avio_seek(pb, next, SEEK_SET);
1848     }
1849     if (ctx_size) ctx->type = type;
1850     return ctx_size ? mxf_add_metadata_set(mxf, ctx) : 0;
1851 }
1852
1853 /**
1854  * Seeks to the previous partition, if possible
1855  * @return <= 0 if we should stop parsing, > 0 if we should keep going
1856  */
1857 static int mxf_seek_to_previous_partition(MXFContext *mxf)
1858 {
1859     AVIOContext *pb = mxf->fc->pb;
1860
1861     if (!mxf->current_partition ||
1862         mxf->run_in + mxf->current_partition->previous_partition <= mxf->last_forward_tell)
1863         return 0;   /* we've parsed all partitions */
1864
1865     /* seek to previous partition */
1866     avio_seek(pb, mxf->run_in + mxf->current_partition->previous_partition, SEEK_SET);
1867     mxf->current_partition = NULL;
1868
1869     av_dlog(mxf->fc, "seeking to previous partition\n");
1870
1871     return 1;
1872 }
1873
1874 /**
1875  * Called when essence is encountered
1876  * @return <= 0 if we should stop parsing, > 0 if we should keep going
1877  */
1878 static int mxf_parse_handle_essence(MXFContext *mxf)
1879 {
1880     AVIOContext *pb = mxf->fc->pb;
1881     int64_t ret;
1882
1883     if (mxf->parsing_backward) {
1884         return mxf_seek_to_previous_partition(mxf);
1885     } else {
1886         uint64_t offset = mxf->footer_partition ? mxf->footer_partition
1887                                                 : mxf->last_partition;
1888
1889         if (!offset) {
1890             av_dlog(mxf->fc, "no last partition\n");
1891             return 0;
1892         }
1893
1894         av_dlog(mxf->fc, "seeking to last partition\n");
1895
1896         /* remember where we were so we don't end up seeking further back than this */
1897         mxf->last_forward_tell = avio_tell(pb);
1898
1899         if (!pb->seekable) {
1900             av_log(mxf->fc, AV_LOG_INFO, "file is not seekable - not parsing last partition\n");
1901             return -1;
1902         }
1903
1904         /* seek to last partition and parse backward */
1905         if ((ret = avio_seek(pb, mxf->run_in + offset, SEEK_SET)) < 0) {
1906             av_log(mxf->fc, AV_LOG_ERROR,
1907                    "failed to seek to last partition @ 0x%" PRIx64
1908                    " (%"PRId64") - partial file?\n",
1909                    mxf->run_in + offset, ret);
1910             return ret;
1911         }
1912
1913         mxf->current_partition = NULL;
1914         mxf->parsing_backward = 1;
1915     }
1916
1917     return 1;
1918 }
1919
1920 /**
1921  * Called when the next partition or EOF is encountered
1922  * @return <= 0 if we should stop parsing, > 0 if we should keep going
1923  */
1924 static int mxf_parse_handle_partition_or_eof(MXFContext *mxf)
1925 {
1926     return mxf->parsing_backward ? mxf_seek_to_previous_partition(mxf) : 1;
1927 }
1928
1929 /**
1930  * Figure out the proper offset and length of the essence container
1931  * in each partition
1932  */
1933 static void mxf_compute_essence_containers(MXFContext *mxf)
1934 {
1935     int x;
1936
1937     /* everything is already correct */
1938     if (mxf->op == OPAtom)
1939         return;
1940
1941     for (x = 0; x < mxf->partitions_count; x++) {
1942         MXFPartition *p = &mxf->partitions[x];
1943
1944         if (!p->body_sid)
1945             continue;       /* BodySID == 0 -> no essence */
1946
1947         if (x >= mxf->partitions_count - 1)
1948             break;          /* last partition - can't compute length (and we don't need to) */
1949
1950         /* essence container spans to the next partition */
1951         p->essence_length = mxf->partitions[x+1].this_partition - p->essence_offset;
1952
1953         if (p->essence_length < 0) {
1954             /* next ThisPartition < essence_offset */
1955             p->essence_length = 0;
1956             av_log(mxf->fc, AV_LOG_ERROR,
1957                    "partition %i: bad ThisPartition = %"PRIX64"\n",
1958                    x+1, mxf->partitions[x+1].this_partition);
1959         }
1960     }
1961 }
1962
1963 static int64_t round_to_kag(int64_t position, int kag_size)
1964 {
1965     /* TODO: account for run-in? the spec isn't clear whether KAG should account for it */
1966     /* NOTE: kag_size may be any integer between 1 - 2^10 */
1967     int64_t ret = (position / kag_size) * kag_size;
1968     return ret == position ? ret : ret + kag_size;
1969 }
1970
1971 static inline void compute_partition_essence_offset(AVFormatContext *s,
1972                                                     MXFContext *mxf,
1973                                                     KLVPacket *klv)
1974 {
1975     MXFPartition *cur_part = mxf->current_partition;
1976     /* for OP1a we compute essence_offset
1977      * for OPAtom we point essence_offset after the KL
1978      *     (usually op1a_essence_offset + 20 or 25)
1979      * TODO: for OP1a we could eliminate this entire if statement, always
1980      *       stopping parsing at op1a_essence_offset
1981      *       for OPAtom we still need the actual essence_offset though
1982      *       (the KL's length can vary)
1983      */
1984     int64_t op1a_essence_offset =
1985         round_to_kag(cur_part->this_partition + cur_part->pack_length,
1986                      cur_part->kag_size) +
1987         round_to_kag(cur_part->header_byte_count, cur_part->kag_size) +
1988         round_to_kag(cur_part->index_byte_count, cur_part->kag_size);
1989
1990     if (mxf->op == OPAtom) {
1991         /* point essence_offset to the actual data
1992          * OPAtom has all the essence in one big KLV
1993          */
1994         cur_part->essence_offset = avio_tell(s->pb);
1995         cur_part->essence_length = klv->length;
1996     } else {
1997         /* NOTE: op1a_essence_offset may be less than to klv.offset
1998          * (C0023S01.mxf)  */
1999         cur_part->essence_offset = op1a_essence_offset;
2000     }
2001 }
2002
2003 static int is_pcm(enum AVCodecID codec_id)
2004 {
2005     /* we only care about "normal" PCM codecs until we get samples */
2006     return codec_id >= AV_CODEC_ID_PCM_S16LE && codec_id < AV_CODEC_ID_PCM_S24DAUD;
2007 }
2008
2009 /**
2010  * Deal with the case where for some audio atoms EditUnitByteCount is
2011  * very small (2, 4..). In those cases we should read more than one
2012  * sample per call to mxf_read_packet().
2013  */
2014 static void mxf_handle_small_eubc(AVFormatContext *s)
2015 {
2016     MXFContext *mxf = s->priv_data;
2017
2018     /* assuming non-OPAtom == frame wrapped
2019      * no sane writer would wrap 2 byte PCM packets with 20 byte headers.. */
2020     if (mxf->op != OPAtom)
2021         return;
2022
2023     /* expect PCM with exactly one index table segment and a small (< 32) EUBC */
2024     if (s->nb_streams != 1                                     ||
2025         s->streams[0]->codec->codec_type != AVMEDIA_TYPE_AUDIO ||
2026         !is_pcm(s->streams[0]->codec->codec_id)                ||
2027         mxf->nb_index_tables != 1                              ||
2028         mxf->index_tables[0].nb_segments != 1                  ||
2029         mxf->index_tables[0].segments[0]->edit_unit_byte_count >= 32)
2030         return;
2031
2032     /* arbitrarily default to 48 kHz PAL audio frame size */
2033     /* TODO: We could compute this from the ratio between the audio
2034      *       and video edit rates for 48 kHz NTSC we could use the
2035      *       1802-1802-1802-1802-1801 pattern. */
2036     mxf->edit_units_per_packet = 1920;
2037 }
2038
2039 static void mxf_read_random_index_pack(AVFormatContext *s)
2040 {
2041     MXFContext *mxf = s->priv_data;
2042     uint32_t length;
2043     int64_t file_size;
2044     KLVPacket klv;
2045
2046     if (!s->pb->seekable)
2047         return;
2048
2049     file_size = avio_size(s->pb);
2050     avio_seek(s->pb, file_size - 4, SEEK_SET);
2051     length = avio_rb32(s->pb);
2052     if (length <= 32 || length >= FFMIN(file_size, INT_MAX))
2053         goto end;
2054     avio_seek(s->pb, file_size - length, SEEK_SET);
2055     if (klv_read_packet(&klv, s->pb) < 0 ||
2056         !IS_KLV_KEY(klv.key, mxf_random_index_pack_key) ||
2057         klv.length != length - 20)
2058         goto end;
2059
2060     avio_skip(s->pb, klv.length - 12);
2061     mxf->last_partition = avio_rb64(s->pb);
2062
2063 end:
2064     avio_seek(s->pb, mxf->run_in, SEEK_SET);
2065 }
2066
2067 static int mxf_read_header(AVFormatContext *s)
2068 {
2069     MXFContext *mxf = s->priv_data;
2070     KLVPacket klv;
2071     int64_t essence_offset = 0;
2072     int ret;
2073
2074     mxf->last_forward_tell = INT64_MAX;
2075     mxf->edit_units_per_packet = 1;
2076
2077     if (!mxf_read_sync(s->pb, mxf_header_partition_pack_key, 14)) {
2078         av_log(s, AV_LOG_ERROR, "could not find header partition pack key\n");
2079         return AVERROR_INVALIDDATA;
2080     }
2081     avio_seek(s->pb, -14, SEEK_CUR);
2082     mxf->fc = s;
2083     mxf->run_in = avio_tell(s->pb);
2084
2085     mxf_read_random_index_pack(s);
2086
2087     while (!s->pb->eof_reached) {
2088
2089         const MXFMetadataReadTableEntry *metadata;
2090
2091         if (klv_read_packet(&klv, s->pb) < 0) {
2092             /* EOF - seek to previous partition or stop */
2093             if(mxf_parse_handle_partition_or_eof(mxf) <= 0)
2094                 break;
2095             else
2096                 continue;
2097         }
2098
2099         PRINT_KEY(s, "read header", klv.key);
2100         av_dlog(s, "size %"PRIu64" offset %#"PRIx64"\n", klv.length, klv.offset);
2101         if (IS_KLV_KEY(klv.key, mxf_encrypted_triplet_key) ||
2102             IS_KLV_KEY(klv.key, mxf_essence_element_key) ||
2103             IS_KLV_KEY(klv.key, mxf_avid_essence_element_key) ||
2104             IS_KLV_KEY(klv.key, mxf_system_item_key)) {
2105
2106             if (!mxf->current_partition) {
2107                 av_log(mxf->fc, AV_LOG_ERROR,
2108                        "found essence prior to first PartitionPack\n");
2109                 return AVERROR_INVALIDDATA;
2110             }
2111
2112             if (!mxf->current_partition->essence_offset) {
2113                 compute_partition_essence_offset(s, mxf, &klv);
2114             }
2115
2116             if (!essence_offset)
2117                 essence_offset = klv.offset;
2118
2119             /* seek to footer, previous partition or stop */
2120             if (mxf_parse_handle_essence(mxf) <= 0)
2121                 break;
2122             continue;
2123         } else if (!memcmp(klv.key, mxf_header_partition_pack_key, 13) &&
2124                    klv.key[13] >= 2 && klv.key[13] <= 4 && mxf->current_partition) {
2125             /* next partition pack - keep going, seek to previous partition or stop */
2126             if(mxf_parse_handle_partition_or_eof(mxf) <= 0)
2127                 break;
2128             else if (mxf->parsing_backward)
2129                 continue;
2130             /* we're still parsing forward. proceed to parsing this partition pack */
2131         }
2132
2133         for (metadata = mxf_metadata_read_table; metadata->read; metadata++) {
2134             if (IS_KLV_KEY(klv.key, metadata->key)) {
2135                 int res;
2136                 if (klv.key[5] == 0x53) {
2137                     res = mxf_read_local_tags(mxf, &klv, metadata->read, metadata->ctx_size, metadata->type);
2138                 } else {
2139                     uint64_t next = avio_tell(s->pb) + klv.length;
2140                     res = metadata->read(mxf, s->pb, 0, klv.length, klv.key, klv.offset);
2141
2142                     /* only seek forward, else this can loop for a long time */
2143                     if (avio_tell(s->pb) > next) {
2144                         av_log(s, AV_LOG_ERROR, "read past end of KLV @ %#"PRIx64"\n",
2145                                klv.offset);
2146                         return AVERROR_INVALIDDATA;
2147                     }
2148
2149                     avio_seek(s->pb, next, SEEK_SET);
2150                 }
2151                 if (res < 0) {
2152                     av_log(s, AV_LOG_ERROR, "error reading header metadata\n");
2153                     return res;
2154                 }
2155                 break;
2156             }
2157         }
2158         if (!metadata->read)
2159             avio_skip(s->pb, klv.length);
2160     }
2161     /* FIXME avoid seek */
2162     if (!essence_offset)  {
2163         av_log(s, AV_LOG_ERROR, "no essence\n");
2164         return AVERROR_INVALIDDATA;
2165     }
2166     avio_seek(s->pb, essence_offset, SEEK_SET);
2167
2168     mxf_compute_essence_containers(mxf);
2169
2170     /* we need to do this before computing the index tables
2171      * to be able to fill in zero IndexDurations with st->duration */
2172     if ((ret = mxf_parse_structural_metadata(mxf)) < 0)
2173         return ret;
2174
2175     if ((ret = mxf_compute_index_tables(mxf)) < 0)
2176         return ret;
2177
2178     if (mxf->nb_index_tables > 1) {
2179         /* TODO: look up which IndexSID to use via EssenceContainerData */
2180         av_log(mxf->fc, AV_LOG_INFO, "got %i index tables - only the first one (IndexSID %i) will be used\n",
2181                mxf->nb_index_tables, mxf->index_tables[0].index_sid);
2182     } else if (mxf->nb_index_tables == 0 && mxf->op == OPAtom) {
2183         av_log(mxf->fc, AV_LOG_ERROR, "cannot demux OPAtom without an index\n");
2184         return AVERROR_INVALIDDATA;
2185     }
2186
2187     mxf_handle_small_eubc(s);
2188
2189     return 0;
2190 }
2191
2192 /**
2193  * Sets mxf->current_edit_unit based on what offset we're currently at.
2194  * @return next_ofs if OK, <0 on error
2195  */
2196 static int64_t mxf_set_current_edit_unit(MXFContext *mxf, int64_t current_offset)
2197 {
2198     int64_t last_ofs = -1, next_ofs = -1;
2199     MXFIndexTable *t = &mxf->index_tables[0];
2200
2201     /* this is called from the OP1a demuxing logic, which means there
2202      * may be no index tables */
2203     if (mxf->nb_index_tables <= 0)
2204         return -1;
2205
2206     /* find mxf->current_edit_unit so that the next edit unit starts ahead
2207      * of current_offset */
2208     while (mxf->current_edit_unit >= 0) {
2209         if (mxf_edit_unit_absolute_offset(mxf, t, mxf->current_edit_unit + 1,
2210                                           NULL, &next_ofs, 0) < 0)
2211             return -1;
2212
2213         if (next_ofs <= last_ofs) {
2214             /* large next_ofs didn't change or current_edit_unit wrapped
2215              * around this fixes the infinite loop on zzuf3.mxf */
2216             av_log(mxf->fc, AV_LOG_ERROR,
2217                    "next_ofs didn't change. not deriving packet timestamps\n");
2218             return -1;
2219         }
2220
2221         if (next_ofs > current_offset)
2222             break;
2223
2224         last_ofs = next_ofs;
2225         mxf->current_edit_unit++;
2226     }
2227
2228     /* not checking mxf->current_edit_unit >= t->nb_ptses here since CBR files
2229      * may lack IndexEntryArrays */
2230     if (mxf->current_edit_unit < 0)
2231         return -1;
2232
2233     return next_ofs;
2234 }
2235
2236 static int mxf_compute_sample_count(MXFContext *mxf, int stream_index,
2237                                     uint64_t *sample_count)
2238 {
2239     int i, total = 0, size = 0;
2240     AVStream *st = mxf->fc->streams[stream_index];
2241     MXFTrack *track = st->priv_data;
2242     AVRational time_base = av_inv_q(track->edit_rate);
2243     AVRational sample_rate = av_inv_q(st->time_base);
2244     const MXFSamplesPerFrame *spf = NULL;
2245
2246     if ((sample_rate.num / sample_rate.den) == 48000)
2247         spf = ff_mxf_get_samples_per_frame(mxf->fc, time_base);
2248     if (!spf) {
2249         int remainder = (sample_rate.num * time_base.num) %
2250                         (time_base.den * sample_rate.den);
2251         *sample_count = av_q2d(av_mul_q((AVRational){mxf->current_edit_unit, 1},
2252                                         av_mul_q(sample_rate, time_base)));
2253         if (remainder)
2254             av_log(mxf->fc, AV_LOG_WARNING,
2255                    "seeking detected on stream #%d with time base (%d/%d) and "
2256                    "sample rate (%d/%d), audio pts won't be accurate.\n",
2257                    stream_index, time_base.num, time_base.den,
2258                    sample_rate.num, sample_rate.den);
2259         return 0;
2260     }
2261
2262     while (spf->samples_per_frame[size]) {
2263         total += spf->samples_per_frame[size];
2264         size++;
2265     }
2266
2267     if (!size)
2268         return 0;
2269
2270     *sample_count = (mxf->current_edit_unit / size) * (uint64_t)total;
2271     for (i = 0; i < mxf->current_edit_unit % size; i++) {
2272         *sample_count += spf->samples_per_frame[i];
2273     }
2274
2275     return 0;
2276 }
2277
2278 static int mxf_set_audio_pts(MXFContext *mxf, AVCodecContext *codec,
2279                              AVPacket *pkt)
2280 {
2281     MXFTrack *track = mxf->fc->streams[pkt->stream_index]->priv_data;
2282     int64_t bits_per_sample = av_get_bits_per_sample(codec->codec_id);
2283
2284     pkt->pts = track->sample_count;
2285
2286     if (codec->channels <= 0 || codec->channels * bits_per_sample < 8)
2287         return AVERROR_INVALIDDATA;
2288
2289     track->sample_count += pkt->size / (codec->channels * bits_per_sample / 8);
2290     return 0;
2291 }
2292
2293 static int mxf_read_packet_old(AVFormatContext *s, AVPacket *pkt)
2294 {
2295     KLVPacket klv;
2296     MXFContext *mxf = s->priv_data;
2297     int ret;
2298
2299     while (!s->pb->eof_reached) {
2300         if ((ret = klv_read_packet(&klv, s->pb)) < 0)
2301             return ret;
2302         PRINT_KEY(s, "read packet", klv.key);
2303         av_dlog(s, "size %"PRIu64" offset %#"PRIx64"\n", klv.length, klv.offset);
2304         if (IS_KLV_KEY(klv.key, mxf_encrypted_triplet_key)) {
2305             ret = mxf_decrypt_triplet(s, pkt, &klv);
2306             if (ret < 0) {
2307                 av_log(s, AV_LOG_ERROR, "invalid encoded triplet\n");
2308                 return ret;
2309             }
2310             return 0;
2311         }
2312         if (IS_KLV_KEY(klv.key, mxf_essence_element_key) ||
2313             IS_KLV_KEY(klv.key, mxf_avid_essence_element_key)) {
2314             int index = mxf_get_stream_index(s, &klv);
2315             int64_t next_ofs, next_klv;
2316             AVStream *st;
2317             MXFTrack *track;
2318             AVCodecContext *codec;
2319
2320             if (index < 0) {
2321                 av_log(s, AV_LOG_ERROR,
2322                        "error getting stream index %"PRIu32"\n",
2323                        AV_RB32(klv.key + 12));
2324                 goto skip;
2325             }
2326
2327             st = s->streams[index];
2328             track = st->priv_data;
2329
2330             if (s->streams[index]->discard == AVDISCARD_ALL)
2331                 goto skip;
2332
2333             next_klv = avio_tell(s->pb) + klv.length;
2334             next_ofs = mxf_set_current_edit_unit(mxf, klv.offset);
2335
2336             if (next_ofs >= 0 && next_klv > next_ofs) {
2337                 /* if this check is hit then it's possible OPAtom was treated
2338                  * as OP1a truncate the packet since it's probably very large
2339                  * (>2 GiB is common) */
2340                 avpriv_request_sample(s,
2341                                       "OPAtom misinterpreted as OP1a?"
2342                                       "KLV for edit unit %i extending into "
2343                                       "next edit unit",
2344                                       mxf->current_edit_unit);
2345                 klv.length = next_ofs - avio_tell(s->pb);
2346             }
2347
2348             /* check for 8 channels AES3 element */
2349             if (klv.key[12] == 0x06 && klv.key[13] == 0x01 && klv.key[14] == 0x10) {
2350                 ret = mxf_get_d10_aes3_packet(s->pb, s->streams[index],
2351                                               pkt, klv.length);
2352                 if (ret < 0) {
2353                     av_log(s, AV_LOG_ERROR, "error reading D-10 aes3 frame\n");
2354                     return ret;
2355                 }
2356             } else {
2357                 ret = av_get_packet(s->pb, pkt, klv.length);
2358                 if (ret < 0)
2359                     return ret;
2360             }
2361             pkt->stream_index = index;
2362             pkt->pos = klv.offset;
2363
2364             codec = s->streams[index]->codec;
2365
2366             if (codec->codec_type == AVMEDIA_TYPE_VIDEO && next_ofs >= 0) {
2367                 /* mxf->current_edit_unit good - see if we have an
2368                  * index table to derive timestamps from */
2369                 MXFIndexTable *t = &mxf->index_tables[0];
2370
2371                 if (mxf->nb_index_tables >= 1 &&
2372                     mxf->current_edit_unit < t->nb_ptses) {
2373                     pkt->dts = mxf->current_edit_unit + t->first_dts;
2374                     pkt->pts = t->ptses[mxf->current_edit_unit];
2375                 } else if (track->intra_only) {
2376                     /* intra-only -> PTS = EditUnit.
2377                      * let utils.c figure out DTS since it can be
2378                      * < PTS if low_delay = 0 (Sony IMX30) */
2379                     pkt->pts = mxf->current_edit_unit;
2380                 }
2381             } else if (codec->codec_type == AVMEDIA_TYPE_AUDIO) {
2382                 ret = mxf_set_audio_pts(mxf, codec, pkt);
2383                 if (ret < 0)
2384                     return ret;
2385             }
2386
2387             /* seek for truncated packets */
2388             avio_seek(s->pb, next_klv, SEEK_SET);
2389
2390             return 0;
2391         } else
2392         skip:
2393             avio_skip(s->pb, klv.length);
2394     }
2395     return AVERROR_EOF;
2396 }
2397
2398 static int mxf_read_packet(AVFormatContext *s, AVPacket *pkt)
2399 {
2400     MXFContext *mxf = s->priv_data;
2401     int ret, size;
2402     int64_t ret64, pos, next_pos;
2403     AVStream *st;
2404     MXFIndexTable *t;
2405     int edit_units;
2406
2407     if (mxf->op != OPAtom)
2408         return mxf_read_packet_old(s, pkt);
2409
2410     /* OPAtom - clip wrapped demuxing */
2411     /* NOTE: mxf_read_header() makes sure nb_index_tables > 0 for OPAtom */
2412     st = s->streams[0];
2413     t = &mxf->index_tables[0];
2414
2415     if (mxf->current_edit_unit >= st->duration)
2416         return AVERROR_EOF;
2417
2418     edit_units = FFMIN(mxf->edit_units_per_packet, st->duration - mxf->current_edit_unit);
2419
2420     if ((ret = mxf_edit_unit_absolute_offset(mxf, t, mxf->current_edit_unit, NULL, &pos, 1)) < 0)
2421         return ret;
2422
2423     /* compute size by finding the next edit unit or the end of the essence container
2424      * not pretty, but it works */
2425     if ((ret = mxf_edit_unit_absolute_offset(mxf, t, mxf->current_edit_unit + edit_units, NULL, &next_pos, 0)) < 0 &&
2426         (next_pos = mxf_essence_container_end(mxf, t->body_sid)) <= 0) {
2427         av_log(s, AV_LOG_ERROR, "unable to compute the size of the last packet\n");
2428         return AVERROR_INVALIDDATA;
2429     }
2430
2431     if ((size = next_pos - pos) <= 0) {
2432         av_log(s, AV_LOG_ERROR, "bad size: %i\n", size);
2433         return AVERROR_INVALIDDATA;
2434     }
2435
2436     if ((ret64 = avio_seek(s->pb, pos, SEEK_SET)) < 0)
2437         return ret64;
2438
2439         if ((ret = av_get_packet(s->pb, pkt, size)) != size)
2440             return ret < 0 ? ret : AVERROR_EOF;
2441
2442     pkt->stream_index = 0;
2443
2444     if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO && t->ptses &&
2445         mxf->current_edit_unit >= 0 && mxf->current_edit_unit < t->nb_ptses) {
2446         pkt->dts = mxf->current_edit_unit + t->first_dts;
2447         pkt->pts = t->ptses[mxf->current_edit_unit];
2448     } else if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
2449         int ret = mxf_set_audio_pts(mxf, st->codec, pkt);
2450         if (ret < 0)
2451             return ret;
2452     }
2453
2454     mxf->current_edit_unit += edit_units;
2455
2456     return 0;
2457 }
2458
2459
2460 static int mxf_read_close(AVFormatContext *s)
2461 {
2462     MXFContext *mxf = s->priv_data;
2463     MXFIndexTableSegment *seg;
2464     int i;
2465
2466     av_freep(&mxf->packages_refs);
2467
2468     for (i = 0; i < s->nb_streams; i++)
2469         s->streams[i]->priv_data = NULL;
2470
2471     for (i = 0; i < mxf->metadata_sets_count; i++) {
2472         switch (mxf->metadata_sets[i]->type) {
2473         case Descriptor:
2474             av_freep(&((MXFDescriptor *)mxf->metadata_sets[i])->extradata);
2475             break;
2476         case MultipleDescriptor:
2477             av_freep(&((MXFDescriptor *)mxf->metadata_sets[i])->sub_descriptors_refs);
2478             break;
2479         case Sequence:
2480             av_freep(&((MXFSequence *)mxf->metadata_sets[i])->structural_components_refs);
2481             break;
2482         case SourcePackage:
2483         case MaterialPackage:
2484             av_freep(&((MXFPackage *)mxf->metadata_sets[i])->tracks_refs);
2485             break;
2486         case IndexTableSegment:
2487             seg = (MXFIndexTableSegment *)mxf->metadata_sets[i];
2488             av_freep(&seg->temporal_offset_entries);
2489             av_freep(&seg->flag_entries);
2490             av_freep(&seg->stream_offset_entries);
2491             break;
2492         default:
2493             break;
2494         }
2495         av_freep(&mxf->metadata_sets[i]);
2496     }
2497     av_freep(&mxf->partitions);
2498     av_freep(&mxf->metadata_sets);
2499     av_freep(&mxf->aesc);
2500     av_freep(&mxf->local_tags);
2501
2502     for (i = 0; i < mxf->nb_index_tables; i++) {
2503         av_freep(&mxf->index_tables[i].segments);
2504         av_freep(&mxf->index_tables[i].ptses);
2505         av_freep(&mxf->index_tables[i].fake_index);
2506     }
2507     av_freep(&mxf->index_tables);
2508
2509     return 0;
2510 }
2511
2512 static int mxf_probe(AVProbeData *p) {
2513     uint8_t *bufp = p->buf;
2514     uint8_t *end = p->buf + p->buf_size;
2515
2516     if (p->buf_size < sizeof(mxf_header_partition_pack_key))
2517         return 0;
2518
2519     /* Must skip Run-In Sequence and search for MXF header partition pack key SMPTE 377M 5.5 */
2520     end -= sizeof(mxf_header_partition_pack_key);
2521     for (; bufp < end; bufp++) {
2522         if (IS_KLV_KEY(bufp, mxf_header_partition_pack_key))
2523             return AVPROBE_SCORE_MAX;
2524     }
2525     return 0;
2526 }
2527
2528 /* rudimentary byte seek */
2529 /* XXX: use MXF Index */
2530 static int mxf_read_seek(AVFormatContext *s, int stream_index, int64_t sample_time, int flags)
2531 {
2532     AVStream *st = s->streams[stream_index];
2533     int64_t seconds;
2534     MXFContext* mxf = s->priv_data;
2535     int64_t seekpos;
2536     int i, ret;
2537     MXFIndexTable *t;
2538     MXFTrack *source_track = st->priv_data;
2539
2540     /* if audio then truncate sample_time to EditRate */
2541     if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO)
2542         sample_time = av_rescale_q(sample_time, st->time_base,
2543                                    av_inv_q(source_track->edit_rate));
2544
2545     if (mxf->nb_index_tables <= 0) {
2546     if (!s->bit_rate)
2547         return AVERROR_INVALIDDATA;
2548     if (sample_time < 0)
2549         sample_time = 0;
2550     seconds = av_rescale(sample_time, st->time_base.num, st->time_base.den);
2551
2552     seekpos = avio_seek(s->pb, (s->bit_rate * seconds) >> 3, SEEK_SET);
2553     if (seekpos < 0)
2554         return seekpos;
2555
2556     ff_update_cur_dts(s, st, sample_time);
2557     mxf->current_edit_unit = sample_time;
2558     } else {
2559         t = &mxf->index_tables[0];
2560
2561         /* clamp above zero, else ff_index_search_timestamp() returns negative
2562          * this also means we allow seeking before the start */
2563         sample_time = FFMAX(sample_time, 0);
2564
2565         if (t->fake_index) {
2566             /* behave as if we have a proper index */
2567             if ((sample_time = ff_index_search_timestamp(t->fake_index, t->nb_ptses, sample_time, flags)) < 0)
2568                 return sample_time;
2569         } else {
2570             /* no IndexEntryArray (one or more CBR segments)
2571              * make sure we don't seek past the end */
2572             sample_time = FFMIN(sample_time, source_track->original_duration - 1);
2573         }
2574
2575         if ((ret = mxf_edit_unit_absolute_offset(mxf, t, sample_time, &sample_time, &seekpos, 1)) << 0)
2576             return ret;
2577
2578         ff_update_cur_dts(s, st, sample_time);
2579         mxf->current_edit_unit = sample_time;
2580         avio_seek(s->pb, seekpos, SEEK_SET);
2581     }
2582
2583     // Update all tracks sample count
2584     for (i = 0; i < s->nb_streams; i++) {
2585         AVStream *cur_st = s->streams[i];
2586         MXFTrack *cur_track = cur_st->priv_data;
2587         uint64_t current_sample_count = 0;
2588         if (cur_st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
2589             ret = mxf_compute_sample_count(mxf, i, &current_sample_count);
2590             if (ret < 0)
2591                 return ret;
2592
2593             cur_track->sample_count = current_sample_count;
2594         }
2595     }
2596     return 0;
2597 }
2598
2599 AVInputFormat ff_mxf_demuxer = {
2600     .name           = "mxf",
2601     .long_name      = NULL_IF_CONFIG_SMALL("MXF (Material eXchange Format)"),
2602     .priv_data_size = sizeof(MXFContext),
2603     .read_probe     = mxf_probe,
2604     .read_header    = mxf_read_header,
2605     .read_packet    = mxf_read_packet,
2606     .read_close     = mxf_read_close,
2607     .read_seek      = mxf_read_seek,
2608 };