]> git.sesse.net Git - ffmpeg/blob - libavformat/mxfdec.c
Merge remote-tracking branch 'qatar/master'
[ffmpeg] / libavformat / mxfdec.c
1 /*
2  * MXF demuxer.
3  * Copyright (c) 2006 SmartJog S.A., Baptiste Coudurier <baptiste dot coudurier at smartjog dot com>
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 /*
23  * References
24  * SMPTE 336M KLV Data Encoding Protocol Using Key-Length-Value
25  * SMPTE 377M MXF File Format Specifications
26  * SMPTE 378M Operational Pattern 1a
27  * SMPTE 379M MXF Generic Container
28  * SMPTE 381M Mapping MPEG Streams into the MXF Generic Container
29  * SMPTE 382M Mapping AES3 and Broadcast Wave Audio into the MXF Generic Container
30  * SMPTE 383M Mapping DV-DIF Data to the MXF Generic Container
31  *
32  * Principle
33  * Search for Track numbers which will identify essence element KLV packets.
34  * Search for SourcePackage which define tracks which contains Track numbers.
35  * Material Package contains tracks with reference to SourcePackage tracks.
36  * Search for Descriptors (Picture, Sound) which contains codec info and parameters.
37  * Assign Descriptors to correct Tracks.
38  *
39  * Metadata reading functions read Local Tags, get InstanceUID(0x3C0A) then add MetaDataSet to MXFContext.
40  * Metadata parsing resolves Strong References to objects.
41  *
42  * Simple demuxer, only OP1A supported and some files might not work at all.
43  * Only tracks with associated descriptors will be decoded. "Highly Desirable" SMPTE 377M D.1
44  */
45
46 //#define DEBUG
47
48 #include "libavutil/aes.h"
49 #include "libavutil/mathematics.h"
50 #include "libavcodec/bytestream.h"
51 #include "avformat.h"
52 #include "internal.h"
53 #include "mxf.h"
54
55 typedef enum {
56     Header,
57     BodyPartition,
58     Footer
59 } MXFPartitionType;
60
61 typedef enum {
62     OP1a,
63     OP1b,
64     OP1c,
65     OP2a,
66     OP2b,
67     OP2c,
68     OP3a,
69     OP3b,
70     OP3c,
71     OPAtom,
72 } MXFOP;
73
74 typedef struct {
75     int closed;
76     int complete;
77     MXFPartitionType type;
78     uint64_t previous_partition;
79     int index_sid;
80     int body_sid;
81 } MXFPartition;
82
83 typedef struct {
84     UID uid;
85     enum MXFMetadataSetType type;
86     UID source_container_ul;
87 } MXFCryptoContext;
88
89 typedef struct {
90     UID uid;
91     enum MXFMetadataSetType type;
92     UID source_package_uid;
93     UID data_definition_ul;
94     int64_t duration;
95     int64_t start_position;
96     int source_track_id;
97 } MXFStructuralComponent;
98
99 typedef struct {
100     UID uid;
101     enum MXFMetadataSetType type;
102     UID data_definition_ul;
103     UID *structural_components_refs;
104     int structural_components_count;
105     int64_t duration;
106 } MXFSequence;
107
108 typedef struct {
109     UID uid;
110     enum MXFMetadataSetType type;
111     MXFSequence *sequence; /* mandatory, and only one */
112     UID sequence_ref;
113     int track_id;
114     uint8_t track_number[4];
115     AVRational edit_rate;
116 } MXFTrack;
117
118 typedef struct {
119     UID uid;
120     enum MXFMetadataSetType type;
121     UID essence_container_ul;
122     UID essence_codec_ul;
123     AVRational sample_rate;
124     AVRational aspect_ratio;
125     int width;
126     int height;
127     int channels;
128     int bits_per_sample;
129     UID *sub_descriptors_refs;
130     int sub_descriptors_count;
131     int linked_track_id;
132     uint8_t *extradata;
133     int extradata_size;
134     enum PixelFormat pix_fmt;
135 } MXFDescriptor;
136
137 typedef struct {
138     UID uid;
139     enum MXFMetadataSetType type;
140     int edit_unit_byte_count;
141     int index_sid;
142     int body_sid;
143     int slice_count;
144     AVRational index_edit_rate;
145     uint64_t index_start_position;
146     uint64_t index_duration;
147     int *slice;
148     int *element_delta;
149     int nb_delta_entries;
150     int *flag_entries;
151     uint64_t *stream_offset_entries;
152     uint32_t **slice_offset_entries;
153     int nb_index_entries;
154 } MXFIndexTableSegment;
155
156 typedef struct {
157     UID uid;
158     enum MXFMetadataSetType type;
159     UID package_uid;
160     UID *tracks_refs;
161     int tracks_count;
162     MXFDescriptor *descriptor; /* only one */
163     UID descriptor_ref;
164 } MXFPackage;
165
166 typedef struct {
167     UID uid;
168     enum MXFMetadataSetType type;
169 } MXFMetadataSet;
170
171 typedef struct {
172     MXFPartition *partitions;
173     unsigned partitions_count;
174     MXFOP op;
175     UID *packages_refs;
176     int packages_count;
177     MXFMetadataSet **metadata_sets;
178     int metadata_sets_count;
179     AVFormatContext *fc;
180     struct AVAES *aesc;
181     uint8_t *local_tags;
182     int local_tags_count;
183     uint64_t footer_partition;
184     int system_item;
185     int64_t essence_offset;
186     int first_essence_kl_length;
187     int64_t first_essence_length;
188     KLVPacket current_klv_data;
189     int current_klv_index;
190 } MXFContext;
191
192 enum MXFWrappingScheme {
193     Frame,
194     Clip,
195 };
196
197 typedef int MXFMetadataReadFunc(void *arg, AVIOContext *pb, int tag, int size, UID uid);
198
199 typedef struct {
200     const UID key;
201     MXFMetadataReadFunc *read;
202     int ctx_size;
203     enum MXFMetadataSetType type;
204 } MXFMetadataReadTableEntry;
205
206 /* partial keys to match */
207 static const uint8_t mxf_header_partition_pack_key[]       = { 0x06,0x0e,0x2b,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02 };
208 static const uint8_t mxf_essence_element_key[]             = { 0x06,0x0e,0x2b,0x34,0x01,0x02,0x01,0x01,0x0d,0x01,0x03,0x01 };
209 static const uint8_t mxf_system_item_key[]                 = { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0D,0x01,0x03,0x01,0x04 };
210 static const uint8_t mxf_klv_key[]                         = { 0x06,0x0e,0x2b,0x34 };
211 /* complete keys to match */
212 static const uint8_t mxf_crypto_source_container_ul[]      = { 0x06,0x0e,0x2b,0x34,0x01,0x01,0x01,0x09,0x06,0x01,0x01,0x02,0x02,0x00,0x00,0x00 };
213 static const uint8_t mxf_encrypted_triplet_key[]           = { 0x06,0x0e,0x2b,0x34,0x02,0x04,0x01,0x07,0x0d,0x01,0x03,0x01,0x02,0x7e,0x01,0x00 };
214 static const uint8_t mxf_encrypted_essence_container[]     = { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x07,0x0d,0x01,0x03,0x01,0x02,0x0b,0x01,0x00 };
215 static const uint8_t mxf_sony_mpeg4_extradata[]            = { 0x06,0x0e,0x2b,0x34,0x04,0x01,0x01,0x01,0x0e,0x06,0x06,0x02,0x02,0x01,0x00,0x00 };
216
217 #define IS_KLV_KEY(x, y) (!memcmp(x, y, sizeof(y)))
218
219 static int64_t klv_decode_ber_length(AVIOContext *pb)
220 {
221     uint64_t size = avio_r8(pb);
222     if (size & 0x80) { /* long form */
223         int bytes_num = size & 0x7f;
224         /* SMPTE 379M 5.3.4 guarantee that bytes_num must not exceed 8 bytes */
225         if (bytes_num > 8)
226             return -1;
227         size = 0;
228         while (bytes_num--)
229             size = size << 8 | avio_r8(pb);
230     }
231     return size;
232 }
233
234 static int mxf_read_sync(AVIOContext *pb, const uint8_t *key, unsigned size)
235 {
236     int i, b;
237     for (i = 0; i < size && !url_feof(pb); i++) {
238         b = avio_r8(pb);
239         if (b == key[0])
240             i = 0;
241         else if (b != key[i])
242             i = -1;
243     }
244     return i == size;
245 }
246
247 static int klv_read_packet(KLVPacket *klv, AVIOContext *pb)
248 {
249     if (!mxf_read_sync(pb, mxf_klv_key, 4))
250         return -1;
251     klv->offset = avio_tell(pb) - 4;
252     memcpy(klv->key, mxf_klv_key, 4);
253     avio_read(pb, klv->key + 4, 12);
254     klv->length = klv_decode_ber_length(pb);
255     return klv->length == -1 ? -1 : 0;
256 }
257
258 static int mxf_get_stream_index(AVFormatContext *s, KLVPacket *klv)
259 {
260     int i;
261
262     for (i = 0; i < s->nb_streams; i++) {
263         MXFTrack *track = s->streams[i]->priv_data;
264         /* SMPTE 379M 7.3 */
265         if (!memcmp(klv->key + sizeof(mxf_essence_element_key), track->track_number, sizeof(track->track_number)))
266             return i;
267     }
268     /* return 0 if only one stream, for OP Atom files with 0 as track number */
269     return s->nb_streams == 1 ? 0 : -1;
270 }
271
272 /* XXX: use AVBitStreamFilter */
273 static int mxf_get_d10_aes3_packet(AVIOContext *pb, AVStream *st, AVPacket *pkt, int64_t length)
274 {
275     const uint8_t *buf_ptr, *end_ptr;
276     uint8_t *data_ptr;
277     int i;
278
279     if (length > 61444) /* worst case PAL 1920 samples 8 channels */
280         return -1;
281     length = av_get_packet(pb, pkt, length);
282     if (length < 0)
283         return length;
284     data_ptr = pkt->data;
285     end_ptr = pkt->data + length;
286     buf_ptr = pkt->data + 4; /* skip SMPTE 331M header */
287     for (; buf_ptr + st->codec->channels*4 < end_ptr; ) {
288         for (i = 0; i < st->codec->channels; i++) {
289             uint32_t sample = bytestream_get_le32(&buf_ptr);
290             if (st->codec->bits_per_coded_sample == 24)
291                 bytestream_put_le24(&data_ptr, (sample >> 4) & 0xffffff);
292             else
293                 bytestream_put_le16(&data_ptr, (sample >> 12) & 0xffff);
294         }
295         buf_ptr += 32 - st->codec->channels*4; // always 8 channels stored SMPTE 331M
296     }
297     av_shrink_packet(pkt, data_ptr - pkt->data);
298     return 0;
299 }
300
301 static int mxf_decrypt_triplet(AVFormatContext *s, AVPacket *pkt, KLVPacket *klv)
302 {
303     static const uint8_t checkv[16] = {0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b, 0x43, 0x48, 0x55, 0x4b};
304     MXFContext *mxf = s->priv_data;
305     AVIOContext *pb = s->pb;
306     int64_t end = avio_tell(pb) + klv->length;
307     int64_t size;
308     uint64_t orig_size;
309     uint64_t plaintext_size;
310     uint8_t ivec[16];
311     uint8_t tmpbuf[16];
312     int index;
313
314     if (!mxf->aesc && s->key && s->keylen == 16) {
315         mxf->aesc = av_malloc(av_aes_size);
316         if (!mxf->aesc)
317             return -1;
318         av_aes_init(mxf->aesc, s->key, 128, 1);
319     }
320     // crypto context
321     avio_skip(pb, klv_decode_ber_length(pb));
322     // plaintext offset
323     klv_decode_ber_length(pb);
324     plaintext_size = avio_rb64(pb);
325     // source klv key
326     klv_decode_ber_length(pb);
327     avio_read(pb, klv->key, 16);
328     if (!IS_KLV_KEY(klv, mxf_essence_element_key))
329         return -1;
330     index = mxf_get_stream_index(s, klv);
331     if (index < 0)
332         return -1;
333     // source size
334     klv_decode_ber_length(pb);
335     orig_size = avio_rb64(pb);
336     if (orig_size < plaintext_size)
337         return -1;
338     // enc. code
339     size = klv_decode_ber_length(pb);
340     if (size < 32 || size - 32 < orig_size)
341         return -1;
342     avio_read(pb, ivec, 16);
343     avio_read(pb, tmpbuf, 16);
344     if (mxf->aesc)
345         av_aes_crypt(mxf->aesc, tmpbuf, tmpbuf, 1, ivec, 1);
346     if (memcmp(tmpbuf, checkv, 16))
347         av_log(s, AV_LOG_ERROR, "probably incorrect decryption key\n");
348     size -= 32;
349     size = av_get_packet(pb, pkt, size);
350     if (size < 0)
351         return size;
352     else if (size < plaintext_size)
353         return AVERROR_INVALIDDATA;
354     size -= plaintext_size;
355     if (mxf->aesc)
356         av_aes_crypt(mxf->aesc, &pkt->data[plaintext_size],
357                      &pkt->data[plaintext_size], size >> 4, ivec, 1);
358     av_shrink_packet(pkt, orig_size);
359     pkt->stream_index = index;
360     avio_skip(pb, end - avio_tell(pb));
361     return 0;
362 }
363
364 static int mxf_read_packet(AVFormatContext *s, AVPacket *pkt)
365 {
366     KLVPacket klv;
367
368     while (!url_feof(s->pb)) {
369         if (klv_read_packet(&klv, s->pb) < 0)
370             return -1;
371         PRINT_KEY(s, "read packet", klv.key);
372         av_dlog(s, "size %"PRIu64" offset %#"PRIx64"\n", klv.length, klv.offset);
373         if (IS_KLV_KEY(klv.key, mxf_encrypted_triplet_key)) {
374             int res = mxf_decrypt_triplet(s, pkt, &klv);
375             if (res < 0) {
376                 av_log(s, AV_LOG_ERROR, "invalid encoded triplet\n");
377                 return -1;
378             }
379             return 0;
380         }
381         if (IS_KLV_KEY(klv.key, mxf_essence_element_key)) {
382             int index = mxf_get_stream_index(s, &klv);
383             if (index < 0) {
384                 av_log(s, AV_LOG_ERROR, "error getting stream index %d\n", AV_RB32(klv.key+12));
385                 goto skip;
386             }
387             if (s->streams[index]->discard == AVDISCARD_ALL)
388                 goto skip;
389             /* check for 8 channels AES3 element */
390             if (klv.key[12] == 0x06 && klv.key[13] == 0x01 && klv.key[14] == 0x10) {
391                 if (mxf_get_d10_aes3_packet(s->pb, s->streams[index], pkt, klv.length) < 0) {
392                     av_log(s, AV_LOG_ERROR, "error reading D-10 aes3 frame\n");
393                     return -1;
394                 }
395             } else {
396                 int ret = av_get_packet(s->pb, pkt, klv.length);
397                 if (ret < 0)
398                     return ret;
399             }
400             pkt->stream_index = index;
401             pkt->pos = klv.offset;
402             return 0;
403         } else
404         skip:
405             avio_skip(s->pb, klv.length);
406     }
407     return AVERROR_EOF;
408 }
409
410 static int mxf_read_primer_pack(void *arg, AVIOContext *pb, int tag, int size, UID uid)
411 {
412     MXFContext *mxf = arg;
413     int item_num = avio_rb32(pb);
414     int item_len = avio_rb32(pb);
415
416     if (item_len != 18) {
417         av_log(mxf->fc, AV_LOG_ERROR, "unsupported primer pack item length\n");
418         return -1;
419     }
420     if (item_num > UINT_MAX / item_len)
421         return -1;
422     mxf->local_tags_count = item_num;
423     mxf->local_tags = av_malloc(item_num*item_len);
424     if (!mxf->local_tags)
425         return -1;
426     avio_read(pb, mxf->local_tags, item_num*item_len);
427     return 0;
428 }
429
430 static int mxf_read_partition_pack(void *arg, AVIOContext *pb, int tag, int size, UID uid)
431 {
432     MXFContext *mxf = arg;
433     MXFPartition *partition;
434     UID op;
435     uint64_t footer_partition;
436
437     if (mxf->partitions_count+1 >= UINT_MAX / sizeof(*mxf->partitions))
438         return AVERROR(ENOMEM);
439
440     mxf->partitions = av_realloc(mxf->partitions, (mxf->partitions_count + 1) * sizeof(*mxf->partitions));
441     if (!mxf->partitions)
442         return AVERROR(ENOMEM);
443
444     partition = &mxf->partitions[mxf->partitions_count++];
445
446     switch(uid[13]) {
447     case 2:
448         partition->type = Header;
449         break;
450     case 3:
451         partition->type = BodyPartition;
452         break;
453     case 4:
454         partition->type = Footer;
455         break;
456     default:
457         av_log(mxf->fc, AV_LOG_ERROR, "unknown partition type %i\n", uid[13]);
458         return AVERROR_INVALIDDATA;
459     }
460
461     /* consider both footers to be closed (there is only Footer and CompleteFooter) */
462     partition->closed = partition->type == Footer || !(uid[14] & 1);
463     partition->complete = uid[14] > 2;
464     avio_skip(pb, 16);
465     partition->previous_partition = avio_rb64(pb);
466     footer_partition = avio_rb64(pb);
467     avio_skip(pb, 16);
468     partition->index_sid = avio_rb32(pb);
469     avio_skip(pb, 8);
470     partition->body_sid = avio_rb32(pb);
471     avio_read(pb, op, sizeof(UID));
472
473     /* some files don'thave FooterPartition set in every partition */
474     if (footer_partition) {
475         if (mxf->footer_partition && mxf->footer_partition != footer_partition) {
476             av_log(mxf->fc, AV_LOG_ERROR, "inconsistent FooterPartition value: %li != %li\n",
477                    mxf->footer_partition, footer_partition);
478         } else {
479             mxf->footer_partition = footer_partition;
480         }
481     }
482
483     av_dlog(mxf->fc, "PartitionPack: PreviousPartition = 0x%lx, "
484             "FooterPartition = 0x%lx, IndexSID = %i, BodySID = %i\n",
485             partition->previous_partition, footer_partition,
486             partition->index_sid, partition->body_sid);
487
488     if      (op[12] == 1 && op[13] == 1) mxf->op = OP1a;
489     else if (op[12] == 1 && op[13] == 2) mxf->op = OP1b;
490     else if (op[12] == 1 && op[13] == 3) mxf->op = OP1c;
491     else if (op[12] == 2 && op[13] == 1) mxf->op = OP2a;
492     else if (op[12] == 2 && op[13] == 2) mxf->op = OP2b;
493     else if (op[12] == 2 && op[13] == 3) mxf->op = OP2c;
494     else if (op[12] == 3 && op[13] == 1) mxf->op = OP3a;
495     else if (op[12] == 3 && op[13] == 2) mxf->op = OP3b;
496     else if (op[12] == 3 && op[13] == 3) mxf->op = OP3c;
497     else if (op[12] == 0x10)             mxf->op = OPAtom;
498     else
499         av_log(mxf->fc, AV_LOG_ERROR, "unknown operational pattern: %02xh %02xh\n", op[12], op[13]);
500
501     return 0;
502 }
503
504 static int mxf_add_metadata_set(MXFContext *mxf, void *metadata_set)
505 {
506     if (mxf->metadata_sets_count+1 >= UINT_MAX / sizeof(*mxf->metadata_sets))
507         return AVERROR(ENOMEM);
508     mxf->metadata_sets = av_realloc(mxf->metadata_sets, (mxf->metadata_sets_count + 1) * sizeof(*mxf->metadata_sets));
509     if (!mxf->metadata_sets)
510         return -1;
511     mxf->metadata_sets[mxf->metadata_sets_count] = metadata_set;
512     mxf->metadata_sets_count++;
513     return 0;
514 }
515
516 static int mxf_read_cryptographic_context(void *arg, AVIOContext *pb, int tag, int size, UID uid)
517 {
518     MXFCryptoContext *cryptocontext = arg;
519     if (size != 16)
520         return -1;
521     if (IS_KLV_KEY(uid, mxf_crypto_source_container_ul))
522         avio_read(pb, cryptocontext->source_container_ul, 16);
523     return 0;
524 }
525
526 static int mxf_read_content_storage(void *arg, AVIOContext *pb, int tag, int size, UID uid)
527 {
528     MXFContext *mxf = arg;
529     switch (tag) {
530     case 0x1901:
531         mxf->packages_count = avio_rb32(pb);
532         if (mxf->packages_count >= UINT_MAX / sizeof(UID))
533             return -1;
534         mxf->packages_refs = av_malloc(mxf->packages_count * sizeof(UID));
535         if (!mxf->packages_refs)
536             return -1;
537         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
538         avio_read(pb, (uint8_t *)mxf->packages_refs, mxf->packages_count * sizeof(UID));
539         break;
540     }
541     return 0;
542 }
543
544 static int mxf_read_source_clip(void *arg, AVIOContext *pb, int tag, int size, UID uid)
545 {
546     MXFStructuralComponent *source_clip = arg;
547     switch(tag) {
548     case 0x0202:
549         source_clip->duration = avio_rb64(pb);
550         break;
551     case 0x1201:
552         source_clip->start_position = avio_rb64(pb);
553         break;
554     case 0x1101:
555         /* UMID, only get last 16 bytes */
556         avio_skip(pb, 16);
557         avio_read(pb, source_clip->source_package_uid, 16);
558         break;
559     case 0x1102:
560         source_clip->source_track_id = avio_rb32(pb);
561         break;
562     }
563     return 0;
564 }
565
566 static int mxf_read_material_package(void *arg, AVIOContext *pb, int tag, int size, UID uid)
567 {
568     MXFPackage *package = arg;
569     switch(tag) {
570     case 0x4403:
571         package->tracks_count = avio_rb32(pb);
572         if (package->tracks_count >= UINT_MAX / sizeof(UID))
573             return -1;
574         package->tracks_refs = av_malloc(package->tracks_count * sizeof(UID));
575         if (!package->tracks_refs)
576             return -1;
577         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
578         avio_read(pb, (uint8_t *)package->tracks_refs, package->tracks_count * sizeof(UID));
579         break;
580     }
581     return 0;
582 }
583
584 static int mxf_read_track(void *arg, AVIOContext *pb, int tag, int size, UID uid)
585 {
586     MXFTrack *track = arg;
587     switch(tag) {
588     case 0x4801:
589         track->track_id = avio_rb32(pb);
590         break;
591     case 0x4804:
592         avio_read(pb, track->track_number, 4);
593         break;
594     case 0x4B01:
595         track->edit_rate.den = avio_rb32(pb);
596         track->edit_rate.num = avio_rb32(pb);
597         break;
598     case 0x4803:
599         avio_read(pb, track->sequence_ref, 16);
600         break;
601     }
602     return 0;
603 }
604
605 static int mxf_read_sequence(void *arg, AVIOContext *pb, int tag, int size, UID uid)
606 {
607     MXFSequence *sequence = arg;
608     switch(tag) {
609     case 0x0202:
610         sequence->duration = avio_rb64(pb);
611         break;
612     case 0x0201:
613         avio_read(pb, sequence->data_definition_ul, 16);
614         break;
615     case 0x1001:
616         sequence->structural_components_count = avio_rb32(pb);
617         if (sequence->structural_components_count >= UINT_MAX / sizeof(UID))
618             return -1;
619         sequence->structural_components_refs = av_malloc(sequence->structural_components_count * sizeof(UID));
620         if (!sequence->structural_components_refs)
621             return -1;
622         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
623         avio_read(pb, (uint8_t *)sequence->structural_components_refs, sequence->structural_components_count * sizeof(UID));
624         break;
625     }
626     return 0;
627 }
628
629 static int mxf_read_source_package(void *arg, AVIOContext *pb, int tag, int size, UID uid)
630 {
631     MXFPackage *package = arg;
632     switch(tag) {
633     case 0x4403:
634         package->tracks_count = avio_rb32(pb);
635         if (package->tracks_count >= UINT_MAX / sizeof(UID))
636             return -1;
637         package->tracks_refs = av_malloc(package->tracks_count * sizeof(UID));
638         if (!package->tracks_refs)
639             return -1;
640         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
641         avio_read(pb, (uint8_t *)package->tracks_refs, package->tracks_count * sizeof(UID));
642         break;
643     case 0x4401:
644         /* UMID, only get last 16 bytes */
645         avio_skip(pb, 16);
646         avio_read(pb, package->package_uid, 16);
647         break;
648     case 0x4701:
649         avio_read(pb, package->descriptor_ref, 16);
650         break;
651     }
652     return 0;
653 }
654
655 static int mxf_read_delta_entry_array(AVIOContext *pb, MXFIndexTableSegment *segment)
656 {
657     int i, length;
658
659     segment->nb_delta_entries = avio_rb32(pb);
660     length = avio_rb32(pb);
661
662     if (!(segment->slice         = av_calloc(segment->nb_delta_entries, sizeof(*segment->slice))) ||
663         !(segment->element_delta = av_calloc(segment->nb_delta_entries, sizeof(*segment->element_delta))))
664         return AVERROR(ENOMEM);
665
666     for (i = 0; i < segment->nb_delta_entries; i++) {
667         avio_r8(pb);    /* PosTableIndex */
668         segment->slice[i] = avio_r8(pb);
669         segment->element_delta[i] = avio_rb32(pb);
670     }
671     return 0;
672 }
673
674 static int mxf_read_index_entry_array(AVIOContext *pb, MXFIndexTableSegment *segment)
675 {
676     int i, j, length;
677
678     segment->nb_index_entries = avio_rb32(pb);
679     length = avio_rb32(pb);
680
681     if (!(segment->flag_entries          = av_calloc(segment->nb_index_entries, sizeof(*segment->flag_entries))) ||
682         !(segment->stream_offset_entries = av_calloc(segment->nb_index_entries, sizeof(*segment->stream_offset_entries))))
683         return AVERROR(ENOMEM);
684
685     if (segment->slice_count &&
686         !(segment->slice_offset_entries  = av_calloc(segment->nb_index_entries, sizeof(*segment->slice_offset_entries))))
687         return AVERROR(ENOMEM);
688
689     for (i = 0; i < segment->nb_index_entries; i++) {
690         avio_rb16(pb);  /* TemporalOffset and KeyFrameOffset */
691         segment->flag_entries[i] = avio_r8(pb);
692         segment->stream_offset_entries[i] = avio_rb64(pb);
693         if (segment->slice_count) {
694             if (!(segment->slice_offset_entries[i] = av_calloc(segment->slice_count, sizeof(**segment->slice_offset_entries))))
695                 return AVERROR(ENOMEM);
696
697             for (j = 0; j < segment->slice_count; j++)
698                 segment->slice_offset_entries[i][j] = avio_rb32(pb);
699         }
700
701         avio_skip(pb, length - 11 - 4 * segment->slice_count);
702     }
703     return 0;
704 }
705
706 static int mxf_read_index_table_segment(void *arg, AVIOContext *pb, int tag, int size, UID uid)
707 {
708     MXFIndexTableSegment *segment = arg;
709     switch(tag) {
710     case 0x3F05:
711         segment->edit_unit_byte_count = avio_rb32(pb);
712         av_dlog(NULL, "EditUnitByteCount %d\n", segment->edit_unit_byte_count);
713         break;
714     case 0x3F06:
715         segment->index_sid = avio_rb32(pb);
716         av_dlog(NULL, "IndexSID %d\n", segment->index_sid);
717         break;
718     case 0x3F07:
719         segment->body_sid = avio_rb32(pb);
720         av_dlog(NULL, "BodySID %d\n", segment->body_sid);
721         break;
722     case 0x3F08:
723         segment->slice_count = avio_r8(pb);
724         av_dlog(NULL, "SliceCount %d\n", segment->slice_count);
725         break;
726     case 0x3F09:
727         av_dlog(NULL, "DeltaEntryArray found\n");
728         return mxf_read_delta_entry_array(pb, segment);
729     case 0x3F0A:
730         av_dlog(NULL, "IndexEntryArray found\n");
731         return mxf_read_index_entry_array(pb, segment);
732     case 0x3F0B:
733         segment->index_edit_rate.num = avio_rb32(pb);
734         segment->index_edit_rate.den = avio_rb32(pb);
735         av_dlog(NULL, "IndexEditRate %d/%d\n", segment->index_edit_rate.num,
736                 segment->index_edit_rate.den);
737         break;
738     case 0x3F0C:
739         segment->index_start_position = avio_rb64(pb);
740         av_dlog(NULL, "IndexStartPosition %"PRId64"\n", segment->index_start_position);
741         break;
742     case 0x3F0D:
743         segment->index_duration = avio_rb64(pb);
744         av_dlog(NULL, "IndexDuration %"PRId64"\n", segment->index_duration);
745         break;
746     }
747     return 0;
748 }
749
750 static void mxf_read_pixel_layout(AVIOContext *pb, MXFDescriptor *descriptor)
751 {
752     int code, value, ofs = 0;
753     char layout[16] = {0};
754
755     do {
756         code = avio_r8(pb);
757         value = avio_r8(pb);
758         av_dlog(NULL, "pixel layout: code %#x\n", code);
759
760         if (ofs < 16) {
761             layout[ofs++] = code;
762             layout[ofs++] = value;
763         }
764     } while (code != 0); /* SMPTE 377M E.2.46 */
765
766     ff_mxf_decode_pixel_layout(layout, &descriptor->pix_fmt);
767 }
768
769 static int mxf_read_generic_descriptor(void *arg, AVIOContext *pb, int tag, int size, UID uid)
770 {
771     MXFDescriptor *descriptor = arg;
772     switch(tag) {
773     case 0x3F01:
774         descriptor->sub_descriptors_count = avio_rb32(pb);
775         if (descriptor->sub_descriptors_count >= UINT_MAX / sizeof(UID))
776             return -1;
777         descriptor->sub_descriptors_refs = av_malloc(descriptor->sub_descriptors_count * sizeof(UID));
778         if (!descriptor->sub_descriptors_refs)
779             return -1;
780         avio_skip(pb, 4); /* useless size of objects, always 16 according to specs */
781         avio_read(pb, (uint8_t *)descriptor->sub_descriptors_refs, descriptor->sub_descriptors_count * sizeof(UID));
782         break;
783     case 0x3004:
784         avio_read(pb, descriptor->essence_container_ul, 16);
785         break;
786     case 0x3006:
787         descriptor->linked_track_id = avio_rb32(pb);
788         break;
789     case 0x3201: /* PictureEssenceCoding */
790         avio_read(pb, descriptor->essence_codec_ul, 16);
791         break;
792     case 0x3203:
793         descriptor->width = avio_rb32(pb);
794         break;
795     case 0x3202:
796         descriptor->height = avio_rb32(pb);
797         break;
798     case 0x320E:
799         descriptor->aspect_ratio.num = avio_rb32(pb);
800         descriptor->aspect_ratio.den = avio_rb32(pb);
801         break;
802     case 0x3D03:
803         descriptor->sample_rate.num = avio_rb32(pb);
804         descriptor->sample_rate.den = avio_rb32(pb);
805         break;
806     case 0x3D06: /* SoundEssenceCompression */
807         avio_read(pb, descriptor->essence_codec_ul, 16);
808         break;
809     case 0x3D07:
810         descriptor->channels = avio_rb32(pb);
811         break;
812     case 0x3D01:
813         descriptor->bits_per_sample = avio_rb32(pb);
814         break;
815     case 0x3401:
816         mxf_read_pixel_layout(pb, descriptor);
817         break;
818     default:
819         /* Private uid used by SONY C0023S01.mxf */
820         if (IS_KLV_KEY(uid, mxf_sony_mpeg4_extradata)) {
821             descriptor->extradata = av_malloc(size + FF_INPUT_BUFFER_PADDING_SIZE);
822             if (!descriptor->extradata)
823                 return -1;
824             descriptor->extradata_size = size;
825             avio_read(pb, descriptor->extradata, size);
826         }
827         break;
828     }
829     return 0;
830 }
831
832 /*
833  * Match an uid independently of the version byte and up to len common bytes
834  * Returns: boolean
835  */
836 static int mxf_match_uid(const UID key, const UID uid, int len)
837 {
838     int i;
839     for (i = 0; i < len; i++) {
840         if (i != 7 && key[i] != uid[i])
841             return 0;
842     }
843     return 1;
844 }
845
846 static const MXFCodecUL *mxf_get_codec_ul(const MXFCodecUL *uls, UID *uid)
847 {
848     while (uls->uid[0]) {
849         if(mxf_match_uid(uls->uid, *uid, uls->matching_len))
850             break;
851         uls++;
852     }
853     return uls;
854 }
855
856 static void *mxf_resolve_strong_ref(MXFContext *mxf, UID *strong_ref, enum MXFMetadataSetType type)
857 {
858     int i;
859
860     if (!strong_ref)
861         return NULL;
862     for (i = 0; i < mxf->metadata_sets_count; i++) {
863         if (!memcmp(*strong_ref, mxf->metadata_sets[i]->uid, 16) &&
864             (type == AnyType || mxf->metadata_sets[i]->type == type)) {
865             return mxf->metadata_sets[i];
866         }
867     }
868     return NULL;
869 }
870
871 static const MXFCodecUL mxf_essence_container_uls[] = {
872     // video essence container uls
873     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x02,0x0D,0x01,0x03,0x01,0x02,0x04,0x60,0x01 }, 14, CODEC_ID_MPEG2VIDEO }, /* MPEG-ES Frame wrapped */
874     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x01,0x0D,0x01,0x03,0x01,0x02,0x02,0x41,0x01 }, 14,    CODEC_ID_DVVIDEO }, /* DV 625 25mbps */
875     // sound essence container uls
876     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x01,0x0D,0x01,0x03,0x01,0x02,0x06,0x01,0x00 }, 14, CODEC_ID_PCM_S16LE }, /* BWF Frame wrapped */
877     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x02,0x0D,0x01,0x03,0x01,0x02,0x04,0x40,0x01 }, 14,       CODEC_ID_MP2 }, /* MPEG-ES Frame wrapped, 0x40 ??? stream id */
878     { { 0x06,0x0E,0x2B,0x34,0x04,0x01,0x01,0x01,0x0D,0x01,0x03,0x01,0x02,0x01,0x01,0x01 }, 14, CODEC_ID_PCM_S16LE }, /* D-10 Mapping 50Mbps PAL Extended Template */
879     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 },  0,      CODEC_ID_NONE },
880 };
881
882 static int mxf_get_sorted_table_segments(MXFContext *mxf, int *nb_sorted_segments, MXFIndexTableSegment ***sorted_segments)
883 {
884     int i, j, nb_segments = 0;
885     MXFIndexTableSegment **unsorted_segments;
886     int last_body_sid = -1, last_index_sid = -1, last_index_start = -1;
887
888     /* count number of segments, allocate arrays and copy unsorted segments */
889     for (i = 0; i < mxf->metadata_sets_count; i++)
890         if (mxf->metadata_sets[i]->type == IndexTableSegment)
891             nb_segments++;
892
893     if (!(unsorted_segments = av_calloc(nb_segments, sizeof(*unsorted_segments))) ||
894         !(*sorted_segments  = av_calloc(nb_segments, sizeof(**sorted_segments)))) {
895         av_free(unsorted_segments);
896         return AVERROR(ENOMEM);
897     }
898
899     for (i = j = 0; i < mxf->metadata_sets_count; i++)
900         if (mxf->metadata_sets[i]->type == IndexTableSegment)
901             unsorted_segments[j++] = (MXFIndexTableSegment*)mxf->metadata_sets[i];
902
903     *nb_sorted_segments = 0;
904
905     /* sort segments by {BodySID, IndexSID, IndexStartPosition}, remove duplicates while we're at it */
906     for (i = 0; i < nb_segments; i++) {
907         int best = -1, best_body_sid = -1, best_index_sid = -1, best_index_start = -1;
908
909         for (j = 0; j < nb_segments; j++) {
910             MXFIndexTableSegment *s = unsorted_segments[j];
911
912             /* Require larger BosySID, IndexSID or IndexStartPosition then the previous entry. This removes duplicates.
913              * We want the smallest values for the keys than what we currently have, unless this is the first such entry this time around.
914              */
915             if ((i == 0     || s->body_sid > last_body_sid || s->index_sid > last_index_sid || s->index_start_position > last_index_start) &&
916                 (best == -1 || s->body_sid < best_body_sid || s->index_sid < best_index_sid || s->index_start_position < best_index_start)) {
917                 best             = j;
918                 best_body_sid    = s->body_sid;
919                 best_index_sid   = s->index_sid;
920                 best_index_start = s->index_start_position;
921             }
922         }
923
924         /* no suitable entry found -> we're done */
925         if (best == -1)
926             break;
927
928         (*sorted_segments)[(*nb_sorted_segments)++] = unsorted_segments[best];
929         last_body_sid    = best_body_sid;
930         last_index_sid   = best_index_sid;
931         last_index_start = best_index_start;
932     }
933
934     av_free(unsorted_segments);
935
936     return 0;
937 }
938
939 static int mxf_parse_index(MXFContext *mxf, int i, AVStream *st)
940 {
941     int64_t accumulated_offset = 0;
942     int j, k, ret, nb_sorted_segments;
943     MXFIndexTableSegment **sorted_segments;
944
945     if ((ret = mxf_get_sorted_table_segments(mxf, &nb_sorted_segments, &sorted_segments)))
946         return ret;
947
948     for (j = 0; j < nb_sorted_segments; j++) {
949         int n_delta = i;
950         int duration, sample_duration = 1, last_sample_size = 0;
951         int64_t segment_size;
952         MXFIndexTableSegment *tableseg = sorted_segments[j];
953
954         /* reset accumulated_offset on BodySID change */
955         if (j > 0 && tableseg->body_sid != sorted_segments[j-1]->body_sid)
956             accumulated_offset = 0;
957
958         /* HACK: How to correctly link between streams and slices? */
959         if (i < mxf->system_item + st->index)
960             n_delta++;
961         if (n_delta >= tableseg->nb_delta_entries && st->index != 0)
962             continue;
963         duration = tableseg->index_duration > 0 ? tableseg->index_duration :
964             st->duration - st->nb_index_entries;
965         segment_size = tableseg->edit_unit_byte_count * duration;
966         /* check small EditUnitByteCount for audio */
967         if (tableseg->edit_unit_byte_count && tableseg->edit_unit_byte_count < 32
968             && !tableseg->index_duration) {
969             /* duration might be prime relative to the new sample_duration,
970              * which means we need to handle the last frame differently */
971             sample_duration = 8192;
972             last_sample_size = (duration % sample_duration) * tableseg->edit_unit_byte_count;
973             tableseg->edit_unit_byte_count *= sample_duration;
974             duration /= sample_duration;
975             if (last_sample_size) duration++;
976         }
977
978         for (k = 0; k < duration; k++) {
979             int64_t pos;
980             int size, flags = 0;
981
982             if (k < tableseg->nb_index_entries) {
983                 pos = tableseg->stream_offset_entries[k];
984                 if (n_delta < tableseg->nb_delta_entries) {
985                     if (n_delta < tableseg->nb_delta_entries - 1) {
986                         size =
987                             tableseg->slice_offset_entries[k][tableseg->slice[n_delta+1]-1] +
988                             tableseg->element_delta[n_delta+1] -
989                             tableseg->element_delta[n_delta];
990                         if (tableseg->slice[n_delta] > 0)
991                             size -= tableseg->slice_offset_entries[k][tableseg->slice[n_delta]-1];
992                     } else if (k < duration - 1) {
993                         size = tableseg->stream_offset_entries[k+1] -
994                             tableseg->stream_offset_entries[k] -
995                             tableseg->slice_offset_entries[k][tableseg->slice[tableseg->nb_delta_entries-1]-1] -
996                             tableseg->element_delta[tableseg->nb_delta_entries-1];
997                     } else
998                         size = 0;
999                     if (tableseg->slice[n_delta] > 0)
1000                         pos += tableseg->slice_offset_entries[k][tableseg->slice[n_delta]-1];
1001                     pos += tableseg->element_delta[n_delta];
1002                 } else
1003                     size = 0;
1004                 flags = !(tableseg->flag_entries[k] & 0x30) ? AVINDEX_KEYFRAME : 0;
1005             } else {
1006                 pos = (int64_t)k * tableseg->edit_unit_byte_count + accumulated_offset;
1007                 if (n_delta < tableseg->nb_delta_entries - 1)
1008                     size = tableseg->element_delta[n_delta+1] - tableseg->element_delta[n_delta];
1009                 else {
1010                     /* use smaller size for last sample if we should */
1011                     if (last_sample_size && k == duration - 1)
1012                         size = last_sample_size;
1013                     else
1014                         size = tableseg->edit_unit_byte_count;
1015                     if (tableseg->nb_delta_entries)
1016                         size -= tableseg->element_delta[tableseg->nb_delta_entries-1];
1017                 }
1018                 if (n_delta < tableseg->nb_delta_entries)
1019                     pos += tableseg->element_delta[n_delta];
1020                 flags = AVINDEX_KEYFRAME;
1021             }
1022
1023             if (k > 0 && pos < mxf->first_essence_length && accumulated_offset == 0)
1024                 pos += mxf->first_essence_kl_length;
1025
1026             pos += mxf->essence_offset;
1027
1028             av_dlog(mxf->fc, "Stream %d IndexEntry %d n_Delta %d Offset %"PRIx64" Timestamp %"PRId64"\n",
1029                     st->index, st->nb_index_entries, n_delta, pos, sample_duration * st->nb_index_entries);
1030
1031             if ((ret = av_add_index_entry(st, pos, sample_duration * st->nb_index_entries, size, 0, flags)) < 0)
1032                 return ret;
1033         }
1034         accumulated_offset += segment_size;
1035     }
1036
1037     av_free(sorted_segments);
1038
1039     return 0;
1040 }
1041
1042 static int mxf_parse_structural_metadata(MXFContext *mxf)
1043 {
1044     MXFPackage *material_package = NULL;
1045     MXFPackage *temp_package = NULL;
1046     int i, j, k, ret;
1047
1048     av_dlog(mxf->fc, "metadata sets count %d\n", mxf->metadata_sets_count);
1049     /* TODO: handle multiple material packages (OP3x) */
1050     for (i = 0; i < mxf->packages_count; i++) {
1051         material_package = mxf_resolve_strong_ref(mxf, &mxf->packages_refs[i], MaterialPackage);
1052         if (material_package) break;
1053     }
1054     if (!material_package) {
1055         av_log(mxf->fc, AV_LOG_ERROR, "no material package found\n");
1056         return -1;
1057     }
1058
1059     for (i = 0; i < material_package->tracks_count; i++) {
1060         MXFPackage *source_package = NULL;
1061         MXFTrack *material_track = NULL;
1062         MXFTrack *source_track = NULL;
1063         MXFTrack *temp_track = NULL;
1064         MXFDescriptor *descriptor = NULL;
1065         MXFStructuralComponent *component = NULL;
1066         UID *essence_container_ul = NULL;
1067         const MXFCodecUL *codec_ul = NULL;
1068         const MXFCodecUL *container_ul = NULL;
1069         AVStream *st;
1070
1071         if (!(material_track = mxf_resolve_strong_ref(mxf, &material_package->tracks_refs[i], Track))) {
1072             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve material track strong ref\n");
1073             continue;
1074         }
1075
1076         if (!(material_track->sequence = mxf_resolve_strong_ref(mxf, &material_track->sequence_ref, Sequence))) {
1077             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve material track sequence strong ref\n");
1078             continue;
1079         }
1080
1081         /* TODO: handle multiple source clips */
1082         for (j = 0; j < material_track->sequence->structural_components_count; j++) {
1083             /* TODO: handle timecode component */
1084             component = mxf_resolve_strong_ref(mxf, &material_track->sequence->structural_components_refs[j], SourceClip);
1085             if (!component)
1086                 continue;
1087
1088             for (k = 0; k < mxf->packages_count; k++) {
1089                 temp_package = mxf_resolve_strong_ref(mxf, &mxf->packages_refs[k], SourcePackage);
1090                 if (!temp_package)
1091                     continue;
1092                 if (!memcmp(temp_package->package_uid, component->source_package_uid, 16)) {
1093                     source_package = temp_package;
1094                     break;
1095                 }
1096             }
1097             if (!source_package) {
1098                 av_log(mxf->fc, AV_LOG_ERROR, "material track %d: no corresponding source package found\n", material_track->track_id);
1099                 break;
1100             }
1101             for (k = 0; k < source_package->tracks_count; k++) {
1102                 if (!(temp_track = mxf_resolve_strong_ref(mxf, &source_package->tracks_refs[k], Track))) {
1103                     av_log(mxf->fc, AV_LOG_ERROR, "could not resolve source track strong ref\n");
1104                     return -1;
1105                 }
1106                 if (temp_track->track_id == component->source_track_id) {
1107                     source_track = temp_track;
1108                     break;
1109                 }
1110             }
1111             if (!source_track) {
1112                 av_log(mxf->fc, AV_LOG_ERROR, "material track %d: no corresponding source track found\n", material_track->track_id);
1113                 break;
1114             }
1115         }
1116         if (!source_track)
1117             continue;
1118
1119         st = avformat_new_stream(mxf->fc, NULL);
1120         if (!st) {
1121             av_log(mxf->fc, AV_LOG_ERROR, "could not allocate stream\n");
1122             return -1;
1123         }
1124         st->id = source_track->track_id;
1125         st->priv_data = source_track;
1126         st->duration = component->duration;
1127         if (st->duration == -1)
1128             st->duration = AV_NOPTS_VALUE;
1129         st->start_time = component->start_position;
1130         av_set_pts_info(st, 64, material_track->edit_rate.num, material_track->edit_rate.den);
1131
1132         if (!(source_track->sequence = mxf_resolve_strong_ref(mxf, &source_track->sequence_ref, Sequence))) {
1133             av_log(mxf->fc, AV_LOG_ERROR, "could not resolve source track sequence strong ref\n");
1134             return -1;
1135         }
1136
1137         PRINT_KEY(mxf->fc, "data definition   ul", source_track->sequence->data_definition_ul);
1138         codec_ul = mxf_get_codec_ul(ff_mxf_data_definition_uls, &source_track->sequence->data_definition_ul);
1139         st->codec->codec_type = codec_ul->id;
1140
1141         source_package->descriptor = mxf_resolve_strong_ref(mxf, &source_package->descriptor_ref, AnyType);
1142         if (source_package->descriptor) {
1143             if (source_package->descriptor->type == MultipleDescriptor) {
1144                 for (j = 0; j < source_package->descriptor->sub_descriptors_count; j++) {
1145                     MXFDescriptor *sub_descriptor = mxf_resolve_strong_ref(mxf, &source_package->descriptor->sub_descriptors_refs[j], Descriptor);
1146
1147                     if (!sub_descriptor) {
1148                         av_log(mxf->fc, AV_LOG_ERROR, "could not resolve sub descriptor strong ref\n");
1149                         continue;
1150                     }
1151                     if (sub_descriptor->linked_track_id == source_track->track_id) {
1152                         descriptor = sub_descriptor;
1153                         break;
1154                     }
1155                 }
1156             } else if (source_package->descriptor->type == Descriptor)
1157                 descriptor = source_package->descriptor;
1158         }
1159         if (!descriptor) {
1160             av_log(mxf->fc, AV_LOG_INFO, "source track %d: stream %d, no descriptor found\n", source_track->track_id, st->index);
1161             continue;
1162         }
1163         PRINT_KEY(mxf->fc, "essence codec     ul", descriptor->essence_codec_ul);
1164         PRINT_KEY(mxf->fc, "essence container ul", descriptor->essence_container_ul);
1165         essence_container_ul = &descriptor->essence_container_ul;
1166         /* HACK: replacing the original key with mxf_encrypted_essence_container
1167          * is not allowed according to s429-6, try to find correct information anyway */
1168         if (IS_KLV_KEY(essence_container_ul, mxf_encrypted_essence_container)) {
1169             av_log(mxf->fc, AV_LOG_INFO, "broken encrypted mxf file\n");
1170             for (k = 0; k < mxf->metadata_sets_count; k++) {
1171                 MXFMetadataSet *metadata = mxf->metadata_sets[k];
1172                 if (metadata->type == CryptoContext) {
1173                     essence_container_ul = &((MXFCryptoContext *)metadata)->source_container_ul;
1174                     break;
1175                 }
1176             }
1177         }
1178         /* TODO: drop PictureEssenceCoding and SoundEssenceCompression, only check EssenceContainer */
1179         codec_ul = mxf_get_codec_ul(ff_mxf_codec_uls, &descriptor->essence_codec_ul);
1180         st->codec->codec_id = codec_ul->id;
1181         if (descriptor->extradata) {
1182             st->codec->extradata = descriptor->extradata;
1183             st->codec->extradata_size = descriptor->extradata_size;
1184         }
1185         if (st->codec->codec_type == AVMEDIA_TYPE_VIDEO) {
1186             container_ul = mxf_get_codec_ul(mxf_essence_container_uls, essence_container_ul);
1187             if (st->codec->codec_id == CODEC_ID_NONE)
1188                 st->codec->codec_id = container_ul->id;
1189             st->codec->width = descriptor->width;
1190             st->codec->height = descriptor->height;
1191             if (st->codec->codec_id == CODEC_ID_RAWVIDEO)
1192                 st->codec->pix_fmt = descriptor->pix_fmt;
1193             st->need_parsing = AVSTREAM_PARSE_HEADERS;
1194         } else if (st->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
1195             container_ul = mxf_get_codec_ul(mxf_essence_container_uls, essence_container_ul);
1196             if (st->codec->codec_id == CODEC_ID_NONE)
1197                 st->codec->codec_id = container_ul->id;
1198             st->codec->channels = descriptor->channels;
1199             st->codec->bits_per_coded_sample = descriptor->bits_per_sample;
1200             st->codec->sample_rate = descriptor->sample_rate.num / descriptor->sample_rate.den;
1201             /* TODO: implement CODEC_ID_RAWAUDIO */
1202             if (st->codec->codec_id == CODEC_ID_PCM_S16LE) {
1203                 if (descriptor->bits_per_sample > 16 && descriptor->bits_per_sample <= 24)
1204                     st->codec->codec_id = CODEC_ID_PCM_S24LE;
1205                 else if (descriptor->bits_per_sample == 32)
1206                     st->codec->codec_id = CODEC_ID_PCM_S32LE;
1207             } else if (st->codec->codec_id == CODEC_ID_PCM_S16BE) {
1208                 if (descriptor->bits_per_sample > 16 && descriptor->bits_per_sample <= 24)
1209                     st->codec->codec_id = CODEC_ID_PCM_S24BE;
1210                 else if (descriptor->bits_per_sample == 32)
1211                     st->codec->codec_id = CODEC_ID_PCM_S32BE;
1212             } else if (st->codec->codec_id == CODEC_ID_MP2) {
1213                 st->need_parsing = AVSTREAM_PARSE_FULL;
1214             }
1215         }
1216         if (st->codec->codec_type != AVMEDIA_TYPE_DATA && (*essence_container_ul)[15] > 0x01) {
1217             av_log(mxf->fc, AV_LOG_WARNING, "only frame wrapped mappings are correctly supported\n");
1218             st->need_parsing = AVSTREAM_PARSE_FULL;
1219         }
1220
1221         if ((ret = mxf_parse_index(mxf, i, st)))
1222             return ret;
1223     }
1224     return 0;
1225 }
1226
1227 static const MXFMetadataReadTableEntry mxf_metadata_read_table[] = {
1228     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x05,0x01,0x00 }, mxf_read_primer_pack },
1229     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x01,0x00 }, mxf_read_partition_pack },
1230     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x02,0x00 }, mxf_read_partition_pack },
1231     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x03,0x00 }, mxf_read_partition_pack },
1232     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x02,0x04,0x00 }, mxf_read_partition_pack },
1233     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x01,0x00 }, mxf_read_partition_pack },
1234     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x02,0x00 }, mxf_read_partition_pack },
1235     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x03,0x00 }, mxf_read_partition_pack },
1236     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x03,0x04,0x00 }, mxf_read_partition_pack },
1237     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x04,0x02,0x00 }, mxf_read_partition_pack },
1238     { { 0x06,0x0E,0x2B,0x34,0x02,0x05,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x04,0x04,0x00 }, mxf_read_partition_pack },
1239     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x18,0x00 }, mxf_read_content_storage, 0, AnyType },
1240     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x37,0x00 }, mxf_read_source_package, sizeof(MXFPackage), SourcePackage },
1241     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x36,0x00 }, mxf_read_material_package, sizeof(MXFPackage), MaterialPackage },
1242     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x0F,0x00 }, mxf_read_sequence, sizeof(MXFSequence), Sequence },
1243     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x11,0x00 }, mxf_read_source_clip, sizeof(MXFStructuralComponent), SourceClip },
1244     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x44,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), MultipleDescriptor },
1245     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x42,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* Generic Sound */
1246     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x28,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* CDCI */
1247     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x29,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* RGBA */
1248     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x51,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* MPEG 2 Video */
1249     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x48,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* Wave */
1250     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x47,0x00 }, mxf_read_generic_descriptor, sizeof(MXFDescriptor), Descriptor }, /* AES3 */
1251     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x3A,0x00 }, mxf_read_track, sizeof(MXFTrack), Track }, /* Static Track */
1252     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x01,0x01,0x01,0x01,0x3B,0x00 }, mxf_read_track, sizeof(MXFTrack), Track }, /* Generic Track */
1253     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x04,0x01,0x02,0x02,0x00,0x00 }, mxf_read_cryptographic_context, sizeof(MXFCryptoContext), CryptoContext },
1254     { { 0x06,0x0E,0x2B,0x34,0x02,0x53,0x01,0x01,0x0d,0x01,0x02,0x01,0x01,0x10,0x01,0x00 }, mxf_read_index_table_segment, sizeof(MXFIndexTableSegment), IndexTableSegment },
1255     { { 0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00 }, NULL, 0, AnyType },
1256 };
1257
1258 static int mxf_read_local_tags(MXFContext *mxf, KLVPacket *klv, MXFMetadataReadFunc *read_child, int ctx_size, enum MXFMetadataSetType type)
1259 {
1260     AVIOContext *pb = mxf->fc->pb;
1261     MXFMetadataSet *ctx = ctx_size ? av_mallocz(ctx_size) : mxf;
1262     uint64_t klv_end = avio_tell(pb) + klv->length;
1263
1264     if (!ctx)
1265         return -1;
1266     while (avio_tell(pb) + 4 < klv_end) {
1267         int tag = avio_rb16(pb);
1268         int size = avio_rb16(pb); /* KLV specified by 0x53 */
1269         uint64_t next = avio_tell(pb) + size;
1270         UID uid = {0};
1271
1272         av_dlog(mxf->fc, "local tag %#04x size %d\n", tag, size);
1273         if (!size) { /* ignore empty tag, needed for some files with empty UMID tag */
1274             av_log(mxf->fc, AV_LOG_ERROR, "local tag %#04x with 0 size\n", tag);
1275             continue;
1276         }
1277         if (tag > 0x7FFF) { /* dynamic tag */
1278             int i;
1279             for (i = 0; i < mxf->local_tags_count; i++) {
1280                 int local_tag = AV_RB16(mxf->local_tags+i*18);
1281                 if (local_tag == tag) {
1282                     memcpy(uid, mxf->local_tags+i*18+2, 16);
1283                     av_dlog(mxf->fc, "local tag %#04x\n", local_tag);
1284                     PRINT_KEY(mxf->fc, "uid", uid);
1285                 }
1286             }
1287         }
1288         if (ctx_size && tag == 0x3C0A)
1289             avio_read(pb, ctx->uid, 16);
1290         else if (read_child(ctx, pb, tag, size, uid) < 0)
1291             return -1;
1292
1293         avio_seek(pb, next, SEEK_SET);
1294     }
1295     if (ctx_size) ctx->type = type;
1296     return ctx_size ? mxf_add_metadata_set(mxf, ctx) : 0;
1297 }
1298
1299 static int mxf_read_header(AVFormatContext *s, AVFormatParameters *ap)
1300 {
1301     MXFContext *mxf = s->priv_data;
1302     KLVPacket klv;
1303
1304     if (!mxf_read_sync(s->pb, mxf_header_partition_pack_key, 14)) {
1305         av_log(s, AV_LOG_ERROR, "could not find header partition pack key\n");
1306         return -1;
1307     }
1308     avio_seek(s->pb, -14, SEEK_CUR);
1309     mxf->fc = s;
1310     while (!url_feof(s->pb)) {
1311         const MXFMetadataReadTableEntry *metadata;
1312
1313         if (klv_read_packet(&klv, s->pb) < 0)
1314             return -1;
1315         PRINT_KEY(s, "read header", klv.key);
1316         av_dlog(s, "size %"PRIu64" offset %#"PRIx64"\n", klv.length, klv.offset);
1317         if (IS_KLV_KEY(klv.key, mxf_encrypted_triplet_key) ||
1318             IS_KLV_KEY(klv.key, mxf_essence_element_key)) {
1319             /* FIXME avoid seek */
1320             avio_seek(s->pb, klv.offset, SEEK_SET);
1321             break;
1322         }
1323         if (IS_KLV_KEY(klv.key, mxf_system_item_key)) {
1324             mxf->system_item = 1;
1325             avio_skip(s->pb, klv.length);
1326             continue;
1327         }
1328
1329         for (metadata = mxf_metadata_read_table; metadata->read; metadata++) {
1330             if (IS_KLV_KEY(klv.key, metadata->key)) {
1331                 int res;
1332                 if (klv.key[5] == 0x53) {
1333                     res = mxf_read_local_tags(mxf, &klv, metadata->read, metadata->ctx_size, metadata->type);
1334                 } else {
1335                     uint64_t next = avio_tell(s->pb) + klv.length;
1336                     res = metadata->read(mxf, s->pb, 0, 0, klv.key);
1337                     avio_seek(s->pb, next, SEEK_SET);
1338                 }
1339                 if (res < 0) {
1340                     av_log(s, AV_LOG_ERROR, "error reading header metadata\n");
1341                     return -1;
1342                 }
1343                 break;
1344             }
1345         }
1346         if (!metadata->read)
1347             avio_skip(s->pb, klv.length);
1348     }
1349     return mxf_parse_structural_metadata(mxf);
1350 }
1351
1352 static int mxf_read_close(AVFormatContext *s)
1353 {
1354     MXFContext *mxf = s->priv_data;
1355     MXFIndexTableSegment *seg;
1356     int i, j;
1357
1358     av_freep(&mxf->packages_refs);
1359
1360     for (i = 0; i < s->nb_streams; i++)
1361         s->streams[i]->priv_data = NULL;
1362
1363     for (i = 0; i < mxf->metadata_sets_count; i++) {
1364         switch (mxf->metadata_sets[i]->type) {
1365         case MultipleDescriptor:
1366             av_freep(&((MXFDescriptor *)mxf->metadata_sets[i])->sub_descriptors_refs);
1367             break;
1368         case Sequence:
1369             av_freep(&((MXFSequence *)mxf->metadata_sets[i])->structural_components_refs);
1370             break;
1371         case SourcePackage:
1372         case MaterialPackage:
1373             av_freep(&((MXFPackage *)mxf->metadata_sets[i])->tracks_refs);
1374             break;
1375         case IndexTableSegment:
1376             seg = (MXFIndexTableSegment *)mxf->metadata_sets[i];
1377             for (j = 0; j < seg->nb_index_entries; j++)
1378                 av_freep(&seg->slice_offset_entries[j]);
1379             av_freep(&seg->slice);
1380             av_freep(&seg->element_delta);
1381             av_freep(&seg->flag_entries);
1382             av_freep(&seg->stream_offset_entries);
1383             av_freep(&seg->slice_offset_entries);
1384             break;
1385         default:
1386             break;
1387         }
1388         av_freep(&mxf->metadata_sets[i]);
1389     }
1390     av_freep(&mxf->partitions);
1391     av_freep(&mxf->metadata_sets);
1392     av_freep(&mxf->aesc);
1393     av_freep(&mxf->local_tags);
1394     return 0;
1395 }
1396
1397 static int mxf_probe(AVProbeData *p) {
1398     uint8_t *bufp = p->buf;
1399     uint8_t *end = p->buf + p->buf_size;
1400
1401     if (p->buf_size < sizeof(mxf_header_partition_pack_key))
1402         return 0;
1403
1404     /* Must skip Run-In Sequence and search for MXF header partition pack key SMPTE 377M 5.5 */
1405     end -= sizeof(mxf_header_partition_pack_key);
1406     for (; bufp < end; bufp++) {
1407         if (IS_KLV_KEY(bufp, mxf_header_partition_pack_key))
1408             return AVPROBE_SCORE_MAX;
1409     }
1410     return 0;
1411 }
1412
1413 /* rudimentary byte seek */
1414 /* XXX: use MXF Index */
1415 static int mxf_read_seek(AVFormatContext *s, int stream_index, int64_t sample_time, int flags)
1416 {
1417     AVStream *st = s->streams[stream_index];
1418     int64_t seconds;
1419
1420     if (!s->bit_rate)
1421         return -1;
1422     if (sample_time < 0)
1423         sample_time = 0;
1424     seconds = av_rescale(sample_time, st->time_base.num, st->time_base.den);
1425     if (avio_seek(s->pb, (s->bit_rate * seconds) >> 3, SEEK_SET) < 0)
1426         return -1;
1427     ff_update_cur_dts(s, st, sample_time);
1428     return 0;
1429 }
1430
1431 AVInputFormat ff_mxf_demuxer = {
1432     .name           = "mxf",
1433     .long_name      = NULL_IF_CONFIG_SMALL("Material eXchange Format"),
1434     .priv_data_size = sizeof(MXFContext),
1435     .read_probe     = mxf_probe,
1436     .read_header    = mxf_read_header,
1437     .read_packet    = mxf_read_packet,
1438     .read_close     = mxf_read_close,
1439     .read_seek      = mxf_read_seek,
1440 };