]> git.sesse.net Git - ffmpeg/blob - libavcodec/proresdec.c
lavu: Remove bit packing from AVComponentDescriptor
[ffmpeg] / libavcodec / proresdec.c
1 /*
2  * Apple ProRes compatible decoder
3  *
4  * Copyright (c) 2010-2011 Maxim Poliakovski
5  *
6  * This file is part of Libav.
7  *
8  * Libav is free software; you can redistribute it and/or
9  * modify it under the terms of the GNU Lesser General Public
10  * License as published by the Free Software Foundation; either
11  * version 2.1 of the License, or (at your option) any later version.
12  *
13  * Libav is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16  * Lesser General Public License for more details.
17  *
18  * You should have received a copy of the GNU Lesser General Public
19  * License along with Libav; if not, write to the Free Software
20  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
21  */
22
23 /**
24  * @file
25  * This is a decoder for Apple ProRes 422 SD/HQ/LT/Proxy and ProRes 4444.
26  * It is used for storing and editing high definition video data in Apple's Final Cut Pro.
27  *
28  * @see http://wiki.multimedia.cx/index.php?title=Apple_ProRes
29  */
30
31 #define LONG_BITSTREAM_READER // some ProRes vlc codes require up to 28 bits to be read at once
32
33 #include <stdint.h>
34
35 #include "libavutil/intmath.h"
36 #include "avcodec.h"
37 #include "idctdsp.h"
38 #include "internal.h"
39 #include "proresdata.h"
40 #include "proresdsp.h"
41 #include "get_bits.h"
42
43 typedef struct ProresThreadData {
44     const uint8_t *index;            ///< pointers to the data of this slice
45     int slice_num;
46     int x_pos, y_pos;
47     int slice_width;
48     int prev_slice_sf;               ///< scalefactor of the previous decoded slice
49     DECLARE_ALIGNED(16, int16_t, blocks)[8 * 4 * 64];
50     DECLARE_ALIGNED(16, int16_t, qmat_luma_scaled)[64];
51     DECLARE_ALIGNED(16, int16_t, qmat_chroma_scaled)[64];
52 } ProresThreadData;
53
54 typedef struct ProresContext {
55     ProresDSPContext dsp;
56     AVFrame    *frame;
57     ScanTable  scantable;
58     int        scantable_type;           ///< -1 = uninitialized, 0 = progressive, 1/2 = interlaced
59
60     int        frame_type;               ///< 0 = progressive, 1 = top-field first, 2 = bottom-field first
61     int        pic_format;               ///< 2 = 422, 3 = 444
62     uint8_t    qmat_luma[64];            ///< dequantization matrix for luma
63     uint8_t    qmat_chroma[64];          ///< dequantization matrix for chroma
64     int        qmat_changed;             ///< 1 - global quantization matrices changed
65     int        total_slices;            ///< total number of slices in a picture
66     ProresThreadData *slice_data;
67     int        pic_num;
68     int        chroma_factor;
69     int        mb_chroma_factor;
70     int        num_chroma_blocks;       ///< number of chrominance blocks in a macroblock
71     int        num_x_slices;
72     int        num_y_slices;
73     int        slice_width_factor;
74     int        slice_height_factor;
75     int        num_x_mbs;
76     int        num_y_mbs;
77     int        alpha_info;
78 } ProresContext;
79
80
81 static av_cold int decode_init(AVCodecContext *avctx)
82 {
83     ProresContext *ctx = avctx->priv_data;
84
85     ctx->total_slices     = 0;
86     ctx->slice_data       = NULL;
87
88     avctx->bits_per_raw_sample = PRORES_BITS_PER_SAMPLE;
89     ff_proresdsp_init(&ctx->dsp);
90
91     ctx->scantable_type = -1;   // set scantable type to uninitialized
92     memset(ctx->qmat_luma, 4, 64);
93     memset(ctx->qmat_chroma, 4, 64);
94
95     return 0;
96 }
97
98
99 static int decode_frame_header(ProresContext *ctx, const uint8_t *buf,
100                                const int data_size, AVCodecContext *avctx)
101 {
102     int hdr_size, version, width, height, flags;
103     const uint8_t *ptr;
104
105     hdr_size = AV_RB16(buf);
106     if (hdr_size > data_size) {
107         av_log(avctx, AV_LOG_ERROR, "frame data too small\n");
108         return AVERROR_INVALIDDATA;
109     }
110
111     version = AV_RB16(buf + 2);
112     if (version >= 2) {
113         av_log(avctx, AV_LOG_ERROR,
114                "unsupported header version: %d\n", version);
115         return AVERROR_INVALIDDATA;
116     }
117
118     width  = AV_RB16(buf + 8);
119     height = AV_RB16(buf + 10);
120     if (width != avctx->width || height != avctx->height) {
121         av_log(avctx, AV_LOG_ERROR,
122                "picture dimension changed: old: %d x %d, new: %d x %d\n",
123                avctx->width, avctx->height, width, height);
124         return AVERROR_INVALIDDATA;
125     }
126
127     ctx->frame_type = (buf[12] >> 2) & 3;
128     if (ctx->frame_type > 2) {
129         av_log(avctx, AV_LOG_ERROR,
130                "unsupported frame type: %d\n", ctx->frame_type);
131         return AVERROR_INVALIDDATA;
132     }
133
134     ctx->chroma_factor     = (buf[12] >> 6) & 3;
135     ctx->mb_chroma_factor  = ctx->chroma_factor + 2;
136     ctx->num_chroma_blocks = (1 << ctx->chroma_factor) >> 1;
137     ctx->alpha_info        = buf[17] & 0xf;
138
139     if (ctx->alpha_info > 2) {
140         av_log(avctx, AV_LOG_ERROR, "Invalid alpha mode %d\n", ctx->alpha_info);
141         return AVERROR_INVALIDDATA;
142     }
143
144     switch (ctx->chroma_factor) {
145     case 2:
146         avctx->pix_fmt = ctx->alpha_info ? AV_PIX_FMT_YUVA422P10
147                                          : AV_PIX_FMT_YUV422P10;
148         break;
149     case 3:
150         avctx->pix_fmt = ctx->alpha_info ? AV_PIX_FMT_YUVA444P10
151                                          : AV_PIX_FMT_YUV444P10;
152         break;
153     default:
154         av_log(avctx, AV_LOG_ERROR,
155                "unsupported picture format: %d\n", ctx->pic_format);
156         return AVERROR_INVALIDDATA;
157     }
158
159     if (ctx->scantable_type != ctx->frame_type) {
160         if (!ctx->frame_type)
161             ff_init_scantable(ctx->dsp.idct_permutation, &ctx->scantable,
162                               ff_prores_progressive_scan);
163         else
164             ff_init_scantable(ctx->dsp.idct_permutation, &ctx->scantable,
165                               ff_prores_interlaced_scan);
166         ctx->scantable_type = ctx->frame_type;
167     }
168
169     if (ctx->frame_type) {      /* if interlaced */
170         ctx->frame->interlaced_frame = 1;
171         ctx->frame->top_field_first  = ctx->frame_type & 1;
172     } else {
173         ctx->frame->interlaced_frame = 0;
174     }
175
176     avctx->color_primaries = buf[14];
177     avctx->color_trc       = buf[15];
178     avctx->colorspace      = buf[16];
179
180     ctx->qmat_changed = 0;
181     ptr   = buf + 20;
182     flags = buf[19];
183     if (flags & 2) {
184         if (ptr - buf > hdr_size - 64) {
185             av_log(avctx, AV_LOG_ERROR, "header data too small\n");
186             return AVERROR_INVALIDDATA;
187         }
188         if (memcmp(ctx->qmat_luma, ptr, 64)) {
189             memcpy(ctx->qmat_luma, ptr, 64);
190             ctx->qmat_changed = 1;
191         }
192         ptr += 64;
193     } else {
194         memset(ctx->qmat_luma, 4, 64);
195         ctx->qmat_changed = 1;
196     }
197
198     if (flags & 1) {
199         if (ptr - buf > hdr_size - 64) {
200             av_log(avctx, AV_LOG_ERROR, "header data too small\n");
201             return -1;
202         }
203         if (memcmp(ctx->qmat_chroma, ptr, 64)) {
204             memcpy(ctx->qmat_chroma, ptr, 64);
205             ctx->qmat_changed = 1;
206         }
207     } else {
208         memset(ctx->qmat_chroma, 4, 64);
209         ctx->qmat_changed = 1;
210     }
211
212     return hdr_size;
213 }
214
215
216 static int decode_picture_header(ProresContext *ctx, const uint8_t *buf,
217                                  const int data_size, AVCodecContext *avctx)
218 {
219     int   i, hdr_size, pic_data_size, num_slices;
220     int   slice_width_factor, slice_height_factor;
221     int   remainder, num_x_slices;
222     const uint8_t *data_ptr, *index_ptr;
223
224     hdr_size = data_size > 0 ? buf[0] >> 3 : 0;
225     if (hdr_size < 8 || hdr_size > data_size) {
226         av_log(avctx, AV_LOG_ERROR, "picture header too small\n");
227         return AVERROR_INVALIDDATA;
228     }
229
230     pic_data_size = AV_RB32(buf + 1);
231     if (pic_data_size > data_size) {
232         av_log(avctx, AV_LOG_ERROR, "picture data too small\n");
233         return AVERROR_INVALIDDATA;
234     }
235
236     slice_width_factor  = buf[7] >> 4;
237     slice_height_factor = buf[7] & 0xF;
238     if (slice_width_factor > 3 || slice_height_factor) {
239         av_log(avctx, AV_LOG_ERROR,
240                "unsupported slice dimension: %d x %d\n",
241                1 << slice_width_factor, 1 << slice_height_factor);
242         return AVERROR_INVALIDDATA;
243     }
244
245     ctx->slice_width_factor  = slice_width_factor;
246     ctx->slice_height_factor = slice_height_factor;
247
248     ctx->num_x_mbs = (avctx->width + 15) >> 4;
249     ctx->num_y_mbs = (avctx->height +
250                       (1 << (4 + ctx->frame->interlaced_frame)) - 1) >>
251                      (4 + ctx->frame->interlaced_frame);
252
253     remainder    = ctx->num_x_mbs & ((1 << slice_width_factor) - 1);
254     num_x_slices = (ctx->num_x_mbs >> slice_width_factor) + (remainder & 1) +
255                    ((remainder >> 1) & 1) + ((remainder >> 2) & 1);
256
257     num_slices = num_x_slices * ctx->num_y_mbs;
258     if (num_slices != AV_RB16(buf + 5)) {
259         av_log(avctx, AV_LOG_ERROR, "invalid number of slices\n");
260         return AVERROR_INVALIDDATA;
261     }
262
263     if (ctx->total_slices != num_slices) {
264         av_freep(&ctx->slice_data);
265         ctx->slice_data = av_malloc((num_slices + 1) * sizeof(ctx->slice_data[0]));
266         if (!ctx->slice_data)
267             return AVERROR(ENOMEM);
268         ctx->total_slices = num_slices;
269     }
270
271     if (hdr_size + num_slices * 2 > data_size) {
272         av_log(avctx, AV_LOG_ERROR, "slice table too small\n");
273         return AVERROR_INVALIDDATA;
274     }
275
276     /* parse slice table allowing quick access to the slice data */
277     index_ptr = buf + hdr_size;
278     data_ptr = index_ptr + num_slices * 2;
279
280     for (i = 0; i < num_slices; i++) {
281         ctx->slice_data[i].index = data_ptr;
282         ctx->slice_data[i].prev_slice_sf = 0;
283         data_ptr += AV_RB16(index_ptr + i * 2);
284     }
285     ctx->slice_data[i].index = data_ptr;
286     ctx->slice_data[i].prev_slice_sf = 0;
287
288     if (data_ptr > buf + data_size) {
289         av_log(avctx, AV_LOG_ERROR, "out of slice data\n");
290         return -1;
291     }
292
293     return pic_data_size;
294 }
295
296
297 /**
298  * Read an unsigned rice/exp golomb codeword.
299  */
300 static inline int decode_vlc_codeword(GetBitContext *gb, unsigned codebook)
301 {
302     unsigned int rice_order, exp_order, switch_bits;
303     unsigned int buf, code;
304     int log, prefix_len, len;
305
306     OPEN_READER(re, gb);
307     UPDATE_CACHE(re, gb);
308     buf = GET_CACHE(re, gb);
309
310     /* number of prefix bits to switch between Rice and expGolomb */
311     switch_bits = (codebook & 3) + 1;
312     rice_order  = codebook >> 5;        /* rice code order */
313     exp_order   = (codebook >> 2) & 7;  /* exp golomb code order */
314
315     log = 31 - av_log2(buf); /* count prefix bits (zeroes) */
316
317     if (log < switch_bits) { /* ok, we got a rice code */
318         if (!rice_order) {
319             /* shortcut for faster decoding of rice codes without remainder */
320             code = log;
321             LAST_SKIP_BITS(re, gb, log + 1);
322         } else {
323             prefix_len = log + 1;
324             code = (log << rice_order) + NEG_USR32(buf << prefix_len, rice_order);
325             LAST_SKIP_BITS(re, gb, prefix_len + rice_order);
326         }
327     } else { /* otherwise we got a exp golomb code */
328         len  = (log << 1) - switch_bits + exp_order + 1;
329         code = NEG_USR32(buf, len) - (1 << exp_order) + (switch_bits << rice_order);
330         LAST_SKIP_BITS(re, gb, len);
331     }
332
333     CLOSE_READER(re, gb);
334
335     return code;
336 }
337
338 #define LSB2SIGN(x) (-((x) & 1))
339 #define TOSIGNED(x) (((x) >> 1) ^ LSB2SIGN(x))
340
341 /**
342  * Decode DC coefficients for all blocks in a slice.
343  */
344 static inline void decode_dc_coeffs(GetBitContext *gb, int16_t *out,
345                                     int nblocks)
346 {
347     int16_t prev_dc;
348     int     i, sign;
349     int16_t delta;
350     unsigned int code;
351
352     code   = decode_vlc_codeword(gb, FIRST_DC_CB);
353     out[0] = prev_dc = TOSIGNED(code);
354
355     out   += 64; /* move to the DC coeff of the next block */
356     delta  = 3;
357
358     for (i = 1; i < nblocks; i++, out += 64) {
359         code = decode_vlc_codeword(gb, ff_prores_dc_codebook[FFMIN(FFABS(delta), 3)]);
360
361         sign     = -(((delta >> 15) & 1) ^ (code & 1));
362         delta    = (((code + 1) >> 1) ^ sign) - sign;
363         prev_dc += delta;
364         out[0]   = prev_dc;
365     }
366 }
367
368 #define MAX_PADDING 16
369
370 /**
371  * Decode AC coefficients for all blocks in a slice.
372  */
373 static inline int decode_ac_coeffs(GetBitContext *gb, int16_t *out,
374                                    int blocks_per_slice,
375                                    int plane_size_factor,
376                                    const uint8_t *scan)
377 {
378     int pos, block_mask, run, level, sign, run_cb_index, lev_cb_index;
379     int max_coeffs, bits_left;
380
381     /* set initial prediction values */
382     run   = 4;
383     level = 2;
384
385     max_coeffs = blocks_per_slice << 6;
386     block_mask = blocks_per_slice - 1;
387
388     for (pos = blocks_per_slice - 1; pos < max_coeffs;) {
389         run_cb_index = ff_prores_run_to_cb_index[FFMIN(run, 15)];
390         lev_cb_index = ff_prores_lev_to_cb_index[FFMIN(level, 9)];
391
392         bits_left = get_bits_left(gb);
393         if (bits_left <= 0 || (bits_left <= MAX_PADDING && !show_bits(gb, bits_left)))
394             return 0;
395
396         run = decode_vlc_codeword(gb, ff_prores_ac_codebook[run_cb_index]);
397         if (run < 0)
398             return AVERROR_INVALIDDATA;
399
400         bits_left = get_bits_left(gb);
401         if (bits_left <= 0 || (bits_left <= MAX_PADDING && !show_bits(gb, bits_left)))
402             return AVERROR_INVALIDDATA;
403
404         level = decode_vlc_codeword(gb, ff_prores_ac_codebook[lev_cb_index]) + 1;
405         if (level < 0)
406             return AVERROR_INVALIDDATA;
407
408         pos += run + 1;
409         if (pos >= max_coeffs)
410             break;
411
412         sign = get_sbits(gb, 1);
413         out[((pos & block_mask) << 6) + scan[pos >> plane_size_factor]] =
414             (level ^ sign) - sign;
415     }
416
417     return 0;
418 }
419
420
421 /**
422  * Decode a slice plane (luma or chroma).
423  */
424 static int decode_slice_plane(ProresContext *ctx, ProresThreadData *td,
425                               const uint8_t *buf,
426                               int data_size, uint16_t *out_ptr,
427                               int linesize, int mbs_per_slice,
428                               int blocks_per_mb, int plane_size_factor,
429                               const int16_t *qmat, int is_chroma)
430 {
431     GetBitContext gb;
432     int16_t *block_ptr;
433     int mb_num, blocks_per_slice, ret;
434
435     blocks_per_slice = mbs_per_slice * blocks_per_mb;
436
437     memset(td->blocks, 0, 8 * 4 * 64 * sizeof(*td->blocks));
438
439     init_get_bits(&gb, buf, data_size << 3);
440
441     decode_dc_coeffs(&gb, td->blocks, blocks_per_slice);
442
443     ret = decode_ac_coeffs(&gb, td->blocks, blocks_per_slice,
444                            plane_size_factor, ctx->scantable.permutated);
445     if (ret < 0)
446         return ret;
447
448     /* inverse quantization, inverse transform and output */
449     block_ptr = td->blocks;
450
451     if (!is_chroma) {
452         for (mb_num = 0; mb_num < mbs_per_slice; mb_num++, out_ptr += blocks_per_mb * 4) {
453             ctx->dsp.idct_put(out_ptr,                    linesize, block_ptr, qmat);
454             block_ptr += 64;
455             if (blocks_per_mb > 2) {
456                 ctx->dsp.idct_put(out_ptr + 8,            linesize, block_ptr, qmat);
457                 block_ptr += 64;
458             }
459             ctx->dsp.idct_put(out_ptr + linesize * 4,     linesize, block_ptr, qmat);
460             block_ptr += 64;
461             if (blocks_per_mb > 2) {
462                 ctx->dsp.idct_put(out_ptr + linesize * 4 + 8, linesize, block_ptr, qmat);
463                 block_ptr += 64;
464             }
465         }
466     } else {
467         for (mb_num = 0; mb_num < mbs_per_slice; mb_num++, out_ptr += blocks_per_mb * 4) {
468             ctx->dsp.idct_put(out_ptr,                    linesize, block_ptr, qmat);
469             block_ptr += 64;
470             ctx->dsp.idct_put(out_ptr + linesize * 4,     linesize, block_ptr, qmat);
471             block_ptr += 64;
472             if (blocks_per_mb > 2) {
473                 ctx->dsp.idct_put(out_ptr + 8,            linesize, block_ptr, qmat);
474                 block_ptr += 64;
475                 ctx->dsp.idct_put(out_ptr + linesize * 4 + 8, linesize, block_ptr, qmat);
476                 block_ptr += 64;
477             }
478         }
479     }
480     return 0;
481 }
482
483
484 static void unpack_alpha(GetBitContext *gb, uint16_t *dst, int num_coeffs,
485                          const int num_bits)
486 {
487     const int mask = (1 << num_bits) - 1;
488     int i, idx, val, alpha_val;
489
490     idx       = 0;
491     alpha_val = mask;
492     do {
493         do {
494             if (get_bits1(gb))
495                 val = get_bits(gb, num_bits);
496             else {
497                 int sign;
498                 val  = get_bits(gb, num_bits == 16 ? 7 : 4);
499                 sign = val & 1;
500                 val  = (val + 2) >> 1;
501                 if (sign)
502                     val = -val;
503             }
504             alpha_val = (alpha_val + val) & mask;
505             if (num_bits == 16)
506                 dst[idx++] = alpha_val >> 6;
507             else
508                 dst[idx++] = (alpha_val << 2) | (alpha_val >> 6);
509             if (idx >= num_coeffs - 1)
510                 break;
511         } while (get_bits1(gb));
512         val = get_bits(gb, 4);
513         if (!val)
514             val = get_bits(gb, 11);
515         if (idx + val > num_coeffs)
516             val = num_coeffs - idx;
517         if (num_bits == 16)
518             for (i = 0; i < val; i++)
519                 dst[idx++] = alpha_val >> 6;
520         else
521             for (i = 0; i < val; i++)
522                 dst[idx++] = (alpha_val << 2) | (alpha_val >> 6);
523     } while (idx < num_coeffs);
524 }
525
526 /**
527  * Decode alpha slice plane.
528  */
529 static void decode_alpha_plane(ProresContext *ctx, ProresThreadData *td,
530                                const uint8_t *buf, int data_size,
531                                uint16_t *out_ptr, int linesize,
532                                int mbs_per_slice)
533 {
534     GetBitContext gb;
535     int i;
536     uint16_t *block_ptr;
537
538     memset(td->blocks, 0, 8 * 4 * 64 * sizeof(*td->blocks));
539
540     init_get_bits(&gb, buf, data_size << 3);
541
542     if (ctx->alpha_info == 2)
543         unpack_alpha(&gb, td->blocks, mbs_per_slice * 4 * 64, 16);
544     else
545         unpack_alpha(&gb, td->blocks, mbs_per_slice * 4 * 64, 8);
546
547     block_ptr = td->blocks;
548
549     for (i = 0; i < 16; i++) {
550         memcpy(out_ptr, block_ptr, 16 * mbs_per_slice * sizeof(*out_ptr));
551         out_ptr   += linesize >> 1;
552         block_ptr += 16 * mbs_per_slice;
553     }
554 }
555
556 static int decode_slice(AVCodecContext *avctx, void *tdata)
557 {
558     ProresThreadData *td = tdata;
559     ProresContext *ctx = avctx->priv_data;
560     int mb_x_pos  = td->x_pos;
561     int mb_y_pos  = td->y_pos;
562     int pic_num   = ctx->pic_num;
563     int slice_num = td->slice_num;
564     int mbs_per_slice = td->slice_width;
565     const uint8_t *buf;
566     uint8_t *y_data, *u_data, *v_data, *a_data;
567     AVFrame *pic = ctx->frame;
568     int i, sf, slice_width_factor;
569     int slice_data_size, hdr_size;
570     int y_data_size, u_data_size, v_data_size, a_data_size;
571     int y_linesize, u_linesize, v_linesize, a_linesize;
572     int coff[4];
573     int ret;
574
575     buf             = ctx->slice_data[slice_num].index;
576     slice_data_size = ctx->slice_data[slice_num + 1].index - buf;
577
578     slice_width_factor = av_log2(mbs_per_slice);
579
580     y_data     = pic->data[0];
581     u_data     = pic->data[1];
582     v_data     = pic->data[2];
583     a_data     = pic->data[3];
584     y_linesize = pic->linesize[0];
585     u_linesize = pic->linesize[1];
586     v_linesize = pic->linesize[2];
587     a_linesize = pic->linesize[3];
588
589     if (pic->interlaced_frame) {
590         if (!(pic_num ^ pic->top_field_first)) {
591             y_data += y_linesize;
592             u_data += u_linesize;
593             v_data += v_linesize;
594             if (a_data)
595                 a_data += a_linesize;
596         }
597         y_linesize <<= 1;
598         u_linesize <<= 1;
599         v_linesize <<= 1;
600         a_linesize <<= 1;
601     }
602     y_data += (mb_y_pos << 4) * y_linesize + (mb_x_pos << 5);
603     u_data += (mb_y_pos << 4) * u_linesize + (mb_x_pos << ctx->mb_chroma_factor);
604     v_data += (mb_y_pos << 4) * v_linesize + (mb_x_pos << ctx->mb_chroma_factor);
605     if (a_data)
606         a_data += (mb_y_pos << 4) * a_linesize + (mb_x_pos << 5);
607
608     if (slice_data_size < 6) {
609         av_log(avctx, AV_LOG_ERROR, "slice data too small\n");
610         return AVERROR_INVALIDDATA;
611     }
612
613     /* parse slice header */
614     hdr_size    = buf[0] >> 3;
615     coff[0]     = hdr_size;
616     y_data_size = AV_RB16(buf + 2);
617     coff[1]     = coff[0] + y_data_size;
618     u_data_size = AV_RB16(buf + 4);
619     coff[2]     = coff[1] + u_data_size;
620     v_data_size = hdr_size > 7 ? AV_RB16(buf + 6) : slice_data_size - coff[2];
621     coff[3]     = coff[2] + v_data_size;
622     a_data_size = slice_data_size - coff[3];
623
624     /* if V or alpha component size is negative that means that previous
625        component sizes are too large */
626     if (v_data_size < 0 || a_data_size < 0 || hdr_size < 6) {
627         av_log(avctx, AV_LOG_ERROR, "invalid data size\n");
628         return AVERROR_INVALIDDATA;
629     }
630
631     sf = av_clip(buf[1], 1, 224);
632     sf = sf > 128 ? (sf - 96) << 2 : sf;
633
634     /* scale quantization matrixes according with slice's scale factor */
635     /* TODO: this can be SIMD-optimized a lot */
636     if (ctx->qmat_changed || sf != td->prev_slice_sf) {
637         td->prev_slice_sf = sf;
638         for (i = 0; i < 64; i++) {
639             td->qmat_luma_scaled[ctx->dsp.idct_permutation[i]]   = ctx->qmat_luma[i]   * sf;
640             td->qmat_chroma_scaled[ctx->dsp.idct_permutation[i]] = ctx->qmat_chroma[i] * sf;
641         }
642     }
643
644     /* decode luma plane */
645     ret = decode_slice_plane(ctx, td, buf + coff[0], y_data_size,
646                              (uint16_t*) y_data, y_linesize,
647                              mbs_per_slice, 4, slice_width_factor + 2,
648                              td->qmat_luma_scaled, 0);
649
650     if (ret < 0)
651         return ret;
652
653     /* decode U chroma plane */
654     ret = decode_slice_plane(ctx, td, buf + coff[1], u_data_size,
655                              (uint16_t*) u_data, u_linesize,
656                              mbs_per_slice, ctx->num_chroma_blocks,
657                              slice_width_factor + ctx->chroma_factor - 1,
658                              td->qmat_chroma_scaled, 1);
659     if (ret < 0)
660         return ret;
661
662     /* decode V chroma plane */
663     ret = decode_slice_plane(ctx, td, buf + coff[2], v_data_size,
664                              (uint16_t*) v_data, v_linesize,
665                              mbs_per_slice, ctx->num_chroma_blocks,
666                              slice_width_factor + ctx->chroma_factor - 1,
667                              td->qmat_chroma_scaled, 1);
668     if (ret < 0)
669         return ret;
670
671     /* decode alpha plane if available */
672     if (a_data && a_data_size)
673         decode_alpha_plane(ctx, td, buf + coff[3], a_data_size,
674                            (uint16_t*) a_data, a_linesize,
675                            mbs_per_slice);
676
677     return 0;
678 }
679
680
681 static int decode_picture(ProresContext *ctx, int pic_num,
682                           AVCodecContext *avctx)
683 {
684     int slice_num, slice_width, x_pos, y_pos;
685
686     slice_num = 0;
687
688     ctx->pic_num = pic_num;
689     for (y_pos = 0; y_pos < ctx->num_y_mbs; y_pos++) {
690         slice_width = 1 << ctx->slice_width_factor;
691
692         for (x_pos = 0; x_pos < ctx->num_x_mbs && slice_width;
693              x_pos += slice_width) {
694             while (ctx->num_x_mbs - x_pos < slice_width)
695                 slice_width >>= 1;
696
697             ctx->slice_data[slice_num].slice_num   = slice_num;
698             ctx->slice_data[slice_num].x_pos       = x_pos;
699             ctx->slice_data[slice_num].y_pos       = y_pos;
700             ctx->slice_data[slice_num].slice_width = slice_width;
701
702             slice_num++;
703         }
704     }
705
706     return avctx->execute(avctx, decode_slice,
707                           ctx->slice_data, NULL, slice_num,
708                           sizeof(ctx->slice_data[0]));
709 }
710
711
712 #define MOVE_DATA_PTR(nbytes) buf += (nbytes); buf_size -= (nbytes)
713
714 static int decode_frame(AVCodecContext *avctx, void *data, int *got_frame,
715                         AVPacket *avpkt)
716 {
717     ProresContext *ctx = avctx->priv_data;
718     const uint8_t *buf = avpkt->data;
719     int buf_size       = avpkt->size;
720     int frame_hdr_size, pic_num, pic_data_size;
721
722     ctx->frame            = data;
723     ctx->frame->pict_type = AV_PICTURE_TYPE_I;
724     ctx->frame->key_frame = 1;
725
726     /* check frame atom container */
727     if (buf_size < 28 || buf_size < AV_RB32(buf) ||
728         AV_RB32(buf + 4) != FRAME_ID) {
729         av_log(avctx, AV_LOG_ERROR, "invalid frame\n");
730         return AVERROR_INVALIDDATA;
731     }
732
733     MOVE_DATA_PTR(8);
734
735     frame_hdr_size = decode_frame_header(ctx, buf, buf_size, avctx);
736     if (frame_hdr_size < 0)
737         return AVERROR_INVALIDDATA;
738
739     MOVE_DATA_PTR(frame_hdr_size);
740
741     if (ff_get_buffer(avctx, ctx->frame, 0) < 0)
742         return -1;
743
744     for (pic_num = 0; ctx->frame->interlaced_frame - pic_num + 1; pic_num++) {
745         pic_data_size = decode_picture_header(ctx, buf, buf_size, avctx);
746         if (pic_data_size < 0)
747             return AVERROR_INVALIDDATA;
748
749         if (decode_picture(ctx, pic_num, avctx))
750             return -1;
751
752         MOVE_DATA_PTR(pic_data_size);
753     }
754
755     ctx->frame = NULL;
756     *got_frame = 1;
757
758     return avpkt->size;
759 }
760
761
762 static av_cold int decode_close(AVCodecContext *avctx)
763 {
764     ProresContext *ctx = avctx->priv_data;
765
766     av_freep(&ctx->slice_data);
767
768     return 0;
769 }
770
771
772 AVCodec ff_prores_decoder = {
773     .name           = "prores",
774     .long_name      = NULL_IF_CONFIG_SMALL("Apple ProRes (iCodec Pro)"),
775     .type           = AVMEDIA_TYPE_VIDEO,
776     .id             = AV_CODEC_ID_PRORES,
777     .priv_data_size = sizeof(ProresContext),
778     .init           = decode_init,
779     .close          = decode_close,
780     .decode         = decode_frame,
781     .capabilities   = AV_CODEC_CAP_DR1 | AV_CODEC_CAP_SLICE_THREADS,
782 };