]> git.sesse.net Git - ffmpeg/blob - libavcodec/h264_ps.c
h264: decouple h264_ps from the h264 decoder
[ffmpeg] / libavcodec / h264_ps.c
1 /*
2  * H.26L/H.264/AVC/JVT/14496-10/... parameter set decoding
3  * Copyright (c) 2003 Michael Niedermayer <michaelni@gmx.at>
4  *
5  * This file is part of Libav.
6  *
7  * Libav is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * Libav is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with Libav; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 /**
23  * @file
24  * H.264 / AVC / MPEG4 part10 parameter set decoding.
25  * @author Michael Niedermayer <michaelni@gmx.at>
26  */
27
28 #include <inttypes.h>
29
30 #include "libavutil/imgutils.h"
31 #include "internal.h"
32 #include "mathops.h"
33 #include "avcodec.h"
34 #include "h264.h"
35 #include "h264data.h"
36 #include "golomb.h"
37
38 #define MAX_LOG2_MAX_FRAME_NUM    (12 + 4)
39 #define MIN_LOG2_MAX_FRAME_NUM    4
40
41 static const AVRational pixel_aspect[17] = {
42     {   0,  1 },
43     {   1,  1 },
44     {  12, 11 },
45     {  10, 11 },
46     {  16, 11 },
47     {  40, 33 },
48     {  24, 11 },
49     {  20, 11 },
50     {  32, 11 },
51     {  80, 33 },
52     {  18, 11 },
53     {  15, 11 },
54     {  64, 33 },
55     { 160, 99 },
56     {   4,  3 },
57     {   3,  2 },
58     {   2,  1 },
59 };
60
61 static const uint8_t default_scaling4[2][16] = {
62     {  6, 13, 20, 28, 13, 20, 28, 32,
63       20, 28, 32, 37, 28, 32, 37, 42 },
64     { 10, 14, 20, 24, 14, 20, 24, 27,
65       20, 24, 27, 30, 24, 27, 30, 34 }
66 };
67
68 static const uint8_t default_scaling8[2][64] = {
69     {  6, 10, 13, 16, 18, 23, 25, 27,
70       10, 11, 16, 18, 23, 25, 27, 29,
71       13, 16, 18, 23, 25, 27, 29, 31,
72       16, 18, 23, 25, 27, 29, 31, 33,
73       18, 23, 25, 27, 29, 31, 33, 36,
74       23, 25, 27, 29, 31, 33, 36, 38,
75       25, 27, 29, 31, 33, 36, 38, 40,
76       27, 29, 31, 33, 36, 38, 40, 42 },
77     {  9, 13, 15, 17, 19, 21, 22, 24,
78       13, 13, 17, 19, 21, 22, 24, 25,
79       15, 17, 19, 21, 22, 24, 25, 27,
80       17, 19, 21, 22, 24, 25, 27, 28,
81       19, 21, 22, 24, 25, 27, 28, 30,
82       21, 22, 24, 25, 27, 28, 30, 32,
83       22, 24, 25, 27, 28, 30, 32, 33,
84       24, 25, 27, 28, 30, 32, 33, 35 }
85 };
86
87 /* maximum number of MBs in the DPB for a given level */
88 static const int level_max_dpb_mbs[][2] = {
89     { 10, 396       },
90     { 11, 900       },
91     { 12, 2376      },
92     { 13, 2376      },
93     { 20, 2376      },
94     { 21, 4752      },
95     { 22, 8100      },
96     { 30, 8100      },
97     { 31, 18000     },
98     { 32, 20480     },
99     { 40, 32768     },
100     { 41, 32768     },
101     { 42, 34816     },
102     { 50, 110400    },
103     { 51, 184320    },
104     { 52, 184320    },
105 };
106
107 static void remove_pps(H264ParamSets *s, int id)
108 {
109     if (s->pps_list[id] && s->pps == (const PPS*)s->pps_list[id]->data)
110         s->pps = NULL;
111     av_buffer_unref(&s->pps_list[id]);
112 }
113
114 static void remove_sps(H264ParamSets *s, int id)
115 {
116     int i;
117     if (s->sps_list[id]) {
118         if (s->sps == (SPS*)s->sps_list[id]->data)
119             s->sps = NULL;
120
121         /* drop all PPS that depend on this SPS */
122         for (i = 0; i < FF_ARRAY_ELEMS(s->pps_list); i++)
123             if (s->pps_list[i] && ((PPS*)s->pps_list[i]->data)->sps_id == id)
124                 remove_pps(s, i);
125     }
126     av_buffer_unref(&s->sps_list[id]);
127 }
128
129 static inline int decode_hrd_parameters(GetBitContext *gb, AVCodecContext *avctx,
130                                         SPS *sps)
131 {
132     int cpb_count, i;
133     cpb_count = get_ue_golomb_31(gb) + 1;
134
135     if (cpb_count > 32U) {
136         av_log(avctx, AV_LOG_ERROR, "cpb_count %d invalid\n", cpb_count);
137         return AVERROR_INVALIDDATA;
138     }
139
140     get_bits(gb, 4); /* bit_rate_scale */
141     get_bits(gb, 4); /* cpb_size_scale */
142     for (i = 0; i < cpb_count; i++) {
143         get_ue_golomb_long(gb); /* bit_rate_value_minus1 */
144         get_ue_golomb_long(gb); /* cpb_size_value_minus1 */
145         get_bits1(gb);          /* cbr_flag */
146     }
147     sps->initial_cpb_removal_delay_length = get_bits(gb, 5) + 1;
148     sps->cpb_removal_delay_length         = get_bits(gb, 5) + 1;
149     sps->dpb_output_delay_length          = get_bits(gb, 5) + 1;
150     sps->time_offset_length               = get_bits(gb, 5);
151     sps->cpb_cnt                          = cpb_count;
152     return 0;
153 }
154
155 static inline int decode_vui_parameters(GetBitContext *gb, AVCodecContext *avctx,
156                                         SPS *sps)
157 {
158     int aspect_ratio_info_present_flag;
159     unsigned int aspect_ratio_idc;
160
161     aspect_ratio_info_present_flag = get_bits1(gb);
162
163     if (aspect_ratio_info_present_flag) {
164         aspect_ratio_idc = get_bits(gb, 8);
165         if (aspect_ratio_idc == EXTENDED_SAR) {
166             sps->sar.num = get_bits(gb, 16);
167             sps->sar.den = get_bits(gb, 16);
168         } else if (aspect_ratio_idc < FF_ARRAY_ELEMS(pixel_aspect)) {
169             sps->sar = pixel_aspect[aspect_ratio_idc];
170         } else {
171             av_log(avctx, AV_LOG_ERROR, "illegal aspect ratio\n");
172             return AVERROR_INVALIDDATA;
173         }
174     } else {
175         sps->sar.num =
176         sps->sar.den = 0;
177     }
178
179     if (get_bits1(gb))      /* overscan_info_present_flag */
180         get_bits1(gb);      /* overscan_appropriate_flag */
181
182     sps->video_signal_type_present_flag = get_bits1(gb);
183     if (sps->video_signal_type_present_flag) {
184         get_bits(gb, 3);                 /* video_format */
185         sps->full_range = get_bits1(gb); /* video_full_range_flag */
186
187         sps->colour_description_present_flag = get_bits1(gb);
188         if (sps->colour_description_present_flag) {
189             sps->color_primaries = get_bits(gb, 8); /* colour_primaries */
190             sps->color_trc       = get_bits(gb, 8); /* transfer_characteristics */
191             sps->colorspace      = get_bits(gb, 8); /* matrix_coefficients */
192             if (sps->color_primaries >= AVCOL_PRI_NB)
193                 sps->color_primaries = AVCOL_PRI_UNSPECIFIED;
194             if (sps->color_trc >= AVCOL_TRC_NB)
195                 sps->color_trc = AVCOL_TRC_UNSPECIFIED;
196             if (sps->colorspace >= AVCOL_SPC_NB)
197                 sps->colorspace = AVCOL_SPC_UNSPECIFIED;
198         }
199     }
200
201     /* chroma_location_info_present_flag */
202     if (get_bits1(gb)) {
203         /* chroma_sample_location_type_top_field */
204         avctx->chroma_sample_location = get_ue_golomb(gb) + 1;
205         get_ue_golomb(gb);  /* chroma_sample_location_type_bottom_field */
206     }
207
208     sps->timing_info_present_flag = get_bits1(gb);
209     if (sps->timing_info_present_flag) {
210         sps->num_units_in_tick = get_bits_long(gb, 32);
211         sps->time_scale        = get_bits_long(gb, 32);
212         if (!sps->num_units_in_tick || !sps->time_scale) {
213             av_log(avctx, AV_LOG_ERROR,
214                    "time_scale/num_units_in_tick invalid or unsupported (%"PRIu32"/%"PRIu32")\n",
215                    sps->time_scale, sps->num_units_in_tick);
216             return AVERROR_INVALIDDATA;
217         }
218         sps->fixed_frame_rate_flag = get_bits1(gb);
219     }
220
221     sps->nal_hrd_parameters_present_flag = get_bits1(gb);
222     if (sps->nal_hrd_parameters_present_flag)
223         if (decode_hrd_parameters(gb, avctx, sps) < 0)
224             return AVERROR_INVALIDDATA;
225     sps->vcl_hrd_parameters_present_flag = get_bits1(gb);
226     if (sps->vcl_hrd_parameters_present_flag)
227         if (decode_hrd_parameters(gb, avctx, sps) < 0)
228             return AVERROR_INVALIDDATA;
229     if (sps->nal_hrd_parameters_present_flag ||
230         sps->vcl_hrd_parameters_present_flag)
231         get_bits1(gb);     /* low_delay_hrd_flag */
232     sps->pic_struct_present_flag = get_bits1(gb);
233
234     sps->bitstream_restriction_flag = get_bits1(gb);
235     if (sps->bitstream_restriction_flag) {
236         get_bits1(gb);     /* motion_vectors_over_pic_boundaries_flag */
237         get_ue_golomb(gb); /* max_bytes_per_pic_denom */
238         get_ue_golomb(gb); /* max_bits_per_mb_denom */
239         get_ue_golomb(gb); /* log2_max_mv_length_horizontal */
240         get_ue_golomb(gb); /* log2_max_mv_length_vertical */
241         sps->num_reorder_frames = get_ue_golomb(gb);
242         get_ue_golomb(gb); /*max_dec_frame_buffering*/
243
244         if (get_bits_left(gb) < 0) {
245             sps->num_reorder_frames         = 0;
246             sps->bitstream_restriction_flag = 0;
247         }
248
249         if (sps->num_reorder_frames > 16U
250             /* max_dec_frame_buffering || max_dec_frame_buffering > 16 */) {
251             av_log(avctx, AV_LOG_ERROR,
252                    "Clipping illegal num_reorder_frames %d\n",
253                    sps->num_reorder_frames);
254             sps->num_reorder_frames = 16;
255             return AVERROR_INVALIDDATA;
256         }
257     }
258     if (get_bits_left(gb) < 0) {
259         av_log(avctx, AV_LOG_ERROR,
260                "Overread VUI by %d bits\n", -get_bits_left(gb));
261         return AVERROR_INVALIDDATA;
262     }
263
264     return 0;
265 }
266
267 static void decode_scaling_list(GetBitContext *gb, uint8_t *factors, int size,
268                                 const uint8_t *jvt_list,
269                                 const uint8_t *fallback_list)
270 {
271     int i, last = 8, next = 8;
272     const uint8_t *scan = size == 16 ? ff_zigzag_scan : ff_zigzag_direct;
273     if (!get_bits1(gb)) /* matrix not written, we use the predicted one */
274         memcpy(factors, fallback_list, size * sizeof(uint8_t));
275     else
276         for (i = 0; i < size; i++) {
277             if (next)
278                 next = (last + get_se_golomb(gb)) & 0xff;
279             if (!i && !next) { /* matrix not written, we use the preset one */
280                 memcpy(factors, jvt_list, size * sizeof(uint8_t));
281                 break;
282             }
283             last = factors[scan[i]] = next ? next : last;
284         }
285 }
286
287 static void decode_scaling_matrices(GetBitContext *gb, SPS *sps,
288                                     PPS *pps, int is_sps,
289                                     uint8_t(*scaling_matrix4)[16],
290                                     uint8_t(*scaling_matrix8)[64])
291 {
292     int fallback_sps = !is_sps && sps->scaling_matrix_present;
293     const uint8_t *fallback[4] = {
294         fallback_sps ? sps->scaling_matrix4[0] : default_scaling4[0],
295         fallback_sps ? sps->scaling_matrix4[3] : default_scaling4[1],
296         fallback_sps ? sps->scaling_matrix8[0] : default_scaling8[0],
297         fallback_sps ? sps->scaling_matrix8[3] : default_scaling8[1]
298     };
299     if (get_bits1(gb)) {
300         sps->scaling_matrix_present |= is_sps;
301         decode_scaling_list(gb, scaling_matrix4[0], 16, default_scaling4[0], fallback[0]);        // Intra, Y
302         decode_scaling_list(gb, scaling_matrix4[1], 16, default_scaling4[0], scaling_matrix4[0]); // Intra, Cr
303         decode_scaling_list(gb, scaling_matrix4[2], 16, default_scaling4[0], scaling_matrix4[1]); // Intra, Cb
304         decode_scaling_list(gb, scaling_matrix4[3], 16, default_scaling4[1], fallback[1]);        // Inter, Y
305         decode_scaling_list(gb, scaling_matrix4[4], 16, default_scaling4[1], scaling_matrix4[3]); // Inter, Cr
306         decode_scaling_list(gb, scaling_matrix4[5], 16, default_scaling4[1], scaling_matrix4[4]); // Inter, Cb
307         if (is_sps || pps->transform_8x8_mode) {
308             decode_scaling_list(gb, scaling_matrix8[0], 64, default_scaling8[0], fallback[2]); // Intra, Y
309             if (sps->chroma_format_idc == 3) {
310                 decode_scaling_list(gb, scaling_matrix8[1], 64, default_scaling8[0], scaling_matrix8[0]); // Intra, Cr
311                 decode_scaling_list(gb, scaling_matrix8[2], 64, default_scaling8[0], scaling_matrix8[1]); // Intra, Cb
312             }
313             decode_scaling_list(gb, scaling_matrix8[3], 64, default_scaling8[1], fallback[3]); // Inter, Y
314             if (sps->chroma_format_idc == 3) {
315                 decode_scaling_list(gb, scaling_matrix8[4], 64, default_scaling8[1], scaling_matrix8[3]); // Inter, Cr
316                 decode_scaling_list(gb, scaling_matrix8[5], 64, default_scaling8[1], scaling_matrix8[4]); // Inter, Cb
317             }
318         }
319     }
320 }
321
322 int ff_h264_decode_seq_parameter_set(GetBitContext *gb, AVCodecContext *avctx,
323                                      H264ParamSets *ps)
324 {
325     AVBufferRef *sps_buf;
326     int profile_idc, level_idc, constraint_set_flags = 0;
327     unsigned int sps_id;
328     int i, log2_max_frame_num_minus4;
329     SPS *sps;
330
331     profile_idc           = get_bits(gb, 8);
332     constraint_set_flags |= get_bits1(gb) << 0;   // constraint_set0_flag
333     constraint_set_flags |= get_bits1(gb) << 1;   // constraint_set1_flag
334     constraint_set_flags |= get_bits1(gb) << 2;   // constraint_set2_flag
335     constraint_set_flags |= get_bits1(gb) << 3;   // constraint_set3_flag
336     constraint_set_flags |= get_bits1(gb) << 4;   // constraint_set4_flag
337     constraint_set_flags |= get_bits1(gb) << 5;   // constraint_set5_flag
338     skip_bits(gb, 2);                             // reserved_zero_2bits
339     level_idc = get_bits(gb, 8);
340     sps_id    = get_ue_golomb_31(gb);
341
342     if (sps_id >= MAX_SPS_COUNT) {
343         av_log(avctx, AV_LOG_ERROR, "sps_id %u out of range\n", sps_id);
344         return AVERROR_INVALIDDATA;
345     }
346
347     sps_buf = av_buffer_allocz(sizeof(*sps));
348     if (!sps_buf)
349         return AVERROR(ENOMEM);
350     sps = (SPS*)sps_buf->data;
351
352     sps->sps_id               = sps_id;
353     sps->time_offset_length   = 24;
354     sps->profile_idc          = profile_idc;
355     sps->constraint_set_flags = constraint_set_flags;
356     sps->level_idc            = level_idc;
357
358     memset(sps->scaling_matrix4, 16, sizeof(sps->scaling_matrix4));
359     memset(sps->scaling_matrix8, 16, sizeof(sps->scaling_matrix8));
360     sps->scaling_matrix_present = 0;
361
362     if (sps->profile_idc == 100 ||  // High profile
363         sps->profile_idc == 110 ||  // High10 profile
364         sps->profile_idc == 122 ||  // High422 profile
365         sps->profile_idc == 244 ||  // High444 Predictive profile
366         sps->profile_idc ==  44 ||  // Cavlc444 profile
367         sps->profile_idc ==  83 ||  // Scalable Constrained High profile (SVC)
368         sps->profile_idc ==  86 ||  // Scalable High Intra profile (SVC)
369         sps->profile_idc == 118 ||  // Stereo High profile (MVC)
370         sps->profile_idc == 128 ||  // Multiview High profile (MVC)
371         sps->profile_idc == 138 ||  // Multiview Depth High profile (MVCD)
372         sps->profile_idc == 144) {  // old High444 profile
373         sps->chroma_format_idc = get_ue_golomb_31(gb);
374         if (sps->chroma_format_idc > 3) {
375             avpriv_request_sample(avctx, "chroma_format_idc %u",
376                                   sps->chroma_format_idc);
377             goto fail;
378         } else if (sps->chroma_format_idc == 3) {
379             sps->residual_color_transform_flag = get_bits1(gb);
380         }
381         sps->bit_depth_luma   = get_ue_golomb(gb) + 8;
382         sps->bit_depth_chroma = get_ue_golomb(gb) + 8;
383         if (sps->bit_depth_chroma != sps->bit_depth_luma) {
384             avpriv_request_sample(avctx,
385                                   "Different chroma and luma bit depth");
386             goto fail;
387         }
388         sps->transform_bypass = get_bits1(gb);
389         decode_scaling_matrices(gb, sps, NULL, 1,
390                                 sps->scaling_matrix4, sps->scaling_matrix8);
391     } else {
392         sps->chroma_format_idc = 1;
393         sps->bit_depth_luma    = 8;
394         sps->bit_depth_chroma  = 8;
395     }
396
397     log2_max_frame_num_minus4 = get_ue_golomb(gb);
398     if (log2_max_frame_num_minus4 < MIN_LOG2_MAX_FRAME_NUM - 4 ||
399         log2_max_frame_num_minus4 > MAX_LOG2_MAX_FRAME_NUM - 4) {
400         av_log(avctx, AV_LOG_ERROR,
401                "log2_max_frame_num_minus4 out of range (0-12): %d\n",
402                log2_max_frame_num_minus4);
403         goto fail;
404     }
405     sps->log2_max_frame_num = log2_max_frame_num_minus4 + 4;
406
407     sps->poc_type = get_ue_golomb_31(gb);
408
409     if (sps->poc_type == 0) { // FIXME #define
410         sps->log2_max_poc_lsb = get_ue_golomb(gb) + 4;
411     } else if (sps->poc_type == 1) { // FIXME #define
412         sps->delta_pic_order_always_zero_flag = get_bits1(gb);
413         sps->offset_for_non_ref_pic           = get_se_golomb(gb);
414         sps->offset_for_top_to_bottom_field   = get_se_golomb(gb);
415         sps->poc_cycle_length                 = get_ue_golomb(gb);
416
417         if ((unsigned)sps->poc_cycle_length >=
418             FF_ARRAY_ELEMS(sps->offset_for_ref_frame)) {
419             av_log(avctx, AV_LOG_ERROR,
420                    "poc_cycle_length overflow %d\n", sps->poc_cycle_length);
421             goto fail;
422         }
423
424         for (i = 0; i < sps->poc_cycle_length; i++)
425             sps->offset_for_ref_frame[i] = get_se_golomb(gb);
426     } else if (sps->poc_type != 2) {
427         av_log(avctx, AV_LOG_ERROR, "illegal POC type %d\n", sps->poc_type);
428         goto fail;
429     }
430
431     sps->ref_frame_count = get_ue_golomb_31(gb);
432     if (sps->ref_frame_count > H264_MAX_PICTURE_COUNT - 2 ||
433         sps->ref_frame_count >= 32U) {
434         av_log(avctx, AV_LOG_ERROR,
435                "too many reference frames %d\n", sps->ref_frame_count);
436         goto fail;
437     }
438     sps->gaps_in_frame_num_allowed_flag = get_bits1(gb);
439     sps->mb_width                       = get_ue_golomb(gb) + 1;
440     sps->mb_height                      = get_ue_golomb(gb) + 1;
441     if ((unsigned)sps->mb_width  >= INT_MAX / 16 ||
442         (unsigned)sps->mb_height >= INT_MAX / 16 ||
443         av_image_check_size(16 * sps->mb_width,
444                             16 * sps->mb_height, 0, avctx)) {
445         av_log(avctx, AV_LOG_ERROR, "mb_width/height overflow\n");
446         goto fail;
447     }
448
449     sps->frame_mbs_only_flag = get_bits1(gb);
450     if (!sps->frame_mbs_only_flag)
451         sps->mb_aff = get_bits1(gb);
452     else
453         sps->mb_aff = 0;
454
455     sps->direct_8x8_inference_flag = get_bits1(gb);
456     if (!sps->frame_mbs_only_flag && !sps->direct_8x8_inference_flag) {
457         av_log(avctx, AV_LOG_ERROR,
458                "This stream was generated by a broken encoder, invalid 8x8 inference\n");
459         goto fail;
460     }
461
462 #ifndef ALLOW_INTERLACE
463     if (sps->mb_aff)
464         av_log(avctx, AV_LOG_ERROR,
465                "MBAFF support not included; enable it at compile-time.\n");
466 #endif
467     sps->crop = get_bits1(gb);
468     if (sps->crop) {
469         unsigned int crop_left   = get_ue_golomb(gb);
470         unsigned int crop_right  = get_ue_golomb(gb);
471         unsigned int crop_top    = get_ue_golomb(gb);
472         unsigned int crop_bottom = get_ue_golomb(gb);
473
474         if (avctx->flags2 & AV_CODEC_FLAG2_IGNORE_CROP) {
475             av_log(avctx, AV_LOG_DEBUG, "discarding sps cropping, original "
476                                            "values are l:%d r:%d t:%d b:%d\n",
477                    crop_left, crop_right, crop_top, crop_bottom);
478
479             sps->crop_left   =
480             sps->crop_right  =
481             sps->crop_top    =
482             sps->crop_bottom = 0;
483         } else {
484             int vsub   = (sps->chroma_format_idc == 1) ? 1 : 0;
485             int hsub   = (sps->chroma_format_idc == 1 ||
486                           sps->chroma_format_idc == 2) ? 1 : 0;
487             int step_x = 1 << hsub;
488             int step_y = (2 - sps->frame_mbs_only_flag) << vsub;
489
490             if (crop_left & (0x1F >> (sps->bit_depth_luma > 8)) &&
491                 !(avctx->flags & AV_CODEC_FLAG_UNALIGNED)) {
492                 crop_left &= ~(0x1F >> (sps->bit_depth_luma > 8));
493                 av_log(avctx, AV_LOG_WARNING,
494                        "Reducing left cropping to %d "
495                        "chroma samples to preserve alignment.\n",
496                        crop_left);
497             }
498
499             if (INT_MAX / step_x             <= crop_left               ||
500                 INT_MAX / step_x - crop_left <= crop_right              ||
501                 16 * sps->mb_width <= step_x * (crop_left + crop_right) ||
502                 INT_MAX / step_y             <= crop_top                ||
503                 INT_MAX / step_y - crop_top  <= crop_bottom             ||
504                 16 * sps->mb_height <= step_y * (crop_top + crop_bottom)) {
505                 av_log(avctx, AV_LOG_WARNING, "Invalid crop parameters\n");
506                 if (avctx->err_recognition & AV_EF_EXPLODE)
507                     goto fail;
508                 crop_left = crop_right = crop_top = crop_bottom = 0;
509             }
510
511             sps->crop_left   = crop_left   * step_x;
512             sps->crop_right  = crop_right  * step_x;
513             sps->crop_top    = crop_top    * step_y;
514             sps->crop_bottom = crop_bottom * step_y;
515         }
516     } else {
517         sps->crop_left   =
518         sps->crop_right  =
519         sps->crop_top    =
520         sps->crop_bottom =
521         sps->crop        = 0;
522     }
523
524     sps->vui_parameters_present_flag = get_bits1(gb);
525     if (sps->vui_parameters_present_flag) {
526         int ret = decode_vui_parameters(gb, avctx, sps);
527         if (ret < 0 && avctx->err_recognition & AV_EF_EXPLODE)
528             goto fail;
529     }
530
531     /* if the maximum delay is not stored in the SPS, derive it based on the
532      * level */
533     if (!sps->bitstream_restriction_flag) {
534         sps->num_reorder_frames = MAX_DELAYED_PIC_COUNT - 1;
535         for (i = 0; i < FF_ARRAY_ELEMS(level_max_dpb_mbs); i++) {
536             if (level_max_dpb_mbs[i][0] == sps->level_idc) {
537                 sps->num_reorder_frames = FFMIN(level_max_dpb_mbs[i][1] / (sps->mb_width * sps->mb_height),
538                                                 sps->num_reorder_frames);
539                 break;
540             }
541         }
542     }
543
544     if (!sps->sar.den)
545         sps->sar.den = 1;
546
547     if (avctx->debug & FF_DEBUG_PICT_INFO) {
548         static const char csp[4][5] = { "Gray", "420", "422", "444" };
549         av_log(avctx, AV_LOG_DEBUG,
550                "sps:%u profile:%d/%d poc:%d ref:%d %dx%d %s %s crop:%u/%u/%u/%u %s %s %"PRId32"/%"PRId32"\n",
551                sps_id, sps->profile_idc, sps->level_idc,
552                sps->poc_type,
553                sps->ref_frame_count,
554                sps->mb_width, sps->mb_height,
555                sps->frame_mbs_only_flag ? "FRM" : (sps->mb_aff ? "MB-AFF" : "PIC-AFF"),
556                sps->direct_8x8_inference_flag ? "8B8" : "",
557                sps->crop_left, sps->crop_right,
558                sps->crop_top, sps->crop_bottom,
559                sps->vui_parameters_present_flag ? "VUI" : "",
560                csp[sps->chroma_format_idc],
561                sps->timing_info_present_flag ? sps->num_units_in_tick : 0,
562                sps->timing_info_present_flag ? sps->time_scale : 0);
563     }
564
565     /* check if this is a repeat of an already parsed SPS, then keep the
566      * original one.
567      * otherwise drop all PPSes that depend on it */
568     if (ps->sps_list[sps_id] &&
569         !memcmp(ps->sps_list[sps_id]->data, sps_buf->data, sps_buf->size)) {
570         av_buffer_unref(&sps_buf);
571     } else {
572         remove_sps(ps, sps_id);
573         ps->sps_list[sps_id] = sps_buf;
574     }
575
576     return 0;
577
578 fail:
579     av_buffer_unref(&sps_buf);
580     return AVERROR_INVALIDDATA;
581 }
582
583 static void init_dequant8_coeff_table(PPS *pps, const SPS *sps)
584 {
585     int i, j, q, x;
586     const int max_qp = 51 + 6 * (sps->bit_depth_luma - 8);
587
588     for (i = 0; i < 6; i++) {
589         pps->dequant8_coeff[i] = pps->dequant8_buffer[i];
590         for (j = 0; j < i; j++)
591             if (!memcmp(pps->scaling_matrix8[j], pps->scaling_matrix8[i],
592                         64 * sizeof(uint8_t))) {
593                 pps->dequant8_coeff[i] = pps->dequant8_buffer[j];
594                 break;
595             }
596         if (j < i)
597             continue;
598
599         for (q = 0; q < max_qp + 1; q++) {
600             int shift = ff_h264_quant_div6[q];
601             int idx   = ff_h264_quant_rem6[q];
602             for (x = 0; x < 64; x++)
603                 pps->dequant8_coeff[i][q][(x >> 3) | ((x & 7) << 3)] =
604                     ((uint32_t)ff_h264_dequant8_coeff_init[idx][ff_h264_dequant8_coeff_init_scan[((x >> 1) & 12) | (x & 3)]] *
605                      pps->scaling_matrix8[i][x]) << shift;
606         }
607     }
608 }
609
610 static void init_dequant4_coeff_table(PPS *pps, const SPS *sps)
611 {
612     int i, j, q, x;
613     const int max_qp = 51 + 6 * (sps->bit_depth_luma - 8);
614     for (i = 0; i < 6; i++) {
615         pps->dequant4_coeff[i] = pps->dequant4_buffer[i];
616         for (j = 0; j < i; j++)
617             if (!memcmp(pps->scaling_matrix4[j], pps->scaling_matrix4[i],
618                         16 * sizeof(uint8_t))) {
619                 pps->dequant4_coeff[i] = pps->dequant4_buffer[j];
620                 break;
621             }
622         if (j < i)
623             continue;
624
625         for (q = 0; q < max_qp + 1; q++) {
626             int shift = ff_h264_quant_div6[q] + 2;
627             int idx   = ff_h264_quant_rem6[q];
628             for (x = 0; x < 16; x++)
629                 pps->dequant4_coeff[i][q][(x >> 2) | ((x << 2) & 0xF)] =
630                     ((uint32_t)ff_h264_dequant4_coeff_init[idx][(x & 1) + ((x >> 2) & 1)] *
631                      pps->scaling_matrix4[i][x]) << shift;
632         }
633     }
634 }
635
636 static void init_dequant_tables(PPS *pps, const SPS *sps)
637 {
638     int i, x;
639     init_dequant4_coeff_table(pps, sps);
640     if (pps->transform_8x8_mode)
641         init_dequant8_coeff_table(pps, sps);
642     if (sps->transform_bypass) {
643         for (i = 0; i < 6; i++)
644             for (x = 0; x < 16; x++)
645                 pps->dequant4_coeff[i][0][x] = 1 << 6;
646         if (pps->transform_8x8_mode)
647             for (i = 0; i < 6; i++)
648                 for (x = 0; x < 64; x++)
649                     pps->dequant8_coeff[i][0][x] = 1 << 6;
650     }
651 }
652
653 static void build_qp_table(PPS *pps, int t, int index, const int depth)
654 {
655     int i;
656     const int max_qp = 51 + 6 * (depth - 8);
657     for (i = 0; i < max_qp + 1; i++)
658         pps->chroma_qp_table[t][i] =
659             ff_h264_chroma_qp[depth - 8][av_clip(i + index, 0, max_qp)];
660 }
661
662 int ff_h264_decode_picture_parameter_set(GetBitContext *gb, AVCodecContext *avctx,
663                                          H264ParamSets *ps, int bit_length)
664 {
665     AVBufferRef *pps_buf;
666     SPS *sps;
667     unsigned int pps_id = get_ue_golomb(gb);
668     PPS *pps;
669     int qp_bd_offset;
670     int bits_left;
671     int ret;
672
673     if (pps_id >= MAX_PPS_COUNT) {
674         av_log(avctx, AV_LOG_ERROR, "pps_id %u out of range\n", pps_id);
675         return AVERROR_INVALIDDATA;
676     }
677
678     pps_buf = av_buffer_allocz(sizeof(*pps));
679     if (!pps_buf)
680         return AVERROR(ENOMEM);
681     pps = (PPS*)pps_buf->data;
682
683     pps->sps_id = get_ue_golomb_31(gb);
684     if ((unsigned)pps->sps_id >= MAX_SPS_COUNT ||
685         !ps->sps_list[pps->sps_id]) {
686         av_log(avctx, AV_LOG_ERROR, "sps_id %u out of range\n", pps->sps_id);
687         ret = AVERROR_INVALIDDATA;
688         goto fail;
689     }
690     sps = (SPS*)ps->sps_list[pps->sps_id]->data;
691
692     if (sps->bit_depth_luma > 10) {
693         av_log(avctx, AV_LOG_ERROR,
694                "Unimplemented luma bit depth=%d (max=10)\n",
695                sps->bit_depth_luma);
696         ret = AVERROR_PATCHWELCOME;
697         goto fail;
698     }
699
700     pps->cabac             = get_bits1(gb);
701     pps->pic_order_present = get_bits1(gb);
702     pps->slice_group_count = get_ue_golomb(gb) + 1;
703     if (pps->slice_group_count > 1) {
704         pps->mb_slice_group_map_type = get_ue_golomb(gb);
705         av_log(avctx, AV_LOG_ERROR, "FMO not supported\n");
706         switch (pps->mb_slice_group_map_type) {
707         case 0:
708 #if 0
709     |       for (i = 0; i <= num_slice_groups_minus1; i++)  |   |      |
710     |           run_length[i]                               |1  |ue(v) |
711 #endif
712             break;
713         case 2:
714 #if 0
715     |       for (i = 0; i < num_slice_groups_minus1; i++) { |   |      |
716     |           top_left_mb[i]                              |1  |ue(v) |
717     |           bottom_right_mb[i]                          |1  |ue(v) |
718     |       }                                               |   |      |
719 #endif
720             break;
721         case 3:
722         case 4:
723         case 5:
724 #if 0
725     |       slice_group_change_direction_flag               |1  |u(1)  |
726     |       slice_group_change_rate_minus1                  |1  |ue(v) |
727 #endif
728             break;
729         case 6:
730 #if 0
731     |       slice_group_id_cnt_minus1                       |1  |ue(v) |
732     |       for (i = 0; i <= slice_group_id_cnt_minus1; i++)|   |      |
733     |           slice_group_id[i]                           |1  |u(v)  |
734 #endif
735             break;
736         }
737     }
738     pps->ref_count[0] = get_ue_golomb(gb) + 1;
739     pps->ref_count[1] = get_ue_golomb(gb) + 1;
740     if (pps->ref_count[0] - 1 > 32 - 1 || pps->ref_count[1] - 1 > 32 - 1) {
741         av_log(avctx, AV_LOG_ERROR, "reference overflow (pps)\n");
742         ret = AVERROR_INVALIDDATA;
743         goto fail;
744     }
745
746     qp_bd_offset = 6 * (sps->bit_depth_luma - 8);
747
748     pps->weighted_pred                        = get_bits1(gb);
749     pps->weighted_bipred_idc                  = get_bits(gb, 2);
750     pps->init_qp                              = get_se_golomb(gb) + 26 + qp_bd_offset;
751     pps->init_qs                              = get_se_golomb(gb) + 26 + qp_bd_offset;
752     pps->chroma_qp_index_offset[0]            = get_se_golomb(gb);
753     pps->deblocking_filter_parameters_present = get_bits1(gb);
754     pps->constrained_intra_pred               = get_bits1(gb);
755     pps->redundant_pic_cnt_present            = get_bits1(gb);
756
757     pps->transform_8x8_mode = 0;
758     memcpy(pps->scaling_matrix4, sps->scaling_matrix4,
759            sizeof(pps->scaling_matrix4));
760     memcpy(pps->scaling_matrix8, sps->scaling_matrix8,
761            sizeof(pps->scaling_matrix8));
762
763     bits_left = bit_length - get_bits_count(gb);
764     if (bits_left && (bits_left > 8 ||
765                       show_bits(gb, bits_left) != 1 << (bits_left - 1))) {
766         pps->transform_8x8_mode = get_bits1(gb);
767         decode_scaling_matrices(gb, sps, pps, 0,
768                                 pps->scaling_matrix4, pps->scaling_matrix8);
769         // second_chroma_qp_index_offset
770         pps->chroma_qp_index_offset[1] = get_se_golomb(gb);
771     } else {
772         pps->chroma_qp_index_offset[1] = pps->chroma_qp_index_offset[0];
773     }
774
775     build_qp_table(pps, 0, pps->chroma_qp_index_offset[0],
776                    sps->bit_depth_luma);
777     build_qp_table(pps, 1, pps->chroma_qp_index_offset[1],
778                    sps->bit_depth_luma);
779
780     init_dequant_tables(pps, sps);
781
782     if (pps->chroma_qp_index_offset[0] != pps->chroma_qp_index_offset[1])
783         pps->chroma_qp_diff = 1;
784
785     if (avctx->debug & FF_DEBUG_PICT_INFO) {
786         av_log(avctx, AV_LOG_DEBUG,
787                "pps:%u sps:%u %s slice_groups:%d ref:%u/%u %s qp:%d/%d/%d/%d %s %s %s %s\n",
788                pps_id, pps->sps_id,
789                pps->cabac ? "CABAC" : "CAVLC",
790                pps->slice_group_count,
791                pps->ref_count[0], pps->ref_count[1],
792                pps->weighted_pred ? "weighted" : "",
793                pps->init_qp, pps->init_qs, pps->chroma_qp_index_offset[0], pps->chroma_qp_index_offset[1],
794                pps->deblocking_filter_parameters_present ? "LPAR" : "",
795                pps->constrained_intra_pred ? "CONSTR" : "",
796                pps->redundant_pic_cnt_present ? "REDU" : "",
797                pps->transform_8x8_mode ? "8x8DCT" : "");
798     }
799
800     remove_pps(ps, pps_id);
801     ps->pps_list[pps_id] = pps_buf;
802
803     return 0;
804
805 fail:
806     av_buffer_unref(&pps_buf);
807     return ret;
808 }