]> git.sesse.net Git - ffmpeg/blob - libavcodec/h264_ps.c
Merge commit 'f638b67e5790735f34620bf82025c9b9d6fc7216'
[ffmpeg] / libavcodec / h264_ps.c
1 /*
2  * H.26L/H.264/AVC/JVT/14496-10/... parameter set decoding
3  * Copyright (c) 2003 Michael Niedermayer <michaelni@gmx.at>
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 /**
23  * @file
24  * H.264 / AVC / MPEG-4 part10 parameter set decoding.
25  * @author Michael Niedermayer <michaelni@gmx.at>
26  */
27
28 #include <inttypes.h>
29
30 #include "libavutil/imgutils.h"
31 #include "internal.h"
32 #include "mathops.h"
33 #include "avcodec.h"
34 #include "h264data.h"
35 #include "h264_ps.h"
36 #include "golomb.h"
37
38 #define MAX_LOG2_MAX_FRAME_NUM    (12 + 4)
39 #define MIN_LOG2_MAX_FRAME_NUM    4
40
41 #define EXTENDED_SAR       255
42
43 static const uint8_t default_scaling4[2][16] = {
44     {  6, 13, 20, 28, 13, 20, 28, 32,
45       20, 28, 32, 37, 28, 32, 37, 42 },
46     { 10, 14, 20, 24, 14, 20, 24, 27,
47       20, 24, 27, 30, 24, 27, 30, 34 }
48 };
49
50 static const uint8_t default_scaling8[2][64] = {
51     {  6, 10, 13, 16, 18, 23, 25, 27,
52       10, 11, 16, 18, 23, 25, 27, 29,
53       13, 16, 18, 23, 25, 27, 29, 31,
54       16, 18, 23, 25, 27, 29, 31, 33,
55       18, 23, 25, 27, 29, 31, 33, 36,
56       23, 25, 27, 29, 31, 33, 36, 38,
57       25, 27, 29, 31, 33, 36, 38, 40,
58       27, 29, 31, 33, 36, 38, 40, 42 },
59     {  9, 13, 15, 17, 19, 21, 22, 24,
60       13, 13, 17, 19, 21, 22, 24, 25,
61       15, 17, 19, 21, 22, 24, 25, 27,
62       17, 19, 21, 22, 24, 25, 27, 28,
63       19, 21, 22, 24, 25, 27, 28, 30,
64       21, 22, 24, 25, 27, 28, 30, 32,
65       22, 24, 25, 27, 28, 30, 32, 33,
66       24, 25, 27, 28, 30, 32, 33, 35 }
67 };
68
69 /* maximum number of MBs in the DPB for a given level */
70 static const int level_max_dpb_mbs[][2] = {
71     { 10, 396       },
72     { 11, 900       },
73     { 12, 2376      },
74     { 13, 2376      },
75     { 20, 2376      },
76     { 21, 4752      },
77     { 22, 8100      },
78     { 30, 8100      },
79     { 31, 18000     },
80     { 32, 20480     },
81     { 40, 32768     },
82     { 41, 32768     },
83     { 42, 34816     },
84     { 50, 110400    },
85     { 51, 184320    },
86     { 52, 184320    },
87 };
88
89 static void remove_pps(H264ParamSets *s, int id)
90 {
91     av_buffer_unref(&s->pps_list[id]);
92 }
93
94 static void remove_sps(H264ParamSets *s, int id)
95 {
96 #if 0
97     int i;
98     if (s->sps_list[id]) {
99         /* drop all PPS that depend on this SPS */
100         for (i = 0; i < FF_ARRAY_ELEMS(s->pps_list); i++)
101             if (s->pps_list[i] && ((PPS*)s->pps_list[i]->data)->sps_id == id)
102                 remove_pps(s, i);
103     }
104 #endif
105     av_buffer_unref(&s->sps_list[id]);
106 }
107
108 static inline int decode_hrd_parameters(GetBitContext *gb, AVCodecContext *avctx,
109                                         SPS *sps)
110 {
111     int cpb_count, i;
112     cpb_count = get_ue_golomb_31(gb) + 1;
113
114     if (cpb_count > 32U) {
115         av_log(avctx, AV_LOG_ERROR, "cpb_count %d invalid\n", cpb_count);
116         return AVERROR_INVALIDDATA;
117     }
118
119     get_bits(gb, 4); /* bit_rate_scale */
120     get_bits(gb, 4); /* cpb_size_scale */
121     for (i = 0; i < cpb_count; i++) {
122         get_ue_golomb_long(gb); /* bit_rate_value_minus1 */
123         get_ue_golomb_long(gb); /* cpb_size_value_minus1 */
124         get_bits1(gb);          /* cbr_flag */
125     }
126     sps->initial_cpb_removal_delay_length = get_bits(gb, 5) + 1;
127     sps->cpb_removal_delay_length         = get_bits(gb, 5) + 1;
128     sps->dpb_output_delay_length          = get_bits(gb, 5) + 1;
129     sps->time_offset_length               = get_bits(gb, 5);
130     sps->cpb_cnt                          = cpb_count;
131     return 0;
132 }
133
134 static inline int decode_vui_parameters(GetBitContext *gb, AVCodecContext *avctx,
135                                         SPS *sps)
136 {
137     int aspect_ratio_info_present_flag;
138     unsigned int aspect_ratio_idc;
139
140     aspect_ratio_info_present_flag = get_bits1(gb);
141
142     if (aspect_ratio_info_present_flag) {
143         aspect_ratio_idc = get_bits(gb, 8);
144         if (aspect_ratio_idc == EXTENDED_SAR) {
145             sps->sar.num = get_bits(gb, 16);
146             sps->sar.den = get_bits(gb, 16);
147         } else if (aspect_ratio_idc < FF_ARRAY_ELEMS(ff_h264_pixel_aspect)) {
148             sps->sar = ff_h264_pixel_aspect[aspect_ratio_idc];
149         } else {
150             av_log(avctx, AV_LOG_ERROR, "illegal aspect ratio\n");
151             return AVERROR_INVALIDDATA;
152         }
153     } else {
154         sps->sar.num =
155         sps->sar.den = 0;
156     }
157
158     if (get_bits1(gb))      /* overscan_info_present_flag */
159         get_bits1(gb);      /* overscan_appropriate_flag */
160
161     sps->video_signal_type_present_flag = get_bits1(gb);
162     if (sps->video_signal_type_present_flag) {
163         get_bits(gb, 3);                 /* video_format */
164         sps->full_range = get_bits1(gb); /* video_full_range_flag */
165
166         sps->colour_description_present_flag = get_bits1(gb);
167         if (sps->colour_description_present_flag) {
168             sps->color_primaries = get_bits(gb, 8); /* colour_primaries */
169             sps->color_trc       = get_bits(gb, 8); /* transfer_characteristics */
170             sps->colorspace      = get_bits(gb, 8); /* matrix_coefficients */
171             if (sps->color_primaries >= AVCOL_PRI_NB)
172                 sps->color_primaries = AVCOL_PRI_UNSPECIFIED;
173             if (sps->color_trc >= AVCOL_TRC_NB)
174                 sps->color_trc = AVCOL_TRC_UNSPECIFIED;
175             if (sps->colorspace >= AVCOL_SPC_NB)
176                 sps->colorspace = AVCOL_SPC_UNSPECIFIED;
177         }
178     }
179
180     /* chroma_location_info_present_flag */
181     if (get_bits1(gb)) {
182         /* chroma_sample_location_type_top_field */
183         avctx->chroma_sample_location = get_ue_golomb(gb) + 1;
184         get_ue_golomb(gb);  /* chroma_sample_location_type_bottom_field */
185     }
186
187     if (show_bits1(gb) && get_bits_left(gb) < 10) {
188         av_log(avctx, AV_LOG_WARNING, "Truncated VUI\n");
189         return 0;
190     }
191
192     sps->timing_info_present_flag = get_bits1(gb);
193     if (sps->timing_info_present_flag) {
194         unsigned num_units_in_tick = get_bits_long(gb, 32);
195         unsigned time_scale        = get_bits_long(gb, 32);
196         if (!num_units_in_tick || !time_scale) {
197             av_log(avctx, AV_LOG_ERROR,
198                    "time_scale/num_units_in_tick invalid or unsupported (%u/%u)\n",
199                    time_scale, num_units_in_tick);
200             sps->timing_info_present_flag = 0;
201         } else {
202             sps->num_units_in_tick = num_units_in_tick;
203             sps->time_scale = time_scale;
204         }
205         sps->fixed_frame_rate_flag = get_bits1(gb);
206     }
207
208     sps->nal_hrd_parameters_present_flag = get_bits1(gb);
209     if (sps->nal_hrd_parameters_present_flag)
210         if (decode_hrd_parameters(gb, avctx, sps) < 0)
211             return AVERROR_INVALIDDATA;
212     sps->vcl_hrd_parameters_present_flag = get_bits1(gb);
213     if (sps->vcl_hrd_parameters_present_flag)
214         if (decode_hrd_parameters(gb, avctx, sps) < 0)
215             return AVERROR_INVALIDDATA;
216     if (sps->nal_hrd_parameters_present_flag ||
217         sps->vcl_hrd_parameters_present_flag)
218         get_bits1(gb);     /* low_delay_hrd_flag */
219     sps->pic_struct_present_flag = get_bits1(gb);
220     if (!get_bits_left(gb))
221         return 0;
222     sps->bitstream_restriction_flag = get_bits1(gb);
223     if (sps->bitstream_restriction_flag) {
224         get_bits1(gb);     /* motion_vectors_over_pic_boundaries_flag */
225         get_ue_golomb(gb); /* max_bytes_per_pic_denom */
226         get_ue_golomb(gb); /* max_bits_per_mb_denom */
227         get_ue_golomb(gb); /* log2_max_mv_length_horizontal */
228         get_ue_golomb(gb); /* log2_max_mv_length_vertical */
229         sps->num_reorder_frames = get_ue_golomb(gb);
230         get_ue_golomb(gb); /*max_dec_frame_buffering*/
231
232         if (get_bits_left(gb) < 0) {
233             sps->num_reorder_frames         = 0;
234             sps->bitstream_restriction_flag = 0;
235         }
236
237         if (sps->num_reorder_frames > 16U
238             /* max_dec_frame_buffering || max_dec_frame_buffering > 16 */) {
239             av_log(avctx, AV_LOG_ERROR,
240                    "Clipping illegal num_reorder_frames %d\n",
241                    sps->num_reorder_frames);
242             sps->num_reorder_frames = 16;
243             return AVERROR_INVALIDDATA;
244         }
245     }
246
247     return 0;
248 }
249
250 static void decode_scaling_list(GetBitContext *gb, uint8_t *factors, int size,
251                                 const uint8_t *jvt_list,
252                                 const uint8_t *fallback_list)
253 {
254     int i, last = 8, next = 8;
255     const uint8_t *scan = size == 16 ? ff_zigzag_scan : ff_zigzag_direct;
256     if (!get_bits1(gb)) /* matrix not written, we use the predicted one */
257         memcpy(factors, fallback_list, size * sizeof(uint8_t));
258     else
259         for (i = 0; i < size; i++) {
260             if (next)
261                 next = (last + get_se_golomb(gb)) & 0xff;
262             if (!i && !next) { /* matrix not written, we use the preset one */
263                 memcpy(factors, jvt_list, size * sizeof(uint8_t));
264                 break;
265             }
266             last = factors[scan[i]] = next ? next : last;
267         }
268 }
269
270 /* returns non zero if the provided SPS scaling matrix has been filled */
271 static int decode_scaling_matrices(GetBitContext *gb, const SPS *sps,
272                                     const PPS *pps, int is_sps,
273                                     uint8_t(*scaling_matrix4)[16],
274                                     uint8_t(*scaling_matrix8)[64])
275 {
276     int fallback_sps = !is_sps && sps->scaling_matrix_present;
277     const uint8_t *fallback[4] = {
278         fallback_sps ? sps->scaling_matrix4[0] : default_scaling4[0],
279         fallback_sps ? sps->scaling_matrix4[3] : default_scaling4[1],
280         fallback_sps ? sps->scaling_matrix8[0] : default_scaling8[0],
281         fallback_sps ? sps->scaling_matrix8[3] : default_scaling8[1]
282     };
283     int ret = 0;
284     if (get_bits1(gb)) {
285         ret = is_sps;
286         decode_scaling_list(gb, scaling_matrix4[0], 16, default_scaling4[0], fallback[0]);        // Intra, Y
287         decode_scaling_list(gb, scaling_matrix4[1], 16, default_scaling4[0], scaling_matrix4[0]); // Intra, Cr
288         decode_scaling_list(gb, scaling_matrix4[2], 16, default_scaling4[0], scaling_matrix4[1]); // Intra, Cb
289         decode_scaling_list(gb, scaling_matrix4[3], 16, default_scaling4[1], fallback[1]);        // Inter, Y
290         decode_scaling_list(gb, scaling_matrix4[4], 16, default_scaling4[1], scaling_matrix4[3]); // Inter, Cr
291         decode_scaling_list(gb, scaling_matrix4[5], 16, default_scaling4[1], scaling_matrix4[4]); // Inter, Cb
292         if (is_sps || pps->transform_8x8_mode) {
293             decode_scaling_list(gb, scaling_matrix8[0], 64, default_scaling8[0], fallback[2]); // Intra, Y
294             decode_scaling_list(gb, scaling_matrix8[3], 64, default_scaling8[1], fallback[3]); // Inter, Y
295             if (sps->chroma_format_idc == 3) {
296                 decode_scaling_list(gb, scaling_matrix8[1], 64, default_scaling8[0], scaling_matrix8[0]); // Intra, Cr
297                 decode_scaling_list(gb, scaling_matrix8[4], 64, default_scaling8[1], scaling_matrix8[3]); // Inter, Cr
298                 decode_scaling_list(gb, scaling_matrix8[2], 64, default_scaling8[0], scaling_matrix8[1]); // Intra, Cb
299                 decode_scaling_list(gb, scaling_matrix8[5], 64, default_scaling8[1], scaling_matrix8[4]); // Inter, Cb
300             }
301         }
302     }
303
304     return ret;
305 }
306
307 void ff_h264_ps_uninit(H264ParamSets *ps)
308 {
309     int i;
310
311     for (i = 0; i < MAX_SPS_COUNT; i++)
312         av_buffer_unref(&ps->sps_list[i]);
313
314     for (i = 0; i < MAX_PPS_COUNT; i++)
315         av_buffer_unref(&ps->pps_list[i]);
316
317     av_buffer_unref(&ps->sps_ref);
318     av_buffer_unref(&ps->pps_ref);
319
320     ps->pps = NULL;
321     ps->sps = NULL;
322 }
323
324 int ff_h264_decode_seq_parameter_set(GetBitContext *gb, AVCodecContext *avctx,
325                                      H264ParamSets *ps, int ignore_truncation)
326 {
327     AVBufferRef *sps_buf;
328     int profile_idc, level_idc, constraint_set_flags = 0;
329     unsigned int sps_id;
330     int i, log2_max_frame_num_minus4;
331     SPS *sps;
332
333     sps_buf = av_buffer_allocz(sizeof(*sps));
334     if (!sps_buf)
335         return AVERROR(ENOMEM);
336     sps = (SPS*)sps_buf->data;
337
338     sps->data_size = gb->buffer_end - gb->buffer;
339     if (sps->data_size > sizeof(sps->data)) {
340         av_log(avctx, AV_LOG_WARNING, "Truncating likely oversized SPS\n");
341         sps->data_size = sizeof(sps->data);
342     }
343     memcpy(sps->data, gb->buffer, sps->data_size);
344
345     profile_idc           = get_bits(gb, 8);
346     constraint_set_flags |= get_bits1(gb) << 0;   // constraint_set0_flag
347     constraint_set_flags |= get_bits1(gb) << 1;   // constraint_set1_flag
348     constraint_set_flags |= get_bits1(gb) << 2;   // constraint_set2_flag
349     constraint_set_flags |= get_bits1(gb) << 3;   // constraint_set3_flag
350     constraint_set_flags |= get_bits1(gb) << 4;   // constraint_set4_flag
351     constraint_set_flags |= get_bits1(gb) << 5;   // constraint_set5_flag
352     skip_bits(gb, 2);                             // reserved_zero_2bits
353     level_idc = get_bits(gb, 8);
354     sps_id    = get_ue_golomb_31(gb);
355
356     if (sps_id >= MAX_SPS_COUNT) {
357         av_log(avctx, AV_LOG_ERROR, "sps_id %u out of range\n", sps_id);
358         goto fail;
359     }
360
361     sps->sps_id               = sps_id;
362     sps->time_offset_length   = 24;
363     sps->profile_idc          = profile_idc;
364     sps->constraint_set_flags = constraint_set_flags;
365     sps->level_idc            = level_idc;
366     sps->full_range           = -1;
367
368     memset(sps->scaling_matrix4, 16, sizeof(sps->scaling_matrix4));
369     memset(sps->scaling_matrix8, 16, sizeof(sps->scaling_matrix8));
370     sps->scaling_matrix_present = 0;
371     sps->colorspace = 2; //AVCOL_SPC_UNSPECIFIED
372
373     if (sps->profile_idc == 100 ||  // High profile
374         sps->profile_idc == 110 ||  // High10 profile
375         sps->profile_idc == 122 ||  // High422 profile
376         sps->profile_idc == 244 ||  // High444 Predictive profile
377         sps->profile_idc ==  44 ||  // Cavlc444 profile
378         sps->profile_idc ==  83 ||  // Scalable Constrained High profile (SVC)
379         sps->profile_idc ==  86 ||  // Scalable High Intra profile (SVC)
380         sps->profile_idc == 118 ||  // Stereo High profile (MVC)
381         sps->profile_idc == 128 ||  // Multiview High profile (MVC)
382         sps->profile_idc == 138 ||  // Multiview Depth High profile (MVCD)
383         sps->profile_idc == 144) {  // old High444 profile
384         sps->chroma_format_idc = get_ue_golomb_31(gb);
385         if (sps->chroma_format_idc > 3U) {
386             avpriv_request_sample(avctx, "chroma_format_idc %u",
387                                   sps->chroma_format_idc);
388             goto fail;
389         } else if (sps->chroma_format_idc == 3) {
390             sps->residual_color_transform_flag = get_bits1(gb);
391             if (sps->residual_color_transform_flag) {
392                 av_log(avctx, AV_LOG_ERROR, "separate color planes are not supported\n");
393                 goto fail;
394             }
395         }
396         sps->bit_depth_luma   = get_ue_golomb(gb) + 8;
397         sps->bit_depth_chroma = get_ue_golomb(gb) + 8;
398         if (sps->bit_depth_chroma != sps->bit_depth_luma) {
399             avpriv_request_sample(avctx,
400                                   "Different chroma and luma bit depth");
401             goto fail;
402         }
403         if (sps->bit_depth_luma   < 8 || sps->bit_depth_luma   > 14 ||
404             sps->bit_depth_chroma < 8 || sps->bit_depth_chroma > 14) {
405             av_log(avctx, AV_LOG_ERROR, "illegal bit depth value (%d, %d)\n",
406                    sps->bit_depth_luma, sps->bit_depth_chroma);
407             goto fail;
408         }
409         sps->transform_bypass = get_bits1(gb);
410         sps->scaling_matrix_present |= decode_scaling_matrices(gb, sps, NULL, 1,
411                                 sps->scaling_matrix4, sps->scaling_matrix8);
412     } else {
413         sps->chroma_format_idc = 1;
414         sps->bit_depth_luma    = 8;
415         sps->bit_depth_chroma  = 8;
416     }
417
418     log2_max_frame_num_minus4 = get_ue_golomb(gb);
419     if (log2_max_frame_num_minus4 < MIN_LOG2_MAX_FRAME_NUM - 4 ||
420         log2_max_frame_num_minus4 > MAX_LOG2_MAX_FRAME_NUM - 4) {
421         av_log(avctx, AV_LOG_ERROR,
422                "log2_max_frame_num_minus4 out of range (0-12): %d\n",
423                log2_max_frame_num_minus4);
424         goto fail;
425     }
426     sps->log2_max_frame_num = log2_max_frame_num_minus4 + 4;
427
428     sps->poc_type = get_ue_golomb_31(gb);
429
430     if (sps->poc_type == 0) { // FIXME #define
431         unsigned t = get_ue_golomb(gb);
432         if (t>12) {
433             av_log(avctx, AV_LOG_ERROR, "log2_max_poc_lsb (%d) is out of range\n", t);
434             goto fail;
435         }
436         sps->log2_max_poc_lsb = t + 4;
437     } else if (sps->poc_type == 1) { // FIXME #define
438         sps->delta_pic_order_always_zero_flag = get_bits1(gb);
439         sps->offset_for_non_ref_pic           = get_se_golomb(gb);
440         sps->offset_for_top_to_bottom_field   = get_se_golomb(gb);
441         sps->poc_cycle_length                 = get_ue_golomb(gb);
442
443         if ((unsigned)sps->poc_cycle_length >=
444             FF_ARRAY_ELEMS(sps->offset_for_ref_frame)) {
445             av_log(avctx, AV_LOG_ERROR,
446                    "poc_cycle_length overflow %d\n", sps->poc_cycle_length);
447             goto fail;
448         }
449
450         for (i = 0; i < sps->poc_cycle_length; i++)
451             sps->offset_for_ref_frame[i] = get_se_golomb(gb);
452     } else if (sps->poc_type != 2) {
453         av_log(avctx, AV_LOG_ERROR, "illegal POC type %d\n", sps->poc_type);
454         goto fail;
455     }
456
457     sps->ref_frame_count = get_ue_golomb_31(gb);
458     if (avctx->codec_tag == MKTAG('S', 'M', 'V', '2'))
459         sps->ref_frame_count = FFMAX(2, sps->ref_frame_count);
460     if (sps->ref_frame_count > H264_MAX_PICTURE_COUNT - 2 ||
461         sps->ref_frame_count > 16U) {
462         av_log(avctx, AV_LOG_ERROR,
463                "too many reference frames %d\n", sps->ref_frame_count);
464         goto fail;
465     }
466     sps->gaps_in_frame_num_allowed_flag = get_bits1(gb);
467     sps->mb_width                       = get_ue_golomb(gb) + 1;
468     sps->mb_height                      = get_ue_golomb(gb) + 1;
469
470     sps->frame_mbs_only_flag = get_bits1(gb);
471     if (!sps->frame_mbs_only_flag)
472         sps->mb_aff = get_bits1(gb);
473     else
474         sps->mb_aff = 0;
475
476     if ((unsigned)sps->mb_width  >= INT_MAX / 16 ||
477         (unsigned)sps->mb_height >= INT_MAX / (16 * (2 - sps->frame_mbs_only_flag)) ||
478         av_image_check_size(16 * sps->mb_width,
479                             16 * sps->mb_height * (2 - sps->frame_mbs_only_flag), 0, avctx)) {
480         av_log(avctx, AV_LOG_ERROR, "mb_width/height overflow\n");
481         goto fail;
482     }
483
484     sps->direct_8x8_inference_flag = get_bits1(gb);
485
486 #ifndef ALLOW_INTERLACE
487     if (sps->mb_aff)
488         av_log(avctx, AV_LOG_ERROR,
489                "MBAFF support not included; enable it at compile-time.\n");
490 #endif
491     sps->crop = get_bits1(gb);
492     if (sps->crop) {
493         unsigned int crop_left   = get_ue_golomb(gb);
494         unsigned int crop_right  = get_ue_golomb(gb);
495         unsigned int crop_top    = get_ue_golomb(gb);
496         unsigned int crop_bottom = get_ue_golomb(gb);
497         int width  = 16 * sps->mb_width;
498         int height = 16 * sps->mb_height * (2 - sps->frame_mbs_only_flag);
499
500         if (avctx->flags2 & AV_CODEC_FLAG2_IGNORE_CROP) {
501             av_log(avctx, AV_LOG_DEBUG, "discarding sps cropping, original "
502                                            "values are l:%d r:%d t:%d b:%d\n",
503                    crop_left, crop_right, crop_top, crop_bottom);
504
505             sps->crop_left   =
506             sps->crop_right  =
507             sps->crop_top    =
508             sps->crop_bottom = 0;
509         } else {
510             int vsub   = (sps->chroma_format_idc == 1) ? 1 : 0;
511             int hsub   = (sps->chroma_format_idc == 1 ||
512                           sps->chroma_format_idc == 2) ? 1 : 0;
513             int step_x = 1 << hsub;
514             int step_y = (2 - sps->frame_mbs_only_flag) << vsub;
515
516             if (crop_left & (0x1F >> (sps->bit_depth_luma > 8)) &&
517                 !(avctx->flags & AV_CODEC_FLAG_UNALIGNED)) {
518                 crop_left &= ~(0x1F >> (sps->bit_depth_luma > 8));
519                 av_log(avctx, AV_LOG_WARNING,
520                        "Reducing left cropping to %d "
521                        "chroma samples to preserve alignment.\n",
522                        crop_left);
523             }
524
525             if (crop_left  > (unsigned)INT_MAX / 4 / step_x ||
526                 crop_right > (unsigned)INT_MAX / 4 / step_x ||
527                 crop_top   > (unsigned)INT_MAX / 4 / step_y ||
528                 crop_bottom> (unsigned)INT_MAX / 4 / step_y ||
529                 (crop_left + crop_right ) * step_x >= width ||
530                 (crop_top  + crop_bottom) * step_y >= height
531             ) {
532                 av_log(avctx, AV_LOG_ERROR, "crop values invalid %d %d %d %d / %d %d\n", crop_left, crop_right, crop_top, crop_bottom, width, height);
533                 goto fail;
534             }
535
536             sps->crop_left   = crop_left   * step_x;
537             sps->crop_right  = crop_right  * step_x;
538             sps->crop_top    = crop_top    * step_y;
539             sps->crop_bottom = crop_bottom * step_y;
540         }
541     } else {
542         sps->crop_left   =
543         sps->crop_right  =
544         sps->crop_top    =
545         sps->crop_bottom =
546         sps->crop        = 0;
547     }
548
549     sps->vui_parameters_present_flag = get_bits1(gb);
550     if (sps->vui_parameters_present_flag) {
551         int ret = decode_vui_parameters(gb, avctx, sps);
552         if (ret < 0)
553             goto fail;
554     }
555
556     if (get_bits_left(gb) < 0) {
557         av_log(avctx, ignore_truncation ? AV_LOG_WARNING : AV_LOG_ERROR,
558                "Overread %s by %d bits\n", sps->vui_parameters_present_flag ? "VUI" : "SPS", -get_bits_left(gb));
559         if (!ignore_truncation)
560             goto fail;
561     }
562
563     /* if the maximum delay is not stored in the SPS, derive it based on the
564      * level */
565     if (!sps->bitstream_restriction_flag &&
566         (sps->ref_frame_count || avctx->strict_std_compliance >= FF_COMPLIANCE_STRICT)) {
567         sps->num_reorder_frames = MAX_DELAYED_PIC_COUNT - 1;
568         for (i = 0; i < FF_ARRAY_ELEMS(level_max_dpb_mbs); i++) {
569             if (level_max_dpb_mbs[i][0] == sps->level_idc) {
570                 sps->num_reorder_frames = FFMIN(level_max_dpb_mbs[i][1] / (sps->mb_width * sps->mb_height),
571                                                 sps->num_reorder_frames);
572                 break;
573             }
574         }
575     }
576
577     if (!sps->sar.den)
578         sps->sar.den = 1;
579
580     if (avctx->debug & FF_DEBUG_PICT_INFO) {
581         static const char csp[4][5] = { "Gray", "420", "422", "444" };
582         av_log(avctx, AV_LOG_DEBUG,
583                "sps:%u profile:%d/%d poc:%d ref:%d %dx%d %s %s crop:%u/%u/%u/%u %s %s %"PRId32"/%"PRId32" b%d reo:%d\n",
584                sps_id, sps->profile_idc, sps->level_idc,
585                sps->poc_type,
586                sps->ref_frame_count,
587                sps->mb_width, sps->mb_height,
588                sps->frame_mbs_only_flag ? "FRM" : (sps->mb_aff ? "MB-AFF" : "PIC-AFF"),
589                sps->direct_8x8_inference_flag ? "8B8" : "",
590                sps->crop_left, sps->crop_right,
591                sps->crop_top, sps->crop_bottom,
592                sps->vui_parameters_present_flag ? "VUI" : "",
593                csp[sps->chroma_format_idc],
594                sps->timing_info_present_flag ? sps->num_units_in_tick : 0,
595                sps->timing_info_present_flag ? sps->time_scale : 0,
596                sps->bit_depth_luma,
597                sps->bitstream_restriction_flag ? sps->num_reorder_frames : -1
598                );
599     }
600
601     /* check if this is a repeat of an already parsed SPS, then keep the
602      * original one.
603      * otherwise drop all PPSes that depend on it */
604     if (ps->sps_list[sps_id] &&
605         !memcmp(ps->sps_list[sps_id]->data, sps_buf->data, sps_buf->size)) {
606         av_buffer_unref(&sps_buf);
607     } else {
608         remove_sps(ps, sps_id);
609         ps->sps_list[sps_id] = sps_buf;
610     }
611
612     return 0;
613
614 fail:
615     av_buffer_unref(&sps_buf);
616     return AVERROR_INVALIDDATA;
617 }
618
619 static void init_dequant8_coeff_table(PPS *pps, const SPS *sps)
620 {
621     int i, j, q, x;
622     const int max_qp = 51 + 6 * (sps->bit_depth_luma - 8);
623
624     for (i = 0; i < 6; i++) {
625         pps->dequant8_coeff[i] = pps->dequant8_buffer[i];
626         for (j = 0; j < i; j++)
627             if (!memcmp(pps->scaling_matrix8[j], pps->scaling_matrix8[i],
628                         64 * sizeof(uint8_t))) {
629                 pps->dequant8_coeff[i] = pps->dequant8_buffer[j];
630                 break;
631             }
632         if (j < i)
633             continue;
634
635         for (q = 0; q < max_qp + 1; q++) {
636             int shift = ff_h264_quant_div6[q];
637             int idx   = ff_h264_quant_rem6[q];
638             for (x = 0; x < 64; x++)
639                 pps->dequant8_coeff[i][q][(x >> 3) | ((x & 7) << 3)] =
640                     ((uint32_t)ff_h264_dequant8_coeff_init[idx][ff_h264_dequant8_coeff_init_scan[((x >> 1) & 12) | (x & 3)]] *
641                      pps->scaling_matrix8[i][x]) << shift;
642         }
643     }
644 }
645
646 static void init_dequant4_coeff_table(PPS *pps, const SPS *sps)
647 {
648     int i, j, q, x;
649     const int max_qp = 51 + 6 * (sps->bit_depth_luma - 8);
650     for (i = 0; i < 6; i++) {
651         pps->dequant4_coeff[i] = pps->dequant4_buffer[i];
652         for (j = 0; j < i; j++)
653             if (!memcmp(pps->scaling_matrix4[j], pps->scaling_matrix4[i],
654                         16 * sizeof(uint8_t))) {
655                 pps->dequant4_coeff[i] = pps->dequant4_buffer[j];
656                 break;
657             }
658         if (j < i)
659             continue;
660
661         for (q = 0; q < max_qp + 1; q++) {
662             int shift = ff_h264_quant_div6[q] + 2;
663             int idx   = ff_h264_quant_rem6[q];
664             for (x = 0; x < 16; x++)
665                 pps->dequant4_coeff[i][q][(x >> 2) | ((x << 2) & 0xF)] =
666                     ((uint32_t)ff_h264_dequant4_coeff_init[idx][(x & 1) + ((x >> 2) & 1)] *
667                      pps->scaling_matrix4[i][x]) << shift;
668         }
669     }
670 }
671
672 static void init_dequant_tables(PPS *pps, const SPS *sps)
673 {
674     int i, x;
675     init_dequant4_coeff_table(pps, sps);
676     memset(pps->dequant8_coeff, 0, sizeof(pps->dequant8_coeff));
677
678     if (pps->transform_8x8_mode)
679         init_dequant8_coeff_table(pps, sps);
680     if (sps->transform_bypass) {
681         for (i = 0; i < 6; i++)
682             for (x = 0; x < 16; x++)
683                 pps->dequant4_coeff[i][0][x] = 1 << 6;
684         if (pps->transform_8x8_mode)
685             for (i = 0; i < 6; i++)
686                 for (x = 0; x < 64; x++)
687                     pps->dequant8_coeff[i][0][x] = 1 << 6;
688     }
689 }
690
691 static void build_qp_table(PPS *pps, int t, int index, const int depth)
692 {
693     int i;
694     const int max_qp = 51 + 6 * (depth - 8);
695     for (i = 0; i < max_qp + 1; i++)
696         pps->chroma_qp_table[t][i] =
697             ff_h264_chroma_qp[depth - 8][av_clip(i + index, 0, max_qp)];
698 }
699
700 static int more_rbsp_data_in_pps(const SPS *sps, void *logctx)
701 {
702     int profile_idc = sps->profile_idc;
703
704     if ((profile_idc == 66 || profile_idc == 77 ||
705          profile_idc == 88) && (sps->constraint_set_flags & 7)) {
706         av_log(logctx, AV_LOG_VERBOSE,
707                "Current profile doesn't provide more RBSP data in PPS, skipping\n");
708         return 0;
709     }
710
711     return 1;
712 }
713
714 int ff_h264_decode_picture_parameter_set(GetBitContext *gb, AVCodecContext *avctx,
715                                          H264ParamSets *ps, int bit_length)
716 {
717     AVBufferRef *pps_buf;
718     const SPS *sps;
719     unsigned int pps_id = get_ue_golomb(gb);
720     PPS *pps;
721     int qp_bd_offset;
722     int bits_left;
723     int ret;
724
725     if (pps_id >= MAX_PPS_COUNT) {
726         av_log(avctx, AV_LOG_ERROR, "pps_id %u out of range\n", pps_id);
727         return AVERROR_INVALIDDATA;
728     }
729
730     pps_buf = av_buffer_allocz(sizeof(*pps));
731     if (!pps_buf)
732         return AVERROR(ENOMEM);
733     pps = (PPS*)pps_buf->data;
734
735     pps->data_size = gb->buffer_end - gb->buffer;
736     if (pps->data_size > sizeof(pps->data)) {
737         av_log(avctx, AV_LOG_WARNING, "Truncating likely oversized PPS "
738                "(%"SIZE_SPECIFIER" > %"SIZE_SPECIFIER")\n",
739                pps->data_size, sizeof(pps->data));
740         pps->data_size = sizeof(pps->data);
741     }
742     memcpy(pps->data, gb->buffer, pps->data_size);
743
744     pps->sps_id = get_ue_golomb_31(gb);
745     if ((unsigned)pps->sps_id >= MAX_SPS_COUNT ||
746         !ps->sps_list[pps->sps_id]) {
747         av_log(avctx, AV_LOG_ERROR, "sps_id %u out of range\n", pps->sps_id);
748         ret = AVERROR_INVALIDDATA;
749         goto fail;
750     }
751     sps = (const SPS*)ps->sps_list[pps->sps_id]->data;
752     if (sps->bit_depth_luma > 14) {
753         av_log(avctx, AV_LOG_ERROR,
754                "Invalid luma bit depth=%d\n",
755                sps->bit_depth_luma);
756         ret = AVERROR_INVALIDDATA;
757         goto fail;
758     } else if (sps->bit_depth_luma == 11 || sps->bit_depth_luma == 13) {
759         av_log(avctx, AV_LOG_ERROR,
760                "Unimplemented luma bit depth=%d\n",
761                sps->bit_depth_luma);
762         ret = AVERROR_PATCHWELCOME;
763         goto fail;
764     }
765
766     pps->cabac             = get_bits1(gb);
767     pps->pic_order_present = get_bits1(gb);
768     pps->slice_group_count = get_ue_golomb(gb) + 1;
769     if (pps->slice_group_count > 1) {
770         pps->mb_slice_group_map_type = get_ue_golomb(gb);
771         av_log(avctx, AV_LOG_ERROR, "FMO not supported\n");
772         switch (pps->mb_slice_group_map_type) {
773         case 0:
774 #if 0
775     |       for (i = 0; i <= num_slice_groups_minus1; i++)  |   |      |
776     |           run_length[i]                               |1  |ue(v) |
777 #endif
778             break;
779         case 2:
780 #if 0
781     |       for (i = 0; i < num_slice_groups_minus1; i++) { |   |      |
782     |           top_left_mb[i]                              |1  |ue(v) |
783     |           bottom_right_mb[i]                          |1  |ue(v) |
784     |       }                                               |   |      |
785 #endif
786             break;
787         case 3:
788         case 4:
789         case 5:
790 #if 0
791     |       slice_group_change_direction_flag               |1  |u(1)  |
792     |       slice_group_change_rate_minus1                  |1  |ue(v) |
793 #endif
794             break;
795         case 6:
796 #if 0
797     |       slice_group_id_cnt_minus1                       |1  |ue(v) |
798     |       for (i = 0; i <= slice_group_id_cnt_minus1; i++)|   |      |
799     |           slice_group_id[i]                           |1  |u(v)  |
800 #endif
801             break;
802         }
803     }
804     pps->ref_count[0] = get_ue_golomb(gb) + 1;
805     pps->ref_count[1] = get_ue_golomb(gb) + 1;
806     if (pps->ref_count[0] - 1 > 32 - 1 || pps->ref_count[1] - 1 > 32 - 1) {
807         av_log(avctx, AV_LOG_ERROR, "reference overflow (pps)\n");
808         ret = AVERROR_INVALIDDATA;
809         goto fail;
810     }
811
812     qp_bd_offset = 6 * (sps->bit_depth_luma - 8);
813
814     pps->weighted_pred                        = get_bits1(gb);
815     pps->weighted_bipred_idc                  = get_bits(gb, 2);
816     pps->init_qp                              = get_se_golomb(gb) + 26 + qp_bd_offset;
817     pps->init_qs                              = get_se_golomb(gb) + 26 + qp_bd_offset;
818     pps->chroma_qp_index_offset[0]            = get_se_golomb(gb);
819     pps->deblocking_filter_parameters_present = get_bits1(gb);
820     pps->constrained_intra_pred               = get_bits1(gb);
821     pps->redundant_pic_cnt_present            = get_bits1(gb);
822
823     pps->transform_8x8_mode = 0;
824     memcpy(pps->scaling_matrix4, sps->scaling_matrix4,
825            sizeof(pps->scaling_matrix4));
826     memcpy(pps->scaling_matrix8, sps->scaling_matrix8,
827            sizeof(pps->scaling_matrix8));
828
829     bits_left = bit_length - get_bits_count(gb);
830     if (bits_left > 0 && more_rbsp_data_in_pps(sps, avctx)) {
831         pps->transform_8x8_mode = get_bits1(gb);
832         decode_scaling_matrices(gb, sps, pps, 0,
833                                 pps->scaling_matrix4, pps->scaling_matrix8);
834         // second_chroma_qp_index_offset
835         pps->chroma_qp_index_offset[1] = get_se_golomb(gb);
836     } else {
837         pps->chroma_qp_index_offset[1] = pps->chroma_qp_index_offset[0];
838     }
839
840     build_qp_table(pps, 0, pps->chroma_qp_index_offset[0],
841                    sps->bit_depth_luma);
842     build_qp_table(pps, 1, pps->chroma_qp_index_offset[1],
843                    sps->bit_depth_luma);
844
845     init_dequant_tables(pps, sps);
846
847     if (pps->chroma_qp_index_offset[0] != pps->chroma_qp_index_offset[1])
848         pps->chroma_qp_diff = 1;
849
850     if (avctx->debug & FF_DEBUG_PICT_INFO) {
851         av_log(avctx, AV_LOG_DEBUG,
852                "pps:%u sps:%u %s slice_groups:%d ref:%u/%u %s qp:%d/%d/%d/%d %s %s %s %s\n",
853                pps_id, pps->sps_id,
854                pps->cabac ? "CABAC" : "CAVLC",
855                pps->slice_group_count,
856                pps->ref_count[0], pps->ref_count[1],
857                pps->weighted_pred ? "weighted" : "",
858                pps->init_qp, pps->init_qs, pps->chroma_qp_index_offset[0], pps->chroma_qp_index_offset[1],
859                pps->deblocking_filter_parameters_present ? "LPAR" : "",
860                pps->constrained_intra_pred ? "CONSTR" : "",
861                pps->redundant_pic_cnt_present ? "REDU" : "",
862                pps->transform_8x8_mode ? "8x8DCT" : "");
863     }
864
865     remove_pps(ps, pps_id);
866     ps->pps_list[pps_id] = pps_buf;
867
868     return 0;
869
870 fail:
871     av_buffer_unref(&pps_buf);
872     return ret;
873 }