]> git.sesse.net Git - ffmpeg/blob - libavcodec/hevc.h
Merge commit '0bad254300356005af4aef00a706bf2e8eee96bc'
[ffmpeg] / libavcodec / hevc.h
1 /*
2  * HEVC video decoder
3  *
4  * Copyright (C) 2012 - 2013 Guillaume Martres
5  *
6  * This file is part of FFmpeg.
7  *
8  * FFmpeg is free software; you can redistribute it and/or
9  * modify it under the terms of the GNU Lesser General Public
10  * License as published by the Free Software Foundation; either
11  * version 2.1 of the License, or (at your option) any later version.
12  *
13  * FFmpeg is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16  * Lesser General Public License for more details.
17  *
18  * You should have received a copy of the GNU Lesser General Public
19  * License along with FFmpeg; if not, write to the Free Software
20  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
21  */
22
23 #ifndef AVCODEC_HEVC_H
24 #define AVCODEC_HEVC_H
25
26 #include "libavutil/buffer.h"
27 #include "libavutil/md5.h"
28
29 #include "avcodec.h"
30 #include "bswapdsp.h"
31 #include "cabac.h"
32 #include "get_bits.h"
33 #include "hevcpred.h"
34 #include "h2645_parse.h"
35 #include "hevcdsp.h"
36 #include "internal.h"
37 #include "thread.h"
38 #include "videodsp.h"
39
40 #define MAX_DPB_SIZE 16 // A.4.1
41 #define MAX_REFS 16
42
43 #define MAX_NB_THREADS 16
44 #define SHIFT_CTB_WPP 2
45
46 /**
47  * 7.4.2.1
48  */
49 #define MAX_SUB_LAYERS 7
50 #define MAX_VPS_COUNT 16
51 #define MAX_SPS_COUNT 32
52 #define MAX_PPS_COUNT 256
53 #define MAX_SHORT_TERM_RPS_COUNT 64
54 #define MAX_CU_SIZE 128
55
56 //TODO: check if this is really the maximum
57 #define MAX_TRANSFORM_DEPTH 5
58
59 #define MAX_TB_SIZE 32
60 #define MAX_LOG2_CTB_SIZE 6
61 #define MAX_QP 51
62 #define DEFAULT_INTRA_TC_OFFSET 2
63
64 #define HEVC_CONTEXTS 199
65
66 #define MRG_MAX_NUM_CANDS     5
67
68 #define L0 0
69 #define L1 1
70
71 #define EPEL_EXTRA_BEFORE 1
72 #define EPEL_EXTRA_AFTER  2
73 #define EPEL_EXTRA        3
74 #define QPEL_EXTRA_BEFORE 3
75 #define QPEL_EXTRA_AFTER  4
76 #define QPEL_EXTRA        7
77
78 #define EDGE_EMU_BUFFER_STRIDE 80
79
80 /**
81  * Value of the luma sample at position (x, y) in the 2D array tab.
82  */
83 #define SAMPLE(tab, x, y) ((tab)[(y) * s->sps->width + (x)])
84 #define SAMPLE_CTB(tab, x, y) ((tab)[(y) * min_cb_width + (x)])
85
86 #define IS_IDR(s) ((s)->nal_unit_type == NAL_IDR_W_RADL || (s)->nal_unit_type == NAL_IDR_N_LP)
87 #define IS_BLA(s) ((s)->nal_unit_type == NAL_BLA_W_RADL || (s)->nal_unit_type == NAL_BLA_W_LP || \
88                    (s)->nal_unit_type == NAL_BLA_N_LP)
89 #define IS_IRAP(s) ((s)->nal_unit_type >= 16 && (s)->nal_unit_type <= 23)
90
91 /**
92  * Table 7-3: NAL unit type codes
93  */
94 enum NALUnitType {
95     NAL_TRAIL_N    = 0,
96     NAL_TRAIL_R    = 1,
97     NAL_TSA_N      = 2,
98     NAL_TSA_R      = 3,
99     NAL_STSA_N     = 4,
100     NAL_STSA_R     = 5,
101     NAL_RADL_N     = 6,
102     NAL_RADL_R     = 7,
103     NAL_RASL_N     = 8,
104     NAL_RASL_R     = 9,
105     NAL_BLA_W_LP   = 16,
106     NAL_BLA_W_RADL = 17,
107     NAL_BLA_N_LP   = 18,
108     NAL_IDR_W_RADL = 19,
109     NAL_IDR_N_LP   = 20,
110     NAL_CRA_NUT    = 21,
111     NAL_VPS        = 32,
112     NAL_SPS        = 33,
113     NAL_PPS        = 34,
114     NAL_AUD        = 35,
115     NAL_EOS_NUT    = 36,
116     NAL_EOB_NUT    = 37,
117     NAL_FD_NUT     = 38,
118     NAL_SEI_PREFIX = 39,
119     NAL_SEI_SUFFIX = 40,
120 };
121
122 enum RPSType {
123     ST_CURR_BEF = 0,
124     ST_CURR_AFT,
125     ST_FOLL,
126     LT_CURR,
127     LT_FOLL,
128     NB_RPS_TYPE,
129 };
130
131 enum SliceType {
132     B_SLICE = 0,
133     P_SLICE = 1,
134     I_SLICE = 2,
135 };
136
137 enum SyntaxElement {
138     SAO_MERGE_FLAG = 0,
139     SAO_TYPE_IDX,
140     SAO_EO_CLASS,
141     SAO_BAND_POSITION,
142     SAO_OFFSET_ABS,
143     SAO_OFFSET_SIGN,
144     END_OF_SLICE_FLAG,
145     SPLIT_CODING_UNIT_FLAG,
146     CU_TRANSQUANT_BYPASS_FLAG,
147     SKIP_FLAG,
148     CU_QP_DELTA,
149     PRED_MODE_FLAG,
150     PART_MODE,
151     PCM_FLAG,
152     PREV_INTRA_LUMA_PRED_FLAG,
153     MPM_IDX,
154     REM_INTRA_LUMA_PRED_MODE,
155     INTRA_CHROMA_PRED_MODE,
156     MERGE_FLAG,
157     MERGE_IDX,
158     INTER_PRED_IDC,
159     REF_IDX_L0,
160     REF_IDX_L1,
161     ABS_MVD_GREATER0_FLAG,
162     ABS_MVD_GREATER1_FLAG,
163     ABS_MVD_MINUS2,
164     MVD_SIGN_FLAG,
165     MVP_LX_FLAG,
166     NO_RESIDUAL_DATA_FLAG,
167     SPLIT_TRANSFORM_FLAG,
168     CBF_LUMA,
169     CBF_CB_CR,
170     TRANSFORM_SKIP_FLAG,
171     EXPLICIT_RDPCM_FLAG,
172     EXPLICIT_RDPCM_DIR_FLAG,
173     LAST_SIGNIFICANT_COEFF_X_PREFIX,
174     LAST_SIGNIFICANT_COEFF_Y_PREFIX,
175     LAST_SIGNIFICANT_COEFF_X_SUFFIX,
176     LAST_SIGNIFICANT_COEFF_Y_SUFFIX,
177     SIGNIFICANT_COEFF_GROUP_FLAG,
178     SIGNIFICANT_COEFF_FLAG,
179     COEFF_ABS_LEVEL_GREATER1_FLAG,
180     COEFF_ABS_LEVEL_GREATER2_FLAG,
181     COEFF_ABS_LEVEL_REMAINING,
182     COEFF_SIGN_FLAG,
183     LOG2_RES_SCALE_ABS,
184     RES_SCALE_SIGN_FLAG,
185     CU_CHROMA_QP_OFFSET_FLAG,
186     CU_CHROMA_QP_OFFSET_IDX,
187 };
188
189 enum PartMode {
190     PART_2Nx2N = 0,
191     PART_2NxN  = 1,
192     PART_Nx2N  = 2,
193     PART_NxN   = 3,
194     PART_2NxnU = 4,
195     PART_2NxnD = 5,
196     PART_nLx2N = 6,
197     PART_nRx2N = 7,
198 };
199
200 enum PredMode {
201     MODE_INTER = 0,
202     MODE_INTRA,
203     MODE_SKIP,
204 };
205
206 enum InterPredIdc {
207     PRED_L0 = 0,
208     PRED_L1,
209     PRED_BI,
210 };
211
212 enum PredFlag {
213     PF_INTRA = 0,
214     PF_L0,
215     PF_L1,
216     PF_BI,
217 };
218
219 enum IntraPredMode {
220     INTRA_PLANAR = 0,
221     INTRA_DC,
222     INTRA_ANGULAR_2,
223     INTRA_ANGULAR_3,
224     INTRA_ANGULAR_4,
225     INTRA_ANGULAR_5,
226     INTRA_ANGULAR_6,
227     INTRA_ANGULAR_7,
228     INTRA_ANGULAR_8,
229     INTRA_ANGULAR_9,
230     INTRA_ANGULAR_10,
231     INTRA_ANGULAR_11,
232     INTRA_ANGULAR_12,
233     INTRA_ANGULAR_13,
234     INTRA_ANGULAR_14,
235     INTRA_ANGULAR_15,
236     INTRA_ANGULAR_16,
237     INTRA_ANGULAR_17,
238     INTRA_ANGULAR_18,
239     INTRA_ANGULAR_19,
240     INTRA_ANGULAR_20,
241     INTRA_ANGULAR_21,
242     INTRA_ANGULAR_22,
243     INTRA_ANGULAR_23,
244     INTRA_ANGULAR_24,
245     INTRA_ANGULAR_25,
246     INTRA_ANGULAR_26,
247     INTRA_ANGULAR_27,
248     INTRA_ANGULAR_28,
249     INTRA_ANGULAR_29,
250     INTRA_ANGULAR_30,
251     INTRA_ANGULAR_31,
252     INTRA_ANGULAR_32,
253     INTRA_ANGULAR_33,
254     INTRA_ANGULAR_34,
255 };
256
257 enum SAOType {
258     SAO_NOT_APPLIED = 0,
259     SAO_BAND,
260     SAO_EDGE,
261     SAO_APPLIED
262 };
263
264 enum SAOEOClass {
265     SAO_EO_HORIZ = 0,
266     SAO_EO_VERT,
267     SAO_EO_135D,
268     SAO_EO_45D,
269 };
270
271 enum ScanType {
272     SCAN_DIAG = 0,
273     SCAN_HORIZ,
274     SCAN_VERT,
275 };
276
277 typedef struct ShortTermRPS {
278     unsigned int num_negative_pics;
279     int num_delta_pocs;
280     int rps_idx_num_delta_pocs;
281     int32_t delta_poc[32];
282     uint8_t used[32];
283 } ShortTermRPS;
284
285 typedef struct LongTermRPS {
286     int     poc[32];
287     uint8_t used[32];
288     uint8_t nb_refs;
289 } LongTermRPS;
290
291 typedef struct RefPicList {
292     struct HEVCFrame *ref[MAX_REFS];
293     int list[MAX_REFS];
294     int isLongTerm[MAX_REFS];
295     int nb_refs;
296 } RefPicList;
297
298 typedef struct RefPicListTab {
299     RefPicList refPicList[2];
300 } RefPicListTab;
301
302 typedef struct HEVCWindow {
303     unsigned int left_offset;
304     unsigned int right_offset;
305     unsigned int top_offset;
306     unsigned int bottom_offset;
307 } HEVCWindow;
308
309 typedef struct VUI {
310     AVRational sar;
311
312     int overscan_info_present_flag;
313     int overscan_appropriate_flag;
314
315     int video_signal_type_present_flag;
316     int video_format;
317     int video_full_range_flag;
318     int colour_description_present_flag;
319     uint8_t colour_primaries;
320     uint8_t transfer_characteristic;
321     uint8_t matrix_coeffs;
322
323     int chroma_loc_info_present_flag;
324     int chroma_sample_loc_type_top_field;
325     int chroma_sample_loc_type_bottom_field;
326     int neutra_chroma_indication_flag;
327
328     int field_seq_flag;
329     int frame_field_info_present_flag;
330
331     int default_display_window_flag;
332     HEVCWindow def_disp_win;
333
334     int vui_timing_info_present_flag;
335     uint32_t vui_num_units_in_tick;
336     uint32_t vui_time_scale;
337     int vui_poc_proportional_to_timing_flag;
338     int vui_num_ticks_poc_diff_one_minus1;
339     int vui_hrd_parameters_present_flag;
340
341     int bitstream_restriction_flag;
342     int tiles_fixed_structure_flag;
343     int motion_vectors_over_pic_boundaries_flag;
344     int restricted_ref_pic_lists_flag;
345     int min_spatial_segmentation_idc;
346     int max_bytes_per_pic_denom;
347     int max_bits_per_min_cu_denom;
348     int log2_max_mv_length_horizontal;
349     int log2_max_mv_length_vertical;
350 } VUI;
351
352 typedef struct PTLCommon {
353     uint8_t profile_space;
354     uint8_t tier_flag;
355     uint8_t profile_idc;
356     uint8_t profile_compatibility_flag[32];
357     uint8_t level_idc;
358     uint8_t progressive_source_flag;
359     uint8_t interlaced_source_flag;
360     uint8_t non_packed_constraint_flag;
361     uint8_t frame_only_constraint_flag;
362 } PTLCommon;
363
364 typedef struct PTL {
365     PTLCommon general_ptl;
366     PTLCommon sub_layer_ptl[MAX_SUB_LAYERS];
367
368     uint8_t sub_layer_profile_present_flag[MAX_SUB_LAYERS];
369     uint8_t sub_layer_level_present_flag[MAX_SUB_LAYERS];
370 } PTL;
371
372 typedef struct HEVCVPS {
373     uint8_t vps_temporal_id_nesting_flag;
374     int vps_max_layers;
375     int vps_max_sub_layers; ///< vps_max_temporal_layers_minus1 + 1
376
377     PTL ptl;
378     int vps_sub_layer_ordering_info_present_flag;
379     unsigned int vps_max_dec_pic_buffering[MAX_SUB_LAYERS];
380     unsigned int vps_num_reorder_pics[MAX_SUB_LAYERS];
381     unsigned int vps_max_latency_increase[MAX_SUB_LAYERS];
382     int vps_max_layer_id;
383     int vps_num_layer_sets; ///< vps_num_layer_sets_minus1 + 1
384     uint8_t vps_timing_info_present_flag;
385     uint32_t vps_num_units_in_tick;
386     uint32_t vps_time_scale;
387     uint8_t vps_poc_proportional_to_timing_flag;
388     int vps_num_ticks_poc_diff_one; ///< vps_num_ticks_poc_diff_one_minus1 + 1
389     int vps_num_hrd_parameters;
390 } HEVCVPS;
391
392 typedef struct ScalingList {
393     /* This is a little wasteful, since sizeID 0 only needs 8 coeffs,
394      * and size ID 3 only has 2 arrays, not 6. */
395     uint8_t sl[4][6][64];
396     uint8_t sl_dc[2][6];
397 } ScalingList;
398
399 typedef struct HEVCSPS {
400     unsigned vps_id;
401     int chroma_format_idc;
402     uint8_t separate_colour_plane_flag;
403
404     ///< output (i.e. cropped) values
405     int output_width, output_height;
406     HEVCWindow output_window;
407
408     HEVCWindow pic_conf_win;
409
410     int bit_depth;
411     int pixel_shift;
412     enum AVPixelFormat pix_fmt;
413
414     unsigned int log2_max_poc_lsb;
415     int pcm_enabled_flag;
416
417     int max_sub_layers;
418     struct {
419         int max_dec_pic_buffering;
420         int num_reorder_pics;
421         int max_latency_increase;
422     } temporal_layer[MAX_SUB_LAYERS];
423
424     VUI vui;
425     PTL ptl;
426
427     uint8_t scaling_list_enable_flag;
428     ScalingList scaling_list;
429
430     unsigned int nb_st_rps;
431     ShortTermRPS st_rps[MAX_SHORT_TERM_RPS_COUNT];
432
433     uint8_t amp_enabled_flag;
434     uint8_t sao_enabled;
435
436     uint8_t long_term_ref_pics_present_flag;
437     uint16_t lt_ref_pic_poc_lsb_sps[32];
438     uint8_t used_by_curr_pic_lt_sps_flag[32];
439     uint8_t num_long_term_ref_pics_sps;
440
441     struct {
442         uint8_t bit_depth;
443         uint8_t bit_depth_chroma;
444         unsigned int log2_min_pcm_cb_size;
445         unsigned int log2_max_pcm_cb_size;
446         uint8_t loop_filter_disable_flag;
447     } pcm;
448     uint8_t sps_temporal_mvp_enabled_flag;
449     uint8_t sps_strong_intra_smoothing_enable_flag;
450
451     unsigned int log2_min_cb_size;
452     unsigned int log2_diff_max_min_coding_block_size;
453     unsigned int log2_min_tb_size;
454     unsigned int log2_max_trafo_size;
455     unsigned int log2_ctb_size;
456     unsigned int log2_min_pu_size;
457
458     int max_transform_hierarchy_depth_inter;
459     int max_transform_hierarchy_depth_intra;
460
461     int transform_skip_rotation_enabled_flag;
462     int transform_skip_context_enabled_flag;
463     int implicit_rdpcm_enabled_flag;
464     int explicit_rdpcm_enabled_flag;
465     int intra_smoothing_disabled_flag;
466     int persistent_rice_adaptation_enabled_flag;
467
468     ///< coded frame dimension in various units
469     int width;
470     int height;
471     int ctb_width;
472     int ctb_height;
473     int ctb_size;
474     int min_cb_width;
475     int min_cb_height;
476     int min_tb_width;
477     int min_tb_height;
478     int min_pu_width;
479     int min_pu_height;
480     int tb_mask;
481
482     int hshift[3];
483     int vshift[3];
484
485     int qp_bd_offset;
486 } HEVCSPS;
487
488 typedef struct HEVCPPS {
489     unsigned int sps_id; ///< seq_parameter_set_id
490
491     uint8_t sign_data_hiding_flag;
492
493     uint8_t cabac_init_present_flag;
494
495     int num_ref_idx_l0_default_active; ///< num_ref_idx_l0_default_active_minus1 + 1
496     int num_ref_idx_l1_default_active; ///< num_ref_idx_l1_default_active_minus1 + 1
497     int pic_init_qp_minus26;
498
499     uint8_t constrained_intra_pred_flag;
500     uint8_t transform_skip_enabled_flag;
501
502     uint8_t cu_qp_delta_enabled_flag;
503     int diff_cu_qp_delta_depth;
504
505     int cb_qp_offset;
506     int cr_qp_offset;
507     uint8_t pic_slice_level_chroma_qp_offsets_present_flag;
508     uint8_t weighted_pred_flag;
509     uint8_t weighted_bipred_flag;
510     uint8_t output_flag_present_flag;
511     uint8_t transquant_bypass_enable_flag;
512
513     uint8_t dependent_slice_segments_enabled_flag;
514     uint8_t tiles_enabled_flag;
515     uint8_t entropy_coding_sync_enabled_flag;
516
517     int num_tile_columns;   ///< num_tile_columns_minus1 + 1
518     int num_tile_rows;      ///< num_tile_rows_minus1 + 1
519     uint8_t uniform_spacing_flag;
520     uint8_t loop_filter_across_tiles_enabled_flag;
521
522     uint8_t seq_loop_filter_across_slices_enabled_flag;
523
524     uint8_t deblocking_filter_control_present_flag;
525     uint8_t deblocking_filter_override_enabled_flag;
526     uint8_t disable_dbf;
527     int beta_offset;    ///< beta_offset_div2 * 2
528     int tc_offset;      ///< tc_offset_div2 * 2
529
530     uint8_t scaling_list_data_present_flag;
531     ScalingList scaling_list;
532
533     uint8_t lists_modification_present_flag;
534     int log2_parallel_merge_level; ///< log2_parallel_merge_level_minus2 + 2
535     int num_extra_slice_header_bits;
536     uint8_t slice_header_extension_present_flag;
537     uint8_t log2_max_transform_skip_block_size;
538     uint8_t cross_component_prediction_enabled_flag;
539     uint8_t chroma_qp_offset_list_enabled_flag;
540     uint8_t diff_cu_chroma_qp_offset_depth;
541     uint8_t chroma_qp_offset_list_len_minus1;
542     int8_t  cb_qp_offset_list[5];
543     int8_t  cr_qp_offset_list[5];
544     uint8_t log2_sao_offset_scale_luma;
545     uint8_t log2_sao_offset_scale_chroma;
546
547     // Inferred parameters
548     unsigned int *column_width;  ///< ColumnWidth
549     unsigned int *row_height;    ///< RowHeight
550     unsigned int *col_bd;        ///< ColBd
551     unsigned int *row_bd;        ///< RowBd
552     int *col_idxX;
553
554     int *ctb_addr_rs_to_ts; ///< CtbAddrRSToTS
555     int *ctb_addr_ts_to_rs; ///< CtbAddrTSToRS
556     int *tile_id;           ///< TileId
557     int *tile_pos_rs;       ///< TilePosRS
558     int *min_tb_addr_zs;    ///< MinTbAddrZS
559     int *min_tb_addr_zs_tab;///< MinTbAddrZS
560 } HEVCPPS;
561
562 typedef struct HEVCParamSets {
563     AVBufferRef *vps_list[MAX_VPS_COUNT];
564     AVBufferRef *sps_list[MAX_SPS_COUNT];
565     AVBufferRef *pps_list[MAX_PPS_COUNT];
566
567     /* currently active parameter sets */
568     const HEVCVPS *vps;
569     const HEVCSPS *sps;
570     const HEVCPPS *pps;
571 } HEVCParamSets;
572
573 typedef struct SliceHeader {
574     unsigned int pps_id;
575
576     ///< address (in raster order) of the first block in the current slice segment
577     unsigned int   slice_segment_addr;
578     ///< address (in raster order) of the first block in the current slice
579     unsigned int   slice_addr;
580
581     enum SliceType slice_type;
582
583     int pic_order_cnt_lsb;
584
585     uint8_t first_slice_in_pic_flag;
586     uint8_t dependent_slice_segment_flag;
587     uint8_t pic_output_flag;
588     uint8_t colour_plane_id;
589
590     ///< RPS coded in the slice header itself is stored here
591     int short_term_ref_pic_set_sps_flag;
592     int short_term_ref_pic_set_size;
593     ShortTermRPS slice_rps;
594     const ShortTermRPS *short_term_rps;
595     int long_term_ref_pic_set_size;
596     LongTermRPS long_term_rps;
597     unsigned int list_entry_lx[2][32];
598
599     uint8_t rpl_modification_flag[2];
600     uint8_t no_output_of_prior_pics_flag;
601     uint8_t slice_temporal_mvp_enabled_flag;
602
603     unsigned int nb_refs[2];
604
605     uint8_t slice_sample_adaptive_offset_flag[3];
606     uint8_t mvd_l1_zero_flag;
607
608     uint8_t cabac_init_flag;
609     uint8_t disable_deblocking_filter_flag; ///< slice_header_disable_deblocking_filter_flag
610     uint8_t slice_loop_filter_across_slices_enabled_flag;
611     uint8_t collocated_list;
612
613     unsigned int collocated_ref_idx;
614
615     int slice_qp_delta;
616     int slice_cb_qp_offset;
617     int slice_cr_qp_offset;
618
619     uint8_t cu_chroma_qp_offset_enabled_flag;
620
621     int beta_offset;    ///< beta_offset_div2 * 2
622     int tc_offset;      ///< tc_offset_div2 * 2
623
624     unsigned int max_num_merge_cand; ///< 5 - 5_minus_max_num_merge_cand
625
626     unsigned *entry_point_offset;
627     int * offset;
628     int * size;
629     int num_entry_point_offsets;
630
631     int8_t slice_qp;
632
633     uint8_t luma_log2_weight_denom;
634     int16_t chroma_log2_weight_denom;
635
636     int16_t luma_weight_l0[16];
637     int16_t chroma_weight_l0[16][2];
638     int16_t chroma_weight_l1[16][2];
639     int16_t luma_weight_l1[16];
640
641     int16_t luma_offset_l0[16];
642     int16_t chroma_offset_l0[16][2];
643
644     int16_t luma_offset_l1[16];
645     int16_t chroma_offset_l1[16][2];
646
647     int slice_ctb_addr_rs;
648 } SliceHeader;
649
650 typedef struct CodingUnit {
651     int x;
652     int y;
653
654     enum PredMode pred_mode;    ///< PredMode
655     enum PartMode part_mode;    ///< PartMode
656
657     // Inferred parameters
658     uint8_t intra_split_flag;   ///< IntraSplitFlag
659     uint8_t max_trafo_depth;    ///< MaxTrafoDepth
660     uint8_t cu_transquant_bypass_flag;
661 } CodingUnit;
662
663 typedef struct Mv {
664     int16_t x;  ///< horizontal component of motion vector
665     int16_t y;  ///< vertical component of motion vector
666 } Mv;
667
668 typedef struct MvField {
669     DECLARE_ALIGNED(4, Mv, mv)[2];
670     int8_t ref_idx[2];
671     int8_t pred_flag;
672 } MvField;
673
674 typedef struct NeighbourAvailable {
675     int cand_bottom_left;
676     int cand_left;
677     int cand_up;
678     int cand_up_left;
679     int cand_up_right;
680     int cand_up_right_sap;
681 } NeighbourAvailable;
682
683 typedef struct PredictionUnit {
684     int mpm_idx;
685     int rem_intra_luma_pred_mode;
686     uint8_t intra_pred_mode[4];
687     Mv mvd;
688     uint8_t merge_flag;
689     uint8_t intra_pred_mode_c[4];
690     uint8_t chroma_mode_c[4];
691 } PredictionUnit;
692
693 typedef struct TransformUnit {
694     int cu_qp_delta;
695
696     int res_scale_val;
697
698     // Inferred parameters;
699     int intra_pred_mode;
700     int intra_pred_mode_c;
701     int chroma_mode_c;
702     uint8_t is_cu_qp_delta_coded;
703     uint8_t is_cu_chroma_qp_offset_coded;
704     int8_t  cu_qp_offset_cb;
705     int8_t  cu_qp_offset_cr;
706     uint8_t cross_pf;
707 } TransformUnit;
708
709 typedef struct DBParams {
710     int beta_offset;
711     int tc_offset;
712 } DBParams;
713
714 #define HEVC_FRAME_FLAG_OUTPUT    (1 << 0)
715 #define HEVC_FRAME_FLAG_SHORT_REF (1 << 1)
716 #define HEVC_FRAME_FLAG_LONG_REF  (1 << 2)
717 #define HEVC_FRAME_FLAG_BUMPING   (1 << 3)
718
719 typedef struct HEVCFrame {
720     AVFrame *frame;
721     ThreadFrame tf;
722     MvField *tab_mvf;
723     RefPicList *refPicList;
724     RefPicListTab **rpl_tab;
725     int ctb_count;
726     int poc;
727     struct HEVCFrame *collocated_ref;
728
729     HEVCWindow window;
730
731     AVBufferRef *tab_mvf_buf;
732     AVBufferRef *rpl_tab_buf;
733     AVBufferRef *rpl_buf;
734
735     AVBufferRef *hwaccel_priv_buf;
736     void *hwaccel_picture_private;
737
738     /**
739      * A sequence counter, so that old frames are output first
740      * after a POC reset
741      */
742     uint16_t sequence;
743
744     /**
745      * A combination of HEVC_FRAME_FLAG_*
746      */
747     uint8_t flags;
748 } HEVCFrame;
749
750 typedef struct HEVCLocalContext {
751     uint8_t cabac_state[HEVC_CONTEXTS];
752
753     uint8_t stat_coeff[4];
754
755     uint8_t first_qp_group;
756
757     GetBitContext gb;
758     CABACContext cc;
759
760     int8_t qp_y;
761     int8_t curr_qp_y;
762
763     int qPy_pred;
764
765     TransformUnit tu;
766
767     uint8_t ctb_left_flag;
768     uint8_t ctb_up_flag;
769     uint8_t ctb_up_right_flag;
770     uint8_t ctb_up_left_flag;
771     int     end_of_tiles_x;
772     int     end_of_tiles_y;
773     /* +7 is for subpixel interpolation, *2 for high bit depths */
774     DECLARE_ALIGNED(32, uint8_t, edge_emu_buffer)[(MAX_PB_SIZE + 7) * EDGE_EMU_BUFFER_STRIDE * 2];
775     /* The extended size between the new edge emu buffer is abused by SAO */
776     DECLARE_ALIGNED(32, uint8_t, edge_emu_buffer2)[(MAX_PB_SIZE + 7) * EDGE_EMU_BUFFER_STRIDE * 2];
777     DECLARE_ALIGNED(32, int16_t, tmp [MAX_PB_SIZE * MAX_PB_SIZE]);
778
779     int ct_depth;
780     CodingUnit cu;
781     PredictionUnit pu;
782     NeighbourAvailable na;
783
784 #define BOUNDARY_LEFT_SLICE     (1 << 0)
785 #define BOUNDARY_LEFT_TILE      (1 << 1)
786 #define BOUNDARY_UPPER_SLICE    (1 << 2)
787 #define BOUNDARY_UPPER_TILE     (1 << 3)
788     /* properties of the boundary of the current CTB for the purposes
789      * of the deblocking filter */
790     int boundary_flags;
791 } HEVCLocalContext;
792
793 typedef struct HEVCContext {
794     const AVClass *c;  // needed by private avoptions
795     AVCodecContext *avctx;
796
797     struct HEVCContext  *sList[MAX_NB_THREADS];
798
799     HEVCLocalContext    *HEVClcList[MAX_NB_THREADS];
800     HEVCLocalContext    *HEVClc;
801
802     uint8_t             threads_type;
803     uint8_t             threads_number;
804
805     int                 width;
806     int                 height;
807
808     uint8_t *cabac_state;
809
810     /** 1 if the independent slice segment header was successfully parsed */
811     uint8_t slice_initialized;
812
813     AVFrame *frame;
814     AVFrame *output_frame;
815     uint8_t *sao_pixel_buffer_h[3];
816     uint8_t *sao_pixel_buffer_v[3];
817
818     HEVCParamSets ps;
819
820     AVBufferPool *tab_mvf_pool;
821     AVBufferPool *rpl_tab_pool;
822
823     ///< candidate references for the current frame
824     RefPicList rps[5];
825
826     SliceHeader sh;
827     SAOParams *sao;
828     DBParams *deblock;
829     enum NALUnitType nal_unit_type;
830     int temporal_id;  ///< temporal_id_plus1 - 1
831     HEVCFrame *ref;
832     HEVCFrame DPB[32];
833     int poc;
834     int pocTid0;
835     int slice_idx; ///< number of the slice being currently decoded
836     int eos;       ///< current packet contains an EOS/EOB NAL
837     int last_eos;  ///< last packet contains an EOS/EOB NAL
838     int max_ra;
839     int bs_width;
840     int bs_height;
841
842     int is_decoded;
843     int no_rasl_output_flag;
844
845     HEVCPredContext hpc;
846     HEVCDSPContext hevcdsp;
847     VideoDSPContext vdsp;
848     BswapDSPContext bdsp;
849     int8_t *qp_y_tab;
850     uint8_t *horizontal_bs;
851     uint8_t *vertical_bs;
852
853     int32_t *tab_slice_address;
854
855     //  CU
856     uint8_t *skip_flag;
857     uint8_t *tab_ct_depth;
858     // PU
859     uint8_t *tab_ipm;
860
861     uint8_t *cbf_luma; // cbf_luma of colocated TU
862     uint8_t *is_pcm;
863
864     // CTB-level flags affecting loop filter operation
865     uint8_t *filter_slice_edges;
866
867     /** used on BE to byteswap the lines for checksumming */
868     uint8_t *checksum_buf;
869     int      checksum_buf_size;
870
871     /**
872      * Sequence counters for decoded and output frames, so that old
873      * frames are output first after a POC reset
874      */
875     uint16_t seq_decode;
876     uint16_t seq_output;
877
878     int enable_parallel_tiles;
879     int wpp_err;
880
881     const uint8_t *data;
882
883     H2645Packet pkt;
884     // type of the first VCL NAL of the current frame
885     enum NALUnitType first_nal_type;
886
887     // for checking the frame checksums
888     struct AVMD5 *md5_ctx;
889     uint8_t       md5[3][16];
890     uint8_t is_md5;
891
892     uint8_t context_initialized;
893     uint8_t is_nalff;       ///< this flag is != 0 if bitstream is encapsulated
894                             ///< as a format defined in 14496-15
895     int apply_defdispwin;
896
897     int active_seq_parameter_set_id;
898
899     int nal_length_size;    ///< Number of bytes used for nal length (1, 2 or 4)
900     int nuh_layer_id;
901
902     /** frame packing arrangement variables */
903     int sei_frame_packing_present;
904     int frame_packing_arrangement_type;
905     int content_interpretation_type;
906     int quincunx_subsampling;
907
908     /** display orientation */
909     int sei_display_orientation_present;
910     int sei_anticlockwise_rotation;
911     int sei_hflip, sei_vflip;
912
913     int picture_struct;
914
915     uint8_t* a53_caption;
916     int a53_caption_size;
917
918     /** mastering display */
919     int sei_mastering_display_info_present;
920     uint16_t display_primaries[3][2];
921     uint16_t white_point[2];
922     uint32_t max_mastering_luminance;
923     uint32_t min_mastering_luminance;
924
925 } HEVCContext;
926
927 int ff_hevc_decode_short_term_rps(GetBitContext *gb, AVCodecContext *avctx,
928                                   ShortTermRPS *rps, const HEVCSPS *sps, int is_slice_header);
929
930 /**
931  * Parse the SPS from the bitstream into the provided HEVCSPS struct.
932  *
933  * @param sps_id the SPS id will be written here
934  * @param apply_defdispwin if set 1, the default display window from the VUI
935  *                         will be applied to the video dimensions
936  * @param vps_list if non-NULL, this function will validate that the SPS refers
937  *                 to an existing VPS
938  */
939 int ff_hevc_parse_sps(HEVCSPS *sps, GetBitContext *gb, unsigned int *sps_id,
940                       int apply_defdispwin, AVBufferRef **vps_list, AVCodecContext *avctx);
941
942 int ff_hevc_decode_nal_vps(GetBitContext *gb, AVCodecContext *avctx,
943                            HEVCParamSets *ps);
944 int ff_hevc_decode_nal_sps(GetBitContext *gb, AVCodecContext *avctx,
945                            HEVCParamSets *ps, int apply_defdispwin);
946 int ff_hevc_decode_nal_pps(GetBitContext *gb, AVCodecContext *avctx,
947                            HEVCParamSets *ps);
948 int ff_hevc_decode_nal_sei(HEVCContext *s);
949
950 /**
951  * Mark all frames in DPB as unused for reference.
952  */
953 void ff_hevc_clear_refs(HEVCContext *s);
954
955 /**
956  * Drop all frames currently in DPB.
957  */
958 void ff_hevc_flush_dpb(HEVCContext *s);
959
960 /**
961  * Compute POC of the current frame and return it.
962  */
963 int ff_hevc_compute_poc(HEVCContext *s, int poc_lsb);
964
965 RefPicList *ff_hevc_get_ref_list(HEVCContext *s, HEVCFrame *frame,
966                                  int x0, int y0);
967
968 /**
969  * Construct the reference picture sets for the current frame.
970  */
971 int ff_hevc_frame_rps(HEVCContext *s);
972
973 /**
974  * Construct the reference picture list(s) for the current slice.
975  */
976 int ff_hevc_slice_rpl(HEVCContext *s);
977
978 void ff_hevc_save_states(HEVCContext *s, int ctb_addr_ts);
979 void ff_hevc_cabac_init(HEVCContext *s, int ctb_addr_ts);
980 int ff_hevc_sao_merge_flag_decode(HEVCContext *s);
981 int ff_hevc_sao_type_idx_decode(HEVCContext *s);
982 int ff_hevc_sao_band_position_decode(HEVCContext *s);
983 int ff_hevc_sao_offset_abs_decode(HEVCContext *s);
984 int ff_hevc_sao_offset_sign_decode(HEVCContext *s);
985 int ff_hevc_sao_eo_class_decode(HEVCContext *s);
986 int ff_hevc_end_of_slice_flag_decode(HEVCContext *s);
987 int ff_hevc_cu_transquant_bypass_flag_decode(HEVCContext *s);
988 int ff_hevc_skip_flag_decode(HEVCContext *s, int x0, int y0,
989                              int x_cb, int y_cb);
990 int ff_hevc_pred_mode_decode(HEVCContext *s);
991 int ff_hevc_split_coding_unit_flag_decode(HEVCContext *s, int ct_depth,
992                                           int x0, int y0);
993 int ff_hevc_part_mode_decode(HEVCContext *s, int log2_cb_size);
994 int ff_hevc_pcm_flag_decode(HEVCContext *s);
995 int ff_hevc_prev_intra_luma_pred_flag_decode(HEVCContext *s);
996 int ff_hevc_mpm_idx_decode(HEVCContext *s);
997 int ff_hevc_rem_intra_luma_pred_mode_decode(HEVCContext *s);
998 int ff_hevc_intra_chroma_pred_mode_decode(HEVCContext *s);
999 int ff_hevc_merge_idx_decode(HEVCContext *s);
1000 int ff_hevc_merge_flag_decode(HEVCContext *s);
1001 int ff_hevc_inter_pred_idc_decode(HEVCContext *s, int nPbW, int nPbH);
1002 int ff_hevc_ref_idx_lx_decode(HEVCContext *s, int num_ref_idx_lx);
1003 int ff_hevc_mvp_lx_flag_decode(HEVCContext *s);
1004 int ff_hevc_no_residual_syntax_flag_decode(HEVCContext *s);
1005 int ff_hevc_split_transform_flag_decode(HEVCContext *s, int log2_trafo_size);
1006 int ff_hevc_cbf_cb_cr_decode(HEVCContext *s, int trafo_depth);
1007 int ff_hevc_cbf_luma_decode(HEVCContext *s, int trafo_depth);
1008 int ff_hevc_log2_res_scale_abs(HEVCContext *s, int idx);
1009 int ff_hevc_res_scale_sign_flag(HEVCContext *s, int idx);
1010
1011 /**
1012  * Get the number of candidate references for the current frame.
1013  */
1014 int ff_hevc_frame_nb_refs(HEVCContext *s);
1015
1016 int ff_hevc_set_new_ref(HEVCContext *s, AVFrame **frame, int poc);
1017
1018 /**
1019  * Find next frame in output order and put a reference to it in frame.
1020  * @return 1 if a frame was output, 0 otherwise
1021  */
1022 int ff_hevc_output_frame(HEVCContext *s, AVFrame *frame, int flush);
1023
1024 void ff_hevc_bump_frame(HEVCContext *s);
1025
1026 void ff_hevc_unref_frame(HEVCContext *s, HEVCFrame *frame, int flags);
1027
1028 void ff_hevc_set_neighbour_available(HEVCContext *s, int x0, int y0,
1029                                      int nPbW, int nPbH);
1030 void ff_hevc_luma_mv_merge_mode(HEVCContext *s, int x0, int y0,
1031                                 int nPbW, int nPbH, int log2_cb_size,
1032                                 int part_idx, int merge_idx, MvField *mv);
1033 void ff_hevc_luma_mv_mvp_mode(HEVCContext *s, int x0, int y0,
1034                               int nPbW, int nPbH, int log2_cb_size,
1035                               int part_idx, int merge_idx,
1036                               MvField *mv, int mvp_lx_flag, int LX);
1037 void ff_hevc_set_qPy(HEVCContext *s, int xBase, int yBase,
1038                      int log2_cb_size);
1039 void ff_hevc_deblocking_boundary_strengths(HEVCContext *s, int x0, int y0,
1040                                            int log2_trafo_size);
1041 int ff_hevc_cu_qp_delta_sign_flag(HEVCContext *s);
1042 int ff_hevc_cu_qp_delta_abs(HEVCContext *s);
1043 int ff_hevc_cu_chroma_qp_offset_flag(HEVCContext *s);
1044 int ff_hevc_cu_chroma_qp_offset_idx(HEVCContext *s);
1045 void ff_hevc_hls_filter(HEVCContext *s, int x, int y, int ctb_size);
1046 void ff_hevc_hls_filters(HEVCContext *s, int x_ctb, int y_ctb, int ctb_size);
1047 void ff_hevc_hls_residual_coding(HEVCContext *s, int x0, int y0,
1048                                  int log2_trafo_size, enum ScanType scan_idx,
1049                                  int c_idx);
1050
1051 void ff_hevc_hls_mvd_coding(HEVCContext *s, int x0, int y0, int log2_cb_size);
1052
1053
1054 int ff_hevc_encode_nal_vps(HEVCVPS *vps, unsigned int id,
1055                            uint8_t *buf, int buf_size);
1056
1057 /**
1058  * Reset SEI values that are stored on the Context.
1059  * e.g. Caption data that was extracted during NAL
1060  * parsing.
1061  *
1062  * @param s HEVCContext.
1063  */
1064 void ff_hevc_reset_sei(HEVCContext *s);
1065
1066 extern const uint8_t ff_hevc_qpel_extra_before[4];
1067 extern const uint8_t ff_hevc_qpel_extra_after[4];
1068 extern const uint8_t ff_hevc_qpel_extra[4];
1069
1070 extern const uint8_t ff_hevc_diag_scan4x4_x[16];
1071 extern const uint8_t ff_hevc_diag_scan4x4_y[16];
1072 extern const uint8_t ff_hevc_diag_scan8x8_x[64];
1073 extern const uint8_t ff_hevc_diag_scan8x8_y[64];
1074
1075 #endif /* AVCODEC_HEVC_H */