]> git.sesse.net Git - ffmpeg/blob - libavcodec/hevc.h
Merge commit '59c70227405c214b29971e6272f3a3ff6fcce3d0'
[ffmpeg] / libavcodec / hevc.h
1 /*
2  * HEVC video decoder
3  *
4  * Copyright (C) 2012 - 2013 Guillaume Martres
5  *
6  * This file is part of FFmpeg.
7  *
8  * FFmpeg is free software; you can redistribute it and/or
9  * modify it under the terms of the GNU Lesser General Public
10  * License as published by the Free Software Foundation; either
11  * version 2.1 of the License, or (at your option) any later version.
12  *
13  * FFmpeg is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16  * Lesser General Public License for more details.
17  *
18  * You should have received a copy of the GNU Lesser General Public
19  * License along with FFmpeg; if not, write to the Free Software
20  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
21  */
22
23 #ifndef AVCODEC_HEVC_H
24 #define AVCODEC_HEVC_H
25
26 #include "libavutil/buffer.h"
27 #include "libavutil/md5.h"
28
29 #include "avcodec.h"
30 #include "bswapdsp.h"
31 #include "cabac.h"
32 #include "get_bits.h"
33 #include "hevcpred.h"
34 #include "h2645_parse.h"
35 #include "hevcdsp.h"
36 #include "internal.h"
37 #include "thread.h"
38 #include "videodsp.h"
39
40 #define MAX_DPB_SIZE 16 // A.4.1
41 #define MAX_REFS 16
42
43 #define MAX_NB_THREADS 16
44 #define SHIFT_CTB_WPP 2
45
46 /**
47  * 7.4.2.1
48  */
49 #define MAX_SUB_LAYERS 7
50 #define MAX_VPS_COUNT 16
51 #define MAX_SPS_COUNT 32
52 #define MAX_PPS_COUNT 256
53 #define MAX_SHORT_TERM_RPS_COUNT 64
54 #define MAX_CU_SIZE 128
55
56 //TODO: check if this is really the maximum
57 #define MAX_TRANSFORM_DEPTH 5
58
59 #define MAX_TB_SIZE 32
60 #define MAX_LOG2_CTB_SIZE 6
61 #define MAX_QP 51
62 #define DEFAULT_INTRA_TC_OFFSET 2
63
64 #define HEVC_CONTEXTS 199
65
66 #define MRG_MAX_NUM_CANDS     5
67
68 #define L0 0
69 #define L1 1
70
71 #define EPEL_EXTRA_BEFORE 1
72 #define EPEL_EXTRA_AFTER  2
73 #define EPEL_EXTRA        3
74 #define QPEL_EXTRA_BEFORE 3
75 #define QPEL_EXTRA_AFTER  4
76 #define QPEL_EXTRA        7
77
78 #define EDGE_EMU_BUFFER_STRIDE 80
79
80 /**
81  * Value of the luma sample at position (x, y) in the 2D array tab.
82  */
83 #define SAMPLE(tab, x, y) ((tab)[(y) * s->sps->width + (x)])
84 #define SAMPLE_CTB(tab, x, y) ((tab)[(y) * min_cb_width + (x)])
85
86 #define IS_IDR(s) ((s)->nal_unit_type == NAL_IDR_W_RADL || (s)->nal_unit_type == NAL_IDR_N_LP)
87 #define IS_BLA(s) ((s)->nal_unit_type == NAL_BLA_W_RADL || (s)->nal_unit_type == NAL_BLA_W_LP || \
88                    (s)->nal_unit_type == NAL_BLA_N_LP)
89 #define IS_IRAP(s) ((s)->nal_unit_type >= 16 && (s)->nal_unit_type <= 23)
90
91 /**
92  * Table 7-3: NAL unit type codes
93  */
94 enum NALUnitType {
95     NAL_TRAIL_N    = 0,
96     NAL_TRAIL_R    = 1,
97     NAL_TSA_N      = 2,
98     NAL_TSA_R      = 3,
99     NAL_STSA_N     = 4,
100     NAL_STSA_R     = 5,
101     NAL_RADL_N     = 6,
102     NAL_RADL_R     = 7,
103     NAL_RASL_N     = 8,
104     NAL_RASL_R     = 9,
105     NAL_BLA_W_LP   = 16,
106     NAL_BLA_W_RADL = 17,
107     NAL_BLA_N_LP   = 18,
108     NAL_IDR_W_RADL = 19,
109     NAL_IDR_N_LP   = 20,
110     NAL_CRA_NUT    = 21,
111     NAL_VPS        = 32,
112     NAL_SPS        = 33,
113     NAL_PPS        = 34,
114     NAL_AUD        = 35,
115     NAL_EOS_NUT    = 36,
116     NAL_EOB_NUT    = 37,
117     NAL_FD_NUT     = 38,
118     NAL_SEI_PREFIX = 39,
119     NAL_SEI_SUFFIX = 40,
120 };
121
122 enum RPSType {
123     ST_CURR_BEF = 0,
124     ST_CURR_AFT,
125     ST_FOLL,
126     LT_CURR,
127     LT_FOLL,
128     NB_RPS_TYPE,
129 };
130
131 enum SliceType {
132     B_SLICE = 0,
133     P_SLICE = 1,
134     I_SLICE = 2,
135 };
136
137 enum SyntaxElement {
138     SAO_MERGE_FLAG = 0,
139     SAO_TYPE_IDX,
140     SAO_EO_CLASS,
141     SAO_BAND_POSITION,
142     SAO_OFFSET_ABS,
143     SAO_OFFSET_SIGN,
144     END_OF_SLICE_FLAG,
145     SPLIT_CODING_UNIT_FLAG,
146     CU_TRANSQUANT_BYPASS_FLAG,
147     SKIP_FLAG,
148     CU_QP_DELTA,
149     PRED_MODE_FLAG,
150     PART_MODE,
151     PCM_FLAG,
152     PREV_INTRA_LUMA_PRED_FLAG,
153     MPM_IDX,
154     REM_INTRA_LUMA_PRED_MODE,
155     INTRA_CHROMA_PRED_MODE,
156     MERGE_FLAG,
157     MERGE_IDX,
158     INTER_PRED_IDC,
159     REF_IDX_L0,
160     REF_IDX_L1,
161     ABS_MVD_GREATER0_FLAG,
162     ABS_MVD_GREATER1_FLAG,
163     ABS_MVD_MINUS2,
164     MVD_SIGN_FLAG,
165     MVP_LX_FLAG,
166     NO_RESIDUAL_DATA_FLAG,
167     SPLIT_TRANSFORM_FLAG,
168     CBF_LUMA,
169     CBF_CB_CR,
170     TRANSFORM_SKIP_FLAG,
171     EXPLICIT_RDPCM_FLAG,
172     EXPLICIT_RDPCM_DIR_FLAG,
173     LAST_SIGNIFICANT_COEFF_X_PREFIX,
174     LAST_SIGNIFICANT_COEFF_Y_PREFIX,
175     LAST_SIGNIFICANT_COEFF_X_SUFFIX,
176     LAST_SIGNIFICANT_COEFF_Y_SUFFIX,
177     SIGNIFICANT_COEFF_GROUP_FLAG,
178     SIGNIFICANT_COEFF_FLAG,
179     COEFF_ABS_LEVEL_GREATER1_FLAG,
180     COEFF_ABS_LEVEL_GREATER2_FLAG,
181     COEFF_ABS_LEVEL_REMAINING,
182     COEFF_SIGN_FLAG,
183     LOG2_RES_SCALE_ABS,
184     RES_SCALE_SIGN_FLAG,
185     CU_CHROMA_QP_OFFSET_FLAG,
186     CU_CHROMA_QP_OFFSET_IDX,
187 };
188
189 enum PartMode {
190     PART_2Nx2N = 0,
191     PART_2NxN  = 1,
192     PART_Nx2N  = 2,
193     PART_NxN   = 3,
194     PART_2NxnU = 4,
195     PART_2NxnD = 5,
196     PART_nLx2N = 6,
197     PART_nRx2N = 7,
198 };
199
200 enum PredMode {
201     MODE_INTER = 0,
202     MODE_INTRA,
203     MODE_SKIP,
204 };
205
206 enum InterPredIdc {
207     PRED_L0 = 0,
208     PRED_L1,
209     PRED_BI,
210 };
211
212 enum PredFlag {
213     PF_INTRA = 0,
214     PF_L0,
215     PF_L1,
216     PF_BI,
217 };
218
219 enum IntraPredMode {
220     INTRA_PLANAR = 0,
221     INTRA_DC,
222     INTRA_ANGULAR_2,
223     INTRA_ANGULAR_3,
224     INTRA_ANGULAR_4,
225     INTRA_ANGULAR_5,
226     INTRA_ANGULAR_6,
227     INTRA_ANGULAR_7,
228     INTRA_ANGULAR_8,
229     INTRA_ANGULAR_9,
230     INTRA_ANGULAR_10,
231     INTRA_ANGULAR_11,
232     INTRA_ANGULAR_12,
233     INTRA_ANGULAR_13,
234     INTRA_ANGULAR_14,
235     INTRA_ANGULAR_15,
236     INTRA_ANGULAR_16,
237     INTRA_ANGULAR_17,
238     INTRA_ANGULAR_18,
239     INTRA_ANGULAR_19,
240     INTRA_ANGULAR_20,
241     INTRA_ANGULAR_21,
242     INTRA_ANGULAR_22,
243     INTRA_ANGULAR_23,
244     INTRA_ANGULAR_24,
245     INTRA_ANGULAR_25,
246     INTRA_ANGULAR_26,
247     INTRA_ANGULAR_27,
248     INTRA_ANGULAR_28,
249     INTRA_ANGULAR_29,
250     INTRA_ANGULAR_30,
251     INTRA_ANGULAR_31,
252     INTRA_ANGULAR_32,
253     INTRA_ANGULAR_33,
254     INTRA_ANGULAR_34,
255 };
256
257 enum SAOType {
258     SAO_NOT_APPLIED = 0,
259     SAO_BAND,
260     SAO_EDGE,
261     SAO_APPLIED
262 };
263
264 enum SAOEOClass {
265     SAO_EO_HORIZ = 0,
266     SAO_EO_VERT,
267     SAO_EO_135D,
268     SAO_EO_45D,
269 };
270
271 enum ScanType {
272     SCAN_DIAG = 0,
273     SCAN_HORIZ,
274     SCAN_VERT,
275 };
276
277 typedef struct ShortTermRPS {
278     unsigned int num_negative_pics;
279     int num_delta_pocs;
280     int rps_idx_num_delta_pocs;
281     int32_t delta_poc[32];
282     uint8_t used[32];
283 } ShortTermRPS;
284
285 typedef struct LongTermRPS {
286     int     poc[32];
287     uint8_t used[32];
288     uint8_t nb_refs;
289 } LongTermRPS;
290
291 typedef struct RefPicList {
292     struct HEVCFrame *ref[MAX_REFS];
293     int list[MAX_REFS];
294     int isLongTerm[MAX_REFS];
295     int nb_refs;
296 } RefPicList;
297
298 typedef struct RefPicListTab {
299     RefPicList refPicList[2];
300 } RefPicListTab;
301
302 typedef struct HEVCWindow {
303     unsigned int left_offset;
304     unsigned int right_offset;
305     unsigned int top_offset;
306     unsigned int bottom_offset;
307 } HEVCWindow;
308
309 typedef struct VUI {
310     AVRational sar;
311
312     int overscan_info_present_flag;
313     int overscan_appropriate_flag;
314
315     int video_signal_type_present_flag;
316     int video_format;
317     int video_full_range_flag;
318     int colour_description_present_flag;
319     uint8_t colour_primaries;
320     uint8_t transfer_characteristic;
321     uint8_t matrix_coeffs;
322
323     int chroma_loc_info_present_flag;
324     int chroma_sample_loc_type_top_field;
325     int chroma_sample_loc_type_bottom_field;
326     int neutra_chroma_indication_flag;
327
328     int field_seq_flag;
329     int frame_field_info_present_flag;
330
331     int default_display_window_flag;
332     HEVCWindow def_disp_win;
333
334     int vui_timing_info_present_flag;
335     uint32_t vui_num_units_in_tick;
336     uint32_t vui_time_scale;
337     int vui_poc_proportional_to_timing_flag;
338     int vui_num_ticks_poc_diff_one_minus1;
339     int vui_hrd_parameters_present_flag;
340
341     int bitstream_restriction_flag;
342     int tiles_fixed_structure_flag;
343     int motion_vectors_over_pic_boundaries_flag;
344     int restricted_ref_pic_lists_flag;
345     int min_spatial_segmentation_idc;
346     int max_bytes_per_pic_denom;
347     int max_bits_per_min_cu_denom;
348     int log2_max_mv_length_horizontal;
349     int log2_max_mv_length_vertical;
350 } VUI;
351
352 typedef struct PTLCommon {
353     uint8_t profile_space;
354     uint8_t tier_flag;
355     uint8_t profile_idc;
356     uint8_t profile_compatibility_flag[32];
357     uint8_t level_idc;
358     uint8_t progressive_source_flag;
359     uint8_t interlaced_source_flag;
360     uint8_t non_packed_constraint_flag;
361     uint8_t frame_only_constraint_flag;
362 } PTLCommon;
363
364 typedef struct PTL {
365     PTLCommon general_ptl;
366     PTLCommon sub_layer_ptl[MAX_SUB_LAYERS];
367
368     uint8_t sub_layer_profile_present_flag[MAX_SUB_LAYERS];
369     uint8_t sub_layer_level_present_flag[MAX_SUB_LAYERS];
370 } PTL;
371
372 typedef struct HEVCVPS {
373     uint8_t vps_temporal_id_nesting_flag;
374     int vps_max_layers;
375     int vps_max_sub_layers; ///< vps_max_temporal_layers_minus1 + 1
376
377     PTL ptl;
378     int vps_sub_layer_ordering_info_present_flag;
379     unsigned int vps_max_dec_pic_buffering[MAX_SUB_LAYERS];
380     unsigned int vps_num_reorder_pics[MAX_SUB_LAYERS];
381     unsigned int vps_max_latency_increase[MAX_SUB_LAYERS];
382     int vps_max_layer_id;
383     int vps_num_layer_sets; ///< vps_num_layer_sets_minus1 + 1
384     uint8_t vps_timing_info_present_flag;
385     uint32_t vps_num_units_in_tick;
386     uint32_t vps_time_scale;
387     uint8_t vps_poc_proportional_to_timing_flag;
388     int vps_num_ticks_poc_diff_one; ///< vps_num_ticks_poc_diff_one_minus1 + 1
389     int vps_num_hrd_parameters;
390
391     uint8_t data[4096];
392     int data_size;
393 } HEVCVPS;
394
395 typedef struct ScalingList {
396     /* This is a little wasteful, since sizeID 0 only needs 8 coeffs,
397      * and size ID 3 only has 2 arrays, not 6. */
398     uint8_t sl[4][6][64];
399     uint8_t sl_dc[2][6];
400 } ScalingList;
401
402 typedef struct HEVCSPS {
403     unsigned vps_id;
404     int chroma_format_idc;
405     uint8_t separate_colour_plane_flag;
406
407     ///< output (i.e. cropped) values
408     int output_width, output_height;
409     HEVCWindow output_window;
410
411     HEVCWindow pic_conf_win;
412
413     int bit_depth;
414     int pixel_shift;
415     enum AVPixelFormat pix_fmt;
416
417     unsigned int log2_max_poc_lsb;
418     int pcm_enabled_flag;
419
420     int max_sub_layers;
421     struct {
422         int max_dec_pic_buffering;
423         int num_reorder_pics;
424         int max_latency_increase;
425     } temporal_layer[MAX_SUB_LAYERS];
426
427     VUI vui;
428     PTL ptl;
429
430     uint8_t scaling_list_enable_flag;
431     ScalingList scaling_list;
432
433     unsigned int nb_st_rps;
434     ShortTermRPS st_rps[MAX_SHORT_TERM_RPS_COUNT];
435
436     uint8_t amp_enabled_flag;
437     uint8_t sao_enabled;
438
439     uint8_t long_term_ref_pics_present_flag;
440     uint16_t lt_ref_pic_poc_lsb_sps[32];
441     uint8_t used_by_curr_pic_lt_sps_flag[32];
442     uint8_t num_long_term_ref_pics_sps;
443
444     struct {
445         uint8_t bit_depth;
446         uint8_t bit_depth_chroma;
447         unsigned int log2_min_pcm_cb_size;
448         unsigned int log2_max_pcm_cb_size;
449         uint8_t loop_filter_disable_flag;
450     } pcm;
451     uint8_t sps_temporal_mvp_enabled_flag;
452     uint8_t sps_strong_intra_smoothing_enable_flag;
453
454     unsigned int log2_min_cb_size;
455     unsigned int log2_diff_max_min_coding_block_size;
456     unsigned int log2_min_tb_size;
457     unsigned int log2_max_trafo_size;
458     unsigned int log2_ctb_size;
459     unsigned int log2_min_pu_size;
460
461     int max_transform_hierarchy_depth_inter;
462     int max_transform_hierarchy_depth_intra;
463
464     int transform_skip_rotation_enabled_flag;
465     int transform_skip_context_enabled_flag;
466     int implicit_rdpcm_enabled_flag;
467     int explicit_rdpcm_enabled_flag;
468     int intra_smoothing_disabled_flag;
469     int persistent_rice_adaptation_enabled_flag;
470
471     ///< coded frame dimension in various units
472     int width;
473     int height;
474     int ctb_width;
475     int ctb_height;
476     int ctb_size;
477     int min_cb_width;
478     int min_cb_height;
479     int min_tb_width;
480     int min_tb_height;
481     int min_pu_width;
482     int min_pu_height;
483     int tb_mask;
484
485     int hshift[3];
486     int vshift[3];
487
488     int qp_bd_offset;
489
490     uint8_t data[4096];
491     int data_size;
492 } HEVCSPS;
493
494 typedef struct HEVCPPS {
495     unsigned int sps_id; ///< seq_parameter_set_id
496
497     uint8_t sign_data_hiding_flag;
498
499     uint8_t cabac_init_present_flag;
500
501     int num_ref_idx_l0_default_active; ///< num_ref_idx_l0_default_active_minus1 + 1
502     int num_ref_idx_l1_default_active; ///< num_ref_idx_l1_default_active_minus1 + 1
503     int pic_init_qp_minus26;
504
505     uint8_t constrained_intra_pred_flag;
506     uint8_t transform_skip_enabled_flag;
507
508     uint8_t cu_qp_delta_enabled_flag;
509     int diff_cu_qp_delta_depth;
510
511     int cb_qp_offset;
512     int cr_qp_offset;
513     uint8_t pic_slice_level_chroma_qp_offsets_present_flag;
514     uint8_t weighted_pred_flag;
515     uint8_t weighted_bipred_flag;
516     uint8_t output_flag_present_flag;
517     uint8_t transquant_bypass_enable_flag;
518
519     uint8_t dependent_slice_segments_enabled_flag;
520     uint8_t tiles_enabled_flag;
521     uint8_t entropy_coding_sync_enabled_flag;
522
523     int num_tile_columns;   ///< num_tile_columns_minus1 + 1
524     int num_tile_rows;      ///< num_tile_rows_minus1 + 1
525     uint8_t uniform_spacing_flag;
526     uint8_t loop_filter_across_tiles_enabled_flag;
527
528     uint8_t seq_loop_filter_across_slices_enabled_flag;
529
530     uint8_t deblocking_filter_control_present_flag;
531     uint8_t deblocking_filter_override_enabled_flag;
532     uint8_t disable_dbf;
533     int beta_offset;    ///< beta_offset_div2 * 2
534     int tc_offset;      ///< tc_offset_div2 * 2
535
536     uint8_t scaling_list_data_present_flag;
537     ScalingList scaling_list;
538
539     uint8_t lists_modification_present_flag;
540     int log2_parallel_merge_level; ///< log2_parallel_merge_level_minus2 + 2
541     int num_extra_slice_header_bits;
542     uint8_t slice_header_extension_present_flag;
543     uint8_t log2_max_transform_skip_block_size;
544     uint8_t cross_component_prediction_enabled_flag;
545     uint8_t chroma_qp_offset_list_enabled_flag;
546     uint8_t diff_cu_chroma_qp_offset_depth;
547     uint8_t chroma_qp_offset_list_len_minus1;
548     int8_t  cb_qp_offset_list[5];
549     int8_t  cr_qp_offset_list[5];
550     uint8_t log2_sao_offset_scale_luma;
551     uint8_t log2_sao_offset_scale_chroma;
552
553     // Inferred parameters
554     unsigned int *column_width;  ///< ColumnWidth
555     unsigned int *row_height;    ///< RowHeight
556     unsigned int *col_bd;        ///< ColBd
557     unsigned int *row_bd;        ///< RowBd
558     int *col_idxX;
559
560     int *ctb_addr_rs_to_ts; ///< CtbAddrRSToTS
561     int *ctb_addr_ts_to_rs; ///< CtbAddrTSToRS
562     int *tile_id;           ///< TileId
563     int *tile_pos_rs;       ///< TilePosRS
564     int *min_tb_addr_zs;    ///< MinTbAddrZS
565     int *min_tb_addr_zs_tab;///< MinTbAddrZS
566
567     uint8_t data[4096];
568     int data_size;
569 } HEVCPPS;
570
571 typedef struct HEVCParamSets {
572     AVBufferRef *vps_list[MAX_VPS_COUNT];
573     AVBufferRef *sps_list[MAX_SPS_COUNT];
574     AVBufferRef *pps_list[MAX_PPS_COUNT];
575
576     /* currently active parameter sets */
577     const HEVCVPS *vps;
578     const HEVCSPS *sps;
579     const HEVCPPS *pps;
580 } HEVCParamSets;
581
582 typedef struct SliceHeader {
583     unsigned int pps_id;
584
585     ///< address (in raster order) of the first block in the current slice segment
586     unsigned int   slice_segment_addr;
587     ///< address (in raster order) of the first block in the current slice
588     unsigned int   slice_addr;
589
590     enum SliceType slice_type;
591
592     int pic_order_cnt_lsb;
593
594     uint8_t first_slice_in_pic_flag;
595     uint8_t dependent_slice_segment_flag;
596     uint8_t pic_output_flag;
597     uint8_t colour_plane_id;
598
599     ///< RPS coded in the slice header itself is stored here
600     int short_term_ref_pic_set_sps_flag;
601     int short_term_ref_pic_set_size;
602     ShortTermRPS slice_rps;
603     const ShortTermRPS *short_term_rps;
604     int long_term_ref_pic_set_size;
605     LongTermRPS long_term_rps;
606     unsigned int list_entry_lx[2][32];
607
608     uint8_t rpl_modification_flag[2];
609     uint8_t no_output_of_prior_pics_flag;
610     uint8_t slice_temporal_mvp_enabled_flag;
611
612     unsigned int nb_refs[2];
613
614     uint8_t slice_sample_adaptive_offset_flag[3];
615     uint8_t mvd_l1_zero_flag;
616
617     uint8_t cabac_init_flag;
618     uint8_t disable_deblocking_filter_flag; ///< slice_header_disable_deblocking_filter_flag
619     uint8_t slice_loop_filter_across_slices_enabled_flag;
620     uint8_t collocated_list;
621
622     unsigned int collocated_ref_idx;
623
624     int slice_qp_delta;
625     int slice_cb_qp_offset;
626     int slice_cr_qp_offset;
627
628     uint8_t cu_chroma_qp_offset_enabled_flag;
629
630     int beta_offset;    ///< beta_offset_div2 * 2
631     int tc_offset;      ///< tc_offset_div2 * 2
632
633     unsigned int max_num_merge_cand; ///< 5 - 5_minus_max_num_merge_cand
634
635     unsigned *entry_point_offset;
636     int * offset;
637     int * size;
638     int num_entry_point_offsets;
639
640     int8_t slice_qp;
641
642     uint8_t luma_log2_weight_denom;
643     int16_t chroma_log2_weight_denom;
644
645     int16_t luma_weight_l0[16];
646     int16_t chroma_weight_l0[16][2];
647     int16_t chroma_weight_l1[16][2];
648     int16_t luma_weight_l1[16];
649
650     int16_t luma_offset_l0[16];
651     int16_t chroma_offset_l0[16][2];
652
653     int16_t luma_offset_l1[16];
654     int16_t chroma_offset_l1[16][2];
655
656     int slice_ctb_addr_rs;
657 } SliceHeader;
658
659 typedef struct CodingUnit {
660     int x;
661     int y;
662
663     enum PredMode pred_mode;    ///< PredMode
664     enum PartMode part_mode;    ///< PartMode
665
666     // Inferred parameters
667     uint8_t intra_split_flag;   ///< IntraSplitFlag
668     uint8_t max_trafo_depth;    ///< MaxTrafoDepth
669     uint8_t cu_transquant_bypass_flag;
670 } CodingUnit;
671
672 typedef struct Mv {
673     int16_t x;  ///< horizontal component of motion vector
674     int16_t y;  ///< vertical component of motion vector
675 } Mv;
676
677 typedef struct MvField {
678     DECLARE_ALIGNED(4, Mv, mv)[2];
679     int8_t ref_idx[2];
680     int8_t pred_flag;
681 } MvField;
682
683 typedef struct NeighbourAvailable {
684     int cand_bottom_left;
685     int cand_left;
686     int cand_up;
687     int cand_up_left;
688     int cand_up_right;
689     int cand_up_right_sap;
690 } NeighbourAvailable;
691
692 typedef struct PredictionUnit {
693     int mpm_idx;
694     int rem_intra_luma_pred_mode;
695     uint8_t intra_pred_mode[4];
696     Mv mvd;
697     uint8_t merge_flag;
698     uint8_t intra_pred_mode_c[4];
699     uint8_t chroma_mode_c[4];
700 } PredictionUnit;
701
702 typedef struct TransformUnit {
703     int cu_qp_delta;
704
705     int res_scale_val;
706
707     // Inferred parameters;
708     int intra_pred_mode;
709     int intra_pred_mode_c;
710     int chroma_mode_c;
711     uint8_t is_cu_qp_delta_coded;
712     uint8_t is_cu_chroma_qp_offset_coded;
713     int8_t  cu_qp_offset_cb;
714     int8_t  cu_qp_offset_cr;
715     uint8_t cross_pf;
716 } TransformUnit;
717
718 typedef struct DBParams {
719     int beta_offset;
720     int tc_offset;
721 } DBParams;
722
723 #define HEVC_FRAME_FLAG_OUTPUT    (1 << 0)
724 #define HEVC_FRAME_FLAG_SHORT_REF (1 << 1)
725 #define HEVC_FRAME_FLAG_LONG_REF  (1 << 2)
726 #define HEVC_FRAME_FLAG_BUMPING   (1 << 3)
727
728 typedef struct HEVCFrame {
729     AVFrame *frame;
730     ThreadFrame tf;
731     MvField *tab_mvf;
732     RefPicList *refPicList;
733     RefPicListTab **rpl_tab;
734     int ctb_count;
735     int poc;
736     struct HEVCFrame *collocated_ref;
737
738     HEVCWindow window;
739
740     AVBufferRef *tab_mvf_buf;
741     AVBufferRef *rpl_tab_buf;
742     AVBufferRef *rpl_buf;
743
744     AVBufferRef *hwaccel_priv_buf;
745     void *hwaccel_picture_private;
746
747     /**
748      * A sequence counter, so that old frames are output first
749      * after a POC reset
750      */
751     uint16_t sequence;
752
753     /**
754      * A combination of HEVC_FRAME_FLAG_*
755      */
756     uint8_t flags;
757 } HEVCFrame;
758
759 typedef struct HEVCLocalContext {
760     uint8_t cabac_state[HEVC_CONTEXTS];
761
762     uint8_t stat_coeff[4];
763
764     uint8_t first_qp_group;
765
766     GetBitContext gb;
767     CABACContext cc;
768
769     int8_t qp_y;
770     int8_t curr_qp_y;
771
772     int qPy_pred;
773
774     TransformUnit tu;
775
776     uint8_t ctb_left_flag;
777     uint8_t ctb_up_flag;
778     uint8_t ctb_up_right_flag;
779     uint8_t ctb_up_left_flag;
780     int     end_of_tiles_x;
781     int     end_of_tiles_y;
782     /* +7 is for subpixel interpolation, *2 for high bit depths */
783     DECLARE_ALIGNED(32, uint8_t, edge_emu_buffer)[(MAX_PB_SIZE + 7) * EDGE_EMU_BUFFER_STRIDE * 2];
784     /* The extended size between the new edge emu buffer is abused by SAO */
785     DECLARE_ALIGNED(32, uint8_t, edge_emu_buffer2)[(MAX_PB_SIZE + 7) * EDGE_EMU_BUFFER_STRIDE * 2];
786     DECLARE_ALIGNED(32, int16_t, tmp [MAX_PB_SIZE * MAX_PB_SIZE]);
787
788     int ct_depth;
789     CodingUnit cu;
790     PredictionUnit pu;
791     NeighbourAvailable na;
792
793 #define BOUNDARY_LEFT_SLICE     (1 << 0)
794 #define BOUNDARY_LEFT_TILE      (1 << 1)
795 #define BOUNDARY_UPPER_SLICE    (1 << 2)
796 #define BOUNDARY_UPPER_TILE     (1 << 3)
797     /* properties of the boundary of the current CTB for the purposes
798      * of the deblocking filter */
799     int boundary_flags;
800 } HEVCLocalContext;
801
802 typedef struct HEVCContext {
803     const AVClass *c;  // needed by private avoptions
804     AVCodecContext *avctx;
805
806     struct HEVCContext  *sList[MAX_NB_THREADS];
807
808     HEVCLocalContext    *HEVClcList[MAX_NB_THREADS];
809     HEVCLocalContext    *HEVClc;
810
811     uint8_t             threads_type;
812     uint8_t             threads_number;
813
814     int                 width;
815     int                 height;
816
817     uint8_t *cabac_state;
818
819     /** 1 if the independent slice segment header was successfully parsed */
820     uint8_t slice_initialized;
821
822     AVFrame *frame;
823     AVFrame *output_frame;
824     uint8_t *sao_pixel_buffer_h[3];
825     uint8_t *sao_pixel_buffer_v[3];
826
827     HEVCParamSets ps;
828
829     AVBufferPool *tab_mvf_pool;
830     AVBufferPool *rpl_tab_pool;
831
832     ///< candidate references for the current frame
833     RefPicList rps[5];
834
835     SliceHeader sh;
836     SAOParams *sao;
837     DBParams *deblock;
838     enum NALUnitType nal_unit_type;
839     int temporal_id;  ///< temporal_id_plus1 - 1
840     HEVCFrame *ref;
841     HEVCFrame DPB[32];
842     int poc;
843     int pocTid0;
844     int slice_idx; ///< number of the slice being currently decoded
845     int eos;       ///< current packet contains an EOS/EOB NAL
846     int last_eos;  ///< last packet contains an EOS/EOB NAL
847     int max_ra;
848     int bs_width;
849     int bs_height;
850
851     int is_decoded;
852     int no_rasl_output_flag;
853
854     HEVCPredContext hpc;
855     HEVCDSPContext hevcdsp;
856     VideoDSPContext vdsp;
857     BswapDSPContext bdsp;
858     int8_t *qp_y_tab;
859     uint8_t *horizontal_bs;
860     uint8_t *vertical_bs;
861
862     int32_t *tab_slice_address;
863
864     //  CU
865     uint8_t *skip_flag;
866     uint8_t *tab_ct_depth;
867     // PU
868     uint8_t *tab_ipm;
869
870     uint8_t *cbf_luma; // cbf_luma of colocated TU
871     uint8_t *is_pcm;
872
873     // CTB-level flags affecting loop filter operation
874     uint8_t *filter_slice_edges;
875
876     /** used on BE to byteswap the lines for checksumming */
877     uint8_t *checksum_buf;
878     int      checksum_buf_size;
879
880     /**
881      * Sequence counters for decoded and output frames, so that old
882      * frames are output first after a POC reset
883      */
884     uint16_t seq_decode;
885     uint16_t seq_output;
886
887     int enable_parallel_tiles;
888     int wpp_err;
889
890     const uint8_t *data;
891
892     H2645Packet pkt;
893     // type of the first VCL NAL of the current frame
894     enum NALUnitType first_nal_type;
895
896     // for checking the frame checksums
897     struct AVMD5 *md5_ctx;
898     uint8_t       md5[3][16];
899     uint8_t is_md5;
900
901     uint8_t context_initialized;
902     uint8_t is_nalff;       ///< this flag is != 0 if bitstream is encapsulated
903                             ///< as a format defined in 14496-15
904     int apply_defdispwin;
905
906     int active_seq_parameter_set_id;
907
908     int nal_length_size;    ///< Number of bytes used for nal length (1, 2 or 4)
909     int nuh_layer_id;
910
911     /** frame packing arrangement variables */
912     int sei_frame_packing_present;
913     int frame_packing_arrangement_type;
914     int content_interpretation_type;
915     int quincunx_subsampling;
916
917     /** display orientation */
918     int sei_display_orientation_present;
919     int sei_anticlockwise_rotation;
920     int sei_hflip, sei_vflip;
921
922     int picture_struct;
923
924     uint8_t* a53_caption;
925     int a53_caption_size;
926
927     /** mastering display */
928     int sei_mastering_display_info_present;
929     uint16_t display_primaries[3][2];
930     uint16_t white_point[2];
931     uint32_t max_mastering_luminance;
932     uint32_t min_mastering_luminance;
933
934 } HEVCContext;
935
936 int ff_hevc_decode_short_term_rps(GetBitContext *gb, AVCodecContext *avctx,
937                                   ShortTermRPS *rps, const HEVCSPS *sps, int is_slice_header);
938
939 /**
940  * Parse the SPS from the bitstream into the provided HEVCSPS struct.
941  *
942  * @param sps_id the SPS id will be written here
943  * @param apply_defdispwin if set 1, the default display window from the VUI
944  *                         will be applied to the video dimensions
945  * @param vps_list if non-NULL, this function will validate that the SPS refers
946  *                 to an existing VPS
947  */
948 int ff_hevc_parse_sps(HEVCSPS *sps, GetBitContext *gb, unsigned int *sps_id,
949                       int apply_defdispwin, AVBufferRef **vps_list, AVCodecContext *avctx);
950
951 int ff_hevc_decode_nal_vps(GetBitContext *gb, AVCodecContext *avctx,
952                            HEVCParamSets *ps);
953 int ff_hevc_decode_nal_sps(GetBitContext *gb, AVCodecContext *avctx,
954                            HEVCParamSets *ps, int apply_defdispwin);
955 int ff_hevc_decode_nal_pps(GetBitContext *gb, AVCodecContext *avctx,
956                            HEVCParamSets *ps);
957 int ff_hevc_decode_nal_sei(HEVCContext *s);
958
959 /**
960  * Mark all frames in DPB as unused for reference.
961  */
962 void ff_hevc_clear_refs(HEVCContext *s);
963
964 /**
965  * Drop all frames currently in DPB.
966  */
967 void ff_hevc_flush_dpb(HEVCContext *s);
968
969 /**
970  * Compute POC of the current frame and return it.
971  */
972 int ff_hevc_compute_poc(HEVCContext *s, int poc_lsb);
973
974 RefPicList *ff_hevc_get_ref_list(HEVCContext *s, HEVCFrame *frame,
975                                  int x0, int y0);
976
977 /**
978  * Construct the reference picture sets for the current frame.
979  */
980 int ff_hevc_frame_rps(HEVCContext *s);
981
982 /**
983  * Construct the reference picture list(s) for the current slice.
984  */
985 int ff_hevc_slice_rpl(HEVCContext *s);
986
987 void ff_hevc_save_states(HEVCContext *s, int ctb_addr_ts);
988 void ff_hevc_cabac_init(HEVCContext *s, int ctb_addr_ts);
989 int ff_hevc_sao_merge_flag_decode(HEVCContext *s);
990 int ff_hevc_sao_type_idx_decode(HEVCContext *s);
991 int ff_hevc_sao_band_position_decode(HEVCContext *s);
992 int ff_hevc_sao_offset_abs_decode(HEVCContext *s);
993 int ff_hevc_sao_offset_sign_decode(HEVCContext *s);
994 int ff_hevc_sao_eo_class_decode(HEVCContext *s);
995 int ff_hevc_end_of_slice_flag_decode(HEVCContext *s);
996 int ff_hevc_cu_transquant_bypass_flag_decode(HEVCContext *s);
997 int ff_hevc_skip_flag_decode(HEVCContext *s, int x0, int y0,
998                              int x_cb, int y_cb);
999 int ff_hevc_pred_mode_decode(HEVCContext *s);
1000 int ff_hevc_split_coding_unit_flag_decode(HEVCContext *s, int ct_depth,
1001                                           int x0, int y0);
1002 int ff_hevc_part_mode_decode(HEVCContext *s, int log2_cb_size);
1003 int ff_hevc_pcm_flag_decode(HEVCContext *s);
1004 int ff_hevc_prev_intra_luma_pred_flag_decode(HEVCContext *s);
1005 int ff_hevc_mpm_idx_decode(HEVCContext *s);
1006 int ff_hevc_rem_intra_luma_pred_mode_decode(HEVCContext *s);
1007 int ff_hevc_intra_chroma_pred_mode_decode(HEVCContext *s);
1008 int ff_hevc_merge_idx_decode(HEVCContext *s);
1009 int ff_hevc_merge_flag_decode(HEVCContext *s);
1010 int ff_hevc_inter_pred_idc_decode(HEVCContext *s, int nPbW, int nPbH);
1011 int ff_hevc_ref_idx_lx_decode(HEVCContext *s, int num_ref_idx_lx);
1012 int ff_hevc_mvp_lx_flag_decode(HEVCContext *s);
1013 int ff_hevc_no_residual_syntax_flag_decode(HEVCContext *s);
1014 int ff_hevc_split_transform_flag_decode(HEVCContext *s, int log2_trafo_size);
1015 int ff_hevc_cbf_cb_cr_decode(HEVCContext *s, int trafo_depth);
1016 int ff_hevc_cbf_luma_decode(HEVCContext *s, int trafo_depth);
1017 int ff_hevc_log2_res_scale_abs(HEVCContext *s, int idx);
1018 int ff_hevc_res_scale_sign_flag(HEVCContext *s, int idx);
1019
1020 /**
1021  * Get the number of candidate references for the current frame.
1022  */
1023 int ff_hevc_frame_nb_refs(HEVCContext *s);
1024
1025 int ff_hevc_set_new_ref(HEVCContext *s, AVFrame **frame, int poc);
1026
1027 /**
1028  * Find next frame in output order and put a reference to it in frame.
1029  * @return 1 if a frame was output, 0 otherwise
1030  */
1031 int ff_hevc_output_frame(HEVCContext *s, AVFrame *frame, int flush);
1032
1033 void ff_hevc_bump_frame(HEVCContext *s);
1034
1035 void ff_hevc_unref_frame(HEVCContext *s, HEVCFrame *frame, int flags);
1036
1037 void ff_hevc_set_neighbour_available(HEVCContext *s, int x0, int y0,
1038                                      int nPbW, int nPbH);
1039 void ff_hevc_luma_mv_merge_mode(HEVCContext *s, int x0, int y0,
1040                                 int nPbW, int nPbH, int log2_cb_size,
1041                                 int part_idx, int merge_idx, MvField *mv);
1042 void ff_hevc_luma_mv_mvp_mode(HEVCContext *s, int x0, int y0,
1043                               int nPbW, int nPbH, int log2_cb_size,
1044                               int part_idx, int merge_idx,
1045                               MvField *mv, int mvp_lx_flag, int LX);
1046 void ff_hevc_set_qPy(HEVCContext *s, int xBase, int yBase,
1047                      int log2_cb_size);
1048 void ff_hevc_deblocking_boundary_strengths(HEVCContext *s, int x0, int y0,
1049                                            int log2_trafo_size);
1050 int ff_hevc_cu_qp_delta_sign_flag(HEVCContext *s);
1051 int ff_hevc_cu_qp_delta_abs(HEVCContext *s);
1052 int ff_hevc_cu_chroma_qp_offset_flag(HEVCContext *s);
1053 int ff_hevc_cu_chroma_qp_offset_idx(HEVCContext *s);
1054 void ff_hevc_hls_filter(HEVCContext *s, int x, int y, int ctb_size);
1055 void ff_hevc_hls_filters(HEVCContext *s, int x_ctb, int y_ctb, int ctb_size);
1056 void ff_hevc_hls_residual_coding(HEVCContext *s, int x0, int y0,
1057                                  int log2_trafo_size, enum ScanType scan_idx,
1058                                  int c_idx);
1059
1060 void ff_hevc_hls_mvd_coding(HEVCContext *s, int x0, int y0, int log2_cb_size);
1061
1062
1063 int ff_hevc_encode_nal_vps(HEVCVPS *vps, unsigned int id,
1064                            uint8_t *buf, int buf_size);
1065
1066 /**
1067  * Reset SEI values that are stored on the Context.
1068  * e.g. Caption data that was extracted during NAL
1069  * parsing.
1070  *
1071  * @param s HEVCContext.
1072  */
1073 void ff_hevc_reset_sei(HEVCContext *s);
1074
1075 extern const uint8_t ff_hevc_qpel_extra_before[4];
1076 extern const uint8_t ff_hevc_qpel_extra_after[4];
1077 extern const uint8_t ff_hevc_qpel_extra[4];
1078
1079 extern const uint8_t ff_hevc_diag_scan4x4_x[16];
1080 extern const uint8_t ff_hevc_diag_scan4x4_y[16];
1081 extern const uint8_t ff_hevc_diag_scan8x8_x[64];
1082 extern const uint8_t ff_hevc_diag_scan8x8_y[64];
1083
1084 #endif /* AVCODEC_HEVC_H */