]> git.sesse.net Git - ffmpeg/blob - libavcodec/hevc.h
07d70739ded0d7bf72f7434f3f7de8368a03dd1f
[ffmpeg] / libavcodec / hevc.h
1 /*
2  * HEVC video decoder
3  *
4  * Copyright (C) 2012 - 2013 Guillaume Martres
5  *
6  * This file is part of Libav.
7  *
8  * Libav is free software; you can redistribute it and/or
9  * modify it under the terms of the GNU Lesser General Public
10  * License as published by the Free Software Foundation; either
11  * version 2.1 of the License, or (at your option) any later version.
12  *
13  * Libav is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16  * Lesser General Public License for more details.
17  *
18  * You should have received a copy of the GNU Lesser General Public
19  * License along with Libav; if not, write to the Free Software
20  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
21  */
22
23 #ifndef AVCODEC_HEVC_H
24 #define AVCODEC_HEVC_H
25
26 #include <stddef.h>
27 #include <stdint.h>
28
29 #include "libavutil/buffer.h"
30 #include "libavutil/md5.h"
31
32 #include "avcodec.h"
33 #include "cabac.h"
34 #include "dsputil.h"
35 #include "get_bits.h"
36 #include "hevcdsp.h"
37 #include "internal.h"
38 #include "thread.h"
39 #include "videodsp.h"
40
41 #define MAX_DPB_SIZE 16 // A.4.1
42 #define MAX_REFS 16
43
44 /**
45  * 7.4.2.1
46  */
47 #define MAX_SUB_LAYERS 7
48 #define MAX_VPS_COUNT 16
49 #define MAX_SPS_COUNT 32
50 #define MAX_PPS_COUNT 256
51 #define MAX_SHORT_TERM_RPS_COUNT 64
52 #define MAX_CU_SIZE 128
53
54 //TODO: check if this is really the maximum
55 #define MAX_TRANSFORM_DEPTH 5
56
57 #define MAX_TB_SIZE 32
58 #define MAX_PB_SIZE 64
59 #define MAX_LOG2_CTB_SIZE 6
60 #define MAX_QP 51
61 #define DEFAULT_INTRA_TC_OFFSET 2
62
63 #define HEVC_CONTEXTS 183
64
65 #define MRG_MAX_NUM_CANDS     5
66
67 #define L0 0
68 #define L1 1
69
70 #define EPEL_EXTRA_BEFORE 1
71 #define EPEL_EXTRA_AFTER  2
72 #define EPEL_EXTRA        3
73
74 #define EDGE_EMU_BUFFER_STRIDE 80
75
76 /**
77  * Value of the luma sample at position (x, y) in the 2D array tab.
78  */
79 #define SAMPLE(tab, x, y) ((tab)[(y) * s->sps->width + (x)])
80 #define SAMPLE_CTB(tab, x, y) ((tab)[(y) * min_cb_width + (x)])
81 #define SAMPLE_CBF(tab, x, y) ((tab)[((y) & ((1<<log2_trafo_size)-1)) * MAX_CU_SIZE + ((x) & ((1<<log2_trafo_size)-1))])
82
83 #define IS_IDR(s) (s->nal_unit_type == NAL_IDR_W_RADL || s->nal_unit_type == NAL_IDR_N_LP)
84 #define IS_BLA(s) (s->nal_unit_type == NAL_BLA_W_RADL || s->nal_unit_type == NAL_BLA_W_LP || \
85                    s->nal_unit_type == NAL_BLA_N_LP)
86 #define IS_IRAP(s) (s->nal_unit_type >= 16 && s->nal_unit_type <= 23)
87
88 /**
89  * Table 7-3: NAL unit type codes
90  */
91 enum NALUnitType {
92     NAL_TRAIL_N    = 0,
93     NAL_TRAIL_R    = 1,
94     NAL_TSA_N      = 2,
95     NAL_TSA_R      = 3,
96     NAL_STSA_N     = 4,
97     NAL_STSA_R     = 5,
98     NAL_RADL_N     = 6,
99     NAL_RADL_R     = 7,
100     NAL_RASL_N     = 8,
101     NAL_RASL_R     = 9,
102     NAL_BLA_W_LP   = 16,
103     NAL_BLA_W_RADL = 17,
104     NAL_BLA_N_LP   = 18,
105     NAL_IDR_W_RADL = 19,
106     NAL_IDR_N_LP   = 20,
107     NAL_CRA_NUT    = 21,
108     NAL_VPS        = 32,
109     NAL_SPS        = 33,
110     NAL_PPS        = 34,
111     NAL_AUD        = 35,
112     NAL_EOS_NUT    = 36,
113     NAL_EOB_NUT    = 37,
114     NAL_FD_NUT     = 38,
115     NAL_SEI_PREFIX = 39,
116     NAL_SEI_SUFFIX = 40,
117 };
118
119 enum RPSType {
120     ST_CURR_BEF = 0,
121     ST_CURR_AFT,
122     ST_FOLL,
123     LT_CURR,
124     LT_FOLL,
125     NB_RPS_TYPE,
126 };
127
128 enum SliceType {
129     B_SLICE = 0,
130     P_SLICE = 1,
131     I_SLICE = 2,
132 };
133
134 enum SyntaxElement {
135     SAO_MERGE_FLAG = 0,
136     SAO_TYPE_IDX,
137     SAO_EO_CLASS,
138     SAO_BAND_POSITION,
139     SAO_OFFSET_ABS,
140     SAO_OFFSET_SIGN,
141     END_OF_SLICE_FLAG,
142     SPLIT_CODING_UNIT_FLAG,
143     CU_TRANSQUANT_BYPASS_FLAG,
144     SKIP_FLAG,
145     CU_QP_DELTA,
146     PRED_MODE_FLAG,
147     PART_MODE,
148     PCM_FLAG,
149     PREV_INTRA_LUMA_PRED_FLAG,
150     MPM_IDX,
151     REM_INTRA_LUMA_PRED_MODE,
152     INTRA_CHROMA_PRED_MODE,
153     MERGE_FLAG,
154     MERGE_IDX,
155     INTER_PRED_IDC,
156     REF_IDX_L0,
157     REF_IDX_L1,
158     ABS_MVD_GREATER0_FLAG,
159     ABS_MVD_GREATER1_FLAG,
160     ABS_MVD_MINUS2,
161     MVD_SIGN_FLAG,
162     MVP_LX_FLAG,
163     NO_RESIDUAL_DATA_FLAG,
164     SPLIT_TRANSFORM_FLAG,
165     CBF_LUMA,
166     CBF_CB_CR,
167     TRANSFORM_SKIP_FLAG,
168     LAST_SIGNIFICANT_COEFF_X_PREFIX,
169     LAST_SIGNIFICANT_COEFF_Y_PREFIX,
170     LAST_SIGNIFICANT_COEFF_X_SUFFIX,
171     LAST_SIGNIFICANT_COEFF_Y_SUFFIX,
172     SIGNIFICANT_COEFF_GROUP_FLAG,
173     SIGNIFICANT_COEFF_FLAG,
174     COEFF_ABS_LEVEL_GREATER1_FLAG,
175     COEFF_ABS_LEVEL_GREATER2_FLAG,
176     COEFF_ABS_LEVEL_REMAINING,
177     COEFF_SIGN_FLAG,
178 };
179
180 enum PartMode {
181     PART_2Nx2N = 0,
182     PART_2NxN  = 1,
183     PART_Nx2N  = 2,
184     PART_NxN   = 3,
185     PART_2NxnU = 4,
186     PART_2NxnD = 5,
187     PART_nLx2N = 6,
188     PART_nRx2N = 7,
189 };
190
191 enum PredMode {
192     MODE_INTER = 0,
193     MODE_INTRA,
194     MODE_SKIP,
195 };
196
197 enum InterPredIdc {
198     PRED_L0 = 0,
199     PRED_L1,
200     PRED_BI,
201 };
202
203 enum IntraPredMode {
204     INTRA_PLANAR = 0,
205     INTRA_DC,
206     INTRA_ANGULAR_2,
207     INTRA_ANGULAR_3,
208     INTRA_ANGULAR_4,
209     INTRA_ANGULAR_5,
210     INTRA_ANGULAR_6,
211     INTRA_ANGULAR_7,
212     INTRA_ANGULAR_8,
213     INTRA_ANGULAR_9,
214     INTRA_ANGULAR_10,
215     INTRA_ANGULAR_11,
216     INTRA_ANGULAR_12,
217     INTRA_ANGULAR_13,
218     INTRA_ANGULAR_14,
219     INTRA_ANGULAR_15,
220     INTRA_ANGULAR_16,
221     INTRA_ANGULAR_17,
222     INTRA_ANGULAR_18,
223     INTRA_ANGULAR_19,
224     INTRA_ANGULAR_20,
225     INTRA_ANGULAR_21,
226     INTRA_ANGULAR_22,
227     INTRA_ANGULAR_23,
228     INTRA_ANGULAR_24,
229     INTRA_ANGULAR_25,
230     INTRA_ANGULAR_26,
231     INTRA_ANGULAR_27,
232     INTRA_ANGULAR_28,
233     INTRA_ANGULAR_29,
234     INTRA_ANGULAR_30,
235     INTRA_ANGULAR_31,
236     INTRA_ANGULAR_32,
237     INTRA_ANGULAR_33,
238     INTRA_ANGULAR_34,
239 };
240
241 enum SAOType {
242     SAO_NOT_APPLIED = 0,
243     SAO_BAND,
244     SAO_EDGE,
245 };
246
247 enum SAOEOClass {
248     SAO_EO_HORIZ = 0,
249     SAO_EO_VERT,
250     SAO_EO_135D,
251     SAO_EO_45D,
252 };
253
254 enum ScanType {
255     SCAN_DIAG = 0,
256     SCAN_HORIZ,
257     SCAN_VERT,
258 };
259
260 typedef struct ShortTermRPS {
261     int num_negative_pics;
262     int num_delta_pocs;
263     int32_t delta_poc[32];
264     uint8_t used[32];
265 } ShortTermRPS;
266
267 typedef struct LongTermRPS {
268     int     poc[32];
269     uint8_t used[32];
270     uint8_t nb_refs;
271 } LongTermRPS;
272
273 typedef struct RefPicList {
274     struct HEVCFrame *ref[MAX_REFS];
275     int list[MAX_REFS];
276     int isLongTerm[MAX_REFS];
277     int nb_refs;
278 } RefPicList;
279
280 typedef struct RefPicListTab {
281     RefPicList refPicList[2];
282 } RefPicListTab;
283
284 typedef struct HEVCWindow {
285     int left_offset;
286     int right_offset;
287     int top_offset;
288     int bottom_offset;
289 } HEVCWindow;
290
291 typedef struct VUI {
292     AVRational sar;
293
294     int overscan_info_present_flag;
295     int overscan_appropriate_flag;
296
297     int video_signal_type_present_flag;
298     int video_format;
299     int video_full_range_flag;
300     int colour_description_present_flag;
301     uint8_t colour_primaries;
302     uint8_t transfer_characteristic;
303     uint8_t matrix_coeffs;
304
305     int chroma_loc_info_present_flag;
306     int chroma_sample_loc_type_top_field;
307     int chroma_sample_loc_type_bottom_field;
308     int neutra_chroma_indication_flag;
309
310     int field_seq_flag;
311     int frame_field_info_present_flag;
312
313     int default_display_window_flag;
314     HEVCWindow def_disp_win;
315
316     int vui_timing_info_present_flag;
317     uint32_t vui_num_units_in_tick;
318     uint32_t vui_time_scale;
319     int vui_poc_proportional_to_timing_flag;
320     int vui_num_ticks_poc_diff_one_minus1;
321     int vui_hrd_parameters_present_flag;
322
323     int bitstream_restriction_flag;
324     int tiles_fixed_structure_flag;
325     int motion_vectors_over_pic_boundaries_flag;
326     int restricted_ref_pic_lists_flag;
327     int min_spatial_segmentation_idc;
328     int max_bytes_per_pic_denom;
329     int max_bits_per_min_cu_denom;
330     int log2_max_mv_length_horizontal;
331     int log2_max_mv_length_vertical;
332 } VUI;
333
334 typedef struct PTLCommon {
335     uint8_t profile_space;
336     uint8_t tier_flag;
337     uint8_t profile_idc;
338     uint8_t profile_compatibility_flag[32];
339     uint8_t level_idc;
340     uint8_t progressive_source_flag;
341     uint8_t interlaced_source_flag;
342     uint8_t non_packed_constraint_flag;
343     uint8_t frame_only_constraint_flag;
344 } PTLCommon;
345
346 typedef struct PTL {
347     PTLCommon general_ptl;
348     PTLCommon sub_layer_ptl[MAX_SUB_LAYERS];
349
350     uint8_t sub_layer_profile_present_flag[MAX_SUB_LAYERS];
351     uint8_t sub_layer_level_present_flag[MAX_SUB_LAYERS];
352 } PTL;
353
354 typedef struct HEVCVPS {
355     uint8_t vps_temporal_id_nesting_flag;
356     int vps_max_layers;
357     int vps_max_sub_layers; ///< vps_max_temporal_layers_minus1 + 1
358
359     PTL ptl;
360     int vps_sub_layer_ordering_info_present_flag;
361     unsigned int vps_max_dec_pic_buffering[MAX_SUB_LAYERS];
362     unsigned int vps_num_reorder_pics[MAX_SUB_LAYERS];
363     unsigned int vps_max_latency_increase[MAX_SUB_LAYERS];
364     int vps_max_layer_id;
365     int vps_num_layer_sets; ///< vps_num_layer_sets_minus1 + 1
366     uint8_t vps_timing_info_present_flag;
367     uint32_t vps_num_units_in_tick;
368     uint32_t vps_time_scale;
369     uint8_t vps_poc_proportional_to_timing_flag;
370     int vps_num_ticks_poc_diff_one; ///< vps_num_ticks_poc_diff_one_minus1 + 1
371     int vps_num_hrd_parameters;
372 } HEVCVPS;
373
374 typedef struct ScalingList {
375     /* This is a little wasteful, since sizeID 0 only needs 8 coeffs,
376      * and size ID 3 only has 2 arrays, not 6. */
377     uint8_t sl[4][6][64];
378     uint8_t sl_dc[2][6];
379 } ScalingList;
380
381 typedef struct HEVCSPS {
382     int vps_id;
383     int chroma_format_idc;
384     uint8_t separate_colour_plane_flag;
385
386     ///< output (i.e. cropped) values
387     int output_width, output_height;
388     HEVCWindow output_window;
389
390     HEVCWindow pic_conf_win;
391
392     int bit_depth;
393     int pixel_shift;
394     enum AVPixelFormat pix_fmt;
395
396     unsigned int log2_max_poc_lsb;
397     int pcm_enabled_flag;
398
399     int max_sub_layers;
400     struct {
401         int max_dec_pic_buffering;
402         int num_reorder_pics;
403         int max_latency_increase;
404     } temporal_layer[MAX_SUB_LAYERS];
405
406     VUI vui;
407     PTL ptl;
408
409     uint8_t scaling_list_enable_flag;
410     ScalingList scaling_list;
411
412     unsigned int nb_st_rps;
413     ShortTermRPS st_rps[MAX_SHORT_TERM_RPS_COUNT];
414
415     uint8_t amp_enabled_flag;
416     uint8_t sao_enabled;
417
418     uint8_t long_term_ref_pics_present_flag;
419     uint16_t lt_ref_pic_poc_lsb_sps[32];
420     uint8_t used_by_curr_pic_lt_sps_flag[32];
421     uint8_t num_long_term_ref_pics_sps;
422
423     struct {
424         uint8_t bit_depth;
425         uint8_t bit_depth_chroma;
426         unsigned int log2_min_pcm_cb_size;
427         unsigned int log2_max_pcm_cb_size;
428         uint8_t loop_filter_disable_flag;
429     } pcm;
430     uint8_t sps_temporal_mvp_enabled_flag;
431     uint8_t sps_strong_intra_smoothing_enable_flag;
432
433     unsigned int log2_min_cb_size;
434     unsigned int log2_diff_max_min_coding_block_size;
435     unsigned int log2_min_tb_size;
436     unsigned int log2_max_trafo_size;
437     unsigned int log2_ctb_size;
438     unsigned int log2_min_pu_size;
439
440     int max_transform_hierarchy_depth_inter;
441     int max_transform_hierarchy_depth_intra;
442
443     ///< coded frame dimension in various units
444     int width;
445     int height;
446     int ctb_width;
447     int ctb_height;
448     int ctb_size;
449     int min_cb_width;
450     int min_cb_height;
451     int min_tb_width;
452     int min_tb_height;
453     int min_pu_width;
454     int min_pu_height;
455
456     int hshift[3];
457     int vshift[3];
458
459     int qp_bd_offset;
460 } HEVCSPS;
461
462 typedef struct HEVCPPS {
463     int sps_id; ///< seq_parameter_set_id
464
465     uint8_t sign_data_hiding_flag;
466
467     uint8_t cabac_init_present_flag;
468
469     int num_ref_idx_l0_default_active; ///< num_ref_idx_l0_default_active_minus1 + 1
470     int num_ref_idx_l1_default_active; ///< num_ref_idx_l1_default_active_minus1 + 1
471     int pic_init_qp_minus26;
472
473     uint8_t constrained_intra_pred_flag;
474     uint8_t transform_skip_enabled_flag;
475
476     uint8_t cu_qp_delta_enabled_flag;
477     int diff_cu_qp_delta_depth;
478
479     int cb_qp_offset;
480     int cr_qp_offset;
481     uint8_t pic_slice_level_chroma_qp_offsets_present_flag;
482     uint8_t weighted_pred_flag;
483     uint8_t weighted_bipred_flag;
484     uint8_t output_flag_present_flag;
485     uint8_t transquant_bypass_enable_flag;
486
487     uint8_t dependent_slice_segments_enabled_flag;
488     uint8_t tiles_enabled_flag;
489     uint8_t entropy_coding_sync_enabled_flag;
490
491     int num_tile_columns;   ///< num_tile_columns_minus1 + 1
492     int num_tile_rows;      ///< num_tile_rows_minus1 + 1
493     uint8_t uniform_spacing_flag;
494     uint8_t loop_filter_across_tiles_enabled_flag;
495
496     uint8_t seq_loop_filter_across_slices_enabled_flag;
497
498     uint8_t deblocking_filter_control_present_flag;
499     uint8_t deblocking_filter_override_enabled_flag;
500     uint8_t disable_dbf;
501     int beta_offset;    ///< beta_offset_div2 * 2
502     int tc_offset;      ///< tc_offset_div2 * 2
503
504     uint8_t scaling_list_data_present_flag;
505     ScalingList scaling_list;
506
507     uint8_t lists_modification_present_flag;
508     int log2_parallel_merge_level; ///< log2_parallel_merge_level_minus2 + 2
509     int num_extra_slice_header_bits;
510     uint8_t slice_header_extension_present_flag;
511
512     // Inferred parameters
513     int *column_width;  ///< ColumnWidth
514     int *row_height;    ///< RowHeight
515     int *col_bd;        ///< ColBd
516     int *row_bd;        ///< RowBd
517     int *col_idxX;
518
519     int *ctb_addr_rs_to_ts; ///< CtbAddrRSToTS
520     int *ctb_addr_ts_to_rs; ///< CtbAddrTSToRS
521     int *tile_id;           ///< TileId
522     int *tile_pos_rs;       ///< TilePosRS
523     int *min_cb_addr_zs;    ///< MinCbAddrZS
524     int *min_tb_addr_zs;    ///< MinTbAddrZS
525 } HEVCPPS;
526
527 typedef struct SliceHeader {
528     int pps_id;
529
530     ///< address (in raster order) of the first block in the current slice segment
531     unsigned int   slice_segment_addr;
532     ///< address (in raster order) of the first block in the current slice
533     unsigned int   slice_addr;
534
535     enum SliceType slice_type;
536
537     int pic_order_cnt_lsb;
538
539     uint8_t first_slice_in_pic_flag;
540     uint8_t dependent_slice_segment_flag;
541     uint8_t pic_output_flag;
542     uint8_t colour_plane_id;
543
544     ///< RPS coded in the slice header itself is stored here
545     ShortTermRPS slice_rps;
546     const ShortTermRPS *short_term_rps;
547     LongTermRPS long_term_rps;
548     unsigned int list_entry_lx[2][32];
549
550     uint8_t rpl_modification_flag[2];
551     uint8_t no_output_of_prior_pics_flag;
552     uint8_t slice_temporal_mvp_enabled_flag;
553
554     unsigned int nb_refs[2];
555
556     uint8_t slice_sample_adaptive_offset_flag[3];
557     uint8_t mvd_l1_zero_flag;
558
559     uint8_t cabac_init_flag;
560     uint8_t disable_deblocking_filter_flag; ///< slice_header_disable_deblocking_filter_flag
561     uint8_t slice_loop_filter_across_slices_enabled_flag;
562     uint8_t collocated_list;
563
564     unsigned int collocated_ref_idx;
565
566     int slice_qp_delta;
567     int slice_cb_qp_offset;
568     int slice_cr_qp_offset;
569
570     int beta_offset;    ///< beta_offset_div2 * 2
571     int tc_offset;      ///< tc_offset_div2 * 2
572
573     unsigned int max_num_merge_cand; ///< 5 - 5_minus_max_num_merge_cand
574
575     int num_entry_point_offsets;
576
577     int8_t slice_qp;
578
579     uint8_t luma_log2_weight_denom;
580     int16_t chroma_log2_weight_denom;
581
582     int16_t luma_weight_l0[16];
583     int16_t chroma_weight_l0[16][2];
584     int16_t chroma_weight_l1[16][2];
585     int16_t luma_weight_l1[16];
586
587     int16_t luma_offset_l0[16];
588     int16_t chroma_offset_l0[16][2];
589
590     int16_t luma_offset_l1[16];
591     int16_t chroma_offset_l1[16][2];
592
593     int slice_ctb_addr_rs;
594 } SliceHeader;
595
596 typedef struct CodingTree {
597     int depth; ///< ctDepth
598 } CodingTree;
599
600 typedef struct CodingUnit {
601     int x;
602     int y;
603
604     enum PredMode pred_mode;    ///< PredMode
605     enum PartMode part_mode;    ///< PartMode
606
607     uint8_t rqt_root_cbf;
608
609     uint8_t pcm_flag;
610
611     // Inferred parameters
612     uint8_t intra_split_flag;   ///< IntraSplitFlag
613     uint8_t max_trafo_depth;    ///< MaxTrafoDepth
614     uint8_t cu_transquant_bypass_flag;
615 } CodingUnit;
616
617 typedef struct Mv {
618     int16_t x;  ///< horizontal component of motion vector
619     int16_t y;  ///< vertical component of motion vector
620 } Mv;
621
622 typedef struct MvField {
623     Mv mv[2];
624     int8_t ref_idx[2];
625     int8_t pred_flag[2];
626     uint8_t is_intra;
627 } MvField;
628
629 typedef struct NeighbourAvailable {
630     int cand_bottom_left;
631     int cand_left;
632     int cand_up;
633     int cand_up_left;
634     int cand_up_right;
635     int cand_up_right_sap;
636 } NeighbourAvailable;
637
638 typedef struct PredictionUnit {
639     int mpm_idx;
640     int rem_intra_luma_pred_mode;
641     uint8_t intra_pred_mode[4];
642     Mv mvd;
643     uint8_t merge_flag;
644     uint8_t intra_pred_mode_c;
645 } PredictionUnit;
646
647 typedef struct TransformTree {
648     uint8_t cbf_cb[MAX_TRANSFORM_DEPTH][MAX_CU_SIZE * MAX_CU_SIZE];
649     uint8_t cbf_cr[MAX_TRANSFORM_DEPTH][MAX_CU_SIZE * MAX_CU_SIZE];
650     uint8_t cbf_luma;
651
652     // Inferred parameters
653     uint8_t inter_split_flag;
654 } TransformTree;
655
656 typedef struct TransformUnit {
657     int cu_qp_delta;
658
659     // Inferred parameters;
660     int cur_intra_pred_mode;
661     uint8_t is_cu_qp_delta_coded;
662 } TransformUnit;
663
664 typedef struct DBParams {
665     int beta_offset;
666     int tc_offset;
667 } DBParams;
668
669 #define HEVC_FRAME_FLAG_OUTPUT    (1 << 0)
670 #define HEVC_FRAME_FLAG_SHORT_REF (1 << 1)
671 #define HEVC_FRAME_FLAG_LONG_REF  (1 << 2)
672
673 typedef struct HEVCFrame {
674     AVFrame *frame;
675     ThreadFrame tf;
676     MvField *tab_mvf;
677     RefPicList *refPicList;
678     RefPicListTab **rpl_tab;
679     int ctb_count;
680     int poc;
681     struct HEVCFrame *collocated_ref;
682
683     HEVCWindow window;
684
685     AVBufferRef *tab_mvf_buf;
686     AVBufferRef *rpl_tab_buf;
687     AVBufferRef *rpl_buf;
688
689     /**
690      * A sequence counter, so that old frames are output first
691      * after a POC reset
692      */
693     uint16_t sequence;
694
695     /**
696      * A combination of HEVC_FRAME_FLAG_*
697      */
698     uint8_t flags;
699 } HEVCFrame;
700
701 typedef struct HEVCNAL {
702     uint8_t *rbsp_buffer;
703     int rbsp_buffer_size;
704
705     int size;
706     const uint8_t *data;
707 } HEVCNAL;
708
709 struct HEVCContext;
710
711 typedef struct HEVCPredContext {
712     void (*intra_pred)(struct HEVCContext *s, int x0, int y0,
713                        int log2_size, int c_idx);
714
715     void (*pred_planar[4])(uint8_t *src, const uint8_t *top,
716                            const uint8_t *left, ptrdiff_t stride);
717     void (*pred_dc)(uint8_t *src, const uint8_t *top, const uint8_t *left,
718                     ptrdiff_t stride, int log2_size, int c_idx);
719     void (*pred_angular[4])(uint8_t *src, const uint8_t *top,
720                             const uint8_t *left, ptrdiff_t stride,
721                             int c_idx, int mode);
722 } HEVCPredContext;
723
724 typedef struct HEVCLocalContext {
725     DECLARE_ALIGNED(16, int16_t, mc_buffer[(MAX_PB_SIZE + 7) * MAX_PB_SIZE]);
726     uint8_t cabac_state[HEVC_CONTEXTS];
727
728     uint8_t first_qp_group;
729
730     GetBitContext gb;
731     CABACContext cc;
732     TransformTree tt;
733
734     int8_t qp_y;
735     int8_t curr_qp_y;
736
737     TransformUnit tu;
738
739     uint8_t ctb_left_flag;
740     uint8_t ctb_up_flag;
741     uint8_t ctb_up_right_flag;
742     uint8_t ctb_up_left_flag;
743     int     start_of_tiles_x;
744     int     end_of_tiles_x;
745     int     end_of_tiles_y;
746     /* +7 is for subpixel interpolation, *2 for high bit depths */
747     DECLARE_ALIGNED(32, uint8_t, edge_emu_buffer)[(MAX_PB_SIZE + 7) * EDGE_EMU_BUFFER_STRIDE * 2];
748     CodingTree ct;
749     CodingUnit cu;
750     PredictionUnit pu;
751     NeighbourAvailable na;
752
753     uint8_t slice_or_tiles_left_boundary;
754     uint8_t slice_or_tiles_up_boundary;
755 } HEVCLocalContext;
756
757 typedef struct HEVCContext {
758     const AVClass *c;  // needed by private avoptions
759     AVCodecContext *avctx;
760
761     HEVCLocalContext HEVClc;
762
763     uint8_t cabac_state[HEVC_CONTEXTS];
764
765     /** 1 if the independent slice segment header was successfully parsed */
766     uint8_t slice_initialized;
767
768     AVFrame *frame;
769     AVFrame *sao_frame;
770     AVFrame *tmp_frame;
771     AVFrame *output_frame;
772
773     const HEVCVPS *vps;
774     const HEVCSPS *sps;
775     const HEVCPPS *pps;
776     AVBufferRef *vps_list[MAX_VPS_COUNT];
777     AVBufferRef *sps_list[MAX_SPS_COUNT];
778     AVBufferRef *pps_list[MAX_PPS_COUNT];
779
780     AVBufferPool *tab_mvf_pool;
781     AVBufferPool *rpl_tab_pool;
782
783     ///< candidate references for the current frame
784     RefPicList rps[5];
785
786     SliceHeader sh;
787     SAOParams *sao;
788     DBParams *deblock;
789     enum NALUnitType nal_unit_type;
790     int temporal_id;  ///< temporal_id_plus1 - 1
791     HEVCFrame *ref;
792     HEVCFrame DPB[32];
793     int poc;
794     int pocTid0;
795     int slice_idx; ///< number of the slice being currently decoded
796     int eos;       ///< current packet contains an EOS/EOB NAL
797     int max_ra;
798     int bs_width;
799     int bs_height;
800
801     int is_decoded;
802
803     HEVCPredContext hpc;
804     HEVCDSPContext hevcdsp;
805     VideoDSPContext vdsp;
806     DSPContext dsp;
807     int8_t *qp_y_tab;
808     uint8_t *split_cu_flag;
809     uint8_t *horizontal_bs;
810     uint8_t *vertical_bs;
811
812     int32_t *tab_slice_address;
813
814     //  CU
815     uint8_t *skip_flag;
816     uint8_t *tab_ct_depth;
817     // PU
818     uint8_t *tab_ipm;
819
820     uint8_t *cbf_luma; // cbf_luma of colocated TU
821     uint8_t *is_pcm;
822
823     // CTB-level flags affecting loop filter operation
824     uint8_t *filter_slice_edges;
825
826     /** used on BE to byteswap the lines for checksumming */
827     uint8_t *checksum_buf;
828     int      checksum_buf_size;
829
830     /**
831      * Sequence counters for decoded and output frames, so that old
832      * frames are output first after a POC reset
833      */
834     uint16_t seq_decode;
835     uint16_t seq_output;
836
837     HEVCNAL *nals;
838     int nb_nals;
839     int nals_allocated;
840
841     // for checking the frame checksums
842     struct AVMD5 *md5_ctx;
843     uint8_t       md5[3][16];
844     uint8_t is_md5;
845
846     uint8_t context_initialized;
847     uint8_t is_nalff;       ///< this flag is != 0 if bitstream is encapsulated
848                             ///< as a format defined in 14496-15
849     int apply_defdispwin;
850
851     int nal_length_size;    ///< Number of bytes used for nal length (1, 2 or 4)
852     int nuh_layer_id;
853
854     /** frame packing arrangement variables */
855     int sei_frame_packing_present;
856     int frame_packing_arrangement_type;
857     int content_interpretation_type;
858     int quincunx_subsampling;
859 } HEVCContext;
860
861 int ff_hevc_decode_short_term_rps(HEVCContext *s, ShortTermRPS *rps,
862                                   const HEVCSPS *sps, int is_slice_header);
863 int ff_hevc_decode_nal_vps(HEVCContext *s);
864 int ff_hevc_decode_nal_sps(HEVCContext *s);
865 int ff_hevc_decode_nal_pps(HEVCContext *s);
866 int ff_hevc_decode_nal_sei(HEVCContext *s);
867
868 /**
869  * Mark all frames in DPB as unused for reference.
870  */
871 void ff_hevc_clear_refs(HEVCContext *s);
872
873 /**
874  * Drop all frames currently in DPB.
875  */
876 void ff_hevc_flush_dpb(HEVCContext *s);
877
878 /**
879  * Compute POC of the current frame and return it.
880  */
881 int ff_hevc_compute_poc(HEVCContext *s, int poc_lsb);
882
883 RefPicList *ff_hevc_get_ref_list(HEVCContext *s, HEVCFrame *frame,
884                                  int x0, int y0);
885
886 /**
887  * Construct the reference picture sets for the current frame.
888  */
889 int ff_hevc_frame_rps(HEVCContext *s);
890
891 /**
892  * Construct the reference picture list(s) for the current slice.
893  */
894 int ff_hevc_slice_rpl(HEVCContext *s);
895
896 void ff_hevc_save_states(HEVCContext *s, int ctb_addr_ts);
897 void ff_hevc_cabac_init(HEVCContext *s, int ctb_addr_ts);
898 int ff_hevc_sao_merge_flag_decode(HEVCContext *s);
899 int ff_hevc_sao_type_idx_decode(HEVCContext *s);
900 int ff_hevc_sao_band_position_decode(HEVCContext *s);
901 int ff_hevc_sao_offset_abs_decode(HEVCContext *s);
902 int ff_hevc_sao_offset_sign_decode(HEVCContext *s);
903 int ff_hevc_sao_eo_class_decode(HEVCContext *s);
904 int ff_hevc_end_of_slice_flag_decode(HEVCContext *s);
905 int ff_hevc_cu_transquant_bypass_flag_decode(HEVCContext *s);
906 int ff_hevc_skip_flag_decode(HEVCContext *s, int x0, int y0,
907                              int x_cb, int y_cb);
908 int ff_hevc_pred_mode_decode(HEVCContext *s);
909 int ff_hevc_split_coding_unit_flag_decode(HEVCContext *s, int ct_depth,
910                                           int x0, int y0);
911 int ff_hevc_part_mode_decode(HEVCContext *s, int log2_cb_size);
912 int ff_hevc_pcm_flag_decode(HEVCContext *s);
913 int ff_hevc_prev_intra_luma_pred_flag_decode(HEVCContext *s);
914 int ff_hevc_mpm_idx_decode(HEVCContext *s);
915 int ff_hevc_rem_intra_luma_pred_mode_decode(HEVCContext *s);
916 int ff_hevc_intra_chroma_pred_mode_decode(HEVCContext *s);
917 int ff_hevc_merge_idx_decode(HEVCContext *s);
918 int ff_hevc_merge_flag_decode(HEVCContext *s);
919 int ff_hevc_inter_pred_idc_decode(HEVCContext *s, int nPbW, int nPbH);
920 int ff_hevc_ref_idx_lx_decode(HEVCContext *s, int num_ref_idx_lx);
921 int ff_hevc_mvp_lx_flag_decode(HEVCContext *s);
922 int ff_hevc_no_residual_syntax_flag_decode(HEVCContext *s);
923 int ff_hevc_abs_mvd_greater0_flag_decode(HEVCContext *s);
924 int ff_hevc_abs_mvd_greater1_flag_decode(HEVCContext *s);
925 int ff_hevc_mvd_decode(HEVCContext *s);
926 int ff_hevc_mvd_sign_flag_decode(HEVCContext *s);
927 int ff_hevc_split_transform_flag_decode(HEVCContext *s, int log2_trafo_size);
928 int ff_hevc_cbf_cb_cr_decode(HEVCContext *s, int trafo_depth);
929 int ff_hevc_cbf_luma_decode(HEVCContext *s, int trafo_depth);
930 int ff_hevc_transform_skip_flag_decode(HEVCContext *s, int c_idx);
931 int ff_hevc_last_significant_coeff_x_prefix_decode(HEVCContext *s, int c_idx,
932                                                    int log2_size);
933 int ff_hevc_last_significant_coeff_y_prefix_decode(HEVCContext *s, int c_idx,
934                                                    int log2_size);
935 int ff_hevc_last_significant_coeff_suffix_decode(HEVCContext *s,
936                                                  int last_significant_coeff_prefix);
937 int ff_hevc_significant_coeff_group_flag_decode(HEVCContext *s, int c_idx,
938                                                 int ctx_cg);
939 int ff_hevc_significant_coeff_flag_decode(HEVCContext *s, int c_idx, int x_c,
940                                           int y_c, int log2_trafo_size,
941                                           int scan_idx, int prev_sig);
942 int ff_hevc_coeff_abs_level_greater1_flag_decode(HEVCContext *s, int c_idx,
943                                                  int ctx_set);
944 int ff_hevc_coeff_abs_level_greater2_flag_decode(HEVCContext *s, int c_idx,
945                                                  int inc);
946 int ff_hevc_coeff_abs_level_remaining(HEVCContext *s, int base_level,
947                                       int rc_rice_param);
948 int ff_hevc_coeff_sign_flag(HEVCContext *s, uint8_t nb);
949
950 /**
951  * Get the number of candidate references for the current frame.
952  */
953 int ff_hevc_frame_nb_refs(HEVCContext *s);
954
955 int ff_hevc_set_new_ref(HEVCContext *s, AVFrame **frame, int poc);
956
957 /**
958  * Find next frame in output order and put a reference to it in frame.
959  * @return 1 if a frame was output, 0 otherwise
960  */
961 int ff_hevc_output_frame(HEVCContext *s, AVFrame *frame, int flush);
962
963 void ff_hevc_unref_frame(HEVCContext *s, HEVCFrame *frame, int flags);
964
965 void ff_hevc_set_neighbour_available(HEVCContext *s, int x0, int y0,
966                                      int nPbW, int nPbH);
967 void ff_hevc_luma_mv_merge_mode(HEVCContext *s, int x0, int y0,
968                                 int nPbW, int nPbH, int log2_cb_size,
969                                 int part_idx, int merge_idx, MvField *mv);
970 void ff_hevc_luma_mv_mvp_mode(HEVCContext *s, int x0, int y0,
971                               int nPbW, int nPbH, int log2_cb_size,
972                               int part_idx, int merge_idx,
973                               MvField *mv, int mvp_lx_flag, int LX);
974 void ff_hevc_set_qPy(HEVCContext *s, int xC, int yC, int xBase, int yBase,
975                      int log2_cb_size);
976 void ff_hevc_deblocking_boundary_strengths(HEVCContext *s, int x0, int y0,
977                                            int log2_trafo_size,
978                                            int slice_or_tiles_up_boundary,
979                                            int slice_or_tiles_left_boundary);
980 int ff_hevc_cu_qp_delta_sign_flag(HEVCContext *s);
981 int ff_hevc_cu_qp_delta_abs(HEVCContext *s);
982 void ff_hevc_hls_filter(HEVCContext *s, int x, int y);
983 void ff_hevc_hls_filters(HEVCContext *s, int x_ctb, int y_ctb, int ctb_size);
984
985 void ff_hevc_pps_free(HEVCPPS **ppps);
986
987 void ff_hevc_pred_init(HEVCPredContext *hpc, int bit_depth);
988
989 extern const uint8_t ff_hevc_qpel_extra_before[4];
990 extern const uint8_t ff_hevc_qpel_extra_after[4];
991 extern const uint8_t ff_hevc_qpel_extra[4];
992
993 extern const uint8_t ff_hevc_diag_scan4x4_x[16];
994 extern const uint8_t ff_hevc_diag_scan4x4_y[16];
995 extern const uint8_t ff_hevc_diag_scan8x8_x[64];
996 extern const uint8_t ff_hevc_diag_scan8x8_y[64];
997
998 #endif /* AVCODEC_HEVC_H */