]> git.sesse.net Git - ffmpeg/blob - libavcodec/vp9dec.h
doc/filters: Documentation to add sess_config option for tensorflow backend
[ffmpeg] / libavcodec / vp9dec.h
1 /*
2  * VP9 compatible video decoder
3  *
4  * Copyright (C) 2013 Ronald S. Bultje <rsbultje gmail com>
5  * Copyright (C) 2013 Clément Bœsch <u pkh me>
6  *
7  * This file is part of FFmpeg.
8  *
9  * FFmpeg is free software; you can redistribute it and/or
10  * modify it under the terms of the GNU Lesser General Public
11  * License as published by the Free Software Foundation; either
12  * version 2.1 of the License, or (at your option) any later version.
13  *
14  * FFmpeg is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
17  * Lesser General Public License for more details.
18  *
19  * You should have received a copy of the GNU Lesser General Public
20  * License along with FFmpeg; if not, write to the Free Software
21  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
22  */
23
24 #ifndef AVCODEC_VP9DEC_H
25 #define AVCODEC_VP9DEC_H
26
27 #include <stddef.h>
28 #include <stdint.h>
29 #include <stdatomic.h>
30
31 #include "libavutil/buffer.h"
32 #include "libavutil/mem_internal.h"
33 #include "libavutil/thread.h"
34 #include "libavutil/internal.h"
35
36 #include "vp9.h"
37 #include "vp9dsp.h"
38 #include "vp9shared.h"
39
40 #define REF_INVALID_SCALE 0xFFFF
41
42 enum MVJoint {
43     MV_JOINT_ZERO,
44     MV_JOINT_H,
45     MV_JOINT_V,
46     MV_JOINT_HV,
47 };
48
49 typedef struct ProbContext {
50     uint8_t y_mode[4][9];
51     uint8_t uv_mode[10][9];
52     uint8_t filter[4][2];
53     uint8_t mv_mode[7][3];
54     uint8_t intra[4];
55     uint8_t comp[5];
56     uint8_t single_ref[5][2];
57     uint8_t comp_ref[5];
58     uint8_t tx32p[2][3];
59     uint8_t tx16p[2][2];
60     uint8_t tx8p[2];
61     uint8_t skip[3];
62     uint8_t mv_joint[3];
63     struct {
64         uint8_t sign;
65         uint8_t classes[10];
66         uint8_t class0;
67         uint8_t bits[10];
68         uint8_t class0_fp[2][3];
69         uint8_t fp[3];
70         uint8_t class0_hp;
71         uint8_t hp;
72     } mv_comp[2];
73     uint8_t partition[4][4][3];
74 } ProbContext;
75
76 typedef struct VP9Filter {
77     uint8_t level[8 * 8];
78     uint8_t /* bit=col */ mask[2 /* 0=y, 1=uv */][2 /* 0=col, 1=row */]
79                               [8 /* rows */][4 /* 0=16, 1=8, 2=4, 3=inner4 */];
80 } VP9Filter;
81
82 typedef struct VP9Block {
83     uint8_t seg_id, intra, comp, ref[2], mode[4], uvmode, skip;
84     enum FilterMode filter;
85     VP56mv mv[4 /* b_idx */][2 /* ref */];
86     enum BlockSize bs;
87     enum TxfmMode tx, uvtx;
88     enum BlockLevel bl;
89     enum BlockPartition bp;
90 } VP9Block;
91
92 typedef struct VP9TileData VP9TileData;
93
94 typedef struct VP9Context {
95     VP9SharedContext s;
96     VP9TileData *td;
97
98     VP9DSPContext dsp;
99     VideoDSPContext vdsp;
100     GetBitContext gb;
101     VP56RangeCoder c;
102     int pass, active_tile_cols;
103
104 #if HAVE_THREADS
105     pthread_mutex_t progress_mutex;
106     pthread_cond_t progress_cond;
107     atomic_int *entries;
108 #endif
109
110     uint8_t ss_h, ss_v;
111     uint8_t last_bpp, bpp_index, bytesperpixel;
112     uint8_t last_keyframe;
113     // sb_cols/rows, rows/cols and last_fmt are used for allocating all internal
114     // arrays, and are thus per-thread. w/h and gf_fmt are synced between threads
115     // and are therefore per-stream. pix_fmt represents the value in the header
116     // of the currently processed frame.
117     int w, h;
118     enum AVPixelFormat pix_fmt, last_fmt, gf_fmt;
119     unsigned sb_cols, sb_rows, rows, cols;
120     ThreadFrame next_refs[8];
121
122     struct {
123         uint8_t lim_lut[64];
124         uint8_t mblim_lut[64];
125     } filter_lut;
126     struct {
127         ProbContext p;
128         uint8_t coef[4][2][2][6][6][3];
129     } prob_ctx[4];
130     struct {
131         ProbContext p;
132         uint8_t coef[4][2][2][6][6][11];
133     } prob;
134
135     // contextual (above) cache
136     uint8_t *above_partition_ctx;
137     uint8_t *above_mode_ctx;
138     // FIXME maybe merge some of the below in a flags field?
139     uint8_t *above_y_nnz_ctx;
140     uint8_t *above_uv_nnz_ctx[2];
141     uint8_t *above_skip_ctx; // 1bit
142     uint8_t *above_txfm_ctx; // 2bit
143     uint8_t *above_segpred_ctx; // 1bit
144     uint8_t *above_intra_ctx; // 1bit
145     uint8_t *above_comp_ctx; // 1bit
146     uint8_t *above_ref_ctx; // 2bit
147     uint8_t *above_filter_ctx;
148     VP56mv (*above_mv_ctx)[2];
149
150     // whole-frame cache
151     uint8_t *intra_pred_data[3];
152     VP9Filter *lflvl;
153
154     // block reconstruction intermediates
155     int block_alloc_using_2pass;
156     uint16_t mvscale[3][2];
157     uint8_t mvstep[3][2];
158
159     // frame specific buffer pools
160     AVBufferPool *frame_extradata_pool;
161     int frame_extradata_pool_size;
162 } VP9Context;
163
164 struct VP9TileData {
165     //VP9Context should be const, but because of the threading API(generates
166     //a lot of warnings) it's not.
167     VP9Context *s;
168     VP56RangeCoder *c_b;
169     VP56RangeCoder *c;
170     int row, row7, col, col7;
171     uint8_t *dst[3];
172     ptrdiff_t y_stride, uv_stride;
173     VP9Block *b_base, *b;
174     unsigned tile_col_start;
175
176     struct {
177         unsigned y_mode[4][10];
178         unsigned uv_mode[10][10];
179         unsigned filter[4][3];
180         unsigned mv_mode[7][4];
181         unsigned intra[4][2];
182         unsigned comp[5][2];
183         unsigned single_ref[5][2][2];
184         unsigned comp_ref[5][2];
185         unsigned tx32p[2][4];
186         unsigned tx16p[2][3];
187         unsigned tx8p[2][2];
188         unsigned skip[3][2];
189         unsigned mv_joint[4];
190         struct {
191             unsigned sign[2];
192             unsigned classes[11];
193             unsigned class0[2];
194             unsigned bits[10][2];
195             unsigned class0_fp[2][4];
196             unsigned fp[4];
197             unsigned class0_hp[2];
198             unsigned hp[2];
199         } mv_comp[2];
200         unsigned partition[4][4][4];
201         unsigned coef[4][2][2][6][6][3];
202         unsigned eob[4][2][2][6][6][2];
203     } counts;
204
205     // whole-frame cache
206     DECLARE_ALIGNED(32, uint8_t, edge_emu_buffer)[135 * 144 * 2];
207
208     // contextual (left) cache
209     DECLARE_ALIGNED(16, uint8_t, left_y_nnz_ctx)[16];
210     DECLARE_ALIGNED(16, uint8_t, left_mode_ctx)[16];
211     DECLARE_ALIGNED(16, VP56mv, left_mv_ctx)[16][2];
212     DECLARE_ALIGNED(16, uint8_t, left_uv_nnz_ctx)[2][16];
213     DECLARE_ALIGNED(8, uint8_t, left_partition_ctx)[8];
214     DECLARE_ALIGNED(8, uint8_t, left_skip_ctx)[8];
215     DECLARE_ALIGNED(8, uint8_t, left_txfm_ctx)[8];
216     DECLARE_ALIGNED(8, uint8_t, left_segpred_ctx)[8];
217     DECLARE_ALIGNED(8, uint8_t, left_intra_ctx)[8];
218     DECLARE_ALIGNED(8, uint8_t, left_comp_ctx)[8];
219     DECLARE_ALIGNED(8, uint8_t, left_ref_ctx)[8];
220     DECLARE_ALIGNED(8, uint8_t, left_filter_ctx)[8];
221     // block reconstruction intermediates
222     DECLARE_ALIGNED(32, uint8_t, tmp_y)[64 * 64 * 2];
223     DECLARE_ALIGNED(32, uint8_t, tmp_uv)[2][64 * 64 * 2];
224     struct { int x, y; } min_mv, max_mv;
225     int16_t *block_base, *block, *uvblock_base[2], *uvblock[2];
226     uint8_t *eob_base, *uveob_base[2], *eob, *uveob[2];
227
228     // error message
229     int error_info;
230     struct {
231         unsigned int row:13;
232         unsigned int col:13;
233         unsigned int block_size_idx_x:2;
234         unsigned int block_size_idx_y:2;
235     } *block_structure;
236     unsigned int nb_block_structure;
237 };
238
239 void ff_vp9_fill_mv(VP9TileData *td, VP56mv *mv, int mode, int sb);
240
241 void ff_vp9_adapt_probs(VP9Context *s);
242
243 void ff_vp9_decode_block(VP9TileData *td, int row, int col,
244                          VP9Filter *lflvl, ptrdiff_t yoff, ptrdiff_t uvoff,
245                          enum BlockLevel bl, enum BlockPartition bp);
246
247 void ff_vp9_loopfilter_sb(AVCodecContext *avctx, VP9Filter *lflvl,
248                           int row, int col, ptrdiff_t yoff, ptrdiff_t uvoff);
249
250 void ff_vp9_intra_recon_8bpp(VP9TileData *td,
251                              ptrdiff_t y_off, ptrdiff_t uv_off);
252 void ff_vp9_intra_recon_16bpp(VP9TileData *td,
253                               ptrdiff_t y_off, ptrdiff_t uv_off);
254 void ff_vp9_inter_recon_8bpp(VP9TileData *td);
255 void ff_vp9_inter_recon_16bpp(VP9TileData *td);
256
257 #endif /* AVCODEC_VP9DEC_H */