]> git.sesse.net Git - ffmpeg/blob - libavcodec/ffv1.h
ffv1: update to ffv1 version 3
[ffmpeg] / libavcodec / ffv1.h
1 /*
2  * FFV1 codec for libavcodec
3  *
4  * Copyright (c) 2003-2012 Michael Niedermayer <michaelni@gmx.at>
5  *
6  * This file is part of Libav.
7  *
8  * Libav is free software; you can redistribute it and/or
9  * modify it under the terms of the GNU Lesser General Public
10  * License as published by the Free Software Foundation; either
11  * version 2.1 of the License, or (at your option) any later version.
12  *
13  * Libav is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16  * Lesser General Public License for more details.
17  *
18  * You should have received a copy of the GNU Lesser General Public
19  * License along with Libav; if not, write to the Free Software
20  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
21  */
22
23 #ifndef AVCODEC_FFV1_H
24 #define AVCODEC_FFV1_H
25 #include "avcodec.h"
26
27 #define MAX_PLANES 4
28 #define CONTEXT_SIZE 32
29
30 #define MAX_QUANT_TABLES 8
31 #define MAX_CONTEXT_INPUTS 5
32
33 extern const uint8_t ff_log2_run[41];
34
35 extern const int8_t ffv1_quant5_10bit[256];
36 extern const int8_t ffv1_quant5[256];
37 extern const int8_t ffv1_quant9_10bit[256];
38 extern const int8_t ffv1_quant11[256];
39 extern const uint8_t ffv1_ver2_state[256];
40
41 typedef struct VlcState {
42     int16_t drift;
43     uint16_t error_sum;
44     int8_t bias;
45     uint8_t count;
46 } VlcState;
47
48 typedef struct PlaneContext {
49     int16_t quant_table[MAX_CONTEXT_INPUTS][256];
50     int quant_table_index;
51     int context_count;
52     uint8_t (*state)[CONTEXT_SIZE];
53     VlcState *vlc_state;
54     uint8_t interlace_bit_state[2];
55 } PlaneContext;
56
57 #define MAX_SLICES 256
58
59 typedef struct FFV1Context {
60     AVClass *class;
61     AVCodecContext *avctx;
62     RangeCoder c;
63     GetBitContext gb;
64     PutBitContext pb;
65     uint64_t rc_stat[256][2];
66     uint64_t (*rc_stat2[MAX_QUANT_TABLES])[32][2];
67     int version;
68     int minor_version;
69     int width, height;
70     int chroma_planes;
71     int chroma_h_shift, chroma_v_shift;
72     int transparency;
73     int flags;
74     int picture_number;
75     AVFrame picture, last_picture;
76     int plane_count;
77     int ac;     // 1 = range coder <-> 0 = golomb rice
78     int ac_byte_count;      // number of bytes used for AC coding
79     PlaneContext plane[MAX_PLANES];
80     int16_t quant_table[MAX_CONTEXT_INPUTS][256];
81     int16_t quant_tables[MAX_QUANT_TABLES][MAX_CONTEXT_INPUTS][256];
82     int context_count[MAX_QUANT_TABLES];
83     uint8_t state_transition[256];
84     uint8_t (*initial_states[MAX_QUANT_TABLES])[32];
85     int run_index;
86     int colorspace;
87     int16_t *sample_buffer;
88
89     int ec;
90     int slice_damaged;
91     int key_frame_ok;
92
93     int bits_per_raw_sample;
94     int packed_at_lsb;
95
96     int gob_count;
97     int quant_table_count;
98
99     DSPContext dsp;
100
101     struct FFV1Context *slice_context[MAX_SLICES];
102     int slice_count;
103     int num_v_slices;
104     int num_h_slices;
105     int slice_width;
106     int slice_height;
107     int slice_x;
108     int slice_y;
109 } FFV1Context;
110
111 static av_always_inline int fold(int diff, int bits)
112 {
113     if (bits == 8)
114         diff = (int8_t)diff;
115     else {
116         diff +=  1 << (bits  - 1);
117         diff &= (1 <<  bits) - 1;
118         diff -=  1 << (bits  - 1);
119     }
120
121     return diff;
122 }
123
124 static inline int predict(int16_t *src, int16_t *last)
125 {
126     const int LT = last[-1];
127     const int T  = last[0];
128     const int L  = src[-1];
129
130     return mid_pred(L, L + T - LT, T);
131 }
132
133 static inline int get_context(PlaneContext *p, int16_t *src,
134                               int16_t *last, int16_t *last2)
135 {
136     const int LT = last[-1];
137     const int T  = last[0];
138     const int RT = last[1];
139     const int L  = src[-1];
140
141     if (p->quant_table[3][127]) {
142         const int TT = last2[0];
143         const int LL = src[-2];
144         return p->quant_table[0][(L - LT) & 0xFF] +
145                p->quant_table[1][(LT - T) & 0xFF] +
146                p->quant_table[2][(T - RT) & 0xFF] +
147                p->quant_table[3][(LL - L) & 0xFF] +
148                p->quant_table[4][(TT - T) & 0xFF];
149     } else
150         return p->quant_table[0][(L - LT) & 0xFF] +
151                p->quant_table[1][(LT - T) & 0xFF] +
152                p->quant_table[2][(T - RT) & 0xFF];
153 }
154
155 static inline void update_vlc_state(VlcState *const state, const int v)
156 {
157     int drift = state->drift;
158     int count = state->count;
159     state->error_sum += FFABS(v);
160     drift            += v;
161
162     if (count == 128) { // FIXME: variable
163         count            >>= 1;
164         drift            >>= 1;
165         state->error_sum >>= 1;
166     }
167     count++;
168
169     if (drift <= -count) {
170         if (state->bias > -128)
171             state->bias--;
172
173         drift += count;
174         if (drift <= -count)
175             drift = -count + 1;
176     } else if (drift > 0) {
177         if (state->bias < 127)
178             state->bias++;
179
180         drift -= count;
181         if (drift > 0)
182             drift = 0;
183     }
184
185     state->drift = drift;
186     state->count = count;
187 }
188
189 int ffv1_common_init(AVCodecContext *avctx);
190 int ffv1_init_slice_state(FFV1Context *f, FFV1Context *fs);
191 int ffv1_init_slice_contexts(FFV1Context *f);
192 int ffv1_allocate_initial_states(FFV1Context *f);
193 void ffv1_clear_slice_state(FFV1Context *f, FFV1Context *fs);
194 int ffv1_close(AVCodecContext *avctx);
195
196 #endif /* AVCODEC_FFV1_H */