]> git.sesse.net Git - ffmpeg/blob - libavcodec/cfhdenc.c
avcodec/cfhdenc: add gbrap12 pixel format support
[ffmpeg] / libavcodec / cfhdenc.c
1 /*
2  * Copyright (c) 2020 Paul B Mahol
3  *
4  * This file is part of FFmpeg.
5  *
6  * FFmpeg is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU Lesser General Public
8  * License as published by the Free Software Foundation; either
9  * version 2.1 of the License, or (at your option) any later version.
10  *
11  * FFmpeg is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14  * Lesser General Public License for more details.
15  *
16  * You should have received a copy of the GNU Lesser General Public
17  * License along with FFmpeg; if not, write to the Free Software
18  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
19  */
20
21 /**
22  * @file
23  * Cineform HD video encoder
24  */
25
26 #include <stdlib.h>
27 #include <string.h>
28
29 #include "libavutil/avassert.h"
30 #include "libavutil/imgutils.h"
31 #include "libavutil/opt.h"
32
33 #include "avcodec.h"
34 #include "bytestream.h"
35 #include "cfhd.h"
36 #include "put_bits.h"
37 #include "internal.h"
38 #include "thread.h"
39
40 /* Derived from existing tables from decoder */
41 static const unsigned codebook[256][2] = {
42     { 1, 0x00000000 }, { 2, 0x00000002 }, { 3, 0x00000007 }, { 5, 0x00000019 }, { 6, 0x00000030 },
43     { 6, 0x00000036 }, { 7, 0x00000063 }, { 7, 0x0000006B }, { 7, 0x0000006F }, { 8, 0x000000D4 },
44     { 8, 0x000000DC }, { 9, 0x00000189 }, { 9, 0x000001A0 }, { 9, 0x000001AB }, {10, 0x00000310 },
45     {10, 0x00000316 }, {10, 0x00000354 }, {10, 0x00000375 }, {10, 0x00000377 }, {11, 0x00000623 },
46     {11, 0x00000684 }, {11, 0x000006AB }, {11, 0x000006EC }, {12, 0x00000C44 }, {12, 0x00000C5C },
47     {12, 0x00000C5E }, {12, 0x00000D55 }, {12, 0x00000DD1 }, {12, 0x00000DD3 }, {12, 0x00000DDB },
48     {13, 0x0000188B }, {13, 0x000018BB }, {13, 0x00001AA8 }, {13, 0x00001BA0 }, {13, 0x00001BA4 },
49     {13, 0x00001BB5 }, {14, 0x00003115 }, {14, 0x00003175 }, {14, 0x0000317D }, {14, 0x00003553 },
50     {14, 0x00003768 }, {15, 0x00006228 }, {15, 0x000062E8 }, {15, 0x000062F8 }, {15, 0x00006AA4 },
51     {15, 0x00006E85 }, {15, 0x00006E87 }, {15, 0x00006ED3 }, {16, 0x0000C453 }, {16, 0x0000C5D3 },
52     {16, 0x0000C5F3 }, {16, 0x0000DD08 }, {16, 0x0000DD0C }, {16, 0x0000DDA4 }, {17, 0x000188A4 },
53     {17, 0x00018BA5 }, {17, 0x00018BE5 }, {17, 0x0001AA95 }, {17, 0x0001AA97 }, {17, 0x0001BA13 },
54     {17, 0x0001BB4A }, {17, 0x0001BB4B }, {18, 0x00031748 }, {18, 0x000317C8 }, {18, 0x00035528 },
55     {18, 0x0003552C }, {18, 0x00037424 }, {18, 0x00037434 }, {18, 0x00037436 }, {19, 0x00062294 },
56     {19, 0x00062E92 }, {19, 0x00062F92 }, {19, 0x0006AA52 }, {19, 0x0006AA5A }, {19, 0x0006E84A },
57     {19, 0x0006E86A }, {19, 0x0006E86E }, {20, 0x000C452A }, {20, 0x000C5D27 }, {20, 0x000C5F26 },
58     {20, 0x000D54A6 }, {20, 0x000D54B6 }, {20, 0x000DD096 }, {20, 0x000DD0D6 }, {20, 0x000DD0DE },
59     {21, 0x00188A56 }, {21, 0x0018BA4D }, {21, 0x0018BE4E }, {21, 0x0018BE4F }, {21, 0x001AA96E },
60     {21, 0x001BA12E }, {21, 0x001BA12F }, {21, 0x001BA1AF }, {21, 0x001BA1BF }, {22, 0x00317498 },
61     {22, 0x0035529C }, {22, 0x0035529D }, {22, 0x003552DE }, {22, 0x003552DF }, {22, 0x0037435D },
62     {22, 0x0037437D }, {23, 0x0062295D }, {23, 0x0062E933 }, {23, 0x006AA53D }, {23, 0x006AA53E },
63     {23, 0x006AA53F }, {23, 0x006E86B9 }, {23, 0x006E86F8 }, {24, 0x00C452B8 }, {24, 0x00C5D265 },
64     {24, 0x00D54A78 }, {24, 0x00D54A79 }, {24, 0x00DD0D70 }, {24, 0x00DD0D71 }, {24, 0x00DD0DF2 },
65     {24, 0x00DD0DF3 }, {26, 0x03114BA2 }, {25, 0x0188A5B1 }, {25, 0x0188A58B }, {25, 0x0188A595 },
66     {25, 0x0188A5D6 }, {25, 0x0188A5D7 }, {25, 0x0188A5A8 }, {25, 0x0188A5AE }, {25, 0x0188A5AF },
67     {25, 0x0188A5C4 }, {25, 0x0188A5C5 }, {25, 0x0188A587 }, {25, 0x0188A584 }, {25, 0x0188A585 },
68     {25, 0x0188A5C6 }, {25, 0x0188A5C7 }, {25, 0x0188A5CC }, {25, 0x0188A5CD }, {25, 0x0188A581 },
69     {25, 0x0188A582 }, {25, 0x0188A583 }, {25, 0x0188A5CE }, {25, 0x0188A5CF }, {25, 0x0188A5C2 },
70     {25, 0x0188A5C3 }, {25, 0x0188A5C1 }, {25, 0x0188A5B4 }, {25, 0x0188A5B5 }, {25, 0x0188A5E6 },
71     {25, 0x0188A5E7 }, {25, 0x0188A5E4 }, {25, 0x0188A5E5 }, {25, 0x0188A5AB }, {25, 0x0188A5E0 },
72     {25, 0x0188A5E1 }, {25, 0x0188A5E2 }, {25, 0x0188A5E3 }, {25, 0x0188A5B6 }, {25, 0x0188A5B7 },
73     {25, 0x0188A5FD }, {25, 0x0188A57E }, {25, 0x0188A57F }, {25, 0x0188A5EC }, {25, 0x0188A5ED },
74     {25, 0x0188A5FE }, {25, 0x0188A5FF }, {25, 0x0188A57D }, {25, 0x0188A59C }, {25, 0x0188A59D },
75     {25, 0x0188A5E8 }, {25, 0x0188A5E9 }, {25, 0x0188A5EA }, {25, 0x0188A5EB }, {25, 0x0188A5EF },
76     {25, 0x0188A57A }, {25, 0x0188A57B }, {25, 0x0188A578 }, {25, 0x0188A579 }, {25, 0x0188A5BA },
77     {25, 0x0188A5BB }, {25, 0x0188A5B8 }, {25, 0x0188A5B9 }, {25, 0x0188A588 }, {25, 0x0188A589 },
78     {25, 0x018BA4C8 }, {25, 0x018BA4C9 }, {25, 0x0188A5FA }, {25, 0x0188A5FB }, {25, 0x0188A5BC },
79     {25, 0x0188A5BD }, {25, 0x0188A598 }, {25, 0x0188A599 }, {25, 0x0188A5F4 }, {25, 0x0188A5F5 },
80     {25, 0x0188A59B }, {25, 0x0188A5DE }, {25, 0x0188A5DF }, {25, 0x0188A596 }, {25, 0x0188A597 },
81     {25, 0x0188A5F8 }, {25, 0x0188A5F9 }, {25, 0x0188A5F1 }, {25, 0x0188A58E }, {25, 0x0188A58F },
82     {25, 0x0188A5DC }, {25, 0x0188A5DD }, {25, 0x0188A5F2 }, {25, 0x0188A5F3 }, {25, 0x0188A58C },
83     {25, 0x0188A58D }, {25, 0x0188A5A4 }, {25, 0x0188A5F0 }, {25, 0x0188A5A5 }, {25, 0x0188A5A6 },
84     {25, 0x0188A5A7 }, {25, 0x0188A59A }, {25, 0x0188A5A2 }, {25, 0x0188A5A3 }, {25, 0x0188A58A },
85     {25, 0x0188A5B0 }, {25, 0x0188A5A0 }, {25, 0x0188A5A1 }, {25, 0x0188A5DA }, {25, 0x0188A5DB },
86     {25, 0x0188A59E }, {25, 0x0188A59F }, {25, 0x0188A5D8 }, {25, 0x0188A5EE }, {25, 0x0188A5D9 },
87     {25, 0x0188A5F6 }, {25, 0x0188A5F7 }, {25, 0x0188A57C }, {25, 0x0188A5C8 }, {25, 0x0188A5C9 },
88     {25, 0x0188A594 }, {25, 0x0188A5FC }, {25, 0x0188A5CA }, {25, 0x0188A5CB }, {25, 0x0188A5B2 },
89     {25, 0x0188A5AA }, {25, 0x0188A5B3 }, {25, 0x0188A572 }, {25, 0x0188A573 }, {25, 0x0188A5C0 },
90     {25, 0x0188A5BE }, {25, 0x0188A5BF }, {25, 0x0188A592 }, {25, 0x0188A580 }, {25, 0x0188A593 },
91     {25, 0x0188A590 }, {25, 0x0188A591 }, {25, 0x0188A586 }, {25, 0x0188A5A9 }, {25, 0x0188A5D2 },
92     {25, 0x0188A5D3 }, {25, 0x0188A5D4 }, {25, 0x0188A5D5 }, {25, 0x0188A5AC }, {25, 0x0188A5AD },
93     {25, 0x0188A5D0 },
94 };
95
96 /* Derived by extracting runcodes from existing tables from decoder */
97 static const uint16_t runbook[8][3] = {
98     {1,  0x0000,   1}, {7,  0x0069,  12}, {8,  0x00D1,  20}, {9,  0x018A,  32},
99     {10, 0x0343,  60}, {11, 0x0685, 100}, {13, 0x18BF, 180}, {13, 0x1BA5, 320},
100 };
101
102 /*
103  * Derived by inspecting various quality encodes
104  * and adding some more from scratch.
105  */
106 static const uint16_t quantization_per_subband[2][3][13][9] = {
107     {{
108         { 16, 16,  8,  4,  4,  2,   3,   3,   4, }, // film3+
109         { 16, 16,  8,  4,  4,  2,   3,   3,   4, }, // film3
110         { 16, 16,  8,  4,  4,  2,   4,   4,   6, }, // film2+
111         { 16, 16,  8,  4,  4,  2,   4,   4,   6, }, // film2
112         { 16, 16,  8,  4,  4,  2,   8,   8,  12, }, // film1++
113         { 24, 24, 12,  6,  6,  3,  12,  12,  18, }, // film1+
114         { 24, 24, 12,  6,  6,  3,  12,  12,  18, }, // film1
115         { 32, 32, 24,  8,  8,  6,  16,  16,  24, }, // high+
116         { 32, 32, 24,  8,  8,  6,  16,  16,  24, }, // high
117         { 48, 48, 32, 12, 12,  8,  32,  32,  48, }, // medium+
118         { 48, 48, 32, 12, 12,  8,  32,  32,  48, }, // medium
119         { 64, 64, 48, 16, 16, 12,  48,  48,  64, }, // low+
120         { 64, 64, 48, 16, 16, 12,  64,  64,  96, }, // low
121     },
122     {
123         { 16, 16,  8,  4,  4,  2,   3,   3,   4, },
124         { 16, 16,  8,  4,  4,  2,   3,   3,   6, },
125         { 16, 16,  8,  4,  4,  2,   4,   4,   6, },
126         { 16, 16,  8,  4,  4,  2,   4,   4,   8, },
127         { 16, 16,  8,  4,  4,  2,   8,   8,  16, },
128         { 24, 24, 12,  6,  6,  3,  12,  12,  18, },
129         { 24, 24, 12,  6,  6,  3,  12,  12,  24, },
130         { 32, 32, 24,  8,  8,  6,  16,  16,  24, },
131         { 48, 48, 32, 12, 12,  8,  16,  16,  32, },
132         { 48, 48, 32, 12, 12,  8,  32,  32,  48, },
133         { 48, 48, 32, 12, 12,  8,  32,  32,  64, },
134         { 64, 64, 48, 16, 16, 12,  48,  48,  64, },
135         { 64, 64, 48, 16, 16, 12,  64,  64,  96, },
136     },
137     {
138         { 16, 16,  8,  4,  4,  2,   3,   3,   4, },
139         { 16, 16,  8,  4,  4,  2,   3,   3,   6, },
140         { 16, 16,  8,  4,  4,  2,   4,   4,   6, },
141         { 16, 16,  8,  4,  4,  2,   4,   4,   8, },
142         { 16, 16,  8,  4,  4,  2,   8,   8,  16, },
143         { 24, 24, 12,  6,  6,  3,  12,  12,  18, },
144         { 24, 24, 12,  6,  6,  3,  12,  12,  24, },
145         { 32, 32, 24,  8,  8,  6,  16,  16,  24, },
146         { 48, 48, 32, 12, 12,  8,  16,  16,  32, },
147         { 48, 48, 32, 12, 12,  8,  32,  32,  48, },
148         { 48, 48, 32, 12, 12,  8,  32,  32,  64, },
149         { 64, 64, 48, 16, 16, 12,  48,  48,  64, },
150         { 64, 64, 48, 16, 16, 12,  64,  64,  96, },
151     }},
152     {{
153         { 16, 16,  8, 16, 16,  8,  24,  24,  36, },
154         { 16, 16,  8, 16, 16,  8,  32,  32,  48, },
155         { 16, 16,  8, 16, 16,  8,  48,  48,  72, },
156         { 16, 16,  8, 16, 16,  8,  64,  64,  96, },
157         { 16, 16,  8, 20, 20, 10,  80,  80, 128, },
158         { 24, 24, 12, 24, 24, 12,  96,  96, 144, },
159         { 24, 24, 12, 24, 24, 12, 128, 128, 192, },
160         { 32, 32, 24, 32, 32, 24, 192, 192, 288, },
161         { 32, 32, 24, 32, 32, 24, 256, 256, 384, },
162         { 48, 48, 32, 48, 48, 32, 256, 256, 384, },
163         { 48, 48, 32, 48, 48, 32, 512, 512, 768, },
164         { 56, 56, 40, 56, 56, 40, 512, 512, 768, },
165         { 64, 64, 48, 64, 64, 48, 512, 512, 768, },
166     },
167     {
168         { 16, 16,  8, 16, 16,  8,  24,  24,  36, },
169         { 16, 16,  8, 16, 16,  8,  32,  32,  48, },
170         { 16, 16,  8, 16, 16,  8,  48,  48,  72, },
171         { 16, 16,  8, 16, 16,  8,  64,  64,  96, },
172         { 16, 16,  8, 20, 20, 10,  80,  80, 128, },
173         { 24, 24, 12, 24, 24, 12,  96,  96, 144, },
174         { 24, 24, 12, 24, 24, 12, 128, 128, 192, },
175         { 32, 32, 24, 32, 32, 24, 192, 192, 288, },
176         { 32, 32, 24, 32, 32, 24, 256, 256, 384, },
177         { 48, 48, 32, 48, 48, 32, 256, 256, 384, },
178         { 48, 48, 32, 48, 48, 32, 512, 512, 768, },
179         { 56, 56, 40, 56, 56, 40, 512, 512, 768, },
180         { 64, 64, 48, 64, 64, 48, 512, 512, 768, },
181     },
182     {
183         { 16, 16,  8, 16, 16,  8,  24,  24,  36, },
184         { 16, 16,  8, 16, 16,  8,  32,  32,  48, },
185         { 16, 16,  8, 16, 16,  8,  48,  48,  72, },
186         { 16, 16,  8, 16, 16,  8,  64,  64,  96, },
187         { 16, 16, 10, 20, 20, 10,  80,  80, 128, },
188         { 24, 24, 12, 24, 24, 12,  96,  96, 144, },
189         { 24, 24, 12, 24, 24, 12, 128, 128, 192, },
190         { 32, 32, 24, 32, 32, 24, 192, 192, 288, },
191         { 32, 32, 24, 32, 32, 24, 256, 256, 384, },
192         { 48, 48, 32, 48, 48, 32, 256, 256, 384, },
193         { 48, 48, 32, 48, 48, 32, 512, 512, 768, },
194         { 56, 56, 40, 56, 56, 40, 512, 512, 768, },
195         { 64, 64, 48, 64, 64, 48, 512, 512, 768, },
196     }},
197 };
198
199 typedef struct Codebook {
200     unsigned bits;
201     unsigned size;
202 } Codebook;
203
204 typedef struct Runbook {
205     unsigned size;
206     unsigned bits;
207     unsigned run;
208 } Runbook;
209
210 typedef struct PlaneEnc {
211     unsigned size;
212
213     int16_t *dwt_buf;
214     int16_t *dwt_tmp;
215
216     unsigned quantization[SUBBAND_COUNT];
217     int16_t *subband[SUBBAND_COUNT];
218     int16_t *l_h[8];
219
220     SubBand band[DWT_LEVELS][4];
221 } PlaneEnc;
222
223 typedef struct CFHDEncContext {
224     const AVClass *class;
225
226     PutBitContext       pb;
227     PutByteContext      pby;
228
229     int quality;
230     int planes;
231     int chroma_h_shift;
232     int chroma_v_shift;
233     PlaneEnc plane[4];
234
235     uint16_t lut[1024];
236     Runbook  rb[321];
237     Codebook cb[513];
238     int16_t *alpha;
239 } CFHDEncContext;
240
241 static av_cold int cfhd_encode_init(AVCodecContext *avctx)
242 {
243     CFHDEncContext *s = avctx->priv_data;
244     const int sign_mask = 256;
245     const int twos_complement = -sign_mask;
246     const int mag_mask = sign_mask - 1;
247     int ret, last = 0;
248
249     ret = av_pix_fmt_get_chroma_sub_sample(avctx->pix_fmt,
250                                            &s->chroma_h_shift,
251                                            &s->chroma_v_shift);
252     if (ret < 0)
253         return ret;
254
255     if (avctx->width & 15) {
256         av_log(avctx, AV_LOG_ERROR, "Width must be multiple of 16.\n");
257         return AVERROR_INVALIDDATA;
258     }
259
260     s->planes = av_pix_fmt_count_planes(avctx->pix_fmt);
261
262     for (int i = 0; i < s->planes; i++) {
263         int w8, h8, w4, h4, w2, h2;
264         int width  = i ? avctx->width >> s->chroma_h_shift : avctx->width;
265         int height = i ? FFALIGN(avctx->height >> s->chroma_v_shift, 8) :
266                          FFALIGN(avctx->height >> s->chroma_v_shift, 8);
267         ptrdiff_t stride = FFALIGN(width / 8, 8) * 8;
268
269         w8 = FFALIGN(width / 8, 8);
270         h8 = height / 8;
271         w4 = w8 * 2;
272         h4 = h8 * 2;
273         w2 = w4 * 2;
274         h2 = h4 * 2;
275
276         s->plane[i].dwt_buf =
277             av_mallocz_array(height * stride, sizeof(*s->plane[i].dwt_buf));
278         s->plane[i].dwt_tmp =
279             av_malloc_array(height * stride, sizeof(*s->plane[i].dwt_tmp));
280         if (!s->plane[i].dwt_buf || !s->plane[i].dwt_tmp)
281             return AVERROR(ENOMEM);
282
283         s->plane[i].subband[0] = s->plane[i].dwt_buf;
284         s->plane[i].subband[1] = s->plane[i].dwt_buf + 2 * w8 * h8;
285         s->plane[i].subband[2] = s->plane[i].dwt_buf + 1 * w8 * h8;
286         s->plane[i].subband[3] = s->plane[i].dwt_buf + 3 * w8 * h8;
287         s->plane[i].subband[4] = s->plane[i].dwt_buf + 2 * w4 * h4;
288         s->plane[i].subband[5] = s->plane[i].dwt_buf + 1 * w4 * h4;
289         s->plane[i].subband[6] = s->plane[i].dwt_buf + 3 * w4 * h4;
290         s->plane[i].subband[7] = s->plane[i].dwt_buf + 2 * w2 * h2;
291         s->plane[i].subband[8] = s->plane[i].dwt_buf + 1 * w2 * h2;
292         s->plane[i].subband[9] = s->plane[i].dwt_buf + 3 * w2 * h2;
293
294         for (int j = 0; j < DWT_LEVELS; j++) {
295             for (int k = 0; k < FF_ARRAY_ELEMS(s->plane[i].band[j]); k++) {
296                 s->plane[i].band[j][k].width  = (width / 8) << j;
297                 s->plane[i].band[j][k].height = (height / 8) << j;
298                 s->plane[i].band[j][k].a_width  = w8 << j;
299                 s->plane[i].band[j][k].a_height = h8 << j;
300             }
301         }
302
303         /* ll2 and ll1 commented out because they are done in-place */
304         s->plane[i].l_h[0] = s->plane[i].dwt_tmp;
305         s->plane[i].l_h[1] = s->plane[i].dwt_tmp + 2 * w8 * h8;
306         // s->plane[i].l_h[2] = ll2;
307         s->plane[i].l_h[3] = s->plane[i].dwt_tmp;
308         s->plane[i].l_h[4] = s->plane[i].dwt_tmp + 2 * w4 * h4;
309         // s->plane[i].l_h[5] = ll1;
310         s->plane[i].l_h[6] = s->plane[i].dwt_tmp;
311         s->plane[i].l_h[7] = s->plane[i].dwt_tmp + 2 * w2 * h2;
312     }
313
314     for (int i = 0; i < 512; i++) {
315         int value = (i & sign_mask) ? twos_complement + (i & mag_mask): i;
316         int mag = FFMIN(FFABS(value), 255);
317
318         if (mag) {
319             s->cb[i].bits = (codebook[mag][1] << 1) | (value > 0 ? 0 : 1);
320             s->cb[i].size = codebook[mag][0] + 1;
321         } else {
322             s->cb[i].bits = codebook[mag][1];
323             s->cb[i].size = codebook[mag][0];
324         }
325     }
326
327     s->cb[512].bits = 0x3114ba3;
328     s->cb[512].size = 26;
329
330     s->rb[0].run = 0;
331
332     for (int i = 1, j = 0; i < 320 && j < 7; j++) {
333         int run = runbook[j][2];
334         int end = runbook[j+1][2];
335
336         while (i < end) {
337             s->rb[i].run = run;
338             s->rb[i].bits = runbook[j][1];
339             s->rb[i++].size = runbook[j][0];
340         }
341     }
342
343     s->rb[320].bits = runbook[7][1];
344     s->rb[320].size = runbook[7][0];
345     s->rb[320].run = 320;
346
347     for (int i = 0; i < 256; i++) {
348         int idx = i + ((768LL * i * i * i) / (256 * 256 * 256));
349
350         s->lut[idx] = i;
351     }
352     for (int i = 0; i < 1024; i++) {
353         if (s->lut[i])
354             last = s->lut[i];
355         else
356             s->lut[i] = last;
357     }
358
359     s->alpha = av_calloc(avctx->width * avctx->height, sizeof(*s->alpha));
360     if (!s->alpha)
361         return AVERROR(ENOMEM);
362
363     return 0;
364 }
365
366 static inline void filter(int16_t *input, ptrdiff_t in_stride,
367                           int16_t *low, ptrdiff_t low_stride,
368                           int16_t *high, ptrdiff_t high_stride,
369                           int len)
370 {
371     low[(0>>1) * low_stride]   = av_clip_int16(input[0*in_stride] + input[1*in_stride]);
372     high[(0>>1) * high_stride] = av_clip_int16((5 * input[0*in_stride] - 11 * input[1*in_stride] +
373                                                 4 * input[2*in_stride] +  4 * input[3*in_stride] -
374                                                 1 * input[4*in_stride] -  1 * input[5*in_stride] + 4) >> 3);
375
376     for (int i = 2; i < len - 2; i += 2) {
377         low[(i>>1) * low_stride]   = av_clip_int16(input[i*in_stride] + input[(i+1)*in_stride]);
378         high[(i>>1) * high_stride] = av_clip_int16(((-input[(i-2)*in_stride] - input[(i-1)*in_stride] +
379                                                       input[(i+2)*in_stride] + input[(i+3)*in_stride] + 4) >> 3) +
380                                                       input[(i+0)*in_stride] - input[(i+1)*in_stride]);
381     }
382
383     low[((len-2)>>1) * low_stride]   = av_clip_int16(input[((len-2)+0)*in_stride] + input[((len-2)+1)*in_stride]);
384     high[((len-2)>>1) * high_stride] = av_clip_int16((11* input[((len-2)+0)*in_stride] - 5 * input[((len-2)+1)*in_stride] -
385                                                       4 * input[((len-2)-1)*in_stride] - 4 * input[((len-2)-2)*in_stride] +
386                                                       1 * input[((len-2)-3)*in_stride] + 1 * input[((len-2)-4)*in_stride] + 4) >> 3);
387 }
388
389 static void horiz_filter(int16_t *input, int16_t *low, int16_t *high,
390                          int width)
391 {
392     filter(input, 1, low, 1, high, 1, width);
393 }
394
395 static void vert_filter(int16_t *input, ptrdiff_t in_stride,
396                         int16_t *low, ptrdiff_t low_stride,
397                         int16_t *high, ptrdiff_t high_stride, int len)
398 {
399     filter(input, in_stride, low, low_stride, high, high_stride, len);
400 }
401
402 static void quantize_band(int16_t *input, int width, int a_width,
403                           int height, unsigned quantization)
404 {
405     const int factor = (1 << 16) / quantization;
406
407     for (int i = 0; i < height; i++) {
408         for (int j = 0; j < width; j++)
409             input[j] = av_clip_intp2((input[j] * factor) / 65536, 10);
410         input += a_width;
411     }
412 }
413
414 static int put_runcode(PutBitContext *pb, int count, const Runbook *const rb)
415 {
416     while (count > 0) {
417         const int index = FFMIN(320, count);
418
419         put_bits(pb, rb[index].size, rb[index].bits);
420         count -= rb[index].run;
421     }
422
423     return 0;
424 }
425
426 static void process_alpha(const int16_t *src, int width, int height, ptrdiff_t stride, int16_t *dst)
427 {
428     for (int i = 0; i < height; i++) {
429         for (int j = 0; j < width; j++) {
430             int alpha = src[j];
431
432             if (alpha > 0 && alpha < 4080) {
433                 alpha *= 223;
434                 alpha += 128;
435                 alpha >>= 8;
436                 alpha += 256;
437             }
438
439             dst[j] = av_clip_uintp2(alpha, 12);
440         }
441
442         src += stride;
443         dst += width;
444     }
445 }
446
447 static int cfhd_encode_frame(AVCodecContext *avctx, AVPacket *pkt,
448                              const AVFrame *frame, int *got_packet)
449 {
450     CFHDEncContext *s = avctx->priv_data;
451     PutByteContext *pby = &s->pby;
452     PutBitContext *pb = &s->pb;
453     const Codebook *const cb = s->cb;
454     const Runbook *const rb = s->rb;
455     const uint16_t *lut = s->lut;
456     unsigned pos;
457     int ret;
458
459     for (int plane = 0; plane < s->planes; plane++) {
460         int width = s->plane[plane].band[2][0].width;
461         int a_width = s->plane[plane].band[2][0].a_width;
462         int height = s->plane[plane].band[2][0].height;
463         int act_plane = plane == 1 ? 2 : plane == 2 ? 1 : plane;
464         int16_t *input = (int16_t *)frame->data[act_plane];
465         int16_t *low = s->plane[plane].l_h[6];
466         int16_t *high = s->plane[plane].l_h[7];
467         ptrdiff_t in_stride = frame->linesize[act_plane] / 2;
468         int low_stride, high_stride;
469
470         if (plane == 3) {
471             process_alpha(input, avctx->width, avctx->height,
472                           in_stride, s->alpha);
473             input = s->alpha;
474             in_stride = avctx->width;
475         }
476
477         for (int i = 0; i < height * 2; i++) {
478             horiz_filter(input, low, high, width * 2);
479             input += in_stride;
480             low += a_width;
481             high += a_width;
482         }
483
484         input = s->plane[plane].l_h[7];
485         low = s->plane[plane].subband[7];
486         low_stride = s->plane[plane].band[2][0].a_width;
487         high = s->plane[plane].subband[9];
488         high_stride = s->plane[plane].band[2][0].a_width;
489
490         for (int i = 0; i < width; i++) {
491             vert_filter(input, a_width, low, low_stride, high, high_stride, height * 2);
492             input++;
493             low++;
494             high++;
495         }
496
497         input = s->plane[plane].l_h[6];
498         low = s->plane[plane].l_h[7];
499         high = s->plane[plane].subband[8];
500
501         for (int i = 0; i < width; i++) {
502             vert_filter(input, a_width, low, low_stride, high, high_stride, height * 2);
503             input++;
504             low++;
505             high++;
506         }
507
508         a_width = s->plane[plane].band[1][0].a_width;
509         width = s->plane[plane].band[1][0].width;
510         height = s->plane[plane].band[1][0].height;
511         input = s->plane[plane].l_h[7];
512         low = s->plane[plane].l_h[3];
513         low_stride = s->plane[plane].band[1][0].a_width;
514         high = s->plane[plane].l_h[4];
515         high_stride = s->plane[plane].band[1][0].a_width;
516
517         for (int i = 0; i < height * 2; i++) {
518             for (int j = 0; j < width * 2; j++)
519                 input[j] /= 4;
520             input += a_width * 2;
521         }
522
523         input = s->plane[plane].l_h[7];
524         for (int i = 0; i < height * 2; i++) {
525             horiz_filter(input, low, high, width * 2);
526             input += a_width * 2;
527             low += low_stride;
528             high += high_stride;
529         }
530
531         input = s->plane[plane].l_h[4];
532         low = s->plane[plane].subband[4];
533         high = s->plane[plane].subband[6];
534
535         for (int i = 0; i < width; i++) {
536             vert_filter(input, a_width, low, low_stride, high, high_stride, height * 2);
537             input++;
538             low++;
539             high++;
540         }
541
542         input = s->plane[plane].l_h[3];
543         low = s->plane[plane].l_h[4];
544         high = s->plane[plane].subband[5];
545
546         for (int i = 0; i < width; i++) {
547             vert_filter(input, a_width, low, low_stride, high, high_stride, height * 2);
548             input++;
549             low++;
550             high++;
551         }
552
553         a_width = s->plane[plane].band[0][0].a_width;
554         width = s->plane[plane].band[0][0].width;
555         height = s->plane[plane].band[0][0].height;
556         input = s->plane[plane].l_h[4];
557         low = s->plane[plane].l_h[0];
558         low_stride = s->plane[plane].band[0][0].a_width;
559         high = s->plane[plane].l_h[1];
560         high_stride = s->plane[plane].band[0][0].a_width;
561
562         if (avctx->pix_fmt != AV_PIX_FMT_YUV422P10) {
563             for (int i = 0; i < height * 2; i++) {
564                 for (int j = 0; j < width * 2; j++)
565                     input[j] /= 4;
566                 input += a_width * 2;
567             }
568         }
569
570         input = s->plane[plane].l_h[4];
571         for (int i = 0; i < height * 2; i++) {
572             horiz_filter(input, low, high, width * 2);
573             input += a_width * 2;
574             low += low_stride;
575             high += high_stride;
576         }
577
578         low = s->plane[plane].subband[1];
579         high = s->plane[plane].subband[3];
580         input = s->plane[plane].l_h[1];
581
582         for (int i = 0; i < width; i++) {
583             vert_filter(input, a_width, low, low_stride, high, high_stride, height * 2);
584             input++;
585             low++;
586             high++;
587         }
588
589         low = s->plane[plane].subband[0];
590         high = s->plane[plane].subband[2];
591         input = s->plane[plane].l_h[0];
592
593         for (int i = 0; i < width; i++) {
594             vert_filter(input, a_width, low, low_stride, high, high_stride, height * 2);
595             input++;
596             low++;
597             high++;
598         }
599     }
600
601     ret = ff_alloc_packet2(avctx, pkt, 64LL + s->planes * (2LL * avctx->width * avctx->height + 1000LL), 0);
602     if (ret < 0)
603         return ret;
604
605     bytestream2_init_writer(pby, pkt->data, pkt->size);
606
607     bytestream2_put_be16(pby, SampleType);
608     bytestream2_put_be16(pby, 9);
609
610     bytestream2_put_be16(pby, SampleIndexTable);
611     bytestream2_put_be16(pby, s->planes);
612
613     for (int i = 0; i < s->planes; i++)
614         bytestream2_put_be32(pby, 0);
615
616     bytestream2_put_be16(pby, TransformType);
617     bytestream2_put_be16(pby, 0);
618
619     bytestream2_put_be16(pby, NumFrames);
620     bytestream2_put_be16(pby, 1);
621
622     bytestream2_put_be16(pby, ChannelCount);
623     bytestream2_put_be16(pby, s->planes);
624
625     bytestream2_put_be16(pby, EncodedFormat);
626     bytestream2_put_be16(pby, avctx->pix_fmt == AV_PIX_FMT_YUV422P10 ? 1 : 3 + (s->planes == 4));
627
628     bytestream2_put_be16(pby, WaveletCount);
629     bytestream2_put_be16(pby, 3);
630
631     bytestream2_put_be16(pby, SubbandCount);
632     bytestream2_put_be16(pby, SUBBAND_COUNT);
633
634     bytestream2_put_be16(pby, NumSpatial);
635     bytestream2_put_be16(pby, 2);
636
637     bytestream2_put_be16(pby, FirstWavelet);
638     bytestream2_put_be16(pby, 3);
639
640     bytestream2_put_be16(pby, ImageWidth);
641     bytestream2_put_be16(pby, avctx->width);
642
643     bytestream2_put_be16(pby, ImageHeight);
644     bytestream2_put_be16(pby, avctx->height);
645
646     bytestream2_put_be16(pby, -FrameNumber);
647     bytestream2_put_be16(pby, avctx->frame_number);
648
649     bytestream2_put_be16(pby, Precision);
650     bytestream2_put_be16(pby, avctx->pix_fmt == AV_PIX_FMT_YUV422P10 ? 10 : 12);
651
652     bytestream2_put_be16(pby, PrescaleTable);
653     bytestream2_put_be16(pby, avctx->pix_fmt == AV_PIX_FMT_YUV422P10 ? 0x2000 : 0x2800);
654
655     bytestream2_put_be16(pby, SampleFlags);
656     bytestream2_put_be16(pby, 1);
657
658     for (int p = 0; p < s->planes; p++) {
659         int width = s->plane[p].band[0][0].width;
660         int a_width = s->plane[p].band[0][0].a_width;
661         int height = s->plane[p].band[0][0].height;
662         int16_t *data = s->plane[p].subband[0];
663
664         if (p) {
665             bytestream2_put_be16(pby, SampleType);
666             bytestream2_put_be16(pby, 3);
667
668             bytestream2_put_be16(pby, ChannelNumber);
669             bytestream2_put_be16(pby, p);
670         }
671
672         bytestream2_put_be16(pby, BitstreamMarker);
673         bytestream2_put_be16(pby, 0x1a4a);
674
675         pos = bytestream2_tell_p(pby);
676
677         bytestream2_put_be16(pby, LowpassSubband);
678         bytestream2_put_be16(pby, 0);
679
680         bytestream2_put_be16(pby, NumLevels);
681         bytestream2_put_be16(pby, 3);
682
683         bytestream2_put_be16(pby, LowpassWidth);
684         bytestream2_put_be16(pby, width);
685
686         bytestream2_put_be16(pby, LowpassHeight);
687         bytestream2_put_be16(pby, height);
688
689         bytestream2_put_be16(pby, PixelOffset);
690         bytestream2_put_be16(pby, 0);
691
692         bytestream2_put_be16(pby, LowpassQuantization);
693         bytestream2_put_be16(pby, 1);
694
695         bytestream2_put_be16(pby, LowpassPrecision);
696         bytestream2_put_be16(pby, 16);
697
698         bytestream2_put_be16(pby, BitstreamMarker);
699         bytestream2_put_be16(pby, 0x0f0f);
700
701         for (int i = 0; i < height; i++) {
702             for (int j = 0; j < width; j++)
703                 bytestream2_put_be16(pby, data[j]);
704             data += a_width;
705         }
706
707         bytestream2_put_be16(pby, BitstreamMarker);
708         bytestream2_put_be16(pby, 0x1b4b);
709
710         for (int l = 0; l < 3; l++) {
711             for (int i = 0; i < 3; i++) {
712                 s->plane[p].quantization[1 + l * 3 + i] = quantization_per_subband[avctx->pix_fmt != AV_PIX_FMT_YUV422P10][p >= 3 ? 0 : p][s->quality][l * 3 + i];
713             }
714         }
715
716         for (int l = 0; l < 3; l++) {
717             int a_width = s->plane[p].band[l][0].a_width;
718             int width = s->plane[p].band[l][0].width;
719             int stride = FFALIGN(width, 8);
720             int height = s->plane[p].band[l][0].height;
721
722             bytestream2_put_be16(pby, BitstreamMarker);
723             bytestream2_put_be16(pby, 0x0d0d);
724
725             bytestream2_put_be16(pby, WaveletType);
726             bytestream2_put_be16(pby, 3 + 2 * (l == 2));
727
728             bytestream2_put_be16(pby, WaveletNumber);
729             bytestream2_put_be16(pby, 3 - l);
730
731             bytestream2_put_be16(pby, WaveletLevel);
732             bytestream2_put_be16(pby, 3 - l);
733
734             bytestream2_put_be16(pby, NumBands);
735             bytestream2_put_be16(pby, 4);
736
737             bytestream2_put_be16(pby, HighpassWidth);
738             bytestream2_put_be16(pby, width);
739
740             bytestream2_put_be16(pby, HighpassHeight);
741             bytestream2_put_be16(pby, height);
742
743             bytestream2_put_be16(pby, LowpassBorder);
744             bytestream2_put_be16(pby, 0);
745
746             bytestream2_put_be16(pby, HighpassBorder);
747             bytestream2_put_be16(pby, 0);
748
749             bytestream2_put_be16(pby, LowpassScale);
750             bytestream2_put_be16(pby, 1);
751
752             bytestream2_put_be16(pby, LowpassDivisor);
753             bytestream2_put_be16(pby, 1);
754
755             for (int i = 0; i < 3; i++) {
756                 int16_t *data = s->plane[p].subband[1 + l * 3 + i];
757                 int count = 0, padd = 0;
758
759                 bytestream2_put_be16(pby, BitstreamMarker);
760                 bytestream2_put_be16(pby, 0x0e0e);
761
762                 bytestream2_put_be16(pby, SubbandNumber);
763                 bytestream2_put_be16(pby, i + 1);
764
765                 bytestream2_put_be16(pby, BandCodingFlags);
766                 bytestream2_put_be16(pby, 1);
767
768                 bytestream2_put_be16(pby, BandWidth);
769                 bytestream2_put_be16(pby, width);
770
771                 bytestream2_put_be16(pby, BandHeight);
772                 bytestream2_put_be16(pby, height);
773
774                 bytestream2_put_be16(pby, SubbandBand);
775                 bytestream2_put_be16(pby, 1 + l * 3 + i);
776
777                 bytestream2_put_be16(pby, BandEncoding);
778                 bytestream2_put_be16(pby, 3);
779
780                 bytestream2_put_be16(pby, Quantization);
781                 bytestream2_put_be16(pby, s->plane[p].quantization[1 + l * 3 + i]);
782
783                 bytestream2_put_be16(pby, BandScale);
784                 bytestream2_put_be16(pby, 1);
785
786                 bytestream2_put_be16(pby, BandHeader);
787                 bytestream2_put_be16(pby, 0);
788
789                 quantize_band(data, width, a_width, height,
790                               s->plane[p].quantization[1 + l * 3 + i]);
791
792                 init_put_bits(pb, pkt->data + bytestream2_tell_p(pby), bytestream2_get_bytes_left_p(pby));
793
794                 for (int m = 0; m < height; m++) {
795                     for (int j = 0; j < stride; j++) {
796                         int16_t index = FFSIGN(data[j]) * lut[FFABS(data[j])];
797
798                         if (index < 0)
799                             index += 512;
800                         if (index == 0) {
801                             count++;
802                             continue;
803                         } else if (count > 0) {
804                             count = put_runcode(pb, count, rb);
805                         }
806
807                         put_bits(pb, cb[index].size, cb[index].bits);
808                     }
809
810                     data += a_width;
811                 }
812
813                 if (count > 0) {
814                     count = put_runcode(pb, count, rb);
815                 }
816
817                 put_bits(pb, cb[512].size, cb[512].bits);
818
819                 flush_put_bits(pb);
820                 bytestream2_skip_p(pby, put_bits_count(pb) >> 3);
821                 padd = (4 - (bytestream2_tell_p(pby) & 3)) & 3;
822                 while (padd--)
823                     bytestream2_put_byte(pby, 0);
824
825                 bytestream2_put_be16(pby, BandTrailer);
826                 bytestream2_put_be16(pby, 0);
827             }
828
829             bytestream2_put_be16(pby, BitstreamMarker);
830             bytestream2_put_be16(pby, 0x0c0c);
831         }
832
833         s->plane[p].size = bytestream2_tell_p(pby) - pos;
834     }
835
836     bytestream2_put_be16(pby, GroupTrailer);
837     bytestream2_put_be16(pby, 0);
838
839     av_shrink_packet(pkt, bytestream2_tell_p(pby));
840
841     pkt->flags |= AV_PKT_FLAG_KEY;
842
843     bytestream2_seek_p(pby, 8, SEEK_SET);
844     for (int i = 0; i < s->planes; i++)
845         bytestream2_put_be32(pby, s->plane[i].size);
846
847     *got_packet = 1;
848
849     return 0;
850 }
851
852 static av_cold int cfhd_encode_close(AVCodecContext *avctx)
853 {
854     CFHDEncContext *s = avctx->priv_data;
855
856     for (int i = 0; i < s->planes; i++) {
857         av_freep(&s->plane[i].dwt_buf);
858         av_freep(&s->plane[i].dwt_tmp);
859
860         for (int j = 0; j < SUBBAND_COUNT; j++)
861             s->plane[i].subband[j] = NULL;
862
863         for (int j = 0; j < 8; j++)
864             s->plane[i].l_h[j] = NULL;
865     }
866
867     return 0;
868 }
869
870 #define OFFSET(x) offsetof(CFHDEncContext, x)
871 #define VE AV_OPT_FLAG_VIDEO_PARAM | AV_OPT_FLAG_ENCODING_PARAM
872 static const AVOption options[] = {
873     { "quality", "set quality", OFFSET(quality), AV_OPT_TYPE_INT,   {.i64= 0}, 0, 12, VE, "q" },
874     { "film3+",   NULL,         0,               AV_OPT_TYPE_CONST, {.i64= 0}, 0,  0, VE, "q" },
875     { "film3",    NULL,         0,               AV_OPT_TYPE_CONST, {.i64= 1}, 0,  0, VE, "q" },
876     { "film2+",   NULL,         0,               AV_OPT_TYPE_CONST, {.i64= 2}, 0,  0, VE, "q" },
877     { "film2",    NULL,         0,               AV_OPT_TYPE_CONST, {.i64= 3}, 0,  0, VE, "q" },
878     { "film1.5",  NULL,         0,               AV_OPT_TYPE_CONST, {.i64= 4}, 0,  0, VE, "q" },
879     { "film1+",   NULL,         0,               AV_OPT_TYPE_CONST, {.i64= 5}, 0,  0, VE, "q" },
880     { "film1",    NULL,         0,               AV_OPT_TYPE_CONST, {.i64= 6}, 0,  0, VE, "q" },
881     { "high+",    NULL,         0,               AV_OPT_TYPE_CONST, {.i64= 7}, 0,  0, VE, "q" },
882     { "high",     NULL,         0,               AV_OPT_TYPE_CONST, {.i64= 8}, 0,  0, VE, "q" },
883     { "medium+",  NULL,         0,               AV_OPT_TYPE_CONST, {.i64= 9}, 0,  0, VE, "q" },
884     { "medium",   NULL,         0,               AV_OPT_TYPE_CONST, {.i64=10}, 0,  0, VE, "q" },
885     { "low+",     NULL,         0,               AV_OPT_TYPE_CONST, {.i64=11}, 0,  0, VE, "q" },
886     { "low",      NULL,         0,               AV_OPT_TYPE_CONST, {.i64=12}, 0,  0, VE, "q" },
887     { NULL},
888 };
889
890 static const AVClass cfhd_class = {
891     .class_name = "cfhd",
892     .item_name  = av_default_item_name,
893     .option     = options,
894     .version    = LIBAVUTIL_VERSION_INT,
895 };
896
897 AVCodec ff_cfhd_encoder = {
898     .name             = "cfhd",
899     .long_name        = NULL_IF_CONFIG_SMALL("Cineform HD"),
900     .type             = AVMEDIA_TYPE_VIDEO,
901     .id               = AV_CODEC_ID_CFHD,
902     .priv_data_size   = sizeof(CFHDEncContext),
903     .priv_class       = &cfhd_class,
904     .init             = cfhd_encode_init,
905     .close            = cfhd_encode_close,
906     .encode2          = cfhd_encode_frame,
907     .capabilities     = AV_CODEC_CAP_FRAME_THREADS,
908     .pix_fmts         = (const enum AVPixelFormat[]) {
909                           AV_PIX_FMT_YUV422P10,
910                           AV_PIX_FMT_GBRP12,
911                           AV_PIX_FMT_GBRAP12,
912                           AV_PIX_FMT_NONE
913                         },
914 };