]> git.sesse.net Git - ffmpeg/blob - libavcodec/on2avc.c
configure: allow overriding ranlib
[ffmpeg] / libavcodec / on2avc.c
1 /*
2  * On2 Audio for Video Codec decoder
3  *
4  * Copyright (c) 2013 Konstantin Shishkov
5  *
6  * This file is part of FFmpeg.
7  *
8  * FFmpeg is free software; you can redistribute it and/or
9  * modify it under the terms of the GNU Lesser General Public
10  * License as published by the Free Software Foundation; either
11  * version 2.1 of the License, or (at your option) any later version.
12  *
13  * FFmpeg is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16  * Lesser General Public License for more details.
17  *
18  * You should have received a copy of the GNU Lesser General Public
19  * License along with FFmpeg; if not, write to the Free Software
20  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
21  */
22
23 #include "libavutil/channel_layout.h"
24 #include "libavutil/float_dsp.h"
25 #include "avcodec.h"
26 #include "bytestream.h"
27 #include "dsputil.h"
28 #include "fft.h"
29 #include "get_bits.h"
30 #include "golomb.h"
31 #include "internal.h"
32 #include "unary.h"
33
34 #include "on2avcdata.h"
35
36 #define ON2AVC_SUBFRAME_SIZE   1024
37
38 enum WindowTypes {
39     WINDOW_TYPE_LONG       = 0,
40     WINDOW_TYPE_LONG_STOP,
41     WINDOW_TYPE_LONG_START,
42     WINDOW_TYPE_8SHORT     = 3,
43     WINDOW_TYPE_EXT4,
44     WINDOW_TYPE_EXT5,
45     WINDOW_TYPE_EXT6,
46     WINDOW_TYPE_EXT7,
47 };
48
49 typedef struct On2AVCContext {
50     AVCodecContext *avctx;
51     AVFloatDSPContext fdsp;
52     FFTContext mdct, mdct_half, mdct_small;
53     FFTContext fft128, fft256, fft512, fft1024;
54     void (*wtf)(struct On2AVCContext *ctx, float *out, float *in, int size);
55
56     int is_av500;
57
58     const On2AVCMode *modes;
59     int window_type, prev_window_type;
60     int num_windows, num_bands;
61     int bits_per_section;
62     const int *band_start;
63
64     int grouping[8];
65     int ms_present;
66     int ms_info[ON2AVC_MAX_BANDS];
67
68     int is_long;
69
70     uint8_t band_type[ON2AVC_MAX_BANDS];
71     uint8_t band_run_end[ON2AVC_MAX_BANDS];
72     int     num_sections;
73
74     float band_scales[ON2AVC_MAX_BANDS];
75
76     VLC scale_diff;
77     VLC cb_vlc[16];
78
79     float scale_tab[128];
80
81     DECLARE_ALIGNED(32, float, coeffs)[2][ON2AVC_SUBFRAME_SIZE];
82     DECLARE_ALIGNED(32, float, delay) [2][ON2AVC_SUBFRAME_SIZE];
83
84     DECLARE_ALIGNED(32, float, temp)     [ON2AVC_SUBFRAME_SIZE * 2];
85     DECLARE_ALIGNED(32, float, mdct_buf) [ON2AVC_SUBFRAME_SIZE];
86     DECLARE_ALIGNED(32, float, long_win) [ON2AVC_SUBFRAME_SIZE];
87     DECLARE_ALIGNED(32, float, short_win)[ON2AVC_SUBFRAME_SIZE / 8];
88 } On2AVCContext;
89
90 static void on2avc_read_ms_info(On2AVCContext *c, GetBitContext *gb)
91 {
92     int w, b, band_off = 0;
93
94     c->ms_present = get_bits1(gb);
95     if (!c->ms_present)
96         return;
97     for (w = 0; w < c->num_windows; w++) {
98         if (!c->grouping[w]) {
99             memcpy(c->ms_info + band_off,
100                    c->ms_info + band_off - c->num_bands,
101                    c->num_bands * sizeof(*c->ms_info));
102             band_off += c->num_bands;
103             continue;
104         }
105         for (b = 0; b < c->num_bands; b++)
106             c->ms_info[band_off++] = get_bits1(gb);
107     }
108 }
109
110 // do not see Table 17 in ISO/IEC 13818-7
111 static int on2avc_decode_band_types(On2AVCContext *c, GetBitContext *gb)
112 {
113     int bits_per_sect = c->is_long ? 5 : 3;
114     int esc_val = (1 << bits_per_sect) - 1;
115     int num_bands = c->num_bands * c->num_windows;
116     int band = 0, i, band_type, run_len, run;
117
118     while (band < num_bands) {
119         band_type = get_bits(gb, 4);
120         run_len   = 1;
121         do {
122             run = get_bits(gb, bits_per_sect);
123             run_len += run;
124         } while (run == esc_val);
125         if (band + run_len > num_bands) {
126             av_log(c->avctx, AV_LOG_ERROR, "Invalid band type run\n");
127             return AVERROR_INVALIDDATA;
128         }
129         for (i = band; i < band + run_len; i++) {
130             c->band_type[i]    = band_type;
131             c->band_run_end[i] = band + run_len;
132         }
133         band += run_len;
134     }
135
136     return 0;
137 }
138
139 // completely not like Table 18 in ISO/IEC 13818-7
140 // (no intensity stereo, different coding for the first coefficient)
141 static int on2avc_decode_band_scales(On2AVCContext *c, GetBitContext *gb)
142 {
143     int w, w2, b, scale, first = 1;
144     int band_off = 0;
145
146     for (w = 0; w < c->num_windows; w++) {
147         if (!c->grouping[w]) {
148             memcpy(c->band_scales + band_off,
149                    c->band_scales + band_off - c->num_bands,
150                    c->num_bands * sizeof(*c->band_scales));
151             band_off += c->num_bands;
152             continue;
153         }
154         for (b = 0; b < c->num_bands; b++) {
155             if (!c->band_type[band_off]) {
156                 int all_zero = 1;
157                 for (w2 = w + 1; w2 < c->num_windows; w2++) {
158                     if (c->grouping[w2])
159                         break;
160                     if (c->band_type[w2 * c->num_bands + b]) {
161                         all_zero = 0;
162                         break;
163                     }
164                 }
165                 if (all_zero) {
166                     c->band_scales[band_off++] = 0;
167                     continue;
168                 }
169             }
170             if (first) {
171                 scale = get_bits(gb, 7);
172                 first = 0;
173             } else {
174                 scale += get_vlc2(gb, c->scale_diff.table, 9, 3) - 60;
175             }
176             if (scale < 0 || scale > 128) {
177                 av_log(c->avctx, AV_LOG_ERROR, "Invalid scale value %d\n",
178                        scale);
179                 return AVERROR_INVALIDDATA;
180             }
181             c->band_scales[band_off++] = c->scale_tab[scale];
182         }
183     }
184
185     return 0;
186 }
187
188 static inline float on2avc_scale(int v, float scale)
189 {
190     return v * sqrtf(fabsf(v)) * scale;
191 }
192
193 // spectral data is coded completely differently - there are no unsigned codebooks
194 static int on2avc_decode_quads(On2AVCContext *c, GetBitContext *gb, float *dst,
195                                int dst_size, int type, float band_scale)
196 {
197     int i, j, val, val1;
198
199     for (i = 0; i < dst_size; i += 4) {
200         val = get_vlc2(gb, c->cb_vlc[type].table, 9, 3);
201
202         for (j = 0; j < 4; j++) {
203             val1 = sign_extend((val >> (12 - j * 4)) & 0xF, 4);
204             *dst++ = on2avc_scale(val1, band_scale);
205         }
206     }
207
208     return 0;
209 }
210
211 static inline int get_egolomb(GetBitContext *gb)
212 {
213     int v = 4;
214
215     while (get_bits1(gb)) v++;
216
217     return (1 << v) + get_bits(gb, v);
218 }
219
220 static int on2avc_decode_pairs(On2AVCContext *c, GetBitContext *gb, float *dst,
221                                int dst_size, int type, float band_scale)
222 {
223     int i, val, val1, val2, sign;
224
225     for (i = 0; i < dst_size; i += 2) {
226         val = get_vlc2(gb, c->cb_vlc[type].table, 9, 3);
227
228         val1 = sign_extend(val >> 8,   8);
229         val2 = sign_extend(val & 0xFF, 8);
230         if (type == ON2AVC_ESC_CB) {
231             if (val1 <= -16 || val1 >= 16) {
232                 sign = 1 - (val1 < 0) * 2;
233                 val1 = sign * get_egolomb(gb);
234             }
235             if (val2 <= -16 || val2 >= 16) {
236                 sign = 1 - (val2 < 0) * 2;
237                 val2 = sign * get_egolomb(gb);
238             }
239         }
240
241         *dst++ = on2avc_scale(val1, band_scale);
242         *dst++ = on2avc_scale(val2, band_scale);
243     }
244
245     return 0;
246 }
247
248 static int on2avc_read_channel_data(On2AVCContext *c, GetBitContext *gb, int ch)
249 {
250     int ret;
251     int w, b, band_idx;
252     float *coeff_ptr;
253
254     if ((ret = on2avc_decode_band_types(c, gb)) < 0)
255         return ret;
256     if ((ret = on2avc_decode_band_scales(c, gb)) < 0)
257         return ret;
258
259     coeff_ptr = c->coeffs[ch];
260     band_idx  = 0;
261     memset(coeff_ptr, 0, ON2AVC_SUBFRAME_SIZE * sizeof(*coeff_ptr));
262     for (w = 0; w < c->num_windows; w++) {
263         for (b = 0; b < c->num_bands; b++) {
264             int band_size = c->band_start[b + 1] - c->band_start[b];
265             int band_type = c->band_type[band_idx + b];
266
267             if (!band_type) {
268                 coeff_ptr += band_size;
269                 continue;
270             }
271             if (band_type < 9)
272                 on2avc_decode_quads(c, gb, coeff_ptr, band_size, band_type,
273                                     c->band_scales[band_idx + b]);
274             else
275                 on2avc_decode_pairs(c, gb, coeff_ptr, band_size, band_type,
276                                     c->band_scales[band_idx + b]);
277             coeff_ptr += band_size;
278         }
279         band_idx += c->num_bands;
280     }
281
282     return 0;
283 }
284
285 static int on2avc_apply_ms(On2AVCContext *c)
286 {
287     int w, b, i;
288     int band_off = 0;
289     float *ch0 = c->coeffs[0];
290     float *ch1 = c->coeffs[1];
291
292     for (w = 0; w < c->num_windows; w++) {
293         for (b = 0; b < c->num_bands; b++) {
294             if (c->ms_info[band_off + b]) {
295                 for (i = c->band_start[b]; i < c->band_start[b + 1]; i++) {
296                     float l = *ch0, r = *ch1;
297                     *ch0++ = l + r;
298                     *ch1++ = l - r;
299                 }
300             } else {
301                 ch0 += c->band_start[b + 1] - c->band_start[b];
302                 ch1 += c->band_start[b + 1] - c->band_start[b];
303             }
304         }
305         band_off += c->num_bands;
306     }
307     return 0;
308 }
309
310 static void zero_head_and_tail(float *src, int len, int order0, int order1)
311 {
312     memset(src,                0, sizeof(*src) * order0);
313     memset(src + len - order1, 0, sizeof(*src) * order1);
314 }
315
316 static void pretwiddle(float *src, float *dst, int dst_len, int tab_step,
317                        int step, int order0, int order1, const double **tabs)
318 {
319     float *src2, *out;
320     const double *tab;
321     int i, j;
322
323     out = dst;
324     tab = tabs[0];
325     for (i = 0; i < tab_step; i++) {
326         double sum = 0;
327         for (j = 0; j < order0; j++)
328             sum += src[j] * tab[j * tab_step + i];
329         out[i] += sum;
330     }
331
332     out = dst + dst_len - tab_step;
333     tab = tabs[order0];
334     src2 = src + (dst_len - tab_step) / step + 1 + order0;
335     for (i = 0; i < tab_step; i++) {
336         double sum = 0;
337         for (j = 0; j < order1; j++)
338             sum += src2[j] * tab[j * tab_step + i];
339         out[i] += sum;
340     }
341 }
342
343 static void twiddle(float *src1, float *src2, int src2_len,
344                     const double *tab, int tab_len, int step,
345                     int order0, int order1, const double **tabs)
346 {
347     int steps;
348     int mask;
349     int i, j;
350
351     steps = (src2_len - tab_len) / step + 1;
352     pretwiddle(src1, src2, src2_len, tab_len, step, order0, order1, tabs);
353     mask = tab_len - 1;
354
355     for (i = 0; i < steps; i++) {
356         float in0 = src1[order0 + i];
357         int   pos = (src2_len - 1) & mask;
358
359         if (pos < tab_len) {
360             const double *t = tab;
361             for (j = pos; j >= 0; j--)
362                 src2[j] += in0 * *t++;
363             for (j = 0; j < tab_len - pos - 1; j++)
364                 src2[src2_len - j - 1] += in0 * tab[pos + 1 + j];
365         } else {
366             for (j = 0; j < tab_len; j++)
367                 src2[pos - j] += in0 * tab[j];
368         }
369         mask = pos + step;
370     }
371 }
372
373 #define CMUL1_R(s, t, is, it) \
374     s[is + 0] * t[it + 0] - s[is + 1] * t[it + 1]
375 #define CMUL1_I(s, t, is, it) \
376     s[is + 0] * t[it + 1] + s[is + 1] * t[it + 0]
377 #define CMUL2_R(s, t, is, it) \
378     s[is + 0] * t[it + 0] + s[is + 1] * t[it + 1]
379 #define CMUL2_I(s, t, is, it) \
380     s[is + 0] * t[it + 1] - s[is + 1] * t[it + 0]
381
382 #define CMUL0(dst, id, s0, s1, s2, s3, t0, t1, t2, t3, is, it)         \
383     dst[id]     = s0[is] * t0[it]     + s1[is] * t1[it]                \
384                 + s2[is] * t2[it]     + s3[is] * t3[it];               \
385     dst[id + 1] = s0[is] * t0[it + 1] + s1[is] * t1[it + 1]            \
386                 + s2[is] * t2[it + 1] + s3[is] * t3[it + 1];
387
388 #define CMUL1(dst, s0, s1, s2, s3, t0, t1, t2, t3, is, it)             \
389     *dst++ = CMUL1_R(s0, t0, is, it)                                   \
390            + CMUL1_R(s1, t1, is, it)                                   \
391            + CMUL1_R(s2, t2, is, it)                                   \
392            + CMUL1_R(s3, t3, is, it);                                  \
393     *dst++ = CMUL1_I(s0, t0, is, it)                                   \
394            + CMUL1_I(s1, t1, is, it)                                   \
395            + CMUL1_I(s2, t2, is, it)                                   \
396            + CMUL1_I(s3, t3, is, it);
397
398 #define CMUL2(dst, s0, s1, s2, s3, t0, t1, t2, t3, is, it)             \
399     *dst++ = CMUL2_R(s0, t0, is, it)                                   \
400            + CMUL2_R(s1, t1, is, it)                                   \
401            + CMUL2_R(s2, t2, is, it)                                   \
402            + CMUL2_R(s3, t3, is, it);                                  \
403     *dst++ = CMUL2_I(s0, t0, is, it)                                   \
404            + CMUL2_I(s1, t1, is, it)                                   \
405            + CMUL2_I(s2, t2, is, it)                                   \
406            + CMUL2_I(s3, t3, is, it);
407
408 static void combine_fft(float *s0, float *s1, float *s2, float *s3, float *dst,
409                         const float *t0, const float *t1,
410                         const float *t2, const float *t3, int len, int step)
411 {
412     const float *h0, *h1, *h2, *h3;
413     float *d1, *d2;
414     int tmp, half;
415     int len2 = len >> 1, len4 = len >> 2;
416     int hoff;
417     int i, j, k;
418
419     tmp = step;
420     for (half = len2; tmp > 1; half <<= 1, tmp >>= 1);
421
422     h0 = t0 + half;
423     h1 = t1 + half;
424     h2 = t2 + half;
425     h3 = t3 + half;
426
427     CMUL0(dst, 0, s0, s1, s2, s3, t0, t1, t2, t3, 0, 0);
428
429     hoff = 2 * step * (len4 >> 1);
430
431     j = 2;
432     k = 2 * step;
433     d1 = dst + 2;
434     d2 = dst + 2 + (len >> 1);
435     for (i = 0; i < (len4 - 1) >> 1; i++) {
436         CMUL1(d1, s0, s1, s2, s3, t0, t1, t2, t3, j, k);
437         CMUL1(d2, s0, s1, s2, s3, h0, h1, h2, h3, j, k);
438         j += 2;
439         k += 2 * step;
440     }
441     CMUL0(dst, len4,        s0, s1, s2, s3, t0, t1, t2, t3, 1, hoff);
442     CMUL0(dst, len4 + len2, s0, s1, s2, s3, h0, h1, h2, h3, 1, hoff);
443
444     j = len4;
445     k = hoff + 2 * step * len4;
446     d1 = dst + len4 + 2;
447     d2 = dst + len4 + 2 + len2;
448     for (i = 0; i < (len4 - 2) >> 1; i++) {
449         CMUL2(d1, s0, s1, s2, s3, t0, t1, t2, t3, j, k);
450         CMUL2(d2, s0, s1, s2, s3, h0, h1, h2, h3, j, k);
451         j -= 2;
452         k += 2 * step;
453     }
454     CMUL0(dst, len2 + 4, s0, s1, s2, s3, t0, t1, t2, t3, 0, k);
455 }
456
457 static void wtf_end_512(On2AVCContext *c, float *out, float *src,
458                         float *tmp0, float *tmp1)
459 {
460     memcpy(src,        tmp0,      384 * sizeof(*tmp0));
461     memcpy(tmp0 + 384, src + 384, 128 * sizeof(*tmp0));
462
463     zero_head_and_tail(src,       128, 16, 4);
464     zero_head_and_tail(src + 128, 128, 16, 4);
465     zero_head_and_tail(src + 256, 128, 13, 7);
466     zero_head_and_tail(src + 384, 128, 15, 5);
467
468     c->fft128.fft_permute(&c->fft128, (FFTComplex*)src);
469     c->fft128.fft_permute(&c->fft128, (FFTComplex*)(src + 128));
470     c->fft128.fft_permute(&c->fft128, (FFTComplex*)(src + 256));
471     c->fft128.fft_permute(&c->fft128, (FFTComplex*)(src + 384));
472     c->fft128.fft_calc(&c->fft128, (FFTComplex*)src);
473     c->fft128.fft_calc(&c->fft128, (FFTComplex*)(src + 128));
474     c->fft128.fft_calc(&c->fft128, (FFTComplex*)(src + 256));
475     c->fft128.fft_calc(&c->fft128, (FFTComplex*)(src + 384));
476     combine_fft(src, src + 128, src + 256, src + 384, tmp1,
477                 ff_on2avc_ctab_1, ff_on2avc_ctab_2,
478                 ff_on2avc_ctab_3, ff_on2avc_ctab_4, 512, 2);
479     c->fft512.fft_permute(&c->fft512, (FFTComplex*)tmp1);
480     c->fft512.fft_calc(&c->fft512, (FFTComplex*)tmp1);
481
482     pretwiddle(&tmp0[  0], tmp1, 512, 84, 4, 16, 4, ff_on2avc_tabs_20_84_1);
483     pretwiddle(&tmp0[128], tmp1, 512, 84, 4, 16, 4, ff_on2avc_tabs_20_84_2);
484     pretwiddle(&tmp0[256], tmp1, 512, 84, 4, 13, 7, ff_on2avc_tabs_20_84_3);
485     pretwiddle(&tmp0[384], tmp1, 512, 84, 4, 15, 5, ff_on2avc_tabs_20_84_4);
486
487     memcpy(src, tmp1, 512 * sizeof(float));
488 }
489
490 static void wtf_end_1024(On2AVCContext *c, float *out, float *src,
491                          float *tmp0, float *tmp1)
492 {
493     memcpy(src,        tmp0,      768 * sizeof(*tmp0));
494     memcpy(tmp0 + 768, src + 768, 256 * sizeof(*tmp0));
495
496     zero_head_and_tail(src,       256, 16, 4);
497     zero_head_and_tail(src + 256, 256, 16, 4);
498     zero_head_and_tail(src + 512, 256, 13, 7);
499     zero_head_and_tail(src + 768, 256, 15, 5);
500
501     c->fft256.fft_permute(&c->fft256, (FFTComplex*)src);
502     c->fft256.fft_permute(&c->fft256, (FFTComplex*)(src + 256));
503     c->fft256.fft_permute(&c->fft256, (FFTComplex*)(src + 512));
504     c->fft256.fft_permute(&c->fft256, (FFTComplex*)(src + 768));
505     c->fft256.fft_calc(&c->fft256, (FFTComplex*)src);
506     c->fft256.fft_calc(&c->fft256, (FFTComplex*)(src + 256));
507     c->fft256.fft_calc(&c->fft256, (FFTComplex*)(src + 512));
508     c->fft256.fft_calc(&c->fft256, (FFTComplex*)(src + 768));
509     combine_fft(src, src + 256, src + 512, src + 768, tmp1,
510                 ff_on2avc_ctab_1, ff_on2avc_ctab_2,
511                 ff_on2avc_ctab_3, ff_on2avc_ctab_4, 1024, 1);
512     c->fft1024.fft_permute(&c->fft1024, (FFTComplex*)tmp1);
513     c->fft1024.fft_calc(&c->fft1024, (FFTComplex*)tmp1);
514
515     pretwiddle(&tmp0[  0], tmp1, 1024, 84, 4, 16, 4, ff_on2avc_tabs_20_84_1);
516     pretwiddle(&tmp0[256], tmp1, 1024, 84, 4, 16, 4, ff_on2avc_tabs_20_84_2);
517     pretwiddle(&tmp0[512], tmp1, 1024, 84, 4, 13, 7, ff_on2avc_tabs_20_84_3);
518     pretwiddle(&tmp0[768], tmp1, 1024, 84, 4, 15, 5, ff_on2avc_tabs_20_84_4);
519
520     memcpy(src, tmp1, 1024 * sizeof(float));
521 }
522
523 static void wtf_40(On2AVCContext *c, float *out, float *src, int size)
524 {
525     float *tmp0 = c->temp, *tmp1 = c->temp + 1024;
526
527     memset(tmp0, 0, sizeof(*tmp0) * 1024);
528     memset(tmp1, 0, sizeof(*tmp1) * 1024);
529
530     if (size == 512) {
531         twiddle(src,       &tmp0[  0], 16, ff_on2avc_tab_10_1, 10, 2, 1, 3, ff_on2avc_tabs_4_10_1);
532         twiddle(src +   8, &tmp0[  0], 16, ff_on2avc_tab_10_2, 10, 2, 3, 1, ff_on2avc_tabs_4_10_2);
533         twiddle(src +  16, &tmp0[ 16], 16, ff_on2avc_tab_10_2, 10, 2, 3, 1, ff_on2avc_tabs_4_10_2);
534         twiddle(src +  24, &tmp0[ 16], 16, ff_on2avc_tab_10_1, 10, 2, 1, 3, ff_on2avc_tabs_4_10_1);
535         twiddle(src +  32, &tmp0[ 32], 16, ff_on2avc_tab_10_1, 10, 2, 1, 3, ff_on2avc_tabs_4_10_1);
536         twiddle(src +  40, &tmp0[ 32], 16, ff_on2avc_tab_10_2, 10, 2, 3, 1, ff_on2avc_tabs_4_10_2);
537         twiddle(src +  48, &tmp0[ 48], 16, ff_on2avc_tab_10_2, 10, 2, 3, 1, ff_on2avc_tabs_4_10_2);
538         twiddle(src +  56, &tmp0[ 48], 16, ff_on2avc_tab_10_1, 10, 2, 1, 3, ff_on2avc_tabs_4_10_1);
539         twiddle(&tmp0[ 0], &tmp1[  0], 32, ff_on2avc_tab_20_1, 20, 2, 5, 4, ff_on2avc_tabs_9_20_1);
540         twiddle(&tmp0[16], &tmp1[  0], 32, ff_on2avc_tab_20_2, 20, 2, 4, 5, ff_on2avc_tabs_9_20_2);
541         twiddle(&tmp0[32], &tmp1[ 32], 32, ff_on2avc_tab_20_2, 20, 2, 4, 5, ff_on2avc_tabs_9_20_2);
542         twiddle(&tmp0[48], &tmp1[ 32], 32, ff_on2avc_tab_20_1, 20, 2, 5, 4, ff_on2avc_tabs_9_20_1);
543         twiddle(src +  64, &tmp1[ 64], 32, ff_on2avc_tab_20_1, 20, 2, 5, 4, ff_on2avc_tabs_9_20_1);
544         twiddle(src +  80, &tmp1[ 64], 32, ff_on2avc_tab_20_2, 20, 2, 4, 5, ff_on2avc_tabs_9_20_2);
545         twiddle(src +  96, &tmp1[ 96], 32, ff_on2avc_tab_20_2, 20, 2, 4, 5, ff_on2avc_tabs_9_20_2);
546         twiddle(src + 112, &tmp1[ 96], 32, ff_on2avc_tab_20_1, 20, 2, 5, 4, ff_on2avc_tabs_9_20_1);
547         twiddle(src + 128, &tmp1[128], 32, ff_on2avc_tab_20_1, 20, 2, 5, 4, ff_on2avc_tabs_9_20_1);
548         twiddle(src + 144, &tmp1[128], 32, ff_on2avc_tab_20_2, 20, 2, 4, 5, ff_on2avc_tabs_9_20_2);
549         twiddle(src + 160, &tmp1[160], 32, ff_on2avc_tab_20_2, 20, 2, 4, 5, ff_on2avc_tabs_9_20_2);
550         twiddle(src + 176, &tmp1[160], 32, ff_on2avc_tab_20_1, 20, 2, 5, 4, ff_on2avc_tabs_9_20_1);
551
552         memset(tmp0, 0, 64 * sizeof(*tmp0));
553
554         twiddle(&tmp1[  0], &tmp0[  0], 128, ff_on2avc_tab_84_1, 84, 4, 16, 4, ff_on2avc_tabs_20_84_1);
555         twiddle(&tmp1[ 32], &tmp0[  0], 128, ff_on2avc_tab_84_2, 84, 4, 16, 4, ff_on2avc_tabs_20_84_2);
556         twiddle(&tmp1[ 64], &tmp0[  0], 128, ff_on2avc_tab_84_3, 84, 4, 13, 7, ff_on2avc_tabs_20_84_3);
557         twiddle(&tmp1[ 96], &tmp0[  0], 128, ff_on2avc_tab_84_4, 84, 4, 15, 5, ff_on2avc_tabs_20_84_4);
558         twiddle(&tmp1[128], &tmp0[128], 128, ff_on2avc_tab_84_4, 84, 4, 15, 5, ff_on2avc_tabs_20_84_4);
559         twiddle(&tmp1[160], &tmp0[128], 128, ff_on2avc_tab_84_3, 84, 4, 13, 7, ff_on2avc_tabs_20_84_3);
560         twiddle(src + 192,  &tmp0[128], 128, ff_on2avc_tab_84_2, 84, 4, 16, 4, ff_on2avc_tabs_20_84_2);
561         twiddle(src + 224,  &tmp0[128], 128, ff_on2avc_tab_84_1, 84, 4, 16, 4, ff_on2avc_tabs_20_84_1);
562         twiddle(src + 256,  &tmp0[256], 128, ff_on2avc_tab_84_1, 84, 4, 16, 4, ff_on2avc_tabs_20_84_1);
563         twiddle(src + 288,  &tmp0[256], 128, ff_on2avc_tab_84_2, 84, 4, 16, 4, ff_on2avc_tabs_20_84_2);
564         twiddle(src + 320,  &tmp0[256], 128, ff_on2avc_tab_84_3, 84, 4, 13, 7, ff_on2avc_tabs_20_84_3);
565         twiddle(src + 352,  &tmp0[256], 128, ff_on2avc_tab_84_4, 84, 4, 15, 5, ff_on2avc_tabs_20_84_4);
566
567         wtf_end_512(c, out, src, tmp0, tmp1);
568     } else {
569         twiddle(src,       &tmp0[  0], 32, ff_on2avc_tab_20_1, 20, 2,  5,  4, ff_on2avc_tabs_9_20_1);
570         twiddle(src +  16, &tmp0[  0], 32, ff_on2avc_tab_20_2, 20, 2,  4,  5, ff_on2avc_tabs_9_20_2);
571         twiddle(src +  32, &tmp0[ 32], 32, ff_on2avc_tab_20_2, 20, 2,  4,  5, ff_on2avc_tabs_9_20_2);
572         twiddle(src +  48, &tmp0[ 32], 32, ff_on2avc_tab_20_1, 20, 2,  5,  4, ff_on2avc_tabs_9_20_1);
573         twiddle(src +  64, &tmp0[ 64], 32, ff_on2avc_tab_20_1, 20, 2,  5,  4, ff_on2avc_tabs_9_20_1);
574         twiddle(src +  80, &tmp0[ 64], 32, ff_on2avc_tab_20_2, 20, 2,  4,  5, ff_on2avc_tabs_9_20_2);
575         twiddle(src +  96, &tmp0[ 96], 32, ff_on2avc_tab_20_2, 20, 2,  4,  5, ff_on2avc_tabs_9_20_2);
576         twiddle(src + 112, &tmp0[ 96], 32, ff_on2avc_tab_20_1, 20, 2,  5,  4, ff_on2avc_tabs_9_20_1);
577         twiddle(&tmp0[ 0], &tmp1[  0], 64, ff_on2avc_tab_40_1, 40, 2, 11,  8, ff_on2avc_tabs_19_40_1);
578         twiddle(&tmp0[32], &tmp1[  0], 64, ff_on2avc_tab_40_2, 40, 2,  8, 11, ff_on2avc_tabs_19_40_2);
579         twiddle(&tmp0[64], &tmp1[ 64], 64, ff_on2avc_tab_40_2, 40, 2,  8, 11, ff_on2avc_tabs_19_40_2);
580         twiddle(&tmp0[96], &tmp1[ 64], 64, ff_on2avc_tab_40_1, 40, 2, 11,  8, ff_on2avc_tabs_19_40_1);
581         twiddle(src + 128, &tmp1[128], 64, ff_on2avc_tab_40_1, 40, 2, 11,  8, ff_on2avc_tabs_19_40_1);
582         twiddle(src + 160, &tmp1[128], 64, ff_on2avc_tab_40_2, 40, 2,  8, 11, ff_on2avc_tabs_19_40_2);
583         twiddle(src + 192, &tmp1[192], 64, ff_on2avc_tab_40_2, 40, 2,  8, 11, ff_on2avc_tabs_19_40_2);
584         twiddle(src + 224, &tmp1[192], 64, ff_on2avc_tab_40_1, 40, 2, 11,  8, ff_on2avc_tabs_19_40_1);
585         twiddle(src + 256, &tmp1[256], 64, ff_on2avc_tab_40_1, 40, 2, 11,  8, ff_on2avc_tabs_19_40_1);
586         twiddle(src + 288, &tmp1[256], 64, ff_on2avc_tab_40_2, 40, 2,  8, 11, ff_on2avc_tabs_19_40_2);
587         twiddle(src + 320, &tmp1[320], 64, ff_on2avc_tab_40_2, 40, 2,  8, 11, ff_on2avc_tabs_19_40_2);
588         twiddle(src + 352, &tmp1[320], 64, ff_on2avc_tab_40_1, 40, 2, 11,  8, ff_on2avc_tabs_19_40_1);
589
590         memset(tmp0, 0, 128 * sizeof(*tmp0));
591
592         twiddle(&tmp1[  0], &tmp0[  0], 256, ff_on2avc_tab_84_1, 84, 4, 16, 4, ff_on2avc_tabs_20_84_1);
593         twiddle(&tmp1[ 64], &tmp0[  0], 256, ff_on2avc_tab_84_2, 84, 4, 16, 4, ff_on2avc_tabs_20_84_2);
594         twiddle(&tmp1[128], &tmp0[  0], 256, ff_on2avc_tab_84_3, 84, 4, 13, 7, ff_on2avc_tabs_20_84_3);
595         twiddle(&tmp1[192], &tmp0[  0], 256, ff_on2avc_tab_84_4, 84, 4, 15, 5, ff_on2avc_tabs_20_84_4);
596         twiddle(&tmp1[256], &tmp0[256], 256, ff_on2avc_tab_84_4, 84, 4, 15, 5, ff_on2avc_tabs_20_84_4);
597         twiddle(&tmp1[320], &tmp0[256], 256, ff_on2avc_tab_84_3, 84, 4, 13, 7, ff_on2avc_tabs_20_84_3);
598         twiddle(src + 384,  &tmp0[256], 256, ff_on2avc_tab_84_2, 84, 4, 16, 4, ff_on2avc_tabs_20_84_2);
599         twiddle(src + 448,  &tmp0[256], 256, ff_on2avc_tab_84_1, 84, 4, 16, 4, ff_on2avc_tabs_20_84_1);
600         twiddle(src + 512,  &tmp0[512], 256, ff_on2avc_tab_84_1, 84, 4, 16, 4, ff_on2avc_tabs_20_84_1);
601         twiddle(src + 576,  &tmp0[512], 256, ff_on2avc_tab_84_2, 84, 4, 16, 4, ff_on2avc_tabs_20_84_2);
602         twiddle(src + 640,  &tmp0[512], 256, ff_on2avc_tab_84_3, 84, 4, 13, 7, ff_on2avc_tabs_20_84_3);
603         twiddle(src + 704,  &tmp0[512], 256, ff_on2avc_tab_84_4, 84, 4, 15, 5, ff_on2avc_tabs_20_84_4);
604
605         wtf_end_1024(c, out, src, tmp0, tmp1);
606     }
607 }
608
609 static void wtf_44(On2AVCContext *c, float *out, float *src, int size)
610 {
611     float *tmp0 = c->temp, *tmp1 = c->temp + 1024;
612
613     memset(tmp0, 0, sizeof(*tmp0) * 1024);
614     memset(tmp1, 0, sizeof(*tmp1) * 1024);
615
616     if (size == 512) {
617         twiddle(src,       &tmp0[ 0], 16, ff_on2avc_tab_10_1, 10, 2, 1, 3, ff_on2avc_tabs_4_10_1);
618         twiddle(src +   8, &tmp0[ 0], 16, ff_on2avc_tab_10_2, 10, 2, 3, 1, ff_on2avc_tabs_4_10_2);
619         twiddle(src +  16, &tmp0[16], 16, ff_on2avc_tab_10_2, 10, 2, 3, 1, ff_on2avc_tabs_4_10_2);
620         twiddle(src +  24, &tmp0[16], 16, ff_on2avc_tab_10_1, 10, 2, 1, 3, ff_on2avc_tabs_4_10_1);
621         twiddle(src +  32, &tmp0[32], 16, ff_on2avc_tab_10_1, 10, 2, 1, 3, ff_on2avc_tabs_4_10_1);
622         twiddle(src +  40, &tmp0[32], 16, ff_on2avc_tab_10_2, 10, 2, 3, 1, ff_on2avc_tabs_4_10_2);
623         twiddle(src +  48, &tmp0[48], 16, ff_on2avc_tab_10_2, 10, 2, 3, 1, ff_on2avc_tabs_4_10_2);
624         twiddle(src +  56, &tmp0[48], 16, ff_on2avc_tab_10_1, 10, 2, 1, 3, ff_on2avc_tabs_4_10_1);
625         twiddle(&tmp0[ 0], &tmp1[ 0], 32, ff_on2avc_tab_20_1, 20, 2, 5, 4, ff_on2avc_tabs_9_20_1);
626         twiddle(&tmp0[16], &tmp1[ 0], 32, ff_on2avc_tab_20_2, 20, 2, 4, 5, ff_on2avc_tabs_9_20_2);
627         twiddle(&tmp0[32], &tmp1[32], 32, ff_on2avc_tab_20_2, 20, 2, 4, 5, ff_on2avc_tabs_9_20_2);
628         twiddle(&tmp0[48], &tmp1[32], 32, ff_on2avc_tab_20_1, 20, 2, 5, 4, ff_on2avc_tabs_9_20_1);
629         twiddle(src +  64, &tmp1[64], 32, ff_on2avc_tab_20_1, 20, 2, 5, 4, ff_on2avc_tabs_9_20_1);
630         twiddle(src +  80, &tmp1[64], 32, ff_on2avc_tab_20_2, 20, 2, 4, 5, ff_on2avc_tabs_9_20_2);
631         twiddle(src +  96, &tmp1[96], 32, ff_on2avc_tab_20_2, 20, 2, 4, 5, ff_on2avc_tabs_9_20_2);
632         twiddle(src + 112, &tmp1[96], 32, ff_on2avc_tab_20_1, 20, 2, 5, 4, ff_on2avc_tabs_9_20_1);
633
634         memset(tmp0, 0, 64 * sizeof(*tmp0));
635
636         twiddle(&tmp1[ 0], &tmp0[  0], 128, ff_on2avc_tab_84_1, 84, 4, 16,  4, ff_on2avc_tabs_20_84_1);
637         twiddle(&tmp1[32], &tmp0[  0], 128, ff_on2avc_tab_84_2, 84, 4, 16,  4, ff_on2avc_tabs_20_84_2);
638         twiddle(&tmp1[64], &tmp0[  0], 128, ff_on2avc_tab_84_3, 84, 4, 13,  7, ff_on2avc_tabs_20_84_3);
639         twiddle(&tmp1[96], &tmp0[  0], 128, ff_on2avc_tab_84_4, 84, 4, 15,  5, ff_on2avc_tabs_20_84_4);
640         twiddle(src + 128, &tmp0[128], 128, ff_on2avc_tab_84_4, 84, 4, 15,  5, ff_on2avc_tabs_20_84_4);
641         twiddle(src + 160, &tmp0[128], 128, ff_on2avc_tab_84_3, 84, 4, 13,  7, ff_on2avc_tabs_20_84_3);
642         twiddle(src + 192, &tmp0[128], 128, ff_on2avc_tab_84_2, 84, 4, 16,  4, ff_on2avc_tabs_20_84_2);
643         twiddle(src + 224, &tmp0[128], 128, ff_on2avc_tab_84_1, 84, 4, 16,  4, ff_on2avc_tabs_20_84_1);
644         twiddle(src + 256, &tmp0[256], 128, ff_on2avc_tab_40_1, 40, 2, 11,  8, ff_on2avc_tabs_19_40_1);
645         twiddle(src + 320, &tmp0[256], 128, ff_on2avc_tab_40_2, 40, 2,  8, 11, ff_on2avc_tabs_19_40_2);
646
647         wtf_end_512(c, out, src, tmp0, tmp1);
648     } else {
649         twiddle(src,       &tmp0[  0], 32, ff_on2avc_tab_20_1, 20, 2,  5,  4, ff_on2avc_tabs_9_20_1);
650         twiddle(src +  16, &tmp0[  0], 32, ff_on2avc_tab_20_2, 20, 2,  4,  5, ff_on2avc_tabs_9_20_2);
651         twiddle(src +  32, &tmp0[ 32], 32, ff_on2avc_tab_20_2, 20, 2,  4,  5, ff_on2avc_tabs_9_20_2);
652         twiddle(src +  48, &tmp0[ 32], 32, ff_on2avc_tab_20_1, 20, 2,  5,  4, ff_on2avc_tabs_9_20_1);
653         twiddle(src +  64, &tmp0[ 64], 32, ff_on2avc_tab_20_1, 20, 2,  5,  4, ff_on2avc_tabs_9_20_1);
654         twiddle(src +  80, &tmp0[ 64], 32, ff_on2avc_tab_20_2, 20, 2,  4,  5, ff_on2avc_tabs_9_20_2);
655         twiddle(src +  96, &tmp0[ 96], 32, ff_on2avc_tab_20_2, 20, 2,  4,  5, ff_on2avc_tabs_9_20_2);
656         twiddle(src + 112, &tmp0[ 96], 32, ff_on2avc_tab_20_1, 20, 2,  5,  4, ff_on2avc_tabs_9_20_1);
657         twiddle(&tmp0[ 0], &tmp1[  0], 64, ff_on2avc_tab_40_1, 40, 2, 11,  8, ff_on2avc_tabs_19_40_1);
658         twiddle(&tmp0[32], &tmp1[  0], 64, ff_on2avc_tab_40_2, 40, 2,  8, 11, ff_on2avc_tabs_19_40_2);
659         twiddle(&tmp0[64], &tmp1[ 64], 64, ff_on2avc_tab_40_2, 40, 2,  8, 11, ff_on2avc_tabs_19_40_2);
660         twiddle(&tmp0[96], &tmp1[ 64], 64, ff_on2avc_tab_40_1, 40, 2, 11,  8, ff_on2avc_tabs_19_40_1);
661         twiddle(src + 128, &tmp1[128], 64, ff_on2avc_tab_40_1, 40, 2, 11,  8, ff_on2avc_tabs_19_40_1);
662         twiddle(src + 160, &tmp1[128], 64, ff_on2avc_tab_40_2, 40, 2,  8, 11, ff_on2avc_tabs_19_40_2);
663         twiddle(src + 192, &tmp1[192], 64, ff_on2avc_tab_40_2, 40, 2,  8, 11, ff_on2avc_tabs_19_40_2);
664         twiddle(src + 224, &tmp1[192], 64, ff_on2avc_tab_40_1, 40, 2, 11,  8, ff_on2avc_tabs_19_40_1);
665
666         memset(tmp0, 0, 128 * sizeof(*tmp0));
667
668         twiddle(&tmp1[  0], &tmp0[  0], 256, ff_on2avc_tab_84_1, 84, 4, 16,  4, ff_on2avc_tabs_20_84_1);
669         twiddle(&tmp1[ 64], &tmp0[  0], 256, ff_on2avc_tab_84_2, 84, 4, 16,  4, ff_on2avc_tabs_20_84_2);
670         twiddle(&tmp1[128], &tmp0[  0], 256, ff_on2avc_tab_84_3, 84, 4, 13,  7, ff_on2avc_tabs_20_84_3);
671         twiddle(&tmp1[192], &tmp0[  0], 256, ff_on2avc_tab_84_4, 84, 4, 15,  5, ff_on2avc_tabs_20_84_4);
672         twiddle(src + 256,  &tmp0[256], 256, ff_on2avc_tab_84_4, 84, 4, 15,  5, ff_on2avc_tabs_20_84_4);
673         twiddle(src + 320,  &tmp0[256], 256, ff_on2avc_tab_84_3, 84, 4, 13,  7, ff_on2avc_tabs_20_84_3);
674         twiddle(src + 384,  &tmp0[256], 256, ff_on2avc_tab_84_2, 84, 4, 16,  4, ff_on2avc_tabs_20_84_2);
675         twiddle(src + 448,  &tmp0[256], 256, ff_on2avc_tab_84_1, 84, 4, 16,  4, ff_on2avc_tabs_20_84_1);
676         twiddle(src + 512,  &tmp0[512], 256, ff_on2avc_tab_40_1, 40, 2, 11,  8, ff_on2avc_tabs_19_40_1);
677         twiddle(src + 640,  &tmp0[512], 256, ff_on2avc_tab_40_2, 40, 2,  8, 11, ff_on2avc_tabs_19_40_2);
678
679         wtf_end_1024(c, out, src, tmp0, tmp1);
680     }
681 }
682
683 static int on2avc_reconstruct_stereo(On2AVCContext *c, AVFrame *dst, int offset)
684 {
685     int ch, i;
686
687     for (ch = 0; ch < 2; ch++) {
688         float *out   = (float*)dst->extended_data[ch] + offset;
689         float *in    = c->coeffs[ch];
690         float *saved = c->delay[ch];
691         float *buf   = c->mdct_buf;
692         float *wout  = out + 448;
693
694         switch (c->window_type) {
695         case WINDOW_TYPE_EXT7:
696             c->mdct.imdct_half(&c->mdct, buf, in);
697             break;
698         case WINDOW_TYPE_EXT4:
699             c->wtf(c, buf, in, 1024);
700             break;
701         case WINDOW_TYPE_EXT5:
702             c->wtf(c, buf, in, 512);
703             c->mdct.imdct_half(&c->mdct_half, buf + 512, in + 512);
704             for (i = 0; i < 256; i++) {
705                 FFSWAP(float, buf[i + 512], buf[1023 - i]);
706             }
707             break;
708         case WINDOW_TYPE_EXT6:
709             c->mdct.imdct_half(&c->mdct_half, buf, in);
710             for (i = 0; i < 256; i++) {
711                 FFSWAP(float, buf[i], buf[511 - i]);
712             }
713             c->wtf(c, buf + 512, in + 512, 512);
714             break;
715         }
716
717         memcpy(out, saved, 448 * sizeof(float));
718         c->fdsp.vector_fmul_window(wout, saved + 448, buf, c->short_win, 64);
719         memcpy(wout + 128,  buf + 64,         448 * sizeof(float));
720         memcpy(saved,       buf + 512,        448 * sizeof(float));
721         memcpy(saved + 448, buf + 7*128 + 64,  64 * sizeof(float));
722     }
723
724     return 0;
725 }
726
727 // not borrowed from aacdec.c - the codec has original design after all
728 static int on2avc_reconstruct_channel(On2AVCContext *c, int channel,
729                                       AVFrame *dst, int offset)
730 {
731     int i;
732     float *out   = (float*)dst->extended_data[channel] + offset;
733     float *in    = c->coeffs[channel];
734     float *saved = c->delay[channel];
735     float *buf   = c->mdct_buf;
736     float *temp  = c->temp;
737
738     switch (c->window_type) {
739     case WINDOW_TYPE_LONG_START:
740     case WINDOW_TYPE_LONG_STOP:
741     case WINDOW_TYPE_LONG:
742         c->mdct.imdct_half(&c->mdct, buf, in);
743         break;
744     case WINDOW_TYPE_8SHORT:
745         for (i = 0; i < ON2AVC_SUBFRAME_SIZE; i += ON2AVC_SUBFRAME_SIZE / 8)
746             c->mdct_small.imdct_half(&c->mdct_small, buf + i, in + i);
747         break;
748     }
749
750     if ((c->prev_window_type == WINDOW_TYPE_LONG ||
751          c->prev_window_type == WINDOW_TYPE_LONG_STOP) &&
752         (c->window_type == WINDOW_TYPE_LONG ||
753          c->window_type == WINDOW_TYPE_LONG_START)) {
754         c->fdsp.vector_fmul_window(out, saved, buf, c->long_win, 512);
755     } else {
756         float *wout = out + 448;
757         memcpy(out, saved, 448 * sizeof(float));
758
759         if (c->window_type == WINDOW_TYPE_8SHORT) {
760             c->fdsp.vector_fmul_window(wout + 0*128, saved + 448,      buf + 0*128, c->short_win, 64);
761             c->fdsp.vector_fmul_window(wout + 1*128, buf + 0*128 + 64, buf + 1*128, c->short_win, 64);
762             c->fdsp.vector_fmul_window(wout + 2*128, buf + 1*128 + 64, buf + 2*128, c->short_win, 64);
763             c->fdsp.vector_fmul_window(wout + 3*128, buf + 2*128 + 64, buf + 3*128, c->short_win, 64);
764             c->fdsp.vector_fmul_window(temp,         buf + 3*128 + 64, buf + 4*128, c->short_win, 64);
765             memcpy(wout + 4*128, temp, 64 * sizeof(float));
766         } else {
767             c->fdsp.vector_fmul_window(wout, saved + 448, buf, c->short_win, 64);
768             memcpy(wout + 128, buf + 64, 448 * sizeof(float));
769         }
770     }
771
772     // buffer update
773     switch (c->window_type) {
774     case WINDOW_TYPE_8SHORT:
775         memcpy(saved,       temp + 64,         64 * sizeof(float));
776         c->fdsp.vector_fmul_window(saved + 64,  buf + 4*128 + 64, buf + 5*128, c->short_win, 64);
777         c->fdsp.vector_fmul_window(saved + 192, buf + 5*128 + 64, buf + 6*128, c->short_win, 64);
778         c->fdsp.vector_fmul_window(saved + 320, buf + 6*128 + 64, buf + 7*128, c->short_win, 64);
779         memcpy(saved + 448, buf + 7*128 + 64,  64 * sizeof(float));
780         break;
781     case WINDOW_TYPE_LONG_START:
782         memcpy(saved,       buf + 512,        448 * sizeof(float));
783         memcpy(saved + 448, buf + 7*128 + 64,  64 * sizeof(float));
784         break;
785     case WINDOW_TYPE_LONG_STOP:
786     case WINDOW_TYPE_LONG:
787         memcpy(saved,       buf + 512,        512 * sizeof(float));
788         break;
789     }
790     return 0;
791 }
792
793 static int on2avc_decode_subframe(On2AVCContext *c, const uint8_t *buf,
794                                   int buf_size, AVFrame *dst, int offset)
795 {
796     GetBitContext gb;
797     int i, ret;
798
799     init_get_bits(&gb, buf, buf_size * 8);
800     if (get_bits1(&gb)) {
801         av_log(c->avctx, AV_LOG_ERROR, "enh bit set\n");
802         return AVERROR_INVALIDDATA;
803     }
804     c->prev_window_type = c->window_type;
805     c->window_type      = get_bits(&gb, 3);
806     if (c->window_type >= WINDOW_TYPE_EXT4 && c->avctx->channels == 1) {
807         av_log(c->avctx, AV_LOG_ERROR, "stereo mode window for mono audio\n");
808         return AVERROR_INVALIDDATA;
809     }
810
811     c->band_start  = c->modes[c->window_type].band_start;
812     c->num_windows = c->modes[c->window_type].num_windows;
813     c->num_bands   = c->modes[c->window_type].num_bands;
814     c->is_long     = (c->window_type != WINDOW_TYPE_8SHORT);
815
816     c->grouping[0] = 1;
817     for (i = 1; i < c->num_windows; i++)
818         c->grouping[i] = !get_bits1(&gb);
819
820     on2avc_read_ms_info(c, &gb);
821     for (i = 0; i < c->avctx->channels; i++)
822         if ((ret = on2avc_read_channel_data(c, &gb, i)) < 0)
823             return AVERROR_INVALIDDATA;
824     if (c->avctx->channels == 2 && c->ms_present)
825         on2avc_apply_ms(c);
826     if (c->window_type < WINDOW_TYPE_EXT4) {
827         for (i = 0; i < c->avctx->channels; i++)
828             on2avc_reconstruct_channel(c, i, dst, offset);
829     } else {
830         on2avc_reconstruct_stereo(c, dst, offset);
831     }
832
833     return 0;
834 }
835
836 static int on2avc_decode_frame(AVCodecContext * avctx, void *data,
837                                int *got_frame_ptr, AVPacket *avpkt)
838 {
839     AVFrame *frame     = data;
840     const uint8_t *buf = avpkt->data;
841     int buf_size       = avpkt->size;
842     On2AVCContext *c   = avctx->priv_data;
843     GetByteContext gb;
844     int num_frames = 0, frame_size, audio_off;
845     int ret;
846
847     if (c->is_av500) {
848         /* get output buffer */
849         frame->nb_samples = ON2AVC_SUBFRAME_SIZE;
850         if ((ret = ff_get_buffer(avctx, frame, 0)) < 0) {
851             av_log(avctx, AV_LOG_ERROR, "get_buffer() failed\n");
852             return ret;
853         }
854
855         if ((ret = on2avc_decode_subframe(c, buf, buf_size, frame, 0)) < 0)
856             return ret;
857     } else {
858         bytestream2_init(&gb, buf, buf_size);
859         while (bytestream2_get_bytes_left(&gb) > 2) {
860             frame_size = bytestream2_get_le16(&gb);
861             if (!frame_size || frame_size > bytestream2_get_bytes_left(&gb)) {
862                 av_log(avctx, AV_LOG_ERROR, "Invalid subframe size %d\n",
863                        frame_size);
864                 return AVERROR_INVALIDDATA;
865             }
866             num_frames++;
867             bytestream2_skip(&gb, frame_size);
868         }
869         if (!num_frames) {
870             av_log(avctx, AV_LOG_ERROR, "No subframes present\n");
871             return AVERROR_INVALIDDATA;
872         }
873
874         /* get output buffer */
875         frame->nb_samples = ON2AVC_SUBFRAME_SIZE * num_frames;
876         if ((ret = ff_get_buffer(avctx, frame, 0)) < 0) {
877             av_log(avctx, AV_LOG_ERROR, "get_buffer() failed\n");
878             return ret;
879         }
880
881         audio_off = 0;
882         bytestream2_init(&gb, buf, buf_size);
883         while (bytestream2_get_bytes_left(&gb) > 2) {
884             frame_size = bytestream2_get_le16(&gb);
885             if ((ret = on2avc_decode_subframe(c, gb.buffer, frame_size,
886                                               frame, audio_off)) < 0)
887                 return ret;
888             audio_off += ON2AVC_SUBFRAME_SIZE;
889             bytestream2_skip(&gb, frame_size);
890         }
891     }
892
893     *got_frame_ptr = 1;
894
895     return buf_size;
896 }
897
898 static av_cold void on2avc_free_vlcs(On2AVCContext *c)
899 {
900     int i;
901
902     ff_free_vlc(&c->scale_diff);
903     for (i = 1; i < 16; i++)
904         ff_free_vlc(&c->cb_vlc[i]);
905 }
906
907 static av_cold int on2avc_decode_init(AVCodecContext *avctx)
908 {
909     On2AVCContext *c = avctx->priv_data;
910     int i;
911
912     c->avctx = avctx;
913     avctx->sample_fmt     = AV_SAMPLE_FMT_FLTP;
914     avctx->channel_layout = (avctx->channels == 2) ? AV_CH_LAYOUT_STEREO
915                                                    : AV_CH_LAYOUT_MONO;
916
917     c->is_av500 = (avctx->codec_tag == 0x500);
918     if (c->is_av500 && avctx->channels == 2) {
919         av_log(avctx, AV_LOG_ERROR, "0x500 version should be mono\n");
920         return AVERROR_INVALIDDATA;
921     }
922     if (avctx->channels == 2)
923         av_log(avctx, AV_LOG_WARNING,
924                "Stereo mode support is not good, patch is welcome\n");
925
926     for (i = 0; i < 20; i++)
927         c->scale_tab[i] = ceil(pow(10.0, i * 0.1) * 16) / 32;
928     for (; i < 128; i++)
929         c->scale_tab[i] = ceil(pow(10.0, i * 0.1) * 0.5);
930
931     if (avctx->sample_rate < 32000 || avctx->channels == 1)
932         memcpy(c->long_win, ff_on2avc_window_long_24000,
933                1024 * sizeof(*c->long_win));
934     else
935         memcpy(c->long_win, ff_on2avc_window_long_32000,
936                1024 * sizeof(*c->long_win));
937     memcpy(c->short_win, ff_on2avc_window_short, 128 * sizeof(*c->short_win));
938
939     c->modes = (avctx->sample_rate <= 40000) ? ff_on2avc_modes_40
940                                              : ff_on2avc_modes_44;
941     c->wtf   = (avctx->sample_rate <= 40000) ? wtf_40
942                                              : wtf_44;
943
944     ff_mdct_init(&c->mdct,       11, 1, 1.0 / (32768.0 * 1024.0));
945     ff_mdct_init(&c->mdct_half,  10, 1, 1.0 / (32768.0 * 512.0));
946     ff_mdct_init(&c->mdct_small,  8, 1, 1.0 / (32768.0 * 128.0));
947     ff_fft_init(&c->fft128,  6, 0);
948     ff_fft_init(&c->fft256,  7, 0);
949     ff_fft_init(&c->fft512,  8, 1);
950     ff_fft_init(&c->fft1024, 9, 1);
951     avpriv_float_dsp_init(&c->fdsp, avctx->flags & CODEC_FLAG_BITEXACT);
952
953     if (init_vlc(&c->scale_diff, 9, ON2AVC_SCALE_DIFFS,
954                  ff_on2avc_scale_diff_bits,  1, 1,
955                  ff_on2avc_scale_diff_codes, 4, 4, 0)) {
956         av_log(avctx, AV_LOG_ERROR, "Cannot init VLC\n");
957         return AVERROR(ENOMEM);
958     }
959     for (i = 1; i < 9; i++) {
960         int idx = i - 1;
961         if (ff_init_vlc_sparse(&c->cb_vlc[i], 9, ff_on2avc_quad_cb_elems[idx],
962                                ff_on2avc_quad_cb_bits[idx],  1, 1,
963                                ff_on2avc_quad_cb_codes[idx], 4, 4,
964                                ff_on2avc_quad_cb_syms[idx],  2, 2, 0)) {
965             av_log(avctx, AV_LOG_ERROR, "Cannot init VLC\n");
966             on2avc_free_vlcs(c);
967             return AVERROR(ENOMEM);
968         }
969     }
970     for (i = 9; i < 16; i++) {
971         int idx = i - 9;
972         if (ff_init_vlc_sparse(&c->cb_vlc[i], 9, ff_on2avc_pair_cb_elems[idx],
973                                ff_on2avc_pair_cb_bits[idx],  1, 1,
974                                ff_on2avc_pair_cb_codes[idx], 2, 2,
975                                ff_on2avc_pair_cb_syms[idx],  2, 2, 0)) {
976             av_log(avctx, AV_LOG_ERROR, "Cannot init VLC\n");
977             on2avc_free_vlcs(c);
978             return AVERROR(ENOMEM);
979         }
980     }
981
982     return 0;
983 }
984
985 static av_cold int on2avc_decode_close(AVCodecContext *avctx)
986 {
987     On2AVCContext *c = avctx->priv_data;
988
989     ff_mdct_end(&c->mdct);
990     ff_mdct_end(&c->mdct_half);
991     ff_mdct_end(&c->mdct_small);
992     ff_fft_end(&c->fft128);
993     ff_fft_end(&c->fft256);
994     ff_fft_end(&c->fft512);
995     ff_fft_end(&c->fft1024);
996
997     on2avc_free_vlcs(c);
998
999     return 0;
1000 }
1001
1002
1003 AVCodec ff_on2avc_decoder = {
1004     .name           = "on2avc",
1005     .long_name      = NULL_IF_CONFIG_SMALL("On2 Audio for Video Codec"),
1006     .type           = AVMEDIA_TYPE_AUDIO,
1007     .id             = AV_CODEC_ID_ON2AVC,
1008     .priv_data_size = sizeof(On2AVCContext),
1009     .init           = on2avc_decode_init,
1010     .decode         = on2avc_decode_frame,
1011     .close          = on2avc_decode_close,
1012     .capabilities   = CODEC_CAP_DR1,
1013     .sample_fmts    = (const enum AVSampleFormat[]) { AV_SAMPLE_FMT_FLTP,
1014                                                       AV_SAMPLE_FMT_NONE },
1015 };