]> git.sesse.net Git - ffmpeg/blob - libavcodec/dcadsp.c
vp9: split superframes in the filtering stage before actual decoding
[ffmpeg] / libavcodec / dcadsp.c
1 /*
2  * Copyright (c) 2004 Gildas Bazin
3  * Copyright (c) 2010 Mans Rullgard <mans@mansr.com>
4  *
5  * This file is part of Libav.
6  *
7  * Libav is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * Libav is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with Libav; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include "config.h"
23
24 #include "libavutil/attributes.h"
25 #include "libavutil/intreadwrite.h"
26
27 #include "dcadsp.h"
28 #include "dcamath.h"
29
30 static void decode_hf_c(int32_t dst[DCA_SUBBANDS][SAMPLES_PER_SUBBAND],
31                         const int32_t vq_num[DCA_SUBBANDS],
32                         const int8_t hf_vq[1024][32], intptr_t vq_offset,
33                         int32_t scale[DCA_SUBBANDS][2],
34                         intptr_t start, intptr_t end)
35 {
36     int i, j;
37
38     for (j = start; j < end; j++) {
39         const int8_t *ptr = &hf_vq[vq_num[j]][vq_offset];
40         for (i = 0; i < 8; i++)
41             dst[j][i] = ptr[i] * scale[j][0] + 8 >> 4;
42     }
43 }
44
45 static inline void dca_lfe_fir(float *out, const float *in, const float *coefs,
46                                int decifactor)
47 {
48     float *out2    = out + 2 * decifactor - 1;
49     int num_coeffs = 256 / decifactor;
50     int j, k;
51
52     /* One decimated sample generates 2*decifactor interpolated ones */
53     for (k = 0; k < decifactor; k++) {
54         float v0 = 0.0;
55         float v1 = 0.0;
56         for (j = 0; j < num_coeffs; j++, coefs++) {
57             v0 += in[-j]                 * *coefs;
58             v1 += in[j + 1 - num_coeffs] * *coefs;
59         }
60         *out++  = v0;
61         *out2-- = v1;
62     }
63 }
64
65 static void dca_qmf_32_subbands(float samples_in[DCA_SUBBANDS][SAMPLES_PER_SUBBAND], int sb_act,
66                                 SynthFilterContext *synth, FFTContext *imdct,
67                                 float synth_buf_ptr[512],
68                                 int *synth_buf_offset, float synth_buf2[32],
69                                 const float window[512], float *samples_out,
70                                 float raXin[32], float scale)
71 {
72     int i;
73     int subindex;
74
75     for (i = sb_act; i < 32; i++)
76         raXin[i] = 0.0;
77
78     /* Reconstructed channel sample index */
79     for (subindex = 0; subindex < 8; subindex++) {
80         /* Load in one sample from each subband and clear inactive subbands */
81         for (i = 0; i < sb_act; i++) {
82             unsigned sign = (i - 1) & 2;
83             uint32_t v    = AV_RN32A(&samples_in[i][subindex]) ^ sign << 30;
84             AV_WN32A(&raXin[i], v);
85         }
86
87         synth->synth_filter_float(imdct, synth_buf_ptr, synth_buf_offset,
88                                   synth_buf2, window, samples_out, raXin,
89                                   scale);
90         samples_out += 32;
91     }
92 }
93
94 static void dequantize_c(int32_t *samples, uint32_t step_size, uint32_t scale)
95 {
96     int64_t step = (int64_t)step_size * scale;
97     int shift, i;
98     int32_t step_scale;
99
100     if (step > (1 << 23))
101         shift = av_log2(step >> 23) + 1;
102     else
103         shift = 0;
104     step_scale = (int32_t)(step >> shift);
105
106     for (i = 0; i < SAMPLES_PER_SUBBAND; i++)
107         samples[i] = dca_clip23(dca_norm((int64_t)samples[i] * step_scale, 22 - shift));
108 }
109
110 static void dca_lfe_fir0_c(float *out, const float *in, const float *coefs)
111 {
112     dca_lfe_fir(out, in, coefs, 32);
113 }
114
115 static void dca_lfe_fir1_c(float *out, const float *in, const float *coefs)
116 {
117     dca_lfe_fir(out, in, coefs, 64);
118 }
119
120 av_cold void ff_dcadsp_init(DCADSPContext *s)
121 {
122     s->lfe_fir[0]      = dca_lfe_fir0_c;
123     s->lfe_fir[1]      = dca_lfe_fir1_c;
124     s->qmf_32_subbands = dca_qmf_32_subbands;
125     s->decode_hf       = decode_hf_c;
126     s->dequantize      = dequantize_c;
127
128     if (ARCH_AARCH64)
129         ff_dcadsp_init_aarch64(s);
130     if (ARCH_ARM)
131         ff_dcadsp_init_arm(s);
132     if (ARCH_X86)
133         ff_dcadsp_init_x86(s);
134 }