]> git.sesse.net Git - ffmpeg/blob - libavutil/tx.c
lavu/tx: add parity revtab generator version
[ffmpeg] / libavutil / tx.c
1 /*
2  * This file is part of FFmpeg.
3  *
4  * FFmpeg is free software; you can redistribute it and/or
5  * modify it under the terms of the GNU Lesser General Public
6  * License as published by the Free Software Foundation; either
7  * version 2.1 of the License, or (at your option) any later version.
8  *
9  * FFmpeg is distributed in the hope that it will be useful,
10  * but WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
12  * Lesser General Public License for more details.
13  *
14  * You should have received a copy of the GNU Lesser General Public
15  * License along with FFmpeg; if not, write to the Free Software
16  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
17  */
18
19 #include "tx_priv.h"
20
21 int ff_tx_type_is_mdct(enum AVTXType type)
22 {
23     switch (type) {
24     case AV_TX_FLOAT_MDCT:
25     case AV_TX_DOUBLE_MDCT:
26     case AV_TX_INT32_MDCT:
27         return 1;
28     default:
29         return 0;
30     }
31 }
32
33 /* Calculates the modular multiplicative inverse */
34 static av_always_inline int mulinv(int n, int m)
35 {
36     n = n % m;
37     for (int x = 1; x < m; x++)
38         if (((n * x) % m) == 1)
39             return x;
40     av_assert0(0); /* Never reached */
41 }
42
43 /* Guaranteed to work for any n, m where gcd(n, m) == 1 */
44 int ff_tx_gen_compound_mapping(AVTXContext *s)
45 {
46     int *in_map, *out_map;
47     const int n     = s->n;
48     const int m     = s->m;
49     const int inv   = s->inv;
50     const int len   = n*m;
51     const int m_inv = mulinv(m, n);
52     const int n_inv = mulinv(n, m);
53     const int mdct  = ff_tx_type_is_mdct(s->type);
54
55     if (!(s->pfatab = av_malloc(2*len*sizeof(*s->pfatab))))
56         return AVERROR(ENOMEM);
57
58     in_map  = s->pfatab;
59     out_map = s->pfatab + n*m;
60
61     /* Ruritanian map for input, CRT map for output, can be swapped */
62     for (int j = 0; j < m; j++) {
63         for (int i = 0; i < n; i++) {
64             /* Shifted by 1 to simplify MDCTs */
65             in_map[j*n + i] = ((i*m + j*n) % len) << mdct;
66             out_map[(i*m*m_inv + j*n*n_inv) % len] = i*m + j;
67         }
68     }
69
70     /* Change transform direction by reversing all ACs */
71     if (inv) {
72         for (int i = 0; i < m; i++) {
73             int *in = &in_map[i*n + 1]; /* Skip the DC */
74             for (int j = 0; j < ((n - 1) >> 1); j++)
75                 FFSWAP(int, in[j], in[n - j - 2]);
76         }
77     }
78
79     /* Our 15-point transform is also a compound one, so embed its input map */
80     if (n == 15) {
81         for (int k = 0; k < m; k++) {
82             int tmp[15];
83             memcpy(tmp, &in_map[k*15], 15*sizeof(*tmp));
84             for (int i = 0; i < 5; i++) {
85                 for (int j = 0; j < 3; j++)
86                     in_map[k*15 + i*3 + j] = tmp[(i*3 + j*5) % 15];
87             }
88         }
89     }
90
91     return 0;
92 }
93
94 static inline int split_radix_permutation(int i, int m, int inverse)
95 {
96     m >>= 1;
97     if (m <= 1)
98         return i & 1;
99     if (!(i & m))
100         return (split_radix_permutation(i, m, inverse) << 1);
101     m >>= 1;
102     return (split_radix_permutation(i, m, inverse) << 2) + 1 - 2*(!(i & m) ^ inverse);
103 }
104
105 int ff_tx_gen_ptwo_revtab(AVTXContext *s, int invert_lookup)
106 {
107     const int m = s->m, inv = s->inv;
108
109     if (!(s->revtab = av_malloc(m*sizeof(*s->revtab))))
110         return AVERROR(ENOMEM);
111
112     /* Default */
113     for (int i = 0; i < m; i++) {
114         int k = -split_radix_permutation(i, m, inv) & (m - 1);
115         if (invert_lookup)
116             s->revtab[i] = k;
117         else
118             s->revtab[k] = i;
119     }
120
121     return 0;
122 }
123
124 int ff_tx_gen_ptwo_inplace_revtab_idx(AVTXContext *s)
125 {
126     int nb_inplace_idx = 0;
127
128     if (!(s->inplace_idx = av_malloc(s->m*sizeof(*s->inplace_idx))))
129         return AVERROR(ENOMEM);
130
131     /* The first coefficient is always already in-place */
132     for (int src = 1; src < s->m; src++) {
133         int dst = s->revtab[src];
134         int found = 0;
135
136         if (dst <= src)
137             continue;
138
139         /* This just checks if a closed loop has been encountered before,
140          * and if so, skips it, since to fully permute a loop we must only
141          * enter it once. */
142         do {
143             for (int j = 0; j < nb_inplace_idx; j++) {
144                 if (dst == s->inplace_idx[j]) {
145                     found = 1;
146                     break;
147                 }
148             }
149             dst = s->revtab[dst];
150         } while (dst != src && !found);
151
152         if (!found)
153             s->inplace_idx[nb_inplace_idx++] = src;
154     }
155
156     s->inplace_idx[nb_inplace_idx++] = 0;
157
158     return 0;
159 }
160
161 static void parity_revtab_generator(int *revtab, int n, int inv, int offset,
162                                     int is_dual, int dual_high, int len,
163                                     int basis, int dual_stride)
164 {
165     len >>= 1;
166
167     if (len <= basis) {
168         int k1, k2, *even, *odd, stride;
169
170         is_dual = is_dual && dual_stride;
171         dual_high = is_dual & dual_high;
172         stride = is_dual ? FFMIN(dual_stride, len) : 0;
173
174         even = &revtab[offset + dual_high*(stride - 2*len)];
175         odd  = &even[len + (is_dual && !dual_high)*len + dual_high*len];
176
177         for (int i = 0; i < len; i++) {
178             k1 = -split_radix_permutation(offset + i*2 + 0, n, inv) & (n - 1);
179             k2 = -split_radix_permutation(offset + i*2 + 1, n, inv) & (n - 1);
180             *even++ = k1;
181             *odd++  = k2;
182             if (stride && !((i + 1) % stride)) {
183                 even += stride;
184                 odd  += stride;
185             }
186         }
187
188         return;
189     }
190
191     parity_revtab_generator(revtab, n, inv, offset,
192                             0, 0, len >> 0, basis, dual_stride);
193     parity_revtab_generator(revtab, n, inv, offset + (len >> 0),
194                             1, 0, len >> 1, basis, dual_stride);
195     parity_revtab_generator(revtab, n, inv, offset + (len >> 0) + (len >> 1),
196                             1, 1, len >> 1, basis, dual_stride);
197 }
198
199 void ff_tx_gen_split_radix_parity_revtab(int *revtab, int len, int inv,
200                                          int basis, int dual_stride)
201 {
202     basis >>= 1;
203     if (len < basis)
204         return;
205     av_assert0(!dual_stride || !(dual_stride & (dual_stride - 1)));
206     av_assert0(dual_stride <= basis);
207     parity_revtab_generator(revtab, len, inv, 0, 0, 0, len, basis, dual_stride);
208 }
209
210 av_cold void av_tx_uninit(AVTXContext **ctx)
211 {
212     if (!(*ctx))
213         return;
214
215     av_free((*ctx)->pfatab);
216     av_free((*ctx)->exptab);
217     av_free((*ctx)->revtab);
218     av_free((*ctx)->inplace_idx);
219     av_free((*ctx)->tmp);
220
221     av_freep(ctx);
222 }
223
224 av_cold int av_tx_init(AVTXContext **ctx, av_tx_fn *tx, enum AVTXType type,
225                        int inv, int len, const void *scale, uint64_t flags)
226 {
227     int err;
228     AVTXContext *s = av_mallocz(sizeof(*s));
229     if (!s)
230         return AVERROR(ENOMEM);
231
232     switch (type) {
233     case AV_TX_FLOAT_FFT:
234     case AV_TX_FLOAT_MDCT:
235         if ((err = ff_tx_init_mdct_fft_float(s, tx, type, inv, len, scale, flags)))
236             goto fail;
237         break;
238     case AV_TX_DOUBLE_FFT:
239     case AV_TX_DOUBLE_MDCT:
240         if ((err = ff_tx_init_mdct_fft_double(s, tx, type, inv, len, scale, flags)))
241             goto fail;
242         break;
243     case AV_TX_INT32_FFT:
244     case AV_TX_INT32_MDCT:
245         if ((err = ff_tx_init_mdct_fft_int32(s, tx, type, inv, len, scale, flags)))
246             goto fail;
247         break;
248     default:
249         err = AVERROR(EINVAL);
250         goto fail;
251     }
252
253     *ctx = s;
254
255     return 0;
256
257 fail:
258     av_tx_uninit(&s);
259     *tx = NULL;
260     return err;
261 }