]> git.sesse.net Git - ffmpeg/blob - libavcodec/fft-test.c
fft-test: add option to set cpuflag mask
[ffmpeg] / libavcodec / fft-test.c
1 /*
2  * (c) 2002 Fabrice Bellard
3  *
4  * This file is part of Libav.
5  *
6  * Libav is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU Lesser General Public
8  * License as published by the Free Software Foundation; either
9  * version 2.1 of the License, or (at your option) any later version.
10  *
11  * Libav is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14  * Lesser General Public License for more details.
15  *
16  * You should have received a copy of the GNU Lesser General Public
17  * License along with Libav; if not, write to the Free Software
18  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
19  */
20
21 /**
22  * @file
23  * FFT and MDCT tests.
24  */
25
26 #include "libavutil/cpu.h"
27 #include "libavutil/mathematics.h"
28 #include "libavutil/lfg.h"
29 #include "libavutil/log.h"
30 #include "fft.h"
31 #if CONFIG_FFT_FLOAT
32 #include "dct.h"
33 #include "rdft.h"
34 #endif
35 #include <math.h>
36 #include <unistd.h>
37 #include <sys/time.h>
38 #include <stdlib.h>
39 #include <string.h>
40
41 /* reference fft */
42
43 #define MUL16(a,b) ((a) * (b))
44
45 #define CMAC(pre, pim, are, aim, bre, bim) \
46 {\
47    pre += (MUL16(are, bre) - MUL16(aim, bim));\
48    pim += (MUL16(are, bim) + MUL16(bre, aim));\
49 }
50
51 #if CONFIG_FFT_FLOAT
52 #   define RANGE 1.0
53 #   define REF_SCALE(x, bits)  (x)
54 #   define FMT "%10.6f"
55 #else
56 #   define RANGE 16384
57 #   define REF_SCALE(x, bits) ((x) / (1<<(bits)))
58 #   define FMT "%6d"
59 #endif
60
61 struct {
62     float re, im;
63 } *exptab;
64
65 static void fft_ref_init(int nbits, int inverse)
66 {
67     int n, i;
68     double c1, s1, alpha;
69
70     n = 1 << nbits;
71     exptab = av_malloc((n / 2) * sizeof(*exptab));
72
73     for (i = 0; i < (n/2); i++) {
74         alpha = 2 * M_PI * (float)i / (float)n;
75         c1 = cos(alpha);
76         s1 = sin(alpha);
77         if (!inverse)
78             s1 = -s1;
79         exptab[i].re = c1;
80         exptab[i].im = s1;
81     }
82 }
83
84 static void fft_ref(FFTComplex *tabr, FFTComplex *tab, int nbits)
85 {
86     int n, i, j, k, n2;
87     double tmp_re, tmp_im, s, c;
88     FFTComplex *q;
89
90     n = 1 << nbits;
91     n2 = n >> 1;
92     for (i = 0; i < n; i++) {
93         tmp_re = 0;
94         tmp_im = 0;
95         q = tab;
96         for (j = 0; j < n; j++) {
97             k = (i * j) & (n - 1);
98             if (k >= n2) {
99                 c = -exptab[k - n2].re;
100                 s = -exptab[k - n2].im;
101             } else {
102                 c = exptab[k].re;
103                 s = exptab[k].im;
104             }
105             CMAC(tmp_re, tmp_im, c, s, q->re, q->im);
106             q++;
107         }
108         tabr[i].re = REF_SCALE(tmp_re, nbits);
109         tabr[i].im = REF_SCALE(tmp_im, nbits);
110     }
111 }
112
113 static void imdct_ref(FFTSample *out, FFTSample *in, int nbits)
114 {
115     int n = 1<<nbits;
116     int k, i, a;
117     double sum, f;
118
119     for (i = 0; i < n; i++) {
120         sum = 0;
121         for (k = 0; k < n/2; k++) {
122             a = (2 * i + 1 + (n / 2)) * (2 * k + 1);
123             f = cos(M_PI * a / (double)(2 * n));
124             sum += f * in[k];
125         }
126         out[i] = REF_SCALE(-sum, nbits - 2);
127     }
128 }
129
130 /* NOTE: no normalisation by 1 / N is done */
131 static void mdct_ref(FFTSample *output, FFTSample *input, int nbits)
132 {
133     int n = 1<<nbits;
134     int k, i;
135     double a, s;
136
137     /* do it by hand */
138     for (k = 0; k < n/2; k++) {
139         s = 0;
140         for (i = 0; i < n; i++) {
141             a = (2*M_PI*(2*i+1+n/2)*(2*k+1) / (4 * n));
142             s += input[i] * cos(a);
143         }
144         output[k] = REF_SCALE(s, nbits - 1);
145     }
146 }
147
148 #if CONFIG_FFT_FLOAT
149 static void idct_ref(float *output, float *input, int nbits)
150 {
151     int n = 1<<nbits;
152     int k, i;
153     double a, s;
154
155     /* do it by hand */
156     for (i = 0; i < n; i++) {
157         s = 0.5 * input[0];
158         for (k = 1; k < n; k++) {
159             a = M_PI*k*(i+0.5) / n;
160             s += input[k] * cos(a);
161         }
162         output[i] = 2 * s / n;
163     }
164 }
165 static void dct_ref(float *output, float *input, int nbits)
166 {
167     int n = 1<<nbits;
168     int k, i;
169     double a, s;
170
171     /* do it by hand */
172     for (k = 0; k < n; k++) {
173         s = 0;
174         for (i = 0; i < n; i++) {
175             a = M_PI*k*(i+0.5) / n;
176             s += input[i] * cos(a);
177         }
178         output[k] = s;
179     }
180 }
181 #endif
182
183
184 static FFTSample frandom(AVLFG *prng)
185 {
186     return (int16_t)av_lfg_get(prng) / 32768.0 * RANGE;
187 }
188
189 static int64_t gettime(void)
190 {
191     struct timeval tv;
192     gettimeofday(&tv,NULL);
193     return (int64_t)tv.tv_sec * 1000000 + tv.tv_usec;
194 }
195
196 static int check_diff(FFTSample *tab1, FFTSample *tab2, int n, double scale)
197 {
198     int i;
199     double max= 0;
200     double error= 0;
201     int err = 0;
202
203     for (i = 0; i < n; i++) {
204         double e = fabsf(tab1[i] - (tab2[i] / scale)) / RANGE;
205         if (e >= 1e-3) {
206             av_log(NULL, AV_LOG_ERROR, "ERROR %5d: "FMT" "FMT"\n",
207                    i, tab1[i], tab2[i]);
208             err = 1;
209         }
210         error+= e*e;
211         if(e>max) max= e;
212     }
213     av_log(NULL, AV_LOG_INFO, "max:%f e:%g\n", max, sqrt(error)/n);
214     return err;
215 }
216
217
218 static void help(void)
219 {
220     av_log(NULL, AV_LOG_INFO,"usage: fft-test [-h] [-s] [-i] [-n b]\n"
221            "-h     print this help\n"
222            "-s     speed test\n"
223            "-m     (I)MDCT test\n"
224            "-d     (I)DCT test\n"
225            "-r     (I)RDFT test\n"
226            "-i     inverse transform test\n"
227            "-n b   set the transform size to 2^b\n"
228            "-f x   set scale factor for output data of (I)MDCT to x\n"
229            );
230 }
231
232 enum tf_transform {
233     TRANSFORM_FFT,
234     TRANSFORM_MDCT,
235     TRANSFORM_RDFT,
236     TRANSFORM_DCT,
237 };
238
239 int main(int argc, char **argv)
240 {
241     FFTComplex *tab, *tab1, *tab_ref;
242     FFTSample *tab2;
243     int it, i, c;
244     int cpuflags;
245     int do_speed = 0;
246     int err = 1;
247     enum tf_transform transform = TRANSFORM_FFT;
248     int do_inverse = 0;
249     FFTContext s1, *s = &s1;
250     FFTContext m1, *m = &m1;
251 #if CONFIG_FFT_FLOAT
252     RDFTContext r1, *r = &r1;
253     DCTContext d1, *d = &d1;
254     int fft_size_2;
255 #endif
256     int fft_nbits, fft_size;
257     double scale = 1.0;
258     AVLFG prng;
259     av_lfg_init(&prng, 1);
260
261     fft_nbits = 9;
262     for(;;) {
263         c = getopt(argc, argv, "hsimrdn:f:c:");
264         if (c == -1)
265             break;
266         switch(c) {
267         case 'h':
268             help();
269             return 1;
270         case 's':
271             do_speed = 1;
272             break;
273         case 'i':
274             do_inverse = 1;
275             break;
276         case 'm':
277             transform = TRANSFORM_MDCT;
278             break;
279         case 'r':
280             transform = TRANSFORM_RDFT;
281             break;
282         case 'd':
283             transform = TRANSFORM_DCT;
284             break;
285         case 'n':
286             fft_nbits = atoi(optarg);
287             break;
288         case 'f':
289             scale = atof(optarg);
290             break;
291         case 'c':
292             cpuflags = av_parse_cpu_flags(optarg);
293             if (cpuflags < 0)
294                 return 1;
295             av_set_cpu_flags_mask(cpuflags);
296             break;
297         }
298     }
299
300     fft_size = 1 << fft_nbits;
301     tab = av_malloc(fft_size * sizeof(FFTComplex));
302     tab1 = av_malloc(fft_size * sizeof(FFTComplex));
303     tab_ref = av_malloc(fft_size * sizeof(FFTComplex));
304     tab2 = av_malloc(fft_size * sizeof(FFTSample));
305
306     switch (transform) {
307     case TRANSFORM_MDCT:
308         av_log(NULL, AV_LOG_INFO,"Scale factor is set to %f\n", scale);
309         if (do_inverse)
310             av_log(NULL, AV_LOG_INFO,"IMDCT");
311         else
312             av_log(NULL, AV_LOG_INFO,"MDCT");
313         ff_mdct_init(m, fft_nbits, do_inverse, scale);
314         break;
315     case TRANSFORM_FFT:
316         if (do_inverse)
317             av_log(NULL, AV_LOG_INFO,"IFFT");
318         else
319             av_log(NULL, AV_LOG_INFO,"FFT");
320         ff_fft_init(s, fft_nbits, do_inverse);
321         fft_ref_init(fft_nbits, do_inverse);
322         break;
323 #if CONFIG_FFT_FLOAT
324     case TRANSFORM_RDFT:
325         if (do_inverse)
326             av_log(NULL, AV_LOG_INFO,"IDFT_C2R");
327         else
328             av_log(NULL, AV_LOG_INFO,"DFT_R2C");
329         ff_rdft_init(r, fft_nbits, do_inverse ? IDFT_C2R : DFT_R2C);
330         fft_ref_init(fft_nbits, do_inverse);
331         break;
332     case TRANSFORM_DCT:
333         if (do_inverse)
334             av_log(NULL, AV_LOG_INFO,"DCT_III");
335         else
336             av_log(NULL, AV_LOG_INFO,"DCT_II");
337         ff_dct_init(d, fft_nbits, do_inverse ? DCT_III : DCT_II);
338         break;
339 #endif
340     default:
341         av_log(NULL, AV_LOG_ERROR, "Requested transform not supported\n");
342         return 1;
343     }
344     av_log(NULL, AV_LOG_INFO," %d test\n", fft_size);
345
346     /* generate random data */
347
348     for (i = 0; i < fft_size; i++) {
349         tab1[i].re = frandom(&prng);
350         tab1[i].im = frandom(&prng);
351     }
352
353     /* checking result */
354     av_log(NULL, AV_LOG_INFO,"Checking...\n");
355
356     switch (transform) {
357     case TRANSFORM_MDCT:
358         if (do_inverse) {
359             imdct_ref((FFTSample *)tab_ref, (FFTSample *)tab1, fft_nbits);
360             m->imdct_calc(m, tab2, (FFTSample *)tab1);
361             err = check_diff((FFTSample *)tab_ref, tab2, fft_size, scale);
362         } else {
363             mdct_ref((FFTSample *)tab_ref, (FFTSample *)tab1, fft_nbits);
364
365             m->mdct_calc(m, tab2, (FFTSample *)tab1);
366
367             err = check_diff((FFTSample *)tab_ref, tab2, fft_size / 2, scale);
368         }
369         break;
370     case TRANSFORM_FFT:
371         memcpy(tab, tab1, fft_size * sizeof(FFTComplex));
372         s->fft_permute(s, tab);
373         s->fft_calc(s, tab);
374
375         fft_ref(tab_ref, tab1, fft_nbits);
376         err = check_diff((FFTSample *)tab_ref, (FFTSample *)tab, fft_size * 2, 1.0);
377         break;
378 #if CONFIG_FFT_FLOAT
379     case TRANSFORM_RDFT:
380         fft_size_2 = fft_size >> 1;
381         if (do_inverse) {
382             tab1[         0].im = 0;
383             tab1[fft_size_2].im = 0;
384             for (i = 1; i < fft_size_2; i++) {
385                 tab1[fft_size_2+i].re =  tab1[fft_size_2-i].re;
386                 tab1[fft_size_2+i].im = -tab1[fft_size_2-i].im;
387             }
388
389             memcpy(tab2, tab1, fft_size * sizeof(FFTSample));
390             tab2[1] = tab1[fft_size_2].re;
391
392             r->rdft_calc(r, tab2);
393             fft_ref(tab_ref, tab1, fft_nbits);
394             for (i = 0; i < fft_size; i++) {
395                 tab[i].re = tab2[i];
396                 tab[i].im = 0;
397             }
398             err = check_diff((float *)tab_ref, (float *)tab, fft_size * 2, 0.5);
399         } else {
400             for (i = 0; i < fft_size; i++) {
401                 tab2[i]    = tab1[i].re;
402                 tab1[i].im = 0;
403             }
404             r->rdft_calc(r, tab2);
405             fft_ref(tab_ref, tab1, fft_nbits);
406             tab_ref[0].im = tab_ref[fft_size_2].re;
407             err = check_diff((float *)tab_ref, (float *)tab2, fft_size, 1.0);
408         }
409         break;
410     case TRANSFORM_DCT:
411         memcpy(tab, tab1, fft_size * sizeof(FFTComplex));
412         d->dct_calc(d, tab);
413         if (do_inverse) {
414             idct_ref(tab_ref, tab1, fft_nbits);
415         } else {
416             dct_ref(tab_ref, tab1, fft_nbits);
417         }
418         err = check_diff((float *)tab_ref, (float *)tab, fft_size, 1.0);
419         break;
420 #endif
421     }
422
423     /* do a speed test */
424
425     if (do_speed) {
426         int64_t time_start, duration;
427         int nb_its;
428
429         av_log(NULL, AV_LOG_INFO,"Speed test...\n");
430         /* we measure during about 1 seconds */
431         nb_its = 1;
432         for(;;) {
433             time_start = gettime();
434             for (it = 0; it < nb_its; it++) {
435                 switch (transform) {
436                 case TRANSFORM_MDCT:
437                     if (do_inverse) {
438                         m->imdct_calc(m, (FFTSample *)tab, (FFTSample *)tab1);
439                     } else {
440                         m->mdct_calc(m, (FFTSample *)tab, (FFTSample *)tab1);
441                     }
442                     break;
443                 case TRANSFORM_FFT:
444                     memcpy(tab, tab1, fft_size * sizeof(FFTComplex));
445                     s->fft_calc(s, tab);
446                     break;
447 #if CONFIG_FFT_FLOAT
448                 case TRANSFORM_RDFT:
449                     memcpy(tab2, tab1, fft_size * sizeof(FFTSample));
450                     r->rdft_calc(r, tab2);
451                     break;
452                 case TRANSFORM_DCT:
453                     memcpy(tab2, tab1, fft_size * sizeof(FFTSample));
454                     d->dct_calc(d, tab2);
455                     break;
456 #endif
457                 }
458             }
459             duration = gettime() - time_start;
460             if (duration >= 1000000)
461                 break;
462             nb_its *= 2;
463         }
464         av_log(NULL, AV_LOG_INFO,"time: %0.1f us/transform [total time=%0.2f s its=%d]\n",
465                (double)duration / nb_its,
466                (double)duration / 1000000.0,
467                nb_its);
468     }
469
470     switch (transform) {
471     case TRANSFORM_MDCT:
472         ff_mdct_end(m);
473         break;
474     case TRANSFORM_FFT:
475         ff_fft_end(s);
476         break;
477 #if CONFIG_FFT_FLOAT
478     case TRANSFORM_RDFT:
479         ff_rdft_end(r);
480         break;
481     case TRANSFORM_DCT:
482         ff_dct_end(d);
483         break;
484 #endif
485     }
486
487     av_free(tab);
488     av_free(tab1);
489     av_free(tab2);
490     av_free(tab_ref);
491     av_free(exptab);
492
493     return err;
494 }