]> git.sesse.net Git - ffmpeg/blob - libavutil/float_dsp.c
Merge commit '22f98ac19cf29f22b3e1d10314df9503f06fe683'
[ffmpeg] / libavutil / float_dsp.c
1 /*
2  * Copyright 2005 Balatoni Denes
3  * Copyright 2006 Loren Merritt
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include "config.h"
23 #include "attributes.h"
24 #include "float_dsp.h"
25 #include "mem.h"
26
27 static void vector_fmul_c(float *dst, const float *src0, const float *src1,
28                           int len)
29 {
30     int i;
31     for (i = 0; i < len; i++)
32         dst[i] = src0[i] * src1[i];
33 }
34
35 static void vector_fmac_scalar_c(float *dst, const float *src, float mul,
36                                  int len)
37 {
38     int i;
39     for (i = 0; i < len; i++)
40         dst[i] += src[i] * mul;
41 }
42
43 static void vector_dmac_scalar_c(double *dst, const double *src, double mul,
44                                  int len)
45 {
46     int i;
47     for (i = 0; i < len; i++)
48         dst[i] += src[i] * mul;
49 }
50
51 static void vector_fmul_scalar_c(float *dst, const float *src, float mul,
52                                  int len)
53 {
54     int i;
55     for (i = 0; i < len; i++)
56         dst[i] = src[i] * mul;
57 }
58
59 static void vector_dmul_scalar_c(double *dst, const double *src, double mul,
60                                  int len)
61 {
62     int i;
63     for (i = 0; i < len; i++)
64         dst[i] = src[i] * mul;
65 }
66
67 static void vector_fmul_window_c(float *dst, const float *src0,
68                                  const float *src1, const float *win, int len)
69 {
70     int i, j;
71
72     dst  += len;
73     win  += len;
74     src0 += len;
75
76     for (i = -len, j = len - 1; i < 0; i++, j--) {
77         float s0 = src0[i];
78         float s1 = src1[j];
79         float wi = win[i];
80         float wj = win[j];
81         dst[i] = s0 * wj - s1 * wi;
82         dst[j] = s0 * wi + s1 * wj;
83     }
84 }
85
86 static void vector_fmul_add_c(float *dst, const float *src0, const float *src1,
87                               const float *src2, int len){
88     int i;
89
90     for (i = 0; i < len; i++)
91         dst[i] = src0[i] * src1[i] + src2[i];
92 }
93
94 static void vector_fmul_reverse_c(float *dst, const float *src0,
95                                   const float *src1, int len)
96 {
97     int i;
98
99     src1 += len-1;
100     for (i = 0; i < len; i++)
101         dst[i] = src0[i] * src1[-i];
102 }
103
104 static void butterflies_float_c(float *av_restrict v1, float *av_restrict v2,
105                                 int len)
106 {
107     int i;
108
109     for (i = 0; i < len; i++) {
110         float t = v1[i] - v2[i];
111         v1[i] += v2[i];
112         v2[i] = t;
113     }
114 }
115
116 float avpriv_scalarproduct_float_c(const float *v1, const float *v2, int len)
117 {
118     float p = 0.0;
119     int i;
120
121     for (i = 0; i < len; i++)
122         p += v1[i] * v2[i];
123
124     return p;
125 }
126
127 av_cold AVFloatDSPContext *avpriv_float_dsp_alloc(int bit_exact)
128 {
129     AVFloatDSPContext *fdsp = av_mallocz(sizeof(AVFloatDSPContext));
130     if (!fdsp)
131         return NULL;
132
133     fdsp->vector_fmul = vector_fmul_c;
134     fdsp->vector_fmac_scalar = vector_fmac_scalar_c;
135     fdsp->vector_fmul_scalar = vector_fmul_scalar_c;
136     fdsp->vector_dmac_scalar = vector_dmac_scalar_c;
137     fdsp->vector_dmul_scalar = vector_dmul_scalar_c;
138     fdsp->vector_fmul_window = vector_fmul_window_c;
139     fdsp->vector_fmul_add = vector_fmul_add_c;
140     fdsp->vector_fmul_reverse = vector_fmul_reverse_c;
141     fdsp->butterflies_float = butterflies_float_c;
142     fdsp->scalarproduct_float = avpriv_scalarproduct_float_c;
143
144     if (ARCH_AARCH64)
145         ff_float_dsp_init_aarch64(fdsp);
146     if (ARCH_ARM)
147         ff_float_dsp_init_arm(fdsp);
148     if (ARCH_PPC)
149         ff_float_dsp_init_ppc(fdsp, bit_exact);
150     if (ARCH_X86)
151         ff_float_dsp_init_x86(fdsp);
152     if (ARCH_MIPS)
153         ff_float_dsp_init_mips(fdsp);
154     return fdsp;
155 }