]> git.sesse.net Git - ffmpeg/blob - libswresample/resample_template.c
Merge commit '7c377f0e74de8ab57f6baa64f3ec197c82104764'
[ffmpeg] / libswresample / resample_template.c
1 /*
2  * audio resampling
3  * Copyright (c) 2004-2012 Michael Niedermayer <michaelni@gmx.at>
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 /**
23  * @file
24  * audio resampling
25  * @author Michael Niedermayer <michaelni@gmx.at>
26  */
27
28 #if    defined(TEMPLATE_RESAMPLE_DBL)     \
29     || defined(TEMPLATE_RESAMPLE_DBL_SSE2)
30
31 #    define FILTER_SHIFT 0
32 #    define DELEM  double
33 #    define FELEM  double
34 #    define FELEM2 double
35 #    define FELEML double
36 #    define OUT(d, v) d = v
37
38 #    if defined(TEMPLATE_RESAMPLE_DBL)
39 #        define RENAME(N) N ## _double
40 #    elif defined(TEMPLATE_RESAMPLE_DBL_SSE2)
41 #        define COMMON_CORE COMMON_CORE_DBL_SSE2
42 #        define LINEAR_CORE LINEAR_CORE_DBL_SSE2
43 #        define RENAME(N) N ## _double_sse2
44 #    endif
45
46 #elif    defined(TEMPLATE_RESAMPLE_FLT)     \
47       || defined(TEMPLATE_RESAMPLE_FLT_SSE) \
48       || defined(TEMPLATE_RESAMPLE_FLT_AVX)
49
50 #    define FILTER_SHIFT 0
51 #    define DELEM  float
52 #    define FELEM  float
53 #    define FELEM2 float
54 #    define FELEML float
55 #    define OUT(d, v) d = v
56
57 #    if defined(TEMPLATE_RESAMPLE_FLT)
58 #        define RENAME(N) N ## _float
59 #    elif defined(TEMPLATE_RESAMPLE_FLT_SSE)
60 #        define COMMON_CORE COMMON_CORE_FLT_SSE
61 #        define LINEAR_CORE LINEAR_CORE_FLT_SSE
62 #        define RENAME(N) N ## _float_sse
63 #    elif defined(TEMPLATE_RESAMPLE_FLT_AVX)
64 #        define COMMON_CORE COMMON_CORE_FLT_AVX
65 #        define LINEAR_CORE LINEAR_CORE_FLT_AVX
66 #        define RENAME(N) N ## _float_avx
67 #    endif
68
69 #elif defined(TEMPLATE_RESAMPLE_S32)
70 #    define RENAME(N) N ## _int32
71 #    define FILTER_SHIFT 30
72 #    define DELEM  int32_t
73 #    define FELEM  int32_t
74 #    define FELEM2 int64_t
75 #    define FELEML int64_t
76 #    define FELEM_MAX INT32_MAX
77 #    define FELEM_MIN INT32_MIN
78 #    define OUT(d, v) v = (v + (1<<(FILTER_SHIFT-1)))>>FILTER_SHIFT;\
79                       d = (uint64_t)(v + 0x80000000) > 0xFFFFFFFF ? (v>>63) ^ 0x7FFFFFFF : v
80
81 #elif    defined(TEMPLATE_RESAMPLE_S16)      \
82       || defined(TEMPLATE_RESAMPLE_S16_MMX2) \
83       || defined(TEMPLATE_RESAMPLE_S16_SSE2)
84
85 #    define FILTER_SHIFT 15
86 #    define DELEM  int16_t
87 #    define FELEM  int16_t
88 #    define FELEM2 int32_t
89 #    define FELEML int64_t
90 #    define FELEM_MAX INT16_MAX
91 #    define FELEM_MIN INT16_MIN
92 #    define OUT(d, v) v = (v + (1<<(FILTER_SHIFT-1)))>>FILTER_SHIFT;\
93                       d = (unsigned)(v + 32768) > 65535 ? (v>>31) ^ 32767 : v
94
95 #    if defined(TEMPLATE_RESAMPLE_S16)
96 #        define RENAME(N) N ## _int16
97 #    elif defined(TEMPLATE_RESAMPLE_S16_MMX2)
98 #        define COMMON_CORE COMMON_CORE_INT16_MMX2
99 #        define LINEAR_CORE LINEAR_CORE_INT16_MMX2
100 #        define RENAME(N) N ## _int16_mmx2
101 #    elif defined(TEMPLATE_RESAMPLE_S16_SSE2)
102 #        define COMMON_CORE COMMON_CORE_INT16_SSE2
103 #        define LINEAR_CORE LINEAR_CORE_INT16_SSE2
104 #        define RENAME(N) N ## _int16_sse2
105 #    endif
106
107 #endif
108
109 int RENAME(swri_resample)(ResampleContext *c, DELEM *dst, const DELEM *src, int *consumed, int src_size, int dst_size, int update_ctx){
110     int dst_index, i;
111     int index= c->index;
112     int frac= c->frac;
113     int dst_incr_frac= c->dst_incr % c->src_incr;
114     int dst_incr=      c->dst_incr / c->src_incr;
115     int compensation_distance= c->compensation_distance;
116
117     av_assert1(c->filter_shift == FILTER_SHIFT);
118     av_assert1(c->felem_size == sizeof(FELEM));
119
120     if(compensation_distance == 0 && c->filter_length == 1 && c->phase_shift==0){
121         int64_t index2= (1LL<<32)*c->frac/c->src_incr + (1LL<<32)*index;
122         int64_t incr= (1LL<<32) * c->dst_incr / c->src_incr;
123         int new_size = (src_size * (int64_t)c->src_incr - frac + c->dst_incr - 1) / c->dst_incr;
124
125         dst_size= FFMIN(dst_size, new_size);
126
127         for(dst_index=0; dst_index < dst_size; dst_index++){
128             dst[dst_index] = src[index2>>32];
129             index2 += incr;
130         }
131         index += dst_index * dst_incr;
132         index += (frac + dst_index * (int64_t)dst_incr_frac) / c->src_incr;
133         frac   = (frac + dst_index * (int64_t)dst_incr_frac) % c->src_incr;
134         av_assert2(index >= 0);
135         *consumed= index;
136         index = 0;
137     }else if(compensation_distance == 0 && !c->linear && index >= 0){
138         int sample_index = 0;
139         for(dst_index=0; dst_index < dst_size; dst_index++){
140             FELEM *filter;
141             sample_index += index >> c->phase_shift;
142             index &= c->phase_mask;
143             filter= ((FELEM*)c->filter_bank) + c->filter_alloc*index;
144
145             if(sample_index + c->filter_length > src_size){
146                 break;
147             }else{
148 #ifdef COMMON_CORE
149                 COMMON_CORE
150 #else
151                 FELEM2 val=0;
152                 for(i=0; i<c->filter_length; i++){
153                     val += src[sample_index + i] * (FELEM2)filter[i];
154                 }
155                 OUT(dst[dst_index], val);
156 #endif
157             }
158
159             frac += dst_incr_frac;
160             index += dst_incr;
161             if(frac >= c->src_incr){
162                 frac -= c->src_incr;
163                 index++;
164             }
165         }
166         *consumed = sample_index;
167     }else{
168         int sample_index = 0;
169         for(dst_index=0; dst_index < dst_size; dst_index++){
170             FELEM *filter;
171             FELEM2 val=0;
172
173             sample_index += index >> c->phase_shift;
174             index &= c->phase_mask;
175             filter = ((FELEM*)c->filter_bank) + c->filter_alloc*index;
176
177             if(sample_index + c->filter_length > src_size || -sample_index >= src_size){
178                 break;
179             }else if(sample_index < 0){
180                 for(i=0; i<c->filter_length; i++)
181                     val += src[FFABS(sample_index + i)] * (FELEM2)filter[i];
182                 OUT(dst[dst_index], val);
183             }else if(c->linear){
184                 FELEM2 v2=0;
185 #ifdef LINEAR_CORE
186                 LINEAR_CORE
187 #else
188                 for(i=0; i<c->filter_length; i++){
189                     val += src[sample_index + i] * (FELEM2)filter[i];
190                     v2  += src[sample_index + i] * (FELEM2)filter[i + c->filter_alloc];
191                 }
192 #endif
193                 val+=(v2-val)*(FELEML)frac / c->src_incr;
194                 OUT(dst[dst_index], val);
195             }else{
196 #ifdef COMMON_CORE
197                 COMMON_CORE
198 #else
199                 for(i=0; i<c->filter_length; i++){
200                     val += src[sample_index + i] * (FELEM2)filter[i];
201                 }
202                 OUT(dst[dst_index], val);
203 #endif
204             }
205
206             frac += dst_incr_frac;
207             index += dst_incr;
208             if(frac >= c->src_incr){
209                 frac -= c->src_incr;
210                 index++;
211             }
212
213             if(dst_index + 1 == compensation_distance){
214                 compensation_distance= 0;
215                 dst_incr_frac= c->ideal_dst_incr % c->src_incr;
216                 dst_incr=      c->ideal_dst_incr / c->src_incr;
217             }
218         }
219         *consumed= FFMAX(sample_index, 0);
220         index += FFMIN(sample_index, 0) << c->phase_shift;
221
222         if(compensation_distance){
223             compensation_distance -= dst_index;
224             av_assert1(compensation_distance > 0);
225         }
226     }
227
228     if(update_ctx){
229         c->frac= frac;
230         c->index= index;
231         c->dst_incr= dst_incr_frac + c->src_incr*dst_incr;
232         c->compensation_distance= compensation_distance;
233     }
234
235     return dst_index;
236 }
237
238 #undef COMMON_CORE
239 #undef LINEAR_CORE
240 #undef RENAME
241 #undef FILTER_SHIFT
242 #undef DELEM
243 #undef FELEM
244 #undef FELEM2
245 #undef FELEML
246 #undef FELEM_MAX
247 #undef FELEM_MIN
248 #undef OUT