]> git.sesse.net Git - ffmpeg/blob - libswresample/rematrix.c
swr: skip memset(0) in rematrix when the array is known to be already 0
[ffmpeg] / libswresample / rematrix.c
1 /*
2  * Copyright (C) 2011-2012 Michael Niedermayer (michaelni@gmx.at)
3  *
4  * This file is part of libswresample
5  *
6  * libswresample is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU Lesser General Public
8  * License as published by the Free Software Foundation; either
9  * version 2.1 of the License, or (at your option) any later version.
10  *
11  * libswresample is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14  * Lesser General Public License for more details.
15  *
16  * You should have received a copy of the GNU Lesser General Public
17  * License along with libswresample; if not, write to the Free Software
18  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
19  */
20
21 #include "swresample_internal.h"
22 #include "libavutil/audioconvert.h"
23 #include "libavutil/avassert.h"
24
25 #define ONE (1.0)
26 #define R(x) x
27 #define SAMPLE float
28 #define COEFF float
29 #define INTER float
30 #define RENAME(x) x ## _float
31 #include "rematrix_template.c"
32 #undef SAMPLE
33 #undef RENAME
34 #undef R
35 #undef ONE
36 #undef COEFF
37 #undef INTER
38
39 #define ONE (1.0)
40 #define R(x) x
41 #define SAMPLE double
42 #define COEFF double
43 #define INTER double
44 #define RENAME(x) x ## _double
45 #include "rematrix_template.c"
46 #undef SAMPLE
47 #undef RENAME
48 #undef R
49 #undef ONE
50 #undef COEFF
51 #undef INTER
52
53 #define ONE (-32768)
54 #define R(x) (((x) + 16384)>>15)
55 #define SAMPLE int16_t
56 #define COEFF int
57 #define INTER int
58 #define RENAME(x) x ## _s16
59 #include "rematrix_template.c"
60
61
62 #define FRONT_LEFT             0
63 #define FRONT_RIGHT            1
64 #define FRONT_CENTER           2
65 #define LOW_FREQUENCY          3
66 #define BACK_LEFT              4
67 #define BACK_RIGHT             5
68 #define FRONT_LEFT_OF_CENTER   6
69 #define FRONT_RIGHT_OF_CENTER  7
70 #define BACK_CENTER            8
71 #define SIDE_LEFT              9
72 #define SIDE_RIGHT             10
73 #define TOP_CENTER             11
74 #define TOP_FRONT_LEFT         12
75 #define TOP_FRONT_CENTER       13
76 #define TOP_FRONT_RIGHT        14
77 #define TOP_BACK_LEFT          15
78 #define TOP_BACK_CENTER        16
79 #define TOP_BACK_RIGHT         17
80
81 int swr_set_matrix(struct SwrContext *s, const double *matrix, int stride)
82 {
83     int nb_in, nb_out, in, out;
84
85     if (!s || s->in_convert) // s needs to be allocated but not initialized
86         return AVERROR(EINVAL);
87     memset(s->matrix, 0, sizeof(s->matrix));
88     nb_in  = av_get_channel_layout_nb_channels(s->in_ch_layout);
89     nb_out = av_get_channel_layout_nb_channels(s->out_ch_layout);
90     for (out = 0; out < nb_out; out++) {
91         for (in = 0; in < nb_in; in++)
92             s->matrix[out][in] = matrix[in];
93         matrix += stride;
94     }
95     s->rematrix_custom = 1;
96     return 0;
97 }
98
99 static int even(int64_t layout){
100     if(!layout) return 1;
101     if(layout&(layout-1)) return 1;
102     return 0;
103 }
104
105 static int sane_layout(int64_t layout){
106     if(!(layout & AV_CH_LAYOUT_SURROUND)) // at least 1 front speaker
107         return 0;
108     if(!even(layout & (AV_CH_FRONT_LEFT | AV_CH_FRONT_RIGHT))) // no asymetric front
109         return 0;
110     if(!even(layout & (AV_CH_SIDE_LEFT | AV_CH_SIDE_RIGHT)))   // no asymetric side
111         return 0;
112     if(!even(layout & (AV_CH_BACK_LEFT | AV_CH_BACK_RIGHT)))
113         return 0;
114     if(!even(layout & (AV_CH_FRONT_LEFT_OF_CENTER | AV_CH_FRONT_RIGHT_OF_CENTER)))
115         return 0;
116     if(av_get_channel_layout_nb_channels(layout) >= SWR_CH_MAX)
117         return 0;
118
119     return 1;
120 }
121
122 static int auto_matrix(SwrContext *s)
123 {
124     int i, j, out_i;
125     double matrix[64][64]={{0}};
126     int64_t unaccounted= s->in_ch_layout & ~s->out_ch_layout;
127     double maxcoef=0;
128
129     memset(s->matrix, 0, sizeof(s->matrix));
130     for(i=0; i<64; i++){
131         if(s->in_ch_layout & s->out_ch_layout & (1LL<<i))
132             matrix[i][i]= 1.0;
133     }
134
135     if(!sane_layout(s->in_ch_layout)){
136         av_log(s, AV_LOG_ERROR, "Input channel layout isnt supported\n");
137         return AVERROR(EINVAL);
138     }
139     if(!sane_layout(s->out_ch_layout)){
140         av_log(s, AV_LOG_ERROR, "Output channel layout isnt supported\n");
141         return AVERROR(EINVAL);
142     }
143
144 //FIXME implement dolby surround
145 //FIXME implement full ac3
146
147
148     if(unaccounted & AV_CH_FRONT_CENTER){
149         if((s->out_ch_layout & AV_CH_LAYOUT_STEREO) == AV_CH_LAYOUT_STEREO){
150             matrix[ FRONT_LEFT][FRONT_CENTER]+= M_SQRT1_2;
151             matrix[FRONT_RIGHT][FRONT_CENTER]+= M_SQRT1_2;
152         }else
153             av_assert0(0);
154     }
155     if(unaccounted & AV_CH_LAYOUT_STEREO){
156         if(s->out_ch_layout & AV_CH_FRONT_CENTER){
157             matrix[FRONT_CENTER][ FRONT_LEFT]+= M_SQRT1_2;
158             matrix[FRONT_CENTER][FRONT_RIGHT]+= M_SQRT1_2;
159             if(s->in_ch_layout & AV_CH_FRONT_CENTER)
160                 matrix[FRONT_CENTER][ FRONT_CENTER] = s->clev*sqrt(2);
161         }else
162             av_assert0(0);
163     }
164
165     if(unaccounted & AV_CH_BACK_CENTER){
166         if(s->out_ch_layout & AV_CH_BACK_LEFT){
167             matrix[ BACK_LEFT][BACK_CENTER]+= M_SQRT1_2;
168             matrix[BACK_RIGHT][BACK_CENTER]+= M_SQRT1_2;
169         }else if(s->out_ch_layout & AV_CH_SIDE_LEFT){
170             matrix[ SIDE_LEFT][BACK_CENTER]+= M_SQRT1_2;
171             matrix[SIDE_RIGHT][BACK_CENTER]+= M_SQRT1_2;
172         }else if(s->out_ch_layout & AV_CH_FRONT_LEFT){
173             matrix[ FRONT_LEFT][BACK_CENTER]+= s->slev*M_SQRT1_2;
174             matrix[FRONT_RIGHT][BACK_CENTER]+= s->slev*M_SQRT1_2;
175         }else if(s->out_ch_layout & AV_CH_FRONT_CENTER){
176             matrix[ FRONT_CENTER][BACK_CENTER]+= s->slev*M_SQRT1_2;
177         }else
178             av_assert0(0);
179     }
180     if(unaccounted & AV_CH_BACK_LEFT){
181         if(s->out_ch_layout & AV_CH_BACK_CENTER){
182             matrix[BACK_CENTER][ BACK_LEFT]+= M_SQRT1_2;
183             matrix[BACK_CENTER][BACK_RIGHT]+= M_SQRT1_2;
184         }else if(s->out_ch_layout & AV_CH_SIDE_LEFT){
185             if(s->in_ch_layout & AV_CH_SIDE_LEFT){
186                 matrix[ SIDE_LEFT][ BACK_LEFT]+= M_SQRT1_2;
187                 matrix[SIDE_RIGHT][BACK_RIGHT]+= M_SQRT1_2;
188             }else{
189             matrix[ SIDE_LEFT][ BACK_LEFT]+= 1.0;
190             matrix[SIDE_RIGHT][BACK_RIGHT]+= 1.0;
191             }
192         }else if(s->out_ch_layout & AV_CH_FRONT_LEFT){
193             matrix[ FRONT_LEFT][ BACK_LEFT]+= s->slev;
194             matrix[FRONT_RIGHT][BACK_RIGHT]+= s->slev;
195         }else if(s->out_ch_layout & AV_CH_FRONT_CENTER){
196             matrix[ FRONT_CENTER][BACK_LEFT ]+= s->slev*M_SQRT1_2;
197             matrix[ FRONT_CENTER][BACK_RIGHT]+= s->slev*M_SQRT1_2;
198         }else
199             av_assert0(0);
200     }
201
202     if(unaccounted & AV_CH_SIDE_LEFT){
203         if(s->out_ch_layout & AV_CH_BACK_LEFT){
204             /* if back channels do not exist in the input, just copy side
205                channels to back channels, otherwise mix side into back */
206             if (s->in_ch_layout & AV_CH_BACK_LEFT) {
207                 matrix[BACK_LEFT ][SIDE_LEFT ] += M_SQRT1_2;
208                 matrix[BACK_RIGHT][SIDE_RIGHT] += M_SQRT1_2;
209             } else {
210                 matrix[BACK_LEFT ][SIDE_LEFT ] += 1.0;
211                 matrix[BACK_RIGHT][SIDE_RIGHT] += 1.0;
212             }
213         }else if(s->out_ch_layout & AV_CH_BACK_CENTER){
214             matrix[BACK_CENTER][ SIDE_LEFT]+= M_SQRT1_2;
215             matrix[BACK_CENTER][SIDE_RIGHT]+= M_SQRT1_2;
216         }else if(s->out_ch_layout & AV_CH_FRONT_LEFT){
217             matrix[ FRONT_LEFT][ SIDE_LEFT]+= s->slev;
218             matrix[FRONT_RIGHT][SIDE_RIGHT]+= s->slev;
219         }else if(s->out_ch_layout & AV_CH_FRONT_CENTER){
220             matrix[ FRONT_CENTER][SIDE_LEFT ]+= s->slev*M_SQRT1_2;
221             matrix[ FRONT_CENTER][SIDE_RIGHT]+= s->slev*M_SQRT1_2;
222         }else
223             av_assert0(0);
224     }
225
226     if(unaccounted & AV_CH_FRONT_LEFT_OF_CENTER){
227         if(s->out_ch_layout & AV_CH_FRONT_LEFT){
228             matrix[ FRONT_LEFT][ FRONT_LEFT_OF_CENTER]+= 1.0;
229             matrix[FRONT_RIGHT][FRONT_RIGHT_OF_CENTER]+= 1.0;
230         }else if(s->out_ch_layout & AV_CH_FRONT_CENTER){
231             matrix[ FRONT_CENTER][ FRONT_LEFT_OF_CENTER]+= M_SQRT1_2;
232             matrix[ FRONT_CENTER][FRONT_RIGHT_OF_CENTER]+= M_SQRT1_2;
233         }else
234             av_assert0(0);
235     }
236     /* mix LFE into front left/right or center */
237     if (unaccounted & AV_CH_LOW_FREQUENCY) {
238         if (s->out_ch_layout & AV_CH_FRONT_CENTER) {
239             matrix[FRONT_CENTER][LOW_FREQUENCY] += s->lfe_mix_level;
240         } else if (s->out_ch_layout & AV_CH_FRONT_LEFT) {
241             matrix[FRONT_LEFT ][LOW_FREQUENCY] += s->lfe_mix_level * M_SQRT1_2;
242             matrix[FRONT_RIGHT][LOW_FREQUENCY] += s->lfe_mix_level * M_SQRT1_2;
243         } else
244             av_assert0(0);
245     }
246
247     for(out_i=i=0; i<64; i++){
248         double sum=0;
249         int in_i=0;
250         for(j=0; j<64; j++){
251             s->matrix[out_i][in_i]= matrix[i][j];
252             if(matrix[i][j]){
253                 sum += fabs(matrix[i][j]);
254             }
255             if(s->in_ch_layout & (1ULL<<j))
256                 in_i++;
257         }
258         maxcoef= FFMAX(maxcoef, sum);
259         if(s->out_ch_layout & (1ULL<<i))
260             out_i++;
261     }
262     if(s->rematrix_volume  < 0)
263         maxcoef = -s->rematrix_volume;
264
265     if((   av_get_packed_sample_fmt(s->out_sample_fmt) < AV_SAMPLE_FMT_FLT
266         || av_get_packed_sample_fmt(s->int_sample_fmt) < AV_SAMPLE_FMT_FLT) && maxcoef > 1.0){
267         for(i=0; i<SWR_CH_MAX; i++)
268             for(j=0; j<SWR_CH_MAX; j++){
269                 s->matrix[i][j] /= maxcoef;
270             }
271     }
272
273     if(s->rematrix_volume > 0){
274         for(i=0; i<SWR_CH_MAX; i++)
275             for(j=0; j<SWR_CH_MAX; j++){
276                 s->matrix[i][j] *= s->rematrix_volume;
277             }
278     }
279
280     for(i=0; i<av_get_channel_layout_nb_channels(s->out_ch_layout); i++){
281         for(j=0; j<av_get_channel_layout_nb_channels(s->in_ch_layout); j++){
282             av_log(NULL, AV_LOG_DEBUG, "%f ", s->matrix[i][j]);
283         }
284         av_log(NULL, AV_LOG_DEBUG, "\n");
285     }
286     return 0;
287 }
288
289 int swri_rematrix_init(SwrContext *s){
290     int i, j;
291     int nb_in  = av_get_channel_layout_nb_channels(s->in_ch_layout);
292     int nb_out = av_get_channel_layout_nb_channels(s->out_ch_layout);
293
294     s->mix_any_f = NULL;
295
296     if (!s->rematrix_custom) {
297         int r = auto_matrix(s);
298         if (r)
299             return r;
300     }
301     if (s->midbuf.fmt == AV_SAMPLE_FMT_S16P){
302         s->native_matrix = av_mallocz(nb_in * nb_out * sizeof(int));
303         s->native_one    = av_mallocz(sizeof(int));
304         for (i = 0; i < nb_out; i++)
305             for (j = 0; j < nb_in; j++)
306                 ((int*)s->native_matrix)[i * nb_in + j] = lrintf(s->matrix[i][j] * 32768);
307         *((int*)s->native_one) = 32768;
308         s->mix_1_1_f = copy_s16;
309         s->mix_2_1_f = sum2_s16;
310         s->mix_any_f = get_mix_any_func_s16(s);
311     }else if(s->midbuf.fmt == AV_SAMPLE_FMT_FLTP){
312         s->native_matrix = av_mallocz(nb_in * nb_out * sizeof(float));
313         s->native_one    = av_mallocz(sizeof(float));
314         for (i = 0; i < nb_out; i++)
315             for (j = 0; j < nb_in; j++)
316                 ((float*)s->native_matrix)[i * nb_in + j] = s->matrix[i][j];
317         *((float*)s->native_one) = 1.0;
318         s->mix_1_1_f = copy_float;
319         s->mix_2_1_f = sum2_float;
320         s->mix_any_f = get_mix_any_func_float(s);
321     }else if(s->midbuf.fmt == AV_SAMPLE_FMT_DBLP){
322         s->native_matrix = av_mallocz(nb_in * nb_out * sizeof(double));
323         s->native_one    = av_mallocz(sizeof(double));
324         for (i = 0; i < nb_out; i++)
325             for (j = 0; j < nb_in; j++)
326                 ((double*)s->native_matrix)[i * nb_in + j] = s->matrix[i][j];
327         *((double*)s->native_one) = 1.0;
328         s->mix_1_1_f = copy_double;
329         s->mix_2_1_f = sum2_double;
330         s->mix_any_f = get_mix_any_func_double(s);
331     }else
332         av_assert0(0);
333     //FIXME quantize for integeres
334     for (i = 0; i < SWR_CH_MAX; i++) {
335         int ch_in=0;
336         for (j = 0; j < SWR_CH_MAX; j++) {
337             s->matrix32[i][j]= lrintf(s->matrix[i][j] * 32768);
338             if(s->matrix[i][j])
339                 s->matrix_ch[i][++ch_in]= j;
340         }
341         s->matrix_ch[i][0]= ch_in;
342     }
343     return 0;
344 }
345
346 void swri_rematrix_free(SwrContext *s){
347     av_freep(&s->native_matrix);
348     av_freep(&s->native_one);
349 }
350
351 int swri_rematrix(SwrContext *s, AudioData *out, AudioData *in, int len, int mustcopy){
352     int out_i, in_i, i, j;
353
354     if(s->mix_any_f) {
355         s->mix_any_f(out->ch, in->ch, s->native_matrix, len);
356         return 0;
357     }
358
359     av_assert0(out->ch_count == av_get_channel_layout_nb_channels(s->out_ch_layout));
360     av_assert0(in ->ch_count == av_get_channel_layout_nb_channels(s-> in_ch_layout));
361
362     for(out_i=0; out_i<out->ch_count; out_i++){
363         switch(s->matrix_ch[out_i][0]){
364         case 0:
365             if(mustcopy)
366                 memset(out->ch[out_i], 0, len * av_get_bytes_per_sample(s->int_sample_fmt));
367             break;
368         case 1:
369             in_i= s->matrix_ch[out_i][1];
370             if(s->matrix[out_i][in_i]!=1.0){
371                 s->mix_1_1_f(out->ch[out_i], in->ch[in_i], s->native_matrix, in->ch_count*out_i + in_i, len);
372             }else if(mustcopy){
373                 memcpy(out->ch[out_i], in->ch[in_i], len*out->bps);
374             }else{
375                 out->ch[out_i]= in->ch[in_i];
376             }
377             break;
378         case 2: {
379             int in_i1 = s->matrix_ch[out_i][1];
380             int in_i2 = s->matrix_ch[out_i][2];
381             s->mix_2_1_f(out->ch[out_i], in->ch[in_i1], in->ch[in_i2], s->native_matrix, in->ch_count*out_i + in_i1, in->ch_count*out_i + in_i2, len);
382             break;}
383         default:
384             if(s->int_sample_fmt == AV_SAMPLE_FMT_FLTP){
385                 for(i=0; i<len; i++){
386                     float v=0;
387                     for(j=0; j<s->matrix_ch[out_i][0]; j++){
388                         in_i= s->matrix_ch[out_i][1+j];
389                         v+= ((float*)in->ch[in_i])[i] * s->matrix[out_i][in_i];
390                     }
391                     ((float*)out->ch[out_i])[i]= v;
392                 }
393             }else if(s->int_sample_fmt == AV_SAMPLE_FMT_DBLP){
394                 for(i=0; i<len; i++){
395                     double v=0;
396                     for(j=0; j<s->matrix_ch[out_i][0]; j++){
397                         in_i= s->matrix_ch[out_i][1+j];
398                         v+= ((double*)in->ch[in_i])[i] * s->matrix[out_i][in_i];
399                     }
400                     ((double*)out->ch[out_i])[i]= v;
401                 }
402             }else{
403                 for(i=0; i<len; i++){
404                     int v=0;
405                     for(j=0; j<s->matrix_ch[out_i][0]; j++){
406                         in_i= s->matrix_ch[out_i][1+j];
407                         v+= ((int16_t*)in->ch[in_i])[i] * s->matrix32[out_i][in_i];
408                     }
409                     ((int16_t*)out->ch[out_i])[i]= (v + 16384)>>15;
410                 }
411             }
412         }
413     }
414     return 0;
415 }