]> git.sesse.net Git - mlt/blob - src/modules/normalize/filter_volume.c
04fb9364ec4bbf0e284d1b7a5ce0a779cfe0ef07
[mlt] / src / modules / normalize / filter_volume.c
1 /*
2  * filter_volume.c -- adjust audio volume
3  * Copyright (C) 2003-2004 Ushodaya Enterprises Limited
4  * Author: Dan Dennedy <dan@dennedy.org>
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License as published by
8  * the Free Software Foundation; either version 2 of the License, or
9  * (at your option) any later version.
10  *
11  * This program is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14  * GNU General Public License for more details.
15  *
16  * You should have received a copy of the GNU General Public License
17  * along with this program; if not, write to the Free Software Foundation,
18  * Inc., 59 Temple Place - Suite 330, Boston, MA 02111-1307, USA.
19  */
20
21 #include "filter_volume.h"
22
23 #include <framework/mlt_frame.h>
24
25 #include <stdio.h>
26 #include <stdlib.h>
27 #include <math.h>
28 #include <ctype.h>
29 #include <string.h>
30
31 #define MAX_CHANNELS 6
32 #define EPSILON 0.00001
33
34 /* The normalise functions come from the normalize utility:
35    Copyright (C) 1999--2002 Chris Vaill */
36
37 #define samp_width 16
38
39 #ifndef ROUND
40 # define ROUND(x) floor((x) + 0.5)
41 #endif
42
43 #define DBFSTOAMP(x) pow(10,(x)/20.0)
44
45 /** Return nonzero if the two strings are equal, ignoring case, up to
46     the first n characters.
47 */
48 int strncaseeq(const char *s1, const char *s2, size_t n)
49 {
50         for ( ; n > 0; n--)
51         {
52                 if (tolower(*s1++) != tolower(*s2++))
53                         return 0;
54         }
55         return 1;
56 }
57
58 /** Limiter function.
59  
60          / tanh((x + lev) / (1-lev)) * (1-lev) - lev        (for x < -lev)
61          |
62     x' = | x                                                (for |x| <= lev)
63          |
64          \ tanh((x - lev) / (1-lev)) * (1-lev) + lev        (for x > lev)
65  
66   With limiter level = 0, this is equivalent to a tanh() function;
67   with limiter level = 1, this is equivalent to clipping.
68 */
69 static inline double limiter( double x, double lmtr_lvl )
70 {
71         double xp = x;
72
73         if (x < -lmtr_lvl)
74                 xp = tanh((x + lmtr_lvl) / (1-lmtr_lvl)) * (1-lmtr_lvl) - lmtr_lvl;
75         else if (x > lmtr_lvl)
76                 xp = tanh((x - lmtr_lvl) / (1-lmtr_lvl)) * (1-lmtr_lvl) + lmtr_lvl;
77
78 //      if ( x != xp )
79 //              fprintf( stderr, "filter_volume: sample %f limited %f\n", x, xp );
80
81         return xp;
82 }
83
84
85 /** Takes a full smoothing window, and returns the value of the center
86     element, smoothed.
87
88     Currently, just does a mean filter, but we could do a median or
89     gaussian filter here instead.
90 */
91 static inline double get_smoothed_data( double *buf, int count )
92 {
93         int i, j;
94         double smoothed = 0;
95
96         for ( i = 0, j = 0; i < count; i++ )
97         {
98                 if ( buf[ i ] != -1.0 )
99                 {
100                         smoothed += buf[ i ];
101                         j++;
102                 }
103         }
104         smoothed /= j;
105 //      fprintf( stderr, "smoothed over %d values, result %f\n", j, smoothed );
106
107         return smoothed;
108 }
109
110 /** Get the max power level (using RMS) and peak level of the audio segment.
111  */
112 double signal_max_power( int16_t *buffer, int channels, int samples, int16_t *peak )
113 {
114         // Determine numeric limits
115         int bytes_per_samp = (samp_width - 1) / 8 + 1;
116         int16_t max = (1 << (bytes_per_samp * 8 - 1)) - 1;
117         int16_t min = -max - 1;
118         
119         double *sums = (double *) calloc( channels, sizeof(double) );
120         int c, i;
121         int16_t sample;
122         double pow, maxpow = 0;
123
124         /* initialize peaks to effectively -inf and +inf */
125         int16_t max_sample = min;
126         int16_t min_sample = max;
127   
128         for ( i = 0; i < samples; i++ )
129         {
130                 for ( c = 0; c < channels; c++ )
131                 {
132                         sample = *buffer++;
133                         sums[ c ] += (double) sample * (double) sample;
134                         
135                         /* track peak */
136                         if ( sample > max_sample )
137                                 max_sample = sample;
138                         else if ( sample < min_sample )
139                                 min_sample = sample;
140                 }
141         }
142         for ( c = 0; c < channels; c++ )
143         {
144                 pow = sums[ c ] / (double) samples;
145                 if ( pow > maxpow )
146                         maxpow = pow;
147         }
148                         
149         free( sums );
150         
151         /* scale the pow value to be in the range 0.0 -- 1.0 */
152         maxpow /= ( (double) min * (double) min);
153
154         if ( -min_sample > max_sample )
155                 *peak = min_sample / (double) min;
156         else
157                 *peak = max_sample / (double) max;
158
159         return sqrt( maxpow );
160 }
161
162 /* ------ End normalize functions --------------------------------------- */
163
164 /** Get the audio.
165 */
166
167 static int filter_get_audio( mlt_frame frame, int16_t **buffer, mlt_audio_format *format, int *frequency, int *channels, int *samples )
168 {
169         // Get the properties of the a frame
170         mlt_properties properties = mlt_frame_properties( frame );
171         double gain = mlt_properties_get_double( properties, "volume.gain" );
172         double max_gain = mlt_properties_get_double( properties, "volume.max_gain" );
173         double limiter_level = 0.5; /* -6 dBFS */
174         int normalise =  mlt_properties_get_int( properties, "volume.normalise" );
175         double amplitude =  mlt_properties_get_double( properties, "volume.amplitude" );
176         int i, j;
177         double sample;
178         int16_t peak;
179
180         // Get the filter from the frame
181         mlt_filter this = mlt_properties_get_data( properties, "filter_volume", NULL );
182
183         // Get the properties from the filter
184         mlt_properties filter_props = mlt_filter_properties( this );
185
186         if ( mlt_properties_get( properties, "volume.limiter" ) != NULL )
187                 limiter_level = mlt_properties_get_double( properties, "volume.limiter" );
188         
189         // Restore the original get_audio
190         frame->get_audio = mlt_properties_get_data( properties, "volume.get_audio", NULL );
191
192         // Get the producer's audio
193         mlt_frame_get_audio( frame, buffer, format, frequency, channels, samples );
194 //      fprintf( stderr, "filter_volume: frequency %d\n", *frequency );
195
196         // Determine numeric limits
197         int bytes_per_samp = (samp_width - 1) / 8 + 1;
198         int samplemax = (1 << (bytes_per_samp * 8 - 1)) - 1;
199         int samplemin = -samplemax - 1;
200
201         if ( normalise )
202         {
203                 int window = mlt_properties_get_int( filter_props, "window" );
204                 double *smooth_buffer = mlt_properties_get_data( filter_props, "smooth_buffer", NULL );
205
206                 if ( window > 0 && smooth_buffer != NULL )
207                 {
208                         int smooth_index = mlt_properties_get_int( filter_props, "_smooth_index" );
209                         
210                         // Compute the signal power and put into smoothing buffer
211                         smooth_buffer[ smooth_index ] = signal_max_power( *buffer, *channels, *samples, &peak );
212 //                      fprintf( stderr, "filter_volume: raw power %f ", smooth_buffer[ smooth_index ] );
213                         if ( smooth_buffer[ smooth_index ] > EPSILON )
214                         {
215                                 mlt_properties_set_int( filter_props, "_smooth_index", ( smooth_index + 1 ) % window );
216
217                                 // Smooth the data and compute the gain
218 //                              fprintf( stderr, "smoothed %f over %d frames\n", get_smoothed_data( smooth_buffer, window ), window );
219                                 gain *= amplitude / get_smoothed_data( smooth_buffer, window );
220                         }
221                 }
222                 else
223                 {
224                         gain *= amplitude / signal_max_power( *buffer, *channels, *samples, &peak );
225                 }
226         }
227         
228 //      if ( gain > 1.0 && normalise )
229 //              fprintf(stderr, "filter_volume: limiter level %f gain %f\n", limiter_level, gain );
230
231         if ( max_gain > 0 && gain > max_gain )
232                 gain = max_gain;
233
234         // Initialise filter's previous gain value to prevent an inadvertant jump from 0
235         if ( mlt_properties_get( filter_props, "previous_gain" ) == NULL )
236                 mlt_properties_set_double( filter_props, "previous_gain", gain );
237
238         // Start the gain out at the previous
239         double previous_gain = mlt_properties_get_double( filter_props, "previous_gain" );
240
241         // Determine ramp increment
242         double gain_step = ( gain - previous_gain ) / *samples;
243 //      fprintf( stderr, "filter_volume: previous gain %f current gain %f step %f\n", previous_gain, gain, gain_step );
244
245         // Save the current gain for the next iteration
246         mlt_properties_set_double( filter_props, "previous_gain", gain );
247
248         // Ramp from the previous gain to the current
249         gain = previous_gain;
250
251         int16_t *p = *buffer;
252
253         // Apply the gain
254         for ( i = 0; i < *samples; i++ )
255         {
256                 for ( j = 0; j < *channels; j++ )
257                 {
258                         sample = *p * gain;
259                         *p = ROUND( sample );
260                 
261                         if ( gain > 1.0 )
262                         {
263                                 /* use limiter function instead of clipping */
264                                 if ( normalise )
265                                         *p = ROUND( samplemax * limiter( sample / (double) samplemax, limiter_level ) );
266                                 
267                                 /* perform clipping */
268                                 else if ( sample > samplemax )
269                                         *p = samplemax;
270                                 else if ( sample < samplemin )
271                                         *p = samplemin;
272                         }
273                         p++;
274                 }
275                 gain += gain_step;
276         }
277         
278         return 0;
279 }
280
281 /** Filter processing.
282 */
283
284 static mlt_frame filter_process( mlt_filter this, mlt_frame frame )
285 {
286         mlt_properties properties = mlt_frame_properties( frame );
287         mlt_properties filter_props = mlt_filter_properties( this );
288
289         // Parse the gain property
290         if ( mlt_properties_get( properties, "gain" ) == NULL )
291         {
292                 double gain = 1.0; // no adjustment
293                 
294                 if ( mlt_properties_get( filter_props, "gain" ) != NULL )
295                 {
296                         char *p = mlt_properties_get( filter_props, "gain" );
297                         
298                         if ( strncaseeq( p, "normalise", 9 ) )
299                                 mlt_properties_set( filter_props, "normalise", "" );
300                         else
301                         {
302                                 if ( strcmp( p, "" ) != 0 )
303                                         gain = fabs( strtod( p, &p) );
304
305                                 while ( isspace( *p ) )
306                                         p++;
307
308                                 /* check if "dB" is given after number */
309                                 if ( strncaseeq( p, "db", 2 ) )
310                                         gain = DBFSTOAMP( gain );
311                                         
312                                 // If there is an end adjust gain to the range
313                                 if ( mlt_properties_get( filter_props, "end" ) != NULL )
314                                 {       
315                                         // Determine the time position of this frame in the transition duration
316                                         mlt_position in = mlt_filter_get_in( this );
317                                         mlt_position out = mlt_filter_get_out( this );
318                                         mlt_position time = mlt_frame_get_position( frame );
319                                         double position = ( double )( time - in ) / ( double )( out - in + 1 );
320
321                                         double end = -1;
322                                         char *p = mlt_properties_get( filter_props, "end" );
323                                         if ( strcmp( p, "" ) != 0 )
324                                                 end = fabs( strtod( p, &p) );
325
326                                         while ( isspace( *p ) )
327                                                 p++;
328
329                                         /* check if "dB" is given after number */
330                                         if ( strncaseeq( p, "db", 2 ) )
331                                                 end = DBFSTOAMP( gain );
332
333                                         if ( end != -1 )
334                                                 gain += ( end - gain ) * position;
335                                 }
336                         }
337                 }
338                 mlt_properties_set_double( properties, "volume.gain", gain );
339         }
340         
341         // Parse the maximum gain property
342         if ( mlt_properties_get( filter_props, "max_gain" ) != NULL )
343         {
344                 char *p = mlt_properties_get( filter_props, "max_gain" );
345                 double gain = fabs( strtod( p, &p) ); // 0 = no max
346                         
347                 while ( isspace( *p ) )
348                         p++;
349
350                 /* check if "dB" is given after number */
351                 if ( strncaseeq( p, "db", 2 ) )
352                         gain = DBFSTOAMP( gain );
353                         
354                 mlt_properties_set_double( properties, "volume.max_gain", gain );
355         }
356
357         // Parse the limiter property
358         if ( mlt_properties_get( filter_props, "limiter" ) != NULL )
359         {
360                 char *p = mlt_properties_get( filter_props, "limiter" );
361                 double level = 0.5; /* -6dBFS */ 
362                 if ( strcmp( p, "" ) != 0 )
363                         level = strtod( p, &p);
364                 
365                 while ( isspace( *p ) )
366                         p++;
367                 
368                 /* check if "dB" is given after number */
369                 if ( strncaseeq( p, "db", 2 ) )
370                 {
371                         if ( level > 0 )
372                                 level = -level;
373                         level = DBFSTOAMP( level );
374                 }
375                 else
376                 {
377                         if ( level < 0 )
378                                 level = -level;
379                 }
380                 mlt_properties_set_double( properties, "volume.limiter", level );
381         }
382
383         // Parse the normalise property
384         if ( mlt_properties_get( filter_props, "normalise" ) != NULL )
385         {
386                 char *p = mlt_properties_get( filter_props, "normalise" );
387                 double amplitude = 0.2511886431509580; /* -12dBFS */
388                 if ( strcmp( p, "" ) != 0 )
389                         amplitude = strtod( p, &p);
390
391                 while ( isspace( *p ) )
392                         p++;
393
394                 /* check if "dB" is given after number */
395                 if ( strncaseeq( p, "db", 2 ) )
396                 {
397                         if ( amplitude > 0 )
398                                 amplitude = -amplitude;
399                         amplitude = DBFSTOAMP( amplitude );
400                 }
401                 else
402                 {
403                         if ( amplitude < 0 )
404                                 amplitude = -amplitude;
405                         if ( amplitude > 1.0 )
406                                 amplitude = 1.0;
407                 }
408                 
409                 // If there is an end adjust gain to the range
410                 if ( mlt_properties_get( filter_props, "end" ) != NULL )
411                 {
412                         // Determine the time position of this frame in the transition duration
413                         mlt_position in = mlt_filter_get_in( this );
414                         mlt_position out = mlt_filter_get_out( this );
415                         mlt_position time = mlt_frame_get_position( frame );
416                         double position = ( double )( time - in ) / ( double )( out - in + 1 );
417                         amplitude *= position;
418                 }
419                 mlt_properties_set_int( properties, "volume.normalise", 1 );
420                 mlt_properties_set_double( properties, "volume.amplitude", amplitude );
421         }
422
423         // Parse the window property and allocate smoothing buffer if needed
424         int window = mlt_properties_get_int( filter_props, "window" );
425         if ( mlt_properties_get( filter_props, "smooth_buffer" ) == NULL && window > 1 )
426         {
427                 // Create a smoothing buffer for the calculated "max power" of frame of audio used in normalisation
428                 double *smooth_buffer = (double*) calloc( window, sizeof( double ) );
429                 int i;
430                 for ( i = 0; i < window; i++ )
431                         smooth_buffer[ i ] = -1.0;
432                 mlt_properties_set_data( filter_props, "smooth_buffer", smooth_buffer, 0, free, NULL );
433         }
434         
435         // Put a filter reference onto the frame
436         mlt_properties_set_data( properties, "filter_volume", this, 0, NULL, NULL );
437
438         // Backup the original get_audio (it's still needed)
439         mlt_properties_set_data( properties, "volume.get_audio", frame->get_audio, 0, NULL, NULL );
440
441         // Override the get_audio method
442         frame->get_audio = filter_get_audio;
443
444         return frame;
445 }
446
447 /** Constructor for the filter.
448 */
449
450 mlt_filter filter_volume_init( char *arg )
451 {
452         mlt_filter this = calloc( sizeof( struct mlt_filter_s ), 1 );
453         if ( this != NULL && mlt_filter_init( this, NULL ) == 0 )
454         {
455                 mlt_properties properties = mlt_filter_properties( this );
456                 this->process = filter_process;
457                 if ( arg != NULL )
458                         mlt_properties_set( properties, "gain", arg );
459
460                 mlt_properties_set_int( properties, "window", 75 );
461                 mlt_properties_set( properties, "max_gain", "20dB" );
462         }
463         return this;
464 }