]> git.sesse.net Git - vlc/blob - modules/codec/avcodec/audio.c
aout_buffer_t.start_data -> aout_buffer_t.i_pts
[vlc] / modules / codec / avcodec / audio.c
1 /*****************************************************************************
2  * audio.c: audio decoder using ffmpeg library
3  *****************************************************************************
4  * Copyright (C) 1999-2003 the VideoLAN team
5  * $Id$
6  *
7  * Authors: Laurent Aimar <fenrir@via.ecp.fr>
8  *          Gildas Bazin <gbazin@videolan.org>
9  *
10  * This program is free software; you can redistribute it and/or modify
11  * it under the terms of the GNU General Public License as published by
12  * the Free Software Foundation; either version 2 of the License, or
13  * (at your option) any later version.
14  *
15  * This program is distributed in the hope that it will be useful,
16  * but WITHOUT ANY WARRANTY; without even the implied warranty of
17  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
18  * GNU General Public License for more details.
19  *
20  * You should have received a copy of the GNU General Public License
21  * along with this program; if not, write to the Free Software
22  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston MA 02110-1301, USA.
23  *****************************************************************************/
24
25 /*****************************************************************************
26  * Preamble
27  *****************************************************************************/
28 #ifdef HAVE_CONFIG_H
29 # include "config.h"
30 #endif
31
32 #include <vlc_common.h>
33 #include <vlc_aout.h>
34 #include <vlc_codec.h>
35 #include <vlc_avcodec.h>
36
37 /* ffmpeg header */
38 #ifdef HAVE_LIBAVCODEC_AVCODEC_H
39 #   include <libavcodec/avcodec.h>
40 #elif defined(HAVE_FFMPEG_AVCODEC_H)
41 #   include <ffmpeg/avcodec.h>
42 #else
43 #   include <avcodec.h>
44 #endif
45
46 #include "avcodec.h"
47
48 /*****************************************************************************
49  * decoder_sys_t : decoder descriptor
50  *****************************************************************************/
51 struct decoder_sys_t
52 {
53     FFMPEG_COMMON_MEMBERS
54
55     /* Temporary buffer for libavcodec */
56     int     i_output_max;
57     uint8_t *p_output;
58
59     /*
60      * Output properties
61      */
62     audio_sample_format_t aout_format;
63     date_t                end_date;
64
65     /*
66      *
67      */
68     uint8_t *p_samples;
69     int     i_samples;
70
71     /* */
72     int     i_reject_count;
73
74     /* */
75     bool    b_extract;
76     int     pi_extraction[AOUT_CHAN_MAX];
77     int     i_previous_channels;
78     int64_t i_previous_layout;
79 };
80
81 static void SetupOutputFormat( decoder_t *p_dec, bool b_trust );
82
83 /*****************************************************************************
84  * InitAudioDec: initialize audio decoder
85  *****************************************************************************
86  * The ffmpeg codec will be opened, some memory allocated.
87  *****************************************************************************/
88 int InitAudioDec( decoder_t *p_dec, AVCodecContext *p_context,
89                       AVCodec *p_codec, int i_codec_id, const char *psz_namecodec )
90 {
91     decoder_sys_t *p_sys;
92
93     /* Allocate the memory needed to store the decoder's structure */
94     if( ( p_dec->p_sys = p_sys = malloc(sizeof(*p_sys)) ) == NULL )
95     {
96         return VLC_ENOMEM;
97     }
98
99     p_sys->p_context = p_context;
100     p_sys->p_codec = p_codec;
101     p_sys->i_codec_id = i_codec_id;
102     p_sys->psz_namecodec = psz_namecodec;
103     p_sys->b_delayed_open = false;
104
105     /* ***** Fill p_context with init values ***** */
106     p_sys->p_context->sample_rate = p_dec->fmt_in.audio.i_rate;
107     p_sys->p_context->channels = p_dec->fmt_in.audio.i_channels;
108
109     p_sys->p_context->block_align = p_dec->fmt_in.audio.i_blockalign;
110     p_sys->p_context->bit_rate = p_dec->fmt_in.i_bitrate;
111 #if LIBAVCODEC_VERSION_INT < AV_VERSION_INT( 52, 0, 0 )
112     p_sys->p_context->bits_per_sample = p_dec->fmt_in.audio.i_bitspersample;
113 #else
114     p_sys->p_context->bits_per_coded_sample = p_dec->fmt_in.audio.i_bitspersample;
115 #endif
116
117     if( p_dec->fmt_in.i_extra > 0 )
118     {
119         const uint8_t * const p_src = p_dec->fmt_in.p_extra;
120         int i_offset;
121         int i_size;
122
123         if( p_dec->fmt_in.i_codec == VLC_CODEC_FLAC )
124         {
125             i_offset = 8;
126             i_size = p_dec->fmt_in.i_extra - 8;
127         }
128         else if( p_dec->fmt_in.i_codec == VLC_CODEC_ALAC )
129         {
130             static const uint8_t p_pattern[] = { 0, 0, 0, 36, 'a', 'l', 'a', 'c' };
131             /* Find alac atom XXX it is a bit ugly */
132             for( i_offset = 0; i_offset < p_dec->fmt_in.i_extra - sizeof(p_pattern); i_offset++ )
133             {
134                 if( !memcmp( &p_src[i_offset], p_pattern, sizeof(p_pattern) ) )
135                     break;
136             }
137             i_size = __MIN( p_dec->fmt_in.i_extra - i_offset, 36 );
138             if( i_size < 36 )
139                 i_size = 0;
140         }
141         else
142         {
143             i_offset = 0;
144             i_size = p_dec->fmt_in.i_extra;
145         }
146
147         if( i_size > 0 )
148         {
149             p_sys->p_context->extradata =
150                 malloc( i_size + FF_INPUT_BUFFER_PADDING_SIZE );
151             if( p_sys->p_context->extradata )
152             {
153                 uint8_t *p_dst = p_sys->p_context->extradata;
154
155                 p_sys->p_context->extradata_size = i_size;
156
157                 memcpy( &p_dst[0],            &p_src[i_offset], i_size );
158                 memset( &p_dst[i_size], 0, FF_INPUT_BUFFER_PADDING_SIZE );
159             }
160         }
161     }
162     else
163     {
164         p_sys->p_context->extradata_size = 0;
165         p_sys->p_context->extradata = NULL;
166     }
167
168     /* ***** Open the codec ***** */
169     int ret;
170     vlc_avcodec_lock();
171     ret = avcodec_open( p_sys->p_context, p_sys->p_codec );
172     vlc_avcodec_unlock();
173     if( ret < 0 )
174     {
175         msg_Err( p_dec, "cannot open codec (%s)", p_sys->psz_namecodec );
176         free( p_sys->p_context->extradata );
177         free( p_sys );
178         return VLC_EGENERIC;
179     }
180
181     msg_Dbg( p_dec, "ffmpeg codec (%s) started", p_sys->psz_namecodec );
182
183     switch( i_codec_id )
184     {
185     case CODEC_ID_WAVPACK:
186         p_sys->i_output_max = 8 * sizeof(int32_t) * 131072;
187         break;
188     case CODEC_ID_TTA:
189         p_sys->i_output_max = p_sys->p_context->channels * sizeof(int32_t) * p_sys->p_context->sample_rate * 2;
190         break;
191     case CODEC_ID_FLAC:
192         p_sys->i_output_max = 8 * sizeof(int32_t) * 65535;
193         break;
194 #if LIBAVCODEC_VERSION_INT >= AV_VERSION_INT( 52, 35, 0 )
195     case CODEC_ID_WMAPRO:
196         p_sys->i_output_max = 8 * sizeof(float) * 6144; /* (1 << 12) * 3/2 */
197         break;
198 #endif
199     default:
200         p_sys->i_output_max = 0;
201         break;
202     }
203     if( p_sys->i_output_max < AVCODEC_MAX_AUDIO_FRAME_SIZE )
204         p_sys->i_output_max = AVCODEC_MAX_AUDIO_FRAME_SIZE;
205     msg_Dbg( p_dec, "Using %d bytes output buffer", p_sys->i_output_max );
206     p_sys->p_output = av_malloc( p_sys->i_output_max );
207
208     p_sys->p_samples = NULL;
209     p_sys->i_samples = 0;
210     p_sys->i_reject_count = 0;
211     p_sys->b_extract = false;
212     p_sys->i_previous_channels = 0;
213     p_sys->i_previous_layout = 0;
214
215     date_Set( &p_sys->end_date, 0 );
216     if( p_dec->fmt_in.audio.i_rate )
217         date_Init( &p_sys->end_date, p_dec->fmt_in.audio.i_rate, 1 );
218
219     /* */
220     p_dec->fmt_out.i_cat = AUDIO_ES;
221     /* Try to set as much informations as possible but do not trust it */
222     SetupOutputFormat( p_dec, false );
223
224     return VLC_SUCCESS;
225 }
226
227 /*****************************************************************************
228  * SplitBuffer: Needed because aout really doesn't like big audio chunk and
229  * wma produces easily > 30000 samples...
230  *****************************************************************************/
231 static aout_buffer_t *SplitBuffer( decoder_t *p_dec )
232 {
233     decoder_sys_t *p_sys = p_dec->p_sys;
234     int i_samples = __MIN( p_sys->i_samples, 4096 );
235     aout_buffer_t *p_buffer;
236
237     if( i_samples == 0 ) return NULL;
238
239     if( ( p_buffer = decoder_NewAudioBuffer( p_dec, i_samples ) ) == NULL )
240         return NULL;
241
242     p_buffer->i_pts = date_Get( &p_sys->end_date );
243     p_buffer->end_date = date_Increment( &p_sys->end_date, i_samples );
244
245     if( p_sys->b_extract )
246         aout_ChannelExtract( p_buffer->p_buffer, p_dec->fmt_out.audio.i_channels,
247                              p_sys->p_samples, p_sys->p_context->channels, i_samples,
248                              p_sys->pi_extraction, p_dec->fmt_out.audio.i_bitspersample );
249     else
250         memcpy( p_buffer->p_buffer, p_sys->p_samples, p_buffer->i_nb_bytes );
251
252     p_sys->p_samples += i_samples * p_sys->p_context->channels * ( p_dec->fmt_out.audio.i_bitspersample / 8 );
253     p_sys->i_samples -= i_samples;
254
255     return p_buffer;
256 }
257
258 /*****************************************************************************
259  * DecodeAudio: Called to decode one frame
260  *****************************************************************************/
261 aout_buffer_t * DecodeAudio ( decoder_t *p_dec, block_t **pp_block )
262 {
263     decoder_sys_t *p_sys = p_dec->p_sys;
264     int i_used, i_output;
265     aout_buffer_t *p_buffer;
266     block_t *p_block;
267
268     if( !pp_block || !*pp_block ) return NULL;
269
270     p_block = *pp_block;
271
272     if( p_block->i_flags & (BLOCK_FLAG_DISCONTINUITY|BLOCK_FLAG_CORRUPTED) )
273     {
274         block_Release( p_block );
275         avcodec_flush_buffers( p_sys->p_context );
276         p_sys->i_samples = 0;
277         date_Set( &p_sys->end_date, 0 );
278
279         if( p_sys->i_codec_id == CODEC_ID_MP2 || p_sys->i_codec_id == CODEC_ID_MP3 )
280             p_sys->i_reject_count = 3;
281         return NULL;
282     }
283
284     if( p_sys->i_samples > 0 )
285     {
286         /* More data */
287         p_buffer = SplitBuffer( p_dec );
288         if( !p_buffer ) block_Release( p_block );
289         return p_buffer;
290     }
291
292     if( !date_Get( &p_sys->end_date ) && !p_block->i_pts )
293     {
294         /* We've just started the stream, wait for the first PTS. */
295         block_Release( p_block );
296         return NULL;
297     }
298
299     if( p_block->i_buffer <= 0 )
300     {
301         block_Release( p_block );
302         return NULL;
303     }
304
305     i_output = __MAX( p_block->i_buffer, p_sys->i_output_max );
306     if( i_output > p_sys->i_output_max )
307     {
308         /* Grow output buffer if necessary (eg. for PCM data) */
309         p_sys->p_output = av_realloc( p_sys->p_output, i_output );
310     }
311
312     *pp_block = p_block = block_Realloc( p_block, 0, p_block->i_buffer + FF_INPUT_BUFFER_PADDING_SIZE );
313     if( !p_block )
314         return NULL;
315     p_block->i_buffer -= FF_INPUT_BUFFER_PADDING_SIZE;
316     memset( &p_block->p_buffer[p_block->i_buffer], 0, FF_INPUT_BUFFER_PADDING_SIZE );
317
318 #if LIBAVCODEC_VERSION_INT >= AV_VERSION_INT( 52, 0, 0 )
319     i_used = avcodec_decode_audio2( p_sys->p_context,
320                                    (int16_t*)p_sys->p_output, &i_output,
321                                    p_block->p_buffer, p_block->i_buffer );
322 #else
323     i_used = avcodec_decode_audio( p_sys->p_context,
324                                    (int16_t*)p_sys->p_output, &i_output,
325                                    p_block->p_buffer, p_block->i_buffer );
326 #endif
327
328     if( i_used < 0 || i_output < 0 )
329     {
330         if( i_used < 0 )
331             msg_Warn( p_dec, "cannot decode one frame (%zu bytes)",
332                       p_block->i_buffer );
333
334         block_Release( p_block );
335         return NULL;
336     }
337     else if( (size_t)i_used > p_block->i_buffer )
338     {
339         i_used = p_block->i_buffer;
340     }
341
342     p_block->i_buffer -= i_used;
343     p_block->p_buffer += i_used;
344
345     if( p_sys->p_context->channels <= 0 || p_sys->p_context->channels > 8 ||
346         p_sys->p_context->sample_rate <= 0 )
347     {
348         msg_Warn( p_dec, "invalid audio properties channels count %d, sample rate %d",
349                   p_sys->p_context->channels, p_sys->p_context->sample_rate );
350         block_Release( p_block );
351         return NULL;
352     }
353
354     if( p_dec->fmt_out.audio.i_rate != (unsigned int)p_sys->p_context->sample_rate )
355     {
356         date_Init( &p_sys->end_date, p_sys->p_context->sample_rate, 1 );
357         date_Set( &p_sys->end_date, p_block->i_pts );
358     }
359
360     /* **** Set audio output parameters **** */
361     SetupOutputFormat( p_dec, true );
362
363     if( p_block->i_pts != 0 &&
364         p_block->i_pts != date_Get( &p_sys->end_date ) )
365     {
366         date_Set( &p_sys->end_date, p_block->i_pts );
367     }
368     p_block->i_pts = 0;
369
370     /* **** Now we can output these samples **** */
371     p_sys->i_samples = i_output / (p_dec->fmt_out.audio.i_bitspersample / 8) / p_sys->p_context->channels;
372     p_sys->p_samples = p_sys->p_output;
373
374     /* Silent unwanted samples */
375     if( p_sys->i_reject_count > 0 )
376     {
377         memset( p_sys->p_output, 0, i_output );
378         p_sys->i_reject_count--;
379     }
380
381     p_buffer = SplitBuffer( p_dec );
382     if( !p_buffer ) block_Release( p_block );
383     return p_buffer;
384 }
385
386 /*****************************************************************************
387  * EndAudioDec: audio decoder destruction
388  *****************************************************************************/
389 void EndAudioDec( decoder_t *p_dec )
390 {
391     decoder_sys_t *p_sys = p_dec->p_sys;
392
393     av_free( p_sys->p_output );
394 }
395
396 /*****************************************************************************
397  *
398  *****************************************************************************/
399 #if LIBAVCODEC_VERSION_INT >= AV_VERSION_INT( 52, 2, 0 )
400 #   define LIBAVCODEC_AUDIO_LAYOUT
401 #else
402 #   warning "Audio channel layout is unsupported by your avcodec version."
403 #endif
404
405 #if defined(LIBAVCODEC_AUDIO_LAYOUT)
406 static const uint64_t pi_channels_map[][2] =
407 {
408     { CH_FRONT_LEFT,        AOUT_CHAN_LEFT },
409     { CH_FRONT_RIGHT,       AOUT_CHAN_RIGHT },
410     { CH_FRONT_CENTER,      AOUT_CHAN_CENTER },
411     { CH_LOW_FREQUENCY,     AOUT_CHAN_LFE },
412     { CH_BACK_LEFT,         AOUT_CHAN_REARLEFT },
413     { CH_BACK_RIGHT,        AOUT_CHAN_REARRIGHT },
414     { CH_FRONT_LEFT_OF_CENTER, 0 },
415     { CH_FRONT_RIGHT_OF_CENTER, 0 },
416     { CH_BACK_CENTER,       AOUT_CHAN_REARCENTER },
417     { CH_SIDE_LEFT,         AOUT_CHAN_MIDDLELEFT },
418     { CH_SIDE_RIGHT,        AOUT_CHAN_MIDDLERIGHT },
419     { CH_TOP_CENTER,        0 },
420     { CH_TOP_FRONT_LEFT,    0 },
421     { CH_TOP_FRONT_CENTER,  0 },
422     { CH_TOP_FRONT_RIGHT,   0 },
423     { CH_TOP_BACK_LEFT,     0 },
424     { CH_TOP_BACK_CENTER,   0 },
425     { CH_TOP_BACK_RIGHT,    0 },
426     { CH_STEREO_LEFT,       0 },
427     { CH_STEREO_RIGHT,      0 },
428 };
429 #else
430 static const uint64_t pi_channels_map[][2] =
431 {
432     { 0, AOUT_CHAN_LEFT },
433     { 0, AOUT_CHAN_RIGHT },
434     { 0, AOUT_CHAN_CENTER },
435     { 0, AOUT_CHAN_LFE },
436     { 0, AOUT_CHAN_REARLEFT },
437     { 0, AOUT_CHAN_REARRIGHT },
438     { 0, 0 },
439     { 0, 0 },
440     { 0, AOUT_CHAN_REARCENTER },
441     { 0, AOUT_CHAN_MIDDLELEFT },
442     { 0, AOUT_CHAN_MIDDLERIGHT },
443     { 0, 0 },
444     { 0, 0 },
445     { 0, 0 },
446     { 0, 0 },
447     { 0, 0 },
448     { 0, 0 },
449     { 0, 0 },
450     { 0, 0 },
451     { 0, 0 },
452 };
453 #endif
454
455 static void SetupOutputFormat( decoder_t *p_dec, bool b_trust )
456 {
457     decoder_sys_t *p_sys = p_dec->p_sys;
458
459 #if LIBAVCODEC_VERSION_INT >= AV_VERSION_INT( 51, 65, 0 )
460     switch( p_sys->p_context->sample_fmt )
461     {
462     case SAMPLE_FMT_U8:
463         p_dec->fmt_out.i_codec = VLC_CODEC_U8;
464         p_dec->fmt_out.audio.i_bitspersample = 8;
465         break;
466     case SAMPLE_FMT_S32:
467         p_dec->fmt_out.i_codec = VLC_CODEC_S32N;
468         p_dec->fmt_out.audio.i_bitspersample = 32;
469         break;
470     case SAMPLE_FMT_FLT:
471         p_dec->fmt_out.i_codec = VLC_CODEC_FL32;
472         p_dec->fmt_out.audio.i_bitspersample = 32;
473         break;
474     case SAMPLE_FMT_DBL:
475         p_dec->fmt_out.i_codec = VLC_CODEC_FL64;
476         p_dec->fmt_out.audio.i_bitspersample = 64;
477         break;
478
479     case SAMPLE_FMT_S16:
480     default:
481         p_dec->fmt_out.i_codec = VLC_CODEC_S16N;
482         p_dec->fmt_out.audio.i_bitspersample = 16;
483         break;
484     }
485 #else
486     p_dec->fmt_out.i_codec = VLC_CODEC_S16N;
487     p_dec->fmt_out.audio.i_bitspersample = 16;
488 #endif
489     p_dec->fmt_out.audio.i_rate     = p_sys->p_context->sample_rate;
490
491     /* */
492 #if defined(LIBAVCODEC_AUDIO_LAYOUT)
493     if( p_sys->i_previous_channels == p_sys->p_context->channels &&
494         p_sys->i_previous_layout == p_sys->p_context->channel_layout )
495         return;
496 #else
497     if( p_sys->i_previous_channels == p_sys->p_context->channels )
498         return;
499 #endif
500     if( b_trust )
501     {
502         p_sys->i_previous_channels = p_sys->p_context->channels;
503 #if defined(LIBAVCODEC_AUDIO_LAYOUT)
504         p_sys->i_previous_layout = p_sys->p_context->channel_layout;
505 #endif
506     }
507
508     /* Specified order
509      * FIXME should we use fmt_in.audio.i_physical_channels or not ?
510      */
511 #if defined(LIBAVCODEC_AUDIO_LAYOUT)
512     const unsigned i_order_max = 8 * sizeof(p_sys->p_context->channel_layout);
513 #else
514     const unsigned i_order_max = 64;
515 #endif
516     uint32_t pi_order_src[i_order_max];
517     int i_channels_src = 0;
518
519 #if defined(LIBAVCODEC_AUDIO_LAYOUT)
520     if( p_sys->p_context->channel_layout )
521     {
522         for( unsigned i = 0; i < sizeof(pi_channels_map)/sizeof(*pi_channels_map); i++ )
523         {
524             if( p_sys->p_context->channel_layout & pi_channels_map[i][0] )
525                 pi_order_src[i_channels_src++] = pi_channels_map[i][1];
526         }
527     }
528     else
529 #endif
530     {
531         /* Create default order  */
532         if( b_trust )
533             msg_Warn( p_dec, "Physical channel configuration not set : guessing" );
534         for( unsigned int i = 0; i < __MIN( i_order_max, (unsigned)p_sys->p_context->channels ); i++ )
535         {
536             if( i < sizeof(pi_channels_map)/sizeof(*pi_channels_map) )
537                 pi_order_src[i_channels_src++] = pi_channels_map[i][1];
538         }
539     }
540     if( i_channels_src != p_sys->p_context->channels && b_trust )
541         msg_Err( p_dec, "Channel layout not understood" );
542
543     uint32_t i_layout_dst;
544     int      i_channels_dst;
545     p_sys->b_extract = aout_CheckChannelExtraction( p_sys->pi_extraction,
546                                                     &i_layout_dst, &i_channels_dst,
547                                                     NULL, pi_order_src, i_channels_src );
548     if( i_channels_dst != i_channels_src && b_trust )
549         msg_Warn( p_dec, "%d channels are dropped", i_channels_src - i_channels_dst );
550
551     p_dec->fmt_out.audio.i_physical_channels =
552     p_dec->fmt_out.audio.i_original_channels = i_layout_dst;
553     p_dec->fmt_out.audio.i_channels = i_channels_dst;
554 }
555