]> git.sesse.net Git - ffmpeg/blob - libavformat/aiff.c
correctly compute bit rate for compressed audio, should fix seeking in aiff
[ffmpeg] / libavformat / aiff.c
1 /*
2  * AIFF/AIFF-C muxer and demuxer
3  * Copyright (c) 2006  Patrick Guimond
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21 #include "avformat.h"
22 #include "raw.h"
23 #include "riff.h"
24 #include "intfloat_readwrite.h"
25
26 static const AVCodecTag codec_aiff_tags[] = {
27     { CODEC_ID_PCM_S16BE, MKTAG('N','O','N','E') },
28     { CODEC_ID_PCM_S8, MKTAG('N','O','N','E') },
29     { CODEC_ID_PCM_S24BE, MKTAG('N','O','N','E') },
30     { CODEC_ID_PCM_S32BE, MKTAG('N','O','N','E') },
31     { CODEC_ID_PCM_ALAW, MKTAG('a','l','a','w') },
32     { CODEC_ID_PCM_MULAW, MKTAG('u','l','a','w') },
33     { CODEC_ID_MACE3, MKTAG('M','A','C','3') },
34     { CODEC_ID_MACE6, MKTAG('M','A','C','6') },
35     { CODEC_ID_GSM, MKTAG('G','S','M',' ') },
36     { CODEC_ID_ADPCM_G726, MKTAG('G','7','2','6') },
37     { CODEC_ID_PCM_S16LE, MKTAG('s','o','w','t') },
38     { CODEC_ID_ADPCM_IMA_QT, MKTAG('i','m','a','4') },
39     { CODEC_ID_QDM2, MKTAG('Q','D','M','2') },
40     { 0, 0 },
41 };
42
43 #define AIFF                    0
44 #define AIFF_C_VERSION1         0xA2805140
45
46 static int aiff_codec_get_id (int bps)
47 {
48     if (bps <= 8)
49         return CODEC_ID_PCM_S8;
50     if (bps <= 16)
51         return CODEC_ID_PCM_S16BE;
52     if (bps <= 24)
53         return CODEC_ID_PCM_S24BE;
54     if (bps <= 32)
55         return CODEC_ID_PCM_S32BE;
56
57     /* bigger than 32 isn't allowed  */
58     return 0;
59 }
60
61 /* returns the size of the found tag */
62 static int get_tag(ByteIOContext *pb, uint32_t * tag)
63 {
64     int size;
65
66     if (url_feof(pb))
67         return AVERROR(EIO);
68
69     *tag = get_le32(pb);
70     size = get_be32(pb);
71
72     if (size < 0)
73         size = 0x7fffffff;
74
75     return size;
76 }
77
78 /* Metadata string read */
79 static void get_meta(ByteIOContext *pb, char * str, int strsize, int size)
80 {
81     int res;
82
83     if (size > strsize-1)
84         res = get_buffer(pb, (uint8_t*)str, strsize-1);
85     else
86         res = get_buffer(pb, (uint8_t*)str, size);
87
88     if (res < 0)
89         return;
90
91     str[res] = 0;
92     if (size & 1)
93         size++;
94     size -= res;
95     if (size)
96         url_fskip(pb, size);
97 }
98
99 /* Returns the number of sound data frames or negative on error */
100 static unsigned int get_aiff_header(ByteIOContext *pb, AVCodecContext *codec,
101                              int size, unsigned version)
102 {
103     AVExtFloat ext;
104     double sample_rate;
105     unsigned int num_frames;
106
107     if (size & 1)
108         size++;
109     codec->codec_type = CODEC_TYPE_AUDIO;
110     codec->channels = get_be16(pb);
111     num_frames = get_be32(pb);
112     codec->bits_per_sample = get_be16(pb);
113
114     get_buffer(pb, (uint8_t*)&ext, sizeof(ext));/* Sample rate is in */
115     sample_rate = av_ext2dbl(ext);          /* 80 bits BE IEEE extended float */
116     codec->sample_rate = sample_rate;
117     size -= 18;
118
119     /* Got an AIFF-C? */
120     if (version == AIFF_C_VERSION1) {
121         codec->codec_tag = get_le32(pb);
122         codec->codec_id  = codec_get_id(codec_aiff_tags, codec->codec_tag);
123
124         switch (codec->codec_id) {
125         case CODEC_ID_PCM_S16BE:
126             codec->codec_id = aiff_codec_get_id(codec->bits_per_sample);
127             codec->bits_per_sample = av_get_bits_per_sample(codec->codec_id);
128             break;
129         case CODEC_ID_ADPCM_IMA_QT:
130             codec->block_align = 34*codec->channels;
131             codec->frame_size = 64;
132             break;
133         case CODEC_ID_MACE3:
134         case CODEC_ID_MACE6:
135             codec->frame_size = 6;
136             break;
137         default:
138             break;
139         }
140         size -= 4;
141     } else {
142         /* Need the codec type */
143         codec->codec_id = aiff_codec_get_id(codec->bits_per_sample);
144         codec->bits_per_sample = av_get_bits_per_sample(codec->codec_id);
145     }
146
147     if (!codec->codec_id)
148         return AVERROR_INVALIDDATA;
149
150     /* Block align needs to be computed in all cases, as the definition
151      * is specific to applications -> here we use the WAVE format definition */
152     if (!codec->block_align)
153         codec->block_align = (codec->bits_per_sample * codec->channels) >> 3;
154
155     codec->bit_rate = (codec->frame_size ? codec->sample_rate/codec->frame_size :
156                        codec->sample_rate) * (codec->block_align << 3);
157
158     /* Chunk is over */
159     if (size)
160         url_fseek(pb, size, SEEK_CUR);
161
162     return num_frames;
163 }
164
165 #ifdef CONFIG_MUXERS
166 typedef struct {
167     offset_t form;
168     offset_t frames;
169     offset_t ssnd;
170 } AIFFOutputContext;
171
172 static int aiff_write_header(AVFormatContext *s)
173 {
174     AIFFOutputContext *aiff = s->priv_data;
175     ByteIOContext *pb = s->pb;
176     AVCodecContext *enc = s->streams[0]->codec;
177     AVExtFloat sample_rate;
178     int aifc = 0;
179
180     /* First verify if format is ok */
181     if (!enc->codec_tag)
182         return -1;
183     if (enc->codec_tag != MKTAG('N','O','N','E'))
184         aifc = 1;
185
186     /* FORM AIFF header */
187     put_tag(pb, "FORM");
188     aiff->form = url_ftell(pb);
189     put_be32(pb, 0);                    /* file length */
190     put_tag(pb, aifc ? "AIFC" : "AIFF");
191
192     if (aifc) { // compressed audio
193         enc->bits_per_sample = 16;
194         if (!enc->block_align) {
195             av_log(s, AV_LOG_ERROR, "block align not set\n");
196             return -1;
197         }
198         /* Version chunk */
199         put_tag(pb, "FVER");
200         put_be32(pb, 4);
201         put_be32(pb, 0xA2805140);
202     }
203
204     /* Common chunk */
205     put_tag(pb, "COMM");
206     put_be32(pb, aifc ? 24 : 18); /* size */
207     put_be16(pb, enc->channels);  /* Number of channels */
208
209     aiff->frames = url_ftell(pb);
210     put_be32(pb, 0);              /* Number of frames */
211
212     if (!enc->bits_per_sample)
213         enc->bits_per_sample = av_get_bits_per_sample(enc->codec_id);
214     if (!enc->bits_per_sample) {
215         av_log(s, AV_LOG_ERROR, "could not compute bits per sample\n");
216         return -1;
217     }
218     if (!enc->block_align)
219         enc->block_align = (enc->bits_per_sample * enc->channels) >> 3;
220
221     put_be16(pb, enc->bits_per_sample); /* Sample size */
222
223     sample_rate = av_dbl2ext((double)enc->sample_rate);
224     put_buffer(pb, (uint8_t*)&sample_rate, sizeof(sample_rate));
225
226     if (aifc) {
227         put_le32(pb, enc->codec_tag);
228         put_be16(pb, 0);
229     }
230
231     /* Sound data chunk */
232     put_tag(pb, "SSND");
233     aiff->ssnd = url_ftell(pb);         /* Sound chunk size */
234     put_be32(pb, 0);                    /* Sound samples data size */
235     put_be32(pb, 0);                    /* Data offset */
236     put_be32(pb, 0);                    /* Block-size (block align) */
237
238     av_set_pts_info(s->streams[0], 64, 1, s->streams[0]->codec->sample_rate);
239
240     /* Data is starting here */
241     put_flush_packet(pb);
242
243     return 0;
244 }
245
246 static int aiff_write_packet(AVFormatContext *s, AVPacket *pkt)
247 {
248     ByteIOContext *pb = s->pb;
249     put_buffer(pb, pkt->data, pkt->size);
250     return 0;
251 }
252
253 static int aiff_write_trailer(AVFormatContext *s)
254 {
255     ByteIOContext *pb = s->pb;
256     AIFFOutputContext *aiff = s->priv_data;
257     AVCodecContext *enc = s->streams[0]->codec;
258
259     /* Chunks sizes must be even */
260     offset_t file_size, end_size;
261     end_size = file_size = url_ftell(pb);
262     if (file_size & 1) {
263         put_byte(pb, 0);
264         end_size++;
265     }
266
267     if (!url_is_streamed(s->pb)) {
268         /* File length */
269         url_fseek(pb, aiff->form, SEEK_SET);
270         put_be32(pb, file_size - aiff->form - 4);
271
272         /* Number of sample frames */
273         url_fseek(pb, aiff->frames, SEEK_SET);
274         put_be32(pb, (file_size-aiff->ssnd-12)/enc->block_align);
275
276         /* Sound Data chunk size */
277         url_fseek(pb, aiff->ssnd, SEEK_SET);
278         put_be32(pb, file_size - aiff->ssnd - 4);
279
280         /* return to the end */
281         url_fseek(pb, end_size, SEEK_SET);
282
283         put_flush_packet(pb);
284     }
285
286     return 0;
287 }
288 #endif //CONFIG_MUXERS
289
290 static int aiff_probe(AVProbeData *p)
291 {
292     /* check file header */
293     if (p->buf[0] == 'F' && p->buf[1] == 'O' &&
294         p->buf[2] == 'R' && p->buf[3] == 'M' &&
295         p->buf[8] == 'A' && p->buf[9] == 'I' &&
296         p->buf[10] == 'F' && (p->buf[11] == 'F' || p->buf[11] == 'C'))
297         return AVPROBE_SCORE_MAX;
298     else
299         return 0;
300 }
301
302 /* aiff input */
303 static int aiff_read_header(AVFormatContext *s,
304                             AVFormatParameters *ap)
305 {
306     int size, filesize;
307     offset_t offset = 0;
308     uint32_t tag;
309     unsigned version = AIFF_C_VERSION1;
310     ByteIOContext *pb = s->pb;
311     AVStream * st = s->streams[0];
312
313     /* check FORM header */
314     filesize = get_tag(pb, &tag);
315     if (filesize < 0 || tag != MKTAG('F', 'O', 'R', 'M'))
316         return AVERROR_INVALIDDATA;
317
318     /* AIFF data type */
319     tag = get_le32(pb);
320     if (tag == MKTAG('A', 'I', 'F', 'F'))       /* Got an AIFF file */
321         version = AIFF;
322     else if (tag != MKTAG('A', 'I', 'F', 'C'))  /* An AIFF-C file then */
323         return AVERROR_INVALIDDATA;
324
325     filesize -= 4;
326
327     st = av_new_stream(s, 0);
328     if (!st)
329         return AVERROR(ENOMEM);
330
331     while (filesize > 0) {
332         /* parse different chunks */
333         size = get_tag(pb, &tag);
334         if (size < 0)
335             return size;
336
337         filesize -= size + 8;
338
339         switch (tag) {
340         case MKTAG('C', 'O', 'M', 'M'):     /* Common chunk */
341             /* Then for the complete header info */
342             st->nb_frames = get_aiff_header (pb, st->codec, size, version);
343             if (st->nb_frames < 0)
344                 return st->nb_frames;
345             if (offset > 0) // COMM is after SSND
346                 goto got_sound;
347             break;
348         case MKTAG('F', 'V', 'E', 'R'):     /* Version chunk */
349             version = get_be32(pb);
350             break;
351         case MKTAG('N', 'A', 'M', 'E'):     /* Sample name chunk */
352             get_meta (pb, s->title, sizeof(s->title), size);
353             break;
354         case MKTAG('A', 'U', 'T', 'H'):     /* Author chunk */
355             get_meta (pb, s->author, sizeof(s->author), size);
356             break;
357         case MKTAG('(', 'c', ')', ' '):     /* Copyright chunk */
358             get_meta (pb, s->copyright, sizeof(s->copyright), size);
359             break;
360         case MKTAG('A', 'N', 'N', 'O'):     /* Annotation chunk */
361             get_meta (pb, s->comment, sizeof(s->comment), size);
362             break;
363         case MKTAG('S', 'S', 'N', 'D'):     /* Sampled sound chunk */
364             offset = get_be32(pb);      /* Offset of sound data */
365             get_be32(pb);               /* BlockSize... don't care */
366             offset += url_ftell(pb);    /* Compute absolute data offset */
367             if (st->codec->codec_id)    /* Assume COMM already parsed */
368                 goto got_sound;
369             if (url_is_streamed(pb)) {
370                 av_log(s, AV_LOG_ERROR, "file is not seekable\n");
371                 return -1;
372             }
373             url_fskip(pb, size - 8);
374             break;
375         case MKTAG('w', 'a', 'v', 'e'):
376             if ((uint64_t)size > (1<<30))
377                 return -1;
378             st->codec->extradata = av_mallocz(size + FF_INPUT_BUFFER_PADDING_SIZE);
379             if (!st->codec->extradata)
380                 return AVERROR(ENOMEM);
381             st->codec->extradata_size = size;
382             get_buffer(pb, st->codec->extradata, size);
383             break;
384         default: /* Jump */
385             if (size & 1)   /* Always even aligned */
386                 size++;
387             url_fskip (pb, size);
388         }
389     }
390
391     /* End of loop and didn't get sound */
392     return AVERROR_INVALIDDATA;
393
394 got_sound:
395     /* Now positioned, get the sound data start and end */
396     if (st->nb_frames)
397         s->file_size = st->nb_frames * st->codec->block_align;
398
399     av_set_pts_info(st, 64, 1, st->codec->sample_rate);
400     st->start_time = 0;
401     st->duration = st->codec->frame_size ?
402         st->nb_frames * st->codec->frame_size : st->nb_frames;
403
404     /* Position the stream at the first block */
405     url_fseek(pb, offset, SEEK_SET);
406
407     return 0;
408 }
409
410 #define MAX_SIZE 4096
411
412 static int aiff_read_packet(AVFormatContext *s,
413                             AVPacket *pkt)
414 {
415     AVStream *st = s->streams[0];
416     int res;
417
418     /* End of stream may be reached */
419     if (url_feof(s->pb))
420         return AVERROR(EIO);
421
422     /* Now for that packet */
423     res = av_get_packet(s->pb, pkt, (MAX_SIZE / st->codec->block_align) * st->codec->block_align);
424     if (res < 0)
425         return res;
426
427     /* Only one stream in an AIFF file */
428     pkt->stream_index = 0;
429     return 0;
430 }
431
432 static int aiff_read_seek(AVFormatContext *s,
433                           int stream_index, int64_t timestamp, int flags)
434 {
435     return pcm_read_seek(s, stream_index, timestamp, flags);
436 }
437
438 #ifdef CONFIG_AIFF_DEMUXER
439 AVInputFormat aiff_demuxer = {
440     "aiff",
441     "Audio IFF",
442     0,
443     aiff_probe,
444     aiff_read_header,
445     aiff_read_packet,
446     NULL,
447     aiff_read_seek,
448     .codec_tag= (const AVCodecTag*[]){codec_aiff_tags, 0},
449 };
450 #endif
451
452 #ifdef CONFIG_AIFF_MUXER
453 AVOutputFormat aiff_muxer = {
454     "aiff",
455     "Audio IFF",
456     "audio/aiff",
457     "aif,aiff,afc,aifc",
458     sizeof(AIFFOutputContext),
459     CODEC_ID_PCM_S16BE,
460     CODEC_ID_NONE,
461     aiff_write_header,
462     aiff_write_packet,
463     aiff_write_trailer,
464     .codec_tag= (const AVCodecTag*[]){codec_aiff_tags, 0},
465 };
466 #endif