]> git.sesse.net Git - ffmpeg/blob - libavformat/aiffdec.c
lavf: replace AVStream.codec with AVStream.codecpar
[ffmpeg] / libavformat / aiffdec.c
1 /*
2  * AIFF/AIFF-C demuxer
3  * Copyright (c) 2006  Patrick Guimond
4  *
5  * This file is part of Libav.
6  *
7  * Libav is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * Libav is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with Libav; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include "libavutil/mathematics.h"
23 #include "libavutil/dict.h"
24 #include "avformat.h"
25 #include "internal.h"
26 #include "pcm.h"
27 #include "aiff.h"
28
29 #define AIFF                    0
30 #define AIFF_C_VERSION1         0xA2805140
31
32 typedef struct AIFFInputContext {
33     int64_t data_end;
34     int block_duration;
35 } AIFFInputContext;
36
37 static enum AVCodecID aiff_codec_get_id(int bps)
38 {
39     if (bps <= 8)
40         return AV_CODEC_ID_PCM_S8;
41     if (bps <= 16)
42         return AV_CODEC_ID_PCM_S16BE;
43     if (bps <= 24)
44         return AV_CODEC_ID_PCM_S24BE;
45     if (bps <= 32)
46         return AV_CODEC_ID_PCM_S32BE;
47
48     /* bigger than 32 isn't allowed  */
49     return AV_CODEC_ID_NONE;
50 }
51
52 /* returns the size of the found tag */
53 static int get_tag(AVIOContext *pb, uint32_t * tag)
54 {
55     int size;
56
57     if (pb->eof_reached)
58         return AVERROR(EIO);
59
60     *tag = avio_rl32(pb);
61     size = avio_rb32(pb);
62
63     if (size < 0)
64         size = 0x7fffffff;
65
66     return size;
67 }
68
69 /* Metadata string read */
70 static void get_meta(AVFormatContext *s, const char *key, int size)
71 {
72     uint8_t *str = av_malloc(size+1);
73     int res;
74
75     if (!str) {
76         avio_skip(s->pb, size);
77         return;
78     }
79
80     res = avio_read(s->pb, str, size);
81     if (res < 0)
82         return;
83
84     str[res] = 0;
85     av_dict_set(&s->metadata, key, str, AV_DICT_DONT_STRDUP_VAL);
86 }
87
88 /* Returns the number of sound data frames or negative on error */
89 static unsigned int get_aiff_header(AVFormatContext *s, int size,
90                                     unsigned version)
91 {
92     AVIOContext *pb        = s->pb;
93     AVCodecParameters *par = s->streams[0]->codecpar;
94     AIFFInputContext *aiff = s->priv_data;
95     int exp;
96     uint64_t val;
97     double sample_rate;
98     unsigned int num_frames;
99
100     if (size & 1)
101         size++;
102     par->codec_type = AVMEDIA_TYPE_AUDIO;
103     par->channels = avio_rb16(pb);
104     num_frames = avio_rb32(pb);
105     par->bits_per_coded_sample = avio_rb16(pb);
106
107     exp = avio_rb16(pb);
108     val = avio_rb64(pb);
109     sample_rate = ldexp(val, exp - 16383 - 63);
110     par->sample_rate = sample_rate;
111     size -= 18;
112
113     /* get codec id for AIFF-C */
114     if (version == AIFF_C_VERSION1) {
115         par->codec_tag = avio_rl32(pb);
116         par->codec_id  = ff_codec_get_id(ff_codec_aiff_tags, par->codec_tag);
117         size -= 4;
118     }
119
120     if (version != AIFF_C_VERSION1 || par->codec_id == AV_CODEC_ID_PCM_S16BE) {
121         par->codec_id = aiff_codec_get_id(par->bits_per_coded_sample);
122         par->bits_per_coded_sample = av_get_bits_per_sample(par->codec_id);
123         aiff->block_duration = 1;
124     } else {
125         switch (par->codec_id) {
126         case AV_CODEC_ID_PCM_F32BE:
127         case AV_CODEC_ID_PCM_F64BE:
128         case AV_CODEC_ID_PCM_S16LE:
129         case AV_CODEC_ID_PCM_ALAW:
130         case AV_CODEC_ID_PCM_MULAW:
131             aiff->block_duration = 1;
132             break;
133         case AV_CODEC_ID_ADPCM_IMA_QT:
134             par->block_align = 34 * par->channels;
135             break;
136         case AV_CODEC_ID_MACE3:
137             par->block_align = 2 * par->channels;
138             break;
139         case AV_CODEC_ID_ADPCM_G722:
140         case AV_CODEC_ID_MACE6:
141             par->block_align = 1 * par->channels;
142             break;
143         case AV_CODEC_ID_GSM:
144             par->block_align = 33;
145             break;
146         case AV_CODEC_ID_QCELP:
147             par->block_align = 35;
148             break;
149         default:
150             break;
151         }
152         if (par->block_align > 0)
153             aiff->block_duration = av_get_audio_frame_duration2(par,
154                                                                 par->block_align);
155     }
156
157     /* Block align needs to be computed in all cases, as the definition
158      * is specific to applications -> here we use the WAVE format definition */
159     if (!par->block_align)
160         par->block_align = (par->bits_per_coded_sample * par->channels) >> 3;
161
162     if (aiff->block_duration) {
163         par->bit_rate = par->sample_rate * (par->block_align << 3) /
164                         aiff->block_duration;
165     }
166
167     /* Chunk is over */
168     if (size)
169         avio_skip(pb, size);
170
171     return num_frames;
172 }
173
174 static int aiff_probe(AVProbeData *p)
175 {
176     /* check file header */
177     if (p->buf[0] == 'F' && p->buf[1] == 'O' &&
178         p->buf[2] == 'R' && p->buf[3] == 'M' &&
179         p->buf[8] == 'A' && p->buf[9] == 'I' &&
180         p->buf[10] == 'F' && (p->buf[11] == 'F' || p->buf[11] == 'C'))
181         return AVPROBE_SCORE_MAX;
182     else
183         return 0;
184 }
185
186 /* aiff input */
187 static int aiff_read_header(AVFormatContext *s)
188 {
189     int size, filesize;
190     int64_t offset = 0;
191     uint32_t tag;
192     unsigned version = AIFF_C_VERSION1;
193     AVIOContext *pb = s->pb;
194     AVStream * st;
195     AIFFInputContext *aiff = s->priv_data;
196
197     /* check FORM header */
198     filesize = get_tag(pb, &tag);
199     if (filesize < 0 || tag != MKTAG('F', 'O', 'R', 'M'))
200         return AVERROR_INVALIDDATA;
201
202     /* AIFF data type */
203     tag = avio_rl32(pb);
204     if (tag == MKTAG('A', 'I', 'F', 'F'))       /* Got an AIFF file */
205         version = AIFF;
206     else if (tag != MKTAG('A', 'I', 'F', 'C'))  /* An AIFF-C file then */
207         return AVERROR_INVALIDDATA;
208
209     filesize -= 4;
210
211     st = avformat_new_stream(s, NULL);
212     if (!st)
213         return AVERROR(ENOMEM);
214
215     while (filesize > 0) {
216         /* parse different chunks */
217         size = get_tag(pb, &tag);
218         if (size < 0)
219             return size;
220
221         filesize -= size + 8;
222
223         switch (tag) {
224         case MKTAG('C', 'O', 'M', 'M'):     /* Common chunk */
225             /* Then for the complete header info */
226             st->nb_frames = get_aiff_header(s, size, version);
227             if (st->nb_frames < 0)
228                 return st->nb_frames;
229             if (offset > 0) // COMM is after SSND
230                 goto got_sound;
231             break;
232         case MKTAG('F', 'V', 'E', 'R'):     /* Version chunk */
233             version = avio_rb32(pb);
234             break;
235         case MKTAG('N', 'A', 'M', 'E'):     /* Sample name chunk */
236             get_meta(s, "title"    , size);
237             break;
238         case MKTAG('A', 'U', 'T', 'H'):     /* Author chunk */
239             get_meta(s, "author"   , size);
240             break;
241         case MKTAG('(', 'c', ')', ' '):     /* Copyright chunk */
242             get_meta(s, "copyright", size);
243             break;
244         case MKTAG('A', 'N', 'N', 'O'):     /* Annotation chunk */
245             get_meta(s, "comment"  , size);
246             break;
247         case MKTAG('S', 'S', 'N', 'D'):     /* Sampled sound chunk */
248             aiff->data_end = avio_tell(pb) + size;
249             offset = avio_rb32(pb);      /* Offset of sound data */
250             avio_rb32(pb);               /* BlockSize... don't care */
251             offset += avio_tell(pb);    /* Compute absolute data offset */
252             if (st->codecpar->block_align)    /* Assume COMM already parsed */
253                 goto got_sound;
254             if (!pb->seekable) {
255                 av_log(s, AV_LOG_ERROR, "file is not seekable\n");
256                 return -1;
257             }
258             avio_skip(pb, size - 8);
259             break;
260         case MKTAG('w', 'a', 'v', 'e'):
261             if ((uint64_t)size > (1<<30))
262                 return -1;
263             st->codecpar->extradata = av_mallocz(size + AV_INPUT_BUFFER_PADDING_SIZE);
264             if (!st->codecpar->extradata)
265                 return AVERROR(ENOMEM);
266             st->codecpar->extradata_size = size;
267             avio_read(pb, st->codecpar->extradata, size);
268             break;
269         default: /* Jump */
270             if (size & 1)   /* Always even aligned */
271                 size++;
272             avio_skip(pb, size);
273         }
274     }
275
276 got_sound:
277     if (!st->codecpar->block_align) {
278         av_log(s, AV_LOG_ERROR, "could not find COMM tag or invalid block_align value\n");
279         return -1;
280     }
281
282     /* Now positioned, get the sound data start and end */
283     avpriv_set_pts_info(st, 64, 1, st->codecpar->sample_rate);
284     st->start_time = 0;
285     st->duration = st->nb_frames * aiff->block_duration;
286
287     /* Position the stream at the first block */
288     avio_seek(pb, offset, SEEK_SET);
289
290     return 0;
291 }
292
293 #define MAX_SIZE 4096
294
295 static int aiff_read_packet(AVFormatContext *s,
296                             AVPacket *pkt)
297 {
298     AVStream *st = s->streams[0];
299     AIFFInputContext *aiff = s->priv_data;
300     int64_t max_size;
301     int res, size;
302
303     /* calculate size of remaining data */
304     max_size = aiff->data_end - avio_tell(s->pb);
305     if (max_size <= 0)
306         return AVERROR_EOF;
307
308     /* Now for that packet */
309     if (st->codecpar->block_align >= 33) // GSM, QCLP, IMA4
310         size = st->codecpar->block_align;
311     else
312         size = (MAX_SIZE / st->codecpar->block_align) * st->codecpar->block_align;
313     size = FFMIN(max_size, size);
314     res = av_get_packet(s->pb, pkt, size);
315     if (res < 0)
316         return res;
317
318     /* Only one stream in an AIFF file */
319     pkt->stream_index = 0;
320     pkt->duration     = (res / st->codecpar->block_align) * aiff->block_duration;
321     return 0;
322 }
323
324 AVInputFormat ff_aiff_demuxer = {
325     .name           = "aiff",
326     .long_name      = NULL_IF_CONFIG_SMALL("Audio IFF"),
327     .priv_data_size = sizeof(AIFFInputContext),
328     .read_probe     = aiff_probe,
329     .read_header    = aiff_read_header,
330     .read_packet    = aiff_read_packet,
331     .read_seek      = ff_pcm_read_seek,
332     .codec_tag      = (const AVCodecTag* const []){ ff_codec_aiff_tags, 0 },
333 };