]> git.sesse.net Git - ffmpeg/blob - libavformat/aiffdec.c
tiertexseq: set audio stream start time to 0
[ffmpeg] / libavformat / aiffdec.c
1 /*
2  * AIFF/AIFF-C demuxer
3  * Copyright (c) 2006  Patrick Guimond
4  *
5  * This file is part of Libav.
6  *
7  * Libav is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * Libav is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with Libav; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include "libavutil/mathematics.h"
23 #include "libavutil/dict.h"
24 #include "avformat.h"
25 #include "internal.h"
26 #include "pcm.h"
27 #include "aiff.h"
28
29 #define AIFF                    0
30 #define AIFF_C_VERSION1         0xA2805140
31
32 typedef struct {
33     int64_t data_end;
34 } AIFFInputContext;
35
36 static enum CodecID aiff_codec_get_id(int bps)
37 {
38     if (bps <= 8)
39         return CODEC_ID_PCM_S8;
40     if (bps <= 16)
41         return CODEC_ID_PCM_S16BE;
42     if (bps <= 24)
43         return CODEC_ID_PCM_S24BE;
44     if (bps <= 32)
45         return CODEC_ID_PCM_S32BE;
46
47     /* bigger than 32 isn't allowed  */
48     return CODEC_ID_NONE;
49 }
50
51 /* returns the size of the found tag */
52 static int get_tag(AVIOContext *pb, uint32_t * tag)
53 {
54     int size;
55
56     if (pb->eof_reached)
57         return AVERROR(EIO);
58
59     *tag = avio_rl32(pb);
60     size = avio_rb32(pb);
61
62     if (size < 0)
63         size = 0x7fffffff;
64
65     return size;
66 }
67
68 /* Metadata string read */
69 static void get_meta(AVFormatContext *s, const char *key, int size)
70 {
71     uint8_t *str = av_malloc(size+1);
72     int res;
73
74     if (!str) {
75         avio_skip(s->pb, size);
76         return;
77     }
78
79     res = avio_read(s->pb, str, size);
80     if (res < 0)
81         return;
82
83     str[res] = 0;
84     av_dict_set(&s->metadata, key, str, AV_DICT_DONT_STRDUP_VAL);
85 }
86
87 /* Returns the number of sound data frames or negative on error */
88 static unsigned int get_aiff_header(AVIOContext *pb, AVCodecContext *codec,
89                              int size, unsigned version)
90 {
91     int exp;
92     uint64_t val;
93     double sample_rate;
94     unsigned int num_frames;
95
96     if (size & 1)
97         size++;
98     codec->codec_type = AVMEDIA_TYPE_AUDIO;
99     codec->channels = avio_rb16(pb);
100     num_frames = avio_rb32(pb);
101     codec->bits_per_coded_sample = avio_rb16(pb);
102
103     exp = avio_rb16(pb);
104     val = avio_rb64(pb);
105     sample_rate = ldexp(val, exp - 16383 - 63);
106     codec->sample_rate = sample_rate;
107     size -= 18;
108
109     /* Got an AIFF-C? */
110     if (version == AIFF_C_VERSION1) {
111         codec->codec_tag = avio_rl32(pb);
112         codec->codec_id  = ff_codec_get_id(ff_codec_aiff_tags, codec->codec_tag);
113
114         switch (codec->codec_id) {
115         case CODEC_ID_PCM_S16BE:
116             codec->codec_id = aiff_codec_get_id(codec->bits_per_coded_sample);
117             codec->bits_per_coded_sample = av_get_bits_per_sample(codec->codec_id);
118             break;
119         case CODEC_ID_ADPCM_IMA_QT:
120             codec->block_align = 34*codec->channels;
121             codec->frame_size = 64;
122             break;
123         case CODEC_ID_MACE3:
124             codec->block_align = 2*codec->channels;
125             codec->frame_size = 6;
126             break;
127         case CODEC_ID_MACE6:
128             codec->block_align = 1*codec->channels;
129             codec->frame_size = 6;
130             break;
131         case CODEC_ID_GSM:
132             codec->block_align = 33;
133             codec->frame_size = 160;
134             break;
135         case CODEC_ID_QCELP:
136             codec->block_align = 35;
137             codec->frame_size= 160;
138             break;
139         default:
140             break;
141         }
142         size -= 4;
143     } else {
144         /* Need the codec type */
145         codec->codec_id = aiff_codec_get_id(codec->bits_per_coded_sample);
146         codec->bits_per_coded_sample = av_get_bits_per_sample(codec->codec_id);
147     }
148
149     /* Block align needs to be computed in all cases, as the definition
150      * is specific to applications -> here we use the WAVE format definition */
151     if (!codec->block_align)
152         codec->block_align = (codec->bits_per_coded_sample * codec->channels) >> 3;
153
154     codec->bit_rate = (codec->frame_size ? codec->sample_rate/codec->frame_size :
155                        codec->sample_rate) * (codec->block_align << 3);
156
157     /* Chunk is over */
158     if (size)
159         avio_skip(pb, size);
160
161     return num_frames;
162 }
163
164 static int aiff_probe(AVProbeData *p)
165 {
166     /* check file header */
167     if (p->buf[0] == 'F' && p->buf[1] == 'O' &&
168         p->buf[2] == 'R' && p->buf[3] == 'M' &&
169         p->buf[8] == 'A' && p->buf[9] == 'I' &&
170         p->buf[10] == 'F' && (p->buf[11] == 'F' || p->buf[11] == 'C'))
171         return AVPROBE_SCORE_MAX;
172     else
173         return 0;
174 }
175
176 /* aiff input */
177 static int aiff_read_header(AVFormatContext *s)
178 {
179     int size, filesize;
180     int64_t offset = 0;
181     uint32_t tag;
182     unsigned version = AIFF_C_VERSION1;
183     AVIOContext *pb = s->pb;
184     AVStream * st;
185     AIFFInputContext *aiff = s->priv_data;
186
187     /* check FORM header */
188     filesize = get_tag(pb, &tag);
189     if (filesize < 0 || tag != MKTAG('F', 'O', 'R', 'M'))
190         return AVERROR_INVALIDDATA;
191
192     /* AIFF data type */
193     tag = avio_rl32(pb);
194     if (tag == MKTAG('A', 'I', 'F', 'F'))       /* Got an AIFF file */
195         version = AIFF;
196     else if (tag != MKTAG('A', 'I', 'F', 'C'))  /* An AIFF-C file then */
197         return AVERROR_INVALIDDATA;
198
199     filesize -= 4;
200
201     st = avformat_new_stream(s, NULL);
202     if (!st)
203         return AVERROR(ENOMEM);
204
205     while (filesize > 0) {
206         /* parse different chunks */
207         size = get_tag(pb, &tag);
208         if (size < 0)
209             return size;
210
211         filesize -= size + 8;
212
213         switch (tag) {
214         case MKTAG('C', 'O', 'M', 'M'):     /* Common chunk */
215             /* Then for the complete header info */
216             st->nb_frames = get_aiff_header(pb, st->codec, size, version);
217             if (st->nb_frames < 0)
218                 return st->nb_frames;
219             if (offset > 0) // COMM is after SSND
220                 goto got_sound;
221             break;
222         case MKTAG('F', 'V', 'E', 'R'):     /* Version chunk */
223             version = avio_rb32(pb);
224             break;
225         case MKTAG('N', 'A', 'M', 'E'):     /* Sample name chunk */
226             get_meta(s, "title"    , size);
227             break;
228         case MKTAG('A', 'U', 'T', 'H'):     /* Author chunk */
229             get_meta(s, "author"   , size);
230             break;
231         case MKTAG('(', 'c', ')', ' '):     /* Copyright chunk */
232             get_meta(s, "copyright", size);
233             break;
234         case MKTAG('A', 'N', 'N', 'O'):     /* Annotation chunk */
235             get_meta(s, "comment"  , size);
236             break;
237         case MKTAG('S', 'S', 'N', 'D'):     /* Sampled sound chunk */
238             aiff->data_end = avio_tell(pb) + size;
239             offset = avio_rb32(pb);      /* Offset of sound data */
240             avio_rb32(pb);               /* BlockSize... don't care */
241             offset += avio_tell(pb);    /* Compute absolute data offset */
242             if (st->codec->block_align)    /* Assume COMM already parsed */
243                 goto got_sound;
244             if (!pb->seekable) {
245                 av_log(s, AV_LOG_ERROR, "file is not seekable\n");
246                 return -1;
247             }
248             avio_skip(pb, size - 8);
249             break;
250         case MKTAG('w', 'a', 'v', 'e'):
251             if ((uint64_t)size > (1<<30))
252                 return -1;
253             st->codec->extradata = av_mallocz(size + FF_INPUT_BUFFER_PADDING_SIZE);
254             if (!st->codec->extradata)
255                 return AVERROR(ENOMEM);
256             st->codec->extradata_size = size;
257             avio_read(pb, st->codec->extradata, size);
258             break;
259         default: /* Jump */
260             if (size & 1)   /* Always even aligned */
261                 size++;
262             avio_skip(pb, size);
263         }
264     }
265
266 got_sound:
267     if (!st->codec->block_align) {
268         av_log(s, AV_LOG_ERROR, "could not find COMM tag or invalid block_align value\n");
269         return -1;
270     }
271
272     /* Now positioned, get the sound data start and end */
273     avpriv_set_pts_info(st, 64, 1, st->codec->sample_rate);
274     st->start_time = 0;
275     st->duration = st->codec->frame_size ?
276         st->nb_frames * st->codec->frame_size : st->nb_frames;
277
278     /* Position the stream at the first block */
279     avio_seek(pb, offset, SEEK_SET);
280
281     return 0;
282 }
283
284 #define MAX_SIZE 4096
285
286 static int aiff_read_packet(AVFormatContext *s,
287                             AVPacket *pkt)
288 {
289     AVStream *st = s->streams[0];
290     AIFFInputContext *aiff = s->priv_data;
291     int64_t max_size;
292     int res, size;
293
294     /* calculate size of remaining data */
295     max_size = aiff->data_end - avio_tell(s->pb);
296     if (max_size <= 0)
297         return AVERROR_EOF;
298
299     /* Now for that packet */
300     if (st->codec->block_align >= 33) // GSM, QCLP, IMA4
301         size = st->codec->block_align;
302     else
303         size = (MAX_SIZE / st->codec->block_align) * st->codec->block_align;
304     size = FFMIN(max_size, size);
305     res = av_get_packet(s->pb, pkt, size);
306     if (res < 0)
307         return res;
308
309     /* Only one stream in an AIFF file */
310     pkt->stream_index = 0;
311     return 0;
312 }
313
314 AVInputFormat ff_aiff_demuxer = {
315     .name           = "aiff",
316     .long_name      = NULL_IF_CONFIG_SMALL("Audio IFF"),
317     .priv_data_size = sizeof(AIFFInputContext),
318     .read_probe     = aiff_probe,
319     .read_header    = aiff_read_header,
320     .read_packet    = aiff_read_packet,
321     .read_seek      = ff_pcm_read_seek,
322     .codec_tag= (const AVCodecTag* const []){ff_codec_aiff_tags, 0},
323 };