]> git.sesse.net Git - ffmpeg/blob - libavformat/wav.c
seek support
[ffmpeg] / libavformat / wav.c
1 /* 
2  * WAV encoder and decoder
3  * Copyright (c) 2001, 2002 Fabrice Bellard.
4  *
5  * This library is free software; you can redistribute it and/or
6  * modify it under the terms of the GNU Lesser General Public
7  * License as published by the Free Software Foundation; either
8  * version 2 of the License, or (at your option) any later version.
9  *
10  * This library is distributed in the hope that it will be useful,
11  * but WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * Lesser General Public License for more details.
14  *
15  * You should have received a copy of the GNU Lesser General Public
16  * License along with this library; if not, write to the Free Software
17  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18  */
19 #include "avformat.h"
20 #include "avi.h"
21
22 const CodecTag codec_wav_tags[] = {
23     { CODEC_ID_MP2, 0x50 },
24     { CODEC_ID_MP3, 0x55 },
25     { CODEC_ID_AC3, 0x2000 },
26     { CODEC_ID_PCM_S16LE, 0x01 },
27     { CODEC_ID_PCM_U8, 0x01 }, /* must come after s16le in this list */
28     { CODEC_ID_PCM_ALAW, 0x06 },
29     { CODEC_ID_PCM_MULAW, 0x07 },
30     { CODEC_ID_ADPCM_MS, 0x02 },
31     { CODEC_ID_ADPCM_IMA_WAV, 0x11 },
32     { CODEC_ID_ADPCM_IMA_DK4, 0x61 },  /* rogue format number */
33     { CODEC_ID_ADPCM_IMA_DK3, 0x62 },  /* rogue format number */
34     { CODEC_ID_WMAV1, 0x160 },
35     { CODEC_ID_WMAV2, 0x161 },
36     { 0, 0 },
37 };
38
39 #ifdef CONFIG_ENCODERS
40 /* WAVEFORMATEX header */
41 /* returns the size or -1 on error */
42 int put_wav_header(ByteIOContext *pb, AVCodecContext *enc)
43 {
44     int bps, blkalign, bytespersec;
45     int hdrsize = 18;
46
47     if(!enc->codec_tag)
48        enc->codec_tag = codec_get_tag(codec_wav_tags, enc->codec_id);
49     if(!enc->codec_tag)
50         return -1;
51
52     put_le16(pb, enc->codec_tag);
53     put_le16(pb, enc->channels);
54     put_le32(pb, enc->sample_rate);
55     if (enc->codec_id == CODEC_ID_PCM_U8 ||
56         enc->codec_id == CODEC_ID_PCM_ALAW ||
57         enc->codec_id == CODEC_ID_PCM_MULAW) {
58         bps = 8;
59     } else if (enc->codec_id == CODEC_ID_MP2 || enc->codec_id == CODEC_ID_MP3) {
60         bps = 0;
61     } else if (enc->codec_id == CODEC_ID_ADPCM_IMA_WAV || enc->codec_id == CODEC_ID_ADPCM_MS) {
62         bps = 4;
63     } else {
64         bps = 16;
65     }
66     
67     if (enc->codec_id == CODEC_ID_MP2 || enc->codec_id == CODEC_ID_MP3) {
68         blkalign = 1;
69         //blkalign = 144 * enc->bit_rate/enc->sample_rate;
70     } else if (enc->block_align != 0) { /* specified by the codec */
71         blkalign = enc->block_align;
72     } else
73         blkalign = enc->channels*bps >> 3;
74     if (enc->codec_id == CODEC_ID_PCM_U8 ||
75         enc->codec_id == CODEC_ID_PCM_S16LE) {
76         bytespersec = enc->sample_rate * blkalign;
77     } else {
78         bytespersec = enc->bit_rate / 8;
79     }
80     put_le32(pb, bytespersec); /* bytes per second */
81     put_le16(pb, blkalign); /* block align */
82     put_le16(pb, bps); /* bits per sample */
83     if (enc->codec_id == CODEC_ID_MP3) {
84         put_le16(pb, 12); /* wav_extra_size */
85         hdrsize += 12;
86         put_le16(pb, 1); /* wID */
87         put_le32(pb, 2); /* fdwFlags */
88         put_le16(pb, 1152); /* nBlockSize */
89         put_le16(pb, 1); /* nFramesPerBlock */
90         put_le16(pb, 1393); /* nCodecDelay */
91     } else if (enc->codec_id == CODEC_ID_MP2) {
92         put_le16(pb, 22); /* wav_extra_size */
93         hdrsize += 22;
94         put_le16(pb, 2);  /* fwHeadLayer */
95         put_le32(pb, enc->bit_rate); /* dwHeadBitrate */
96         put_le16(pb, enc->channels == 2 ? 1 : 8); /* fwHeadMode */
97         put_le16(pb, 0);  /* fwHeadModeExt */
98         put_le16(pb, 1);  /* wHeadEmphasis */
99         put_le16(pb, 16); /* fwHeadFlags */
100         put_le32(pb, 0);  /* dwPTSLow */
101         put_le32(pb, 0);  /* dwPTSHigh */
102     } else if (enc->codec_id == CODEC_ID_ADPCM_IMA_WAV) {
103         put_le16(pb, 2); /* wav_extra_size */
104         put_le16(pb, ((enc->block_align - 4 * enc->channels) / (4 * enc->channels)) * 8 + 1); /* wSamplesPerBlock */
105     } else
106         put_le16(pb, 0); /* wav_extra_size */
107
108     return hdrsize;
109 }
110 #endif //CONFIG_ENCODERS
111
112 /* We could be given one of the three possible structures here:
113  * WAVEFORMAT, PCMWAVEFORMAT or WAVEFORMATEX. Each structure
114  * is an expansion of the previous one with the fields added
115  * at the bottom. PCMWAVEFORMAT adds 'WORD wBitsPerSample' and
116  * WAVEFORMATEX adds 'WORD  cbSize' and basically makes itself
117  * an openended structure.
118  */
119 void get_wav_header(ByteIOContext *pb, AVCodecContext *codec, int size) 
120 {
121     int id;
122
123     id = get_le16(pb);
124     codec->codec_type = CODEC_TYPE_AUDIO;
125     codec->codec_tag = id;
126     codec->channels = get_le16(pb);
127     codec->sample_rate = get_le32(pb);
128     codec->bit_rate = get_le32(pb) * 8;
129     codec->block_align = get_le16(pb);
130     if (size == 14) {  /* We're dealing with plain vanilla WAVEFORMAT */
131         codec->bits_per_sample = 8;
132     }else
133         codec->bits_per_sample = get_le16(pb);
134     codec->codec_id = wav_codec_get_id(id, codec->bits_per_sample);
135     
136     if (size > 16) {  /* We're obviously dealing with WAVEFORMATEX */
137         codec->extradata_size = get_le16(pb);
138         if (codec->extradata_size > 0) {
139             if (codec->extradata_size > size - 18)
140                 codec->extradata_size = size - 18;
141             codec->extradata = av_mallocz(codec->extradata_size);
142             get_buffer(pb, codec->extradata, codec->extradata_size);
143         } else
144             codec->extradata_size = 0;
145         
146         /* It is possible for the chunk to contain garbage at the end */
147         if (size - codec->extradata_size - 18 > 0)
148             url_fskip(pb, size - codec->extradata_size - 18);
149     }
150 }
151
152
153 int wav_codec_get_id(unsigned int tag, int bps)
154 {
155     int id;
156     id = codec_get_id(codec_wav_tags, tag);
157     if (id <= 0)
158         return id;
159     /* handle specific u8 codec */
160     if (id == CODEC_ID_PCM_S16LE && bps == 8)
161         id = CODEC_ID_PCM_U8;
162     return id;
163 }
164
165 #ifdef CONFIG_ENCODERS
166 typedef struct {
167     offset_t data;
168 } WAVContext;
169
170 static int wav_write_header(AVFormatContext *s)
171 {
172     WAVContext *wav = s->priv_data;
173     ByteIOContext *pb = &s->pb;
174     offset_t fmt;
175
176     put_tag(pb, "RIFF");
177     put_le32(pb, 0); /* file length */
178     put_tag(pb, "WAVE");
179
180     /* format header */
181     fmt = start_tag(pb, "fmt ");
182     if (put_wav_header(pb, &s->streams[0]->codec) < 0) {
183         av_free(wav);
184         return -1;
185     }
186     end_tag(pb, fmt);
187
188     /* data header */
189     wav->data = start_tag(pb, "data");
190     
191     put_flush_packet(pb);
192
193     return 0;
194 }
195
196 static int wav_write_packet(AVFormatContext *s, int stream_index_ptr,
197                             const uint8_t *buf, int size, int64_t pts)
198 {
199     ByteIOContext *pb = &s->pb;
200     put_buffer(pb, buf, size);
201     return 0;
202 }
203
204 static int wav_write_trailer(AVFormatContext *s)
205 {
206     ByteIOContext *pb = &s->pb;
207     WAVContext *wav = s->priv_data;
208     offset_t file_size;
209
210     if (!url_is_streamed(&s->pb)) {
211         end_tag(pb, wav->data);
212
213         /* update file size */
214         file_size = url_ftell(pb);
215         url_fseek(pb, 4, SEEK_SET);
216         put_le32(pb, (uint32_t)(file_size - 8));
217         url_fseek(pb, file_size, SEEK_SET);
218
219         put_flush_packet(pb);
220     }
221     return 0;
222 }
223 #endif //CONFIG_ENCODERS
224
225 /* return the size of the found tag */
226 /* XXX: > 2GB ? */
227 static int find_tag(ByteIOContext *pb, uint32_t tag1)
228 {
229     unsigned int tag;
230     int size;
231
232     for(;;) {
233         if (url_feof(pb))
234             return -1;
235         tag = get_le32(pb);
236         size = get_le32(pb);
237         if (tag == tag1)
238             break;
239         url_fseek(pb, size, SEEK_CUR);
240     }
241     if (size < 0)
242         size = 0x7fffffff;
243     return size;
244 }
245
246 static int wav_probe(AVProbeData *p)
247 {
248     /* check file header */
249     if (p->buf_size <= 32)
250         return 0;
251     if (p->buf[0] == 'R' && p->buf[1] == 'I' &&
252         p->buf[2] == 'F' && p->buf[3] == 'F' &&
253         p->buf[8] == 'W' && p->buf[9] == 'A' &&
254         p->buf[10] == 'V' && p->buf[11] == 'E')
255         return AVPROBE_SCORE_MAX;
256     else
257         return 0;
258 }
259
260 /* wav input */
261 static int wav_read_header(AVFormatContext *s,
262                            AVFormatParameters *ap)
263 {
264     int size;
265     unsigned int tag;
266     ByteIOContext *pb = &s->pb;
267     AVStream *st;
268
269     /* check RIFF header */
270     tag = get_le32(pb);
271
272     if (tag != MKTAG('R', 'I', 'F', 'F'))
273         return -1;
274     get_le32(pb); /* file size */
275     tag = get_le32(pb);
276     if (tag != MKTAG('W', 'A', 'V', 'E'))
277         return -1;
278     
279     /* parse fmt header */
280     size = find_tag(pb, MKTAG('f', 'm', 't', ' '));
281     if (size < 0)
282         return -1;
283     st = av_new_stream(s, 0);
284     if (!st)
285         return AVERROR_NOMEM;
286
287     get_wav_header(pb, &st->codec, size);
288     st->need_parsing = 1;
289     
290     size = find_tag(pb, MKTAG('d', 'a', 't', 'a'));
291     if (size < 0)
292         return -1;
293     return 0;
294 }
295
296 #define MAX_SIZE 4096
297
298 static int wav_read_packet(AVFormatContext *s,
299                            AVPacket *pkt)
300 {
301     int ret, size;
302     AVStream *st;
303
304     if (url_feof(&s->pb))
305         return -EIO;
306     st = s->streams[0];
307
308     size = MAX_SIZE;
309     if (st->codec.block_align > 1) {
310         if (size < st->codec.block_align)
311             size = st->codec.block_align;
312         size = (size / st->codec.block_align) * st->codec.block_align;
313     }
314     if (av_new_packet(pkt, size))
315         return -EIO;
316     pkt->stream_index = 0;
317
318     ret = get_buffer(&s->pb, pkt->data, pkt->size);
319     if (ret < 0)
320         av_free_packet(pkt);
321     /* note: we need to modify the packet size here to handle the last
322        packet */
323     pkt->size = ret;
324     return ret;
325 }
326
327 static int wav_read_close(AVFormatContext *s)
328 {
329     return 0;
330 }
331
332 static int wav_read_seek(AVFormatContext *s, 
333                          int stream_index, int64_t timestamp)
334 {
335     AVStream *st;
336
337     st = s->streams[0];
338     switch(st->codec.codec_id) {
339     case CODEC_ID_MP2:
340     case CODEC_ID_MP3:
341     case CODEC_ID_AC3:
342         /* use generic seeking with dynamically generated indexes */
343         return -1;
344     default:
345         break;
346     }
347     return pcm_read_seek(s, stream_index, timestamp);
348 }
349
350
351 static AVInputFormat wav_iformat = {
352     "wav",
353     "wav format",
354     0,
355     wav_probe,
356     wav_read_header,
357     wav_read_packet,
358     wav_read_close,
359     wav_read_seek,
360 };
361
362 #ifdef CONFIG_ENCODERS
363 static AVOutputFormat wav_oformat = {
364     "wav",
365     "wav format",
366     "audio/x-wav",
367     "wav",
368     sizeof(WAVContext),
369     CODEC_ID_PCM_S16LE,
370     CODEC_ID_NONE,
371     wav_write_header,
372     wav_write_packet,
373     wav_write_trailer,
374 };
375 #endif //CONFIG_ENCODERS
376
377 int wav_init(void)
378 {
379     av_register_input_format(&wav_iformat);
380 #ifdef CONFIG_ENCODERS
381     av_register_output_format(&wav_oformat);
382 #endif //CONFIG_ENCODERS
383     return 0;
384 }