]> git.sesse.net Git - ffmpeg/blob - libavformat/wav.c
fix global name conflicts patch by ("Ronald S. Bultje" <R dot S dot Bultje at student...
[ffmpeg] / libavformat / wav.c
1 /* 
2  * WAV encoder and decoder
3  * Copyright (c) 2001, 2002 Fabrice Bellard.
4  *
5  * This library is free software; you can redistribute it and/or
6  * modify it under the terms of the GNU Lesser General Public
7  * License as published by the Free Software Foundation; either
8  * version 2 of the License, or (at your option) any later version.
9  *
10  * This library is distributed in the hope that it will be useful,
11  * but WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * Lesser General Public License for more details.
14  *
15  * You should have received a copy of the GNU Lesser General Public
16  * License along with this library; if not, write to the Free Software
17  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18  */
19 #include "avformat.h"
20 #include "avi.h"
21
22 const CodecTag codec_wav_tags[] = {
23     { CODEC_ID_MP2, 0x50 },
24     { CODEC_ID_MP3, 0x55 },
25     { CODEC_ID_AC3, 0x2000 },
26     { CODEC_ID_PCM_S16LE, 0x01 },
27     { CODEC_ID_PCM_U8, 0x01 }, /* must come after s16le in this list */
28     { CODEC_ID_PCM_ALAW, 0x06 },
29     { CODEC_ID_PCM_MULAW, 0x07 },
30     { CODEC_ID_ADPCM_MS, 0x02 },
31     { CODEC_ID_ADPCM_IMA_WAV, 0x11 },
32     { CODEC_ID_ADPCM_G726, 0x45 },
33     { CODEC_ID_ADPCM_IMA_DK4, 0x61 },  /* rogue format number */
34     { CODEC_ID_ADPCM_IMA_DK3, 0x62 },  /* rogue format number */
35     { CODEC_ID_WMAV1, 0x160 },
36     { CODEC_ID_WMAV2, 0x161 },
37     { 0, 0 },
38 };
39
40 #ifdef CONFIG_ENCODERS
41 /* WAVEFORMATEX header */
42 /* returns the size or -1 on error */
43 int put_wav_header(ByteIOContext *pb, AVCodecContext *enc)
44 {
45     int bps, blkalign, bytespersec;
46     int hdrsize = 18;
47
48     if(!enc->codec_tag)
49        enc->codec_tag = codec_get_tag(codec_wav_tags, enc->codec_id);
50     if(!enc->codec_tag)
51         return -1;
52
53     put_le16(pb, enc->codec_tag);
54     put_le16(pb, enc->channels);
55     put_le32(pb, enc->sample_rate);
56     if (enc->codec_id == CODEC_ID_PCM_U8 ||
57         enc->codec_id == CODEC_ID_PCM_ALAW ||
58         enc->codec_id == CODEC_ID_PCM_MULAW) {
59         bps = 8;
60     } else if (enc->codec_id == CODEC_ID_MP2 || enc->codec_id == CODEC_ID_MP3) {
61         bps = 0;
62     } else if (enc->codec_id == CODEC_ID_ADPCM_IMA_WAV || enc->codec_id == CODEC_ID_ADPCM_MS) {
63         bps = 4;
64     } else {
65         bps = 16;
66     }
67     
68     if (enc->codec_id == CODEC_ID_MP2 || enc->codec_id == CODEC_ID_MP3) {
69         blkalign = 1;
70         //blkalign = 144 * enc->bit_rate/enc->sample_rate;
71     } else if (enc->block_align != 0) { /* specified by the codec */
72         blkalign = enc->block_align;
73     } else
74         blkalign = enc->channels*bps >> 3;
75     if (enc->codec_id == CODEC_ID_PCM_U8 ||
76         enc->codec_id == CODEC_ID_PCM_S16LE) {
77         bytespersec = enc->sample_rate * blkalign;
78     } else {
79         bytespersec = enc->bit_rate / 8;
80     }
81     put_le32(pb, bytespersec); /* bytes per second */
82     put_le16(pb, blkalign); /* block align */
83     put_le16(pb, bps); /* bits per sample */
84     if (enc->codec_id == CODEC_ID_MP3) {
85         put_le16(pb, 12); /* wav_extra_size */
86         hdrsize += 12;
87         put_le16(pb, 1); /* wID */
88         put_le32(pb, 2); /* fdwFlags */
89         put_le16(pb, 1152); /* nBlockSize */
90         put_le16(pb, 1); /* nFramesPerBlock */
91         put_le16(pb, 1393); /* nCodecDelay */
92     } else if (enc->codec_id == CODEC_ID_MP2) {
93         put_le16(pb, 22); /* wav_extra_size */
94         hdrsize += 22;
95         put_le16(pb, 2);  /* fwHeadLayer */
96         put_le32(pb, enc->bit_rate); /* dwHeadBitrate */
97         put_le16(pb, enc->channels == 2 ? 1 : 8); /* fwHeadMode */
98         put_le16(pb, 0);  /* fwHeadModeExt */
99         put_le16(pb, 1);  /* wHeadEmphasis */
100         put_le16(pb, 16); /* fwHeadFlags */
101         put_le32(pb, 0);  /* dwPTSLow */
102         put_le32(pb, 0);  /* dwPTSHigh */
103     } else if (enc->codec_id == CODEC_ID_ADPCM_IMA_WAV) {
104         put_le16(pb, 2); /* wav_extra_size */
105         hdrsize += 2;
106         put_le16(pb, ((enc->block_align - 4 * enc->channels) / (4 * enc->channels)) * 8 + 1); /* wSamplesPerBlock */
107     } else
108         put_le16(pb, 0); /* wav_extra_size */
109
110     return hdrsize;
111 }
112 #endif //CONFIG_ENCODERS
113
114 /* We could be given one of the three possible structures here:
115  * WAVEFORMAT, PCMWAVEFORMAT or WAVEFORMATEX. Each structure
116  * is an expansion of the previous one with the fields added
117  * at the bottom. PCMWAVEFORMAT adds 'WORD wBitsPerSample' and
118  * WAVEFORMATEX adds 'WORD  cbSize' and basically makes itself
119  * an openended structure.
120  */
121 void get_wav_header(ByteIOContext *pb, AVCodecContext *codec, int size) 
122 {
123     int id;
124
125     id = get_le16(pb);
126     codec->codec_type = CODEC_TYPE_AUDIO;
127     codec->codec_tag = id;
128     codec->channels = get_le16(pb);
129     codec->sample_rate = get_le32(pb);
130     codec->bit_rate = get_le32(pb) * 8;
131     codec->block_align = get_le16(pb);
132     if (size == 14) {  /* We're dealing with plain vanilla WAVEFORMAT */
133         codec->bits_per_sample = 8;
134     }else
135         codec->bits_per_sample = get_le16(pb);
136     codec->codec_id = wav_codec_get_id(id, codec->bits_per_sample);
137     
138     if (size > 16) {  /* We're obviously dealing with WAVEFORMATEX */
139         codec->extradata_size = get_le16(pb);
140         if (codec->extradata_size > 0) {
141             if (codec->extradata_size > size - 18)
142                 codec->extradata_size = size - 18;
143             codec->extradata = av_mallocz(codec->extradata_size);
144             get_buffer(pb, codec->extradata, codec->extradata_size);
145         } else
146             codec->extradata_size = 0;
147         
148         /* It is possible for the chunk to contain garbage at the end */
149         if (size - codec->extradata_size - 18 > 0)
150             url_fskip(pb, size - codec->extradata_size - 18);
151     }
152 }
153
154
155 int wav_codec_get_id(unsigned int tag, int bps)
156 {
157     int id;
158     id = codec_get_id(codec_wav_tags, tag);
159     if (id <= 0)
160         return id;
161     /* handle specific u8 codec */
162     if (id == CODEC_ID_PCM_S16LE && bps == 8)
163         id = CODEC_ID_PCM_U8;
164     return id;
165 }
166
167 #ifdef CONFIG_ENCODERS
168 typedef struct {
169     offset_t data;
170 } WAVContext;
171
172 static int wav_write_header(AVFormatContext *s)
173 {
174     WAVContext *wav = s->priv_data;
175     ByteIOContext *pb = &s->pb;
176     offset_t fmt;
177
178     put_tag(pb, "RIFF");
179     put_le32(pb, 0); /* file length */
180     put_tag(pb, "WAVE");
181
182     /* format header */
183     fmt = start_tag(pb, "fmt ");
184     if (put_wav_header(pb, &s->streams[0]->codec) < 0) {
185         av_free(wav);
186         return -1;
187     }
188     end_tag(pb, fmt);
189
190     /* data header */
191     wav->data = start_tag(pb, "data");
192     
193     put_flush_packet(pb);
194
195     return 0;
196 }
197
198 static int wav_write_packet(AVFormatContext *s, int stream_index_ptr,
199                             const uint8_t *buf, int size, int64_t pts)
200 {
201     ByteIOContext *pb = &s->pb;
202     put_buffer(pb, buf, size);
203     return 0;
204 }
205
206 static int wav_write_trailer(AVFormatContext *s)
207 {
208     ByteIOContext *pb = &s->pb;
209     WAVContext *wav = s->priv_data;
210     offset_t file_size;
211
212     if (!url_is_streamed(&s->pb)) {
213         end_tag(pb, wav->data);
214
215         /* update file size */
216         file_size = url_ftell(pb);
217         url_fseek(pb, 4, SEEK_SET);
218         put_le32(pb, (uint32_t)(file_size - 8));
219         url_fseek(pb, file_size, SEEK_SET);
220
221         put_flush_packet(pb);
222     }
223     return 0;
224 }
225 #endif //CONFIG_ENCODERS
226
227 /* return the size of the found tag */
228 /* XXX: > 2GB ? */
229 static int find_tag(ByteIOContext *pb, uint32_t tag1)
230 {
231     unsigned int tag;
232     int size;
233
234     for(;;) {
235         if (url_feof(pb))
236             return -1;
237         tag = get_le32(pb);
238         size = get_le32(pb);
239         if (tag == tag1)
240             break;
241         url_fseek(pb, size, SEEK_CUR);
242     }
243     if (size < 0)
244         size = 0x7fffffff;
245     return size;
246 }
247
248 static int wav_probe(AVProbeData *p)
249 {
250     /* check file header */
251     if (p->buf_size <= 32)
252         return 0;
253     if (p->buf[0] == 'R' && p->buf[1] == 'I' &&
254         p->buf[2] == 'F' && p->buf[3] == 'F' &&
255         p->buf[8] == 'W' && p->buf[9] == 'A' &&
256         p->buf[10] == 'V' && p->buf[11] == 'E')
257         return AVPROBE_SCORE_MAX;
258     else
259         return 0;
260 }
261
262 /* wav input */
263 static int wav_read_header(AVFormatContext *s,
264                            AVFormatParameters *ap)
265 {
266     int size;
267     unsigned int tag;
268     ByteIOContext *pb = &s->pb;
269     AVStream *st;
270
271     /* check RIFF header */
272     tag = get_le32(pb);
273
274     if (tag != MKTAG('R', 'I', 'F', 'F'))
275         return -1;
276     get_le32(pb); /* file size */
277     tag = get_le32(pb);
278     if (tag != MKTAG('W', 'A', 'V', 'E'))
279         return -1;
280     
281     /* parse fmt header */
282     size = find_tag(pb, MKTAG('f', 'm', 't', ' '));
283     if (size < 0)
284         return -1;
285     st = av_new_stream(s, 0);
286     if (!st)
287         return AVERROR_NOMEM;
288
289     get_wav_header(pb, &st->codec, size);
290     st->need_parsing = 1;
291     
292     size = find_tag(pb, MKTAG('d', 'a', 't', 'a'));
293     if (size < 0)
294         return -1;
295     return 0;
296 }
297
298 #define MAX_SIZE 4096
299
300 static int wav_read_packet(AVFormatContext *s,
301                            AVPacket *pkt)
302 {
303     int ret, size;
304     AVStream *st;
305
306     if (url_feof(&s->pb))
307         return -EIO;
308     st = s->streams[0];
309
310     size = MAX_SIZE;
311     if (st->codec.block_align > 1) {
312         if (size < st->codec.block_align)
313             size = st->codec.block_align;
314         size = (size / st->codec.block_align) * st->codec.block_align;
315     }
316     if (av_new_packet(pkt, size))
317         return -EIO;
318     pkt->stream_index = 0;
319
320     ret = get_buffer(&s->pb, pkt->data, pkt->size);
321     if (ret < 0)
322         av_free_packet(pkt);
323     /* note: we need to modify the packet size here to handle the last
324        packet */
325     pkt->size = ret;
326     return ret;
327 }
328
329 static int wav_read_close(AVFormatContext *s)
330 {
331     return 0;
332 }
333
334 static int wav_read_seek(AVFormatContext *s, 
335                          int stream_index, int64_t timestamp)
336 {
337     AVStream *st;
338
339     st = s->streams[0];
340     switch(st->codec.codec_id) {
341     case CODEC_ID_MP2:
342     case CODEC_ID_MP3:
343     case CODEC_ID_AC3:
344         /* use generic seeking with dynamically generated indexes */
345         return -1;
346     default:
347         break;
348     }
349     return pcm_read_seek(s, stream_index, timestamp);
350 }
351
352
353 static AVInputFormat wav_iformat = {
354     "wav",
355     "wav format",
356     0,
357     wav_probe,
358     wav_read_header,
359     wav_read_packet,
360     wav_read_close,
361     wav_read_seek,
362 };
363
364 #ifdef CONFIG_ENCODERS
365 static AVOutputFormat wav_oformat = {
366     "wav",
367     "wav format",
368     "audio/x-wav",
369     "wav",
370     sizeof(WAVContext),
371     CODEC_ID_PCM_S16LE,
372     CODEC_ID_NONE,
373     wav_write_header,
374     wav_write_packet,
375     wav_write_trailer,
376 };
377 #endif //CONFIG_ENCODERS
378
379 int ff_wav_init(void)
380 {
381     av_register_input_format(&wav_iformat);
382 #ifdef CONFIG_ENCODERS
383     av_register_output_format(&wav_oformat);
384 #endif //CONFIG_ENCODERS
385     return 0;
386 }