]> git.sesse.net Git - ffmpeg/blob - libavformat/wav.c
flags and named constants with type checking of course for AVOption
[ffmpeg] / libavformat / wav.c
1 /* 
2  * WAV encoder and decoder
3  * Copyright (c) 2001, 2002 Fabrice Bellard.
4  *
5  * This library is free software; you can redistribute it and/or
6  * modify it under the terms of the GNU Lesser General Public
7  * License as published by the Free Software Foundation; either
8  * version 2 of the License, or (at your option) any later version.
9  *
10  * This library is distributed in the hope that it will be useful,
11  * but WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * Lesser General Public License for more details.
14  *
15  * You should have received a copy of the GNU Lesser General Public
16  * License along with this library; if not, write to the Free Software
17  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18  */
19 #include "avformat.h"
20 #include "avi.h"
21
22 const CodecTag codec_wav_tags[] = {
23     { CODEC_ID_MP2, 0x50 },
24     { CODEC_ID_MP3, 0x55 },
25     { CODEC_ID_AC3, 0x2000 },
26     { CODEC_ID_PCM_S16LE, 0x01 },
27     { CODEC_ID_PCM_U8, 0x01 }, /* must come after s16le in this list */
28     { CODEC_ID_PCM_S24LE, 0x01 },
29     { CODEC_ID_PCM_S32LE, 0x01 },
30     { CODEC_ID_PCM_ALAW, 0x06 },
31     { CODEC_ID_PCM_MULAW, 0x07 },
32     { CODEC_ID_ADPCM_MS, 0x02 },
33     { CODEC_ID_ADPCM_IMA_WAV, 0x11 },
34     { CODEC_ID_ADPCM_YAMAHA, 0x20 },
35     { CODEC_ID_ADPCM_G726, 0x45 },
36     { CODEC_ID_ADPCM_IMA_DK4, 0x61 },  /* rogue format number */
37     { CODEC_ID_ADPCM_IMA_DK3, 0x62 },  /* rogue format number */
38     { CODEC_ID_WMAV1, 0x160 },
39     { CODEC_ID_WMAV2, 0x161 },
40     { CODEC_ID_AAC, 0x706d },
41     { CODEC_ID_VORBIS, ('V'<<8)+'o' }, //HACK/FIXME, does vorbis in WAV/AVI have an (in)official id?
42     { CODEC_ID_SONIC, 0x2048 },
43     { CODEC_ID_SONIC_LS, 0x2048 },
44     { CODEC_ID_ADPCM_CT, 0x200 },
45     { CODEC_ID_ADPCM_SWF, ('S'<<8)+'F' },
46     { 0, 0 },
47 };
48
49 #ifdef CONFIG_ENCODERS
50 /* WAVEFORMATEX header */
51 /* returns the size or -1 on error */
52 int put_wav_header(ByteIOContext *pb, AVCodecContext *enc)
53 {
54     int bps, blkalign, bytespersec;
55     int hdrsize = 18;
56
57     if(!enc->codec_tag)
58        enc->codec_tag = codec_get_tag(codec_wav_tags, enc->codec_id);
59     if(!enc->codec_tag)
60         return -1;
61
62     put_le16(pb, enc->codec_tag);
63     put_le16(pb, enc->channels);
64     put_le32(pb, enc->sample_rate);
65     if (enc->codec_id == CODEC_ID_PCM_U8 ||
66         enc->codec_id == CODEC_ID_PCM_ALAW ||
67         enc->codec_id == CODEC_ID_PCM_MULAW) {
68         bps = 8;
69     } else if (enc->codec_id == CODEC_ID_MP2 || enc->codec_id == CODEC_ID_MP3) {
70         bps = 0;
71     } else if (enc->codec_id == CODEC_ID_ADPCM_IMA_WAV || enc->codec_id == CODEC_ID_ADPCM_MS || enc->codec_id == CODEC_ID_ADPCM_G726 || enc->codec_id == CODEC_ID_ADPCM_YAMAHA) { //
72         bps = 4;
73     } else if (enc->codec_id == CODEC_ID_PCM_S24LE) {
74         bps = 24;
75     } else if (enc->codec_id == CODEC_ID_PCM_S32LE) {
76         bps = 32;
77     } else {
78         bps = 16;
79     }
80     
81     if (enc->codec_id == CODEC_ID_MP2 || enc->codec_id == CODEC_ID_MP3) {
82         blkalign = enc->frame_size; //this is wrong, but seems many demuxers dont work if this is set correctly
83         //blkalign = 144 * enc->bit_rate/enc->sample_rate;
84     } else if (enc->codec_id == CODEC_ID_ADPCM_G726) { //
85         blkalign = 1;
86     } else if (enc->block_align != 0) { /* specified by the codec */
87         blkalign = enc->block_align;
88     } else
89         blkalign = enc->channels*bps >> 3;
90     if (enc->codec_id == CODEC_ID_PCM_U8 ||
91         enc->codec_id == CODEC_ID_PCM_S24LE ||
92         enc->codec_id == CODEC_ID_PCM_S32LE ||
93         enc->codec_id == CODEC_ID_PCM_S16LE) {
94         bytespersec = enc->sample_rate * blkalign;
95     } else {
96         bytespersec = enc->bit_rate / 8;
97     }
98     put_le32(pb, bytespersec); /* bytes per second */
99     put_le16(pb, blkalign); /* block align */
100     put_le16(pb, bps); /* bits per sample */
101     if (enc->codec_id == CODEC_ID_MP3) {
102         put_le16(pb, 12); /* wav_extra_size */
103         hdrsize += 12;
104         put_le16(pb, 1); /* wID */
105         put_le32(pb, 2); /* fdwFlags */
106         put_le16(pb, 1152); /* nBlockSize */
107         put_le16(pb, 1); /* nFramesPerBlock */
108         put_le16(pb, 1393); /* nCodecDelay */
109     } else if (enc->codec_id == CODEC_ID_MP2) {
110         put_le16(pb, 22); /* wav_extra_size */
111         hdrsize += 22;
112         put_le16(pb, 2);  /* fwHeadLayer */
113         put_le32(pb, enc->bit_rate); /* dwHeadBitrate */
114         put_le16(pb, enc->channels == 2 ? 1 : 8); /* fwHeadMode */
115         put_le16(pb, 0);  /* fwHeadModeExt */
116         put_le16(pb, 1);  /* wHeadEmphasis */
117         put_le16(pb, 16); /* fwHeadFlags */
118         put_le32(pb, 0);  /* dwPTSLow */
119         put_le32(pb, 0);  /* dwPTSHigh */
120     } else if (enc->codec_id == CODEC_ID_ADPCM_IMA_WAV) {
121         put_le16(pb, 2); /* wav_extra_size */
122         hdrsize += 2;
123         put_le16(pb, ((enc->block_align - 4 * enc->channels) / (4 * enc->channels)) * 8 + 1); /* wSamplesPerBlock */
124     } else if(enc->extradata_size){
125         put_le16(pb, enc->extradata_size);
126         put_buffer(pb, enc->extradata, enc->extradata_size);
127         hdrsize += enc->extradata_size;
128         if(hdrsize&1){
129             hdrsize++;
130             put_byte(pb, 0);
131         }
132     } else {
133         hdrsize -= 2;
134     }
135
136     return hdrsize;
137 }
138 #endif //CONFIG_ENCODERS
139
140 /* We could be given one of the three possible structures here:
141  * WAVEFORMAT, PCMWAVEFORMAT or WAVEFORMATEX. Each structure
142  * is an expansion of the previous one with the fields added
143  * at the bottom. PCMWAVEFORMAT adds 'WORD wBitsPerSample' and
144  * WAVEFORMATEX adds 'WORD  cbSize' and basically makes itself
145  * an openended structure.
146  */
147 void get_wav_header(ByteIOContext *pb, AVCodecContext *codec, int size) 
148 {
149     int id;
150
151     id = get_le16(pb);
152     codec->codec_type = CODEC_TYPE_AUDIO;
153     codec->codec_tag = id;
154     codec->channels = get_le16(pb);
155     codec->sample_rate = get_le32(pb);
156     codec->bit_rate = get_le32(pb) * 8;
157     codec->block_align = get_le16(pb);
158     if (size == 14) {  /* We're dealing with plain vanilla WAVEFORMAT */
159         codec->bits_per_sample = 8;
160     }else
161         codec->bits_per_sample = get_le16(pb);
162     codec->codec_id = wav_codec_get_id(id, codec->bits_per_sample);
163     
164     if (size > 16) {  /* We're obviously dealing with WAVEFORMATEX */
165         codec->extradata_size = get_le16(pb);
166         if (codec->extradata_size > 0) {
167             if (codec->extradata_size > size - 18)
168                 codec->extradata_size = size - 18;
169             codec->extradata = av_mallocz(codec->extradata_size + FF_INPUT_BUFFER_PADDING_SIZE);
170             get_buffer(pb, codec->extradata, codec->extradata_size);
171         } else
172             codec->extradata_size = 0;
173         
174         /* It is possible for the chunk to contain garbage at the end */
175         if (size - codec->extradata_size - 18 > 0)
176             url_fskip(pb, size - codec->extradata_size - 18);
177     }
178 }
179
180
181 int wav_codec_get_id(unsigned int tag, int bps)
182 {
183     int id;
184     id = codec_get_id(codec_wav_tags, tag);
185     if (id <= 0)
186         return id;
187     /* handle specific u8 codec */
188     if (id == CODEC_ID_PCM_S16LE && bps == 8)
189         id = CODEC_ID_PCM_U8;
190     if (id == CODEC_ID_PCM_S16LE && bps == 24)
191         id = CODEC_ID_PCM_S24LE;
192     if (id == CODEC_ID_PCM_S16LE && bps == 32)
193         id = CODEC_ID_PCM_S32LE;
194     return id;
195 }
196
197 #ifdef CONFIG_ENCODERS
198 typedef struct {
199     offset_t data;
200 } WAVContext;
201
202 static int wav_write_header(AVFormatContext *s)
203 {
204     WAVContext *wav = s->priv_data;
205     ByteIOContext *pb = &s->pb;
206     offset_t fmt;
207
208     put_tag(pb, "RIFF");
209     put_le32(pb, 0); /* file length */
210     put_tag(pb, "WAVE");
211
212     /* format header */
213     fmt = start_tag(pb, "fmt ");
214     if (put_wav_header(pb, s->streams[0]->codec) < 0) {
215         av_free(wav);
216         return -1;
217     }
218     end_tag(pb, fmt);
219
220     av_set_pts_info(s->streams[0], 64, 1, s->streams[0]->codec->sample_rate);
221
222     /* data header */
223     wav->data = start_tag(pb, "data");
224     
225     put_flush_packet(pb);
226
227     return 0;
228 }
229
230 static int wav_write_packet(AVFormatContext *s, AVPacket *pkt)
231 {
232     ByteIOContext *pb = &s->pb;
233     put_buffer(pb, pkt->data, pkt->size);
234     return 0;
235 }
236
237 static int wav_write_trailer(AVFormatContext *s)
238 {
239     ByteIOContext *pb = &s->pb;
240     WAVContext *wav = s->priv_data;
241     offset_t file_size;
242
243     if (!url_is_streamed(&s->pb)) {
244         end_tag(pb, wav->data);
245
246         /* update file size */
247         file_size = url_ftell(pb);
248         url_fseek(pb, 4, SEEK_SET);
249         put_le32(pb, (uint32_t)(file_size - 8));
250         url_fseek(pb, file_size, SEEK_SET);
251
252         put_flush_packet(pb);
253     }
254     return 0;
255 }
256 #endif //CONFIG_ENCODERS
257
258 /* return the size of the found tag */
259 /* XXX: > 2GB ? */
260 static int find_tag(ByteIOContext *pb, uint32_t tag1)
261 {
262     unsigned int tag;
263     int size;
264
265     for(;;) {
266         if (url_feof(pb))
267             return -1;
268         tag = get_le32(pb);
269         size = get_le32(pb);
270         if (tag == tag1)
271             break;
272         url_fseek(pb, size, SEEK_CUR);
273     }
274     if (size < 0)
275         size = 0x7fffffff;
276     return size;
277 }
278
279 static int wav_probe(AVProbeData *p)
280 {
281     /* check file header */
282     if (p->buf_size <= 32)
283         return 0;
284     if (p->buf[0] == 'R' && p->buf[1] == 'I' &&
285         p->buf[2] == 'F' && p->buf[3] == 'F' &&
286         p->buf[8] == 'W' && p->buf[9] == 'A' &&
287         p->buf[10] == 'V' && p->buf[11] == 'E')
288         return AVPROBE_SCORE_MAX;
289     else
290         return 0;
291 }
292
293 /* wav input */
294 static int wav_read_header(AVFormatContext *s,
295                            AVFormatParameters *ap)
296 {
297     int size;
298     unsigned int tag;
299     ByteIOContext *pb = &s->pb;
300     AVStream *st;
301
302     /* check RIFF header */
303     tag = get_le32(pb);
304
305     if (tag != MKTAG('R', 'I', 'F', 'F'))
306         return -1;
307     get_le32(pb); /* file size */
308     tag = get_le32(pb);
309     if (tag != MKTAG('W', 'A', 'V', 'E'))
310         return -1;
311     
312     /* parse fmt header */
313     size = find_tag(pb, MKTAG('f', 'm', 't', ' '));
314     if (size < 0)
315         return -1;
316     st = av_new_stream(s, 0);
317     if (!st)
318         return AVERROR_NOMEM;
319
320     get_wav_header(pb, st->codec, size);
321     st->need_parsing = 1;
322
323     av_set_pts_info(st, 64, 1, st->codec->sample_rate);
324
325     size = find_tag(pb, MKTAG('d', 'a', 't', 'a'));
326     if (size < 0)
327         return -1;
328     return 0;
329 }
330
331 #define MAX_SIZE 4096
332
333 static int wav_read_packet(AVFormatContext *s,
334                            AVPacket *pkt)
335 {
336     int ret, size;
337     AVStream *st;
338
339     if (url_feof(&s->pb))
340         return AVERROR_IO;
341     st = s->streams[0];
342
343     size = MAX_SIZE;
344     if (st->codec->block_align > 1) {
345         if (size < st->codec->block_align)
346             size = st->codec->block_align;
347         size = (size / st->codec->block_align) * st->codec->block_align;
348     }
349     if (av_new_packet(pkt, size))
350         return AVERROR_IO;
351     pkt->stream_index = 0;
352
353     ret = get_buffer(&s->pb, pkt->data, pkt->size);
354     if (ret < 0)
355         av_free_packet(pkt);
356     /* note: we need to modify the packet size here to handle the last
357        packet */
358     pkt->size = ret;
359     return ret;
360 }
361
362 static int wav_read_close(AVFormatContext *s)
363 {
364     return 0;
365 }
366
367 static int wav_read_seek(AVFormatContext *s, 
368                          int stream_index, int64_t timestamp, int flags)
369 {
370     AVStream *st;
371
372     st = s->streams[0];
373     switch(st->codec->codec_id) {
374     case CODEC_ID_MP2:
375     case CODEC_ID_MP3:
376     case CODEC_ID_AC3:
377     case CODEC_ID_DTS:
378         /* use generic seeking with dynamically generated indexes */
379         return -1;
380     default:
381         break;
382     }
383     return pcm_read_seek(s, stream_index, timestamp, flags);
384 }
385
386
387 static AVInputFormat wav_iformat = {
388     "wav",
389     "wav format",
390     0,
391     wav_probe,
392     wav_read_header,
393     wav_read_packet,
394     wav_read_close,
395     wav_read_seek,
396 };
397
398 #ifdef CONFIG_ENCODERS
399 static AVOutputFormat wav_oformat = {
400     "wav",
401     "wav format",
402     "audio/x-wav",
403     "wav",
404     sizeof(WAVContext),
405     CODEC_ID_PCM_S16LE,
406     CODEC_ID_NONE,
407     wav_write_header,
408     wav_write_packet,
409     wav_write_trailer,
410 };
411 #endif //CONFIG_ENCODERS
412
413 int ff_wav_init(void)
414 {
415     av_register_input_format(&wav_iformat);
416 #ifdef CONFIG_ENCODERS
417     av_register_output_format(&wav_oformat);
418 #endif //CONFIG_ENCODERS
419     return 0;
420 }