]> git.sesse.net Git - ffmpeg/blob - libavformat/wav.c
0bc3c3408be7bd0e11ebd2981096b5def7877ed9
[ffmpeg] / libavformat / wav.c
1 /* 
2  * WAV encoder and decoder
3  * Copyright (c) 2001, 2002 Fabrice Bellard.
4  *
5  * This library is free software; you can redistribute it and/or
6  * modify it under the terms of the GNU Lesser General Public
7  * License as published by the Free Software Foundation; either
8  * version 2 of the License, or (at your option) any later version.
9  *
10  * This library is distributed in the hope that it will be useful,
11  * but WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * Lesser General Public License for more details.
14  *
15  * You should have received a copy of the GNU Lesser General Public
16  * License along with this library; if not, write to the Free Software
17  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18  */
19 #include "avformat.h"
20 #include "avi.h"
21
22 const CodecTag codec_wav_tags[] = {
23     { CODEC_ID_MP2, 0x50 },
24     { CODEC_ID_MP3, 0x55 },
25     { CODEC_ID_AC3, 0x2000 },
26     { CODEC_ID_PCM_S16LE, 0x01 },
27     { CODEC_ID_PCM_U8, 0x01 }, /* must come after s16le in this list */
28     { CODEC_ID_PCM_ALAW, 0x06 },
29     { CODEC_ID_PCM_MULAW, 0x07 },
30     { CODEC_ID_ADPCM_MS, 0x02 },
31     { CODEC_ID_ADPCM_IMA_WAV, 0x11 },
32     { CODEC_ID_ADPCM_G726, 0x45 },
33     { CODEC_ID_ADPCM_IMA_DK4, 0x61 },  /* rogue format number */
34     { CODEC_ID_ADPCM_IMA_DK3, 0x62 },  /* rogue format number */
35     { CODEC_ID_WMAV1, 0x160 },
36     { CODEC_ID_WMAV2, 0x161 },
37     { CODEC_ID_AAC, 0x706d },
38     { CODEC_ID_VORBIS, ('V'<<8)+'o' }, //HACK/FIXME, does vorbis in WAV/AVI have an (in)official id?
39     { CODEC_ID_SONIC, 0x2048 },
40     { CODEC_ID_SONIC_LS, 0x2048 },
41     { 0, 0 },
42 };
43
44 #ifdef CONFIG_ENCODERS
45 /* WAVEFORMATEX header */
46 /* returns the size or -1 on error */
47 int put_wav_header(ByteIOContext *pb, AVCodecContext *enc)
48 {
49     int bps, blkalign, bytespersec;
50     int hdrsize = 18;
51
52     if(!enc->codec_tag)
53        enc->codec_tag = codec_get_tag(codec_wav_tags, enc->codec_id);
54     if(!enc->codec_tag)
55         return -1;
56
57     put_le16(pb, enc->codec_tag);
58     put_le16(pb, enc->channels);
59     put_le32(pb, enc->sample_rate);
60     if (enc->codec_id == CODEC_ID_PCM_U8 ||
61         enc->codec_id == CODEC_ID_PCM_ALAW ||
62         enc->codec_id == CODEC_ID_PCM_MULAW) {
63         bps = 8;
64     } else if (enc->codec_id == CODEC_ID_MP2 || enc->codec_id == CODEC_ID_MP3) {
65         bps = 0;
66     } else if (enc->codec_id == CODEC_ID_ADPCM_IMA_WAV || enc->codec_id == CODEC_ID_ADPCM_MS) {
67         bps = 4;
68     } else {
69         bps = 16;
70     }
71     
72     if (enc->codec_id == CODEC_ID_MP2 || enc->codec_id == CODEC_ID_MP3) {
73         blkalign = 1;
74         //blkalign = 144 * enc->bit_rate/enc->sample_rate;
75     } else if (enc->block_align != 0) { /* specified by the codec */
76         blkalign = enc->block_align;
77     } else
78         blkalign = enc->channels*bps >> 3;
79     if (enc->codec_id == CODEC_ID_PCM_U8 ||
80         enc->codec_id == CODEC_ID_PCM_S16LE) {
81         bytespersec = enc->sample_rate * blkalign;
82     } else {
83         bytespersec = enc->bit_rate / 8;
84     }
85     put_le32(pb, bytespersec); /* bytes per second */
86     put_le16(pb, blkalign); /* block align */
87     put_le16(pb, bps); /* bits per sample */
88     if (enc->codec_id == CODEC_ID_MP3) {
89         put_le16(pb, 12); /* wav_extra_size */
90         hdrsize += 12;
91         put_le16(pb, 1); /* wID */
92         put_le32(pb, 2); /* fdwFlags */
93         put_le16(pb, 1152); /* nBlockSize */
94         put_le16(pb, 1); /* nFramesPerBlock */
95         put_le16(pb, 1393); /* nCodecDelay */
96     } else if (enc->codec_id == CODEC_ID_MP2) {
97         put_le16(pb, 22); /* wav_extra_size */
98         hdrsize += 22;
99         put_le16(pb, 2);  /* fwHeadLayer */
100         put_le32(pb, enc->bit_rate); /* dwHeadBitrate */
101         put_le16(pb, enc->channels == 2 ? 1 : 8); /* fwHeadMode */
102         put_le16(pb, 0);  /* fwHeadModeExt */
103         put_le16(pb, 1);  /* wHeadEmphasis */
104         put_le16(pb, 16); /* fwHeadFlags */
105         put_le32(pb, 0);  /* dwPTSLow */
106         put_le32(pb, 0);  /* dwPTSHigh */
107     } else if (enc->codec_id == CODEC_ID_ADPCM_IMA_WAV) {
108         put_le16(pb, 2); /* wav_extra_size */
109         hdrsize += 2;
110         put_le16(pb, ((enc->block_align - 4 * enc->channels) / (4 * enc->channels)) * 8 + 1); /* wSamplesPerBlock */
111     } else if(enc->extradata_size){
112         put_le16(pb, enc->extradata_size);
113         put_buffer(pb, enc->extradata, enc->extradata_size);
114         hdrsize += enc->extradata_size;
115         if(hdrsize&1){
116             hdrsize++;
117             put_byte(pb, 0);
118         }
119     } else {
120         hdrsize -= 2;
121     }
122
123     return hdrsize;
124 }
125 #endif //CONFIG_ENCODERS
126
127 /* We could be given one of the three possible structures here:
128  * WAVEFORMAT, PCMWAVEFORMAT or WAVEFORMATEX. Each structure
129  * is an expansion of the previous one with the fields added
130  * at the bottom. PCMWAVEFORMAT adds 'WORD wBitsPerSample' and
131  * WAVEFORMATEX adds 'WORD  cbSize' and basically makes itself
132  * an openended structure.
133  */
134 void get_wav_header(ByteIOContext *pb, AVCodecContext *codec, int size) 
135 {
136     int id;
137
138     id = get_le16(pb);
139     codec->codec_type = CODEC_TYPE_AUDIO;
140     codec->codec_tag = id;
141     codec->channels = get_le16(pb);
142     codec->sample_rate = get_le32(pb);
143     codec->bit_rate = get_le32(pb) * 8;
144     codec->block_align = get_le16(pb);
145     if (size == 14) {  /* We're dealing with plain vanilla WAVEFORMAT */
146         codec->bits_per_sample = 8;
147     }else
148         codec->bits_per_sample = get_le16(pb);
149     codec->codec_id = wav_codec_get_id(id, codec->bits_per_sample);
150     
151     if (size > 16) {  /* We're obviously dealing with WAVEFORMATEX */
152         codec->extradata_size = get_le16(pb);
153         if (codec->extradata_size > 0) {
154             if (codec->extradata_size > size - 18)
155                 codec->extradata_size = size - 18;
156             codec->extradata = av_mallocz(codec->extradata_size);
157             get_buffer(pb, codec->extradata, codec->extradata_size);
158         } else
159             codec->extradata_size = 0;
160         
161         /* It is possible for the chunk to contain garbage at the end */
162         if (size - codec->extradata_size - 18 > 0)
163             url_fskip(pb, size - codec->extradata_size - 18);
164     }
165 }
166
167
168 int wav_codec_get_id(unsigned int tag, int bps)
169 {
170     int id;
171     id = codec_get_id(codec_wav_tags, tag);
172     if (id <= 0)
173         return id;
174     /* handle specific u8 codec */
175     if (id == CODEC_ID_PCM_S16LE && bps == 8)
176         id = CODEC_ID_PCM_U8;
177     return id;
178 }
179
180 #ifdef CONFIG_ENCODERS
181 typedef struct {
182     offset_t data;
183 } WAVContext;
184
185 static int wav_write_header(AVFormatContext *s)
186 {
187     WAVContext *wav = s->priv_data;
188     ByteIOContext *pb = &s->pb;
189     offset_t fmt;
190
191     put_tag(pb, "RIFF");
192     put_le32(pb, 0); /* file length */
193     put_tag(pb, "WAVE");
194
195     /* format header */
196     fmt = start_tag(pb, "fmt ");
197     if (put_wav_header(pb, &s->streams[0]->codec) < 0) {
198         av_free(wav);
199         return -1;
200     }
201     end_tag(pb, fmt);
202
203     /* data header */
204     wav->data = start_tag(pb, "data");
205     
206     put_flush_packet(pb);
207
208     return 0;
209 }
210
211 static int wav_write_packet(AVFormatContext *s, AVPacket *pkt)
212 {
213     ByteIOContext *pb = &s->pb;
214     put_buffer(pb, pkt->data, pkt->size);
215     return 0;
216 }
217
218 static int wav_write_trailer(AVFormatContext *s)
219 {
220     ByteIOContext *pb = &s->pb;
221     WAVContext *wav = s->priv_data;
222     offset_t file_size;
223
224     if (!url_is_streamed(&s->pb)) {
225         end_tag(pb, wav->data);
226
227         /* update file size */
228         file_size = url_ftell(pb);
229         url_fseek(pb, 4, SEEK_SET);
230         put_le32(pb, (uint32_t)(file_size - 8));
231         url_fseek(pb, file_size, SEEK_SET);
232
233         put_flush_packet(pb);
234     }
235     return 0;
236 }
237 #endif //CONFIG_ENCODERS
238
239 /* return the size of the found tag */
240 /* XXX: > 2GB ? */
241 static int find_tag(ByteIOContext *pb, uint32_t tag1)
242 {
243     unsigned int tag;
244     int size;
245
246     for(;;) {
247         if (url_feof(pb))
248             return -1;
249         tag = get_le32(pb);
250         size = get_le32(pb);
251         if (tag == tag1)
252             break;
253         url_fseek(pb, size, SEEK_CUR);
254     }
255     if (size < 0)
256         size = 0x7fffffff;
257     return size;
258 }
259
260 static int wav_probe(AVProbeData *p)
261 {
262     /* check file header */
263     if (p->buf_size <= 32)
264         return 0;
265     if (p->buf[0] == 'R' && p->buf[1] == 'I' &&
266         p->buf[2] == 'F' && p->buf[3] == 'F' &&
267         p->buf[8] == 'W' && p->buf[9] == 'A' &&
268         p->buf[10] == 'V' && p->buf[11] == 'E')
269         return AVPROBE_SCORE_MAX;
270     else
271         return 0;
272 }
273
274 /* wav input */
275 static int wav_read_header(AVFormatContext *s,
276                            AVFormatParameters *ap)
277 {
278     int size;
279     unsigned int tag;
280     ByteIOContext *pb = &s->pb;
281     AVStream *st;
282
283     /* check RIFF header */
284     tag = get_le32(pb);
285
286     if (tag != MKTAG('R', 'I', 'F', 'F'))
287         return -1;
288     get_le32(pb); /* file size */
289     tag = get_le32(pb);
290     if (tag != MKTAG('W', 'A', 'V', 'E'))
291         return -1;
292     
293     /* parse fmt header */
294     size = find_tag(pb, MKTAG('f', 'm', 't', ' '));
295     if (size < 0)
296         return -1;
297     st = av_new_stream(s, 0);
298     if (!st)
299         return AVERROR_NOMEM;
300
301     get_wav_header(pb, &st->codec, size);
302     st->need_parsing = 1;
303     
304     size = find_tag(pb, MKTAG('d', 'a', 't', 'a'));
305     if (size < 0)
306         return -1;
307     return 0;
308 }
309
310 #define MAX_SIZE 4096
311
312 static int wav_read_packet(AVFormatContext *s,
313                            AVPacket *pkt)
314 {
315     int ret, size;
316     AVStream *st;
317
318     if (url_feof(&s->pb))
319         return AVERROR_IO;
320     st = s->streams[0];
321
322     size = MAX_SIZE;
323     if (st->codec.block_align > 1) {
324         if (size < st->codec.block_align)
325             size = st->codec.block_align;
326         size = (size / st->codec.block_align) * st->codec.block_align;
327     }
328     if (av_new_packet(pkt, size))
329         return AVERROR_IO;
330     pkt->stream_index = 0;
331
332     ret = get_buffer(&s->pb, pkt->data, pkt->size);
333     if (ret < 0)
334         av_free_packet(pkt);
335     /* note: we need to modify the packet size here to handle the last
336        packet */
337     pkt->size = ret;
338     return ret;
339 }
340
341 static int wav_read_close(AVFormatContext *s)
342 {
343     return 0;
344 }
345
346 static int wav_read_seek(AVFormatContext *s, 
347                          int stream_index, int64_t timestamp, int flags)
348 {
349     AVStream *st;
350
351     st = s->streams[0];
352     switch(st->codec.codec_id) {
353     case CODEC_ID_MP2:
354     case CODEC_ID_MP3:
355     case CODEC_ID_AC3:
356     case CODEC_ID_DTS:
357         /* use generic seeking with dynamically generated indexes */
358         return -1;
359     default:
360         break;
361     }
362     return pcm_read_seek(s, stream_index, timestamp, flags);
363 }
364
365
366 static AVInputFormat wav_iformat = {
367     "wav",
368     "wav format",
369     0,
370     wav_probe,
371     wav_read_header,
372     wav_read_packet,
373     wav_read_close,
374     wav_read_seek,
375 };
376
377 #ifdef CONFIG_ENCODERS
378 static AVOutputFormat wav_oformat = {
379     "wav",
380     "wav format",
381     "audio/x-wav",
382     "wav",
383     sizeof(WAVContext),
384     CODEC_ID_PCM_S16LE,
385     CODEC_ID_NONE,
386     wav_write_header,
387     wav_write_packet,
388     wav_write_trailer,
389 };
390 #endif //CONFIG_ENCODERS
391
392 int ff_wav_init(void)
393 {
394     av_register_input_format(&wav_iformat);
395 #ifdef CONFIG_ENCODERS
396     av_register_output_format(&wav_oformat);
397 #endif //CONFIG_ENCODERS
398     return 0;
399 }