]> git.sesse.net Git - ffmpeg/blob - libavformat/wav.c
libdts support by (Benjamin Zores <ben at geexbox dot org>)
[ffmpeg] / libavformat / wav.c
1 /* 
2  * WAV encoder and decoder
3  * Copyright (c) 2001, 2002 Fabrice Bellard.
4  *
5  * This library is free software; you can redistribute it and/or
6  * modify it under the terms of the GNU Lesser General Public
7  * License as published by the Free Software Foundation; either
8  * version 2 of the License, or (at your option) any later version.
9  *
10  * This library is distributed in the hope that it will be useful,
11  * but WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * Lesser General Public License for more details.
14  *
15  * You should have received a copy of the GNU Lesser General Public
16  * License along with this library; if not, write to the Free Software
17  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18  */
19 #include "avformat.h"
20 #include "avi.h"
21
22 const CodecTag codec_wav_tags[] = {
23     { CODEC_ID_MP2, 0x50 },
24     { CODEC_ID_MP3, 0x55 },
25     { CODEC_ID_AC3, 0x2000 },
26     { CODEC_ID_PCM_S16LE, 0x01 },
27     { CODEC_ID_PCM_U8, 0x01 }, /* must come after s16le in this list */
28     { CODEC_ID_PCM_ALAW, 0x06 },
29     { CODEC_ID_PCM_MULAW, 0x07 },
30     { CODEC_ID_ADPCM_MS, 0x02 },
31     { CODEC_ID_ADPCM_IMA_WAV, 0x11 },
32     { CODEC_ID_ADPCM_G726, 0x45 },
33     { CODEC_ID_ADPCM_IMA_DK4, 0x61 },  /* rogue format number */
34     { CODEC_ID_ADPCM_IMA_DK3, 0x62 },  /* rogue format number */
35     { CODEC_ID_WMAV1, 0x160 },
36     { CODEC_ID_WMAV2, 0x161 },
37     { CODEC_ID_VORBIS, ('V'<<8)+'o' }, //HACK/FIXME, does vorbis in WAV/AVI have an (in)official id?
38     { 0, 0 },
39 };
40
41 #ifdef CONFIG_ENCODERS
42 /* WAVEFORMATEX header */
43 /* returns the size or -1 on error */
44 int put_wav_header(ByteIOContext *pb, AVCodecContext *enc)
45 {
46     int bps, blkalign, bytespersec;
47     int hdrsize = 18;
48
49     if(!enc->codec_tag)
50        enc->codec_tag = codec_get_tag(codec_wav_tags, enc->codec_id);
51     if(!enc->codec_tag)
52         return -1;
53
54     put_le16(pb, enc->codec_tag);
55     put_le16(pb, enc->channels);
56     put_le32(pb, enc->sample_rate);
57     if (enc->codec_id == CODEC_ID_PCM_U8 ||
58         enc->codec_id == CODEC_ID_PCM_ALAW ||
59         enc->codec_id == CODEC_ID_PCM_MULAW) {
60         bps = 8;
61     } else if (enc->codec_id == CODEC_ID_MP2 || enc->codec_id == CODEC_ID_MP3) {
62         bps = 0;
63     } else if (enc->codec_id == CODEC_ID_ADPCM_IMA_WAV || enc->codec_id == CODEC_ID_ADPCM_MS) {
64         bps = 4;
65     } else {
66         bps = 16;
67     }
68     
69     if (enc->codec_id == CODEC_ID_MP2 || enc->codec_id == CODEC_ID_MP3) {
70         blkalign = 1;
71         //blkalign = 144 * enc->bit_rate/enc->sample_rate;
72     } else if (enc->block_align != 0) { /* specified by the codec */
73         blkalign = enc->block_align;
74     } else
75         blkalign = enc->channels*bps >> 3;
76     if (enc->codec_id == CODEC_ID_PCM_U8 ||
77         enc->codec_id == CODEC_ID_PCM_S16LE) {
78         bytespersec = enc->sample_rate * blkalign;
79     } else {
80         bytespersec = enc->bit_rate / 8;
81     }
82     put_le32(pb, bytespersec); /* bytes per second */
83     put_le16(pb, blkalign); /* block align */
84     put_le16(pb, bps); /* bits per sample */
85     if (enc->codec_id == CODEC_ID_MP3) {
86         put_le16(pb, 12); /* wav_extra_size */
87         hdrsize += 12;
88         put_le16(pb, 1); /* wID */
89         put_le32(pb, 2); /* fdwFlags */
90         put_le16(pb, 1152); /* nBlockSize */
91         put_le16(pb, 1); /* nFramesPerBlock */
92         put_le16(pb, 1393); /* nCodecDelay */
93     } else if (enc->codec_id == CODEC_ID_MP2) {
94         put_le16(pb, 22); /* wav_extra_size */
95         hdrsize += 22;
96         put_le16(pb, 2);  /* fwHeadLayer */
97         put_le32(pb, enc->bit_rate); /* dwHeadBitrate */
98         put_le16(pb, enc->channels == 2 ? 1 : 8); /* fwHeadMode */
99         put_le16(pb, 0);  /* fwHeadModeExt */
100         put_le16(pb, 1);  /* wHeadEmphasis */
101         put_le16(pb, 16); /* fwHeadFlags */
102         put_le32(pb, 0);  /* dwPTSLow */
103         put_le32(pb, 0);  /* dwPTSHigh */
104     } else if (enc->codec_id == CODEC_ID_ADPCM_IMA_WAV) {
105         put_le16(pb, 2); /* wav_extra_size */
106         hdrsize += 2;
107         put_le16(pb, ((enc->block_align - 4 * enc->channels) / (4 * enc->channels)) * 8 + 1); /* wSamplesPerBlock */
108     } else {
109         put_le16(pb, enc->extradata_size);
110         put_buffer(pb, enc->extradata, enc->extradata_size);
111         hdrsize += enc->extradata_size;
112         if(hdrsize&1){
113             hdrsize++;
114             put_byte(pb, 0);
115         }
116     }
117
118     return hdrsize;
119 }
120 #endif //CONFIG_ENCODERS
121
122 /* We could be given one of the three possible structures here:
123  * WAVEFORMAT, PCMWAVEFORMAT or WAVEFORMATEX. Each structure
124  * is an expansion of the previous one with the fields added
125  * at the bottom. PCMWAVEFORMAT adds 'WORD wBitsPerSample' and
126  * WAVEFORMATEX adds 'WORD  cbSize' and basically makes itself
127  * an openended structure.
128  */
129 void get_wav_header(ByteIOContext *pb, AVCodecContext *codec, int size) 
130 {
131     int id;
132
133     id = get_le16(pb);
134     codec->codec_type = CODEC_TYPE_AUDIO;
135     codec->codec_tag = id;
136     codec->channels = get_le16(pb);
137     codec->sample_rate = get_le32(pb);
138     codec->bit_rate = get_le32(pb) * 8;
139     codec->block_align = get_le16(pb);
140     if (size == 14) {  /* We're dealing with plain vanilla WAVEFORMAT */
141         codec->bits_per_sample = 8;
142     }else
143         codec->bits_per_sample = get_le16(pb);
144     codec->codec_id = wav_codec_get_id(id, codec->bits_per_sample);
145     
146     if (size > 16) {  /* We're obviously dealing with WAVEFORMATEX */
147         codec->extradata_size = get_le16(pb);
148         if (codec->extradata_size > 0) {
149             if (codec->extradata_size > size - 18)
150                 codec->extradata_size = size - 18;
151             codec->extradata = av_mallocz(codec->extradata_size);
152             get_buffer(pb, codec->extradata, codec->extradata_size);
153         } else
154             codec->extradata_size = 0;
155         
156         /* It is possible for the chunk to contain garbage at the end */
157         if (size - codec->extradata_size - 18 > 0)
158             url_fskip(pb, size - codec->extradata_size - 18);
159     }
160 }
161
162
163 int wav_codec_get_id(unsigned int tag, int bps)
164 {
165     int id;
166     id = codec_get_id(codec_wav_tags, tag);
167     if (id <= 0)
168         return id;
169     /* handle specific u8 codec */
170     if (id == CODEC_ID_PCM_S16LE && bps == 8)
171         id = CODEC_ID_PCM_U8;
172     return id;
173 }
174
175 #ifdef CONFIG_ENCODERS
176 typedef struct {
177     offset_t data;
178 } WAVContext;
179
180 static int wav_write_header(AVFormatContext *s)
181 {
182     WAVContext *wav = s->priv_data;
183     ByteIOContext *pb = &s->pb;
184     offset_t fmt;
185
186     put_tag(pb, "RIFF");
187     put_le32(pb, 0); /* file length */
188     put_tag(pb, "WAVE");
189
190     /* format header */
191     fmt = start_tag(pb, "fmt ");
192     if (put_wav_header(pb, &s->streams[0]->codec) < 0) {
193         av_free(wav);
194         return -1;
195     }
196     end_tag(pb, fmt);
197
198     /* data header */
199     wav->data = start_tag(pb, "data");
200     
201     put_flush_packet(pb);
202
203     return 0;
204 }
205
206 static int wav_write_packet(AVFormatContext *s, AVPacket *pkt)
207 {
208     ByteIOContext *pb = &s->pb;
209     put_buffer(pb, pkt->data, pkt->size);
210     return 0;
211 }
212
213 static int wav_write_trailer(AVFormatContext *s)
214 {
215     ByteIOContext *pb = &s->pb;
216     WAVContext *wav = s->priv_data;
217     offset_t file_size;
218
219     if (!url_is_streamed(&s->pb)) {
220         end_tag(pb, wav->data);
221
222         /* update file size */
223         file_size = url_ftell(pb);
224         url_fseek(pb, 4, SEEK_SET);
225         put_le32(pb, (uint32_t)(file_size - 8));
226         url_fseek(pb, file_size, SEEK_SET);
227
228         put_flush_packet(pb);
229     }
230     return 0;
231 }
232 #endif //CONFIG_ENCODERS
233
234 /* return the size of the found tag */
235 /* XXX: > 2GB ? */
236 static int find_tag(ByteIOContext *pb, uint32_t tag1)
237 {
238     unsigned int tag;
239     int size;
240
241     for(;;) {
242         if (url_feof(pb))
243             return -1;
244         tag = get_le32(pb);
245         size = get_le32(pb);
246         if (tag == tag1)
247             break;
248         url_fseek(pb, size, SEEK_CUR);
249     }
250     if (size < 0)
251         size = 0x7fffffff;
252     return size;
253 }
254
255 static int wav_probe(AVProbeData *p)
256 {
257     /* check file header */
258     if (p->buf_size <= 32)
259         return 0;
260     if (p->buf[0] == 'R' && p->buf[1] == 'I' &&
261         p->buf[2] == 'F' && p->buf[3] == 'F' &&
262         p->buf[8] == 'W' && p->buf[9] == 'A' &&
263         p->buf[10] == 'V' && p->buf[11] == 'E')
264         return AVPROBE_SCORE_MAX;
265     else
266         return 0;
267 }
268
269 /* wav input */
270 static int wav_read_header(AVFormatContext *s,
271                            AVFormatParameters *ap)
272 {
273     int size;
274     unsigned int tag;
275     ByteIOContext *pb = &s->pb;
276     AVStream *st;
277
278     /* check RIFF header */
279     tag = get_le32(pb);
280
281     if (tag != MKTAG('R', 'I', 'F', 'F'))
282         return -1;
283     get_le32(pb); /* file size */
284     tag = get_le32(pb);
285     if (tag != MKTAG('W', 'A', 'V', 'E'))
286         return -1;
287     
288     /* parse fmt header */
289     size = find_tag(pb, MKTAG('f', 'm', 't', ' '));
290     if (size < 0)
291         return -1;
292     st = av_new_stream(s, 0);
293     if (!st)
294         return AVERROR_NOMEM;
295
296     get_wav_header(pb, &st->codec, size);
297     st->need_parsing = 1;
298     
299     size = find_tag(pb, MKTAG('d', 'a', 't', 'a'));
300     if (size < 0)
301         return -1;
302     return 0;
303 }
304
305 #define MAX_SIZE 4096
306
307 static int wav_read_packet(AVFormatContext *s,
308                            AVPacket *pkt)
309 {
310     int ret, size;
311     AVStream *st;
312
313     if (url_feof(&s->pb))
314         return AVERROR_IO;
315     st = s->streams[0];
316
317     size = MAX_SIZE;
318     if (st->codec.block_align > 1) {
319         if (size < st->codec.block_align)
320             size = st->codec.block_align;
321         size = (size / st->codec.block_align) * st->codec.block_align;
322     }
323     if (av_new_packet(pkt, size))
324         return AVERROR_IO;
325     pkt->stream_index = 0;
326
327     ret = get_buffer(&s->pb, pkt->data, pkt->size);
328     if (ret < 0)
329         av_free_packet(pkt);
330     /* note: we need to modify the packet size here to handle the last
331        packet */
332     pkt->size = ret;
333     return ret;
334 }
335
336 static int wav_read_close(AVFormatContext *s)
337 {
338     return 0;
339 }
340
341 static int wav_read_seek(AVFormatContext *s, 
342                          int stream_index, int64_t timestamp)
343 {
344     AVStream *st;
345
346     st = s->streams[0];
347     switch(st->codec.codec_id) {
348     case CODEC_ID_MP2:
349     case CODEC_ID_MP3:
350     case CODEC_ID_AC3:
351     case CODEC_ID_DTS:
352         /* use generic seeking with dynamically generated indexes */
353         return -1;
354     default:
355         break;
356     }
357     return pcm_read_seek(s, stream_index, timestamp);
358 }
359
360
361 static AVInputFormat wav_iformat = {
362     "wav",
363     "wav format",
364     0,
365     wav_probe,
366     wav_read_header,
367     wav_read_packet,
368     wav_read_close,
369     wav_read_seek,
370 };
371
372 #ifdef CONFIG_ENCODERS
373 static AVOutputFormat wav_oformat = {
374     "wav",
375     "wav format",
376     "audio/x-wav",
377     "wav",
378     sizeof(WAVContext),
379     CODEC_ID_PCM_S16LE,
380     CODEC_ID_NONE,
381     wav_write_header,
382     wav_write_packet,
383     wav_write_trailer,
384 };
385 #endif //CONFIG_ENCODERS
386
387 int ff_wav_init(void)
388 {
389     av_register_input_format(&wav_iformat);
390 #ifdef CONFIG_ENCODERS
391     av_register_output_format(&wav_oformat);
392 #endif //CONFIG_ENCODERS
393     return 0;
394 }