]> git.sesse.net Git - ffmpeg/blob - libavformat/wav.c
reverse zero packet dissapearence "feature"
[ffmpeg] / libavformat / wav.c
1 /* 
2  * WAV encoder and decoder
3  * Copyright (c) 2001, 2002 Fabrice Bellard.
4  *
5  * This library is free software; you can redistribute it and/or
6  * modify it under the terms of the GNU Lesser General Public
7  * License as published by the Free Software Foundation; either
8  * version 2 of the License, or (at your option) any later version.
9  *
10  * This library is distributed in the hope that it will be useful,
11  * but WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * Lesser General Public License for more details.
14  *
15  * You should have received a copy of the GNU Lesser General Public
16  * License along with this library; if not, write to the Free Software
17  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18  */
19 #include "avformat.h"
20 #include "avi.h"
21
22 const CodecTag codec_wav_tags[] = {
23     { CODEC_ID_MP2, 0x50 },
24     { CODEC_ID_MP3, 0x55 },
25     { CODEC_ID_AC3, 0x2000 },
26     { CODEC_ID_PCM_S16LE, 0x01 },
27     { CODEC_ID_PCM_U8, 0x01 }, /* must come after s16le in this list */
28     { CODEC_ID_PCM_ALAW, 0x06 },
29     { CODEC_ID_PCM_MULAW, 0x07 },
30     { CODEC_ID_ADPCM_MS, 0x02 },
31     { CODEC_ID_ADPCM_IMA_WAV, 0x11 },
32     { CODEC_ID_ADPCM_G726, 0x45 },
33     { CODEC_ID_ADPCM_IMA_DK4, 0x61 },  /* rogue format number */
34     { CODEC_ID_ADPCM_IMA_DK3, 0x62 },  /* rogue format number */
35     { CODEC_ID_WMAV1, 0x160 },
36     { CODEC_ID_WMAV2, 0x161 },
37     { CODEC_ID_AAC, 0x706d },
38     { CODEC_ID_VORBIS, ('V'<<8)+'o' }, //HACK/FIXME, does vorbis in WAV/AVI have an (in)official id?
39     { CODEC_ID_SONIC, 0x2048 },
40     { CODEC_ID_SONIC_LS, 0x2048 },
41     { CODEC_ID_ADPCM_CT, 0x200 },
42     { CODEC_ID_ADPCM_SWF, ('S'<<8)+'F' },
43     { 0, 0 },
44 };
45
46 #ifdef CONFIG_ENCODERS
47 /* WAVEFORMATEX header */
48 /* returns the size or -1 on error */
49 int put_wav_header(ByteIOContext *pb, AVCodecContext *enc)
50 {
51     int bps, blkalign, bytespersec;
52     int hdrsize = 18;
53
54     if(!enc->codec_tag)
55        enc->codec_tag = codec_get_tag(codec_wav_tags, enc->codec_id);
56     if(!enc->codec_tag)
57         return -1;
58
59     put_le16(pb, enc->codec_tag);
60     put_le16(pb, enc->channels);
61     put_le32(pb, enc->sample_rate);
62     if (enc->codec_id == CODEC_ID_PCM_U8 ||
63         enc->codec_id == CODEC_ID_PCM_ALAW ||
64         enc->codec_id == CODEC_ID_PCM_MULAW) {
65         bps = 8;
66     } else if (enc->codec_id == CODEC_ID_MP2 || enc->codec_id == CODEC_ID_MP3) {
67         bps = 0;
68     } else if (enc->codec_id == CODEC_ID_ADPCM_IMA_WAV || enc->codec_id == CODEC_ID_ADPCM_MS) {
69         bps = 4;
70     } else {
71         bps = 16;
72     }
73     
74     if (enc->codec_id == CODEC_ID_MP2 || enc->codec_id == CODEC_ID_MP3) {
75         blkalign = enc->frame_size; //this is wrong, but seems many demuxers dont work if this is set correctly
76         //blkalign = 144 * enc->bit_rate/enc->sample_rate;
77     } else if (enc->block_align != 0) { /* specified by the codec */
78         blkalign = enc->block_align;
79     } else
80         blkalign = enc->channels*bps >> 3;
81     if (enc->codec_id == CODEC_ID_PCM_U8 ||
82         enc->codec_id == CODEC_ID_PCM_S16LE) {
83         bytespersec = enc->sample_rate * blkalign;
84     } else {
85         bytespersec = enc->bit_rate / 8;
86     }
87     put_le32(pb, bytespersec); /* bytes per second */
88     put_le16(pb, blkalign); /* block align */
89     put_le16(pb, bps); /* bits per sample */
90     if (enc->codec_id == CODEC_ID_MP3) {
91         put_le16(pb, 12); /* wav_extra_size */
92         hdrsize += 12;
93         put_le16(pb, 1); /* wID */
94         put_le32(pb, 2); /* fdwFlags */
95         put_le16(pb, 1152); /* nBlockSize */
96         put_le16(pb, 1); /* nFramesPerBlock */
97         put_le16(pb, 1393); /* nCodecDelay */
98     } else if (enc->codec_id == CODEC_ID_MP2) {
99         put_le16(pb, 22); /* wav_extra_size */
100         hdrsize += 22;
101         put_le16(pb, 2);  /* fwHeadLayer */
102         put_le32(pb, enc->bit_rate); /* dwHeadBitrate */
103         put_le16(pb, enc->channels == 2 ? 1 : 8); /* fwHeadMode */
104         put_le16(pb, 0);  /* fwHeadModeExt */
105         put_le16(pb, 1);  /* wHeadEmphasis */
106         put_le16(pb, 16); /* fwHeadFlags */
107         put_le32(pb, 0);  /* dwPTSLow */
108         put_le32(pb, 0);  /* dwPTSHigh */
109     } else if (enc->codec_id == CODEC_ID_ADPCM_IMA_WAV) {
110         put_le16(pb, 2); /* wav_extra_size */
111         hdrsize += 2;
112         put_le16(pb, ((enc->block_align - 4 * enc->channels) / (4 * enc->channels)) * 8 + 1); /* wSamplesPerBlock */
113     } else if(enc->extradata_size){
114         put_le16(pb, enc->extradata_size);
115         put_buffer(pb, enc->extradata, enc->extradata_size);
116         hdrsize += enc->extradata_size;
117         if(hdrsize&1){
118             hdrsize++;
119             put_byte(pb, 0);
120         }
121     } else {
122         hdrsize -= 2;
123     }
124
125     return hdrsize;
126 }
127 #endif //CONFIG_ENCODERS
128
129 /* We could be given one of the three possible structures here:
130  * WAVEFORMAT, PCMWAVEFORMAT or WAVEFORMATEX. Each structure
131  * is an expansion of the previous one with the fields added
132  * at the bottom. PCMWAVEFORMAT adds 'WORD wBitsPerSample' and
133  * WAVEFORMATEX adds 'WORD  cbSize' and basically makes itself
134  * an openended structure.
135  */
136 void get_wav_header(ByteIOContext *pb, AVCodecContext *codec, int size) 
137 {
138     int id;
139
140     id = get_le16(pb);
141     codec->codec_type = CODEC_TYPE_AUDIO;
142     codec->codec_tag = id;
143     codec->channels = get_le16(pb);
144     codec->sample_rate = get_le32(pb);
145     codec->bit_rate = get_le32(pb) * 8;
146     codec->block_align = get_le16(pb);
147     if (size == 14) {  /* We're dealing with plain vanilla WAVEFORMAT */
148         codec->bits_per_sample = 8;
149     }else
150         codec->bits_per_sample = get_le16(pb);
151     codec->codec_id = wav_codec_get_id(id, codec->bits_per_sample);
152     
153     if (size > 16) {  /* We're obviously dealing with WAVEFORMATEX */
154         codec->extradata_size = get_le16(pb);
155         if (codec->extradata_size > 0) {
156             if (codec->extradata_size > size - 18)
157                 codec->extradata_size = size - 18;
158             codec->extradata = av_mallocz(codec->extradata_size + FF_INPUT_BUFFER_PADDING_SIZE);
159             get_buffer(pb, codec->extradata, codec->extradata_size);
160         } else
161             codec->extradata_size = 0;
162         
163         /* It is possible for the chunk to contain garbage at the end */
164         if (size - codec->extradata_size - 18 > 0)
165             url_fskip(pb, size - codec->extradata_size - 18);
166     }
167 }
168
169
170 int wav_codec_get_id(unsigned int tag, int bps)
171 {
172     int id;
173     id = codec_get_id(codec_wav_tags, tag);
174     if (id <= 0)
175         return id;
176     /* handle specific u8 codec */
177     if (id == CODEC_ID_PCM_S16LE && bps == 8)
178         id = CODEC_ID_PCM_U8;
179     return id;
180 }
181
182 #ifdef CONFIG_ENCODERS
183 typedef struct {
184     offset_t data;
185 } WAVContext;
186
187 static int wav_write_header(AVFormatContext *s)
188 {
189     WAVContext *wav = s->priv_data;
190     ByteIOContext *pb = &s->pb;
191     offset_t fmt;
192
193     put_tag(pb, "RIFF");
194     put_le32(pb, 0); /* file length */
195     put_tag(pb, "WAVE");
196
197     /* format header */
198     fmt = start_tag(pb, "fmt ");
199     if (put_wav_header(pb, &s->streams[0]->codec) < 0) {
200         av_free(wav);
201         return -1;
202     }
203     end_tag(pb, fmt);
204
205     av_set_pts_info(s->streams[0], 64, 1, s->streams[0]->codec.sample_rate);
206
207     /* data header */
208     wav->data = start_tag(pb, "data");
209     
210     put_flush_packet(pb);
211
212     return 0;
213 }
214
215 static int wav_write_packet(AVFormatContext *s, AVPacket *pkt)
216 {
217     ByteIOContext *pb = &s->pb;
218     put_buffer(pb, pkt->data, pkt->size);
219     return 0;
220 }
221
222 static int wav_write_trailer(AVFormatContext *s)
223 {
224     ByteIOContext *pb = &s->pb;
225     WAVContext *wav = s->priv_data;
226     offset_t file_size;
227
228     if (!url_is_streamed(&s->pb)) {
229         end_tag(pb, wav->data);
230
231         /* update file size */
232         file_size = url_ftell(pb);
233         url_fseek(pb, 4, SEEK_SET);
234         put_le32(pb, (uint32_t)(file_size - 8));
235         url_fseek(pb, file_size, SEEK_SET);
236
237         put_flush_packet(pb);
238     }
239     return 0;
240 }
241 #endif //CONFIG_ENCODERS
242
243 /* return the size of the found tag */
244 /* XXX: > 2GB ? */
245 static int find_tag(ByteIOContext *pb, uint32_t tag1)
246 {
247     unsigned int tag;
248     int size;
249
250     for(;;) {
251         if (url_feof(pb))
252             return -1;
253         tag = get_le32(pb);
254         size = get_le32(pb);
255         if (tag == tag1)
256             break;
257         url_fseek(pb, size, SEEK_CUR);
258     }
259     if (size < 0)
260         size = 0x7fffffff;
261     return size;
262 }
263
264 static int wav_probe(AVProbeData *p)
265 {
266     /* check file header */
267     if (p->buf_size <= 32)
268         return 0;
269     if (p->buf[0] == 'R' && p->buf[1] == 'I' &&
270         p->buf[2] == 'F' && p->buf[3] == 'F' &&
271         p->buf[8] == 'W' && p->buf[9] == 'A' &&
272         p->buf[10] == 'V' && p->buf[11] == 'E')
273         return AVPROBE_SCORE_MAX;
274     else
275         return 0;
276 }
277
278 /* wav input */
279 static int wav_read_header(AVFormatContext *s,
280                            AVFormatParameters *ap)
281 {
282     int size;
283     unsigned int tag;
284     ByteIOContext *pb = &s->pb;
285     AVStream *st;
286
287     /* check RIFF header */
288     tag = get_le32(pb);
289
290     if (tag != MKTAG('R', 'I', 'F', 'F'))
291         return -1;
292     get_le32(pb); /* file size */
293     tag = get_le32(pb);
294     if (tag != MKTAG('W', 'A', 'V', 'E'))
295         return -1;
296     
297     /* parse fmt header */
298     size = find_tag(pb, MKTAG('f', 'm', 't', ' '));
299     if (size < 0)
300         return -1;
301     st = av_new_stream(s, 0);
302     if (!st)
303         return AVERROR_NOMEM;
304
305     get_wav_header(pb, &st->codec, size);
306     st->need_parsing = 1;
307
308     av_set_pts_info(st, 64, 1, st->codec.sample_rate);
309
310     size = find_tag(pb, MKTAG('d', 'a', 't', 'a'));
311     if (size < 0)
312         return -1;
313     return 0;
314 }
315
316 #define MAX_SIZE 4096
317
318 static int wav_read_packet(AVFormatContext *s,
319                            AVPacket *pkt)
320 {
321     int ret, size;
322     AVStream *st;
323
324     if (url_feof(&s->pb))
325         return AVERROR_IO;
326     st = s->streams[0];
327
328     size = MAX_SIZE;
329     if (st->codec.block_align > 1) {
330         if (size < st->codec.block_align)
331             size = st->codec.block_align;
332         size = (size / st->codec.block_align) * st->codec.block_align;
333     }
334     if (av_new_packet(pkt, size))
335         return AVERROR_IO;
336     pkt->stream_index = 0;
337
338     ret = get_buffer(&s->pb, pkt->data, pkt->size);
339     if (ret < 0)
340         av_free_packet(pkt);
341     /* note: we need to modify the packet size here to handle the last
342        packet */
343     pkt->size = ret;
344     return ret;
345 }
346
347 static int wav_read_close(AVFormatContext *s)
348 {
349     return 0;
350 }
351
352 static int wav_read_seek(AVFormatContext *s, 
353                          int stream_index, int64_t timestamp, int flags)
354 {
355     AVStream *st;
356
357     st = s->streams[0];
358     switch(st->codec.codec_id) {
359     case CODEC_ID_MP2:
360     case CODEC_ID_MP3:
361     case CODEC_ID_AC3:
362     case CODEC_ID_DTS:
363         /* use generic seeking with dynamically generated indexes */
364         return -1;
365     default:
366         break;
367     }
368     return pcm_read_seek(s, stream_index, timestamp, flags);
369 }
370
371
372 static AVInputFormat wav_iformat = {
373     "wav",
374     "wav format",
375     0,
376     wav_probe,
377     wav_read_header,
378     wav_read_packet,
379     wav_read_close,
380     wav_read_seek,
381 };
382
383 #ifdef CONFIG_ENCODERS
384 static AVOutputFormat wav_oformat = {
385     "wav",
386     "wav format",
387     "audio/x-wav",
388     "wav",
389     sizeof(WAVContext),
390     CODEC_ID_PCM_S16LE,
391     CODEC_ID_NONE,
392     wav_write_header,
393     wav_write_packet,
394     wav_write_trailer,
395 };
396 #endif //CONFIG_ENCODERS
397
398 int ff_wav_init(void)
399 {
400     av_register_input_format(&wav_iformat);
401 #ifdef CONFIG_ENCODERS
402     av_register_output_format(&wav_oformat);
403 #endif //CONFIG_ENCODERS
404     return 0;
405 }