]> git.sesse.net Git - ffmpeg/blob - libavformat/wav.c
allow individual selection of muxers and demuxers
[ffmpeg] / libavformat / wav.c
1 /*
2  * WAV encoder and decoder
3  * Copyright (c) 2001, 2002 Fabrice Bellard.
4  *
5  * This library is free software; you can redistribute it and/or
6  * modify it under the terms of the GNU Lesser General Public
7  * License as published by the Free Software Foundation; either
8  * version 2 of the License, or (at your option) any later version.
9  *
10  * This library is distributed in the hope that it will be useful,
11  * but WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * Lesser General Public License for more details.
14  *
15  * You should have received a copy of the GNU Lesser General Public
16  * License along with this library; if not, write to the Free Software
17  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
18  */
19 #include "avformat.h"
20 #include "allformats.h"
21 #include "avi.h"
22
23 const CodecTag codec_wav_tags[] = {
24     { CODEC_ID_MP2, 0x50 },
25     { CODEC_ID_MP3, 0x55 },
26     { CODEC_ID_AC3, 0x2000 },
27     { CODEC_ID_DTS, 0x2001 },
28     { CODEC_ID_PCM_S16LE, 0x01 },
29     { CODEC_ID_PCM_U8, 0x01 }, /* must come after s16le in this list */
30     { CODEC_ID_PCM_S24LE, 0x01 },
31     { CODEC_ID_PCM_S32LE, 0x01 },
32     { CODEC_ID_PCM_ALAW, 0x06 },
33     { CODEC_ID_PCM_MULAW, 0x07 },
34     { CODEC_ID_ADPCM_MS, 0x02 },
35     { CODEC_ID_ADPCM_IMA_WAV, 0x11 },
36     { CODEC_ID_ADPCM_YAMAHA, 0x20 },
37     { CODEC_ID_ADPCM_G726, 0x45 },
38     { CODEC_ID_ADPCM_IMA_DK4, 0x61 },  /* rogue format number */
39     { CODEC_ID_ADPCM_IMA_DK3, 0x62 },  /* rogue format number */
40     { CODEC_ID_WMAV1, 0x160 },
41     { CODEC_ID_WMAV2, 0x161 },
42     { CODEC_ID_AAC, 0x706d },
43     { CODEC_ID_VORBIS, ('V'<<8)+'o' }, //HACK/FIXME, does vorbis in WAV/AVI have an (in)official id?
44     { CODEC_ID_SONIC, 0x2048 },
45     { CODEC_ID_SONIC_LS, 0x2048 },
46     { CODEC_ID_ADPCM_CT, 0x200 },
47     { CODEC_ID_ADPCM_SWF, ('S'<<8)+'F' },
48     { CODEC_ID_TRUESPEECH, 0x22 },
49
50     // for NuppelVideo (nuv.c)
51     { CODEC_ID_PCM_S16LE, MKTAG('R', 'A', 'W', 'A') },
52     { CODEC_ID_MP3, MKTAG('L', 'A', 'M', 'E') },
53     { 0, 0 },
54 };
55
56 #ifdef CONFIG_MUXERS
57 /* WAVEFORMATEX header */
58 /* returns the size or -1 on error */
59 int put_wav_header(ByteIOContext *pb, AVCodecContext *enc)
60 {
61     int bps, blkalign, bytespersec;
62     int hdrsize = 18;
63
64     if(!enc->codec_tag || enc->codec_tag > 0xffff)
65        enc->codec_tag = codec_get_tag(codec_wav_tags, enc->codec_id);
66     if(!enc->codec_tag)
67         return -1;
68
69     put_le16(pb, enc->codec_tag);
70     put_le16(pb, enc->channels);
71     put_le32(pb, enc->sample_rate);
72     if (enc->codec_id == CODEC_ID_PCM_U8 ||
73         enc->codec_id == CODEC_ID_PCM_ALAW ||
74         enc->codec_id == CODEC_ID_PCM_MULAW) {
75         bps = 8;
76     } else if (enc->codec_id == CODEC_ID_MP2 || enc->codec_id == CODEC_ID_MP3) {
77         bps = 0;
78     } else if (enc->codec_id == CODEC_ID_ADPCM_IMA_WAV || enc->codec_id == CODEC_ID_ADPCM_MS || enc->codec_id == CODEC_ID_ADPCM_G726 || enc->codec_id == CODEC_ID_ADPCM_YAMAHA) { //
79         bps = 4;
80     } else if (enc->codec_id == CODEC_ID_PCM_S24LE) {
81         bps = 24;
82     } else if (enc->codec_id == CODEC_ID_PCM_S32LE) {
83         bps = 32;
84     } else {
85         bps = 16;
86     }
87
88     if (enc->codec_id == CODEC_ID_MP2 || enc->codec_id == CODEC_ID_MP3) {
89         blkalign = enc->frame_size; //this is wrong, but seems many demuxers dont work if this is set correctly
90         //blkalign = 144 * enc->bit_rate/enc->sample_rate;
91     } else if (enc->codec_id == CODEC_ID_ADPCM_G726) { //
92         blkalign = 1;
93     } else if (enc->block_align != 0) { /* specified by the codec */
94         blkalign = enc->block_align;
95     } else
96         blkalign = enc->channels*bps >> 3;
97     if (enc->codec_id == CODEC_ID_PCM_U8 ||
98         enc->codec_id == CODEC_ID_PCM_S24LE ||
99         enc->codec_id == CODEC_ID_PCM_S32LE ||
100         enc->codec_id == CODEC_ID_PCM_S16LE) {
101         bytespersec = enc->sample_rate * blkalign;
102     } else {
103         bytespersec = enc->bit_rate / 8;
104     }
105     put_le32(pb, bytespersec); /* bytes per second */
106     put_le16(pb, blkalign); /* block align */
107     put_le16(pb, bps); /* bits per sample */
108     if (enc->codec_id == CODEC_ID_MP3) {
109         put_le16(pb, 12); /* wav_extra_size */
110         hdrsize += 12;
111         put_le16(pb, 1); /* wID */
112         put_le32(pb, 2); /* fdwFlags */
113         put_le16(pb, 1152); /* nBlockSize */
114         put_le16(pb, 1); /* nFramesPerBlock */
115         put_le16(pb, 1393); /* nCodecDelay */
116     } else if (enc->codec_id == CODEC_ID_MP2) {
117         put_le16(pb, 22); /* wav_extra_size */
118         hdrsize += 22;
119         put_le16(pb, 2);  /* fwHeadLayer */
120         put_le32(pb, enc->bit_rate); /* dwHeadBitrate */
121         put_le16(pb, enc->channels == 2 ? 1 : 8); /* fwHeadMode */
122         put_le16(pb, 0);  /* fwHeadModeExt */
123         put_le16(pb, 1);  /* wHeadEmphasis */
124         put_le16(pb, 16); /* fwHeadFlags */
125         put_le32(pb, 0);  /* dwPTSLow */
126         put_le32(pb, 0);  /* dwPTSHigh */
127     } else if (enc->codec_id == CODEC_ID_ADPCM_IMA_WAV) {
128         put_le16(pb, 2); /* wav_extra_size */
129         hdrsize += 2;
130         put_le16(pb, ((enc->block_align - 4 * enc->channels) / (4 * enc->channels)) * 8 + 1); /* wSamplesPerBlock */
131     } else if(enc->extradata_size){
132         put_le16(pb, enc->extradata_size);
133         put_buffer(pb, enc->extradata, enc->extradata_size);
134         hdrsize += enc->extradata_size;
135         if(hdrsize&1){
136             hdrsize++;
137             put_byte(pb, 0);
138         }
139     } else {
140         hdrsize -= 2;
141     }
142
143     return hdrsize;
144 }
145 #endif //CONFIG_MUXERS
146
147 /* We could be given one of the three possible structures here:
148  * WAVEFORMAT, PCMWAVEFORMAT or WAVEFORMATEX. Each structure
149  * is an expansion of the previous one with the fields added
150  * at the bottom. PCMWAVEFORMAT adds 'WORD wBitsPerSample' and
151  * WAVEFORMATEX adds 'WORD  cbSize' and basically makes itself
152  * an openended structure.
153  */
154 void get_wav_header(ByteIOContext *pb, AVCodecContext *codec, int size)
155 {
156     int id;
157
158     id = get_le16(pb);
159     codec->codec_type = CODEC_TYPE_AUDIO;
160     codec->codec_tag = id;
161     codec->channels = get_le16(pb);
162     codec->sample_rate = get_le32(pb);
163     codec->bit_rate = get_le32(pb) * 8;
164     codec->block_align = get_le16(pb);
165     if (size == 14) {  /* We're dealing with plain vanilla WAVEFORMAT */
166         codec->bits_per_sample = 8;
167     }else
168         codec->bits_per_sample = get_le16(pb);
169     codec->codec_id = wav_codec_get_id(id, codec->bits_per_sample);
170
171     if (size > 16) {  /* We're obviously dealing with WAVEFORMATEX */
172         codec->extradata_size = get_le16(pb);
173         if (codec->extradata_size > 0) {
174             if (codec->extradata_size > size - 18)
175                 codec->extradata_size = size - 18;
176             codec->extradata = av_mallocz(codec->extradata_size + FF_INPUT_BUFFER_PADDING_SIZE);
177             get_buffer(pb, codec->extradata, codec->extradata_size);
178         } else
179             codec->extradata_size = 0;
180
181         /* It is possible for the chunk to contain garbage at the end */
182         if (size - codec->extradata_size - 18 > 0)
183             url_fskip(pb, size - codec->extradata_size - 18);
184     }
185 }
186
187
188 int wav_codec_get_id(unsigned int tag, int bps)
189 {
190     int id;
191     id = codec_get_id(codec_wav_tags, tag);
192     if (id <= 0)
193         return id;
194     /* handle specific u8 codec */
195     if (id == CODEC_ID_PCM_S16LE && bps == 8)
196         id = CODEC_ID_PCM_U8;
197     if (id == CODEC_ID_PCM_S16LE && bps == 24)
198         id = CODEC_ID_PCM_S24LE;
199     if (id == CODEC_ID_PCM_S16LE && bps == 32)
200         id = CODEC_ID_PCM_S32LE;
201     return id;
202 }
203
204 typedef struct {
205     offset_t data;
206     offset_t data_end;
207 } WAVContext;
208
209 #ifdef CONFIG_MUXERS
210 static int wav_write_header(AVFormatContext *s)
211 {
212     WAVContext *wav = s->priv_data;
213     ByteIOContext *pb = &s->pb;
214     offset_t fmt;
215
216     put_tag(pb, "RIFF");
217     put_le32(pb, 0); /* file length */
218     put_tag(pb, "WAVE");
219
220     /* format header */
221     fmt = start_tag(pb, "fmt ");
222     if (put_wav_header(pb, s->streams[0]->codec) < 0) {
223         av_free(wav);
224         return -1;
225     }
226     end_tag(pb, fmt);
227
228     av_set_pts_info(s->streams[0], 64, 1, s->streams[0]->codec->sample_rate);
229
230     /* data header */
231     wav->data = start_tag(pb, "data");
232
233     put_flush_packet(pb);
234
235     return 0;
236 }
237
238 static int wav_write_packet(AVFormatContext *s, AVPacket *pkt)
239 {
240     ByteIOContext *pb = &s->pb;
241     put_buffer(pb, pkt->data, pkt->size);
242     return 0;
243 }
244
245 static int wav_write_trailer(AVFormatContext *s)
246 {
247     ByteIOContext *pb = &s->pb;
248     WAVContext *wav = s->priv_data;
249     offset_t file_size;
250
251     if (!url_is_streamed(&s->pb)) {
252         end_tag(pb, wav->data);
253
254         /* update file size */
255         file_size = url_ftell(pb);
256         url_fseek(pb, 4, SEEK_SET);
257         put_le32(pb, (uint32_t)(file_size - 8));
258         url_fseek(pb, file_size, SEEK_SET);
259
260         put_flush_packet(pb);
261     }
262     return 0;
263 }
264 #endif //CONFIG_MUXERS
265
266 /* return the size of the found tag */
267 /* XXX: > 2GB ? */
268 static int find_tag(ByteIOContext *pb, uint32_t tag1)
269 {
270     unsigned int tag;
271     int size;
272
273     for(;;) {
274         if (url_feof(pb))
275             return -1;
276         tag = get_le32(pb);
277         size = get_le32(pb);
278         if (tag == tag1)
279             break;
280         url_fseek(pb, size, SEEK_CUR);
281     }
282     if (size < 0)
283         size = 0x7fffffff;
284     return size;
285 }
286
287 static int wav_probe(AVProbeData *p)
288 {
289     /* check file header */
290     if (p->buf_size <= 32)
291         return 0;
292     if (p->buf[0] == 'R' && p->buf[1] == 'I' &&
293         p->buf[2] == 'F' && p->buf[3] == 'F' &&
294         p->buf[8] == 'W' && p->buf[9] == 'A' &&
295         p->buf[10] == 'V' && p->buf[11] == 'E')
296         return AVPROBE_SCORE_MAX;
297     else
298         return 0;
299 }
300
301 /* wav input */
302 static int wav_read_header(AVFormatContext *s,
303                            AVFormatParameters *ap)
304 {
305     int size;
306     unsigned int tag;
307     ByteIOContext *pb = &s->pb;
308     AVStream *st;
309     WAVContext *wav = s->priv_data;
310
311     /* check RIFF header */
312     tag = get_le32(pb);
313
314     if (tag != MKTAG('R', 'I', 'F', 'F'))
315         return -1;
316     get_le32(pb); /* file size */
317     tag = get_le32(pb);
318     if (tag != MKTAG('W', 'A', 'V', 'E'))
319         return -1;
320
321     /* parse fmt header */
322     size = find_tag(pb, MKTAG('f', 'm', 't', ' '));
323     if (size < 0)
324         return -1;
325     st = av_new_stream(s, 0);
326     if (!st)
327         return AVERROR_NOMEM;
328
329     get_wav_header(pb, st->codec, size);
330     st->need_parsing = 1;
331
332     av_set_pts_info(st, 64, 1, st->codec->sample_rate);
333
334     size = find_tag(pb, MKTAG('d', 'a', 't', 'a'));
335     if (size < 0)
336         return -1;
337     wav->data_end= url_ftell(pb) + size;
338     return 0;
339 }
340
341 #define MAX_SIZE 4096
342
343 static int wav_read_packet(AVFormatContext *s,
344                            AVPacket *pkt)
345 {
346     int ret, size, left;
347     AVStream *st;
348     WAVContext *wav = s->priv_data;
349
350     if (url_feof(&s->pb))
351         return AVERROR_IO;
352     st = s->streams[0];
353
354     left= wav->data_end - url_ftell(&s->pb);
355     if(left <= 0){
356         left = find_tag(&(s->pb), MKTAG('d', 'a', 't', 'a'));
357         if (left < 0) {
358             return AVERROR_IO;
359         }
360         wav->data_end= url_ftell(&s->pb) + left;
361     }
362
363     size = MAX_SIZE;
364     if (st->codec->block_align > 1) {
365         if (size < st->codec->block_align)
366             size = st->codec->block_align;
367         size = (size / st->codec->block_align) * st->codec->block_align;
368     }
369     size= FFMIN(size, left);
370     if (av_new_packet(pkt, size))
371         return AVERROR_IO;
372     pkt->stream_index = 0;
373
374     ret = get_buffer(&s->pb, pkt->data, pkt->size);
375     if (ret < 0)
376         av_free_packet(pkt);
377     /* note: we need to modify the packet size here to handle the last
378        packet */
379     pkt->size = ret;
380     return ret;
381 }
382
383 static int wav_read_close(AVFormatContext *s)
384 {
385     return 0;
386 }
387
388 static int wav_read_seek(AVFormatContext *s,
389                          int stream_index, int64_t timestamp, int flags)
390 {
391     AVStream *st;
392
393     st = s->streams[0];
394     switch(st->codec->codec_id) {
395     case CODEC_ID_MP2:
396     case CODEC_ID_MP3:
397     case CODEC_ID_AC3:
398     case CODEC_ID_DTS:
399         /* use generic seeking with dynamically generated indexes */
400         return -1;
401     default:
402         break;
403     }
404     return pcm_read_seek(s, stream_index, timestamp, flags);
405 }
406
407 #ifdef CONFIG_WAV_DEMUXER
408 AVInputFormat wav_demuxer = {
409     "wav",
410     "wav format",
411     sizeof(WAVContext),
412     wav_probe,
413     wav_read_header,
414     wav_read_packet,
415     wav_read_close,
416     wav_read_seek,
417 };
418 #endif
419 #ifdef CONFIG_WAV_MUXER
420 AVOutputFormat wav_muxer = {
421     "wav",
422     "wav format",
423     "audio/x-wav",
424     "wav",
425     sizeof(WAVContext),
426     CODEC_ID_PCM_S16LE,
427     CODEC_ID_NONE,
428     wav_write_header,
429     wav_write_packet,
430     wav_write_trailer,
431 };
432 #endif