]> git.sesse.net Git - ffmpeg/blob - libavformat/wav.c
fix mp3 muxing
[ffmpeg] / libavformat / wav.c
1 /*
2  * WAV encoder and decoder
3  * Copyright (c) 2001, 2002 Fabrice Bellard.
4  *
5  * This library is free software; you can redistribute it and/or
6  * modify it under the terms of the GNU Lesser General Public
7  * License as published by the Free Software Foundation; either
8  * version 2 of the License, or (at your option) any later version.
9  *
10  * This library is distributed in the hope that it will be useful,
11  * but WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * Lesser General Public License for more details.
14  *
15  * You should have received a copy of the GNU Lesser General Public
16  * License along with this library; if not, write to the Free Software
17  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
18  */
19 #include "avformat.h"
20 #include "avi.h"
21
22 const CodecTag codec_wav_tags[] = {
23     { CODEC_ID_MP2, 0x50 },
24     { CODEC_ID_MP3, 0x55 },
25     { CODEC_ID_AC3, 0x2000 },
26     { CODEC_ID_DTS, 0x2001 },
27     { CODEC_ID_PCM_S16LE, 0x01 },
28     { CODEC_ID_PCM_U8, 0x01 }, /* must come after s16le in this list */
29     { CODEC_ID_PCM_S24LE, 0x01 },
30     { CODEC_ID_PCM_S32LE, 0x01 },
31     { CODEC_ID_PCM_ALAW, 0x06 },
32     { CODEC_ID_PCM_MULAW, 0x07 },
33     { CODEC_ID_ADPCM_MS, 0x02 },
34     { CODEC_ID_ADPCM_IMA_WAV, 0x11 },
35     { CODEC_ID_ADPCM_YAMAHA, 0x20 },
36     { CODEC_ID_ADPCM_G726, 0x45 },
37     { CODEC_ID_ADPCM_IMA_DK4, 0x61 },  /* rogue format number */
38     { CODEC_ID_ADPCM_IMA_DK3, 0x62 },  /* rogue format number */
39     { CODEC_ID_WMAV1, 0x160 },
40     { CODEC_ID_WMAV2, 0x161 },
41     { CODEC_ID_AAC, 0x706d },
42     { CODEC_ID_VORBIS, ('V'<<8)+'o' }, //HACK/FIXME, does vorbis in WAV/AVI have an (in)official id?
43     { CODEC_ID_SONIC, 0x2048 },
44     { CODEC_ID_SONIC_LS, 0x2048 },
45     { CODEC_ID_ADPCM_CT, 0x200 },
46     { CODEC_ID_ADPCM_SWF, ('S'<<8)+'F' },
47     { CODEC_ID_TRUESPEECH, 0x22 },
48
49     // for NuppelVideo (nuv.c)
50     { CODEC_ID_PCM_S16LE, MKTAG('R', 'A', 'W', 'A') },
51     { CODEC_ID_MP3, MKTAG('L', 'A', 'M', 'E') },
52     { 0, 0 },
53 };
54
55 #ifdef CONFIG_MUXERS
56 /* WAVEFORMATEX header */
57 /* returns the size or -1 on error */
58 int put_wav_header(ByteIOContext *pb, AVCodecContext *enc)
59 {
60     int bps, blkalign, bytespersec;
61     int hdrsize = 18;
62
63     if(!enc->codec_tag)
64        enc->codec_tag = codec_get_tag(codec_wav_tags, enc->codec_id);
65     if(!enc->codec_tag)
66         return -1;
67
68     put_le16(pb, enc->codec_tag);
69     put_le16(pb, enc->channels);
70     put_le32(pb, enc->sample_rate);
71     if (enc->codec_id == CODEC_ID_PCM_U8 ||
72         enc->codec_id == CODEC_ID_PCM_ALAW ||
73         enc->codec_id == CODEC_ID_PCM_MULAW) {
74         bps = 8;
75     } else if (enc->codec_id == CODEC_ID_MP2 || enc->codec_id == CODEC_ID_MP3) {
76         bps = 0;
77     } else if (enc->codec_id == CODEC_ID_ADPCM_IMA_WAV || enc->codec_id == CODEC_ID_ADPCM_MS || enc->codec_id == CODEC_ID_ADPCM_G726 || enc->codec_id == CODEC_ID_ADPCM_YAMAHA) { //
78         bps = 4;
79     } else if (enc->codec_id == CODEC_ID_PCM_S24LE) {
80         bps = 24;
81     } else if (enc->codec_id == CODEC_ID_PCM_S32LE) {
82         bps = 32;
83     } else {
84         bps = 16;
85     }
86
87     if (enc->codec_id == CODEC_ID_MP2 || enc->codec_id == CODEC_ID_MP3) {
88         blkalign = enc->frame_size; //this is wrong, but seems many demuxers dont work if this is set correctly
89         //blkalign = 144 * enc->bit_rate/enc->sample_rate;
90     } else if (enc->codec_id == CODEC_ID_ADPCM_G726) { //
91         blkalign = 1;
92     } else if (enc->block_align != 0) { /* specified by the codec */
93         blkalign = enc->block_align;
94     } else
95         blkalign = enc->channels*bps >> 3;
96     if (enc->codec_id == CODEC_ID_PCM_U8 ||
97         enc->codec_id == CODEC_ID_PCM_S24LE ||
98         enc->codec_id == CODEC_ID_PCM_S32LE ||
99         enc->codec_id == CODEC_ID_PCM_S16LE) {
100         bytespersec = enc->sample_rate * blkalign;
101     } else {
102         bytespersec = enc->bit_rate / 8;
103     }
104     put_le32(pb, bytespersec); /* bytes per second */
105     put_le16(pb, blkalign); /* block align */
106     put_le16(pb, bps); /* bits per sample */
107     if (enc->codec_id == CODEC_ID_MP3) {
108         put_le16(pb, 12); /* wav_extra_size */
109         hdrsize += 12;
110         put_le16(pb, 1); /* wID */
111         put_le32(pb, 2); /* fdwFlags */
112         put_le16(pb, 1152); /* nBlockSize */
113         put_le16(pb, 1); /* nFramesPerBlock */
114         put_le16(pb, 1393); /* nCodecDelay */
115     } else if (enc->codec_id == CODEC_ID_MP2) {
116         put_le16(pb, 22); /* wav_extra_size */
117         hdrsize += 22;
118         put_le16(pb, 2);  /* fwHeadLayer */
119         put_le32(pb, enc->bit_rate); /* dwHeadBitrate */
120         put_le16(pb, enc->channels == 2 ? 1 : 8); /* fwHeadMode */
121         put_le16(pb, 0);  /* fwHeadModeExt */
122         put_le16(pb, 1);  /* wHeadEmphasis */
123         put_le16(pb, 16); /* fwHeadFlags */
124         put_le32(pb, 0);  /* dwPTSLow */
125         put_le32(pb, 0);  /* dwPTSHigh */
126     } else if (enc->codec_id == CODEC_ID_ADPCM_IMA_WAV) {
127         put_le16(pb, 2); /* wav_extra_size */
128         hdrsize += 2;
129         put_le16(pb, ((enc->block_align - 4 * enc->channels) / (4 * enc->channels)) * 8 + 1); /* wSamplesPerBlock */
130     } else if(enc->extradata_size){
131         put_le16(pb, enc->extradata_size);
132         put_buffer(pb, enc->extradata, enc->extradata_size);
133         hdrsize += enc->extradata_size;
134         if(hdrsize&1){
135             hdrsize++;
136             put_byte(pb, 0);
137         }
138     } else {
139         hdrsize -= 2;
140     }
141
142     return hdrsize;
143 }
144 #endif //CONFIG_MUXERS
145
146 /* We could be given one of the three possible structures here:
147  * WAVEFORMAT, PCMWAVEFORMAT or WAVEFORMATEX. Each structure
148  * is an expansion of the previous one with the fields added
149  * at the bottom. PCMWAVEFORMAT adds 'WORD wBitsPerSample' and
150  * WAVEFORMATEX adds 'WORD  cbSize' and basically makes itself
151  * an openended structure.
152  */
153 void get_wav_header(ByteIOContext *pb, AVCodecContext *codec, int size)
154 {
155     int id;
156
157     id = get_le16(pb);
158     codec->codec_type = CODEC_TYPE_AUDIO;
159     codec->codec_tag = id;
160     codec->channels = get_le16(pb);
161     codec->sample_rate = get_le32(pb);
162     codec->bit_rate = get_le32(pb) * 8;
163     codec->block_align = get_le16(pb);
164     if (size == 14) {  /* We're dealing with plain vanilla WAVEFORMAT */
165         codec->bits_per_sample = 8;
166     }else
167         codec->bits_per_sample = get_le16(pb);
168     codec->codec_id = wav_codec_get_id(id, codec->bits_per_sample);
169
170     if (size > 16) {  /* We're obviously dealing with WAVEFORMATEX */
171         codec->extradata_size = get_le16(pb);
172         if (codec->extradata_size > 0) {
173             if (codec->extradata_size > size - 18)
174                 codec->extradata_size = size - 18;
175             codec->extradata = av_mallocz(codec->extradata_size + FF_INPUT_BUFFER_PADDING_SIZE);
176             get_buffer(pb, codec->extradata, codec->extradata_size);
177         } else
178             codec->extradata_size = 0;
179
180         /* It is possible for the chunk to contain garbage at the end */
181         if (size - codec->extradata_size - 18 > 0)
182             url_fskip(pb, size - codec->extradata_size - 18);
183     }
184 }
185
186
187 int wav_codec_get_id(unsigned int tag, int bps)
188 {
189     int id;
190     id = codec_get_id(codec_wav_tags, tag);
191     if (id <= 0)
192         return id;
193     /* handle specific u8 codec */
194     if (id == CODEC_ID_PCM_S16LE && bps == 8)
195         id = CODEC_ID_PCM_U8;
196     if (id == CODEC_ID_PCM_S16LE && bps == 24)
197         id = CODEC_ID_PCM_S24LE;
198     if (id == CODEC_ID_PCM_S16LE && bps == 32)
199         id = CODEC_ID_PCM_S32LE;
200     return id;
201 }
202
203 #ifdef CONFIG_MUXERS
204 typedef struct {
205     offset_t data;
206 } WAVContext;
207
208 static int wav_write_header(AVFormatContext *s)
209 {
210     WAVContext *wav = s->priv_data;
211     ByteIOContext *pb = &s->pb;
212     offset_t fmt;
213
214     put_tag(pb, "RIFF");
215     put_le32(pb, 0); /* file length */
216     put_tag(pb, "WAVE");
217
218     /* format header */
219     fmt = start_tag(pb, "fmt ");
220     if (put_wav_header(pb, s->streams[0]->codec) < 0) {
221         av_free(wav);
222         return -1;
223     }
224     end_tag(pb, fmt);
225
226     av_set_pts_info(s->streams[0], 64, 1, s->streams[0]->codec->sample_rate);
227
228     /* data header */
229     wav->data = start_tag(pb, "data");
230
231     put_flush_packet(pb);
232
233     return 0;
234 }
235
236 static int wav_write_packet(AVFormatContext *s, AVPacket *pkt)
237 {
238     ByteIOContext *pb = &s->pb;
239     put_buffer(pb, pkt->data, pkt->size);
240     return 0;
241 }
242
243 static int wav_write_trailer(AVFormatContext *s)
244 {
245     ByteIOContext *pb = &s->pb;
246     WAVContext *wav = s->priv_data;
247     offset_t file_size;
248
249     if (!url_is_streamed(&s->pb)) {
250         end_tag(pb, wav->data);
251
252         /* update file size */
253         file_size = url_ftell(pb);
254         url_fseek(pb, 4, SEEK_SET);
255         put_le32(pb, (uint32_t)(file_size - 8));
256         url_fseek(pb, file_size, SEEK_SET);
257
258         put_flush_packet(pb);
259     }
260     return 0;
261 }
262 #endif //CONFIG_MUXERS
263
264 /* return the size of the found tag */
265 /* XXX: > 2GB ? */
266 static int find_tag(ByteIOContext *pb, uint32_t tag1)
267 {
268     unsigned int tag;
269     int size;
270
271     for(;;) {
272         if (url_feof(pb))
273             return -1;
274         tag = get_le32(pb);
275         size = get_le32(pb);
276         if (tag == tag1)
277             break;
278         url_fseek(pb, size, SEEK_CUR);
279     }
280     if (size < 0)
281         size = 0x7fffffff;
282     return size;
283 }
284
285 static int wav_probe(AVProbeData *p)
286 {
287     /* check file header */
288     if (p->buf_size <= 32)
289         return 0;
290     if (p->buf[0] == 'R' && p->buf[1] == 'I' &&
291         p->buf[2] == 'F' && p->buf[3] == 'F' &&
292         p->buf[8] == 'W' && p->buf[9] == 'A' &&
293         p->buf[10] == 'V' && p->buf[11] == 'E')
294         return AVPROBE_SCORE_MAX;
295     else
296         return 0;
297 }
298
299 /* wav input */
300 static int wav_read_header(AVFormatContext *s,
301                            AVFormatParameters *ap)
302 {
303     int size;
304     unsigned int tag;
305     ByteIOContext *pb = &s->pb;
306     AVStream *st;
307
308     /* check RIFF header */
309     tag = get_le32(pb);
310
311     if (tag != MKTAG('R', 'I', 'F', 'F'))
312         return -1;
313     get_le32(pb); /* file size */
314     tag = get_le32(pb);
315     if (tag != MKTAG('W', 'A', 'V', 'E'))
316         return -1;
317
318     /* parse fmt header */
319     size = find_tag(pb, MKTAG('f', 'm', 't', ' '));
320     if (size < 0)
321         return -1;
322     st = av_new_stream(s, 0);
323     if (!st)
324         return AVERROR_NOMEM;
325
326     get_wav_header(pb, st->codec, size);
327     st->need_parsing = 1;
328
329     av_set_pts_info(st, 64, 1, st->codec->sample_rate);
330
331     size = find_tag(pb, MKTAG('d', 'a', 't', 'a'));
332     if (size < 0)
333         return -1;
334     return 0;
335 }
336
337 #define MAX_SIZE 4096
338
339 static int wav_read_packet(AVFormatContext *s,
340                            AVPacket *pkt)
341 {
342     int ret, size;
343     AVStream *st;
344
345     if (url_feof(&s->pb))
346         return AVERROR_IO;
347     st = s->streams[0];
348
349     size = MAX_SIZE;
350     if (st->codec->block_align > 1) {
351         if (size < st->codec->block_align)
352             size = st->codec->block_align;
353         size = (size / st->codec->block_align) * st->codec->block_align;
354     }
355     if (av_new_packet(pkt, size))
356         return AVERROR_IO;
357     pkt->stream_index = 0;
358
359     ret = get_buffer(&s->pb, pkt->data, pkt->size);
360     if (ret < 0)
361         av_free_packet(pkt);
362     /* note: we need to modify the packet size here to handle the last
363        packet */
364     pkt->size = ret;
365     return ret;
366 }
367
368 static int wav_read_close(AVFormatContext *s)
369 {
370     return 0;
371 }
372
373 static int wav_read_seek(AVFormatContext *s,
374                          int stream_index, int64_t timestamp, int flags)
375 {
376     AVStream *st;
377
378     st = s->streams[0];
379     switch(st->codec->codec_id) {
380     case CODEC_ID_MP2:
381     case CODEC_ID_MP3:
382     case CODEC_ID_AC3:
383     case CODEC_ID_DTS:
384         /* use generic seeking with dynamically generated indexes */
385         return -1;
386     default:
387         break;
388     }
389     return pcm_read_seek(s, stream_index, timestamp, flags);
390 }
391
392
393 static AVInputFormat wav_iformat = {
394     "wav",
395     "wav format",
396     0,
397     wav_probe,
398     wav_read_header,
399     wav_read_packet,
400     wav_read_close,
401     wav_read_seek,
402 };
403
404 #ifdef CONFIG_MUXERS
405 static AVOutputFormat wav_oformat = {
406     "wav",
407     "wav format",
408     "audio/x-wav",
409     "wav",
410     sizeof(WAVContext),
411     CODEC_ID_PCM_S16LE,
412     CODEC_ID_NONE,
413     wav_write_header,
414     wav_write_packet,
415     wav_write_trailer,
416 };
417 #endif //CONFIG_MUXERS
418
419 int ff_wav_init(void)
420 {
421     av_register_input_format(&wav_iformat);
422 #ifdef CONFIG_MUXERS
423     av_register_output_format(&wav_oformat);
424 #endif //CONFIG_MUXERS
425     return 0;
426 }