]> git.sesse.net Git - ffmpeg/blob - libavformat/4xm.c
avidec: Fix infinite loop caused by rounding of timestamps in non interleaved avis.
[ffmpeg] / libavformat / 4xm.c
1 /*
2  * 4X Technologies .4xm File Demuxer (no muxer)
3  * Copyright (c) 2003  The ffmpeg Project
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 /**
23  * @file
24  * 4X Technologies file demuxer
25  * by Mike Melanson (melanson@pcisys.net)
26  * for more information on the .4xm file format, visit:
27  *   http://www.pcisys.net/~melanson/codecs/
28  */
29
30 #include "libavutil/intreadwrite.h"
31 #include "libavutil/intfloat.h"
32 #include "avformat.h"
33 #include "internal.h"
34
35 #define     RIFF_TAG MKTAG('R', 'I', 'F', 'F')
36 #define  FOURXMV_TAG MKTAG('4', 'X', 'M', 'V')
37 #define     LIST_TAG MKTAG('L', 'I', 'S', 'T')
38 #define     HEAD_TAG MKTAG('H', 'E', 'A', 'D')
39 #define     TRK__TAG MKTAG('T', 'R', 'K', '_')
40 #define     MOVI_TAG MKTAG('M', 'O', 'V', 'I')
41 #define     VTRK_TAG MKTAG('V', 'T', 'R', 'K')
42 #define     STRK_TAG MKTAG('S', 'T', 'R', 'K')
43 #define     std__TAG MKTAG('s', 't', 'd', '_')
44 #define     name_TAG MKTAG('n', 'a', 'm', 'e')
45 #define     vtrk_TAG MKTAG('v', 't', 'r', 'k')
46 #define     strk_TAG MKTAG('s', 't', 'r', 'k')
47 #define     ifrm_TAG MKTAG('i', 'f', 'r', 'm')
48 #define     pfrm_TAG MKTAG('p', 'f', 'r', 'm')
49 #define     cfrm_TAG MKTAG('c', 'f', 'r', 'm')
50 #define     ifr2_TAG MKTAG('i', 'f', 'r', '2')
51 #define     pfr2_TAG MKTAG('p', 'f', 'r', '2')
52 #define     cfr2_TAG MKTAG('c', 'f', 'r', '2')
53 #define     snd__TAG MKTAG('s', 'n', 'd', '_')
54
55 #define vtrk_SIZE 0x44
56 #define strk_SIZE 0x28
57
58 #define GET_LIST_HEADER() \
59     fourcc_tag = avio_rl32(pb); \
60     size = avio_rl32(pb); \
61     if (fourcc_tag != LIST_TAG) \
62         return AVERROR_INVALIDDATA; \
63     fourcc_tag = avio_rl32(pb);
64
65 typedef struct AudioTrack {
66     int sample_rate;
67     int bits;
68     int channels;
69     int stream_index;
70     int adpcm;
71     int64_t audio_pts;
72 } AudioTrack;
73
74 typedef struct FourxmDemuxContext {
75     int width;
76     int height;
77     int video_stream_index;
78     int track_count;
79     AudioTrack *tracks;
80
81     int64_t video_pts;
82     float fps;
83 } FourxmDemuxContext;
84
85 static int fourxm_probe(AVProbeData *p)
86 {
87     if ((AV_RL32(&p->buf[0]) != RIFF_TAG) ||
88         (AV_RL32(&p->buf[8]) != FOURXMV_TAG))
89         return 0;
90
91     return AVPROBE_SCORE_MAX;
92 }
93
94 static int fourxm_read_header(AVFormatContext *s,
95                               AVFormatParameters *ap)
96 {
97     AVIOContext *pb = s->pb;
98     unsigned int fourcc_tag;
99     unsigned int size;
100     int header_size;
101     FourxmDemuxContext *fourxm = s->priv_data;
102     unsigned char *header;
103     int i, ret;
104     AVStream *st;
105
106     fourxm->track_count = 0;
107     fourxm->tracks = NULL;
108     fourxm->fps = 1.0;
109
110     /* skip the first 3 32-bit numbers */
111     avio_skip(pb, 12);
112
113     /* check for LIST-HEAD */
114     GET_LIST_HEADER();
115     header_size = size - 4;
116     if (fourcc_tag != HEAD_TAG || header_size < 0)
117         return AVERROR_INVALIDDATA;
118
119     /* allocate space for the header and load the whole thing */
120     header = av_malloc(header_size);
121     if (!header)
122         return AVERROR(ENOMEM);
123     if (avio_read(pb, header, header_size) != header_size){
124         av_free(header);
125         return AVERROR(EIO);
126     }
127
128     /* take the lazy approach and search for any and all vtrk and strk chunks */
129     for (i = 0; i < header_size - 8; i++) {
130         fourcc_tag = AV_RL32(&header[i]);
131         size = AV_RL32(&header[i + 4]);
132
133         if (fourcc_tag == std__TAG) {
134             fourxm->fps = av_int2float(AV_RL32(&header[i + 12]));
135         } else if (fourcc_tag == vtrk_TAG) {
136             /* check that there is enough data */
137             if (size != vtrk_SIZE) {
138                 ret= AVERROR_INVALIDDATA;
139                 goto fail;
140             }
141             fourxm->width  = AV_RL32(&header[i + 36]);
142             fourxm->height = AV_RL32(&header[i + 40]);
143
144             /* allocate a new AVStream */
145             st = avformat_new_stream(s, NULL);
146             if (!st){
147                 ret= AVERROR(ENOMEM);
148                 goto fail;
149             }
150             avpriv_set_pts_info(st, 60, 1, fourxm->fps);
151
152             fourxm->video_stream_index = st->index;
153
154             st->codec->codec_type = AVMEDIA_TYPE_VIDEO;
155             st->codec->codec_id = CODEC_ID_4XM;
156             st->codec->extradata_size = 4;
157             st->codec->extradata = av_malloc(4);
158             AV_WL32(st->codec->extradata, AV_RL32(&header[i + 16]));
159             st->codec->width  = fourxm->width;
160             st->codec->height = fourxm->height;
161
162             i += 8 + size;
163         } else if (fourcc_tag == strk_TAG) {
164             int current_track;
165             /* check that there is enough data */
166             if (size != strk_SIZE) {
167                 ret= AVERROR_INVALIDDATA;
168                 goto fail;
169             }
170             current_track = AV_RL32(&header[i + 8]);
171             if((unsigned)current_track >= UINT_MAX / sizeof(AudioTrack) - 1){
172                 av_log(s, AV_LOG_ERROR, "current_track too large\n");
173                 ret= -1;
174                 goto fail;
175             }
176             if (current_track + 1 > fourxm->track_count) {
177                 fourxm->tracks = av_realloc_f(fourxm->tracks,
178                                               sizeof(AudioTrack),
179                                               current_track + 1);
180                 if (!fourxm->tracks) {
181                     ret = AVERROR(ENOMEM);
182                     goto fail;
183                 }
184                 memset(&fourxm->tracks[fourxm->track_count], 0,
185                        sizeof(AudioTrack) * (current_track + 1 - fourxm->track_count));
186                 fourxm->track_count = current_track + 1;
187             }
188             fourxm->tracks[current_track].adpcm       = AV_RL32(&header[i + 12]);
189             fourxm->tracks[current_track].channels    = AV_RL32(&header[i + 36]);
190             fourxm->tracks[current_track].sample_rate = AV_RL32(&header[i + 40]);
191             fourxm->tracks[current_track].bits        = AV_RL32(&header[i + 44]);
192             fourxm->tracks[current_track].audio_pts   = 0;
193             if(   fourxm->tracks[current_track].channels    <= 0
194                || fourxm->tracks[current_track].sample_rate <= 0
195                || fourxm->tracks[current_track].bits        <  0){
196                 av_log(s, AV_LOG_ERROR, "audio header invalid\n");
197                 ret= -1;
198                 goto fail;
199             }
200             i += 8 + size;
201
202             /* allocate a new AVStream */
203             st = avformat_new_stream(s, NULL);
204             if (!st){
205                 ret= AVERROR(ENOMEM);
206                 goto fail;
207             }
208
209             st->id = current_track;
210             avpriv_set_pts_info(st, 60, 1, fourxm->tracks[current_track].sample_rate);
211
212             fourxm->tracks[current_track].stream_index = st->index;
213
214             st->codec->codec_type = AVMEDIA_TYPE_AUDIO;
215             st->codec->codec_tag = 0;
216             st->codec->channels              = fourxm->tracks[current_track].channels;
217             st->codec->sample_rate           = fourxm->tracks[current_track].sample_rate;
218             st->codec->bits_per_coded_sample = fourxm->tracks[current_track].bits;
219             st->codec->bit_rate              = st->codec->channels * st->codec->sample_rate *
220                 st->codec->bits_per_coded_sample;
221             st->codec->block_align = st->codec->channels * st->codec->bits_per_coded_sample;
222             if (fourxm->tracks[current_track].adpcm){
223                 st->codec->codec_id = CODEC_ID_ADPCM_4XM;
224             }else if (st->codec->bits_per_coded_sample == 8){
225                 st->codec->codec_id = CODEC_ID_PCM_U8;
226             }else
227                 st->codec->codec_id = CODEC_ID_PCM_S16LE;
228         }
229     }
230
231     /* skip over the LIST-MOVI chunk (which is where the stream should be */
232     GET_LIST_HEADER();
233     if (fourcc_tag != MOVI_TAG){
234         ret= AVERROR_INVALIDDATA;
235         goto fail;
236     }
237
238     av_free(header);
239     /* initialize context members */
240     fourxm->video_pts = -1;  /* first frame will push to 0 */
241
242     return 0;
243 fail:
244     av_freep(&fourxm->tracks);
245     av_free(header);
246     return ret;
247 }
248
249 static int fourxm_read_packet(AVFormatContext *s,
250                               AVPacket *pkt)
251 {
252     FourxmDemuxContext *fourxm = s->priv_data;
253     AVIOContext *pb = s->pb;
254     unsigned int fourcc_tag;
255     unsigned int size;
256     int ret = 0;
257     unsigned int track_number;
258     int packet_read = 0;
259     unsigned char header[8];
260     int audio_frame_count;
261
262     while (!packet_read) {
263
264         if ((ret = avio_read(s->pb, header, 8)) < 0)
265             return ret;
266         fourcc_tag = AV_RL32(&header[0]);
267         size = AV_RL32(&header[4]);
268         if (url_feof(pb))
269             return AVERROR(EIO);
270         switch (fourcc_tag) {
271
272         case LIST_TAG:
273             /* this is a good time to bump the video pts */
274             fourxm->video_pts ++;
275
276             /* skip the LIST-* tag and move on to the next fourcc */
277             avio_rl32(pb);
278             break;
279
280         case ifrm_TAG:
281         case pfrm_TAG:
282         case cfrm_TAG:
283         case ifr2_TAG:
284         case pfr2_TAG:
285         case cfr2_TAG:
286             /* allocate 8 more bytes than 'size' to account for fourcc
287              * and size */
288             if (size + 8 < size || av_new_packet(pkt, size + 8))
289                 return AVERROR(EIO);
290             pkt->stream_index = fourxm->video_stream_index;
291             pkt->pts = fourxm->video_pts;
292             pkt->pos = avio_tell(s->pb);
293             memcpy(pkt->data, header, 8);
294             ret = avio_read(s->pb, &pkt->data[8], size);
295
296             if (ret < 0){
297                 av_free_packet(pkt);
298             }else
299                 packet_read = 1;
300             break;
301
302         case snd__TAG:
303             track_number = avio_rl32(pb);
304             avio_skip(pb, 4);
305             size-=8;
306
307             if (track_number < fourxm->track_count && fourxm->tracks[track_number].channels>0) {
308                 ret= av_get_packet(s->pb, pkt, size);
309                 if(ret<0)
310                     return AVERROR(EIO);
311                 pkt->stream_index =
312                     fourxm->tracks[track_number].stream_index;
313                 pkt->pts = fourxm->tracks[track_number].audio_pts;
314                 packet_read = 1;
315
316                 /* pts accounting */
317                 audio_frame_count = size;
318                 if (fourxm->tracks[track_number].adpcm)
319                     audio_frame_count -=
320                         2 * (fourxm->tracks[track_number].channels);
321                 audio_frame_count /=
322                       fourxm->tracks[track_number].channels;
323                 if (fourxm->tracks[track_number].adpcm){
324                     audio_frame_count *= 2;
325                 }else
326                     audio_frame_count /=
327                     (fourxm->tracks[track_number].bits / 8);
328                 fourxm->tracks[track_number].audio_pts += audio_frame_count;
329
330             } else {
331                 avio_skip(pb, size);
332             }
333             break;
334
335         default:
336             avio_skip(pb, size);
337             break;
338         }
339     }
340     return ret;
341 }
342
343 static int fourxm_read_close(AVFormatContext *s)
344 {
345     FourxmDemuxContext *fourxm = s->priv_data;
346
347     av_freep(&fourxm->tracks);
348
349     return 0;
350 }
351
352 AVInputFormat ff_fourxm_demuxer = {
353     .name           = "4xm",
354     .long_name      = NULL_IF_CONFIG_SMALL("4X Technologies format"),
355     .priv_data_size = sizeof(FourxmDemuxContext),
356     .read_probe     = fourxm_probe,
357     .read_header    = fourxm_read_header,
358     .read_packet    = fourxm_read_packet,
359     .read_close     = fourxm_read_close,
360 };