]> git.sesse.net Git - ffmpeg/blobdiff - libavformat/4xm.c
move time_base (pts_num/pts_den) from AVFormatContext -> AVStream
[ffmpeg] / libavformat / 4xm.c
index c1d5f67e8ceb000259d072b4f57b4a4447dd8896..fd8a8cc0ac945c81fe6382af661e0b1ea4f78a2d 100644 (file)
 
 #include "avformat.h"
 
-#define LE_16(x)  ((((uint8_t*)(x))[1] << 8) | ((uint8_t*)(x))[0])
-#define LE_32(x)  ((((uint8_t*)(x))[3] << 24) | \
-                   (((uint8_t*)(x))[2] << 16) | \
-                   (((uint8_t*)(x))[1] << 8) | \
-                    ((uint8_t*)(x))[0])
-#define BE_16(x)  ((((uint8_t*)(x))[0] << 8) | ((uint8_t*)(x))[1])
-#define BE_32(x)  ((((uint8_t*)(x))[0] << 24) | \
-                   (((uint8_t*)(x))[1] << 16) | \
-                   (((uint8_t*)(x))[2] << 8) | \
-                    ((uint8_t*)(x))[3])
-
-#define FOURCC_TAG( ch0, ch1, ch2, ch3 ) \
-        ( (long)(unsigned char)(ch3) | \
-        ( (long)(unsigned char)(ch2) << 8 ) | \
-        ( (long)(unsigned char)(ch1) << 16 ) | \
-        ( (long)(unsigned char)(ch0) << 24 ) )
-
-#define  RIFF_TAG FOURCC_TAG('R', 'I', 'F', 'F')
-#define _4XMV_TAG FOURCC_TAG('4', 'X', 'M', 'V')
-#define  LIST_TAG FOURCC_TAG('L', 'I', 'S', 'T')
-#define  HEAD_TAG FOURCC_TAG('H', 'E', 'A', 'D')
-#define  TRK__TAG FOURCC_TAG('T', 'R', 'K', '_')
-#define  MOVI_TAG FOURCC_TAG('M', 'O', 'V', 'I')
-#define  VTRK_TAG FOURCC_TAG('V', 'T', 'R', 'K')
-#define  STRK_TAG FOURCC_TAG('S', 'T', 'R', 'K')
-#define  name_TAG FOURCC_TAG('n', 'a', 'm', 'e')
-#define  vtrk_TAG FOURCC_TAG('v', 't', 'r', 'k')
-#define  strk_TAG FOURCC_TAG('s', 't', 'r', 'k')
-#define  ifrm_TAG FOURCC_TAG('i', 'f', 'r', 'm')
-#define  pfrm_TAG FOURCC_TAG('p', 'f', 'r', 'm')
-#define  cfrm_TAG FOURCC_TAG('c', 'f', 'r', 'm')
-#define  snd__TAG FOURCC_TAG('s', 'n', 'd', '_')
-#define  _TAG FOURCC_TAG('', '', '', '')
+#define  RIFF_TAG MKTAG('R', 'I', 'F', 'F')
+#define _4XMV_TAG MKTAG('4', 'X', 'M', 'V')
+#define  LIST_TAG MKTAG('L', 'I', 'S', 'T')
+#define  HEAD_TAG MKTAG('H', 'E', 'A', 'D')
+#define  TRK__TAG MKTAG('T', 'R', 'K', '_')
+#define  MOVI_TAG MKTAG('M', 'O', 'V', 'I')
+#define  VTRK_TAG MKTAG('V', 'T', 'R', 'K')
+#define  STRK_TAG MKTAG('S', 'T', 'R', 'K')
+#define  std__TAG MKTAG('s', 't', 'd', '_')
+#define  name_TAG MKTAG('n', 'a', 'm', 'e')
+#define  vtrk_TAG MKTAG('v', 't', 'r', 'k')
+#define  strk_TAG MKTAG('s', 't', 'r', 'k')
+#define  ifrm_TAG MKTAG('i', 'f', 'r', 'm')
+#define  pfrm_TAG MKTAG('p', 'f', 'r', 'm')
+#define  cfrm_TAG MKTAG('c', 'f', 'r', 'm')
+#define  snd__TAG MKTAG('s', 'n', 'd', '_')
 
 #define vtrk_SIZE 0x44
 #define strk_SIZE 0x28
 
 #define GET_LIST_HEADER() \
-    fourcc_tag = get_be32(pb); \
+    fourcc_tag = get_le32(pb); \
     size = get_le32(pb); \
     if (fourcc_tag != LIST_TAG) \
         return AVERROR_INVALIDDATA; \
-    fourcc_tag = get_be32(pb);
+    fourcc_tag = get_le32(pb);
 
 typedef struct AudioTrack {
     int sample_rate;
     int bits;
     int channels;
+    int stream_index;
+    int adpcm;
 } AudioTrack;
 
 typedef struct FourxmDemuxContext {
     int width;
     int height;
+    int video_stream_index;
     int track_count;
     AudioTrack *tracks;
     int selected_track;
+
+    int64_t audio_pts;
+    int64_t video_pts;
+    int video_pts_inc;
+    float fps;
 } FourxmDemuxContext;
 
+static float get_le_float(unsigned char *buffer)
+{
+    float f;
+    unsigned char *float_buffer = (unsigned char *)&f;
+
+#ifdef WORDS_BIGENDIAN
+    float_buffer[0] = buffer[3];
+    float_buffer[1] = buffer[2];
+    float_buffer[2] = buffer[1];
+    float_buffer[3] = buffer[0];
+#else
+    float_buffer[0] = buffer[0];
+    float_buffer[1] = buffer[1];
+    float_buffer[2] = buffer[2];
+    float_buffer[3] = buffer[3];
+#endif
+
+    return f;
+}
+
 static int fourxm_probe(AVProbeData *p)
 {
-    if ((BE_32(&p->buf[0]) != RIFF_TAG) ||
-        (BE_32(&p->buf[8]) != _4XMV_TAG))
+    if (p->buf_size < 12)
         return 0;
 
-printf ("  detected .4xm file\n");
+    if ((LE_32(&p->buf[0]) != RIFF_TAG) ||
+        (LE_32(&p->buf[8]) != _4XMV_TAG))
+        return 0;
 
     return AVPROBE_SCORE_MAX;
 }
 
 static int fourxm_read_header(AVFormatContext *s,
-                             AVFormatParameters *ap)
+                              AVFormatParameters *ap)
 {
     ByteIOContext *pb = &s->pb;
     unsigned int fourcc_tag;
@@ -112,6 +124,7 @@ static int fourxm_read_header(AVFormatContext *s,
     fourxm->track_count = 0;
     fourxm->tracks = NULL;
     fourxm->selected_track = 0;
+    fourxm->fps = 1.0;
 
     /* skip the first 3 32-bit numbers */
     url_fseek(pb, 12, SEEK_CUR);
@@ -131,10 +144,13 @@ static int fourxm_read_header(AVFormatContext *s,
 
     /* take the lazy approach and search for any and all vtrk and strk chunks */
     for (i = 0; i < header_size - 8; i++) {
-        fourcc_tag = BE_32(&header[i]);
+        fourcc_tag = LE_32(&header[i]);
         size = LE_32(&header[i + 4]);
 
-        if (fourcc_tag == vtrk_TAG) {
+        if (fourcc_tag == std__TAG) {
+            fourxm->fps = get_le_float(&header[i + 12]);
+            fourxm->video_pts_inc = (int)(90000.0 / fourxm->fps);
+        } else if (fourcc_tag == vtrk_TAG) {
             /* check that there is enough data */
             if (size != vtrk_SIZE) {
                 av_free(header);
@@ -143,6 +159,23 @@ static int fourxm_read_header(AVFormatContext *s,
             fourxm->width = LE_32(&header[i + 36]);
             fourxm->height = LE_32(&header[i + 40]);
             i += 8 + size;
+
+            /* allocate a new AVStream */
+            st = av_new_stream(s, 0);
+            if (!st)
+                return AVERROR_NOMEM;
+            av_set_pts_info(st, 33, 1, 90000);
+
+            fourxm->video_stream_index = st->index;
+
+            st->codec.frame_rate = fourxm->fps;
+            st->codec.frame_rate_base = 1.0;
+            st->codec.codec_type = CODEC_TYPE_VIDEO;
+            st->codec.codec_id = CODEC_ID_4XM;
+            st->codec.codec_tag = 0;  /* no fourcc */
+            st->codec.width = fourxm->width;
+            st->codec.height = fourxm->height;
+
         } else if (fourcc_tag == strk_TAG) {
             /* check that there is enough data */
             if (size != strk_SIZE) {
@@ -151,17 +184,44 @@ static int fourxm_read_header(AVFormatContext *s,
             }
             current_track = LE_32(&header[i + 8]);
             if (current_track + 1 > fourxm->track_count) {
-                fourxm->track_count++;
-                fourxm->tracks = av_realloc(fourxm->tracks, fourxm->track_count);
+                fourxm->track_count = current_track + 1;
+                fourxm->tracks = av_realloc(fourxm->tracks, 
+                    fourxm->track_count * sizeof(AudioTrack));
                 if (!fourxm->tracks) {
                     av_free(header);
                     return AVERROR_NOMEM;
                 }
             }
+            fourxm->tracks[current_track].adpcm = LE_32(&header[i + 12]);
             fourxm->tracks[current_track].channels = LE_32(&header[i + 36]);
             fourxm->tracks[current_track].sample_rate = LE_32(&header[i + 40]);
             fourxm->tracks[current_track].bits = LE_32(&header[i + 44]);
             i += 8 + size;
+
+            /* allocate a new AVStream */
+            st = av_new_stream(s, current_track);
+            if (!st)
+                return AVERROR_NOMEM;
+
+            /* set the pts reference (1 pts = 1/90000) */
+            av_set_pts_info(st, 33, 1, 90000);
+
+            fourxm->tracks[current_track].stream_index = st->index;
+
+            st->codec.codec_type = CODEC_TYPE_AUDIO;
+            st->codec.codec_tag = 1;
+            st->codec.channels = fourxm->tracks[current_track].channels;
+            st->codec.sample_rate = fourxm->tracks[current_track].sample_rate;
+            st->codec.bits_per_sample = fourxm->tracks[current_track].bits;
+            st->codec.bit_rate = st->codec.channels * st->codec.sample_rate *
+                st->codec.bits_per_sample;
+            st->codec.block_align = st->codec.channels * st->codec.bits_per_sample;
+            if (fourxm->tracks[current_track].adpcm)
+                st->codec.codec_id = CODEC_ID_ADPCM_4XM;
+            else if (st->codec.bits_per_sample == 8)
+                st->codec.codec_id = CODEC_ID_PCM_U8;
+            else
+                st->codec.codec_id = CODEC_ID_PCM_S16LE;
         }
     }
 
@@ -172,87 +232,100 @@ static int fourxm_read_header(AVFormatContext *s,
     if (fourcc_tag != MOVI_TAG)
         return AVERROR_INVALIDDATA;
 
-    if (current_track > -1) {
-        st = av_new_stream(s, 0);
-        if (!st)
-            return AVERROR_NOMEM;
-
-        st->codec.codec_type = CODEC_TYPE_AUDIO;
-        st->codec.codec_tag = 1;
-        st->codec.channels = fourxm->tracks[current_track].channels;
-        st->codec.sample_rate = fourxm->tracks[current_track].sample_rate;
-        st->codec.bits_per_sample = fourxm->tracks[current_track].bits;
-        st->codec.bit_rate = st->codec.channels * st->codec.sample_rate *
-            st->codec.bits_per_sample;
-        st->codec.block_align = st->codec.channels * st->codec.bits_per_sample;
-        if (st->codec.bits_per_sample == 8)
-            st->codec.codec_id = CODEC_ID_PCM_U8;
-        else
-            st->codec.codec_id = CODEC_ID_PCM_S16LE;
-    }
+    /* initialize context members */
+    fourxm->video_pts = -fourxm->video_pts_inc;  /* first frame will push to 0 */
+    fourxm->audio_pts = 0;
 
     return 0;
 }
 
 static int fourxm_read_packet(AVFormatContext *s,
-                             AVPacket *pkt)
+                              AVPacket *pkt)
 {
     FourxmDemuxContext *fourxm = s->priv_data;
     ByteIOContext *pb = &s->pb;
     unsigned int fourcc_tag;
-    unsigned int size;
+    unsigned int size, out_size;
     int ret = 0;
     int track_number;
     int packet_read = 0;
+    unsigned char header[8];
+    int64_t pts_inc;
+    int audio_frame_count;
 
     while (!packet_read) {
 
-        fourcc_tag = get_be32(pb);
-        size = get_le32(pb);
-        if (fourcc_tag == LIST_TAG) {
-            /* skip the LIST-FRAM tag and get the next fourcc */
-            get_be32(pb);
-            fourcc_tag = get_be32(pb);
-            size = get_le32(pb);
-        }
-
+        if ((ret = get_buffer(&s->pb, header, 8)) < 0)
+            return ret;
+        fourcc_tag = LE_32(&header[0]);
+        size = LE_32(&header[4]);
         if (url_feof(pb))
             return -EIO;
-
         switch (fourcc_tag) {
 
-        case ifrm_TAG:
-printf (" %cfrm chunk\n", (char)(fourcc_tag >> 24) & 0xFF);
-url_fseek(pb, size, SEEK_CUR);
+        case LIST_TAG:
+            /* this is a good time to bump the video pts */
+            fourxm->video_pts += fourxm->video_pts_inc;
+
+            /* skip the LIST-* tag and move on to the next fourcc */
+            get_le32(pb);
             break;
+
+        case ifrm_TAG:
         case pfrm_TAG:
-printf (" %cfrm chunk\n", (char)(fourcc_tag >> 24) & 0xFF);
-url_fseek(pb, size, SEEK_CUR);
-            break;
         case cfrm_TAG:{
-int unknown= get_le32(pb);
-int id= get_le32(pb);
-int whole= get_le32(pb);
-static int stats[1000];
-stats[id] += size - 12;
-printf(" cfrm chunk id:%d size:%d whole:%d until now:%d\n", id, size, whole, stats[id]);
-url_fseek(pb, size-12, SEEK_CUR);
+
+            /* allocate 8 more bytes than 'size' to account for fourcc
+             * and size */
+            if (av_new_packet(pkt, size + 8))
+                return -EIO;
+            pkt->stream_index = fourxm->video_stream_index;
+            pkt->pts = fourxm->video_pts;
+            memcpy(pkt->data, header, 8);
+            ret = get_buffer(&s->pb, &pkt->data[8], size);
+
+            if (ret < 0)
+                av_free_packet(pkt);
+            else
+                packet_read = 1;
             break;
         }
+
         case snd__TAG:
-printf (" snd_ chunk, ");
             track_number = get_le32(pb);
-            size = get_le32(pb);
+            out_size= get_le32(pb);
+            size-=8;
+
             if (track_number == fourxm->selected_track) {
-printf ("correct track, dispatching...\n");
                 if (av_new_packet(pkt, size))
                     return -EIO;
+                pkt->stream_index = 
+                    fourxm->tracks[fourxm->selected_track].stream_index;
+                pkt->pts = fourxm->audio_pts;
                 ret = get_buffer(&s->pb, pkt->data, size);
                 if (ret < 0)
                     av_free_packet(pkt);
-                packet_read = 1;
+                else
+                    packet_read = 1;
+
+                /* pts accounting */
+                audio_frame_count = size;
+                if (fourxm->tracks[fourxm->selected_track].adpcm)
+                    audio_frame_count -= 
+                        2 * (fourxm->tracks[fourxm->selected_track].channels);
+                audio_frame_count /=
+                      fourxm->tracks[fourxm->selected_track].channels;
+                if (fourxm->tracks[fourxm->selected_track].adpcm)
+                    audio_frame_count *= 2;
+                else 
+                    audio_frame_count /=
+                    (fourxm->tracks[fourxm->selected_track].bits / 8);
+                pts_inc = audio_frame_count;
+                pts_inc *= 90000;
+                pts_inc /= fourxm->tracks[fourxm->selected_track].sample_rate;
+                fourxm->audio_pts += pts_inc;
+
             } else {
-printf ("wrong track, skipping...\n");
                 url_fseek(pb, size, SEEK_CUR);
             }
             break;
@@ -262,7 +335,6 @@ printf ("wrong track, skipping...\n");
             break;
         }
     }
-
     return ret;
 }