]> git.sesse.net Git - ffmpeg/blob - libavformat/bink.c
dxva2_vc1: set PQUANT as described by the 2010 spec update
[ffmpeg] / libavformat / bink.c
1 /*
2  * Bink demuxer
3  * Copyright (c) 2008-2010 Peter Ross (pross@xvid.org)
4  * Copyright (c) 2009 Daniel Verkamp (daniel@drv.nu)
5  *
6  * This file is part of FFmpeg.
7  *
8  * FFmpeg is free software; you can redistribute it and/or
9  * modify it under the terms of the GNU Lesser General Public
10  * License as published by the Free Software Foundation; either
11  * version 2.1 of the License, or (at your option) any later version.
12  *
13  * FFmpeg is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16  * Lesser General Public License for more details.
17  *
18  * You should have received a copy of the GNU Lesser General Public
19  * License along with FFmpeg; if not, write to the Free Software
20  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
21  */
22
23 /**
24  * @file
25  * Bink demuxer
26  *
27  * Technical details here:
28  *  http://wiki.multimedia.cx/index.php?title=Bink_Container
29  */
30
31 #include "libavutil/channel_layout.h"
32 #include "libavutil/intreadwrite.h"
33 #include "avformat.h"
34 #include "internal.h"
35
36 enum BinkAudFlags {
37     BINK_AUD_16BITS = 0x4000, ///< prefer 16-bit output
38     BINK_AUD_STEREO = 0x2000,
39     BINK_AUD_USEDCT = 0x1000,
40 };
41
42 #define BINK_EXTRADATA_SIZE     1
43 #define BINK_MAX_AUDIO_TRACKS   256
44 #define BINK_MAX_WIDTH          7680
45 #define BINK_MAX_HEIGHT         4800
46
47 typedef struct {
48     uint32_t file_size;
49
50     uint32_t num_audio_tracks;
51     int current_track;      ///< audio track to return in next packet
52     int64_t video_pts;
53     int64_t audio_pts[BINK_MAX_AUDIO_TRACKS];
54
55     uint32_t remain_packet_size;
56 } BinkDemuxContext;
57
58 static int probe(AVProbeData *p)
59 {
60     const uint8_t *b = p->buf;
61
62     if ( b[0] == 'B' && b[1] == 'I' && b[2] == 'K' &&
63         (b[3] == 'b' || b[3] == 'f' || b[3] == 'g' || b[3] == 'h' || b[3] == 'i') &&
64         AV_RL32(b+8) > 0 &&  // num_frames
65         AV_RL32(b+20) > 0 && AV_RL32(b+20) <= BINK_MAX_WIDTH &&
66         AV_RL32(b+24) > 0 && AV_RL32(b+24) <= BINK_MAX_HEIGHT &&
67         AV_RL32(b+28) > 0 && AV_RL32(b+32) > 0)  // fps num,den
68         return AVPROBE_SCORE_MAX;
69     return 0;
70 }
71
72 static int read_header(AVFormatContext *s)
73 {
74     BinkDemuxContext *bink = s->priv_data;
75     AVIOContext *pb = s->pb;
76     uint32_t fps_num, fps_den;
77     AVStream *vst, *ast;
78     unsigned int i;
79     uint32_t pos, next_pos;
80     uint16_t flags;
81     int keyframe;
82
83     vst = avformat_new_stream(s, NULL);
84     if (!vst)
85         return AVERROR(ENOMEM);
86
87     vst->codec->codec_tag = avio_rl32(pb);
88
89     bink->file_size = avio_rl32(pb) + 8;
90     vst->duration   = avio_rl32(pb);
91
92     if (vst->duration > 1000000) {
93         av_log(s, AV_LOG_ERROR, "invalid header: more than 1000000 frames\n");
94         return AVERROR(EIO);
95     }
96
97     if (avio_rl32(pb) > bink->file_size) {
98         av_log(s, AV_LOG_ERROR,
99                "invalid header: largest frame size greater than file size\n");
100         return AVERROR(EIO);
101     }
102
103     avio_skip(pb, 4);
104
105     vst->codec->width  = avio_rl32(pb);
106     vst->codec->height = avio_rl32(pb);
107
108     fps_num = avio_rl32(pb);
109     fps_den = avio_rl32(pb);
110     if (fps_num == 0 || fps_den == 0) {
111         av_log(s, AV_LOG_ERROR, "invalid header: invalid fps (%d/%d)\n", fps_num, fps_den);
112         return AVERROR(EIO);
113     }
114     avpriv_set_pts_info(vst, 64, fps_den, fps_num);
115     vst->avg_frame_rate = av_inv_q(vst->time_base);
116
117     vst->codec->codec_type = AVMEDIA_TYPE_VIDEO;
118     vst->codec->codec_id   = AV_CODEC_ID_BINKVIDEO;
119     if (ff_get_extradata(vst->codec, pb, 4) < 0)
120         return AVERROR(ENOMEM);
121
122     bink->num_audio_tracks = avio_rl32(pb);
123
124     if (bink->num_audio_tracks > BINK_MAX_AUDIO_TRACKS) {
125         av_log(s, AV_LOG_ERROR,
126                "invalid header: more than "AV_STRINGIFY(BINK_MAX_AUDIO_TRACKS)" audio tracks (%d)\n",
127                bink->num_audio_tracks);
128         return AVERROR(EIO);
129     }
130
131     if (bink->num_audio_tracks) {
132         avio_skip(pb, 4 * bink->num_audio_tracks);
133
134         for (i = 0; i < bink->num_audio_tracks; i++) {
135             ast = avformat_new_stream(s, NULL);
136             if (!ast)
137                 return AVERROR(ENOMEM);
138             ast->codec->codec_type  = AVMEDIA_TYPE_AUDIO;
139             ast->codec->codec_tag   = 0;
140             ast->codec->sample_rate = avio_rl16(pb);
141             avpriv_set_pts_info(ast, 64, 1, ast->codec->sample_rate);
142             flags = avio_rl16(pb);
143             ast->codec->codec_id = flags & BINK_AUD_USEDCT ?
144                                    AV_CODEC_ID_BINKAUDIO_DCT : AV_CODEC_ID_BINKAUDIO_RDFT;
145             if (flags & BINK_AUD_STEREO) {
146                 ast->codec->channels       = 2;
147                 ast->codec->channel_layout = AV_CH_LAYOUT_STEREO;
148             } else {
149                 ast->codec->channels       = 1;
150                 ast->codec->channel_layout = AV_CH_LAYOUT_MONO;
151             }
152             if (ff_alloc_extradata(ast->codec, 4))
153                 return AVERROR(ENOMEM);
154             AV_WL32(ast->codec->extradata, vst->codec->codec_tag);
155         }
156
157         for (i = 0; i < bink->num_audio_tracks; i++)
158             s->streams[i + 1]->id = avio_rl32(pb);
159     }
160
161     /* frame index table */
162     next_pos = avio_rl32(pb);
163     for (i = 0; i < vst->duration; i++) {
164         pos = next_pos;
165         if (i == vst->duration - 1) {
166             next_pos = bink->file_size;
167             keyframe = 0;
168         } else {
169             next_pos = avio_rl32(pb);
170             keyframe = pos & 1;
171         }
172         pos &= ~1;
173         next_pos &= ~1;
174
175         if (next_pos <= pos) {
176             av_log(s, AV_LOG_ERROR, "invalid frame index table\n");
177             return AVERROR(EIO);
178         }
179         av_add_index_entry(vst, pos, i, next_pos - pos, 0,
180                            keyframe ? AVINDEX_KEYFRAME : 0);
181     }
182
183     avio_skip(pb, 4);
184
185     bink->current_track = -1;
186     return 0;
187 }
188
189 static int read_packet(AVFormatContext *s, AVPacket *pkt)
190 {
191     BinkDemuxContext *bink = s->priv_data;
192     AVIOContext *pb = s->pb;
193     int ret;
194
195     if (bink->current_track < 0) {
196         int index_entry;
197         AVStream *st = s->streams[0]; // stream 0 is video stream with index
198
199         if (bink->video_pts >= st->duration)
200             return AVERROR_EOF;
201
202         index_entry = av_index_search_timestamp(st, bink->video_pts,
203                                                 AVSEEK_FLAG_ANY);
204         if (index_entry < 0) {
205             av_log(s, AV_LOG_ERROR,
206                    "could not find index entry for frame %"PRId64"\n",
207                    bink->video_pts);
208             return AVERROR(EIO);
209         }
210
211         bink->remain_packet_size = st->index_entries[index_entry].size;
212         bink->current_track = 0;
213     }
214
215     while (bink->current_track < bink->num_audio_tracks) {
216         uint32_t audio_size = avio_rl32(pb);
217         if (audio_size > bink->remain_packet_size - 4) {
218             av_log(s, AV_LOG_ERROR,
219                    "frame %"PRId64": audio size in header (%u) > size of packet left (%u)\n",
220                    bink->video_pts, audio_size, bink->remain_packet_size);
221             return AVERROR(EIO);
222         }
223         bink->remain_packet_size -= 4 + audio_size;
224         bink->current_track++;
225         if (audio_size >= 4) {
226             /* get one audio packet per track */
227             if ((ret = av_get_packet(pb, pkt, audio_size)) < 0)
228                 return ret;
229             pkt->stream_index = bink->current_track;
230             pkt->pts = bink->audio_pts[bink->current_track - 1];
231
232             /* Each audio packet reports the number of decompressed samples
233                (in bytes). We use this value to calcuate the audio PTS */
234             if (pkt->size >= 4)
235                 bink->audio_pts[bink->current_track -1] +=
236                     AV_RL32(pkt->data) / (2 * s->streams[bink->current_track]->codec->channels);
237             return 0;
238         } else {
239             avio_skip(pb, audio_size);
240         }
241     }
242
243     /* get video packet */
244     if ((ret = av_get_packet(pb, pkt, bink->remain_packet_size)) < 0)
245         return ret;
246     pkt->stream_index = 0;
247     pkt->pts = bink->video_pts++;
248     pkt->flags |= AV_PKT_FLAG_KEY;
249
250     /* -1 instructs the next call to read_packet() to read the next frame */
251     bink->current_track = -1;
252
253     return 0;
254 }
255
256 static int read_seek(AVFormatContext *s, int stream_index, int64_t timestamp, int flags)
257 {
258     BinkDemuxContext *bink = s->priv_data;
259     AVStream *vst = s->streams[0];
260
261     if (!s->pb->seekable)
262         return -1;
263
264     /* seek to the first frame */
265     if (avio_seek(s->pb, vst->index_entries[0].pos, SEEK_SET) < 0)
266         return -1;
267
268     bink->video_pts = 0;
269     memset(bink->audio_pts, 0, sizeof(bink->audio_pts));
270     bink->current_track = -1;
271     return 0;
272 }
273
274 AVInputFormat ff_bink_demuxer = {
275     .name           = "bink",
276     .long_name      = NULL_IF_CONFIG_SMALL("Bink"),
277     .priv_data_size = sizeof(BinkDemuxContext),
278     .read_probe     = probe,
279     .read_header    = read_header,
280     .read_packet    = read_packet,
281     .read_seek      = read_seek,
282 };