]> git.sesse.net Git - ffmpeg/blob - libavformat/vividas.c
avcodec/adpcm: add support for 5.1 ADPCM MS
[ffmpeg] / libavformat / vividas.c
1 /*
2  * Vividas VIV format Demuxer
3  * Copyright (c) 2012 Krzysztof Klinikowski
4  * Copyright (c) 2010 Andrzej Szombierski
5  * based on vivparse Copyright (c) 2007 Måns Rullgård
6  *
7  * This file is part of FFmpeg.
8  *
9  * FFmpeg is free software; you can redistribute it and/or
10  * modify it under the terms of the GNU Lesser General Public
11  * License as published by the Free Software Foundation; either
12  * version 2.1 of the License, or (at your option) any later version.
13  *
14  * FFmpeg is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
17  * Lesser General Public License for more details.
18  *
19  * You should have received a copy of the GNU Lesser General Public
20  * License along with FFmpeg; if not, write to the Free Software
21  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
22  */
23
24 /**
25  * @file
26  * @brief Vividas VIV (.viv) file demuxer
27  * @author Andrzej Szombierski [qq at kuku eu org] (2010-07)
28  * @sa http://wiki.multimedia.cx/index.php?title=Vividas_VIV
29  */
30
31 #include "libavutil/intreadwrite.h"
32 #include "avio_internal.h"
33 #include "avformat.h"
34 #include "internal.h"
35
36 #define MAX_AUDIO_SUBPACKETS 100
37
38 typedef struct VIV_SB_block {
39     int size, n_packets;
40     int64_t byte_offset;
41     int64_t packet_offset;
42 } VIV_SB_block;
43
44 typedef struct VIV_SB_entry {
45     int size, flag;
46 } VIV_SB_entry;
47
48 typedef struct VIV_AudioSubpacket {
49     int start, pcm_bytes;
50 } VIV_AudioSubpacket;
51
52 typedef struct VividasDemuxContext {
53     int n_sb_blocks;
54     VIV_SB_block *sb_blocks;
55
56     uint32_t sb_key;
57     int64_t sb_offset;
58
59     int current_sb, current_sb_entry;
60     uint8_t *sb_buf;
61     AVIOContext *sb_pb;
62     int n_sb_entries;
63     VIV_SB_entry *sb_entries;
64
65     int n_audio_subpackets;
66     int current_audio_subpacket;
67
68     int64_t audio_sample;
69
70     VIV_AudioSubpacket audio_subpackets[MAX_AUDIO_SUBPACKETS];
71 } VividasDemuxContext;
72
73 static int viv_probe(const AVProbeData *p)
74 {
75     if (memcmp(p->buf, "vividas03", 9))
76         return 0;
77
78     return AVPROBE_SCORE_MAX;
79 }
80
81 static const uint8_t keybits[32] = {
82  20,  52, 111,  10,  27,  71, 142,  53,
83  82, 138,   1,  78,  86, 121, 183,  85,
84 105, 152,  39, 140, 172,  11,  64, 144,
85 155,   6,  71, 163, 186,  49, 126,  43,
86 };
87
88 static uint32_t decode_key(uint8_t *buf)
89 {
90     uint32_t key = 0;
91
92     for (int i = 0; i < 32; i++) {
93         unsigned p = keybits[i];
94         key |= ((buf[p] >> ((i*5+3)&7)) & 1u) << i;
95     }
96
97     return key;
98 }
99
100 static void put_v(uint8_t *p, unsigned v)
101 {
102     if (v>>28)
103         *p++ = ((v>>28)&0x7f)|0x80;
104     if (v>>21)
105         *p++ = ((v>>21)&0x7f)|0x80;
106     if (v>>14)
107         *p++ = ((v>>14)&0x7f)|0x80;
108     if (v>>7)
109         *p++ =  ((v>>7)&0x7f)|0x80;
110 }
111
112 static unsigned recover_key(unsigned char sample[4], unsigned expected_size)
113 {
114     unsigned char plaintext[8] = { 'S', 'B' };
115
116     put_v(plaintext+2, expected_size);
117
118     return AV_RL32(sample) ^ AV_RL32(plaintext);
119 }
120
121 static void xor_block(void *p1, void *p2, unsigned size, int key, unsigned *key_ptr)
122 {
123     unsigned *d1 = p1;
124     unsigned *d2 = p2;
125     unsigned k = *key_ptr;
126
127     size >>= 2;
128
129     while (size > 0) {
130         *d2 = *d1 ^ (HAVE_BIGENDIAN ? av_bswap32(k) : k);
131         k += key;
132         d1++;
133         d2++;
134         size--;
135     }
136
137     *key_ptr = k;
138 }
139
140 static void decode_block(uint8_t *src, uint8_t *dest, unsigned size,
141                          uint32_t key, uint32_t *key_ptr,
142                          int align)
143 {
144     unsigned s = size;
145     char tmp[4];
146     int a2;
147
148     if (!size)
149         return;
150
151     align &= 3;
152     a2 = (4 - align) & 3;
153
154     if (align) {
155         uint32_t tmpkey = *key_ptr - key;
156         memcpy(tmp + align, src, a2);
157         xor_block(tmp, tmp, 4, key, &tmpkey);
158         memcpy(dest, tmp + align, a2);
159         s -= a2;
160     }
161
162     if (s >= 4) {
163         if (!align)
164             align = 4;
165         xor_block(src + a2, dest + a2, s & ~3,
166                   key, key_ptr);
167         s &= 3;
168     }
169
170     if (s) {
171         size -= s;
172         memcpy(tmp, src + size, s);
173         xor_block(&tmp, &tmp, 4, key, key_ptr);
174         memcpy(dest + size, tmp, s);
175     }
176 }
177
178 static uint32_t get_v(uint8_t *p, int len)
179 {
180     uint32_t v = 0;
181     const uint8_t *end = p + len;
182
183     do {
184         if (p >= end || v >= UINT_MAX / 128 - *p)
185             return v;
186         v <<= 7;
187         v += *p & 0x7f;
188     } while (*p++ & 0x80);
189
190     return v;
191 }
192
193 static uint8_t *read_vblock(AVIOContext *src, uint32_t *size,
194                             uint32_t key, uint32_t *k2, int align)
195 {
196     uint8_t tmp[4];
197     uint8_t *buf;
198     unsigned n;
199
200     if (avio_read(src, tmp, 4) != 4)
201         return NULL;
202
203     decode_block(tmp, tmp, 4, key, k2, align);
204
205     n = get_v(tmp, 4);
206     if (n < 4)
207         return NULL;
208
209     buf = av_malloc(n);
210     if (!buf)
211         return NULL;
212
213     *size = n;
214     n -= 4;
215
216     memcpy(buf, tmp, 4);
217
218     if (avio_read(src, buf + 4, n) == n) {
219         decode_block(buf + 4, buf + 4, n, key, k2, align + 4);
220     } else {
221         av_free(buf);
222         buf = NULL;
223     }
224
225     return buf;
226 }
227
228 static uint8_t *read_sb_block(AVIOContext *src, unsigned *size,
229                               uint32_t *key, unsigned expected_size)
230 {
231     uint8_t *buf;
232     uint8_t ibuf[8], sbuf[8];
233     uint32_t k2;
234     unsigned n;
235
236     if (avio_read(src, ibuf, 8) < 8)
237         return NULL;
238
239     k2 = *key;
240     decode_block(ibuf, sbuf, 8, *key, &k2, 0);
241
242     n = get_v(sbuf+2, 6);
243
244     if (sbuf[0] != 'S' || sbuf[1] != 'B' || (expected_size>0 && n != expected_size)) {
245         uint32_t tmpkey = recover_key(ibuf, expected_size);
246         k2 = tmpkey;
247         decode_block(ibuf, sbuf, 8, tmpkey, &k2, 0);
248         n = get_v(sbuf+2, 6);
249         if (sbuf[0] != 'S' || sbuf[1] != 'B' || expected_size != n)
250             return NULL;
251         *key = tmpkey;
252     }
253
254     buf = av_malloc(n);
255     if (!buf)
256         return NULL;
257
258     memcpy(buf, sbuf, 8);
259
260     *size = n;
261     n -= 8;
262
263     if (avio_read(src, buf+8, n) < n) {
264         av_free(buf);
265         return NULL;
266     }
267
268     decode_block(buf + 8, buf + 8, n, *key, &k2, 0);
269
270     return buf;
271 }
272
273 static void track_header(VividasDemuxContext *viv, AVFormatContext *s,  uint8_t *buf, int size)
274 {
275     int i,j;
276     int64_t off;
277     int val_1;
278     int num_video, num_audio;
279     AVIOContext *pb;
280
281     pb = avio_alloc_context(buf, size, 0, NULL, NULL, NULL, NULL);
282     if (!pb)
283         return;
284
285     ffio_read_varlen(pb); // track_header_len
286     avio_r8(pb); // '1'
287
288     val_1 = ffio_read_varlen(pb);
289
290     for (i=0;i<val_1;i++) {
291         int c = avio_r8(pb);
292         for (j=0;j<c;j++) {
293             avio_r8(pb); // val_3
294             avio_r8(pb); // val_4
295         }
296     }
297
298     avio_r8(pb); // num_streams
299
300     off = avio_tell(pb);
301     off += ffio_read_varlen(pb); // val_5
302
303     avio_r8(pb); // '2'
304     num_video = avio_r8(pb);
305
306     avio_seek(pb, off, SEEK_SET);
307     if (num_video != 1)
308         av_log(s, AV_LOG_WARNING, "number of video tracks %d is not 1\n", num_video);
309
310     for (i = 0; i < num_video; i++) {
311         AVStream *st = avformat_new_stream(s, NULL);
312
313         st->id = i;
314
315         st->codecpar->codec_type = AVMEDIA_TYPE_VIDEO;
316         st->codecpar->codec_id = AV_CODEC_ID_VP6;
317
318         off = avio_tell(pb);
319         off += ffio_read_varlen(pb);
320         avio_r8(pb); // '3'
321         avio_r8(pb); // val_7
322         st->time_base.num = avio_rl32(pb); // frame_time
323         st->time_base.den = avio_rl32(pb); // time_base
324         st->nb_frames = avio_rl32(pb); // n frames
325         st->codecpar->width = avio_rl16(pb); // width
326         st->codecpar->height = avio_rl16(pb); // height
327         avio_r8(pb); // val_8
328         avio_rl32(pb); // val_9
329
330         avio_seek(pb, off, SEEK_SET);
331     }
332
333     off = avio_tell(pb);
334     off += ffio_read_varlen(pb); // val_10
335     avio_r8(pb); // '4'
336     num_audio = avio_r8(pb);
337     avio_seek(pb, off, SEEK_SET);
338
339     if (num_audio != 1)
340         av_log(s, AV_LOG_WARNING, "number of audio tracks %d is not 1\n", num_audio);
341
342     for(i=0;i<num_audio;i++) {
343         int q;
344         AVStream *st = avformat_new_stream(s, NULL);
345
346         st->id = num_video + i;
347
348         st->codecpar->codec_type = AVMEDIA_TYPE_AUDIO;
349         st->codecpar->codec_id = AV_CODEC_ID_VORBIS;
350
351         off = avio_tell(pb);
352         off += ffio_read_varlen(pb); // length
353         avio_r8(pb); // '5'
354         avio_r8(pb); //codec_id
355         avio_rl16(pb); //codec_subid
356         st->codecpar->channels = avio_rl16(pb); // channels
357         st->codecpar->sample_rate = avio_rl32(pb); // sample_rate
358         avio_seek(pb, 10, SEEK_CUR); // data_1
359         q = avio_r8(pb);
360         avio_seek(pb, q, SEEK_CUR); // data_2
361         avio_r8(pb); // zeropad
362
363         if (avio_tell(pb) < off) {
364             int num_data;
365             int xd_size = 0;
366             int data_len[256];
367             int offset = 1;
368             uint8_t *p;
369             ffio_read_varlen(pb); // val_13
370             avio_r8(pb); // '19'
371             ffio_read_varlen(pb); // len_3
372             num_data = avio_r8(pb);
373             for (j = 0; j < num_data; j++) {
374                 data_len[j] = ffio_read_varlen(pb);
375                 xd_size += data_len[j];
376             }
377
378             st->codecpar->extradata_size = 64 + xd_size + xd_size / 255;
379             if (ff_alloc_extradata(st->codecpar, st->codecpar->extradata_size))
380                 return;
381
382             p = st->codecpar->extradata;
383             p[0] = 2;
384
385             for (j = 0; j < num_data - 1; j++)
386                 offset += av_xiphlacing(&p[offset], data_len[j]);
387
388             for (j = 0; j < num_data; j++) {
389                 avio_read(pb, &p[offset], data_len[j]);
390                 offset += data_len[j];
391             }
392
393             if (offset < st->codecpar->extradata_size)
394                 st->codecpar->extradata_size = offset;
395         }
396     }
397
398     av_free(pb);
399 }
400
401 static void track_index(VividasDemuxContext *viv, AVFormatContext *s, uint8_t *buf, unsigned size)
402 {
403     int64_t off;
404     int64_t poff;
405     int maxnp=0;
406     AVIOContext *pb;
407     int i;
408
409     pb = avio_alloc_context(buf, size, 0, NULL, NULL, NULL, NULL);
410     if (!pb)
411         return;
412
413     ffio_read_varlen(pb); // track_index_len
414     avio_r8(pb); // 'c'
415     viv->n_sb_blocks = ffio_read_varlen(pb);
416     viv->sb_blocks = av_calloc(viv->n_sb_blocks, sizeof(VIV_SB_block));
417     if (!viv->sb_blocks) {
418         viv->n_sb_blocks = 0;
419         av_free(pb);
420         return;
421     }
422
423     off = 0;
424     poff = 0;
425
426     for (i = 0; i < viv->n_sb_blocks; i++) {
427         viv->sb_blocks[i].byte_offset = off;
428         viv->sb_blocks[i].packet_offset = poff;
429
430         viv->sb_blocks[i].size = ffio_read_varlen(pb);
431         viv->sb_blocks[i].n_packets = ffio_read_varlen(pb);
432
433         off += viv->sb_blocks[i].size;
434         poff += viv->sb_blocks[i].n_packets;
435
436
437         if (maxnp < viv->sb_blocks[i].n_packets)
438             maxnp = viv->sb_blocks[i].n_packets;
439     }
440
441     viv->sb_entries = av_calloc(maxnp, sizeof(VIV_SB_entry));
442     av_free(pb);
443 }
444
445 static void load_sb_block(AVFormatContext *s, VividasDemuxContext *viv, unsigned expected_size)
446 {
447     uint32_t size = 0;
448     int i;
449     AVIOContext *pb = 0;
450
451     if (viv->sb_pb) {
452         av_free(viv->sb_pb);
453         viv->sb_pb = NULL;
454     }
455
456     if (viv->sb_buf)
457         av_free(viv->sb_buf);
458
459     viv->sb_buf = read_sb_block(s->pb, &size, &viv->sb_key, expected_size);
460     if (!viv->sb_buf) {
461         return;
462     }
463
464     pb = avio_alloc_context(viv->sb_buf, size, 0, NULL, NULL, NULL, NULL);
465     if (!pb)
466         return;
467
468     viv->sb_pb = pb;
469
470     avio_r8(pb); //  'S'
471     avio_r8(pb); //  'B'
472     ffio_read_varlen(pb); //  size
473     avio_r8(pb); //  junk
474     ffio_read_varlen(pb); // first packet
475
476     viv->n_sb_entries = viv->sb_blocks[viv->current_sb].n_packets;
477
478     for (i = 0; i < viv->n_sb_entries; i++) {
479         viv->sb_entries[i].size = ffio_read_varlen(pb);
480         viv->sb_entries[i].flag = avio_r8(pb);
481     }
482
483     ffio_read_varlen(pb);
484     avio_r8(pb);
485
486     viv->current_sb_entry = 0;
487 }
488
489 static int viv_read_header(AVFormatContext *s)
490 {
491     VividasDemuxContext *viv = s->priv_data;
492     AVIOContext *pb = s->pb;
493     int64_t header_end;
494     int num_tracks;
495     uint32_t key, k2;
496     uint32_t v;
497     uint8_t keybuffer[187];
498     uint32_t b22_size = 0;
499     uint32_t b22_key = 0;
500     uint8_t *buf = 0;
501
502     avio_skip(pb, 9);
503
504     header_end = avio_tell(pb);
505
506     header_end += ffio_read_varlen(pb);
507
508     num_tracks = avio_r8(pb);
509
510     if (num_tracks != 1) {
511         av_log(s, AV_LOG_ERROR, "number of tracks %d is not 1\n", num_tracks);
512         return AVERROR(EINVAL);
513     }
514
515     v = avio_r8(pb);
516     avio_seek(pb, v, SEEK_CUR);
517
518     avio_read(pb, keybuffer, 187);
519     key = decode_key(keybuffer);
520     viv->sb_key = key;
521
522     avio_rl32(pb);
523
524     for (;;) {
525         int64_t here = avio_tell(pb);
526         int block_len, block_type;
527
528         if (here >= header_end)
529             break;
530
531         block_len = ffio_read_varlen(pb);
532         block_type = avio_r8(pb);
533
534         if (block_type == 22) {
535             avio_read(pb, keybuffer, 187);
536             b22_key = decode_key(keybuffer);
537             b22_size = avio_rl32(pb);
538         }
539
540         avio_seek(pb, here + block_len, SEEK_SET);
541     }
542
543     if (b22_size) {
544         k2 = b22_key;
545         buf = read_vblock(pb, &v, b22_key, &k2, 0);
546         if (!buf)
547             return AVERROR(EIO);
548
549         av_free(buf);
550     }
551
552     k2 = key;
553     buf = read_vblock(pb, &v, key, &k2, 0);
554     if (!buf)
555         return AVERROR(EIO);
556     track_header(viv, s, buf, v);
557     av_free(buf);
558
559     buf = read_vblock(pb, &v, key, &k2, v);
560     if (!buf)
561         return AVERROR(EIO);
562     track_index(viv, s, buf, v);
563     av_free(buf);
564
565     viv->sb_offset = avio_tell(pb);
566     if (viv->n_sb_blocks > 0) {
567         viv->current_sb = 0;
568         load_sb_block(s, viv, viv->sb_blocks[0].size);
569     } else {
570         viv->current_sb = -1;
571     }
572
573     return 0;
574 }
575
576 static int viv_read_packet(AVFormatContext *s,
577                            AVPacket *pkt)
578 {
579     VividasDemuxContext *viv = s->priv_data;
580     AVIOContext *pb;
581     int64_t off;
582     int ret;
583
584     if (!viv->sb_pb)
585         return AVERROR(EIO);
586     if (avio_feof(viv->sb_pb))
587         return AVERROR_EOF;
588
589     if (viv->current_audio_subpacket < viv->n_audio_subpackets) {
590         AVStream *astream;
591         int size = viv->audio_subpackets[viv->current_audio_subpacket+1].start - viv->audio_subpackets[viv->current_audio_subpacket].start;
592
593         pb = viv->sb_pb;
594         ret = av_get_packet(pb, pkt, size);
595         if (ret < 0)
596             return ret;
597         pkt->pos += viv->sb_offset + viv->sb_blocks[viv->current_sb].byte_offset;
598
599         pkt->stream_index = 1;
600         astream = s->streams[pkt->stream_index];
601
602         pkt->pts = av_rescale(viv->audio_sample, astream->time_base.den, astream->time_base.num) / astream->codecpar->sample_rate;
603         viv->audio_sample += viv->audio_subpackets[viv->current_audio_subpacket].pcm_bytes / 2 / astream->codecpar->channels;
604         pkt->flags |= AV_PKT_FLAG_KEY;
605         viv->current_audio_subpacket++;
606         return 0;
607     }
608
609     if (viv->current_sb_entry >= viv->n_sb_entries) {
610         if (viv->current_sb+1 >= viv->n_sb_blocks)
611             return AVERROR(EIO);
612         viv->current_sb++;
613
614         load_sb_block(s, viv, 0);
615         viv->current_sb_entry = 0;
616     }
617
618     pb = viv->sb_pb;
619     if (!pb)
620         return AVERROR(EIO);
621     off = avio_tell(pb);
622     off += viv->sb_entries[viv->current_sb_entry].size;
623
624     if (viv->sb_entries[viv->current_sb_entry].flag == 0) {
625         uint64_t v_size = ffio_read_varlen(pb);
626
627         ffio_read_varlen(pb);
628         if (v_size > INT_MAX)
629             return AVERROR_INVALIDDATA;
630         ret = av_get_packet(pb, pkt, v_size);
631         if (ret < 0)
632             return ret;
633         pkt->pos += viv->sb_offset + viv->sb_blocks[viv->current_sb].byte_offset;
634
635         pkt->pts = viv->sb_blocks[viv->current_sb].packet_offset + viv->current_sb_entry;
636         pkt->flags |= (pkt->data[0]&0x80)?0:AV_PKT_FLAG_KEY;
637         pkt->stream_index = 0;
638
639         for (int i = 0; i < MAX_AUDIO_SUBPACKETS - 1; i++) {
640             int start, pcm_bytes;
641             start = ffio_read_varlen(pb);
642             pcm_bytes = ffio_read_varlen(pb);
643
644             if (i > 0 && start == 0)
645                 break;
646
647             viv->n_audio_subpackets = i + 1;
648             viv->audio_subpackets[i].start = start;
649             viv->audio_subpackets[i].pcm_bytes = pcm_bytes;
650         }
651         viv->audio_subpackets[viv->n_audio_subpackets].start = (int)(off - avio_tell(pb));
652         viv->current_audio_subpacket = 0;
653
654     } else {
655         uint64_t v_size = ffio_read_varlen(pb);
656
657         if (v_size > INT_MAX)
658             return AVERROR_INVALIDDATA;
659         ret = av_get_packet(pb, pkt, v_size);
660         if (ret < 0)
661             return ret;
662         pkt->pos += viv->sb_offset + viv->sb_blocks[viv->current_sb].byte_offset;
663         pkt->pts = viv->sb_blocks[viv->current_sb].packet_offset + viv->current_sb_entry;
664         pkt->flags |= (pkt->data[0] & 0x80) ? 0 : AV_PKT_FLAG_KEY;
665         pkt->stream_index = 0;
666     }
667
668     viv->current_sb_entry++;
669
670     return 0;
671 }
672
673 static int viv_read_close(AVFormatContext *s)
674 {
675     VividasDemuxContext *viv = s->priv_data;
676
677     av_freep(&viv->sb_pb);
678     av_freep(&viv->sb_buf);
679     av_freep(&viv->sb_blocks);
680     av_freep(&viv->sb_entries);
681
682     return 0;
683 }
684
685 static int viv_read_seek(AVFormatContext *s, int stream_index, int64_t timestamp, int flags)
686 {
687     VividasDemuxContext *viv = s->priv_data;
688     int64_t frame;
689
690     if (stream_index == 0)
691         frame = timestamp;
692     else
693         frame = av_rescale_q(timestamp, s->streams[0]->time_base, s->streams[stream_index]->time_base);
694
695     for (int i = 0; i < viv->n_sb_blocks; i++) {
696         if (frame >= viv->sb_blocks[i].packet_offset && frame < viv->sb_blocks[i].packet_offset + viv->sb_blocks[i].n_packets) {
697             // flush audio packet queue
698             viv->current_audio_subpacket = 0;
699             viv->n_audio_subpackets = 0;
700             viv->current_sb = i;
701             // seek to ith sb block
702             avio_seek(s->pb, viv->sb_offset + viv->sb_blocks[i].byte_offset, SEEK_SET);
703             // load the block
704             load_sb_block(s, viv, 0);
705             // most problematic part: guess audio offset
706             viv->audio_sample = av_rescale_q(viv->sb_blocks[i].packet_offset, av_make_q(s->streams[1]->codecpar->sample_rate, 1), av_inv_q(s->streams[0]->time_base));
707             // hand-tuned 1.s a/v offset
708             viv->audio_sample += s->streams[1]->codecpar->sample_rate;
709             viv->current_sb_entry = 0;
710             return 1;
711         }
712     }
713     return 0;
714 }
715
716 AVInputFormat ff_vividas_demuxer = {
717     .name           = "vividas",
718     .long_name      = NULL_IF_CONFIG_SMALL("Vividas VIV"),
719     .priv_data_size = sizeof(VividasDemuxContext),
720     .read_probe     = viv_probe,
721     .read_header    = viv_read_header,
722     .read_packet    = viv_read_packet,
723     .read_close     = viv_read_close,
724     .read_seek      = viv_read_seek,
725 };