]> git.sesse.net Git - ffmpeg/blob - libavcodec/hqx.c
Merge commit '6a9c00c09d2bc50c0ea64ba092b2f4afc46aa978'
[ffmpeg] / libavcodec / hqx.c
1 /*
2  * Canopus HQX decoder
3  *
4  * This file is part of FFmpeg.
5  *
6  * FFmpeg is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU Lesser General Public
8  * License as published by the Free Software Foundation; either
9  * version 2.1 of the License, or (at your option) any later version.
10  *
11  * FFmpeg is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14  * Lesser General Public License for more details.
15  *
16  * You should have received a copy of the GNU Lesser General Public
17  * License along with FFmpeg; if not, write to the Free Software
18  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
19  */
20
21 #include <inttypes.h>
22
23 #include "libavutil/imgutils.h"
24 #include "libavutil/intreadwrite.h"
25
26 #include "avcodec.h"
27 #include "canopus.h"
28 #include "get_bits.h"
29 #include "internal.h"
30 #include "thread.h"
31
32 #include "hqx.h"
33 #include "hqxdsp.h"
34
35 /* HQX has four modes - 422, 444, 422alpha and 444alpha - all 12-bit */
36 enum HQXFormat {
37     HQX_422 = 0,
38     HQX_444,
39     HQX_422A,
40     HQX_444A,
41 };
42
43 #define HQX_HEADER_SIZE 59
44
45 /* macroblock selects a group of 4 possible quants and
46  * a block can use any of those four quantisers
47  * one column is powers of 2, the other one is powers of 2 * 3,
48  * then there is the special one, powers of 2 * 5 */
49 static const int hqx_quants[16][4] = {
50     {  0x1,   0x2,   0x4,   0x8 }, {  0x1,  0x3,   0x6,   0xC },
51     {  0x2,   0x4,   0x8,  0x10 }, {  0x3,  0x6,   0xC,  0x18 },
52     {  0x4,   0x8,  0x10,  0x20 }, {  0x6,  0xC,  0x18,  0x30 },
53     {  0x8,  0x10,  0x20,  0x40 },
54                       { 0xA, 0x14, 0x28, 0x50 },
55                                    {  0xC, 0x18,  0x30,  0x60 },
56     { 0x10,  0x20,  0x40,  0x80 }, { 0x18, 0x30,  0x60,  0xC0 },
57     { 0x20,  0x40,  0x80, 0x100 }, { 0x30, 0x60,  0xC0, 0x180 },
58     { 0x40,  0x80, 0x100, 0x200 }, { 0x60, 0xC0, 0x180, 0x300 },
59     { 0x80, 0x100, 0x200, 0x400 }
60 };
61
62 static const uint8_t hqx_quant_luma[64] = {
63     16,  16,  16,  19,  19,  19,  42,  44,
64     16,  16,  19,  19,  19,  38,  43,  45,
65     16,  19,  19,  19,  40,  41,  45,  48,
66     19,  19,  19,  40,  41,  42,  46,  49,
67     19,  19,  40,  41,  42,  43,  48, 101,
68     19,  38,  41,  42,  43,  44,  98, 104,
69     42,  43,  45,  46,  48,  98, 109, 116,
70     44,  45,  48,  49, 101, 104, 116, 123,
71 };
72
73 static const uint8_t hqx_quant_chroma[64] = {
74     16,  16,  19,  25,  26,  26,  42,  44,
75     16,  19,  25,  25,  26,  38,  43,  91,
76     19,  25,  26,  27,  40,  41,  91,  96,
77     25,  25,  27,  40,  41,  84,  93, 197,
78     26,  26,  40,  41,  84,  86, 191, 203,
79     26,  38,  41,  84,  86, 177, 197, 209,
80     42,  43,  91,  93, 191, 197, 219, 232,
81     44,  91,  96, 197, 203, 209, 232, 246,
82 };
83
84 static inline void put_blocks(HQXContext *ctx, int plane,
85                               int x, int y, int ilace,
86                               int16_t *block0, int16_t *block1,
87                               const uint8_t *quant)
88 {
89     int fields = ilace ? 2 : 1;
90     int lsize = ctx->pic->linesize[plane];
91     uint8_t *p = ctx->pic->data[plane] + x * 2;
92
93     ctx->hqxdsp.idct_put((uint16_t *)(p + y * lsize),
94                          lsize * fields, block0, quant);
95     ctx->hqxdsp.idct_put((uint16_t *)(p + (y + (ilace ? 1 : 8)) * lsize),
96                          lsize * fields, block1, quant);
97 }
98
99 static inline void hqx_get_ac(GetBitContext *gb, const HQXAC *ac,
100                               int *run, int *lev)
101 {
102     int val;
103
104     val = show_bits(gb, ac->lut_bits);
105     if (ac->lut[val].bits == -1) {
106         GetBitContext gb2 = *gb;
107         skip_bits(&gb2, ac->lut_bits);
108         val = ac->lut[val].lev + show_bits(&gb2, ac->extra_bits);
109     }
110     *run = ac->lut[val].run;
111     *lev = ac->lut[val].lev;
112     skip_bits(gb, ac->lut[val].bits);
113 }
114
115 static int decode_block(GetBitContext *gb, VLC *vlc,
116                         const int *quants, int dcb,
117                         int16_t block[64], int *last_dc)
118 {
119     int q, dc;
120     int ac_idx;
121     int run, lev, pos = 1;
122
123     memset(block, 0, 64 * sizeof(*block));
124     dc = get_vlc2(gb, vlc->table, HQX_DC_VLC_BITS, 2);
125     if (dc < 0)
126         return AVERROR_INVALIDDATA;
127     *last_dc += dc;
128
129     block[0] = sign_extend(*last_dc << (12 - dcb), 12);
130
131     q = quants[get_bits(gb, 2)];
132     if (q >= 128)
133         ac_idx = HQX_AC_Q128;
134     else if (q >= 64)
135         ac_idx = HQX_AC_Q64;
136     else if (q >= 32)
137         ac_idx = HQX_AC_Q32;
138     else if (q >= 16)
139         ac_idx = HQX_AC_Q16;
140     else if (q >= 8)
141         ac_idx = HQX_AC_Q8;
142     else
143         ac_idx = HQX_AC_Q0;
144
145     do {
146         hqx_get_ac(gb, &ff_hqx_ac[ac_idx], &run, &lev);
147         pos += run;
148         if (pos >= 64)
149             break;
150         block[ff_zigzag_direct[pos++]] = lev * q;
151     } while (pos < 64);
152
153     return 0;
154 }
155
156 static int hqx_decode_422(HQXContext *ctx, int slice_no, int x, int y)
157 {
158     HQXSlice *slice = &ctx->slice[slice_no];
159     GetBitContext *gb = &slice->gb;
160     const int *quants;
161     int flag;
162     int last_dc;
163     int i, ret;
164
165     if (ctx->interlaced)
166         flag = get_bits1(gb);
167     else
168         flag = 0;
169
170     quants = hqx_quants[get_bits(gb, 4)];
171
172     for (i = 0; i < 8; i++) {
173         int vlc_index = ctx->dcb - 9;
174         if (i == 0 || i == 4 || i == 6)
175             last_dc = 0;
176         ret = decode_block(gb, &ctx->dc_vlc[vlc_index], quants,
177                            ctx->dcb, slice->block[i], &last_dc);
178         if (ret < 0)
179             return ret;
180     }
181
182     put_blocks(ctx, 0, x,      y, flag, slice->block[0], slice->block[2], hqx_quant_luma);
183     put_blocks(ctx, 0, x + 8,  y, flag, slice->block[1], slice->block[3], hqx_quant_luma);
184     put_blocks(ctx, 2, x >> 1, y, flag, slice->block[4], slice->block[5], hqx_quant_chroma);
185     put_blocks(ctx, 1, x >> 1, y, flag, slice->block[6], slice->block[7], hqx_quant_chroma);
186
187     return 0;
188 }
189
190 static int hqx_decode_422a(HQXContext *ctx, int slice_no, int x, int y)
191 {
192     HQXSlice *slice = &ctx->slice[slice_no];
193     GetBitContext *gb = &slice->gb;
194     const int *quants;
195     int flag = 0;
196     int last_dc;
197     int i, ret;
198     int cbp;
199
200     cbp = get_vlc2(gb, ctx->cbp_vlc.table, ctx->cbp_vlc.bits, 1);
201
202     for (i = 0; i < 12; i++)
203         memset(slice->block[i], 0, sizeof(**slice->block) * 64);
204     for (i = 0; i < 12; i++)
205         slice->block[i][0] = -0x800;
206     if (cbp) {
207         if (ctx->interlaced)
208             flag = get_bits1(gb);
209
210         quants = hqx_quants[get_bits(gb, 4)];
211
212         cbp |= cbp << 4; // alpha CBP
213         if (cbp & 0x3)   // chroma CBP - top
214             cbp |= 0x500;
215         if (cbp & 0xC)   // chroma CBP - bottom
216             cbp |= 0xA00;
217         for (i = 0; i < 12; i++) {
218             if (i == 0 || i == 4 || i == 8 || i == 10)
219                 last_dc = 0;
220             if (cbp & (1 << i)) {
221                 int vlc_index = ctx->dcb - 9;
222                 ret = decode_block(gb, &ctx->dc_vlc[vlc_index], quants,
223                                    ctx->dcb, slice->block[i], &last_dc);
224                 if (ret < 0)
225                     return ret;
226             }
227         }
228     }
229
230     put_blocks(ctx, 3, x,      y, flag, slice->block[ 0], slice->block[ 2], hqx_quant_luma);
231     put_blocks(ctx, 3, x + 8,  y, flag, slice->block[ 1], slice->block[ 3], hqx_quant_luma);
232     put_blocks(ctx, 0, x,      y, flag, slice->block[ 4], slice->block[ 6], hqx_quant_luma);
233     put_blocks(ctx, 0, x + 8,  y, flag, slice->block[ 5], slice->block[ 7], hqx_quant_luma);
234     put_blocks(ctx, 2, x >> 1, y, flag, slice->block[ 8], slice->block[ 9], hqx_quant_chroma);
235     put_blocks(ctx, 1, x >> 1, y, flag, slice->block[10], slice->block[11], hqx_quant_chroma);
236
237     return 0;
238 }
239
240 static int hqx_decode_444(HQXContext *ctx, int slice_no, int x, int y)
241 {
242     HQXSlice *slice = &ctx->slice[slice_no];
243     GetBitContext *gb = &slice->gb;
244     const int *quants;
245     int flag;
246     int last_dc;
247     int i, ret;
248
249     if (ctx->interlaced)
250         flag = get_bits1(gb);
251     else
252         flag = 0;
253
254     quants = hqx_quants[get_bits(gb, 4)];
255
256     for (i = 0; i < 12; i++) {
257         int vlc_index = ctx->dcb - 9;
258         if (i == 0 || i == 4 || i == 8)
259             last_dc = 0;
260         ret = decode_block(gb, &ctx->dc_vlc[vlc_index], quants,
261                            ctx->dcb, slice->block[i], &last_dc);
262         if (ret < 0)
263             return ret;
264     }
265
266     put_blocks(ctx, 0, x,     y, flag, slice->block[0], slice->block[ 2], hqx_quant_luma);
267     put_blocks(ctx, 0, x + 8, y, flag, slice->block[1], slice->block[ 3], hqx_quant_luma);
268     put_blocks(ctx, 2, x,     y, flag, slice->block[4], slice->block[ 6], hqx_quant_chroma);
269     put_blocks(ctx, 2, x + 8, y, flag, slice->block[5], slice->block[ 7], hqx_quant_chroma);
270     put_blocks(ctx, 1, x,     y, flag, slice->block[8], slice->block[10], hqx_quant_chroma);
271     put_blocks(ctx, 1, x + 8, y, flag, slice->block[9], slice->block[11], hqx_quant_chroma);
272
273     return 0;
274 }
275
276 static int hqx_decode_444a(HQXContext *ctx, int slice_no, int x, int y)
277 {
278     HQXSlice *slice = &ctx->slice[slice_no];
279     GetBitContext *gb = &slice->gb;
280     const int *quants;
281     int flag = 0;
282     int last_dc;
283     int i, ret;
284     int cbp;
285
286     cbp = get_vlc2(gb, ctx->cbp_vlc.table, ctx->cbp_vlc.bits, 1);
287
288     for (i = 0; i < 16; i++)
289         memset(slice->block[i], 0, sizeof(**slice->block) * 64);
290     for (i = 0; i < 16; i++)
291         slice->block[i][0] = -0x800;
292     if (cbp) {
293         if (ctx->interlaced)
294             flag = get_bits1(gb);
295
296         quants = hqx_quants[get_bits(gb, 4)];
297
298         cbp |= cbp << 4; // alpha CBP
299         cbp |= cbp << 8; // chroma CBP
300         for (i = 0; i < 16; i++) {
301             if (i == 0 || i == 4 || i == 8 || i == 12)
302                 last_dc = 0;
303             if (cbp & (1 << i)) {
304                 int vlc_index = ctx->dcb - 9;
305                 ret = decode_block(gb, &ctx->dc_vlc[vlc_index], quants,
306                                    ctx->dcb, slice->block[i], &last_dc);
307                 if (ret < 0)
308                     return ret;
309             }
310         }
311     }
312
313     put_blocks(ctx, 3, x,     y, flag, slice->block[ 0], slice->block[ 2], hqx_quant_luma);
314     put_blocks(ctx, 3, x + 8, y, flag, slice->block[ 1], slice->block[ 3], hqx_quant_luma);
315     put_blocks(ctx, 0, x,     y, flag, slice->block[ 4], slice->block[ 6], hqx_quant_luma);
316     put_blocks(ctx, 0, x + 8, y, flag, slice->block[ 5], slice->block[ 7], hqx_quant_luma);
317     put_blocks(ctx, 2, x,     y, flag, slice->block[ 8], slice->block[10], hqx_quant_chroma);
318     put_blocks(ctx, 2, x + 8, y, flag, slice->block[ 9], slice->block[11], hqx_quant_chroma);
319     put_blocks(ctx, 1, x,     y, flag, slice->block[12], slice->block[14], hqx_quant_chroma);
320     put_blocks(ctx, 1, x + 8, y, flag, slice->block[13], slice->block[15], hqx_quant_chroma);
321
322     return 0;
323 }
324
325 static const int shuffle_16[16] = {
326     0, 5, 11, 14, 2, 7, 9, 13, 1, 4, 10, 15, 3, 6, 8, 12
327 };
328
329 static int decode_slice(HQXContext *ctx, int slice_no)
330 {
331     int mb_w = (ctx->width  + 15) >> 4;
332     int mb_h = (ctx->height + 15) >> 4;
333     int grp_w = (mb_w + 4) / 5;
334     int grp_h = (mb_h + 4) / 5;
335     int grp_h_edge = grp_w * (mb_w / grp_w);
336     int grp_v_edge = grp_h * (mb_h / grp_h);
337     int grp_v_rest = mb_w - grp_h_edge;
338     int grp_h_rest = mb_h - grp_v_edge;
339     int num_mbs = mb_w * mb_h;
340     int num_tiles = (num_mbs + 479) / 480;
341     int std_tile_blocks = num_mbs / (16 * num_tiles);
342     int g_tile = slice_no * num_tiles;
343     int blk_addr, loc_addr, mb_x, mb_y, pos, loc_row, i;
344     int tile_blocks, tile_limit, tile_no;
345
346     for (tile_no = 0; tile_no < num_tiles; tile_no++, g_tile++) {
347         tile_blocks = std_tile_blocks;
348         tile_limit = -1;
349         if (g_tile < num_mbs - std_tile_blocks * 16 * num_tiles) {
350             tile_limit = num_mbs / (16 * num_tiles);
351             tile_blocks++;
352         }
353         for (i = 0; i < tile_blocks; i++) {
354             if (i == tile_limit)
355                 blk_addr = g_tile + 16 * num_tiles * i;
356             else
357                 blk_addr = tile_no + 16 * num_tiles * i +
358                            num_tiles * shuffle_16[(i + slice_no) & 0xF];
359             loc_row  = grp_h * (blk_addr / (grp_h * mb_w));
360             loc_addr =          blk_addr % (grp_h * mb_w);
361             if (loc_row >= grp_v_edge) {
362                 mb_x = grp_w * (loc_addr / (grp_h_rest * grp_w));
363                 pos  =          loc_addr % (grp_h_rest * grp_w);
364             } else {
365                 mb_x = grp_w * (loc_addr / (grp_h * grp_w));
366                 pos  =          loc_addr % (grp_h * grp_w);
367             }
368             if (mb_x >= grp_h_edge) {
369                 mb_x +=            pos % grp_v_rest;
370                 mb_y  = loc_row + (pos / grp_v_rest);
371             } else {
372                 mb_x +=            pos % grp_w;
373                 mb_y  = loc_row + (pos / grp_w);
374             }
375             ctx->decode_func(ctx, slice_no, mb_x * 16, mb_y * 16);
376         }
377     }
378
379     return 0;
380 }
381
382 static int decode_slice_thread(AVCodecContext *avctx, void *arg,
383                                int slice_no, int threadnr)
384 {
385     HQXContext *ctx = avctx->priv_data;
386     uint32_t *slice_off = ctx->slice_off;
387     int ret;
388
389     if (slice_off[slice_no] < HQX_HEADER_SIZE ||
390         slice_off[slice_no] >= slice_off[slice_no + 1] ||
391         slice_off[slice_no + 1] > ctx->data_size) {
392         av_log(avctx, AV_LOG_ERROR, "Invalid slice size %d.\n", ctx->data_size);
393         return AVERROR_INVALIDDATA;
394     }
395
396     ret = init_get_bits8(&ctx->slice[slice_no].gb,
397                          ctx->src + slice_off[slice_no],
398                          slice_off[slice_no + 1] - slice_off[slice_no]);
399     if (ret < 0)
400         return ret;
401
402     return decode_slice(ctx, slice_no);
403 }
404
405 static int hqx_decode_frame(AVCodecContext *avctx, void *data,
406                             int *got_picture_ptr, AVPacket *avpkt)
407 {
408     HQXContext *ctx = avctx->priv_data;
409     ThreadFrame frame = { .f = data };
410     uint8_t *src = avpkt->data;
411     uint32_t info_tag;
412     int data_start;
413     int i, ret;
414
415     if (avpkt->size < 4 + 4) {
416         av_log(avctx, AV_LOG_ERROR, "Frame is too small %d.\n", avpkt->size);
417         return AVERROR_INVALIDDATA;
418     }
419
420     info_tag    = AV_RL32(src);
421     if (info_tag == MKTAG('I', 'N', 'F', 'O')) {
422         uint32_t info_offset = AV_RL32(src + 4);
423         if (info_offset > INT_MAX || info_offset + 8 > avpkt->size) {
424             av_log(avctx, AV_LOG_ERROR,
425                    "Invalid INFO header offset: 0x%08"PRIX32" is too large.\n",
426                    info_offset);
427             return AVERROR_INVALIDDATA;
428         }
429         ff_canopus_parse_info_tag(avctx, src + 8, info_offset);
430
431         info_offset += 8;
432         src         += info_offset;
433     }
434
435     data_start     = src - avpkt->data;
436     ctx->data_size = avpkt->size - data_start;
437     ctx->src       = src;
438     ctx->pic       = data;
439
440     if (ctx->data_size < HQX_HEADER_SIZE) {
441         av_log(avctx, AV_LOG_ERROR, "Frame too small.\n");
442         return AVERROR_INVALIDDATA;
443     }
444
445     if (src[0] != 'H' || src[1] != 'Q') {
446         av_log(avctx, AV_LOG_ERROR, "Not an HQX frame.\n");
447         return AVERROR_INVALIDDATA;
448     }
449     ctx->interlaced = !(src[2] & 0x80);
450     ctx->format     = src[2] & 7;
451     ctx->dcb        = (src[3] & 3) + 8;
452     ctx->width      = AV_RB16(src + 4);
453     ctx->height     = AV_RB16(src + 6);
454     for (i = 0; i < 17; i++)
455         ctx->slice_off[i] = AV_RB24(src + 8 + i * 3);
456
457     if (ctx->dcb == 8) {
458         av_log(avctx, AV_LOG_ERROR, "Invalid DC precision %d.\n", ctx->dcb);
459         return AVERROR_INVALIDDATA;
460     }
461     ret = av_image_check_size(ctx->width, ctx->height, 0, avctx);
462     if (ret < 0) {
463         av_log(avctx, AV_LOG_ERROR, "Invalid stored dimensions %dx%d.\n",
464                ctx->width, ctx->height);
465         return AVERROR_INVALIDDATA;
466     }
467
468     avctx->coded_width         = FFALIGN(ctx->width,  16);
469     avctx->coded_height        = FFALIGN(ctx->height, 16);
470     avctx->width               = ctx->width;
471     avctx->height              = ctx->height;
472     avctx->bits_per_raw_sample = 10;
473
474     switch (ctx->format) {
475     case HQX_422:
476         avctx->pix_fmt = AV_PIX_FMT_YUV422P16;
477         ctx->decode_func = hqx_decode_422;
478         break;
479     case HQX_444:
480         avctx->pix_fmt = AV_PIX_FMT_YUV444P16;
481         ctx->decode_func = hqx_decode_444;
482         break;
483     case HQX_422A:
484         avctx->pix_fmt = AV_PIX_FMT_YUVA422P16;
485         ctx->decode_func = hqx_decode_422a;
486         break;
487     case HQX_444A:
488         avctx->pix_fmt = AV_PIX_FMT_YUVA444P16;
489         ctx->decode_func = hqx_decode_444a;
490         break;
491     default:
492         av_log(avctx, AV_LOG_ERROR, "Invalid format: %d.\n", ctx->format);
493         return AVERROR_INVALIDDATA;
494     }
495
496     ret = ff_thread_get_buffer(avctx, &frame, 0);
497     if (ret < 0)
498         return ret;
499
500     avctx->execute2(avctx, decode_slice_thread, NULL, NULL, 16);
501
502     ctx->pic->key_frame = 1;
503     ctx->pic->pict_type = AV_PICTURE_TYPE_I;
504
505     *got_picture_ptr = 1;
506
507     return avpkt->size;
508 }
509
510 static av_cold int hqx_decode_close(AVCodecContext *avctx)
511 {
512     int i;
513     HQXContext *ctx = avctx->priv_data;
514
515     if (avctx->internal->is_copy)
516         return 0;
517
518     ff_free_vlc(&ctx->cbp_vlc);
519     for (i = 0; i < 3; i++) {
520         ff_free_vlc(&ctx->dc_vlc[i]);
521     }
522
523     return 0;
524 }
525
526 static av_cold int hqx_decode_init(AVCodecContext *avctx)
527 {
528     HQXContext *ctx = avctx->priv_data;
529
530     ff_hqxdsp_init(&ctx->hqxdsp);
531
532     return ff_hqx_init_vlcs(ctx);
533 }
534
535 AVCodec ff_hqx_decoder = {
536     .name           = "hqx",
537     .long_name      = NULL_IF_CONFIG_SMALL("Canopus HQX"),
538     .type           = AVMEDIA_TYPE_VIDEO,
539     .id             = AV_CODEC_ID_HQX,
540     .priv_data_size = sizeof(HQXContext),
541     .init           = hqx_decode_init,
542     .decode         = hqx_decode_frame,
543     .close          = hqx_decode_close,
544     .capabilities   = AV_CODEC_CAP_DR1 | AV_CODEC_CAP_SLICE_THREADS |
545                       AV_CODEC_CAP_FRAME_THREADS,
546     .caps_internal  = FF_CODEC_CAP_INIT_THREADSAFE |
547                       FF_CODEC_CAP_INIT_CLEANUP,
548 };