]> git.sesse.net Git - ffmpeg/blob - libavcodec/g2meet.c
avcodec/g2meet: Check if adjusted pixel was on the stack
[ffmpeg] / libavcodec / g2meet.c
1 /*
2  * Go2Webinar / Go2Meeting decoder
3  * Copyright (c) 2012 Konstantin Shishkov
4  * Copyright (c) 2013 Maxim Poliakovski
5  *
6  * This file is part of FFmpeg.
7  *
8  * FFmpeg is free software; you can redistribute it and/or
9  * modify it under the terms of the GNU Lesser General Public
10  * License as published by the Free Software Foundation; either
11  * version 2.1 of the License, or (at your option) any later version.
12  *
13  * FFmpeg is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16  * Lesser General Public License for more details.
17  *
18  * You should have received a copy of the GNU Lesser General Public
19  * License along with FFmpeg; if not, write to the Free Software
20  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
21  */
22
23 /**
24  * @file
25  * Go2Webinar / Go2Meeting decoder
26  */
27
28 #include <inttypes.h>
29 #include <zlib.h>
30
31 #include "libavutil/imgutils.h"
32 #include "libavutil/intreadwrite.h"
33
34 #include "avcodec.h"
35 #include "blockdsp.h"
36 #include "bytestream.h"
37 #include "elsdec.h"
38 #include "get_bits.h"
39 #include "idctdsp.h"
40 #include "internal.h"
41 #include "jpegtables.h"
42 #include "mjpeg.h"
43
44 #define EPIC_PIX_STACK_SIZE 1024
45 #define EPIC_PIX_STACK_MAX  (EPIC_PIX_STACK_SIZE - 1)
46
47 enum ChunkType {
48     DISPLAY_INFO = 0xC8,
49     TILE_DATA,
50     CURSOR_POS,
51     CURSOR_SHAPE,
52     CHUNK_CC,
53     CHUNK_CD
54 };
55
56 enum Compression {
57     COMPR_EPIC_J_B = 2,
58     COMPR_KEMPF_J_B,
59 };
60
61 static const uint8_t luma_quant[64] = {
62      8,  6,  5,  8, 12, 20, 26, 31,
63      6,  6,  7, 10, 13, 29, 30, 28,
64      7,  7,  8, 12, 20, 29, 35, 28,
65      7,  9, 11, 15, 26, 44, 40, 31,
66      9, 11, 19, 28, 34, 55, 52, 39,
67     12, 18, 28, 32, 41, 52, 57, 46,
68     25, 32, 39, 44, 52, 61, 60, 51,
69     36, 46, 48, 49, 56, 50, 52, 50
70 };
71
72 static const uint8_t chroma_quant[64] = {
73      9,  9, 12, 24, 50, 50, 50, 50,
74      9, 11, 13, 33, 50, 50, 50, 50,
75     12, 13, 28, 50, 50, 50, 50, 50,
76     24, 33, 50, 50, 50, 50, 50, 50,
77     50, 50, 50, 50, 50, 50, 50, 50,
78     50, 50, 50, 50, 50, 50, 50, 50,
79     50, 50, 50, 50, 50, 50, 50, 50,
80     50, 50, 50, 50, 50, 50, 50, 50,
81 };
82
83 typedef struct ePICPixListElem {
84     struct ePICPixListElem *next;
85     uint32_t               pixel;
86     uint8_t                rung;
87 } ePICPixListElem;
88
89 typedef struct ePICPixHashElem {
90     uint32_t                pix_id;
91     struct ePICPixListElem  *list;
92 } ePICPixHashElem;
93
94 #define EPIC_HASH_SIZE 256
95 typedef struct ePICPixHash {
96     ePICPixHashElem *bucket[EPIC_HASH_SIZE];
97     int              bucket_size[EPIC_HASH_SIZE];
98     int              bucket_fill[EPIC_HASH_SIZE];
99 } ePICPixHash;
100
101 typedef struct ePICContext {
102     ElsDecCtx        els_ctx;
103     int              next_run_pos;
104     ElsUnsignedRung  unsigned_rung;
105     uint8_t          W_flag_rung;
106     uint8_t          N_flag_rung;
107     uint8_t          W_ctx_rung[256];
108     uint8_t          N_ctx_rung[512];
109     uint8_t          nw_pred_rung[256];
110     uint8_t          ne_pred_rung[256];
111     uint8_t          prev_row_rung[14];
112     uint8_t          runlen_zeroes[14];
113     uint8_t          runlen_one;
114     int              stack_pos;
115     uint32_t         stack[EPIC_PIX_STACK_SIZE];
116     ePICPixHash      hash;
117 } ePICContext;
118
119 typedef struct JPGContext {
120     BlockDSPContext bdsp;
121     IDCTDSPContext idsp;
122     ScanTable  scantable;
123
124     VLC        dc_vlc[2], ac_vlc[2];
125     int        prev_dc[3];
126     DECLARE_ALIGNED(32, int16_t, block)[6][64];
127
128     uint8_t    *buf;
129 } JPGContext;
130
131 typedef struct G2MContext {
132     ePICContext ec;
133     JPGContext jc;
134
135     int        version;
136
137     int        compression;
138     int        width, height, bpp;
139     int        orig_width, orig_height;
140     int        tile_width, tile_height;
141     int        tiles_x, tiles_y, tile_x, tile_y;
142
143     int        got_header;
144
145     uint8_t    *framebuf;
146     int        framebuf_stride, old_width, old_height;
147
148     uint8_t    *synth_tile, *jpeg_tile, *epic_buf, *epic_buf_base;
149     int        tile_stride, epic_buf_stride, old_tile_w, old_tile_h;
150     int        swapuv;
151
152     uint8_t    *kempf_buf, *kempf_flags;
153
154     uint8_t    *cursor;
155     int        cursor_stride;
156     int        cursor_fmt;
157     int        cursor_w, cursor_h, cursor_x, cursor_y;
158     int        cursor_hot_x, cursor_hot_y;
159 } G2MContext;
160
161 static av_cold int build_vlc(VLC *vlc, const uint8_t *bits_table,
162                              const uint8_t *val_table, int nb_codes,
163                              int is_ac)
164 {
165     uint8_t  huff_size[256] = { 0 };
166     uint16_t huff_code[256];
167     uint16_t huff_sym[256];
168     int i;
169
170     ff_mjpeg_build_huffman_codes(huff_size, huff_code, bits_table, val_table);
171
172     for (i = 0; i < 256; i++)
173         huff_sym[i] = i + 16 * is_ac;
174
175     if (is_ac)
176         huff_sym[0] = 16 * 256;
177
178     return ff_init_vlc_sparse(vlc, 9, nb_codes, huff_size, 1, 1,
179                               huff_code, 2, 2, huff_sym, 2, 2, 0);
180 }
181
182 static av_cold int jpg_init(AVCodecContext *avctx, JPGContext *c)
183 {
184     int ret;
185
186     ret = build_vlc(&c->dc_vlc[0], avpriv_mjpeg_bits_dc_luminance,
187                     avpriv_mjpeg_val_dc, 12, 0);
188     if (ret)
189         return ret;
190     ret = build_vlc(&c->dc_vlc[1], avpriv_mjpeg_bits_dc_chrominance,
191                     avpriv_mjpeg_val_dc, 12, 0);
192     if (ret)
193         return ret;
194     ret = build_vlc(&c->ac_vlc[0], avpriv_mjpeg_bits_ac_luminance,
195                     avpriv_mjpeg_val_ac_luminance, 251, 1);
196     if (ret)
197         return ret;
198     ret = build_vlc(&c->ac_vlc[1], avpriv_mjpeg_bits_ac_chrominance,
199                     avpriv_mjpeg_val_ac_chrominance, 251, 1);
200     if (ret)
201         return ret;
202
203     ff_blockdsp_init(&c->bdsp, avctx);
204     ff_idctdsp_init(&c->idsp, avctx);
205     ff_init_scantable(c->idsp.idct_permutation, &c->scantable,
206                       ff_zigzag_direct);
207
208     return 0;
209 }
210
211 static av_cold void jpg_free_context(JPGContext *ctx)
212 {
213     int i;
214
215     for (i = 0; i < 2; i++) {
216         ff_free_vlc(&ctx->dc_vlc[i]);
217         ff_free_vlc(&ctx->ac_vlc[i]);
218     }
219
220     av_freep(&ctx->buf);
221 }
222
223 static void jpg_unescape(const uint8_t *src, int src_size,
224                          uint8_t *dst, int *dst_size)
225 {
226     const uint8_t *src_end = src + src_size;
227     uint8_t *dst_start = dst;
228
229     while (src < src_end) {
230         uint8_t x = *src++;
231
232         *dst++ = x;
233
234         if (x == 0xFF && !*src)
235             src++;
236     }
237     *dst_size = dst - dst_start;
238 }
239
240 static int jpg_decode_block(JPGContext *c, GetBitContext *gb,
241                             int plane, int16_t *block)
242 {
243     int dc, val, pos;
244     const int is_chroma = !!plane;
245     const uint8_t *qmat = is_chroma ? chroma_quant : luma_quant;
246
247     c->bdsp.clear_block(block);
248     dc = get_vlc2(gb, c->dc_vlc[is_chroma].table, 9, 3);
249     if (dc < 0)
250         return AVERROR_INVALIDDATA;
251     if (dc)
252         dc = get_xbits(gb, dc);
253     dc                = dc * qmat[0] + c->prev_dc[plane];
254     block[0]          = dc;
255     c->prev_dc[plane] = dc;
256
257     pos = 0;
258     while (pos < 63) {
259         val = get_vlc2(gb, c->ac_vlc[is_chroma].table, 9, 3);
260         if (val < 0)
261             return AVERROR_INVALIDDATA;
262         pos += val >> 4;
263         val &= 0xF;
264         if (pos > 63)
265             return val ? AVERROR_INVALIDDATA : 0;
266         if (val) {
267             int nbits = val;
268
269             val                                 = get_xbits(gb, nbits);
270             val                                *= qmat[ff_zigzag_direct[pos]];
271             block[c->scantable.permutated[pos]] = val;
272         }
273     }
274     return 0;
275 }
276
277 static inline void yuv2rgb(uint8_t *out, int ridx, int Y, int U, int V)
278 {
279     out[ridx]     = av_clip_uint8(Y +              (91881 * V + 32768 >> 16));
280     out[1]        = av_clip_uint8(Y + (-22554 * U - 46802 * V + 32768 >> 16));
281     out[2 - ridx] = av_clip_uint8(Y + (116130 * U             + 32768 >> 16));
282 }
283
284 static int jpg_decode_data(JPGContext *c, int width, int height,
285                            const uint8_t *src, int src_size,
286                            uint8_t *dst, int dst_stride,
287                            const uint8_t *mask, int mask_stride, int num_mbs,
288                            int swapuv)
289 {
290     GetBitContext gb;
291     int mb_w, mb_h, mb_x, mb_y, i, j;
292     int bx, by;
293     int unesc_size;
294     int ret;
295     const int ridx = swapuv ? 2 : 0;
296
297     if ((ret = av_reallocp(&c->buf,
298                            src_size + AV_INPUT_BUFFER_PADDING_SIZE)) < 0)
299         return ret;
300     jpg_unescape(src, src_size, c->buf, &unesc_size);
301     memset(c->buf + unesc_size, 0, AV_INPUT_BUFFER_PADDING_SIZE);
302     if((ret = init_get_bits8(&gb, c->buf, unesc_size)) < 0)
303         return ret;
304
305     width = FFALIGN(width, 16);
306     mb_w  =  width        >> 4;
307     mb_h  = (height + 15) >> 4;
308
309     if (!num_mbs)
310         num_mbs = mb_w * mb_h * 4;
311
312     for (i = 0; i < 3; i++)
313         c->prev_dc[i] = 1024;
314     bx =
315     by = 0;
316     c->bdsp.clear_blocks(c->block[0]);
317     for (mb_y = 0; mb_y < mb_h; mb_y++) {
318         for (mb_x = 0; mb_x < mb_w; mb_x++) {
319             if (mask && !mask[mb_x * 2] && !mask[mb_x * 2 + 1] &&
320                 !mask[mb_x * 2 +     mask_stride] &&
321                 !mask[mb_x * 2 + 1 + mask_stride]) {
322                 bx += 16;
323                 continue;
324             }
325             for (j = 0; j < 2; j++) {
326                 for (i = 0; i < 2; i++) {
327                     if (mask && !mask[mb_x * 2 + i + j * mask_stride])
328                         continue;
329                     num_mbs--;
330                     if ((ret = jpg_decode_block(c, &gb, 0,
331                                                 c->block[i + j * 2])) != 0)
332                         return ret;
333                     c->idsp.idct(c->block[i + j * 2]);
334                 }
335             }
336             for (i = 1; i < 3; i++) {
337                 if ((ret = jpg_decode_block(c, &gb, i, c->block[i + 3])) != 0)
338                     return ret;
339                 c->idsp.idct(c->block[i + 3]);
340             }
341
342             for (j = 0; j < 16; j++) {
343                 uint8_t *out = dst + bx * 3 + (by + j) * dst_stride;
344                 for (i = 0; i < 16; i++) {
345                     int Y, U, V;
346
347                     Y = c->block[(j >> 3) * 2 + (i >> 3)][(i & 7) + (j & 7) * 8];
348                     U = c->block[4][(i >> 1) + (j >> 1) * 8] - 128;
349                     V = c->block[5][(i >> 1) + (j >> 1) * 8] - 128;
350                     yuv2rgb(out + i * 3, ridx, Y, U, V);
351                 }
352             }
353
354             if (!num_mbs)
355                 return 0;
356             bx += 16;
357         }
358         bx  = 0;
359         by += 16;
360         if (mask)
361             mask += mask_stride * 2;
362     }
363
364     return 0;
365 }
366
367 #define LOAD_NEIGHBOURS(x)      \
368     W   = curr_row[(x)   - 1];  \
369     N   = above_row[(x)];       \
370     WW  = curr_row[(x)   - 2];  \
371     NW  = above_row[(x)  - 1];  \
372     NE  = above_row[(x)  + 1];  \
373     NN  = above2_row[(x)];      \
374     NNW = above2_row[(x) - 1];  \
375     NWW = above_row[(x)  - 2];  \
376     NNE = above2_row[(x) + 1]
377
378 #define UPDATE_NEIGHBOURS(x)    \
379     NNW = NN;                   \
380     NN  = NNE;                  \
381     NWW = NW;                   \
382     NW  = N;                    \
383     N   = NE;                   \
384     NE  = above_row[(x)  + 1];  \
385     NNE = above2_row[(x) + 1]
386
387 #define R_shift 16
388 #define G_shift  8
389 #define B_shift  0
390
391 /* improved djb2 hash from http://www.cse.yorku.ca/~oz/hash.html */
392 static int djb2_hash(uint32_t key)
393 {
394     uint32_t h = 5381;
395
396     h = (h * 33) ^ ((key >> 24) & 0xFF); // xxx: probably not needed at all
397     h = (h * 33) ^ ((key >> 16) & 0xFF);
398     h = (h * 33) ^ ((key >>  8) & 0xFF);
399     h = (h * 33) ^  (key        & 0xFF);
400
401     return h & (EPIC_HASH_SIZE - 1);
402 }
403
404 static void epic_hash_init(ePICPixHash *hash)
405 {
406     memset(hash, 0, sizeof(*hash));
407 }
408
409 static ePICPixHashElem *epic_hash_find(const ePICPixHash *hash, uint32_t key)
410 {
411     int i, idx = djb2_hash(key);
412     ePICPixHashElem *bucket = hash->bucket[idx];
413
414     for (i = 0; i < hash->bucket_fill[idx]; i++)
415         if (bucket[i].pix_id == key)
416             return &bucket[i];
417
418     return NULL;
419 }
420
421 static ePICPixHashElem *epic_hash_add(ePICPixHash *hash, uint32_t key)
422 {
423     ePICPixHashElem *bucket, *ret;
424     int idx = djb2_hash(key);
425
426     if (hash->bucket_size[idx] > INT_MAX / sizeof(**hash->bucket))
427         return NULL;
428
429     if (!(hash->bucket_fill[idx] < hash->bucket_size[idx])) {
430         int new_size = hash->bucket_size[idx] + 16;
431         bucket = av_realloc(hash->bucket[idx], new_size * sizeof(*bucket));
432         if (!bucket)
433             return NULL;
434         hash->bucket[idx]      = bucket;
435         hash->bucket_size[idx] = new_size;
436     }
437
438     ret = &hash->bucket[idx][hash->bucket_fill[idx]++];
439     memset(ret, 0, sizeof(*ret));
440     ret->pix_id = key;
441     return ret;
442 }
443
444 static int epic_add_pixel_to_cache(ePICPixHash *hash, uint32_t key, uint32_t pix)
445 {
446     ePICPixListElem *new_elem;
447     ePICPixHashElem *hash_elem = epic_hash_find(hash, key);
448
449     if (!hash_elem) {
450         if (!(hash_elem = epic_hash_add(hash, key)))
451             return AVERROR(ENOMEM);
452     }
453
454     new_elem = av_mallocz(sizeof(*new_elem));
455     if (!new_elem)
456         return AVERROR(ENOMEM);
457
458     new_elem->pixel = pix;
459     new_elem->next  = hash_elem->list;
460     hash_elem->list = new_elem;
461
462     return 0;
463 }
464
465 static inline int epic_cache_entries_for_pixel(const ePICPixHash *hash,
466                                                uint32_t pix)
467 {
468     ePICPixHashElem *hash_elem = epic_hash_find(hash, pix);
469
470     if (hash_elem != NULL && hash_elem->list != NULL)
471         return 1;
472
473     return 0;
474 }
475
476 static void epic_free_pixel_cache(ePICPixHash *hash)
477 {
478     int i, j;
479
480     for (i = 0; i < EPIC_HASH_SIZE; i++) {
481         for (j = 0; j < hash->bucket_fill[i]; j++) {
482             ePICPixListElem *list_elem = hash->bucket[i][j].list;
483             while (list_elem) {
484                 ePICPixListElem *tmp = list_elem->next;
485                 av_free(list_elem);
486                 list_elem = tmp;
487             }
488         }
489         av_freep(&hash->bucket[i]);
490         hash->bucket_size[i] =
491         hash->bucket_fill[i] = 0;
492     }
493 }
494
495 static inline int is_pixel_on_stack(const ePICContext *dc, uint32_t pix)
496 {
497     int i;
498
499     for (i = 0; i < dc->stack_pos; i++)
500         if (dc->stack[i] == pix)
501             break;
502
503     return i != dc->stack_pos;
504 }
505
506 #define TOSIGNED(val) (((val) >> 1) ^ -((val) & 1))
507
508 static inline int epic_decode_component_pred(ePICContext *dc,
509                                              int N, int W, int NW)
510 {
511     unsigned delta = ff_els_decode_unsigned(&dc->els_ctx, &dc->unsigned_rung);
512     return mid_pred(N, N + W - NW, W) - TOSIGNED(delta);
513 }
514
515 static uint32_t epic_decode_pixel_pred(ePICContext *dc, int x, int y,
516                                        const uint32_t *curr_row,
517                                        const uint32_t *above_row)
518 {
519     uint32_t N, W, NW, pred;
520     unsigned delta;
521     int GN, GW, GNW, R, G, B;
522
523     if (x && y) {
524         W  = curr_row[x  - 1];
525         N  = above_row[x];
526         NW = above_row[x - 1];
527
528         GN  = (N  >> G_shift) & 0xFF;
529         GW  = (W  >> G_shift) & 0xFF;
530         GNW = (NW >> G_shift) & 0xFF;
531
532         G = epic_decode_component_pred(dc, GN, GW, GNW);
533
534         R = G + epic_decode_component_pred(dc,
535                                            ((N  >> R_shift) & 0xFF) - GN,
536                                            ((W  >> R_shift) & 0xFF) - GW,
537                                            ((NW >> R_shift) & 0xFF) - GNW);
538
539         B = G + epic_decode_component_pred(dc,
540                                            ((N  >> B_shift) & 0xFF) - GN,
541                                            ((W  >> B_shift) & 0xFF) - GW,
542                                            ((NW >> B_shift) & 0xFF) - GNW);
543     } else {
544         if (x)
545             pred = curr_row[x - 1];
546         else
547             pred = above_row[x];
548
549         delta = ff_els_decode_unsigned(&dc->els_ctx, &dc->unsigned_rung);
550         R     = ((pred >> R_shift) & 0xFF) - TOSIGNED(delta);
551
552         delta = ff_els_decode_unsigned(&dc->els_ctx, &dc->unsigned_rung);
553         G     = ((pred >> G_shift) & 0xFF) - TOSIGNED(delta);
554
555         delta = ff_els_decode_unsigned(&dc->els_ctx, &dc->unsigned_rung);
556         B     = ((pred >> B_shift) & 0xFF) - TOSIGNED(delta);
557     }
558
559     if (R<0 || G<0 || B<0 || R > 255 || G > 255 || B > 255) {
560         avpriv_request_sample(NULL, "RGB %d %d %d is out of range\n", R, G, B);
561         return 0;
562     }
563
564     return (R << R_shift) | (G << G_shift) | (B << B_shift);
565 }
566
567 static int epic_predict_pixel(ePICContext *dc, uint8_t *rung,
568                               uint32_t *pPix, uint32_t pix)
569 {
570     if (!ff_els_decode_bit(&dc->els_ctx, rung)) {
571         *pPix = pix;
572         return 1;
573     }
574     dc->stack[dc->stack_pos++ & EPIC_PIX_STACK_MAX] = pix;
575     return 0;
576 }
577
578 static int epic_handle_edges(ePICContext *dc, int x, int y,
579                              const uint32_t *curr_row,
580                              const uint32_t *above_row, uint32_t *pPix)
581 {
582     uint32_t pix;
583
584     if (!x && !y) { /* special case: top-left pixel */
585         /* the top-left pixel is coded independently with 3 unsigned numbers */
586         *pPix = (ff_els_decode_unsigned(&dc->els_ctx, &dc->unsigned_rung) << R_shift) |
587                 (ff_els_decode_unsigned(&dc->els_ctx, &dc->unsigned_rung) << G_shift) |
588                 (ff_els_decode_unsigned(&dc->els_ctx, &dc->unsigned_rung) << B_shift);
589         return 1;
590     }
591
592     if (x) { /* predict from W first */
593         pix = curr_row[x - 1];
594         if (epic_predict_pixel(dc, &dc->W_flag_rung, pPix, pix))
595             return 1;
596     }
597
598     if (y) { /* then try to predict from N */
599         pix = above_row[x];
600         if (!dc->stack_pos || dc->stack[0] != pix) {
601             if (epic_predict_pixel(dc, &dc->N_flag_rung, pPix, pix))
602                 return 1;
603         }
604     }
605
606     return 0;
607 }
608
609 static int epic_decode_run_length(ePICContext *dc, int x, int y, int tile_width,
610                                   const uint32_t *curr_row,
611                                   const uint32_t *above_row,
612                                   const uint32_t *above2_row,
613                                   uint32_t *pPix, int *pRun)
614 {
615     int idx, got_pixel = 0, WWneW, old_WWneW = 0;
616     uint32_t W, WW, N, NN, NW, NE, NWW, NNW, NNE;
617
618     *pRun = 0;
619
620     LOAD_NEIGHBOURS(x);
621
622     if (dc->next_run_pos == x) {
623         /* can't reuse W for the new pixel in this case */
624         WWneW = 1;
625     } else {
626         idx = (WW  != W)  << 7 |
627               (NW  != W)  << 6 |
628               (N   != NE) << 5 |
629               (NW  != N)  << 4 |
630               (NWW != NW) << 3 |
631               (NNE != NE) << 2 |
632               (NN  != N)  << 1 |
633               (NNW != NW);
634         WWneW = ff_els_decode_bit(&dc->els_ctx, &dc->W_ctx_rung[idx]);
635         if (WWneW < 0)
636             return WWneW;
637     }
638
639     if (WWneW)
640         dc->stack[dc->stack_pos++ & EPIC_PIX_STACK_MAX] = W;
641     else {
642         *pPix     = W;
643         got_pixel = 1;
644     }
645
646     do {
647         int NWneW = 1;
648         if (got_pixel) // pixel value already known (derived from either W or N)
649             NWneW = *pPix != N;
650         else { // pixel value is unknown and will be decoded later
651             NWneW = *pRun ? NWneW : NW != W;
652
653             /* TODO: RFC this mess! */
654             switch (((NW != N) << 2) | (NWneW << 1) | WWneW) {
655             case 0:
656                 break; // do nothing here
657             case 3:
658             case 5:
659             case 6:
660             case 7:
661                 if (!is_pixel_on_stack(dc, N)) {
662                     idx = WWneW       << 8 |
663                           (*pRun ? old_WWneW : WW != W) << 7 |
664                           NWneW       << 6 |
665                           (N   != NE) << 5 |
666                           (NW  != N)  << 4 |
667                           (NWW != NW) << 3 |
668                           (NNE != NE) << 2 |
669                           (NN  != N)  << 1 |
670                           (NNW != NW);
671                     if (!ff_els_decode_bit(&dc->els_ctx, &dc->N_ctx_rung[idx])) {
672                         NWneW = 0;
673                         *pPix = N;
674                         got_pixel = 1;
675                         break;
676                     }
677                 }
678                 /* fall through */
679             default:
680                 NWneW = 1;
681                 old_WWneW = WWneW;
682                 if (!is_pixel_on_stack(dc, N))
683                     dc->stack[dc->stack_pos++ & EPIC_PIX_STACK_MAX] = N;
684             }
685         }
686
687         (*pRun)++;
688         if (x + *pRun >= tile_width - 1)
689             break;
690
691         UPDATE_NEIGHBOURS(x + *pRun);
692
693         if (!NWneW && NW == N && N == NE) {
694             int pos, run, rle;
695             int start_pos = x + *pRun;
696
697             /* scan for a run of pix in the line above */
698             uint32_t pix = above_row[start_pos + 1];
699             for (pos = start_pos + 2; pos < tile_width; pos++)
700                 if (!(above_row[pos] == pix))
701                     break;
702             run = pos - start_pos - 1;
703             idx = av_ceil_log2(run);
704             if (ff_els_decode_bit(&dc->els_ctx, &dc->prev_row_rung[idx]))
705                 *pRun += run;
706             else {
707                 int flag;
708                 /* run-length is coded as plain binary number of idx - 1 bits */
709                 for (pos = idx - 1, rle = 0, flag = 0; pos >= 0; pos--) {
710                     if ((1 << pos) + rle < run &&
711                         ff_els_decode_bit(&dc->els_ctx,
712                                           flag ? &dc->runlen_one
713                                                : &dc->runlen_zeroes[pos])) {
714                         flag = 1;
715                         rle |= 1 << pos;
716                     }
717                 }
718                 *pRun += rle;
719                 break; // return immediately
720             }
721             if (x + *pRun >= tile_width - 1)
722                 break;
723
724             LOAD_NEIGHBOURS(x + *pRun);
725             WWneW = 0;
726             NWneW = 0;
727         }
728
729         idx = WWneW       << 7 |
730               NWneW       << 6 |
731               (N   != NE) << 5 |
732               (NW  != N)  << 4 |
733               (NWW != NW) << 3 |
734               (NNE != NE) << 2 |
735               (NN  != N)  << 1 |
736               (NNW != NW);
737         WWneW = ff_els_decode_bit(&dc->els_ctx, &dc->W_ctx_rung[idx]);
738     } while (!WWneW);
739
740     dc->next_run_pos = x + *pRun;
741     return got_pixel;
742 }
743
744 static int epic_predict_pixel2(ePICContext *dc, uint8_t *rung,
745                                uint32_t *pPix, uint32_t pix)
746 {
747     if (ff_els_decode_bit(&dc->els_ctx, rung)) {
748         *pPix = pix;
749         return 1;
750     }
751     dc->stack[dc->stack_pos++ & EPIC_PIX_STACK_MAX] = pix;
752     return 0;
753 }
754
755 static int epic_predict_from_NW_NE(ePICContext *dc, int x, int y, int run,
756                                    int tile_width, const uint32_t *curr_row,
757                                    const uint32_t *above_row, uint32_t *pPix)
758 {
759     int pos;
760
761     /* try to reuse the NW pixel first */
762     if (x && y) {
763         uint32_t NW = above_row[x - 1];
764         if (NW != curr_row[x - 1] && NW != above_row[x] && !is_pixel_on_stack(dc, NW)) {
765             if (epic_predict_pixel2(dc, &dc->nw_pred_rung[NW & 0xFF], pPix, NW))
766                 return 1;
767         }
768     }
769
770     /* try to reuse the NE[x + run, y] pixel */
771     pos = x + run - 1;
772     if (pos < tile_width - 1 && y) {
773         uint32_t NE = above_row[pos + 1];
774         if (NE != above_row[pos] && !is_pixel_on_stack(dc, NE)) {
775             if (epic_predict_pixel2(dc, &dc->ne_pred_rung[NE & 0xFF], pPix, NE))
776                 return 1;
777         }
778     }
779
780     return 0;
781 }
782
783 static int epic_decode_from_cache(ePICContext *dc, uint32_t W, uint32_t *pPix)
784 {
785     ePICPixListElem *list, *prev = NULL;
786     ePICPixHashElem *hash_elem = epic_hash_find(&dc->hash, W);
787
788     if (!hash_elem || !hash_elem->list)
789         return 0;
790
791     list = hash_elem->list;
792     while (list) {
793         if (!is_pixel_on_stack(dc, list->pixel)) {
794             if (ff_els_decode_bit(&dc->els_ctx, &list->rung)) {
795                 *pPix = list->pixel;
796                 if (list != hash_elem->list) {
797                     prev->next      = list->next;
798                     list->next      = hash_elem->list;
799                     hash_elem->list = list;
800                 }
801                 return 1;
802             }
803             dc->stack[dc->stack_pos++ & EPIC_PIX_STACK_MAX] = list->pixel;
804         }
805         prev = list;
806         list = list->next;
807     }
808
809     return 0;
810 }
811
812 static int epic_decode_tile(ePICContext *dc, uint8_t *out, int tile_height,
813                             int tile_width, int stride)
814 {
815     int x, y;
816     uint32_t pix;
817     uint32_t *curr_row = NULL, *above_row = NULL, *above2_row;
818
819     for (y = 0; y < tile_height; y++, out += stride) {
820         above2_row = above_row;
821         above_row  = curr_row;
822         curr_row   = (uint32_t *) out;
823
824         for (x = 0, dc->next_run_pos = 0; x < tile_width;) {
825             if (dc->els_ctx.err)
826                 return AVERROR_INVALIDDATA; // bail out in the case of ELS overflow
827
828             pix = curr_row[x - 1]; // get W pixel
829
830             if (y >= 1 && x >= 2 &&
831                 pix != curr_row[x - 2]  && pix != above_row[x - 1] &&
832                 pix != above_row[x - 2] && pix != above_row[x] &&
833                 !epic_cache_entries_for_pixel(&dc->hash, pix)) {
834                 curr_row[x] = epic_decode_pixel_pred(dc, x, y, curr_row, above_row);
835                 x++;
836             } else {
837                 int got_pixel, run;
838                 dc->stack_pos = 0; // empty stack
839
840                 if (y < 2 || x < 2 || x == tile_width - 1) {
841                     run       = 1;
842                     got_pixel = epic_handle_edges(dc, x, y, curr_row, above_row, &pix);
843                 } else {
844                     got_pixel = epic_decode_run_length(dc, x, y, tile_width,
845                                                        curr_row, above_row,
846                                                        above2_row, &pix, &run);
847                     if (got_pixel < 0)
848                         return got_pixel;
849                 }
850
851                 if (!got_pixel && !epic_predict_from_NW_NE(dc, x, y, run,
852                                                            tile_width, curr_row,
853                                                            above_row, &pix)) {
854                     uint32_t ref_pix = curr_row[x - 1];
855                     if (!x || !epic_decode_from_cache(dc, ref_pix, &pix)) {
856                         pix = epic_decode_pixel_pred(dc, x, y, curr_row, above_row);
857                         if (is_pixel_on_stack(dc, pix))
858                             return AVERROR_INVALIDDATA;
859
860                         if (x) {
861                             int ret = epic_add_pixel_to_cache(&dc->hash,
862                                                               ref_pix,
863                                                               pix);
864                             if (ret)
865                                 return ret;
866                         }
867                     }
868                 }
869                 for (; run > 0; x++, run--)
870                     curr_row[x] = pix;
871             }
872         }
873     }
874
875     return 0;
876 }
877
878 static int epic_jb_decode_tile(G2MContext *c, int tile_x, int tile_y,
879                                const uint8_t *src, size_t src_size,
880                                AVCodecContext *avctx)
881 {
882     uint8_t prefix, mask = 0x80;
883     int extrabytes, tile_width, tile_height, awidth, aheight;
884     size_t els_dsize;
885     uint8_t *dst;
886
887     if (!src_size)
888         return 0;
889
890     /* get data size of the ELS partition as unsigned variable-length integer */
891     prefix = *src++;
892     src_size--;
893     for (extrabytes = 0; (prefix & mask) && (extrabytes < 7); extrabytes++)
894         mask >>= 1;
895     if (extrabytes > 3 || src_size < extrabytes) {
896         av_log(avctx, AV_LOG_ERROR, "ePIC: invalid data size VLI\n");
897         return AVERROR_INVALIDDATA;
898     }
899
900     els_dsize = prefix & ((0x80 >> extrabytes) - 1); // mask out the length prefix
901     while (extrabytes-- > 0) {
902         els_dsize = (els_dsize << 8) | *src++;
903         src_size--;
904     }
905
906     if (src_size < els_dsize) {
907         av_log(avctx, AV_LOG_ERROR, "ePIC: data too short, needed %"SIZE_SPECIFIER", got %"SIZE_SPECIFIER"\n",
908                els_dsize, src_size);
909         return AVERROR_INVALIDDATA;
910     }
911
912     tile_width  = FFMIN(c->width  - tile_x * c->tile_width,  c->tile_width);
913     tile_height = FFMIN(c->height - tile_y * c->tile_height, c->tile_height);
914     awidth      = FFALIGN(tile_width,  16);
915     aheight     = FFALIGN(tile_height, 16);
916
917     if (els_dsize) {
918         int ret, i, j, k;
919         uint8_t tr_r, tr_g, tr_b, *buf;
920         uint32_t *in;
921         /* ELS decoder initializations */
922         memset(&c->ec, 0, sizeof(c->ec));
923         ff_els_decoder_init(&c->ec.els_ctx, src, els_dsize);
924         epic_hash_init(&c->ec.hash);
925
926         /* decode transparent pixel value */
927         tr_r = ff_els_decode_unsigned(&c->ec.els_ctx, &c->ec.unsigned_rung);
928         tr_g = ff_els_decode_unsigned(&c->ec.els_ctx, &c->ec.unsigned_rung);
929         tr_b = ff_els_decode_unsigned(&c->ec.els_ctx, &c->ec.unsigned_rung);
930         if (c->ec.els_ctx.err != 0) {
931             av_log(avctx, AV_LOG_ERROR,
932                    "ePIC: couldn't decode transparency pixel!\n");
933             ff_els_decoder_uninit(&c->ec.unsigned_rung);
934             return AVERROR_INVALIDDATA;
935         }
936
937         ret = epic_decode_tile(&c->ec, c->epic_buf, tile_height, tile_width,
938                                c->epic_buf_stride);
939
940         epic_free_pixel_cache(&c->ec.hash);
941         ff_els_decoder_uninit(&c->ec.unsigned_rung);
942
943         if (ret) {
944             av_log(avctx, AV_LOG_ERROR,
945                    "ePIC: tile decoding failed, frame=%d, tile_x=%d, tile_y=%d\n",
946                    avctx->frame_number, tile_x, tile_y);
947             return AVERROR_INVALIDDATA;
948         }
949
950         buf = c->epic_buf;
951         dst = c->framebuf + tile_x * c->tile_width * 3 +
952               tile_y * c->tile_height * c->framebuf_stride;
953
954         for (j = 0; j < tile_height; j++) {
955             uint8_t *out = dst;
956             in  = (uint32_t *) buf;
957             for (i = 0; i < tile_width; i++) {
958                 out[0] = (in[i] >> R_shift) & 0xFF;
959                 out[1] = (in[i] >> G_shift) & 0xFF;
960                 out[2] = (in[i] >> B_shift) & 0xFF;
961                 out   += 3;
962             }
963             buf += c->epic_buf_stride;
964             dst += c->framebuf_stride;
965         }
966
967         if (src_size > els_dsize) {
968             uint8_t *jpg;
969             uint32_t tr;
970             int bstride = FFALIGN(tile_width, 16) >> 3;
971             int nblocks = 0;
972             int estride = c->epic_buf_stride >> 2;
973
974             src      += els_dsize;
975             src_size -= els_dsize;
976
977             in = (uint32_t *) c->epic_buf;
978             tr = (tr_r << R_shift) | (tr_g << G_shift) | (tr_b << B_shift);
979
980             memset(c->kempf_flags, 0,
981                    (aheight >> 3) * bstride * sizeof(*c->kempf_flags));
982             for (j = 0; j < tile_height; j += 8) {
983                 for (i = 0; i < tile_width; i += 8) {
984                     c->kempf_flags[(i >> 3) + (j >> 3) * bstride] = 0;
985                     for (k = 0; k < 8 * 8; k++) {
986                         if (in[i + (k & 7) + (k >> 3) * estride] == tr) {
987                             c->kempf_flags[(i >> 3) + (j >> 3) * bstride] = 1;
988                             nblocks++;
989                             break;
990                         }
991                     }
992                 }
993                 in += 8 * estride;
994             }
995
996             memset(c->jpeg_tile, 0, c->tile_stride * aheight);
997             jpg_decode_data(&c->jc, awidth, aheight, src, src_size,
998                             c->jpeg_tile, c->tile_stride,
999                             c->kempf_flags, bstride, nblocks, c->swapuv);
1000
1001             in  = (uint32_t *) c->epic_buf;
1002             dst = c->framebuf + tile_x * c->tile_width * 3 +
1003                   tile_y * c->tile_height * c->framebuf_stride;
1004             jpg = c->jpeg_tile;
1005             for (j = 0; j < tile_height; j++) {
1006                 for (i = 0; i < tile_width; i++)
1007                     if (in[i] == tr)
1008                         memcpy(dst + i * 3, jpg + i * 3, 3);
1009                 in  += c->epic_buf_stride >> 2;
1010                 dst += c->framebuf_stride;
1011                 jpg += c->tile_stride;
1012             }
1013         }
1014     } else {
1015         dst = c->framebuf + tile_x * c->tile_width * 3 +
1016               tile_y * c->tile_height * c->framebuf_stride;
1017         return jpg_decode_data(&c->jc, tile_width, tile_height, src, src_size,
1018                                dst, c->framebuf_stride, NULL, 0, 0, c->swapuv);
1019     }
1020
1021     return 0;
1022 }
1023
1024 static int kempf_restore_buf(const uint8_t *src, int len,
1025                               uint8_t *dst, int stride,
1026                               const uint8_t *jpeg_tile, int tile_stride,
1027                               int width, int height,
1028                               const uint8_t *pal, int npal, int tidx)
1029 {
1030     GetBitContext gb;
1031     int i, j, nb, col;
1032     int ret;
1033     int align_width = FFALIGN(width, 16);
1034
1035     if ((ret = init_get_bits8(&gb, src, len)) < 0)
1036         return ret;
1037
1038     if (npal <= 2)       nb = 1;
1039     else if (npal <= 4)  nb = 2;
1040     else if (npal <= 16) nb = 4;
1041     else                 nb = 8;
1042
1043     for (j = 0; j < height; j++, dst += stride, jpeg_tile += tile_stride) {
1044         if (get_bits(&gb, 8))
1045             continue;
1046         for (i = 0; i < width; i++) {
1047             col = get_bits(&gb, nb);
1048             if (col != tidx)
1049                 memcpy(dst + i * 3, pal + col * 3, 3);
1050             else
1051                 memcpy(dst + i * 3, jpeg_tile + i * 3, 3);
1052         }
1053         skip_bits_long(&gb, nb * (align_width - width));
1054     }
1055
1056     return 0;
1057 }
1058
1059 static int kempf_decode_tile(G2MContext *c, int tile_x, int tile_y,
1060                              const uint8_t *src, int src_size)
1061 {
1062     int width, height;
1063     int hdr, zsize, npal, tidx = -1, ret;
1064     int i, j;
1065     const uint8_t *src_end = src + src_size;
1066     uint8_t pal[768], transp[3];
1067     uLongf dlen = (c->tile_width + 1) * c->tile_height;
1068     int sub_type;
1069     int nblocks, cblocks, bstride;
1070     int bits, bitbuf, coded;
1071     uint8_t *dst = c->framebuf + tile_x * c->tile_width * 3 +
1072                    tile_y * c->tile_height * c->framebuf_stride;
1073
1074     if (src_size < 2)
1075         return AVERROR_INVALIDDATA;
1076
1077     width  = FFMIN(c->width  - tile_x * c->tile_width,  c->tile_width);
1078     height = FFMIN(c->height - tile_y * c->tile_height, c->tile_height);
1079
1080     hdr      = *src++;
1081     sub_type = hdr >> 5;
1082     if (sub_type == 0) {
1083         int j;
1084         memcpy(transp, src, 3);
1085         src += 3;
1086         for (j = 0; j < height; j++, dst += c->framebuf_stride)
1087             for (i = 0; i < width; i++)
1088                 memcpy(dst + i * 3, transp, 3);
1089         return 0;
1090     } else if (sub_type == 1) {
1091         return jpg_decode_data(&c->jc, width, height, src, src_end - src,
1092                                dst, c->framebuf_stride, NULL, 0, 0, 0);
1093     }
1094
1095     if (sub_type != 2) {
1096         memcpy(transp, src, 3);
1097         src += 3;
1098     }
1099     npal = *src++ + 1;
1100     if (src_end - src < npal * 3)
1101         return AVERROR_INVALIDDATA;
1102     memcpy(pal, src, npal * 3);
1103     src += npal * 3;
1104     if (sub_type != 2) {
1105         for (i = 0; i < npal; i++) {
1106             if (!memcmp(pal + i * 3, transp, 3)) {
1107                 tidx = i;
1108                 break;
1109             }
1110         }
1111     }
1112
1113     if (src_end - src < 2)
1114         return 0;
1115     zsize = (src[0] << 8) | src[1];
1116     src  += 2;
1117
1118     if (src_end - src < zsize + (sub_type != 2))
1119         return AVERROR_INVALIDDATA;
1120
1121     ret = uncompress(c->kempf_buf, &dlen, src, zsize);
1122     if (ret)
1123         return AVERROR_INVALIDDATA;
1124     src += zsize;
1125
1126     if (sub_type == 2) {
1127         kempf_restore_buf(c->kempf_buf, dlen, dst, c->framebuf_stride,
1128                           NULL, 0, width, height, pal, npal, tidx);
1129         return 0;
1130     }
1131
1132     nblocks = *src++ + 1;
1133     cblocks = 0;
1134     bstride = FFALIGN(width, 16) >> 3;
1135     // blocks are coded LSB and we need normal bitreader for JPEG data
1136     bits = 0;
1137     for (i = 0; i < (FFALIGN(height, 16) >> 4); i++) {
1138         for (j = 0; j < (FFALIGN(width, 16) >> 4); j++) {
1139             if (!bits) {
1140                 if (src >= src_end)
1141                     return AVERROR_INVALIDDATA;
1142                 bitbuf = *src++;
1143                 bits   = 8;
1144             }
1145             coded = bitbuf & 1;
1146             bits--;
1147             bitbuf >>= 1;
1148             cblocks += coded;
1149             if (cblocks > nblocks)
1150                 return AVERROR_INVALIDDATA;
1151             c->kempf_flags[j * 2 +      i * 2      * bstride] =
1152             c->kempf_flags[j * 2 + 1 +  i * 2      * bstride] =
1153             c->kempf_flags[j * 2 +     (i * 2 + 1) * bstride] =
1154             c->kempf_flags[j * 2 + 1 + (i * 2 + 1) * bstride] = coded;
1155         }
1156     }
1157
1158     memset(c->jpeg_tile, 0, c->tile_stride * height);
1159     jpg_decode_data(&c->jc, width, height, src, src_end - src,
1160                     c->jpeg_tile, c->tile_stride,
1161                     c->kempf_flags, bstride, nblocks * 4, 0);
1162
1163     kempf_restore_buf(c->kempf_buf, dlen, dst, c->framebuf_stride,
1164                       c->jpeg_tile, c->tile_stride,
1165                       width, height, pal, npal, tidx);
1166
1167     return 0;
1168 }
1169
1170 static int g2m_init_buffers(G2MContext *c)
1171 {
1172     int aligned_height;
1173
1174     if (!c->framebuf || c->old_width < c->width || c->old_height < c->height) {
1175         c->framebuf_stride = FFALIGN(c->width + 15, 16) * 3;
1176         aligned_height     = c->height + 15;
1177         av_free(c->framebuf);
1178         c->framebuf = av_mallocz_array(c->framebuf_stride, aligned_height);
1179         if (!c->framebuf)
1180             return AVERROR(ENOMEM);
1181     }
1182     if (!c->synth_tile || !c->jpeg_tile ||
1183         (c->compression == 2 && !c->epic_buf_base) ||
1184         c->old_tile_w < c->tile_width ||
1185         c->old_tile_h < c->tile_height) {
1186         c->tile_stride     = FFALIGN(c->tile_width, 16) * 3;
1187         c->epic_buf_stride = FFALIGN(c->tile_width * 4, 16);
1188         aligned_height     = FFALIGN(c->tile_height,    16);
1189         av_freep(&c->synth_tile);
1190         av_freep(&c->jpeg_tile);
1191         av_freep(&c->kempf_buf);
1192         av_freep(&c->kempf_flags);
1193         av_freep(&c->epic_buf_base);
1194         c->epic_buf    = NULL;
1195         c->synth_tile  = av_mallocz(c->tile_stride      * aligned_height);
1196         c->jpeg_tile   = av_mallocz(c->tile_stride      * aligned_height);
1197         c->kempf_buf   = av_mallocz((c->tile_width + 1) * aligned_height +
1198                                     AV_INPUT_BUFFER_PADDING_SIZE);
1199         c->kempf_flags = av_mallocz(c->tile_width       * aligned_height);
1200         if (!c->synth_tile || !c->jpeg_tile ||
1201             !c->kempf_buf || !c->kempf_flags)
1202             return AVERROR(ENOMEM);
1203         if (c->compression == 2) {
1204             c->epic_buf_base = av_mallocz(c->epic_buf_stride * aligned_height + 4);
1205             if (!c->epic_buf_base)
1206                 return AVERROR(ENOMEM);
1207             c->epic_buf = c->epic_buf_base + 4;
1208         }
1209     }
1210
1211     return 0;
1212 }
1213
1214 static int g2m_load_cursor(AVCodecContext *avctx, G2MContext *c,
1215                            GetByteContext *gb)
1216 {
1217     int i, j, k;
1218     uint8_t *dst;
1219     uint32_t bits;
1220     uint32_t cur_size, cursor_w, cursor_h, cursor_stride;
1221     uint32_t cursor_hot_x, cursor_hot_y;
1222     int cursor_fmt, err;
1223
1224     cur_size     = bytestream2_get_be32(gb);
1225     cursor_w     = bytestream2_get_byte(gb);
1226     cursor_h     = bytestream2_get_byte(gb);
1227     cursor_hot_x = bytestream2_get_byte(gb);
1228     cursor_hot_y = bytestream2_get_byte(gb);
1229     cursor_fmt   = bytestream2_get_byte(gb);
1230
1231     cursor_stride = FFALIGN(cursor_w, cursor_fmt==1 ? 32 : 1) * 4;
1232
1233     if (cursor_w < 1 || cursor_w > 256 ||
1234         cursor_h < 1 || cursor_h > 256) {
1235         av_log(avctx, AV_LOG_ERROR, "Invalid cursor dimensions %"PRIu32"x%"PRIu32"\n",
1236                cursor_w, cursor_h);
1237         return AVERROR_INVALIDDATA;
1238     }
1239     if (cursor_hot_x > cursor_w || cursor_hot_y > cursor_h) {
1240         av_log(avctx, AV_LOG_WARNING, "Invalid hotspot position %"PRIu32",%"PRIu32"\n",
1241                cursor_hot_x, cursor_hot_y);
1242         cursor_hot_x = FFMIN(cursor_hot_x, cursor_w - 1);
1243         cursor_hot_y = FFMIN(cursor_hot_y, cursor_h - 1);
1244     }
1245     if (cur_size - 9 > bytestream2_get_bytes_left(gb) ||
1246         c->cursor_w * c->cursor_h / 4 > cur_size) {
1247         av_log(avctx, AV_LOG_ERROR, "Invalid cursor data size %"PRIu32"/%u\n",
1248                cur_size, bytestream2_get_bytes_left(gb));
1249         return AVERROR_INVALIDDATA;
1250     }
1251     if (cursor_fmt != 1 && cursor_fmt != 32) {
1252         avpriv_report_missing_feature(avctx, "Cursor format %d",
1253                                       cursor_fmt);
1254         return AVERROR_PATCHWELCOME;
1255     }
1256
1257     if ((err = av_reallocp(&c->cursor, cursor_stride * cursor_h)) < 0) {
1258         av_log(avctx, AV_LOG_ERROR, "Cannot allocate cursor buffer\n");
1259         return err;
1260     }
1261
1262     c->cursor_w      = cursor_w;
1263     c->cursor_h      = cursor_h;
1264     c->cursor_hot_x  = cursor_hot_x;
1265     c->cursor_hot_y  = cursor_hot_y;
1266     c->cursor_fmt    = cursor_fmt;
1267     c->cursor_stride = cursor_stride;
1268
1269     dst = c->cursor;
1270     switch (c->cursor_fmt) {
1271     case 1: // old monochrome
1272         for (j = 0; j < c->cursor_h; j++) {
1273             for (i = 0; i < c->cursor_w; i += 32) {
1274                 bits = bytestream2_get_be32(gb);
1275                 for (k = 0; k < 32; k++) {
1276                     dst[0] = !!(bits & 0x80000000);
1277                     dst   += 4;
1278                     bits <<= 1;
1279                 }
1280             }
1281         }
1282
1283         dst = c->cursor;
1284         for (j = 0; j < c->cursor_h; j++) {
1285             for (i = 0; i < c->cursor_w; i += 32) {
1286                 bits = bytestream2_get_be32(gb);
1287                 for (k = 0; k < 32; k++) {
1288                     int mask_bit = !!(bits & 0x80000000);
1289                     switch (dst[0] * 2 + mask_bit) {
1290                     case 0:
1291                         dst[0] = 0xFF;
1292                         dst[1] = 0x00;
1293                         dst[2] = 0x00;
1294                         dst[3] = 0x00;
1295                         break;
1296                     case 1:
1297                         dst[0] = 0xFF;
1298                         dst[1] = 0xFF;
1299                         dst[2] = 0xFF;
1300                         dst[3] = 0xFF;
1301                         break;
1302                     default:
1303                         dst[0] = 0x00;
1304                         dst[1] = 0x00;
1305                         dst[2] = 0x00;
1306                         dst[3] = 0x00;
1307                     }
1308                     dst   += 4;
1309                     bits <<= 1;
1310                 }
1311             }
1312         }
1313         break;
1314     case 32: // full colour
1315         /* skip monochrome version of the cursor and decode RGBA instead */
1316         bytestream2_skip(gb, c->cursor_h * (FFALIGN(c->cursor_w, 32) >> 3));
1317         for (j = 0; j < c->cursor_h; j++) {
1318             for (i = 0; i < c->cursor_w; i++) {
1319                 int val = bytestream2_get_be32(gb);
1320                 *dst++ = val >>  0;
1321                 *dst++ = val >>  8;
1322                 *dst++ = val >> 16;
1323                 *dst++ = val >> 24;
1324             }
1325         }
1326         break;
1327     default:
1328         return AVERROR_PATCHWELCOME;
1329     }
1330     return 0;
1331 }
1332
1333 #define APPLY_ALPHA(src, new, alpha) \
1334     src = (src * (256 - alpha) + new * alpha) >> 8
1335
1336 static void g2m_paint_cursor(G2MContext *c, uint8_t *dst, int stride)
1337 {
1338     int i, j;
1339     int x, y, w, h;
1340     const uint8_t *cursor;
1341
1342     if (!c->cursor)
1343         return;
1344
1345     x = c->cursor_x - c->cursor_hot_x;
1346     y = c->cursor_y - c->cursor_hot_y;
1347
1348     cursor = c->cursor;
1349     w      = c->cursor_w;
1350     h      = c->cursor_h;
1351
1352     if (x + w > c->width)
1353         w = c->width - x;
1354     if (y + h > c->height)
1355         h = c->height - y;
1356     if (x < 0) {
1357         w      +=  x;
1358         cursor += -x * 4;
1359     } else {
1360         dst    +=  x * 3;
1361     }
1362
1363     if (y < 0)
1364         h      +=  y;
1365     if (w < 0 || h < 0)
1366         return;
1367     if (y < 0) {
1368         cursor += -y * c->cursor_stride;
1369     } else {
1370         dst    +=  y * stride;
1371     }
1372
1373     for (j = 0; j < h; j++) {
1374         for (i = 0; i < w; i++) {
1375             uint8_t alpha = cursor[i * 4];
1376             APPLY_ALPHA(dst[i * 3 + 0], cursor[i * 4 + 1], alpha);
1377             APPLY_ALPHA(dst[i * 3 + 1], cursor[i * 4 + 2], alpha);
1378             APPLY_ALPHA(dst[i * 3 + 2], cursor[i * 4 + 3], alpha);
1379         }
1380         dst    += stride;
1381         cursor += c->cursor_stride;
1382     }
1383 }
1384
1385 static int g2m_decode_frame(AVCodecContext *avctx, void *data,
1386                             int *got_picture_ptr, AVPacket *avpkt)
1387 {
1388     const uint8_t *buf = avpkt->data;
1389     int buf_size = avpkt->size;
1390     G2MContext *c = avctx->priv_data;
1391     AVFrame *pic = data;
1392     GetByteContext bc, tbc;
1393     int magic;
1394     int got_header = 0;
1395     uint32_t chunk_size, r_mask, g_mask, b_mask;
1396     int chunk_type, chunk_start;
1397     int i;
1398     int ret;
1399
1400     if (buf_size < 12) {
1401         av_log(avctx, AV_LOG_ERROR,
1402                "Frame should have at least 12 bytes, got %d instead\n",
1403                buf_size);
1404         return AVERROR_INVALIDDATA;
1405     }
1406
1407     bytestream2_init(&bc, buf, buf_size);
1408
1409     magic = bytestream2_get_be32(&bc);
1410     if ((magic & ~0xF) != MKBETAG('G', '2', 'M', '0') ||
1411         (magic & 0xF) < 2 || (magic & 0xF) > 5) {
1412         av_log(avctx, AV_LOG_ERROR, "Wrong magic %08X\n", magic);
1413         return AVERROR_INVALIDDATA;
1414     }
1415
1416     c->swapuv = magic == MKBETAG('G', '2', 'M', '2');
1417
1418     while (bytestream2_get_bytes_left(&bc) > 5) {
1419         chunk_size  = bytestream2_get_le32(&bc) - 1;
1420         chunk_type  = bytestream2_get_byte(&bc);
1421         chunk_start = bytestream2_tell(&bc);
1422         if (chunk_size > bytestream2_get_bytes_left(&bc)) {
1423             av_log(avctx, AV_LOG_ERROR, "Invalid chunk size %"PRIu32" type %02X\n",
1424                    chunk_size, chunk_type);
1425             break;
1426         }
1427         switch (chunk_type) {
1428         case DISPLAY_INFO:
1429             got_header =
1430             c->got_header = 0;
1431             if (chunk_size < 21) {
1432                 av_log(avctx, AV_LOG_ERROR, "Invalid display info size %"PRIu32"\n",
1433                        chunk_size);
1434                 break;
1435             }
1436             c->width  = bytestream2_get_be32(&bc);
1437             c->height = bytestream2_get_be32(&bc);
1438             if (c->width < 16 || c->height < 16) {
1439                 av_log(avctx, AV_LOG_ERROR,
1440                        "Invalid frame dimensions %dx%d\n",
1441                        c->width, c->height);
1442                 ret = AVERROR_INVALIDDATA;
1443                 goto header_fail;
1444             }
1445             if (c->width != avctx->width || c->height != avctx->height) {
1446                 ret = ff_set_dimensions(avctx, c->width, c->height);
1447                 if (ret < 0)
1448                     goto header_fail;
1449             }
1450             c->compression = bytestream2_get_be32(&bc);
1451             if (c->compression != 2 && c->compression != 3) {
1452                 avpriv_report_missing_feature(avctx, "Compression method %d",
1453                                               c->compression);
1454                 ret = AVERROR_PATCHWELCOME;
1455                 goto header_fail;
1456             }
1457             c->tile_width  = bytestream2_get_be32(&bc);
1458             c->tile_height = bytestream2_get_be32(&bc);
1459             if (c->tile_width <= 0 || c->tile_height <= 0 ||
1460                 ((c->tile_width | c->tile_height) & 0xF) ||
1461                 c->tile_width * (uint64_t)c->tile_height >= INT_MAX / 4 ||
1462                 av_image_check_size2(c->tile_width, c->tile_height, avctx->max_pixels, avctx->pix_fmt, 0, avctx) < 0
1463             ) {
1464                 av_log(avctx, AV_LOG_ERROR,
1465                        "Invalid tile dimensions %dx%d\n",
1466                        c->tile_width, c->tile_height);
1467                 ret = AVERROR_INVALIDDATA;
1468                 goto header_fail;
1469             }
1470             c->tiles_x = (c->width  + c->tile_width  - 1) / c->tile_width;
1471             c->tiles_y = (c->height + c->tile_height - 1) / c->tile_height;
1472             c->bpp     = bytestream2_get_byte(&bc);
1473             if (c->bpp == 32) {
1474                 if (bytestream2_get_bytes_left(&bc) < 16 ||
1475                     (chunk_size - 21) < 16) {
1476                     av_log(avctx, AV_LOG_ERROR,
1477                            "Display info: missing bitmasks!\n");
1478                     ret = AVERROR_INVALIDDATA;
1479                     goto header_fail;
1480                 }
1481                 r_mask = bytestream2_get_be32(&bc);
1482                 g_mask = bytestream2_get_be32(&bc);
1483                 b_mask = bytestream2_get_be32(&bc);
1484                 if (r_mask != 0xFF0000 || g_mask != 0xFF00 || b_mask != 0xFF) {
1485                     avpriv_report_missing_feature(avctx,
1486                                                   "Bitmasks: R=%"PRIX32", G=%"PRIX32", B=%"PRIX32,
1487                                                   r_mask, g_mask, b_mask);
1488                     ret = AVERROR_PATCHWELCOME;
1489                     goto header_fail;
1490                 }
1491             } else {
1492                 avpriv_request_sample(avctx, "bpp=%d", c->bpp);
1493                 ret = AVERROR_PATCHWELCOME;
1494                 goto header_fail;
1495             }
1496             if (g2m_init_buffers(c)) {
1497                 ret = AVERROR(ENOMEM);
1498                 goto header_fail;
1499             }
1500             got_header = 1;
1501             break;
1502         case TILE_DATA:
1503             if (!c->tiles_x || !c->tiles_y) {
1504                 av_log(avctx, AV_LOG_WARNING,
1505                        "No display info - skipping tile\n");
1506                 break;
1507             }
1508             if (chunk_size < 2) {
1509                 av_log(avctx, AV_LOG_ERROR, "Invalid tile data size %"PRIu32"\n",
1510                        chunk_size);
1511                 break;
1512             }
1513             c->tile_x = bytestream2_get_byte(&bc);
1514             c->tile_y = bytestream2_get_byte(&bc);
1515             if (c->tile_x >= c->tiles_x || c->tile_y >= c->tiles_y) {
1516                 av_log(avctx, AV_LOG_ERROR,
1517                        "Invalid tile pos %d,%d (in %dx%d grid)\n",
1518                        c->tile_x, c->tile_y, c->tiles_x, c->tiles_y);
1519                 break;
1520             }
1521             ret = 0;
1522             switch (c->compression) {
1523             case COMPR_EPIC_J_B:
1524                 ret = epic_jb_decode_tile(c, c->tile_x, c->tile_y,
1525                                           buf + bytestream2_tell(&bc),
1526                                           chunk_size - 2, avctx);
1527                 break;
1528             case COMPR_KEMPF_J_B:
1529                 ret = kempf_decode_tile(c, c->tile_x, c->tile_y,
1530                                         buf + bytestream2_tell(&bc),
1531                                         chunk_size - 2);
1532                 break;
1533             }
1534             if (ret && c->framebuf)
1535                 av_log(avctx, AV_LOG_ERROR, "Error decoding tile %d,%d\n",
1536                        c->tile_x, c->tile_y);
1537             break;
1538         case CURSOR_POS:
1539             if (chunk_size < 5) {
1540                 av_log(avctx, AV_LOG_ERROR, "Invalid cursor pos size %"PRIu32"\n",
1541                        chunk_size);
1542                 break;
1543             }
1544             c->cursor_x = bytestream2_get_be16(&bc);
1545             c->cursor_y = bytestream2_get_be16(&bc);
1546             break;
1547         case CURSOR_SHAPE:
1548             if (chunk_size < 8) {
1549                 av_log(avctx, AV_LOG_ERROR, "Invalid cursor data size %"PRIu32"\n",
1550                        chunk_size);
1551                 break;
1552             }
1553             bytestream2_init(&tbc, buf + bytestream2_tell(&bc),
1554                              chunk_size - 4);
1555             g2m_load_cursor(avctx, c, &tbc);
1556             break;
1557         case CHUNK_CC:
1558         case CHUNK_CD:
1559             break;
1560         default:
1561             av_log(avctx, AV_LOG_WARNING, "Skipping chunk type %02d\n",
1562                    chunk_type);
1563         }
1564
1565         /* navigate to next chunk */
1566         bytestream2_skip(&bc, chunk_start + chunk_size - bytestream2_tell(&bc));
1567     }
1568     if (got_header)
1569         c->got_header = 1;
1570
1571     if (c->width && c->height && c->framebuf) {
1572         if ((ret = ff_get_buffer(avctx, pic, 0)) < 0)
1573             return ret;
1574
1575         pic->key_frame = got_header;
1576         pic->pict_type = got_header ? AV_PICTURE_TYPE_I : AV_PICTURE_TYPE_P;
1577
1578         for (i = 0; i < avctx->height; i++)
1579             memcpy(pic->data[0] + i * pic->linesize[0],
1580                    c->framebuf + i * c->framebuf_stride,
1581                    c->width * 3);
1582         g2m_paint_cursor(c, pic->data[0], pic->linesize[0]);
1583
1584         *got_picture_ptr = 1;
1585     }
1586
1587     return buf_size;
1588
1589 header_fail:
1590     c->width   =
1591     c->height  = 0;
1592     c->tiles_x =
1593     c->tiles_y = 0;
1594     c->tile_width =
1595     c->tile_height = 0;
1596     return ret;
1597 }
1598
1599 static av_cold int g2m_decode_init(AVCodecContext *avctx)
1600 {
1601     G2MContext *const c = avctx->priv_data;
1602     int ret;
1603
1604     if ((ret = jpg_init(avctx, &c->jc)) != 0) {
1605         av_log(avctx, AV_LOG_ERROR, "Cannot initialise VLCs\n");
1606         jpg_free_context(&c->jc);
1607         return AVERROR(ENOMEM);
1608     }
1609
1610     avctx->pix_fmt = AV_PIX_FMT_RGB24;
1611
1612     // store original sizes and check against those if resize happens
1613     c->orig_width  = avctx->width;
1614     c->orig_height = avctx->height;
1615
1616     return 0;
1617 }
1618
1619 static av_cold int g2m_decode_end(AVCodecContext *avctx)
1620 {
1621     G2MContext *const c = avctx->priv_data;
1622
1623     jpg_free_context(&c->jc);
1624
1625     av_freep(&c->epic_buf_base);
1626     c->epic_buf = NULL;
1627     av_freep(&c->kempf_buf);
1628     av_freep(&c->kempf_flags);
1629     av_freep(&c->synth_tile);
1630     av_freep(&c->jpeg_tile);
1631     av_freep(&c->cursor);
1632     av_freep(&c->framebuf);
1633
1634     return 0;
1635 }
1636
1637 AVCodec ff_g2m_decoder = {
1638     .name           = "g2m",
1639     .long_name      = NULL_IF_CONFIG_SMALL("Go2Meeting"),
1640     .type           = AVMEDIA_TYPE_VIDEO,
1641     .id             = AV_CODEC_ID_G2M,
1642     .priv_data_size = sizeof(G2MContext),
1643     .init           = g2m_decode_init,
1644     .close          = g2m_decode_end,
1645     .decode         = g2m_decode_frame,
1646     .capabilities   = AV_CODEC_CAP_DR1,
1647     .caps_internal  = FF_CODEC_CAP_INIT_THREADSAFE,
1648 };