git.sesse.net Git - ffmpeg/blob - libavcodec/huffyuvdec.c

   1 /*
   2  * huffyuv decoder
   3  *
   4  * Copyright (c) 2002-2014 Michael Niedermayer <michaelni@gmx.at>
   5  *
   6  * see http://www.pcisys.net/~melanson/codecs/huffyuv.txt for a description of
   7  * the algorithm used
   8  *
   9  * This file is part of FFmpeg.
  10  *
  11  * FFmpeg is free software; you can redistribute it and/or
  12  * modify it under the terms of the GNU Lesser General Public
  13  * License as published by the Free Software Foundation; either
  14  * version 2.1 of the License, or (at your option) any later version.
  15  *
  16  * FFmpeg is distributed in the hope that it will be useful,
  17  * but WITHOUT ANY WARRANTY; without even the implied warranty of
  18  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
  19  * Lesser General Public License for more details.
  20  *
  21  * You should have received a copy of the GNU Lesser General Public
  22  * License along with FFmpeg; if not, write to the Free Software
  23  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
  24  *
  25  * yuva, gray, 4:4:4, 4:1:1, 4:1:0 and >8 bit per sample support sponsored by NOA
  26  */
  27
  28 /**
  29  * @file
  30  * huffyuv decoder
  31  */
  32
  33 #include "avcodec.h"
  34 #include "get_bits.h"
  35 #include "huffyuv.h"
  36 #include "huffyuvdsp.h"
  37 #include "thread.h"
  38 #include "libavutil/pixdesc.h"
  39
  40 #define classic_shift_luma_table_size 42
  41 static const unsigned char classic_shift_luma[classic_shift_luma_table_size + FF_INPUT_BUFFER_PADDING_SIZE] = {
  42   34,36,35,69,135,232,9,16,10,24,11,23,12,16,13,10,14,8,15,8,
  43   16,8,17,20,16,10,207,206,205,236,11,8,10,21,9,23,8,8,199,70,
  44   69,68, 0,
  45   0,0,0,0,0,0,0,0,
  46 };
  47
  48 #define classic_shift_chroma_table_size 59
  49 static const unsigned char classic_shift_chroma[classic_shift_chroma_table_size + FF_INPUT_BUFFER_PADDING_SIZE] = {
  50   66,36,37,38,39,40,41,75,76,77,110,239,144,81,82,83,84,85,118,183,
  51   56,57,88,89,56,89,154,57,58,57,26,141,57,56,58,57,58,57,184,119,
  52   214,245,116,83,82,49,80,79,78,77,44,75,41,40,39,38,37,36,34, 0,
  53   0,0,0,0,0,0,0,0,
  54 };
  55
  56 static const unsigned char classic_add_luma[256] = {
  57     3,  9,  5, 12, 10, 35, 32, 29, 27, 50, 48, 45, 44, 41, 39, 37,
  58    73, 70, 68, 65, 64, 61, 58, 56, 53, 50, 49, 46, 44, 41, 38, 36,
  59    68, 65, 63, 61, 58, 55, 53, 51, 48, 46, 45, 43, 41, 39, 38, 36,
  60    35, 33, 32, 30, 29, 27, 26, 25, 48, 47, 46, 44, 43, 41, 40, 39,
  61    37, 36, 35, 34, 32, 31, 30, 28, 27, 26, 24, 23, 22, 20, 19, 37,
  62    35, 34, 33, 31, 30, 29, 27, 26, 24, 23, 21, 20, 18, 17, 15, 29,
  63    27, 26, 24, 22, 21, 19, 17, 16, 14, 26, 25, 23, 21, 19, 18, 16,
  64    15, 27, 25, 23, 21, 19, 17, 16, 14, 26, 25, 23, 21, 18, 17, 14,
  65    12, 17, 19, 13,  4,  9,  2, 11,  1,  7,  8,  0, 16,  3, 14,  6,
  66    12, 10,  5, 15, 18, 11, 10, 13, 15, 16, 19, 20, 22, 24, 27, 15,
  67    18, 20, 22, 24, 26, 14, 17, 20, 22, 24, 27, 15, 18, 20, 23, 25,
  68    28, 16, 19, 22, 25, 28, 32, 36, 21, 25, 29, 33, 38, 42, 45, 49,
  69    28, 31, 34, 37, 40, 42, 44, 47, 49, 50, 52, 54, 56, 57, 59, 60,
  70    62, 64, 66, 67, 69, 35, 37, 39, 40, 42, 43, 45, 47, 48, 51, 52,
  71    54, 55, 57, 59, 60, 62, 63, 66, 67, 69, 71, 72, 38, 40, 42, 43,
  72    46, 47, 49, 51, 26, 28, 30, 31, 33, 34, 18, 19, 11, 13,  7,  8,
  73 };
  74
  75 static const unsigned char classic_add_chroma[256] = {
  76     3,  1,  2,  2,  2,  2,  3,  3,  7,  5,  7,  5,  8,  6, 11,  9,
  77     7, 13, 11, 10,  9,  8,  7,  5,  9,  7,  6,  4,  7,  5,  8,  7,
  78    11,  8, 13, 11, 19, 15, 22, 23, 20, 33, 32, 28, 27, 29, 51, 77,
  79    43, 45, 76, 81, 46, 82, 75, 55, 56,144, 58, 80, 60, 74,147, 63,
  80   143, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79,
  81    80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 27, 30, 21, 22,
  82    17, 14,  5,  6,100, 54, 47, 50, 51, 53,106,107,108,109,110,111,
  83   112,113,114,115,  4,117,118, 92, 94,121,122,  3,124,103,  2,  1,
  84     0,129,130,131,120,119,126,125,136,137,138,139,140,141,142,134,
  85   135,132,133,104, 64,101, 62, 57,102, 95, 93, 59, 61, 28, 97, 96,
  86    52, 49, 48, 29, 32, 25, 24, 46, 23, 98, 45, 44, 43, 20, 42, 41,
  87    19, 18, 99, 40, 15, 39, 38, 16, 13, 12, 11, 37, 10,  9,  8, 36,
  88     7,128,127,105,123,116, 35, 34, 33,145, 31, 79, 42,146, 78, 26,
  89    83, 48, 49, 50, 44, 47, 26, 31, 30, 18, 17, 19, 21, 24, 25, 13,
  90    14, 16, 17, 18, 20, 21, 12, 14, 15,  9, 10,  6,  9,  6,  5,  8,
  91     6, 12,  8, 10,  7,  9,  6,  4,  6,  2,  2,  3,  3,  3,  3,  2,
  92 };
  93
  94 static int read_len_table(uint8_t *dst, GetBitContext *gb, int n)
  95 {
  96     int i, val, repeat;
  97
  98     for (i = 0; i < n;) {
  99         repeat = get_bits(gb, 3);
 100         val    = get_bits(gb, 5);
 101         if (repeat == 0)
 102             repeat = get_bits(gb, 8);
 103         if (i + repeat > n || get_bits_left(gb) < 0) {
 104             av_log(NULL, AV_LOG_ERROR, "Error reading huffman table\n");
 105             return -1;
 106         }
 107         while (repeat--)
 108             dst[i++] = val;
 109     }
 110     return 0;
 111 }
 112
 113 static int generate_joint_tables(HYuvContext *s)
 114 {
 115     uint16_t symbols[1 << VLC_BITS];
 116     uint16_t bits[1 << VLC_BITS];
 117     uint8_t len[1 << VLC_BITS];
 118     int ret;
 119
 120     if (s->bitstream_bpp < 24 || s->version > 2) {
 121         int p, i, y, u;
 122         for (p = 0; p < 4; p++) {
 123             int p0 = s->version > 2 ? p : 0;
 124             for (i = y = 0; y < s->vlc_n; y++) {
 125                 int len0 = s->len[p0][y];
 126                 int limit = VLC_BITS - len0;
 127                 if(limit <= 0 || !len0)
 128                     continue;
 129                 if((sign_extend(y, 8) & (s->vlc_n-1)) != y)
 130                     continue;
 131                 for (u = 0; u < s->vlc_n; u++) {
 132                     int len1 = s->len[p][u];
 133                     if (len1 > limit || !len1)
 134                         continue;
 135                     if((sign_extend(u, 8) & (s->vlc_n-1)) != u)
 136                         continue;
 137                     av_assert0(i < (1 << VLC_BITS));
 138                     len[i] = len0 + len1;
 139                     bits[i] = (s->bits[p0][y] << len1) + s->bits[p][u];
 140                     symbols[i] = (y << 8) + (u & 0xFF);
 141                         i++;
 142                 }
 143             }
 144             ff_free_vlc(&s->vlc[4 + p]);
 145             if ((ret = ff_init_vlc_sparse(&s->vlc[4 + p], VLC_BITS, i, len, 1, 1,
 146                                           bits, 2, 2, symbols, 2, 2, 0)) < 0)
 147                 return ret;
 148         }
 149     } else {
 150         uint8_t (*map)[4] = (uint8_t(*)[4])s->pix_bgr_map;
 151         int i, b, g, r, code;
 152         int p0 = s->decorrelate;
 153         int p1 = !s->decorrelate;
 154         // restrict the range to +/-16 because that's pretty much guaranteed to
 155         // cover all the combinations that fit in 11 bits total, and it doesn't
 156         // matter if we miss a few rare codes.
 157         for (i = 0, g = -16; g < 16; g++) {
 158             int len0 = s->len[p0][g & 255];
 159             int limit0 = VLC_BITS - len0;
 160             if (limit0 < 2 || !len0)
 161                 continue;
 162             for (b = -16; b < 16; b++) {
 163                 int len1 = s->len[p1][b & 255];
 164                 int limit1 = limit0 - len1;
 165                 if (limit1 < 1 || !len1)
 166                     continue;
 167                 code = (s->bits[p0][g & 255] << len1) + s->bits[p1][b & 255];
 168                 for (r = -16; r < 16; r++) {
 169                     int len2 = s->len[2][r & 255];
 170                     if (len2 > limit1 || !len2)
 171                         continue;
 172                     av_assert0(i < (1 << VLC_BITS));
 173                     len[i] = len0 + len1 + len2;
 174                     bits[i] = (code << len2) + s->bits[2][r & 255];
 175                     if (s->decorrelate) {
 176                         map[i][G] = g;
 177                         map[i][B] = g + b;
 178                         map[i][R] = g + r;
 179                     } else {
 180                         map[i][B] = g;
 181                         map[i][G] = b;
 182                         map[i][R] = r;
 183                     }
 184                     i++;
 185                 }
 186             }
 187         }
 188         ff_free_vlc(&s->vlc[4]);
 189         if ((ret = init_vlc(&s->vlc[4], VLC_BITS, i, len, 1, 1, bits, 2, 2, 0)) < 0)
 190             return ret;
 191     }
 192     return 0;
 193 }
 194
 195 static int read_huffman_tables(HYuvContext *s, const uint8_t *src, int length)
 196 {
 197     GetBitContext gb;
 198     int i;
 199     int ret;
 200     int count = 3;
 201
 202     init_get_bits(&gb, src, length * 8);
 203
 204     if (s->version > 2)
 205         count = 1 + s->alpha + 2*s->chroma;
 206
 207     for (i = 0; i < count; i++) {
 208         if (read_len_table(s->len[i], &gb, s->vlc_n) < 0)
 209             return -1;
 210         if (ff_huffyuv_generate_bits_table(s->bits[i], s->len[i], s->vlc_n) < 0) {
 211             return -1;
 212         }
 213         ff_free_vlc(&s->vlc[i]);
 214         if ((ret = init_vlc(&s->vlc[i], VLC_BITS, s->vlc_n, s->len[i], 1, 1,
 215                            s->bits[i], 4, 4, 0)) < 0)
 216             return ret;
 217     }
 218
 219     if ((ret = generate_joint_tables(s)) < 0)
 220         return ret;
 221
 222     return (get_bits_count(&gb) + 7) / 8;
 223 }
 224
 225 static int read_old_huffman_tables(HYuvContext *s)
 226 {
 227     GetBitContext gb;
 228     int i;
 229     int ret;
 230
 231     init_get_bits(&gb, classic_shift_luma,
 232                   classic_shift_luma_table_size * 8);
 233     if (read_len_table(s->len[0], &gb, 256) < 0)
 234         return -1;
 235
 236     init_get_bits(&gb, classic_shift_chroma,
 237                   classic_shift_chroma_table_size * 8);
 238     if (read_len_table(s->len[1], &gb, 256) < 0)
 239         return -1;
 240
 241     for(i=0; i<256; i++) s->bits[0][i] = classic_add_luma  [i];
 242     for(i=0; i<256; i++) s->bits[1][i] = classic_add_chroma[i];
 243
 244     if (s->bitstream_bpp >= 24) {
 245         memcpy(s->bits[1], s->bits[0], 256 * sizeof(uint32_t));
 246         memcpy(s->len[1] , s->len [0], 256 * sizeof(uint8_t));
 247     }
 248     memcpy(s->bits[2], s->bits[1], 256 * sizeof(uint32_t));
 249     memcpy(s->len[2] , s->len [1], 256 * sizeof(uint8_t));
 250
 251     for (i = 0; i < 4; i++) {
 252         ff_free_vlc(&s->vlc[i]);
 253         if ((ret = init_vlc(&s->vlc[i], VLC_BITS, 256, s->len[i], 1, 1,
 254                             s->bits[i], 4, 4, 0)) < 0)
 255             return ret;
 256     }
 257
 258     if ((ret = generate_joint_tables(s)) < 0)
 259         return ret;
 260
 261     return 0;
 262 }
 263
 264 static av_cold int decode_init(AVCodecContext *avctx)
 265 {
 266     HYuvContext *s = avctx->priv_data;
 267
 268     ff_huffyuvdsp_init(&s->hdsp);
 269     memset(s->vlc, 0, 4 * sizeof(VLC));
 270
 271     s->interlaced = avctx->height > 288;
 272
 273     s->bgr32 = 1;
 274
 275     if (avctx->extradata_size) {
 276         if ((avctx->bits_per_coded_sample & 7) &&
 277             avctx->bits_per_coded_sample != 12)
 278             s->version = 1; // do such files exist at all?
 279         else if (avctx->extradata_size > 3 && avctx->extradata[3] == 0)
 280             s->version = 2;
 281         else
 282             s->version = 3;
 283     } else
 284         s->version = 0;
 285
 286     s->bps = 8;
 287     s->n = 1<<s->bps;
 288     s->vlc_n = FFMIN(s->n, MAX_VLC_N);
 289     s->chroma = 1;
 290     if (s->version >= 2) {
 291         int method, interlace;
 292
 293         if (avctx->extradata_size < 4)
 294             return -1;
 295
 296         method = ((uint8_t*)avctx->extradata)[0];
 297         s->decorrelate = method & 64 ? 1 : 0;
 298         s->predictor = method & 63;
 299         if (s->version == 2) {
 300             s->bitstream_bpp = ((uint8_t*)avctx->extradata)[1];
 301             if (s->bitstream_bpp == 0)
 302                 s->bitstream_bpp = avctx->bits_per_coded_sample & ~7;
 303         } else {
 304             s->bps = (avctx->extradata[1] >> 4) + 1;
 305             s->n = 1<<s->bps;
 306             s->vlc_n = FFMIN(s->n, MAX_VLC_N);
 307             s->chroma_h_shift = avctx->extradata[1] & 3;
 308             s->chroma_v_shift = (avctx->extradata[1] >> 2) & 3;
 309             s->yuv   = !!(((uint8_t*)avctx->extradata)[2] & 1);
 310             s->chroma= !!(((uint8_t*)avctx->extradata)[2] & 3);
 311             s->alpha = !!(((uint8_t*)avctx->extradata)[2] & 4);
 312         }
 313         interlace = (((uint8_t*)avctx->extradata)[2] & 0x30) >> 4;
 314         s->interlaced = (interlace == 1) ? 1 : (interlace == 2) ? 0 : s->interlaced;
 315         s->context = ((uint8_t*)avctx->extradata)[2] & 0x40 ? 1 : 0;
 316
 317         if ( read_huffman_tables(s, ((uint8_t*)avctx->extradata) + 4,
 318                                  avctx->extradata_size - 4) < 0)
 319             return AVERROR_INVALIDDATA;
 320     }else{
 321         switch (avctx->bits_per_coded_sample & 7) {
 322         case 1:
 323             s->predictor = LEFT;
 324             s->decorrelate = 0;
 325             break;
 326         case 2:
 327             s->predictor = LEFT;
 328             s->decorrelate = 1;
 329             break;
 330         case 3:
 331             s->predictor = PLANE;
 332             s->decorrelate = avctx->bits_per_coded_sample >= 24;
 333             break;
 334         case 4:
 335             s->predictor = MEDIAN;
 336             s->decorrelate = 0;
 337             break;
 338         default:
 339             s->predictor = LEFT; //OLD
 340             s->decorrelate = 0;
 341             break;
 342         }
 343         s->bitstream_bpp = avctx->bits_per_coded_sample & ~7;
 344         s->context = 0;
 345
 346         if (read_old_huffman_tables(s) < 0)
 347             return AVERROR_INVALIDDATA;
 348     }
 349
 350     if (s->version <= 2) {
 351         switch (s->bitstream_bpp) {
 352         case 12:
 353             avctx->pix_fmt = AV_PIX_FMT_YUV420P;
 354             s->yuv = 1;
 355             break;
 356         case 16:
 357             if (s->yuy2) {
 358                 avctx->pix_fmt = AV_PIX_FMT_YUYV422;
 359             } else {
 360                 avctx->pix_fmt = AV_PIX_FMT_YUV422P;
 361             }
 362             s->yuv = 1;
 363             break;
 364         case 24:
 365             if (s->bgr32) {
 366                 avctx->pix_fmt = AV_PIX_FMT_0RGB32;
 367             } else {
 368                 avctx->pix_fmt = AV_PIX_FMT_BGR24;
 369             }
 370             break;
 371         case 32:
 372             av_assert0(s->bgr32);
 373             avctx->pix_fmt = AV_PIX_FMT_RGB32;
 374             s->alpha = 1;
 375             break;
 376         default:
 377             return AVERROR_INVALIDDATA;
 378         }
 379         av_pix_fmt_get_chroma_sub_sample(avctx->pix_fmt,
 380                                          &s->chroma_h_shift,
 381                                          &s->chroma_v_shift);
 382     } else {
 383         switch ( (s->chroma<<10) | (s->yuv<<9) | (s->alpha<<8) | ((s->bps-1)<<4) | s->chroma_h_shift | (s->chroma_v_shift<<2)) {
 384         case 0x070:
 385             avctx->pix_fmt = AV_PIX_FMT_GRAY8;
 386             break;
 387         case 0x0F0:
 388             avctx->pix_fmt = AV_PIX_FMT_GRAY16;
 389             break;
 390         case 0x170:
 391             avctx->pix_fmt = AV_PIX_FMT_GRAY8A;
 392             break;
 393         case 0x470:
 394             avctx->pix_fmt = AV_PIX_FMT_GBRP;
 395             break;
 396         case 0x480:
 397             avctx->pix_fmt = AV_PIX_FMT_GBRP9;
 398             break;
 399         case 0x490:
 400             avctx->pix_fmt = AV_PIX_FMT_GBRP10;
 401             break;
 402         case 0x4B0:
 403             avctx->pix_fmt = AV_PIX_FMT_GBRP12;
 404             break;
 405         case 0x4D0:
 406             avctx->pix_fmt = AV_PIX_FMT_GBRP14;
 407             break;
 408         case 0x4F0:
 409             avctx->pix_fmt = AV_PIX_FMT_GBRP16;
 410             break;
 411         case 0x570:
 412             avctx->pix_fmt = AV_PIX_FMT_GBRAP;
 413             break;
 414         case 0x670:
 415             avctx->pix_fmt = AV_PIX_FMT_YUV444P;
 416             break;
 417         case 0x680:
 418             avctx->pix_fmt = AV_PIX_FMT_YUV444P9;
 419             break;
 420         case 0x690:
 421             avctx->pix_fmt = AV_PIX_FMT_YUV444P10;
 422             break;
 423         case 0x6B0:
 424             avctx->pix_fmt = AV_PIX_FMT_YUV444P12;
 425             break;
 426         case 0x6D0:
 427             avctx->pix_fmt = AV_PIX_FMT_YUV444P14;
 428             break;
 429         case 0x6F0:
 430             avctx->pix_fmt = AV_PIX_FMT_YUV444P16;
 431             break;
 432         case 0x671:
 433             avctx->pix_fmt = AV_PIX_FMT_YUV422P;
 434             break;
 435         case 0x681:
 436             avctx->pix_fmt = AV_PIX_FMT_YUV422P9;
 437             break;
 438         case 0x691:
 439             avctx->pix_fmt = AV_PIX_FMT_YUV422P10;
 440             break;
 441         case 0x6B1:
 442             avctx->pix_fmt = AV_PIX_FMT_YUV422P12;
 443             break;
 444         case 0x6D1:
 445             avctx->pix_fmt = AV_PIX_FMT_YUV422P14;
 446             break;
 447         case 0x6F1:
 448             avctx->pix_fmt = AV_PIX_FMT_YUV422P16;
 449             break;
 450         case 0x672:
 451             avctx->pix_fmt = AV_PIX_FMT_YUV411P;
 452             break;
 453         case 0x674:
 454             avctx->pix_fmt = AV_PIX_FMT_YUV440P;
 455             break;
 456         case 0x675:
 457             avctx->pix_fmt = AV_PIX_FMT_YUV420P;
 458             break;
 459         case 0x685:
 460             avctx->pix_fmt = AV_PIX_FMT_YUV420P9;
 461             break;
 462         case 0x695:
 463             avctx->pix_fmt = AV_PIX_FMT_YUV420P10;
 464             break;
 465         case 0x6B5:
 466             avctx->pix_fmt = AV_PIX_FMT_YUV420P12;
 467             break;
 468         case 0x6D5:
 469             avctx->pix_fmt = AV_PIX_FMT_YUV420P14;
 470             break;
 471         case 0x6F5:
 472             avctx->pix_fmt = AV_PIX_FMT_YUV420P16;
 473             break;
 474         case 0x67A:
 475             avctx->pix_fmt = AV_PIX_FMT_YUV410P;
 476             break;
 477         case 0x770:
 478             avctx->pix_fmt = AV_PIX_FMT_YUVA444P;
 479             break;
 480         case 0x780:
 481             avctx->pix_fmt = AV_PIX_FMT_YUVA444P9;
 482             break;
 483         case 0x790:
 484             avctx->pix_fmt = AV_PIX_FMT_YUVA444P10;
 485             break;
 486         case 0x7F0:
 487             avctx->pix_fmt = AV_PIX_FMT_YUVA444P16;
 488             break;
 489         case 0x771:
 490             avctx->pix_fmt = AV_PIX_FMT_YUVA422P;
 491             break;
 492         case 0x781:
 493             avctx->pix_fmt = AV_PIX_FMT_YUVA422P9;
 494             break;
 495         case 0x791:
 496             avctx->pix_fmt = AV_PIX_FMT_YUVA422P10;
 497             break;
 498         case 0x7F1:
 499             avctx->pix_fmt = AV_PIX_FMT_YUVA422P16;
 500             break;
 501         case 0x775:
 502             avctx->pix_fmt = AV_PIX_FMT_YUVA420P;
 503             break;
 504         case 0x785:
 505             avctx->pix_fmt = AV_PIX_FMT_YUVA420P9;
 506             break;
 507         case 0x795:
 508             avctx->pix_fmt = AV_PIX_FMT_YUVA420P10;
 509             break;
 510         case 0x7F5:
 511             avctx->pix_fmt = AV_PIX_FMT_YUVA420P16;
 512             break;
 513         default:
 514             return AVERROR_INVALIDDATA;
 515         }
 516     }
 517
 518     ff_huffyuv_common_init(avctx);
 519
 520     if ((avctx->pix_fmt == AV_PIX_FMT_YUV422P || avctx->pix_fmt == AV_PIX_FMT_YUV420P) && avctx->width & 1) {
 521         av_log(avctx, AV_LOG_ERROR, "width must be even for this colorspace\n");
 522         return AVERROR_INVALIDDATA;
 523     }
 524     if (s->predictor == MEDIAN && avctx->pix_fmt == AV_PIX_FMT_YUV422P && avctx->width%4) {
 525         av_log(avctx, AV_LOG_ERROR, "width must be a multiple of 4 this colorspace and predictor\n");
 526         return AVERROR_INVALIDDATA;
 527     }
 528     if (ff_huffyuv_alloc_temp(s)) {
 529         ff_huffyuv_common_end(s);
 530         return AVERROR(ENOMEM);
 531     }
 532
 533     return 0;
 534 }
 535
 536 static av_cold int decode_init_thread_copy(AVCodecContext *avctx)
 537 {
 538     HYuvContext *s = avctx->priv_data;
 539     int i;
 540
 541     if (ff_huffyuv_alloc_temp(s)) {
 542         ff_huffyuv_common_end(s);
 543         return AVERROR(ENOMEM);
 544     }
 545
 546     for (i = 0; i < 8; i++)
 547         s->vlc[i].table = NULL;
 548
 549     if (s->version >= 2) {
 550         if (read_huffman_tables(s, ((uint8_t*)avctx->extradata) + 4,
 551                                 avctx->extradata_size) < 0)
 552             return AVERROR_INVALIDDATA;
 553     } else {
 554         if (read_old_huffman_tables(s) < 0)
 555             return AVERROR_INVALIDDATA;
 556     }
 557
 558     return 0;
 559 }
 560
 561 /** Subset of GET_VLC for use in hand-roller VLC code */
 562 #define VLC_INTERN(dst, table, gb, name, bits, max_depth)   \
 563     code = table[index][0];                                 \
 564     n    = table[index][1];                                 \
 565     if (max_depth > 1 && n < 0) {                           \
 566         LAST_SKIP_BITS(name, gb, bits);                     \
 567         UPDATE_CACHE(name, gb);                             \
 568                                                             \
 569         nb_bits = -n;                                       \
 570         index   = SHOW_UBITS(name, gb, nb_bits) + code;     \
 571         code    = table[index][0];                          \
 572         n       = table[index][1];                          \
 573         if (max_depth > 2 && n < 0) {                       \
 574             LAST_SKIP_BITS(name, gb, nb_bits);              \
 575             UPDATE_CACHE(name, gb);                         \
 576                                                             \
 577             nb_bits = -n;                                   \
 578             index   = SHOW_UBITS(name, gb, nb_bits) + code; \
 579             code    = table[index][0];                      \
 580             n       = table[index][1];                      \
 581         }                                                   \
 582     }                                                       \
 583     dst = code;                                             \
 584     LAST_SKIP_BITS(name, gb, n)
 585
 586
 587 #define GET_VLC_DUAL(dst0, dst1, name, gb, dtable, table1, table2,  \
 588                      bits, max_depth, OP)                           \
 589     do {                                                            \
 590         unsigned int index = SHOW_UBITS(name, gb, bits);            \
 591         int          code, n = dtable[index][1];                    \
 592                                                                     \
 593         if (n<=0) {                                                 \
 594             int nb_bits;                                            \
 595             VLC_INTERN(dst0, table1, gb, name, bits, max_depth);    \
 596                                                                     \
 597             UPDATE_CACHE(re, gb);                                   \
 598             index = SHOW_UBITS(name, gb, bits);                     \
 599             VLC_INTERN(dst1, table2, gb, name, bits, max_depth);    \
 600         } else {                                                    \
 601             code = dtable[index][0];                                \
 602             OP(dst0, dst1, code);                                   \
 603             LAST_SKIP_BITS(name, gb, n);                            \
 604         }                                                           \
 605     } while (0)
 606
 607 #define OP8bits(dst0, dst1, code) dst0 = code>>8; dst1 = code
 608
 609 #define READ_2PIX(dst0, dst1, plane1)\
 610     UPDATE_CACHE(re, &s->gb); \
 611     GET_VLC_DUAL(dst0, dst1, re, &s->gb, s->vlc[4+plane1].table, \
 612                  s->vlc[0].table, s->vlc[plane1].table, VLC_BITS, 3, OP8bits)
 613
 614 static void decode_422_bitstream(HYuvContext *s, int count)
 615 {
 616     int i;
 617     OPEN_READER(re, &s->gb);
 618     count /= 2;
 619
 620     if (count >= (get_bits_left(&s->gb)) / (32 * 4)) {
 621         for (i = 0; i < count && get_bits_left(&s->gb) > 0; i++) {
 622             READ_2PIX(s->temp[0][2 * i    ], s->temp[1][i], 1);
 623             READ_2PIX(s->temp[0][2 * i + 1], s->temp[2][i], 2);
 624         }
 625         for (; i < count; i++)
 626             s->temp[0][2 * i    ] = s->temp[1][i] =
 627             s->temp[0][2 * i + 1] = s->temp[2][i] = 128;
 628     } else {
 629         for (i = 0; i < count; i++) {
 630             READ_2PIX(s->temp[0][2 * i    ], s->temp[1][i], 1);
 631             READ_2PIX(s->temp[0][2 * i + 1], s->temp[2][i], 2);
 632         }
 633     }
 634     CLOSE_READER(re, &s->gb);
 635 }
 636
 637 #define READ_2PIX_PLANE(dst0, dst1, plane, OP) \
 638     UPDATE_CACHE(re, &s->gb); \
 639     GET_VLC_DUAL(dst0, dst1, re, &s->gb, s->vlc[4+plane].table, \
 640                  s->vlc[plane].table, s->vlc[plane].table, VLC_BITS, 3, OP)
 641
 642 #define OP14bits(dst0, dst1, code) dst0 = code>>8; dst1 = sign_extend(code, 8)
 643
 644 /* TODO instead of restarting the read when the code isn't in the first level
 645  * of the joint table, jump into the 2nd level of the individual table. */
 646 #define READ_2PIX_PLANE16(dst0, dst1, plane){\
 647     dst0 = get_vlc2(&s->gb, s->vlc[plane].table, VLC_BITS, 3)<<2;\
 648     dst0 += get_bits(&s->gb, 2);\
 649     dst1 = get_vlc2(&s->gb, s->vlc[plane].table, VLC_BITS, 3)<<2;\
 650     dst1 += get_bits(&s->gb, 2);\
 651 }
 652 static void decode_plane_bitstream(HYuvContext *s, int count, int plane)
 653 {
 654     int i;
 655
 656     count/=2;
 657
 658     if (s->bps <= 8) {
 659         OPEN_READER(re, &s->gb);
 660         if (count >= (get_bits_left(&s->gb)) / (32 * 2)) {
 661             for (i = 0; i < count && get_bits_left(&s->gb) > 0; i++) {
 662                 READ_2PIX_PLANE(s->temp[0][2 * i], s->temp[0][2 * i + 1], plane, OP8bits);
 663             }
 664         } else {
 665             for(i=0; i<count; i++){
 666                 READ_2PIX_PLANE(s->temp[0][2 * i], s->temp[0][2 * i + 1], plane, OP8bits);
 667             }
 668         }
 669         CLOSE_READER(re, &s->gb);
 670     } else if (s->bps <= 14) {
 671         OPEN_READER(re, &s->gb);
 672         if (count >= (get_bits_left(&s->gb)) / (32 * 2)) {
 673             for (i = 0; i < count && get_bits_left(&s->gb) > 0; i++) {
 674                 READ_2PIX_PLANE(s->temp16[0][2 * i], s->temp16[0][2 * i + 1], plane, OP14bits);
 675             }
 676         } else {
 677             for(i=0; i<count; i++){
 678                 READ_2PIX_PLANE(s->temp16[0][2 * i], s->temp16[0][2 * i + 1], plane, OP14bits);
 679             }
 680         }
 681         CLOSE_READER(re, &s->gb);
 682     } else {
 683         if (count >= (get_bits_left(&s->gb)) / (32 * 2)) {
 684             for (i = 0; i < count && get_bits_left(&s->gb) > 0; i++) {
 685                 READ_2PIX_PLANE16(s->temp16[0][2 * i], s->temp16[0][2 * i + 1], plane);
 686             }
 687         } else {
 688             for(i=0; i<count; i++){
 689                 READ_2PIX_PLANE16(s->temp16[0][2 * i], s->temp16[0][2 * i + 1], plane);
 690             }
 691         }
 692     }
 693 }
 694
 695 static void decode_gray_bitstream(HYuvContext *s, int count)
 696 {
 697     int i;
 698     OPEN_READER(re, &s->gb);
 699     count/=2;
 700
 701     if (count >= (get_bits_left(&s->gb)) / (32 * 2)) {
 702         for (i = 0; i < count && get_bits_left(&s->gb) > 0; i++) {
 703             READ_2PIX(s->temp[0][2 * i], s->temp[0][2 * i + 1], 0);
 704         }
 705     } else {
 706         for(i=0; i<count; i++){
 707             READ_2PIX(s->temp[0][2 * i], s->temp[0][2 * i + 1], 0);
 708         }
 709     }
 710     CLOSE_READER(re, &s->gb);
 711 }
 712
 713 static av_always_inline void decode_bgr_1(HYuvContext *s, int count,
 714                                           int decorrelate, int alpha)
 715 {
 716     int i;
 717     OPEN_READER(re, &s->gb);
 718
 719     for (i = 0; i < count; i++) {
 720         unsigned int index;
 721         int code, n;
 722
 723         UPDATE_CACHE(re, &s->gb);
 724         index = SHOW_UBITS(re, &s->gb, VLC_BITS);
 725         n     = s->vlc[4].table[index][1];
 726
 727         if (n>0) {
 728             code  = s->vlc[4].table[index][0];
 729             *(uint32_t*)&s->temp[0][4 * i] = s->pix_bgr_map[code];
 730             LAST_SKIP_BITS(re, &s->gb, n);
 731         } else {
 732             int nb_bits;
 733             if(decorrelate) {
 734                 VLC_INTERN(s->temp[0][4 * i + G], s->vlc[1].table,
 735                            &s->gb, re, VLC_BITS, 3);
 736
 737                 UPDATE_CACHE(re, &s->gb);
 738                 index = SHOW_UBITS(re, &s->gb, VLC_BITS);
 739                 VLC_INTERN(code, s->vlc[0].table, &s->gb, re, VLC_BITS, 3);
 740                 s->temp[0][4 * i + B] = code + s->temp[0][4 * i + G];
 741
 742                 UPDATE_CACHE(re, &s->gb);
 743                 index = SHOW_UBITS(re, &s->gb, VLC_BITS);
 744                 VLC_INTERN(code, s->vlc[2].table, &s->gb, re, VLC_BITS, 3);
 745                 s->temp[0][4 * i + R] = code + s->temp[0][4 * i + G];
 746             } else {
 747                 VLC_INTERN(s->temp[0][4 * i + B], s->vlc[0].table,
 748                            &s->gb, re, VLC_BITS, 3);
 749
 750                 UPDATE_CACHE(re, &s->gb);
 751                 index = SHOW_UBITS(re, &s->gb, VLC_BITS);
 752                 VLC_INTERN(s->temp[0][4 * i + G], s->vlc[1].table,
 753                            &s->gb, re, VLC_BITS, 3);
 754
 755                 UPDATE_CACHE(re, &s->gb);
 756                 index = SHOW_UBITS(re, &s->gb, VLC_BITS);
 757                 VLC_INTERN(s->temp[0][4 * i + R], s->vlc[2].table,
 758                            &s->gb, re, VLC_BITS, 3);
 759             }
 760             if (alpha) {
 761                 UPDATE_CACHE(re, &s->gb);
 762                 index = SHOW_UBITS(re, &s->gb, VLC_BITS);
 763                 VLC_INTERN(s->temp[0][4 * i + A], s->vlc[2].table,
 764                            &s->gb, re, VLC_BITS, 3);
 765             }
 766         }
 767     }
 768     CLOSE_READER(re, &s->gb);
 769 }
 770
 771 static void decode_bgr_bitstream(HYuvContext *s, int count)
 772 {
 773     if (s->decorrelate) {
 774         if (s->bitstream_bpp==24)
 775             decode_bgr_1(s, count, 1, 0);
 776         else
 777             decode_bgr_1(s, count, 1, 1);
 778     } else {
 779         if (s->bitstream_bpp==24)
 780             decode_bgr_1(s, count, 0, 0);
 781         else
 782             decode_bgr_1(s, count, 0, 1);
 783     }
 784 }
 785
 786 static void draw_slice(HYuvContext *s, AVFrame *frame, int y)
 787 {
 788     int h, cy, i;
 789     int offset[AV_NUM_DATA_POINTERS];
 790
 791     if (s->avctx->draw_horiz_band==NULL)
 792         return;
 793
 794     h = y - s->last_slice_end;
 795     y -= h;
 796
 797     if (s->bitstream_bpp == 12) {
 798         cy = y>>1;
 799     } else {
 800         cy = y;
 801     }
 802
 803     offset[0] = frame->linesize[0] * y;
 804     offset[1] = frame->linesize[1] * cy;
 805     offset[2] = frame->linesize[2] * cy;
 806     for (i = 3; i < AV_NUM_DATA_POINTERS; i++)
 807         offset[i] = 0;
 808     emms_c();
 809
 810     s->avctx->draw_horiz_band(s->avctx, frame, offset, y, 3, h);
 811
 812     s->last_slice_end = y + h;
 813 }
 814
 815 static int left_prediction(HYuvContext *s, uint8_t *dst, const uint8_t *src, int w, int acc)
 816 {
 817     if (s->bps <= 8) {
 818         return s->hdsp.add_hfyu_left_pred(dst, src, w, acc);
 819     } else {
 820         return s->llviddsp.add_hfyu_left_pred_int16((      uint16_t *)dst, (const uint16_t *)src, s->n-1, w, acc);
 821     }
 822 }
 823
 824 static void add_bytes(HYuvContext *s, uint8_t *dst, uint8_t *src, int w)
 825 {
 826     if (s->bps <= 8) {
 827         s->hdsp.add_bytes(dst, src, w);
 828     } else {
 829         s->llviddsp.add_int16((uint16_t*)dst, (const uint16_t*)src, s->n - 1, w);
 830     }
 831 }
 832
 833 static void add_median_prediction(HYuvContext *s, uint8_t *dst, const uint8_t *src, const uint8_t *diff, int w, int *left, int *left_top)
 834 {
 835     if (s->bps <= 8) {
 836         s->hdsp.add_hfyu_median_pred(dst, src, diff, w, left, left_top);
 837     } else {
 838         s->llviddsp.add_hfyu_median_pred_int16((uint16_t *)dst, (const uint16_t *)src, (const uint16_t *)diff, s->n-1, w, left, left_top);
 839     }
 840 }
 841 static int decode_frame(AVCodecContext *avctx, void *data, int *got_frame,
 842                         AVPacket *avpkt)
 843 {
 844     const uint8_t *buf = avpkt->data;
 845     int buf_size = avpkt->size;
 846     HYuvContext *s = avctx->priv_data;
 847     const int width = s->width;
 848     const int width2 = s->width>>1;
 849     const int height = s->height;
 850     int fake_ystride, fake_ustride, fake_vstride;
 851     ThreadFrame frame = { .f = data };
 852     AVFrame * const p = data;
 853     int table_size = 0, ret;
 854
 855     av_fast_padded_malloc(&s->bitstream_buffer,
 856                    &s->bitstream_buffer_size,
 857                    buf_size);
 858     if (!s->bitstream_buffer)
 859         return AVERROR(ENOMEM);
 860
 861     s->dsp.bswap_buf((uint32_t*)s->bitstream_buffer,
 862                      (const uint32_t*)buf, buf_size / 4);
 863
 864     if ((ret = ff_thread_get_buffer(avctx, &frame, 0)) < 0)
 865         return ret;
 866
 867     if (s->context) {
 868         table_size = read_huffman_tables(s, s->bitstream_buffer, buf_size);
 869         if (table_size < 0)
 870             return AVERROR_INVALIDDATA;
 871     }
 872
 873     if ((unsigned)(buf_size-table_size) >= INT_MAX / 8)
 874         return AVERROR_INVALIDDATA;
 875
 876     init_get_bits(&s->gb, s->bitstream_buffer+table_size,
 877                   (buf_size-table_size) * 8);
 878
 879     fake_ystride = s->interlaced ? p->linesize[0] * 2  : p->linesize[0];
 880     fake_ustride = s->interlaced ? p->linesize[1] * 2  : p->linesize[1];
 881     fake_vstride = s->interlaced ? p->linesize[2] * 2  : p->linesize[2];
 882
 883     s->last_slice_end = 0;
 884
 885     if (s->version > 2) {
 886         int plane;
 887         for(plane = 0; plane < 1 + 2*s->chroma + s->alpha; plane++) {
 888             int left, lefttop, y;
 889             int w = width;
 890             int h = height;
 891             int fake_stride = fake_ystride;
 892
 893             if (s->chroma && (plane == 1 || plane == 2)) {
 894                 w >>= s->chroma_h_shift;
 895                 h >>= s->chroma_v_shift;
 896                 fake_stride = plane == 1 ? fake_ustride : fake_vstride;
 897             }
 898
 899             switch (s->predictor) {
 900             case LEFT:
 901             case PLANE:
 902                 decode_plane_bitstream(s, w, plane);
 903                 left = left_prediction(s, p->data[plane], s->temp[0], w, 0);
 904
 905                 for (y = 1; y < h; y++) {
 906                     uint8_t *dst = p->data[plane] + p->linesize[plane]*y;
 907
 908                     decode_plane_bitstream(s, w, plane);
 909                     left = left_prediction(s, dst, s->temp[0], w, left);
 910                     if (s->predictor == PLANE) {
 911                         if (y > s->interlaced) {
 912                             add_bytes(s, dst, dst - fake_stride, w);
 913                         }
 914                     }
 915                 }
 916
 917                 break;
 918             case MEDIAN:
 919                 decode_plane_bitstream(s, w, plane);
 920                 left= left_prediction(s, p->data[plane], s->temp[0], w, 0);
 921
 922                 y = 1;
 923
 924                 /* second line is left predicted for interlaced case */
 925                 if (s->interlaced) {
 926                     decode_plane_bitstream(s, w, plane);
 927                     left = left_prediction(s, p->data[plane] + p->linesize[plane], s->temp[0], w, left);
 928                     y++;
 929                 }
 930
 931                 lefttop = p->data[plane][0];
 932                 decode_plane_bitstream(s, w, plane);
 933                 add_median_prediction(s, p->data[plane] + fake_stride, p->data[plane], s->temp[0], w, &left, &lefttop);
 934                 y++;
 935
 936                 for (; y<h; y++) {
 937                     uint8_t *dst;
 938
 939                     decode_plane_bitstream(s, w, plane);
 940
 941                     dst = p->data[plane] + p->linesize[plane] * y;
 942
 943                     add_median_prediction(s, dst, dst - fake_stride, s->temp[0], w, &left, &lefttop);
 944                 }
 945
 946                 break;
 947             }
 948         }
 949         draw_slice(s, p, height);
 950     } else if (s->bitstream_bpp < 24) {
 951         int y, cy;
 952         int lefty, leftu, leftv;
 953         int lefttopy, lefttopu, lefttopv;
 954
 955         if (s->yuy2) {
 956             p->data[0][3] = get_bits(&s->gb, 8);
 957             p->data[0][2] = get_bits(&s->gb, 8);
 958             p->data[0][1] = get_bits(&s->gb, 8);
 959             p->data[0][0] = get_bits(&s->gb, 8);
 960
 961             av_log(avctx, AV_LOG_ERROR,
 962                    "YUY2 output is not implemented yet\n");
 963             return AVERROR_PATCHWELCOME;
 964         } else {
 965
 966             leftv = p->data[2][0] = get_bits(&s->gb, 8);
 967             lefty = p->data[0][1] = get_bits(&s->gb, 8);
 968             leftu = p->data[1][0] = get_bits(&s->gb, 8);
 969                     p->data[0][0] = get_bits(&s->gb, 8);
 970
 971             switch (s->predictor) {
 972             case LEFT:
 973             case PLANE:
 974                 decode_422_bitstream(s, width-2);
 975                 lefty = s->hdsp.add_hfyu_left_pred(p->data[0] + 2, s->temp[0], width - 2, lefty);
 976                 if (!(s->flags&CODEC_FLAG_GRAY)) {
 977                     leftu = s->hdsp.add_hfyu_left_pred(p->data[1] + 1, s->temp[1], width2 - 1, leftu);
 978                     leftv = s->hdsp.add_hfyu_left_pred(p->data[2] + 1, s->temp[2], width2 - 1, leftv);
 979                 }
 980
 981                 for (cy = y = 1; y < s->height; y++, cy++) {
 982                     uint8_t *ydst, *udst, *vdst;
 983
 984                     if (s->bitstream_bpp == 12) {
 985                         decode_gray_bitstream(s, width);
 986
 987                         ydst = p->data[0] + p->linesize[0] * y;
 988
 989                         lefty = s->hdsp.add_hfyu_left_pred(ydst, s->temp[0], width, lefty);
 990                         if (s->predictor == PLANE) {
 991                             if (y > s->interlaced)
 992                                 s->hdsp.add_bytes(ydst, ydst - fake_ystride, width);
 993                         }
 994                         y++;
 995                         if (y >= s->height) break;
 996                     }
 997
 998                     draw_slice(s, p, y);
 999
1000                     ydst = p->data[0] + p->linesize[0]*y;
1001                     udst = p->data[1] + p->linesize[1]*cy;
1002                     vdst = p->data[2] + p->linesize[2]*cy;
1003
1004                     decode_422_bitstream(s, width);
1005                     lefty = s->hdsp.add_hfyu_left_pred(ydst, s->temp[0], width, lefty);
1006                     if (!(s->flags & CODEC_FLAG_GRAY)) {
1007                         leftu = s->hdsp.add_hfyu_left_pred(udst, s->temp[1], width2, leftu);
1008                         leftv = s->hdsp.add_hfyu_left_pred(vdst, s->temp[2], width2, leftv);
1009                     }
1010                     if (s->predictor == PLANE) {
1011                         if (cy > s->interlaced) {
1012                             s->hdsp.add_bytes(ydst, ydst - fake_ystride, width);
1013                             if (!(s->flags & CODEC_FLAG_GRAY)) {
1014                                 s->hdsp.add_bytes(udst, udst - fake_ustride, width2);
1015                                 s->hdsp.add_bytes(vdst, vdst - fake_vstride, width2);
1016                             }
1017                         }
1018                     }
1019                 }
1020                 draw_slice(s, p, height);
1021
1022                 break;
1023             case MEDIAN:
1024                 /* first line except first 2 pixels is left predicted */
1025                 decode_422_bitstream(s, width - 2);
1026                 lefty = s->hdsp.add_hfyu_left_pred(p->data[0] + 2, s->temp[0], width - 2, lefty);
1027                 if (!(s->flags & CODEC_FLAG_GRAY)) {
1028                     leftu = s->hdsp.add_hfyu_left_pred(p->data[1] + 1, s->temp[1], width2 - 1, leftu);
1029                     leftv = s->hdsp.add_hfyu_left_pred(p->data[2] + 1, s->temp[2], width2 - 1, leftv);
1030                 }
1031
1032                 cy = y = 1;
1033
1034                 /* second line is left predicted for interlaced case */
1035                 if (s->interlaced) {
1036                     decode_422_bitstream(s, width);
1037                     lefty = s->hdsp.add_hfyu_left_pred(p->data[0] + p->linesize[0], s->temp[0], width, lefty);
1038                     if (!(s->flags & CODEC_FLAG_GRAY)) {
1039                         leftu = s->hdsp.add_hfyu_left_pred(p->data[1] + p->linesize[2], s->temp[1], width2, leftu);
1040                         leftv = s->hdsp.add_hfyu_left_pred(p->data[2] + p->linesize[1], s->temp[2], width2, leftv);
1041                     }
1042                     y++; cy++;
1043                 }
1044
1045                 /* next 4 pixels are left predicted too */
1046                 decode_422_bitstream(s, 4);
1047                 lefty = s->hdsp.add_hfyu_left_pred(p->data[0] + fake_ystride, s->temp[0], 4, lefty);
1048                 if (!(s->flags&CODEC_FLAG_GRAY)) {
1049                     leftu = s->hdsp.add_hfyu_left_pred(p->data[1] + fake_ustride, s->temp[1], 2, leftu);
1050                     leftv = s->hdsp.add_hfyu_left_pred(p->data[2] + fake_vstride, s->temp[2], 2, leftv);
1051                 }
1052
1053                 /* next line except the first 4 pixels is median predicted */
1054                 lefttopy = p->data[0][3];
1055                 decode_422_bitstream(s, width - 4);
1056                 s->hdsp.add_hfyu_median_pred(p->data[0] + fake_ystride + 4, p->data[0] + 4, s->temp[0], width - 4, &lefty, &lefttopy);
1057                 if (!(s->flags&CODEC_FLAG_GRAY)) {
1058                     lefttopu = p->data[1][1];
1059                     lefttopv = p->data[2][1];
1060                     s->hdsp.add_hfyu_median_pred(p->data[1] + fake_ustride + 2, p->data[1] + 2, s->temp[1], width2 - 2, &leftu, &lefttopu);
1061                     s->hdsp.add_hfyu_median_pred(p->data[2] + fake_vstride + 2, p->data[2] + 2, s->temp[2], width2 - 2, &leftv, &lefttopv);
1062                 }
1063                 y++; cy++;
1064
1065                 for (; y<height; y++, cy++) {
1066                     uint8_t *ydst, *udst, *vdst;
1067
1068                     if (s->bitstream_bpp == 12) {
1069                         while (2 * cy > y) {
1070                             decode_gray_bitstream(s, width);
1071                             ydst = p->data[0] + p->linesize[0] * y;
1072                             s->hdsp.add_hfyu_median_pred(ydst, ydst - fake_ystride, s->temp[0], width, &lefty, &lefttopy);
1073                             y++;
1074                         }
1075                         if (y >= height) break;
1076                     }
1077                     draw_slice(s, p, y);
1078
1079                     decode_422_bitstream(s, width);
1080
1081                     ydst = p->data[0] + p->linesize[0] * y;
1082                     udst = p->data[1] + p->linesize[1] * cy;
1083                     vdst = p->data[2] + p->linesize[2] * cy;
1084
1085                     s->hdsp.add_hfyu_median_pred(ydst, ydst - fake_ystride, s->temp[0], width, &lefty, &lefttopy);
1086                     if (!(s->flags & CODEC_FLAG_GRAY)) {
1087                         s->hdsp.add_hfyu_median_pred(udst, udst - fake_ustride, s->temp[1], width2, &leftu, &lefttopu);
1088                         s->hdsp.add_hfyu_median_pred(vdst, vdst - fake_vstride, s->temp[2], width2, &leftv, &lefttopv);
1089                     }
1090                 }
1091
1092                 draw_slice(s, p, height);
1093                 break;
1094             }
1095         }
1096     } else {
1097         int y;
1098         uint8_t left[4];
1099         const int last_line = (height - 1) * p->linesize[0];
1100
1101         if (s->bitstream_bpp == 32) {
1102             left[A] = p->data[0][last_line+A] = get_bits(&s->gb, 8);
1103             left[R] = p->data[0][last_line+R] = get_bits(&s->gb, 8);
1104             left[G] = p->data[0][last_line+G] = get_bits(&s->gb, 8);
1105             left[B] = p->data[0][last_line+B] = get_bits(&s->gb, 8);
1106         } else {
1107             left[R] = p->data[0][last_line+R] = get_bits(&s->gb, 8);
1108             left[G] = p->data[0][last_line+G] = get_bits(&s->gb, 8);
1109             left[B] = p->data[0][last_line+B] = get_bits(&s->gb, 8);
1110             left[A] = p->data[0][last_line+A] = 255;
1111             skip_bits(&s->gb, 8);
1112         }
1113
1114         if (s->bgr32) {
1115             switch (s->predictor) {
1116             case LEFT:
1117             case PLANE:
1118                 decode_bgr_bitstream(s, width - 1);
1119                 s->hdsp.add_hfyu_left_pred_bgr32(p->data[0] + last_line + 4, s->temp[0], width - 1, left);
1120
1121                 for (y = s->height - 2; y >= 0; y--) { //Yes it is stored upside down.
1122                     decode_bgr_bitstream(s, width);
1123
1124                     s->hdsp.add_hfyu_left_pred_bgr32(p->data[0] + p->linesize[0] * y, s->temp[0], width, left);
1125                     if (s->predictor == PLANE) {
1126                         if (s->bitstream_bpp != 32) left[A] = 0;
1127                         if ((y & s->interlaced) == 0 &&
1128                             y < s->height - 1 - s->interlaced) {
1129                             s->hdsp.add_bytes(p->data[0] + p->linesize[0] * y,
1130                                               p->data[0] + p->linesize[0] * y +
1131                                               fake_ystride, fake_ystride);
1132                         }
1133                     }
1134                 }
1135                 // just 1 large slice as this is not possible in reverse order
1136                 draw_slice(s, p, height);
1137                 break;
1138             default:
1139                 av_log(avctx, AV_LOG_ERROR,
1140                        "prediction type not supported!\n");
1141             }
1142         }else{
1143             av_log(avctx, AV_LOG_ERROR,
1144                    "BGR24 output is not implemented yet\n");
1145             return AVERROR_PATCHWELCOME;
1146         }
1147     }
1148     emms_c();
1149
1150     *got_frame = 1;
1151
1152     return (get_bits_count(&s->gb) + 31) / 32 * 4 + table_size;
1153 }
1154
1155 static av_cold int decode_end(AVCodecContext *avctx)
1156 {
1157     HYuvContext *s = avctx->priv_data;
1158     int i;
1159
1160     ff_huffyuv_common_end(s);
1161     av_freep(&s->bitstream_buffer);
1162
1163     for (i = 0; i < 8; i++) {
1164         ff_free_vlc(&s->vlc[i]);
1165     }
1166
1167     return 0;
1168 }
1169
1170 AVCodec ff_huffyuv_decoder = {
1171     .name             = "huffyuv",
1172     .long_name        = NULL_IF_CONFIG_SMALL("Huffyuv / HuffYUV"),
1173     .type             = AVMEDIA_TYPE_VIDEO,
1174     .id               = AV_CODEC_ID_HUFFYUV,
1175     .priv_data_size   = sizeof(HYuvContext),
1176     .init             = decode_init,
1177     .close            = decode_end,
1178     .decode           = decode_frame,
1179     .capabilities     = CODEC_CAP_DR1 | CODEC_CAP_DRAW_HORIZ_BAND |
1180                         CODEC_CAP_FRAME_THREADS,
1181     .init_thread_copy = ONLY_IF_THREADS_ENABLED(decode_init_thread_copy),
1182 };
1183
1184 #if CONFIG_FFVHUFF_DECODER
1185 AVCodec ff_ffvhuff_decoder = {
1186     .name             = "ffvhuff",
1187     .long_name        = NULL_IF_CONFIG_SMALL("Huffyuv FFmpeg variant"),
1188     .type             = AVMEDIA_TYPE_VIDEO,
1189     .id               = AV_CODEC_ID_FFVHUFF,
1190     .priv_data_size   = sizeof(HYuvContext),
1191     .init             = decode_init,
1192     .close            = decode_end,
1193     .decode           = decode_frame,
1194     .capabilities     = CODEC_CAP_DR1 | CODEC_CAP_DRAW_HORIZ_BAND |
1195                         CODEC_CAP_FRAME_THREADS,
1196     .init_thread_copy = ONLY_IF_THREADS_ENABLED(decode_init_thread_copy),
1197 };
1198 #endif