]> git.sesse.net Git - ffmpeg/blob - libavcodec/scpr.c
avfilter/vf_convolution: add horizontal/row mode
[ffmpeg] / libavcodec / scpr.c
1 /*
2  * ScreenPressor decoder
3  *
4  * Copyright (c) 2017 Paul B Mahol
5  *
6  * This file is part of FFmpeg.
7  *
8  * FFmpeg is free software; you can redistribute it and/or
9  * modify it under the terms of the GNU Lesser General Public
10  * License as published by the Free Software Foundation; either
11  * version 2.1 of the License, or (at your option) any later version.
12  *
13  * FFmpeg is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16  * Lesser General Public License for more details.
17  *
18  * You should have received a copy of the GNU Lesser General Public
19  * License along with FFmpeg; if not, write to the Free Software
20  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
21  */
22
23 #include <stdio.h>
24 #include <stdlib.h>
25 #include <string.h>
26
27 #include "avcodec.h"
28 #include "bytestream.h"
29 #include "internal.h"
30
31 #define TOP  0x01000000
32 #define BOT    0x010000
33
34 typedef struct RangeCoder {
35     unsigned   code;
36     unsigned   range;
37     unsigned   code1;
38 } RangeCoder;
39
40 typedef struct PixelModel {
41     unsigned    freq[256];
42     unsigned    lookup[16];
43     unsigned    total_freq;
44 } PixelModel;
45
46 typedef struct SCPRContext {
47     AVFrame        *last_frame;
48     AVFrame        *current_frame;
49     GetByteContext  gb;
50     RangeCoder      rc;
51     PixelModel      pixel_model[3][4096];
52     unsigned        op_model[6][7];
53     unsigned        run_model[6][257];
54     unsigned        range_model[257];
55     unsigned        count_model[257];
56     unsigned        fill_model[6];
57     unsigned        sxy_model[4][17];
58     unsigned        mv_model[2][513];
59     unsigned        nbx, nby;
60     unsigned        nbcount;
61     unsigned       *blocks;
62     unsigned        cbits;
63     int             cxshift;
64
65     int           (*get_freq)(RangeCoder *rc, unsigned total_freq, unsigned *freq);
66     int           (*decode)(GetByteContext *gb, RangeCoder *rc, unsigned cumFreq, unsigned freq, unsigned total_freq);
67 } SCPRContext;
68
69 static void init_rangecoder(RangeCoder *rc, GetByteContext *gb)
70 {
71     rc->code1 = 0;
72     rc->range = 0xFFFFFFFFU;
73     rc->code  = bytestream2_get_be32(gb);
74 }
75
76 static void reinit_tables(SCPRContext *s)
77 {
78     int comp, i, j;
79
80     for (comp = 0; comp < 3; comp++) {
81         for (j = 0; j < 4096; j++) {
82             if (s->pixel_model[comp][j].total_freq != 256) {
83                 for (i = 0; i < 256; i++)
84                     s->pixel_model[comp][j].freq[i] = 1;
85                 for (i = 0; i < 16; i++)
86                     s->pixel_model[comp][j].lookup[i] = 16;
87                 s->pixel_model[comp][j].total_freq = 256;
88             }
89         }
90     }
91
92     for (j = 0; j < 6; j++) {
93         unsigned *p = s->run_model[j];
94         for (i = 0; i < 256; i++)
95             p[i] = 1;
96         p[256] = 256;
97     }
98
99     for (j = 0; j < 6; j++) {
100         unsigned *op = s->op_model[j];
101         for (i = 0; i < 6; i++)
102             op[i] = 1;
103         op[6] = 6;
104     }
105
106     for (i = 0; i < 256; i++) {
107         s->range_model[i] = 1;
108         s->count_model[i] = 1;
109     }
110     s->range_model[256] = 256;
111     s->count_model[256] = 256;
112
113     for (i = 0; i < 5; i++) {
114         s->fill_model[i] = 1;
115     }
116     s->fill_model[5] = 5;
117
118     for (j = 0; j < 4; j++) {
119         for (i = 0; i < 16; i++) {
120             s->sxy_model[j][i] = 1;
121         }
122         s->sxy_model[j][16] = 16;
123     }
124
125     for (i = 0; i < 512; i++) {
126         s->mv_model[0][i] = 1;
127         s->mv_model[1][i] = 1;
128     }
129     s->mv_model[0][512] = 512;
130     s->mv_model[1][512] = 512;
131 }
132
133 static int decode(GetByteContext *gb, RangeCoder *rc, unsigned cumFreq, unsigned freq, unsigned total_freq)
134 {
135     rc->code -= cumFreq * rc->range;
136     rc->range *= freq;
137
138     while (rc->range < TOP && bytestream2_get_bytes_left(gb) > 0) {
139         unsigned byte = bytestream2_get_byte(gb);
140         rc->code = (rc->code << 8) | byte;
141         rc->range <<= 8;
142     }
143
144     return 0;
145 }
146
147 static int get_freq(RangeCoder *rc, unsigned total_freq, unsigned *freq)
148 {
149     if (total_freq == 0)
150         return AVERROR_INVALIDDATA;
151
152     rc->range = rc->range / total_freq;
153
154     if (rc->range == 0)
155         return AVERROR_INVALIDDATA;
156
157     *freq = rc->code / rc->range;
158
159     return 0;
160 }
161
162 static int decode0(GetByteContext *gb, RangeCoder *rc, unsigned cumFreq, unsigned freq, unsigned total_freq)
163 {
164     unsigned t;
165
166     if (total_freq == 0)
167         return AVERROR_INVALIDDATA;
168
169     t = rc->range * (uint64_t)cumFreq / total_freq;
170
171     rc->code1 += t + 1;
172     rc->range = rc->range * (uint64_t)(freq + cumFreq) / total_freq - (t + 1);
173
174     while (rc->range < TOP && bytestream2_get_bytes_left(gb) > 0) {
175         unsigned byte = bytestream2_get_byte(gb);
176         rc->code = (rc->code << 8) | byte;
177         rc->code1 <<= 8;
178         rc->range <<= 8;
179     }
180
181     return 0;
182 }
183
184 static int get_freq0(RangeCoder *rc, unsigned total_freq, unsigned *freq)
185 {
186     if (rc->range == 0)
187         return AVERROR_INVALIDDATA;
188
189     *freq = total_freq * (uint64_t)(rc->code - rc->code1) / rc->range;
190
191     return 0;
192 }
193
194 static int decode_value(SCPRContext *s, unsigned *cnt, unsigned maxc, unsigned step, unsigned *rval)
195 {
196     GetByteContext *gb = &s->gb;
197     RangeCoder *rc = &s->rc;
198     unsigned totfr = cnt[maxc];
199     unsigned value;
200     unsigned c = 0, cumfr = 0, cnt_c = 0;
201     int i, ret;
202
203     if ((ret = s->get_freq(rc, totfr, &value)) < 0)
204         return ret;
205
206     while (c < maxc) {
207         cnt_c = cnt[c];
208         if (value >= cumfr + cnt_c)
209             cumfr += cnt_c;
210         else
211             break;
212         c++;
213     }
214
215     if (c >= maxc)
216         return AVERROR_INVALIDDATA;
217
218     if ((ret = s->decode(gb, rc, cumfr, cnt_c, totfr)) < 0)
219         return ret;
220
221     cnt[c] = cnt_c + step;
222     totfr += step;
223     if (totfr > BOT) {
224         totfr = 0;
225         for (i = 0; i < maxc; i++) {
226             unsigned nc = (cnt[i] >> 1) + 1;
227             cnt[i] = nc;
228             totfr += nc;
229         }
230     }
231
232     cnt[maxc] = totfr;
233     *rval = c;
234
235     return 0;
236 }
237
238 static int decode_unit(SCPRContext *s, PixelModel *pixel, unsigned step, unsigned *rval)
239 {
240     GetByteContext *gb = &s->gb;
241     RangeCoder *rc = &s->rc;
242     unsigned totfr = pixel->total_freq;
243     unsigned value, x = 0, cumfr = 0, cnt_x = 0;
244     int i, j, ret, c, cnt_c;
245
246     if ((ret = s->get_freq(rc, totfr, &value)) < 0)
247         return ret;
248
249     while (x < 16) {
250         cnt_x = pixel->lookup[x];
251         if (value >= cumfr + cnt_x)
252             cumfr += cnt_x;
253         else
254             break;
255         x++;
256     }
257
258     c = x * 16;
259     cnt_c = 0;
260     while (c < 256) {
261         cnt_c = pixel->freq[c];
262         if (value >= cumfr + cnt_c)
263             cumfr += cnt_c;
264         else
265             break;
266         c++;
267     }
268     if (x >= 16 || c >= 256) {
269         return AVERROR_INVALIDDATA;
270     }
271
272     if ((ret = s->decode(gb, rc, cumfr, cnt_c, totfr)) < 0)
273         return ret;
274
275     pixel->freq[c] = cnt_c + step;
276     pixel->lookup[x] = cnt_x + step;
277     totfr += step;
278     if (totfr > BOT) {
279         totfr = 0;
280         for (i = 0; i < 256; i++) {
281             unsigned nc = (pixel->freq[i] >> 1) + 1;
282             pixel->freq[i] = nc;
283             totfr += nc;
284         }
285         for (i = 0; i < 16; i++) {
286             unsigned sum = 0;
287             unsigned i16_17 = i << 4;
288             for (j = 0; j < 16; j++)
289                 sum += pixel->freq[i16_17 + j];
290             pixel->lookup[i] = sum;
291         }
292     }
293     pixel->total_freq = totfr;
294
295     *rval = c & s->cbits;
296
297     return 0;
298 }
299
300 static int decompress_i(AVCodecContext *avctx, uint32_t *dst, int linesize)
301 {
302     SCPRContext *s = avctx->priv_data;
303     GetByteContext *gb = &s->gb;
304     int cx = 0, cx1 = 0, k = 0, clr = 0;
305     int run, r, g, b, off, y = 0, x = 0, z, ret;
306     unsigned backstep = linesize - avctx->width;
307     const int cxshift = s->cxshift;
308     unsigned lx, ly, ptype;
309
310     reinit_tables(s);
311     bytestream2_skip(gb, 2);
312     init_rangecoder(&s->rc, gb);
313
314     while (k < avctx->width + 1) {
315         ret = decode_unit(s, &s->pixel_model[0][cx + cx1], 400, &r);
316         if (ret < 0)
317             return ret;
318
319         cx1 = (cx << 6) & 0xFC0;
320         cx = r >> cxshift;
321         ret = decode_unit(s, &s->pixel_model[1][cx + cx1], 400, &g);
322         if (ret < 0)
323             return ret;
324
325         cx1 = (cx << 6) & 0xFC0;
326         cx = g >> cxshift;
327         ret = decode_unit(s, &s->pixel_model[2][cx + cx1], 400, &b);
328         if (ret < 0)
329             return ret;
330
331         cx1 = (cx << 6) & 0xFC0;
332         cx = b >> cxshift;
333
334         ret = decode_value(s, s->run_model[0], 256, 400, &run);
335         if (ret < 0)
336             return ret;
337
338         clr = (b << 16) + (g << 8) + r;
339         k += run;
340         while (run-- > 0) {
341             if (y >= avctx->height)
342                 return AVERROR_INVALIDDATA;
343
344             dst[y * linesize + x] = clr;
345             lx = x;
346             ly = y;
347             x++;
348             if (x >= avctx->width) {
349                 x = 0;
350                 y++;
351             }
352         }
353     }
354     off = -linesize - 1;
355     ptype = 0;
356
357     while (x < avctx->width && y < avctx->height) {
358         ret = decode_value(s, s->op_model[ptype], 6, 1000, &ptype);
359         if (ret < 0)
360             return ret;
361         if (ptype == 0) {
362             ret = decode_unit(s, &s->pixel_model[0][cx + cx1], 400, &r);
363             if (ret < 0)
364                 return ret;
365
366             cx1 = (cx << 6) & 0xFC0;
367             cx = r >> cxshift;
368             ret = decode_unit(s, &s->pixel_model[1][cx + cx1], 400, &g);
369             if (ret < 0)
370                 return ret;
371
372             cx1 = (cx << 6) & 0xFC0;
373             cx = g >> cxshift;
374             ret = decode_unit(s, &s->pixel_model[2][cx + cx1], 400, &b);
375             if (ret < 0)
376                 return ret;
377
378             clr = (b << 16) + (g << 8) + r;
379         }
380         if (ptype > 5)
381             return AVERROR_INVALIDDATA;
382         ret = decode_value(s, s->run_model[ptype], 256, 400, &run);
383         if (ret < 0)
384             return ret;
385
386         switch (ptype) {
387         case 0:
388             while (run-- > 0) {
389                 if (y >= avctx->height)
390                     return AVERROR_INVALIDDATA;
391
392                 dst[y * linesize + x] = clr;
393                 lx = x;
394                 ly = y;
395                 x++;
396                 if (x >= avctx->width) {
397                     x = 0;
398                     y++;
399                 }
400             }
401             break;
402         case 1:
403             while (run-- > 0) {
404                 if (y >= avctx->height)
405                     return AVERROR_INVALIDDATA;
406
407                 dst[y * linesize + x] = dst[ly * linesize + lx];
408                 lx = x;
409                 ly = y;
410                 x++;
411                 if (x >= avctx->width) {
412                     x = 0;
413                     y++;
414                 }
415             }
416             clr = dst[ly * linesize + lx];
417             break;
418         case 2:
419             while (run-- > 0) {
420                 if (y < 1 || y >= avctx->height)
421                     return AVERROR_INVALIDDATA;
422
423                 clr = dst[y * linesize + x + off + 1];
424                 dst[y * linesize + x] = clr;
425                 lx = x;
426                 ly = y;
427                 x++;
428                 if (x >= avctx->width) {
429                     x = 0;
430                     y++;
431                 }
432             }
433             break;
434         case 4:
435             while (run-- > 0) {
436                 uint8_t *odst = (uint8_t *)dst;
437
438                 if (y < 1 || y >= avctx->height ||
439                     (y == 1 && x == 0))
440                     return AVERROR_INVALIDDATA;
441
442                 if (x == 0) {
443                     z = backstep;
444                 } else {
445                     z = 0;
446                 }
447
448                 r = odst[(ly * linesize + lx) * 4] +
449                     odst[((y * linesize + x) + off) * 4 + 4] -
450                     odst[((y * linesize + x) + off - z) * 4];
451                 g = odst[(ly * linesize + lx) * 4 + 1] +
452                     odst[((y * linesize + x) + off) * 4 + 5] -
453                     odst[((y * linesize + x) + off - z) * 4 + 1];
454                 b = odst[(ly * linesize + lx) * 4 + 2] +
455                     odst[((y * linesize + x) + off) * 4 + 6] -
456                     odst[((y * linesize + x) + off - z) * 4 + 2];
457                 clr = ((b & 0xFF) << 16) + ((g & 0xFF) << 8) + (r & 0xFF);
458                 dst[y * linesize + x] = clr;
459                 lx = x;
460                 ly = y;
461                 x++;
462                 if (x >= avctx->width) {
463                     x = 0;
464                     y++;
465                 }
466             }
467             break;
468         case 5:
469             while (run-- > 0) {
470                 if (y < 1 || y >= avctx->height ||
471                     (y == 1 && x == 0))
472                     return AVERROR_INVALIDDATA;
473
474                 if (x == 0) {
475                     z = backstep;
476                 } else {
477                     z = 0;
478                 }
479
480                 clr = dst[y * linesize + x + off - z];
481                 dst[y * linesize + x] = clr;
482                 lx = x;
483                 ly = y;
484                 x++;
485                 if (x >= avctx->width) {
486                     x = 0;
487                     y++;
488                 }
489             }
490             break;
491         }
492
493         if (avctx->bits_per_coded_sample == 16) {
494             cx1 = (clr & 0x3F00) >> 2;
495             cx = (clr & 0x3FFFFF) >> 16;
496         } else {
497             cx1 = (clr & 0xFC00) >> 4;
498             cx = (clr & 0xFFFFFF) >> 18;
499         }
500     }
501
502     return 0;
503 }
504
505 static int decompress_p(AVCodecContext *avctx,
506                         uint32_t *dst, int linesize,
507                         uint32_t *prev, int plinesize)
508 {
509     SCPRContext *s = avctx->priv_data;
510     GetByteContext *gb = &s->gb;
511     int ret, temp, min, max, x, y, cx = 0, cx1 = 0;
512     int backstep = linesize - avctx->width;
513     const int cxshift = s->cxshift;
514
515     if (bytestream2_get_byte(gb) == 0)
516         return 0;
517     bytestream2_skip(gb, 1);
518     init_rangecoder(&s->rc, gb);
519
520     ret  = decode_value(s, s->range_model, 256, 1, &min);
521     ret |= decode_value(s, s->range_model, 256, 1, &temp);
522     min += temp << 8;
523     ret |= decode_value(s, s->range_model, 256, 1, &max);
524     ret |= decode_value(s, s->range_model, 256, 1, &temp);
525     if (ret < 0)
526         return ret;
527
528     max += temp << 8;
529     memset(s->blocks, 0, sizeof(*s->blocks) * s->nbcount);
530
531     while (min <= max) {
532         int fill, count;
533
534         ret  = decode_value(s, s->fill_model,  5,   10, &fill);
535         ret |= decode_value(s, s->count_model, 256, 20, &count);
536         if (ret < 0)
537             return ret;
538
539         while (min < s->nbcount && count-- > 0) {
540             s->blocks[min++] = fill;
541         }
542     }
543
544     for (y = 0; y < s->nby; y++) {
545         for (x = 0; x < s->nbx; x++) {
546             int sy1 = 0, sy2 = 16, sx1 = 0, sx2 = 16;
547
548             if (s->blocks[y * s->nbx + x] == 0)
549                 continue;
550
551             if (((s->blocks[y * s->nbx + x] - 1) & 1) > 0) {
552                 ret  = decode_value(s, s->sxy_model[0], 16, 100, &sx1);
553                 ret |= decode_value(s, s->sxy_model[1], 16, 100, &sy1);
554                 ret |= decode_value(s, s->sxy_model[2], 16, 100, &sx2);
555                 ret |= decode_value(s, s->sxy_model[3], 16, 100, &sy2);
556                 if (ret < 0)
557                     return ret;
558
559                 sx2++;
560                 sy2++;
561             }
562             if (((s->blocks[y * s->nbx + x] - 1) & 2) > 0) {
563                 int i, j, by = y * 16, bx = x * 16;
564                 int mvx, mvy;
565
566                 ret  = decode_value(s, s->mv_model[0], 512, 100, &mvx);
567                 ret |= decode_value(s, s->mv_model[1], 512, 100, &mvy);
568                 if (ret < 0)
569                     return ret;
570
571                 mvx -= 256;
572                 mvy -= 256;
573
574                 if (by + mvy + sy1 < 0 || bx + mvx + sx1 < 0 ||
575                     by + mvy + sy1 >= avctx->height || bx + mvx + sx1 >= avctx->width)
576                     return AVERROR_INVALIDDATA;
577
578                 for (i = 0; i < sy2 - sy1 && (by + sy1 + i) < avctx->height && (by + mvy + sy1 + i) < avctx->height; i++) {
579                     for (j = 0; j < sx2 - sx1 && (bx + sx1 + j) < avctx->width && (bx + mvx + sx1 + j) < avctx->width; j++) {
580                         dst[(by + i + sy1) * linesize + bx + sx1 + j] = prev[(by + mvy + sy1 + i) * plinesize + bx + sx1 + mvx + j];
581                     }
582                 }
583             } else {
584                 int run, r, g, b, z, bx = x * 16 + sx1, by = y * 16 + sy1;
585                 unsigned clr, ptype = 0;
586
587                 for (; by < y * 16 + sy2 && by < avctx->height;) {
588                     ret = decode_value(s, s->op_model[ptype], 6, 1000, &ptype);
589                     if (ret < 0)
590                         return ret;
591                     if (ptype == 0) {
592                         ret = decode_unit(s, &s->pixel_model[0][cx + cx1], 400, &r);
593                         if (ret < 0)
594                             return ret;
595
596                         cx1 = (cx << 6) & 0xFC0;
597                         cx = r >> cxshift;
598                         ret = decode_unit(s, &s->pixel_model[1][cx + cx1], 400, &g);
599                         if (ret < 0)
600                             return ret;
601
602                         cx1 = (cx << 6) & 0xFC0;
603                         cx = g >> cxshift;
604                         ret = decode_unit(s, &s->pixel_model[2][cx + cx1], 400, &b);
605                         if (ret < 0)
606                             return ret;
607
608                         clr = (b << 16) + (g << 8) + r;
609                     }
610                     if (ptype > 5)
611                         return AVERROR_INVALIDDATA;
612                     ret = decode_value(s, s->run_model[ptype], 256, 400, &run);
613                     if (ret < 0)
614                         return ret;
615
616                     switch (ptype) {
617                     case 0:
618                         while (run-- > 0) {
619                             if (by >= avctx->height)
620                                 return AVERROR_INVALIDDATA;
621
622                             dst[by * linesize + bx] = clr;
623                             bx++;
624                             if (bx >= x * 16 + sx2 || bx >= avctx->width) {
625                                 bx = x * 16 + sx1;
626                                 by++;
627                             }
628                         }
629                         break;
630                     case 1:
631                         while (run-- > 0) {
632                             if (bx == 0) {
633                                 if (by < 1)
634                                     return AVERROR_INVALIDDATA;
635                                 z = backstep;
636                             } else {
637                                 z = 0;
638                             }
639
640                             if (by >= avctx->height)
641                                 return AVERROR_INVALIDDATA;
642
643                             clr = dst[by * linesize + bx - 1 - z];
644                             dst[by * linesize + bx] = clr;
645                             bx++;
646                             if (bx >= x * 16 + sx2 || bx >= avctx->width) {
647                                 bx = x * 16 + sx1;
648                                 by++;
649                             }
650                         }
651                         break;
652                     case 2:
653                         while (run-- > 0) {
654                             if (by < 1 || by >= avctx->height)
655                                 return AVERROR_INVALIDDATA;
656
657                             clr = dst[(by - 1) * linesize + bx];
658                             dst[by * linesize + bx] = clr;
659                             bx++;
660                             if (bx >= x * 16 + sx2 || bx >= avctx->width) {
661                                 bx = x * 16 + sx1;
662                                 by++;
663                             }
664                         }
665                         break;
666                     case 3:
667                         while (run-- > 0) {
668                             if (by >= avctx->height)
669                                 return AVERROR_INVALIDDATA;
670
671                             clr = prev[by * plinesize + bx];
672                             dst[by * linesize + bx] = clr;
673                             bx++;
674                             if (bx >= x * 16 + sx2 || bx >= avctx->width) {
675                                 bx = x * 16 + sx1;
676                                 by++;
677                             }
678                         }
679                         break;
680                     case 4:
681                         while (run-- > 0) {
682                             uint8_t *odst = (uint8_t *)dst;
683
684                             if (by < 1 || by >= avctx->height)
685                                 return AVERROR_INVALIDDATA;
686
687                             if (bx == 0) {
688                                 if (by < 2)
689                                     return AVERROR_INVALIDDATA;
690                                 z = backstep;
691                             } else {
692                                 z = 0;
693                             }
694
695                             r = odst[((by - 1) * linesize + bx) * 4] +
696                                 odst[(by * linesize + bx - 1 - z) * 4] -
697                                 odst[((by - 1) * linesize + bx - 1 - z) * 4];
698                             g = odst[((by - 1) * linesize + bx) * 4 + 1] +
699                                 odst[(by * linesize + bx - 1 - z) * 4 + 1] -
700                                 odst[((by - 1) * linesize + bx - 1 - z) * 4 + 1];
701                             b = odst[((by - 1) * linesize + bx) * 4 + 2] +
702                                 odst[(by * linesize + bx - 1 - z) * 4 + 2] -
703                                 odst[((by - 1) * linesize + bx - 1 - z) * 4 + 2];
704                             clr = ((b & 0xFF) << 16) + ((g & 0xFF) << 8) + (r & 0xFF);
705                             dst[by * linesize + bx] = clr;
706                             bx++;
707                             if (bx >= x * 16 + sx2 || bx >= avctx->width) {
708                                 bx = x * 16 + sx1;
709                                 by++;
710                             }
711                         }
712                         break;
713                     case 5:
714                         while (run-- > 0) {
715                             if (by < 1 || by >= avctx->height)
716                                 return AVERROR_INVALIDDATA;
717
718                             if (bx == 0) {
719                                 if (by < 2)
720                                     return AVERROR_INVALIDDATA;
721                                 z = backstep;
722                             } else {
723                                 z = 0;
724                             }
725
726                             clr = dst[(by - 1) * linesize + bx - 1 - z];
727                             dst[by * linesize + bx] = clr;
728                             bx++;
729                             if (bx >= x * 16 + sx2 || bx >= avctx->width) {
730                                 bx = x * 16 + sx1;
731                                 by++;
732                             }
733                         }
734                         break;
735                     }
736
737                     if (avctx->bits_per_coded_sample == 16) {
738                         cx1 = (clr & 0x3F00) >> 2;
739                         cx = (clr & 0x3FFFFF) >> 16;
740                     } else {
741                         cx1 = (clr & 0xFC00) >> 4;
742                         cx = (clr & 0xFFFFFF) >> 18;
743                     }
744                 }
745             }
746         }
747     }
748
749     return 0;
750 }
751
752 static int decode_frame(AVCodecContext *avctx, void *data, int *got_frame,
753                         AVPacket *avpkt)
754 {
755     SCPRContext *s = avctx->priv_data;
756     GetByteContext *gb = &s->gb;
757     AVFrame *frame = data;
758     int ret, type;
759
760     if (avctx->bits_per_coded_sample == 16) {
761         if ((ret = ff_get_buffer(avctx, frame, 0)) < 0)
762             return ret;
763     }
764
765     if ((ret = ff_reget_buffer(avctx, s->current_frame)) < 0)
766         return ret;
767
768     bytestream2_init(gb, avpkt->data, avpkt->size);
769
770     type = bytestream2_peek_byte(gb);
771
772     if (type == 2) {
773         s->get_freq = get_freq0;
774         s->decode = decode0;
775         frame->key_frame = 1;
776         ret = decompress_i(avctx, (uint32_t *)s->current_frame->data[0],
777                            s->current_frame->linesize[0] / 4);
778     } else if (type == 18) {
779         s->get_freq = get_freq;
780         s->decode = decode;
781         frame->key_frame = 1;
782         ret = decompress_i(avctx, (uint32_t *)s->current_frame->data[0],
783                            s->current_frame->linesize[0] / 4);
784     } else if (type == 17) {
785         uint32_t clr, *dst = (uint32_t *)s->current_frame->data[0];
786         int x, y;
787
788         frame->key_frame = 1;
789         bytestream2_skip(gb, 1);
790         if (avctx->bits_per_coded_sample == 16) {
791             uint16_t value = bytestream2_get_le16(gb);
792             int r, g, b;
793
794             r = (value      ) & 31;
795             g = (value >>  5) & 31;
796             b = (value >> 10) & 31;
797             clr = (r << 16) + (g << 8) + b;
798         } else {
799             clr = bytestream2_get_le24(gb);
800         }
801         for (y = 0; y < avctx->height; y++) {
802             for (x = 0; x < avctx->width; x++) {
803                 dst[x] = clr;
804             }
805             dst += s->current_frame->linesize[0] / 4;
806         }
807     } else if (type == 0 || type == 1) {
808         frame->key_frame = 0;
809
810         ret = av_frame_copy(s->current_frame, s->last_frame);
811         if (ret < 0)
812             return ret;
813
814         ret = decompress_p(avctx, (uint32_t *)s->current_frame->data[0],
815                            s->current_frame->linesize[0] / 4,
816                            (uint32_t *)s->last_frame->data[0],
817                            s->last_frame->linesize[0] / 4);
818     } else {
819         return AVERROR_PATCHWELCOME;
820     }
821
822     if (ret < 0)
823         return ret;
824
825     if (avctx->bits_per_coded_sample != 16) {
826         ret = av_frame_ref(data, s->current_frame);
827         if (ret < 0)
828             return ret;
829     } else {
830         uint8_t *dst = frame->data[0];
831         int x, y;
832
833         ret = av_frame_copy(frame, s->current_frame);
834         if (ret < 0)
835             return ret;
836
837         // scale up each sample by 8
838         for (y = 0; y < avctx->height; y++) {
839             // If the image is sufficiently aligned, compute 8 samples at once
840             if (!(((uintptr_t)dst) & 7)) {
841                 uint64_t *dst64 = (uint64_t *)dst;
842                 int w = avctx->width>>1;
843                 for (x = 0; x < w; x++) {
844                     dst64[x] = (dst64[x] << 3) & 0xFCFCFCFCFCFCFCFCULL;
845                 }
846                 x *= 8;
847             } else
848                 x = 0;
849             for (; x < avctx->width * 4; x++) {
850                 dst[x] = dst[x] << 3;
851             }
852             dst += frame->linesize[0];
853         }
854     }
855
856     frame->pict_type = frame->key_frame ? AV_PICTURE_TYPE_I : AV_PICTURE_TYPE_P;
857
858     FFSWAP(AVFrame *, s->current_frame, s->last_frame);
859
860     frame->data[0]     += frame->linesize[0] * (avctx->height - 1);
861     frame->linesize[0] *= -1;
862
863     *got_frame = 1;
864
865     return avpkt->size;
866 }
867
868 static av_cold int decode_init(AVCodecContext *avctx)
869 {
870     SCPRContext *s = avctx->priv_data;
871
872     switch (avctx->bits_per_coded_sample) {
873     case 16: avctx->pix_fmt = AV_PIX_FMT_RGB0; break;
874     case 24:
875     case 32: avctx->pix_fmt = AV_PIX_FMT_BGR0; break;
876     default:
877         av_log(avctx, AV_LOG_ERROR, "Unsupported bitdepth %i\n", avctx->bits_per_coded_sample);
878         return AVERROR_INVALIDDATA;
879     }
880
881     s->get_freq = get_freq0;
882     s->decode = decode0;
883
884     s->cxshift = avctx->bits_per_coded_sample == 16 ? 0 : 2;
885     s->cbits = avctx->bits_per_coded_sample == 16 ? 0x1F : 0xFF;
886     s->nbx = (avctx->width + 15) / 16;
887     s->nby = (avctx->height + 15) / 16;
888     s->nbcount = s->nbx * s->nby;
889     s->blocks = av_malloc_array(s->nbcount, sizeof(*s->blocks));
890     if (!s->blocks)
891         return AVERROR(ENOMEM);
892
893     s->last_frame = av_frame_alloc();
894     s->current_frame = av_frame_alloc();
895     if (!s->last_frame || !s->current_frame)
896         return AVERROR(ENOMEM);
897
898     return 0;
899 }
900
901 static av_cold int decode_close(AVCodecContext *avctx)
902 {
903     SCPRContext *s = avctx->priv_data;
904
905     av_freep(&s->blocks);
906     av_frame_free(&s->last_frame);
907     av_frame_free(&s->current_frame);
908
909     return 0;
910 }
911
912 AVCodec ff_scpr_decoder = {
913     .name             = "scpr",
914     .long_name        = NULL_IF_CONFIG_SMALL("ScreenPressor"),
915     .type             = AVMEDIA_TYPE_VIDEO,
916     .id               = AV_CODEC_ID_SCPR,
917     .priv_data_size   = sizeof(SCPRContext),
918     .init             = decode_init,
919     .close            = decode_close,
920     .decode           = decode_frame,
921     .capabilities     = AV_CODEC_CAP_DR1,
922     .caps_internal    = FF_CODEC_CAP_INIT_THREADSAFE |
923                         FF_CODEC_CAP_INIT_CLEANUP,
924 };