]> git.sesse.net Git - ffmpeg/blob - libavcodec/mss3.c
Merge commit '019ab88a95cb31b698506d90e8ce56695a7f1cc5'
[ffmpeg] / libavcodec / mss3.c
1 /*
2  * Microsoft Screen 3 (aka Microsoft ATC Screen) decoder
3  * Copyright (c) 2012 Konstantin Shishkov
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 /**
23  * @file
24  * Microsoft Screen 3 (aka Microsoft ATC Screen) decoder
25  */
26
27 #include "avcodec.h"
28 #include "bytestream.h"
29 #include "internal.h"
30 #include "mathops.h"
31 #include "mss34dsp.h"
32
33 #define HEADER_SIZE 27
34
35 #define MODEL2_SCALE       13
36 #define MODEL_SCALE        15
37 #define MODEL256_SEC_SCALE  9
38
39 typedef struct Model2 {
40     int      upd_val, till_rescale;
41     unsigned zero_freq,  zero_weight;
42     unsigned total_freq, total_weight;
43 } Model2;
44
45 typedef struct Model {
46     int weights[16], freqs[16];
47     int num_syms;
48     int tot_weight;
49     int upd_val, max_upd_val, till_rescale;
50 } Model;
51
52 typedef struct Model256 {
53     int weights[256], freqs[256];
54     int tot_weight;
55     int secondary[68];
56     int sec_size;
57     int upd_val, max_upd_val, till_rescale;
58 } Model256;
59
60 #define RAC_BOTTOM 0x01000000
61 typedef struct RangeCoder {
62     const uint8_t *src, *src_end;
63
64     uint32_t range, low;
65     int got_error;
66 } RangeCoder;
67
68 enum BlockType {
69     FILL_BLOCK = 0,
70     IMAGE_BLOCK,
71     DCT_BLOCK,
72     HAAR_BLOCK,
73     SKIP_BLOCK
74 };
75
76 typedef struct BlockTypeContext {
77     int      last_type;
78     Model    bt_model[5];
79 } BlockTypeContext;
80
81 typedef struct FillBlockCoder {
82     int      fill_val;
83     Model    coef_model;
84 } FillBlockCoder;
85
86 typedef struct ImageBlockCoder {
87     Model256 esc_model, vec_entry_model;
88     Model    vec_size_model;
89     Model    vq_model[125];
90 } ImageBlockCoder;
91
92 typedef struct DCTBlockCoder {
93     int      *prev_dc;
94     ptrdiff_t prev_dc_stride;
95     int      prev_dc_height;
96     int      quality;
97     uint16_t qmat[64];
98     Model    dc_model;
99     Model2   sign_model;
100     Model256 ac_model;
101 } DCTBlockCoder;
102
103 typedef struct HaarBlockCoder {
104     int      quality, scale;
105     Model256 coef_model;
106     Model    coef_hi_model;
107 } HaarBlockCoder;
108
109 typedef struct MSS3Context {
110     AVCodecContext   *avctx;
111     AVFrame          *pic;
112
113     int              got_error;
114     RangeCoder       coder;
115     BlockTypeContext btype[3];
116     FillBlockCoder   fill_coder[3];
117     ImageBlockCoder  image_coder[3];
118     DCTBlockCoder    dct_coder[3];
119     HaarBlockCoder   haar_coder[3];
120
121     int              dctblock[64];
122     int              hblock[16 * 16];
123 } MSS3Context;
124
125
126 static void model2_reset(Model2 *m)
127 {
128     m->zero_weight  = 1;
129     m->total_weight = 2;
130     m->zero_freq    = 0x1000;
131     m->total_freq   = 0x2000;
132     m->upd_val      = 4;
133     m->till_rescale = 4;
134 }
135
136 static void model2_update(Model2 *m, int bit)
137 {
138     unsigned scale;
139
140     if (!bit)
141         m->zero_weight++;
142     m->till_rescale--;
143     if (m->till_rescale)
144         return;
145
146     m->total_weight += m->upd_val;
147     if (m->total_weight > 0x2000) {
148         m->total_weight = (m->total_weight + 1) >> 1;
149         m->zero_weight  = (m->zero_weight  + 1) >> 1;
150         if (m->total_weight == m->zero_weight)
151             m->total_weight = m->zero_weight + 1;
152     }
153     m->upd_val = m->upd_val * 5 >> 2;
154     if (m->upd_val > 64)
155         m->upd_val = 64;
156     scale = 0x80000000u / m->total_weight;
157     m->zero_freq    = m->zero_weight  * scale >> 18;
158     m->total_freq   = m->total_weight * scale >> 18;
159     m->till_rescale = m->upd_val;
160 }
161
162 static void model_update(Model *m, int val)
163 {
164     int i, sum = 0;
165     unsigned scale;
166
167     m->weights[val]++;
168     m->till_rescale--;
169     if (m->till_rescale)
170         return;
171     m->tot_weight += m->upd_val;
172
173     if (m->tot_weight > 0x8000) {
174         m->tot_weight = 0;
175         for (i = 0; i < m->num_syms; i++) {
176             m->weights[i]  = (m->weights[i] + 1) >> 1;
177             m->tot_weight +=  m->weights[i];
178         }
179     }
180     scale = 0x80000000u / m->tot_weight;
181     for (i = 0; i < m->num_syms; i++) {
182         m->freqs[i] = sum * scale >> 16;
183         sum += m->weights[i];
184     }
185
186     m->upd_val = m->upd_val * 5 >> 2;
187     if (m->upd_val > m->max_upd_val)
188         m->upd_val = m->max_upd_val;
189     m->till_rescale = m->upd_val;
190 }
191
192 static void model_reset(Model *m)
193 {
194     int i;
195
196     m->tot_weight   = 0;
197     for (i = 0; i < m->num_syms - 1; i++)
198         m->weights[i] = 1;
199     m->weights[m->num_syms - 1] = 0;
200
201     m->upd_val      = m->num_syms;
202     m->till_rescale = 1;
203     model_update(m, m->num_syms - 1);
204     m->till_rescale =
205     m->upd_val      = (m->num_syms + 6) >> 1;
206 }
207
208 static av_cold void model_init(Model *m, int num_syms)
209 {
210     m->num_syms    = num_syms;
211     m->max_upd_val = 8 * num_syms + 48;
212
213     model_reset(m);
214 }
215
216 static void model256_update(Model256 *m, int val)
217 {
218     int i, sum = 0;
219     unsigned scale;
220     int send, sidx = 1;
221
222     m->weights[val]++;
223     m->till_rescale--;
224     if (m->till_rescale)
225         return;
226     m->tot_weight += m->upd_val;
227
228     if (m->tot_weight > 0x8000) {
229         m->tot_weight = 0;
230         for (i = 0; i < 256; i++) {
231             m->weights[i]  = (m->weights[i] + 1) >> 1;
232             m->tot_weight +=  m->weights[i];
233         }
234     }
235     scale = 0x80000000u / m->tot_weight;
236     m->secondary[0] = 0;
237     for (i = 0; i < 256; i++) {
238         m->freqs[i] = sum * scale >> 16;
239         sum += m->weights[i];
240         send = m->freqs[i] >> MODEL256_SEC_SCALE;
241         while (sidx <= send)
242             m->secondary[sidx++] = i - 1;
243     }
244     while (sidx < m->sec_size)
245         m->secondary[sidx++] = 255;
246
247     m->upd_val = m->upd_val * 5 >> 2;
248     if (m->upd_val > m->max_upd_val)
249         m->upd_val = m->max_upd_val;
250     m->till_rescale = m->upd_val;
251 }
252
253 static void model256_reset(Model256 *m)
254 {
255     int i;
256
257     for (i = 0; i < 255; i++)
258         m->weights[i] = 1;
259     m->weights[255] = 0;
260
261     m->tot_weight   = 0;
262     m->upd_val      = 256;
263     m->till_rescale = 1;
264     model256_update(m, 255);
265     m->till_rescale =
266     m->upd_val      = (256 + 6) >> 1;
267 }
268
269 static av_cold void model256_init(Model256 *m)
270 {
271     m->max_upd_val = 8 * 256 + 48;
272     m->sec_size    = (1 << 6) + 2;
273
274     model256_reset(m);
275 }
276
277 static void rac_init(RangeCoder *c, const uint8_t *src, int size)
278 {
279     int i;
280
281     c->src       = src;
282     c->src_end   = src + size;
283     c->low       = 0;
284     for (i = 0; i < FFMIN(size, 4); i++)
285         c->low = (c->low << 8) | *c->src++;
286     c->range     = 0xFFFFFFFF;
287     c->got_error = 0;
288 }
289
290 static void rac_normalise(RangeCoder *c)
291 {
292     for (;;) {
293         c->range <<= 8;
294         c->low   <<= 8;
295         if (c->src < c->src_end) {
296             c->low |= *c->src++;
297         } else if (!c->low) {
298             c->got_error = 1;
299             c->low = 1;
300         }
301         if (c->range >= RAC_BOTTOM)
302             return;
303     }
304 }
305
306 static int rac_get_bit(RangeCoder *c)
307 {
308     int bit;
309
310     c->range >>= 1;
311
312     bit = (c->range <= c->low);
313     if (bit)
314         c->low -= c->range;
315
316     if (c->range < RAC_BOTTOM)
317         rac_normalise(c);
318
319     return bit;
320 }
321
322 static int rac_get_bits(RangeCoder *c, int nbits)
323 {
324     int val;
325
326     c->range >>= nbits;
327     val = c->low / c->range;
328     c->low -= c->range * val;
329
330     if (c->range < RAC_BOTTOM)
331         rac_normalise(c);
332
333     return val;
334 }
335
336 static int rac_get_model2_sym(RangeCoder *c, Model2 *m)
337 {
338     int bit, helper;
339
340     helper = m->zero_freq * (c->range >> MODEL2_SCALE);
341     bit    = (c->low >= helper);
342     if (bit) {
343         c->low   -= helper;
344         c->range -= helper;
345     } else {
346         c->range  = helper;
347     }
348
349     if (c->range < RAC_BOTTOM)
350         rac_normalise(c);
351
352     model2_update(m, bit);
353
354     return bit;
355 }
356
357 static int rac_get_model_sym(RangeCoder *c, Model *m)
358 {
359     int val;
360     int end, end2;
361     unsigned prob, prob2, helper;
362
363     prob       = 0;
364     prob2      = c->range;
365     c->range >>= MODEL_SCALE;
366     val        = 0;
367     end        = m->num_syms >> 1;
368     end2       = m->num_syms;
369     do {
370         helper = m->freqs[end] * c->range;
371         if (helper <= c->low) {
372             val   = end;
373             prob  = helper;
374         } else {
375             end2  = end;
376             prob2 = helper;
377         }
378         end = (end2 + val) >> 1;
379     } while (end != val);
380     c->low  -= prob;
381     c->range = prob2 - prob;
382     if (c->range < RAC_BOTTOM)
383         rac_normalise(c);
384
385     model_update(m, val);
386
387     return val;
388 }
389
390 static int rac_get_model256_sym(RangeCoder *c, Model256 *m)
391 {
392     int prob, prob2, helper, val;
393     int start, end;
394     int ssym;
395
396     prob2      = c->range;
397     c->range >>= MODEL_SCALE;
398
399     helper     = c->low / c->range;
400     ssym       = helper >> MODEL256_SEC_SCALE;
401     val        = m->secondary[ssym];
402
403     end = start = m->secondary[ssym + 1] + 1;
404     while (end > val + 1) {
405         ssym = (end + val) >> 1;
406         if (m->freqs[ssym] <= helper) {
407             end = start;
408             val = ssym;
409         } else {
410             end   = (end + val) >> 1;
411             start = ssym;
412         }
413     }
414     prob = m->freqs[val] * c->range;
415     if (val != 255)
416         prob2 = m->freqs[val + 1] * c->range;
417
418     c->low  -= prob;
419     c->range = prob2 - prob;
420     if (c->range < RAC_BOTTOM)
421         rac_normalise(c);
422
423     model256_update(m, val);
424
425     return val;
426 }
427
428 static int decode_block_type(RangeCoder *c, BlockTypeContext *bt)
429 {
430     bt->last_type = rac_get_model_sym(c, &bt->bt_model[bt->last_type]);
431
432     return bt->last_type;
433 }
434
435 static int decode_coeff(RangeCoder *c, Model *m)
436 {
437     int val, sign;
438
439     val = rac_get_model_sym(c, m);
440     if (val) {
441         sign = rac_get_bit(c);
442         if (val > 1) {
443             val--;
444             val = (1 << val) + rac_get_bits(c, val);
445         }
446         if (!sign)
447             val = -val;
448     }
449
450     return val;
451 }
452
453 static void decode_fill_block(RangeCoder *c, FillBlockCoder *fc,
454                               uint8_t *dst, ptrdiff_t stride, int block_size)
455 {
456     int i;
457
458     fc->fill_val += decode_coeff(c, &fc->coef_model);
459
460     for (i = 0; i < block_size; i++, dst += stride)
461         memset(dst, fc->fill_val, block_size);
462 }
463
464 static void decode_image_block(RangeCoder *c, ImageBlockCoder *ic,
465                                uint8_t *dst, ptrdiff_t stride, int block_size)
466 {
467     int i, j;
468     int vec_size;
469     int vec[4];
470     int prev_line[16];
471     int A, B, C;
472
473     vec_size = rac_get_model_sym(c, &ic->vec_size_model) + 2;
474     for (i = 0; i < vec_size; i++)
475         vec[i] = rac_get_model256_sym(c, &ic->vec_entry_model);
476     for (; i < 4; i++)
477         vec[i] = 0;
478     memset(prev_line, 0, sizeof(prev_line));
479
480     for (j = 0; j < block_size; j++) {
481         A = 0;
482         B = 0;
483         for (i = 0; i < block_size; i++) {
484             C = B;
485             B = prev_line[i];
486             A = rac_get_model_sym(c, &ic->vq_model[A + B * 5 + C * 25]);
487
488             prev_line[i] = A;
489             if (A < 4)
490                dst[i] = vec[A];
491             else
492                dst[i] = rac_get_model256_sym(c, &ic->esc_model);
493         }
494         dst += stride;
495     }
496 }
497
498 static int decode_dct(RangeCoder *c, DCTBlockCoder *bc, int *block,
499                       int bx, int by)
500 {
501     int skip, val, sign, pos = 1, zz_pos, dc;
502     int blk_pos = bx + by * bc->prev_dc_stride;
503
504     memset(block, 0, sizeof(*block) * 64);
505
506     dc = decode_coeff(c, &bc->dc_model);
507     if (by) {
508         if (bx) {
509             int l, tl, t;
510
511             l  = bc->prev_dc[blk_pos - 1];
512             tl = bc->prev_dc[blk_pos - 1 - bc->prev_dc_stride];
513             t  = bc->prev_dc[blk_pos     - bc->prev_dc_stride];
514
515             if (FFABS(t - tl) <= FFABS(l - tl))
516                 dc += l;
517             else
518                 dc += t;
519         } else {
520             dc += bc->prev_dc[blk_pos - bc->prev_dc_stride];
521         }
522     } else if (bx) {
523         dc += bc->prev_dc[bx - 1];
524     }
525     bc->prev_dc[blk_pos] = dc;
526     block[0]             = dc * bc->qmat[0];
527
528     while (pos < 64) {
529         val = rac_get_model256_sym(c, &bc->ac_model);
530         if (!val)
531             return 0;
532         if (val == 0xF0) {
533             pos += 16;
534             continue;
535         }
536         skip = val >> 4;
537         val  = val & 0xF;
538         if (!val)
539             return -1;
540         pos += skip;
541         if (pos >= 64)
542             return -1;
543
544         sign = rac_get_model2_sym(c, &bc->sign_model);
545         if (val > 1) {
546             val--;
547             val = (1 << val) + rac_get_bits(c, val);
548         }
549         if (!sign)
550             val = -val;
551
552         zz_pos = ff_zigzag_direct[pos];
553         block[zz_pos] = val * bc->qmat[zz_pos];
554         pos++;
555     }
556
557     return pos == 64 ? 0 : -1;
558 }
559
560 static void decode_dct_block(RangeCoder *c, DCTBlockCoder *bc,
561                              uint8_t *dst, ptrdiff_t stride, int block_size,
562                              int *block, int mb_x, int mb_y)
563 {
564     int i, j;
565     int bx, by;
566     int nblocks = block_size >> 3;
567
568     bx = mb_x * nblocks;
569     by = mb_y * nblocks;
570
571     for (j = 0; j < nblocks; j++) {
572         for (i = 0; i < nblocks; i++) {
573             if (decode_dct(c, bc, block, bx + i, by + j)) {
574                 c->got_error = 1;
575                 return;
576             }
577             ff_mss34_dct_put(dst + i * 8, stride, block);
578         }
579         dst += 8 * stride;
580     }
581 }
582
583 static void decode_haar_block(RangeCoder *c, HaarBlockCoder *hc,
584                               uint8_t *dst, ptrdiff_t stride,
585                               int block_size, int *block)
586 {
587     const int hsize = block_size >> 1;
588     int A, B, C, D, t1, t2, t3, t4;
589     int i, j;
590
591     for (j = 0; j < block_size; j++) {
592         for (i = 0; i < block_size; i++) {
593             if (i < hsize && j < hsize)
594                 block[i] = rac_get_model256_sym(c, &hc->coef_model);
595             else
596                 block[i] = decode_coeff(c, &hc->coef_hi_model);
597             block[i] *= hc->scale;
598         }
599         block += block_size;
600     }
601     block -= block_size * block_size;
602
603     for (j = 0; j < hsize; j++) {
604         for (i = 0; i < hsize; i++) {
605             A = block[i];
606             B = block[i + hsize];
607             C = block[i + hsize * block_size];
608             D = block[i + hsize * block_size + hsize];
609
610             t1 = A - B;
611             t2 = C - D;
612             t3 = A + B;
613             t4 = C + D;
614             dst[i * 2]              = av_clip_uint8(t1 - t2);
615             dst[i * 2 + stride]     = av_clip_uint8(t1 + t2);
616             dst[i * 2 + 1]          = av_clip_uint8(t3 - t4);
617             dst[i * 2 + 1 + stride] = av_clip_uint8(t3 + t4);
618         }
619         block += block_size;
620         dst   += stride * 2;
621     }
622 }
623
624 static void reset_coders(MSS3Context *ctx, int quality)
625 {
626     int i, j;
627
628     for (i = 0; i < 3; i++) {
629         ctx->btype[i].last_type = SKIP_BLOCK;
630         for (j = 0; j < 5; j++)
631             model_reset(&ctx->btype[i].bt_model[j]);
632         ctx->fill_coder[i].fill_val = 0;
633         model_reset(&ctx->fill_coder[i].coef_model);
634         model256_reset(&ctx->image_coder[i].esc_model);
635         model256_reset(&ctx->image_coder[i].vec_entry_model);
636         model_reset(&ctx->image_coder[i].vec_size_model);
637         for (j = 0; j < 125; j++)
638             model_reset(&ctx->image_coder[i].vq_model[j]);
639         if (ctx->dct_coder[i].quality != quality) {
640             ctx->dct_coder[i].quality = quality;
641             ff_mss34_gen_quant_mat(ctx->dct_coder[i].qmat, quality, !i);
642         }
643         memset(ctx->dct_coder[i].prev_dc, 0,
644                sizeof(*ctx->dct_coder[i].prev_dc) *
645                ctx->dct_coder[i].prev_dc_stride *
646                ctx->dct_coder[i].prev_dc_height);
647         model_reset(&ctx->dct_coder[i].dc_model);
648         model2_reset(&ctx->dct_coder[i].sign_model);
649         model256_reset(&ctx->dct_coder[i].ac_model);
650         if (ctx->haar_coder[i].quality != quality) {
651             ctx->haar_coder[i].quality = quality;
652             ctx->haar_coder[i].scale   = 17 - 7 * quality / 50;
653         }
654         model_reset(&ctx->haar_coder[i].coef_hi_model);
655         model256_reset(&ctx->haar_coder[i].coef_model);
656     }
657 }
658
659 static av_cold void init_coders(MSS3Context *ctx)
660 {
661     int i, j;
662
663     for (i = 0; i < 3; i++) {
664         for (j = 0; j < 5; j++)
665             model_init(&ctx->btype[i].bt_model[j], 5);
666         model_init(&ctx->fill_coder[i].coef_model, 12);
667         model256_init(&ctx->image_coder[i].esc_model);
668         model256_init(&ctx->image_coder[i].vec_entry_model);
669         model_init(&ctx->image_coder[i].vec_size_model, 3);
670         for (j = 0; j < 125; j++)
671             model_init(&ctx->image_coder[i].vq_model[j], 5);
672         model_init(&ctx->dct_coder[i].dc_model, 12);
673         model256_init(&ctx->dct_coder[i].ac_model);
674         model_init(&ctx->haar_coder[i].coef_hi_model, 12);
675         model256_init(&ctx->haar_coder[i].coef_model);
676     }
677 }
678
679 static int mss3_decode_frame(AVCodecContext *avctx, void *data, int *got_frame,
680                              AVPacket *avpkt)
681 {
682     const uint8_t *buf = avpkt->data;
683     int buf_size = avpkt->size;
684     MSS3Context *c = avctx->priv_data;
685     RangeCoder *acoder = &c->coder;
686     GetByteContext gb;
687     uint8_t *dst[3];
688     int dec_width, dec_height, dec_x, dec_y, quality, keyframe;
689     int x, y, i, mb_width, mb_height, blk_size, btype;
690     int ret;
691
692     if (buf_size < HEADER_SIZE) {
693         av_log(avctx, AV_LOG_ERROR,
694                "Frame should have at least %d bytes, got %d instead\n",
695                HEADER_SIZE, buf_size);
696         return AVERROR_INVALIDDATA;
697     }
698
699     bytestream2_init(&gb, buf, buf_size);
700     keyframe   = bytestream2_get_be32(&gb);
701     if (keyframe & ~0x301) {
702         av_log(avctx, AV_LOG_ERROR, "Invalid frame type %X\n", keyframe);
703         return AVERROR_INVALIDDATA;
704     }
705     keyframe   = !(keyframe & 1);
706     bytestream2_skip(&gb, 6);
707     dec_x      = bytestream2_get_be16(&gb);
708     dec_y      = bytestream2_get_be16(&gb);
709     dec_width  = bytestream2_get_be16(&gb);
710     dec_height = bytestream2_get_be16(&gb);
711
712     if (dec_x + dec_width > avctx->width ||
713         dec_y + dec_height > avctx->height ||
714         (dec_width | dec_height) & 0xF) {
715         av_log(avctx, AV_LOG_ERROR, "Invalid frame dimensions %dx%d +%d,%d\n",
716                dec_width, dec_height, dec_x, dec_y);
717         return AVERROR_INVALIDDATA;
718     }
719     bytestream2_skip(&gb, 4);
720     quality    = bytestream2_get_byte(&gb);
721     if (quality < 1 || quality > 100) {
722         av_log(avctx, AV_LOG_ERROR, "Invalid quality setting %d\n", quality);
723         return AVERROR_INVALIDDATA;
724     }
725     bytestream2_skip(&gb, 4);
726
727     if (keyframe && !bytestream2_get_bytes_left(&gb)) {
728         av_log(avctx, AV_LOG_ERROR, "Keyframe without data found\n");
729         return AVERROR_INVALIDDATA;
730     }
731     if (!keyframe && c->got_error)
732         return buf_size;
733     c->got_error = 0;
734
735     if ((ret = ff_reget_buffer(avctx, c->pic)) < 0)
736         return ret;
737     c->pic->key_frame = keyframe;
738     c->pic->pict_type = keyframe ? AV_PICTURE_TYPE_I : AV_PICTURE_TYPE_P;
739     if (!bytestream2_get_bytes_left(&gb)) {
740         if ((ret = av_frame_ref(data, c->pic)) < 0)
741             return ret;
742         *got_frame      = 1;
743
744         return buf_size;
745     }
746
747     reset_coders(c, quality);
748
749     rac_init(acoder, buf + HEADER_SIZE, buf_size - HEADER_SIZE);
750
751     mb_width  = dec_width  >> 4;
752     mb_height = dec_height >> 4;
753     dst[0] = c->pic->data[0] + dec_x     +  dec_y      * c->pic->linesize[0];
754     dst[1] = c->pic->data[1] + dec_x / 2 + (dec_y / 2) * c->pic->linesize[1];
755     dst[2] = c->pic->data[2] + dec_x / 2 + (dec_y / 2) * c->pic->linesize[2];
756     for (y = 0; y < mb_height; y++) {
757         for (x = 0; x < mb_width; x++) {
758             for (i = 0; i < 3; i++) {
759                 blk_size = 8 << !i;
760
761                 btype = decode_block_type(acoder, c->btype + i);
762                 switch (btype) {
763                 case FILL_BLOCK:
764                     decode_fill_block(acoder, c->fill_coder + i,
765                                       dst[i] + x * blk_size,
766                                       c->pic->linesize[i], blk_size);
767                     break;
768                 case IMAGE_BLOCK:
769                     decode_image_block(acoder, c->image_coder + i,
770                                        dst[i] + x * blk_size,
771                                        c->pic->linesize[i], blk_size);
772                     break;
773                 case DCT_BLOCK:
774                     decode_dct_block(acoder, c->dct_coder + i,
775                                      dst[i] + x * blk_size,
776                                      c->pic->linesize[i], blk_size,
777                                      c->dctblock, x, y);
778                     break;
779                 case HAAR_BLOCK:
780                     decode_haar_block(acoder, c->haar_coder + i,
781                                       dst[i] + x * blk_size,
782                                       c->pic->linesize[i], blk_size,
783                                       c->hblock);
784                     break;
785                 }
786                 if (c->got_error || acoder->got_error) {
787                     av_log(avctx, AV_LOG_ERROR, "Error decoding block %d,%d\n",
788                            x, y);
789                     c->got_error = 1;
790                     return AVERROR_INVALIDDATA;
791                 }
792             }
793         }
794         dst[0] += c->pic->linesize[0] * 16;
795         dst[1] += c->pic->linesize[1] * 8;
796         dst[2] += c->pic->linesize[2] * 8;
797     }
798
799     if ((ret = av_frame_ref(data, c->pic)) < 0)
800         return ret;
801
802     *got_frame      = 1;
803
804     return buf_size;
805 }
806
807 static av_cold int mss3_decode_end(AVCodecContext *avctx)
808 {
809     MSS3Context * const c = avctx->priv_data;
810     int i;
811
812     av_frame_free(&c->pic);
813     for (i = 0; i < 3; i++)
814         av_freep(&c->dct_coder[i].prev_dc);
815
816     return 0;
817 }
818
819 static av_cold int mss3_decode_init(AVCodecContext *avctx)
820 {
821     MSS3Context * const c = avctx->priv_data;
822     int i;
823
824     c->avctx = avctx;
825
826     if ((avctx->width & 0xF) || (avctx->height & 0xF)) {
827         av_log(avctx, AV_LOG_ERROR,
828                "Image dimensions should be a multiple of 16.\n");
829         return AVERROR_INVALIDDATA;
830     }
831
832     c->got_error = 0;
833     for (i = 0; i < 3; i++) {
834         int b_width  = avctx->width  >> (2 + !!i);
835         int b_height = avctx->height >> (2 + !!i);
836         c->dct_coder[i].prev_dc_stride = b_width;
837         c->dct_coder[i].prev_dc_height = b_height;
838         c->dct_coder[i].prev_dc = av_malloc(sizeof(*c->dct_coder[i].prev_dc) *
839                                             b_width * b_height);
840         if (!c->dct_coder[i].prev_dc) {
841             av_log(avctx, AV_LOG_ERROR, "Cannot allocate buffer\n");
842             av_frame_free(&c->pic);
843             while (i >= 0) {
844                 av_freep(&c->dct_coder[i].prev_dc);
845                 i--;
846             }
847             return AVERROR(ENOMEM);
848         }
849     }
850
851     c->pic = av_frame_alloc();
852     if (!c->pic) {
853         mss3_decode_end(avctx);
854         return AVERROR(ENOMEM);
855     }
856
857     avctx->pix_fmt     = AV_PIX_FMT_YUV420P;
858
859     init_coders(c);
860
861     return 0;
862 }
863
864 AVCodec ff_msa1_decoder = {
865     .name           = "msa1",
866     .long_name      = NULL_IF_CONFIG_SMALL("MS ATC Screen"),
867     .type           = AVMEDIA_TYPE_VIDEO,
868     .id             = AV_CODEC_ID_MSA1,
869     .priv_data_size = sizeof(MSS3Context),
870     .init           = mss3_decode_init,
871     .close          = mss3_decode_end,
872     .decode         = mss3_decode_frame,
873     .capabilities   = AV_CODEC_CAP_DR1,
874 };