]> git.sesse.net Git - ffmpeg/blob - libavcodec/truemotion1.c
atrac3: switch to av_assert
[ffmpeg] / libavcodec / truemotion1.c
1 /*
2  * Duck TrueMotion 1.0 Decoder
3  * Copyright (C) 2003 Alex Beregszaszi & Mike Melanson
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 /**
23  * @file
24  * Duck TrueMotion v1 Video Decoder by
25  * Alex Beregszaszi and
26  * Mike Melanson (melanson@pcisys.net)
27  *
28  * The TrueMotion v1 decoder presently only decodes 16-bit TM1 data and
29  * outputs RGB555 (or RGB565) data. 24-bit TM1 data is not supported yet.
30  */
31
32 #include <stdio.h>
33 #include <stdlib.h>
34 #include <string.h>
35
36 #include "avcodec.h"
37 #include "dsputil.h"
38 #include "libavutil/imgutils.h"
39
40 #include "truemotion1data.h"
41
42 typedef struct TrueMotion1Context {
43     AVCodecContext *avctx;
44     AVFrame frame;
45
46     const uint8_t *buf;
47     int size;
48
49     const uint8_t *mb_change_bits;
50     int mb_change_bits_row_size;
51     const uint8_t *index_stream;
52     int index_stream_size;
53
54     int flags;
55     int x, y, w, h;
56
57     uint32_t y_predictor_table[1024];
58     uint32_t c_predictor_table[1024];
59     uint32_t fat_y_predictor_table[1024];
60     uint32_t fat_c_predictor_table[1024];
61
62     int compression;
63     int block_type;
64     int block_width;
65     int block_height;
66
67     int16_t ydt[8];
68     int16_t cdt[8];
69     int16_t fat_ydt[8];
70     int16_t fat_cdt[8];
71
72     int last_deltaset, last_vectable;
73
74     unsigned int *vert_pred;
75     int vert_pred_size;
76
77 } TrueMotion1Context;
78
79 #define FLAG_SPRITE         32
80 #define FLAG_KEYFRAME       16
81 #define FLAG_INTERFRAME      8
82 #define FLAG_INTERPOLATED    4
83
84 struct frame_header {
85     uint8_t header_size;
86     uint8_t compression;
87     uint8_t deltaset;
88     uint8_t vectable;
89     uint16_t ysize;
90     uint16_t xsize;
91     uint16_t checksum;
92     uint8_t version;
93     uint8_t header_type;
94     uint8_t flags;
95     uint8_t control;
96     uint16_t xoffset;
97     uint16_t yoffset;
98     uint16_t width;
99     uint16_t height;
100 };
101
102 #define ALGO_NOP        0
103 #define ALGO_RGB16V     1
104 #define ALGO_RGB16H     2
105 #define ALGO_RGB24H     3
106
107 /* these are the various block sizes that can occupy a 4x4 block */
108 #define BLOCK_2x2  0
109 #define BLOCK_2x4  1
110 #define BLOCK_4x2  2
111 #define BLOCK_4x4  3
112
113 typedef struct comp_types {
114     int algorithm;
115     int block_width; // vres
116     int block_height; // hres
117     int block_type;
118 } comp_types;
119
120 /* { valid for metatype }, algorithm, num of deltas, vert res, horiz res */
121 static const comp_types compression_types[17] = {
122     { ALGO_NOP,    0, 0, 0 },
123
124     { ALGO_RGB16V, 4, 4, BLOCK_4x4 },
125     { ALGO_RGB16H, 4, 4, BLOCK_4x4 },
126     { ALGO_RGB16V, 4, 2, BLOCK_4x2 },
127     { ALGO_RGB16H, 4, 2, BLOCK_4x2 },
128
129     { ALGO_RGB16V, 2, 4, BLOCK_2x4 },
130     { ALGO_RGB16H, 2, 4, BLOCK_2x4 },
131     { ALGO_RGB16V, 2, 2, BLOCK_2x2 },
132     { ALGO_RGB16H, 2, 2, BLOCK_2x2 },
133
134     { ALGO_NOP,    4, 4, BLOCK_4x4 },
135     { ALGO_RGB24H, 4, 4, BLOCK_4x4 },
136     { ALGO_NOP,    4, 2, BLOCK_4x2 },
137     { ALGO_RGB24H, 4, 2, BLOCK_4x2 },
138
139     { ALGO_NOP,    2, 4, BLOCK_2x4 },
140     { ALGO_RGB24H, 2, 4, BLOCK_2x4 },
141     { ALGO_NOP,    2, 2, BLOCK_2x2 },
142     { ALGO_RGB24H, 2, 2, BLOCK_2x2 }
143 };
144
145 static void select_delta_tables(TrueMotion1Context *s, int delta_table_index)
146 {
147     int i;
148
149     if (delta_table_index > 3)
150         return;
151
152     memcpy(s->ydt, ydts[delta_table_index], 8 * sizeof(int16_t));
153     memcpy(s->cdt, cdts[delta_table_index], 8 * sizeof(int16_t));
154     memcpy(s->fat_ydt, fat_ydts[delta_table_index], 8 * sizeof(int16_t));
155     memcpy(s->fat_cdt, fat_cdts[delta_table_index], 8 * sizeof(int16_t));
156
157     /* Y skinny deltas need to be halved for some reason; maybe the
158      * skinny Y deltas should be modified */
159     for (i = 0; i < 8; i++)
160     {
161         /* drop the lsb before dividing by 2-- net effect: round down
162          * when dividing a negative number (e.g., -3/2 = -2, not -1) */
163         s->ydt[i] &= 0xFFFE;
164         s->ydt[i] /= 2;
165     }
166 }
167
168 #if HAVE_BIGENDIAN
169 static int make_ydt15_entry(int p2, int p1, int16_t *ydt)
170 #else
171 static int make_ydt15_entry(int p1, int p2, int16_t *ydt)
172 #endif
173 {
174     int lo, hi;
175
176     lo = ydt[p1];
177     lo += (lo << 5) + (lo << 10);
178     hi = ydt[p2];
179     hi += (hi << 5) + (hi << 10);
180     return (lo + (hi << 16)) << 1;
181 }
182
183 static int make_cdt15_entry(int p1, int p2, int16_t *cdt)
184 {
185     int r, b, lo;
186
187     b = cdt[p2];
188     r = cdt[p1] << 10;
189     lo = b + r;
190     return (lo + (lo << 16)) << 1;
191 }
192
193 #if HAVE_BIGENDIAN
194 static int make_ydt16_entry(int p2, int p1, int16_t *ydt)
195 #else
196 static int make_ydt16_entry(int p1, int p2, int16_t *ydt)
197 #endif
198 {
199     int lo, hi;
200
201     lo = ydt[p1];
202     lo += (lo << 6) + (lo << 11);
203     hi = ydt[p2];
204     hi += (hi << 6) + (hi << 11);
205     return (lo + (hi << 16)) << 1;
206 }
207
208 static int make_cdt16_entry(int p1, int p2, int16_t *cdt)
209 {
210     int r, b, lo;
211
212     b = cdt[p2];
213     r = cdt[p1] << 11;
214     lo = b + r;
215     return (lo + (lo << 16)) << 1;
216 }
217
218 static int make_ydt24_entry(int p1, int p2, int16_t *ydt)
219 {
220     int lo, hi;
221
222     lo = ydt[p1];
223     hi = ydt[p2];
224     return (lo + (hi << 8) + (hi << 16)) << 1;
225 }
226
227 static int make_cdt24_entry(int p1, int p2, int16_t *cdt)
228 {
229     int r, b;
230
231     b = cdt[p2];
232     r = cdt[p1]<<16;
233     return (b+r) << 1;
234 }
235
236 static void gen_vector_table15(TrueMotion1Context *s, const uint8_t *sel_vector_table)
237 {
238     int len, i, j;
239     unsigned char delta_pair;
240
241     for (i = 0; i < 1024; i += 4)
242     {
243         len = *sel_vector_table++ / 2;
244         for (j = 0; j < len; j++)
245         {
246             delta_pair = *sel_vector_table++;
247             s->y_predictor_table[i+j] = 0xfffffffe &
248                 make_ydt15_entry(delta_pair >> 4, delta_pair & 0xf, s->ydt);
249             s->c_predictor_table[i+j] = 0xfffffffe &
250                 make_cdt15_entry(delta_pair >> 4, delta_pair & 0xf, s->cdt);
251         }
252         s->y_predictor_table[i+(j-1)] |= 1;
253         s->c_predictor_table[i+(j-1)] |= 1;
254     }
255 }
256
257 static void gen_vector_table16(TrueMotion1Context *s, const uint8_t *sel_vector_table)
258 {
259     int len, i, j;
260     unsigned char delta_pair;
261
262     for (i = 0; i < 1024; i += 4)
263     {
264         len = *sel_vector_table++ / 2;
265         for (j = 0; j < len; j++)
266         {
267             delta_pair = *sel_vector_table++;
268             s->y_predictor_table[i+j] = 0xfffffffe &
269                 make_ydt16_entry(delta_pair >> 4, delta_pair & 0xf, s->ydt);
270             s->c_predictor_table[i+j] = 0xfffffffe &
271                 make_cdt16_entry(delta_pair >> 4, delta_pair & 0xf, s->cdt);
272         }
273         s->y_predictor_table[i+(j-1)] |= 1;
274         s->c_predictor_table[i+(j-1)] |= 1;
275     }
276 }
277
278 static void gen_vector_table24(TrueMotion1Context *s, const uint8_t *sel_vector_table)
279 {
280     int len, i, j;
281     unsigned char delta_pair;
282
283     for (i = 0; i < 1024; i += 4)
284     {
285         len = *sel_vector_table++ / 2;
286         for (j = 0; j < len; j++)
287         {
288             delta_pair = *sel_vector_table++;
289             s->y_predictor_table[i+j] = 0xfffffffe &
290                 make_ydt24_entry(delta_pair >> 4, delta_pair & 0xf, s->ydt);
291             s->c_predictor_table[i+j] = 0xfffffffe &
292                 make_cdt24_entry(delta_pair >> 4, delta_pair & 0xf, s->cdt);
293             s->fat_y_predictor_table[i+j] = 0xfffffffe &
294                 make_ydt24_entry(delta_pair >> 4, delta_pair & 0xf, s->fat_ydt);
295             s->fat_c_predictor_table[i+j] = 0xfffffffe &
296                 make_cdt24_entry(delta_pair >> 4, delta_pair & 0xf, s->fat_cdt);
297         }
298         s->y_predictor_table[i+(j-1)] |= 1;
299         s->c_predictor_table[i+(j-1)] |= 1;
300         s->fat_y_predictor_table[i+(j-1)] |= 1;
301         s->fat_c_predictor_table[i+(j-1)] |= 1;
302     }
303 }
304
305 /* Returns the number of bytes consumed from the bytestream. Returns -1 if
306  * there was an error while decoding the header */
307 static int truemotion1_decode_header(TrueMotion1Context *s)
308 {
309     int i;
310     int width_shift = 0;
311     int new_pix_fmt;
312     struct frame_header header;
313     uint8_t header_buffer[128] = { 0 };  /* logical maximum size of the header */
314     const uint8_t *sel_vector_table;
315
316     header.header_size = ((s->buf[0] >> 5) | (s->buf[0] << 3)) & 0x7f;
317     if (s->buf[0] < 0x10 || header.header_size >= s->size)
318     {
319         av_log(s->avctx, AV_LOG_ERROR, "invalid header size (%d)\n", s->buf[0]);
320         return -1;
321     }
322
323     /* unscramble the header bytes with a XOR operation */
324     for (i = 1; i < header.header_size; i++)
325         header_buffer[i - 1] = s->buf[i] ^ s->buf[i + 1];
326
327     header.compression = header_buffer[0];
328     header.deltaset = header_buffer[1];
329     header.vectable = header_buffer[2];
330     header.ysize = AV_RL16(&header_buffer[3]);
331     header.xsize = AV_RL16(&header_buffer[5]);
332     header.checksum = AV_RL16(&header_buffer[7]);
333     header.version = header_buffer[9];
334     header.header_type = header_buffer[10];
335     header.flags = header_buffer[11];
336     header.control = header_buffer[12];
337
338     /* Version 2 */
339     if (header.version >= 2)
340     {
341         if (header.header_type > 3)
342         {
343             av_log(s->avctx, AV_LOG_ERROR, "invalid header type (%d)\n", header.header_type);
344             return -1;
345         } else if ((header.header_type == 2) || (header.header_type == 3)) {
346             s->flags = header.flags;
347             if (!(s->flags & FLAG_INTERFRAME))
348                 s->flags |= FLAG_KEYFRAME;
349         } else
350             s->flags = FLAG_KEYFRAME;
351     } else /* Version 1 */
352         s->flags = FLAG_KEYFRAME;
353
354     if (s->flags & FLAG_SPRITE) {
355         av_log_ask_for_sample(s->avctx, "SPRITE frame found.\n");
356         /* FIXME header.width, height, xoffset and yoffset aren't initialized */
357         return -1;
358     } else {
359         s->w = header.xsize;
360         s->h = header.ysize;
361         if (header.header_type < 2) {
362             if ((s->w < 213) && (s->h >= 176))
363             {
364                 s->flags |= FLAG_INTERPOLATED;
365                 av_log_ask_for_sample(s->avctx, "INTERPOLATION selected.\n");
366             }
367         }
368     }
369
370     if (header.compression >= 17) {
371         av_log(s->avctx, AV_LOG_ERROR, "invalid compression type (%d)\n", header.compression);
372         return -1;
373     }
374
375     if ((header.deltaset != s->last_deltaset) ||
376         (header.vectable != s->last_vectable))
377         select_delta_tables(s, header.deltaset);
378
379     if ((header.compression & 1) && header.header_type)
380         sel_vector_table = pc_tbl2;
381     else {
382         if (header.vectable > 0 && header.vectable < 4)
383             sel_vector_table = tables[header.vectable - 1];
384         else {
385             av_log(s->avctx, AV_LOG_ERROR, "invalid vector table id (%d)\n", header.vectable);
386             return -1;
387         }
388     }
389
390     if (compression_types[header.compression].algorithm == ALGO_RGB24H) {
391         new_pix_fmt = PIX_FMT_RGB32;
392         width_shift = 1;
393     } else
394         new_pix_fmt = PIX_FMT_RGB555; // RGB565 is supported as well
395
396     s->w >>= width_shift;
397     if (av_image_check_size(s->w, s->h, 0, s->avctx) < 0)
398         return -1;
399
400     if (s->w != s->avctx->width || s->h != s->avctx->height ||
401         new_pix_fmt != s->avctx->pix_fmt) {
402         if (s->frame.data[0])
403             s->avctx->release_buffer(s->avctx, &s->frame);
404         s->avctx->sample_aspect_ratio = (AVRational){ 1 << width_shift, 1 };
405         s->avctx->pix_fmt = new_pix_fmt;
406         avcodec_set_dimensions(s->avctx, s->w, s->h);
407         av_fast_malloc(&s->vert_pred, &s->vert_pred_size, s->avctx->width * sizeof(unsigned int));
408     }
409
410     /* There is 1 change bit per 4 pixels, so each change byte represents
411      * 32 pixels; divide width by 4 to obtain the number of change bits and
412      * then round up to the nearest byte. */
413     s->mb_change_bits_row_size = ((s->avctx->width >> (2 - width_shift)) + 7) >> 3;
414
415     if ((header.deltaset != s->last_deltaset) || (header.vectable != s->last_vectable))
416     {
417         if (compression_types[header.compression].algorithm == ALGO_RGB24H)
418             gen_vector_table24(s, sel_vector_table);
419         else
420         if (s->avctx->pix_fmt == PIX_FMT_RGB555)
421             gen_vector_table15(s, sel_vector_table);
422         else
423             gen_vector_table16(s, sel_vector_table);
424     }
425
426     /* set up pointers to the other key data chunks */
427     s->mb_change_bits = s->buf + header.header_size;
428     if (s->flags & FLAG_KEYFRAME) {
429         /* no change bits specified for a keyframe; only index bytes */
430         s->index_stream = s->mb_change_bits;
431     } else {
432         /* one change bit per 4x4 block */
433         s->index_stream = s->mb_change_bits +
434             (s->mb_change_bits_row_size * (s->avctx->height >> 2));
435     }
436     s->index_stream_size = s->size - (s->index_stream - s->buf);
437
438     s->last_deltaset = header.deltaset;
439     s->last_vectable = header.vectable;
440     s->compression = header.compression;
441     s->block_width = compression_types[header.compression].block_width;
442     s->block_height = compression_types[header.compression].block_height;
443     s->block_type = compression_types[header.compression].block_type;
444
445     if (s->avctx->debug & FF_DEBUG_PICT_INFO)
446         av_log(s->avctx, AV_LOG_INFO, "tables: %d / %d c:%d %dx%d t:%d %s%s%s%s\n",
447             s->last_deltaset, s->last_vectable, s->compression, s->block_width,
448             s->block_height, s->block_type,
449             s->flags & FLAG_KEYFRAME ? " KEY" : "",
450             s->flags & FLAG_INTERFRAME ? " INTER" : "",
451             s->flags & FLAG_SPRITE ? " SPRITE" : "",
452             s->flags & FLAG_INTERPOLATED ? " INTERPOL" : "");
453
454     return header.header_size;
455 }
456
457 static av_cold int truemotion1_decode_init(AVCodecContext *avctx)
458 {
459     TrueMotion1Context *s = avctx->priv_data;
460
461     s->avctx = avctx;
462
463     // FIXME: it may change ?
464 //    if (avctx->bits_per_sample == 24)
465 //        avctx->pix_fmt = PIX_FMT_RGB24;
466 //    else
467 //        avctx->pix_fmt = PIX_FMT_RGB555;
468
469     avcodec_get_frame_defaults(&s->frame);
470     s->frame.data[0] = NULL;
471
472     /* there is a vertical predictor for each pixel in a line; each vertical
473      * predictor is 0 to start with */
474     av_fast_malloc(&s->vert_pred, &s->vert_pred_size, s->avctx->width * sizeof(unsigned int));
475
476     return 0;
477 }
478
479 /*
480 Block decoding order:
481
482 dxi: Y-Y
483 dxic: Y-C-Y
484 dxic2: Y-C-Y-C
485
486 hres,vres,i,i%vres (0 < i < 4)
487 2x2 0: 0 dxic2
488 2x2 1: 1 dxi
489 2x2 2: 0 dxic2
490 2x2 3: 1 dxi
491 2x4 0: 0 dxic2
492 2x4 1: 1 dxi
493 2x4 2: 2 dxi
494 2x4 3: 3 dxi
495 4x2 0: 0 dxic
496 4x2 1: 1 dxi
497 4x2 2: 0 dxic
498 4x2 3: 1 dxi
499 4x4 0: 0 dxic
500 4x4 1: 1 dxi
501 4x4 2: 2 dxi
502 4x4 3: 3 dxi
503 */
504
505 #define GET_NEXT_INDEX() \
506 {\
507     if (index_stream_index >= s->index_stream_size) { \
508         av_log(s->avctx, AV_LOG_INFO, " help! truemotion1 decoder went out of bounds\n"); \
509         return; \
510     } \
511     index = s->index_stream[index_stream_index++] * 4; \
512 }
513
514 #define APPLY_C_PREDICTOR() \
515     if(index > 1023){\
516         av_log(s->avctx, AV_LOG_ERROR, " index %d went out of bounds\n", index); \
517         return; \
518     }\
519     predictor_pair = s->c_predictor_table[index]; \
520     horiz_pred += (predictor_pair >> 1); \
521     if (predictor_pair & 1) { \
522         GET_NEXT_INDEX() \
523         if (!index) { \
524             GET_NEXT_INDEX() \
525             predictor_pair = s->c_predictor_table[index]; \
526             horiz_pred += ((predictor_pair >> 1) * 5); \
527             if (predictor_pair & 1) \
528                 GET_NEXT_INDEX() \
529             else \
530                 index++; \
531         } \
532     } else \
533         index++;
534
535 #define APPLY_C_PREDICTOR_24() \
536     if(index > 1023){\
537         av_log(s->avctx, AV_LOG_ERROR, " index %d went out of bounds\n", index); \
538         return; \
539     }\
540     predictor_pair = s->c_predictor_table[index]; \
541     horiz_pred += (predictor_pair >> 1); \
542     if (predictor_pair & 1) { \
543         GET_NEXT_INDEX() \
544         if (!index) { \
545             GET_NEXT_INDEX() \
546             predictor_pair = s->fat_c_predictor_table[index]; \
547             horiz_pred += (predictor_pair >> 1); \
548             if (predictor_pair & 1) \
549                 GET_NEXT_INDEX() \
550             else \
551                 index++; \
552         } \
553     } else \
554         index++;
555
556
557 #define APPLY_Y_PREDICTOR() \
558     if(index > 1023){\
559         av_log(s->avctx, AV_LOG_ERROR, " index %d went out of bounds\n", index); \
560         return; \
561     }\
562     predictor_pair = s->y_predictor_table[index]; \
563     horiz_pred += (predictor_pair >> 1); \
564     if (predictor_pair & 1) { \
565         GET_NEXT_INDEX() \
566         if (!index) { \
567             GET_NEXT_INDEX() \
568             predictor_pair = s->y_predictor_table[index]; \
569             horiz_pred += ((predictor_pair >> 1) * 5); \
570             if (predictor_pair & 1) \
571                 GET_NEXT_INDEX() \
572             else \
573                 index++; \
574         } \
575     } else \
576         index++;
577
578 #define APPLY_Y_PREDICTOR_24() \
579     if(index > 1023){\
580         av_log(s->avctx, AV_LOG_ERROR, " index %d went out of bounds\n", index); \
581         return; \
582     }\
583     predictor_pair = s->y_predictor_table[index]; \
584     horiz_pred += (predictor_pair >> 1); \
585     if (predictor_pair & 1) { \
586         GET_NEXT_INDEX() \
587         if (!index) { \
588             GET_NEXT_INDEX() \
589             predictor_pair = s->fat_y_predictor_table[index]; \
590             horiz_pred += (predictor_pair >> 1); \
591             if (predictor_pair & 1) \
592                 GET_NEXT_INDEX() \
593             else \
594                 index++; \
595         } \
596     } else \
597         index++;
598
599 #define OUTPUT_PIXEL_PAIR() \
600     *current_pixel_pair = *vert_pred + horiz_pred; \
601     *vert_pred++ = *current_pixel_pair++;
602
603 static void truemotion1_decode_16bit(TrueMotion1Context *s)
604 {
605     int y;
606     int pixels_left;  /* remaining pixels on this line */
607     unsigned int predictor_pair;
608     unsigned int horiz_pred;
609     unsigned int *vert_pred;
610     unsigned int *current_pixel_pair;
611     unsigned char *current_line = s->frame.data[0];
612     int keyframe = s->flags & FLAG_KEYFRAME;
613
614     /* these variables are for managing the stream of macroblock change bits */
615     const unsigned char *mb_change_bits = s->mb_change_bits;
616     unsigned char mb_change_byte;
617     unsigned char mb_change_byte_mask;
618     int mb_change_index;
619
620     /* these variables are for managing the main index stream */
621     int index_stream_index = 0;  /* yes, the index into the index stream */
622     int index;
623
624     /* clean out the line buffer */
625     memset(s->vert_pred, 0, s->avctx->width * sizeof(unsigned int));
626
627     GET_NEXT_INDEX();
628
629     for (y = 0; y < s->avctx->height; y++) {
630
631         /* re-init variables for the next line iteration */
632         horiz_pred = 0;
633         current_pixel_pair = (unsigned int *)current_line;
634         vert_pred = s->vert_pred;
635         mb_change_index = 0;
636         mb_change_byte = mb_change_bits[mb_change_index++];
637         mb_change_byte_mask = 0x01;
638         pixels_left = s->avctx->width;
639
640         while (pixels_left > 0) {
641
642             if (keyframe || ((mb_change_byte & mb_change_byte_mask) == 0)) {
643
644                 switch (y & 3) {
645                 case 0:
646                     /* if macroblock width is 2, apply C-Y-C-Y; else
647                      * apply C-Y-Y */
648                     if (s->block_width == 2) {
649                         APPLY_C_PREDICTOR();
650                         APPLY_Y_PREDICTOR();
651                         OUTPUT_PIXEL_PAIR();
652                         APPLY_C_PREDICTOR();
653                         APPLY_Y_PREDICTOR();
654                         OUTPUT_PIXEL_PAIR();
655                     } else {
656                         APPLY_C_PREDICTOR();
657                         APPLY_Y_PREDICTOR();
658                         OUTPUT_PIXEL_PAIR();
659                         APPLY_Y_PREDICTOR();
660                         OUTPUT_PIXEL_PAIR();
661                     }
662                     break;
663
664                 case 1:
665                 case 3:
666                     /* always apply 2 Y predictors on these iterations */
667                     APPLY_Y_PREDICTOR();
668                     OUTPUT_PIXEL_PAIR();
669                     APPLY_Y_PREDICTOR();
670                     OUTPUT_PIXEL_PAIR();
671                     break;
672
673                 case 2:
674                     /* this iteration might be C-Y-C-Y, Y-Y, or C-Y-Y
675                      * depending on the macroblock type */
676                     if (s->block_type == BLOCK_2x2) {
677                         APPLY_C_PREDICTOR();
678                         APPLY_Y_PREDICTOR();
679                         OUTPUT_PIXEL_PAIR();
680                         APPLY_C_PREDICTOR();
681                         APPLY_Y_PREDICTOR();
682                         OUTPUT_PIXEL_PAIR();
683                     } else if (s->block_type == BLOCK_4x2) {
684                         APPLY_C_PREDICTOR();
685                         APPLY_Y_PREDICTOR();
686                         OUTPUT_PIXEL_PAIR();
687                         APPLY_Y_PREDICTOR();
688                         OUTPUT_PIXEL_PAIR();
689                     } else {
690                         APPLY_Y_PREDICTOR();
691                         OUTPUT_PIXEL_PAIR();
692                         APPLY_Y_PREDICTOR();
693                         OUTPUT_PIXEL_PAIR();
694                     }
695                     break;
696                 }
697
698             } else {
699
700                 /* skip (copy) four pixels, but reassign the horizontal
701                  * predictor */
702                 *vert_pred++ = *current_pixel_pair++;
703                 horiz_pred = *current_pixel_pair - *vert_pred;
704                 *vert_pred++ = *current_pixel_pair++;
705
706             }
707
708             if (!keyframe) {
709                 mb_change_byte_mask <<= 1;
710
711                 /* next byte */
712                 if (!mb_change_byte_mask) {
713                     mb_change_byte = mb_change_bits[mb_change_index++];
714                     mb_change_byte_mask = 0x01;
715                 }
716             }
717
718             pixels_left -= 4;
719         }
720
721         /* next change row */
722         if (((y + 1) & 3) == 0)
723             mb_change_bits += s->mb_change_bits_row_size;
724
725         current_line += s->frame.linesize[0];
726     }
727 }
728
729 static void truemotion1_decode_24bit(TrueMotion1Context *s)
730 {
731     int y;
732     int pixels_left;  /* remaining pixels on this line */
733     unsigned int predictor_pair;
734     unsigned int horiz_pred;
735     unsigned int *vert_pred;
736     unsigned int *current_pixel_pair;
737     unsigned char *current_line = s->frame.data[0];
738     int keyframe = s->flags & FLAG_KEYFRAME;
739
740     /* these variables are for managing the stream of macroblock change bits */
741     const unsigned char *mb_change_bits = s->mb_change_bits;
742     unsigned char mb_change_byte;
743     unsigned char mb_change_byte_mask;
744     int mb_change_index;
745
746     /* these variables are for managing the main index stream */
747     int index_stream_index = 0;  /* yes, the index into the index stream */
748     int index;
749
750     /* clean out the line buffer */
751     memset(s->vert_pred, 0, s->avctx->width * sizeof(unsigned int));
752
753     GET_NEXT_INDEX();
754
755     for (y = 0; y < s->avctx->height; y++) {
756
757         /* re-init variables for the next line iteration */
758         horiz_pred = 0;
759         current_pixel_pair = (unsigned int *)current_line;
760         vert_pred = s->vert_pred;
761         mb_change_index = 0;
762         mb_change_byte = mb_change_bits[mb_change_index++];
763         mb_change_byte_mask = 0x01;
764         pixels_left = s->avctx->width;
765
766         while (pixels_left > 0) {
767
768             if (keyframe || ((mb_change_byte & mb_change_byte_mask) == 0)) {
769
770                 switch (y & 3) {
771                 case 0:
772                     /* if macroblock width is 2, apply C-Y-C-Y; else
773                      * apply C-Y-Y */
774                     if (s->block_width == 2) {
775                         APPLY_C_PREDICTOR_24();
776                         APPLY_Y_PREDICTOR_24();
777                         OUTPUT_PIXEL_PAIR();
778                         APPLY_C_PREDICTOR_24();
779                         APPLY_Y_PREDICTOR_24();
780                         OUTPUT_PIXEL_PAIR();
781                     } else {
782                         APPLY_C_PREDICTOR_24();
783                         APPLY_Y_PREDICTOR_24();
784                         OUTPUT_PIXEL_PAIR();
785                         APPLY_Y_PREDICTOR_24();
786                         OUTPUT_PIXEL_PAIR();
787                     }
788                     break;
789
790                 case 1:
791                 case 3:
792                     /* always apply 2 Y predictors on these iterations */
793                     APPLY_Y_PREDICTOR_24();
794                     OUTPUT_PIXEL_PAIR();
795                     APPLY_Y_PREDICTOR_24();
796                     OUTPUT_PIXEL_PAIR();
797                     break;
798
799                 case 2:
800                     /* this iteration might be C-Y-C-Y, Y-Y, or C-Y-Y
801                      * depending on the macroblock type */
802                     if (s->block_type == BLOCK_2x2) {
803                         APPLY_C_PREDICTOR_24();
804                         APPLY_Y_PREDICTOR_24();
805                         OUTPUT_PIXEL_PAIR();
806                         APPLY_C_PREDICTOR_24();
807                         APPLY_Y_PREDICTOR_24();
808                         OUTPUT_PIXEL_PAIR();
809                     } else if (s->block_type == BLOCK_4x2) {
810                         APPLY_C_PREDICTOR_24();
811                         APPLY_Y_PREDICTOR_24();
812                         OUTPUT_PIXEL_PAIR();
813                         APPLY_Y_PREDICTOR_24();
814                         OUTPUT_PIXEL_PAIR();
815                     } else {
816                         APPLY_Y_PREDICTOR_24();
817                         OUTPUT_PIXEL_PAIR();
818                         APPLY_Y_PREDICTOR_24();
819                         OUTPUT_PIXEL_PAIR();
820                     }
821                     break;
822                 }
823
824             } else {
825
826                 /* skip (copy) four pixels, but reassign the horizontal
827                  * predictor */
828                 *vert_pred++ = *current_pixel_pair++;
829                 horiz_pred = *current_pixel_pair - *vert_pred;
830                 *vert_pred++ = *current_pixel_pair++;
831
832             }
833
834             if (!keyframe) {
835                 mb_change_byte_mask <<= 1;
836
837                 /* next byte */
838                 if (!mb_change_byte_mask) {
839                     mb_change_byte = mb_change_bits[mb_change_index++];
840                     mb_change_byte_mask = 0x01;
841                 }
842             }
843
844             pixels_left -= 2;
845         }
846
847         /* next change row */
848         if (((y + 1) & 3) == 0)
849             mb_change_bits += s->mb_change_bits_row_size;
850
851         current_line += s->frame.linesize[0];
852     }
853 }
854
855
856 static int truemotion1_decode_frame(AVCodecContext *avctx,
857                                     void *data, int *data_size,
858                                     AVPacket *avpkt)
859 {
860     const uint8_t *buf = avpkt->data;
861     int buf_size = avpkt->size;
862     TrueMotion1Context *s = avctx->priv_data;
863
864     s->buf = buf;
865     s->size = buf_size;
866
867     if (truemotion1_decode_header(s) == -1)
868         return -1;
869
870     s->frame.reference = 3;
871     s->frame.buffer_hints = FF_BUFFER_HINTS_VALID |
872         FF_BUFFER_HINTS_PRESERVE | FF_BUFFER_HINTS_REUSABLE;
873     if (avctx->reget_buffer(avctx, &s->frame) < 0) {
874         av_log(s->avctx, AV_LOG_ERROR, "get_buffer() failed\n");
875         return -1;
876     }
877
878     if (compression_types[s->compression].algorithm == ALGO_RGB24H) {
879         truemotion1_decode_24bit(s);
880     } else if (compression_types[s->compression].algorithm != ALGO_NOP) {
881         truemotion1_decode_16bit(s);
882     }
883
884     *data_size = sizeof(AVFrame);
885     *(AVFrame*)data = s->frame;
886
887     /* report that the buffer was completely consumed */
888     return buf_size;
889 }
890
891 static av_cold int truemotion1_decode_end(AVCodecContext *avctx)
892 {
893     TrueMotion1Context *s = avctx->priv_data;
894
895     if (s->frame.data[0])
896         avctx->release_buffer(avctx, &s->frame);
897
898     av_free(s->vert_pred);
899
900     return 0;
901 }
902
903 AVCodec ff_truemotion1_decoder = {
904     .name           = "truemotion1",
905     .type           = AVMEDIA_TYPE_VIDEO,
906     .id             = CODEC_ID_TRUEMOTION1,
907     .priv_data_size = sizeof(TrueMotion1Context),
908     .init           = truemotion1_decode_init,
909     .close          = truemotion1_decode_end,
910     .decode         = truemotion1_decode_frame,
911     .capabilities   = CODEC_CAP_DR1,
912     .long_name      = NULL_IF_CONFIG_SMALL("Duck TrueMotion 1.0"),
913 };