]> git.sesse.net Git - ffmpeg/blob - libavcodec/truemotion1.c
motion estimation bitrate penalty compensation
[ffmpeg] / libavcodec / truemotion1.c
1 /*
2  * Duck TrueMotion 1.0 Decoder
3  * Copyright (C) 2003 Alex Beregszaszi & Mike Melanson
4  *
5  * This library is free software; you can redistribute it and/or
6  * modify it under the terms of the GNU Lesser General Public
7  * License as published by the Free Software Foundation; either
8  * version 2 of the License, or (at your option) any later version.
9  *
10  * This library is distributed in the hope that it will be useful,
11  * but WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * Lesser General Public License for more details.
14  *
15  * You should have received a copy of the GNU Lesser General Public
16  * License along with this library; if not, write to the Free Software
17  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18  */
19
20 /**
21  * @file truemotion1.c
22  * Duck TrueMotion v1 Video Decoder by 
23  * Alex Beregszaszi (alex@fsn.hu) and
24  * Mike Melanson (melanson@pcisys.net)
25  *
26  * The TrueMotion v1 decoder presently only decodes 16-bit TM1 data and
27  * outputs RGB555 (or RGB565) data. 24-bit TM1 data is not supported yet.
28  */
29
30 #include <stdio.h>
31 #include <stdlib.h>
32 #include <string.h>
33 #include <unistd.h>
34
35 #include "common.h"
36 #include "avcodec.h"
37 #include "dsputil.h"
38
39 #include "truemotion1data.h"
40
41 typedef struct TrueMotion1Context {
42     AVCodecContext *avctx;
43     AVFrame frame;
44     AVFrame prev_frame;
45
46     uint8_t *buf;
47     int size;
48
49     uint8_t *mb_change_bits;
50     int mb_change_bits_row_size;
51     uint8_t *index_stream;
52     int index_stream_size;
53
54     int flags;
55     int x, y, w, h;
56     
57     uint32_t y_predictor_table[1024];
58     uint32_t c_predictor_table[1024];
59     uint32_t fat_y_predictor_table[1024];
60     uint32_t fat_c_predictor_table[1024];
61     
62     int compression;
63     int block_type;
64     int block_width;
65     int block_height;
66
67     int16_t ydt[8];
68     int16_t cdt[8];
69     int16_t fat_ydt[8];
70     int16_t fat_cdt[8];
71     
72     int last_deltaset, last_vectable;
73
74     unsigned int *vert_pred;
75
76 } TrueMotion1Context;
77
78 #define FLAG_SPRITE         32
79 #define FLAG_KEYFRAME       16
80 #define FLAG_INTERFRAME      8
81 #define FLAG_INTERPOLATED    4
82
83 struct frame_header {
84     uint8_t header_size;
85     uint8_t compression;
86     uint8_t deltaset;
87     uint8_t vectable;
88     uint16_t ysize;
89     uint16_t xsize;
90     uint16_t checksum;
91     uint8_t version;
92     uint8_t header_type;
93     uint8_t flags;
94     uint8_t control;
95     uint16_t xoffset;
96     uint16_t yoffset;
97     uint16_t width;
98     uint16_t height;
99 };
100
101 #define ALGO_NOP        0
102 #define ALGO_RGB16V     1
103 #define ALGO_RGB16H     2
104 #define ALGO_RGB24H     3
105
106 /* these are the various block sizes that can occupy a 4x4 block */
107 #define BLOCK_2x2  0
108 #define BLOCK_2x4  1
109 #define BLOCK_4x2  2
110 #define BLOCK_4x4  3
111
112 typedef struct comp_types {
113     int algorithm;
114     int block_width; // vres
115     int block_height; // hres
116     int block_type;
117 } comp_types;
118
119 /* { valid for metatype }, algorithm, num of deltas, vert res, horiz res */
120 static comp_types compression_types[17] = {
121     { ALGO_NOP,    0, 0, 0 },
122
123     { ALGO_RGB16V, 4, 4, BLOCK_4x4 },
124     { ALGO_RGB16H, 4, 4, BLOCK_4x4 },
125     { ALGO_RGB16V, 4, 2, BLOCK_4x2 },
126     { ALGO_RGB16H, 4, 2, BLOCK_4x2 },
127
128     { ALGO_RGB16V, 2, 4, BLOCK_2x4 },
129     { ALGO_RGB16H, 2, 4, BLOCK_2x4 },
130     { ALGO_RGB16V, 2, 2, BLOCK_2x2 },
131     { ALGO_RGB16H, 2, 2, BLOCK_2x2 },
132
133     { ALGO_NOP,    4, 4, BLOCK_4x4 },
134     { ALGO_RGB24H, 4, 4, BLOCK_4x4 },
135     { ALGO_NOP,    4, 2, BLOCK_4x2 },
136     { ALGO_RGB24H, 4, 2, BLOCK_4x2 },
137
138     { ALGO_NOP,    2, 4, BLOCK_2x4 },
139     { ALGO_RGB24H, 2, 4, BLOCK_2x4 },
140     { ALGO_NOP,    2, 2, BLOCK_2x2 },
141     { ALGO_RGB24H, 2, 2, BLOCK_2x2 }
142 };
143
144 static void select_delta_tables(TrueMotion1Context *s, int delta_table_index)
145 {
146     int i;
147
148     if (delta_table_index > 3)
149         return;
150
151     memcpy(s->ydt, ydts[delta_table_index], 8 * sizeof(int16_t));
152     memcpy(s->cdt, cdts[delta_table_index], 8 * sizeof(int16_t));
153     memcpy(s->fat_ydt, fat_ydts[delta_table_index], 8 * sizeof(int16_t));
154     memcpy(s->fat_cdt, fat_cdts[delta_table_index], 8 * sizeof(int16_t));
155
156     /* Y skinny deltas need to be halved for some reason; maybe the
157      * skinny Y deltas should be modified */
158     for (i = 0; i < 8; i++)
159     {
160         /* drop the lsb before dividing by 2-- net effect: round down
161          * when dividing a negative number (e.g., -3/2 = -2, not -1) */
162         s->ydt[i] &= 0xFFFE;
163         s->ydt[i] /= 2;
164     }
165 }
166
167 #ifdef WORDS_BIGENDIAN
168 static int make_ydt15_entry(int p2, int p1, int16_t *ydt)
169 #else
170 static int make_ydt15_entry(int p1, int p2, int16_t *ydt)
171 #endif
172 {
173     int lo, hi;
174     
175     lo = ydt[p1];
176     lo += (lo << 5) + (lo << 10);
177     hi = ydt[p2];
178     hi += (hi << 5) + (hi << 10);
179     return ((lo + (hi << 16)) << 1);
180 }
181
182 #ifdef WORDS_BIGENDIAN
183 static int make_cdt15_entry(int p2, int p1, int16_t *cdt)
184 #else
185 static int make_cdt15_entry(int p1, int p2, int16_t *cdt)
186 #endif
187 {
188     int r, b, lo;
189     
190     b = cdt[p2];
191     r = cdt[p1] << 10;
192     lo = b + r;
193     return ((lo + (lo << 16)) << 1);
194 }
195
196 #ifdef WORDS_BIGENDIAN
197 static int make_ydt16_entry(int p2, int p1, int16_t *ydt)
198 #else
199 static int make_ydt16_entry(int p1, int p2, int16_t *ydt)
200 #endif
201 {
202     int lo, hi;
203     
204     lo = ydt[p1];
205     lo += (lo << 6) + (lo << 11);
206     hi = ydt[p2];
207     hi += (hi << 6) + (hi << 11);
208     return ((lo + (hi << 16)) << 1);
209 }
210
211 #ifdef WORDS_BIGENDIAN
212 static int make_cdt16_entry(int p2, int p1, int16_t *cdt)
213 #else
214 static int make_cdt16_entry(int p1, int p2, int16_t *cdt)
215 #endif
216 {
217     int r, b, lo;
218     
219     b = cdt[p2];
220     r = cdt[p1] << 11;
221     lo = b + r;
222     return ((lo + (lo << 16)) << 1);
223 }
224
225 #ifdef WORDS_BIGENDIAN
226 static int make_ydt24_entry(int p2, int p1, int16_t *ydt)
227 #else
228 static int make_ydt24_entry(int p1, int p2, int16_t *ydt)
229 #endif
230 {
231     int lo, hi;
232     
233     lo = ydt[p1];
234     hi = ydt[p2];
235     return ((lo + (hi << 8)) << 1);
236 }
237
238 #ifdef WORDS_BIGENDIAN
239 static int make_cdt24_entry(int p2, int p1, int16_t *cdt)
240 #else
241 static int make_cdt24_entry(int p1, int p2, int16_t *cdt)
242 #endif
243 {
244     int r, b;
245     
246     b = cdt[p2];
247     r = cdt[p1]<<16;
248     return ((b+r) << 1);
249 }
250
251 static void gen_vector_table15(TrueMotion1Context *s, uint8_t *sel_vector_table)
252 {
253     int len, i, j;
254     unsigned char delta_pair;
255     
256     for (i = 0; i < 1024; i += 4)
257     {
258         len = *sel_vector_table++ / 2;
259         for (j = 0; j < len; j++)
260         {
261             delta_pair = *sel_vector_table++;
262             s->y_predictor_table[i+j] = 0xfffffffe & 
263                 make_ydt15_entry(delta_pair >> 4, delta_pair & 0xf, s->ydt);
264             s->c_predictor_table[i+j] = 0xfffffffe & 
265                 make_cdt15_entry(delta_pair >> 4, delta_pair & 0xf, s->cdt);
266         }
267         s->y_predictor_table[i+(j-1)] |= 1;
268         s->c_predictor_table[i+(j-1)] |= 1;
269     }
270 }
271
272 static void gen_vector_table16(TrueMotion1Context *s, uint8_t *sel_vector_table)
273 {
274     int len, i, j;
275     unsigned char delta_pair;
276     
277     for (i = 0; i < 1024; i += 4)
278     {
279         len = *sel_vector_table++ / 2;
280         for (j = 0; j < len; j++)
281         {
282             delta_pair = *sel_vector_table++;
283             s->y_predictor_table[i+j] = 0xfffffffe & 
284                 make_ydt16_entry(delta_pair >> 4, delta_pair & 0xf, s->ydt);
285             s->c_predictor_table[i+j] = 0xfffffffe & 
286                 make_cdt16_entry(delta_pair >> 4, delta_pair & 0xf, s->cdt);
287         }
288         s->y_predictor_table[i+(j-1)] |= 1;
289         s->c_predictor_table[i+(j-1)] |= 1;
290     }
291 }
292
293 static void gen_vector_table24(TrueMotion1Context *s, uint8_t *sel_vector_table)
294 {
295     int len, i, j;
296     unsigned char delta_pair;
297     
298     for (i = 0; i < 1024; i += 4)
299     {
300         len = *sel_vector_table++ / 2;
301         for (j = 0; j < len; j++)
302         {
303             delta_pair = *sel_vector_table++;
304             s->y_predictor_table[i+j] = 0xfffffffe & 
305                 make_ydt24_entry(delta_pair >> 4, delta_pair & 0xf, s->ydt);
306             s->c_predictor_table[i+j] = 0xfffffffe & 
307                 make_cdt24_entry(delta_pair >> 4, delta_pair & 0xf, s->cdt);
308             s->fat_y_predictor_table[i+j] = 0xfffffffe & 
309                 make_ydt24_entry(delta_pair >> 4, delta_pair & 0xf, s->fat_ydt);
310             s->fat_c_predictor_table[i+j] = 0xfffffffe & 
311                 make_cdt24_entry(delta_pair >> 4, delta_pair & 0xf, s->fat_cdt);
312         }
313         s->y_predictor_table[i+(j-1)] |= 1;
314         s->c_predictor_table[i+(j-1)] |= 1;
315         s->fat_y_predictor_table[i+(j-1)] |= 1;
316         s->fat_c_predictor_table[i+(j-1)] |= 1;
317     }
318 }
319
320 /* Returns the number of bytes consumed from the bytestream. Returns -1 if
321  * there was an error while decoding the header */ 
322 static int truemotion1_decode_header(TrueMotion1Context *s)
323 {
324     int i;
325     struct frame_header header;
326     uint8_t header_buffer[128];  /* logical maximum size of the header */
327     uint8_t *sel_vector_table;
328
329     /* There is 1 change bit per 4 pixels, so each change byte represents
330      * 32 pixels; divide width by 4 to obtain the number of change bits and
331      * then round up to the nearest byte. */
332     s->mb_change_bits_row_size = ((s->avctx->width >> 2) + 7) >> 3;
333
334     header.header_size = ((s->buf[0] >> 5) | (s->buf[0] << 3)) & 0x7f;
335     if (s->buf[0] < 0x10)
336     {
337         av_log(s->avctx, AV_LOG_ERROR, "invalid header size (%d)\n", s->buf[0]);
338         return -1;
339     }
340
341     /* unscramble the header bytes with a XOR operation */
342     memset(header_buffer, 0, 128);
343     for (i = 1; i < header.header_size; i++)
344         header_buffer[i - 1] = s->buf[i] ^ s->buf[i + 1];
345
346     header.compression = header_buffer[0];
347     header.deltaset = header_buffer[1];
348     header.vectable = header_buffer[2];
349     header.ysize = LE_16(&header_buffer[3]);
350     header.xsize = LE_16(&header_buffer[5]);
351     header.checksum = LE_16(&header_buffer[7]);
352     header.version = header_buffer[9];
353     header.header_type = header_buffer[10];
354     header.flags = header_buffer[11];
355     header.control = header_buffer[12];
356
357     /* Version 2 */
358     if (header.version >= 2)
359     {
360         if (header.header_type > 3)
361         {
362             av_log(s->avctx, AV_LOG_ERROR, "invalid header type (%d)\n", header.header_type);
363             return -1;
364         } else if ((header.header_type == 2) || (header.header_type == 3)) {
365             s->flags = header.flags;
366             if (!(s->flags & FLAG_INTERFRAME))
367                 s->flags |= FLAG_KEYFRAME;
368         } else
369             s->flags = FLAG_KEYFRAME;
370     } else /* Version 1 */
371         s->flags = FLAG_KEYFRAME;
372     
373     if (s->flags & FLAG_SPRITE) {
374         av_log(s->avctx, AV_LOG_INFO, "SPRITE frame found, please report the sample to the developers\n");
375         s->w = header.width;
376         s->h = header.height;
377         s->x = header.xoffset;
378         s->y = header.yoffset;
379     } else {
380         s->w = header.xsize;
381         s->h = header.ysize;
382         if (header.header_type < 2) {
383             if ((s->w < 213) && (s->h >= 176))
384             {
385                 s->flags |= FLAG_INTERPOLATED;
386                 av_log(s->avctx, AV_LOG_INFO, "INTERPOLATION selected, please report the sample to the developers\n");
387             }
388         }
389     }
390
391     if (header.compression > 17) {
392         av_log(s->avctx, AV_LOG_ERROR, "invalid compression type (%d)\n", header.compression);
393         return -1;
394     }
395     
396     if ((header.deltaset != s->last_deltaset) || 
397         (header.vectable != s->last_vectable))
398         select_delta_tables(s, header.deltaset);
399
400     if ((header.compression & 1) && header.header_type)
401         sel_vector_table = pc_tbl2;
402     else {
403         if (header.vectable < 4)
404             sel_vector_table = tables[header.vectable - 1];
405         else {
406             av_log(s->avctx, AV_LOG_ERROR, "invalid vector table id (%d)\n", header.vectable);
407             return -1;
408         }
409     }
410     
411     // FIXME: where to place this ?!?!
412     if (compression_types[header.compression].algorithm == ALGO_RGB24H)
413         s->avctx->pix_fmt = PIX_FMT_BGR24;
414     else
415         s->avctx->pix_fmt = PIX_FMT_RGB555; // RGB565 is supported aswell
416
417     if ((header.deltaset != s->last_deltaset) || (header.vectable != s->last_vectable))
418     {
419         if (compression_types[header.compression].algorithm == ALGO_RGB24H)
420             gen_vector_table24(s, sel_vector_table);
421         else
422         if (s->avctx->pix_fmt == PIX_FMT_RGB555)
423             gen_vector_table15(s, sel_vector_table);
424         else
425             gen_vector_table16(s, sel_vector_table);
426     }
427
428     /* set up pointers to the other key data chunks */
429     s->mb_change_bits = s->buf + header.header_size;
430     if (s->flags & FLAG_KEYFRAME) {
431         /* no change bits specified for a keyframe; only index bytes */
432         s->index_stream = s->mb_change_bits;
433     } else {
434         /* one change bit per 4x4 block */
435         s->index_stream = s->mb_change_bits + 
436             (s->mb_change_bits_row_size * (s->avctx->height >> 2));
437     }
438     s->index_stream_size = s->size - (s->index_stream - s->buf);
439
440     s->last_deltaset = header.deltaset;
441     s->last_vectable = header.vectable;
442     s->compression = header.compression;
443     s->block_width = compression_types[header.compression].block_width;
444     s->block_height = compression_types[header.compression].block_height;
445     s->block_type = compression_types[header.compression].block_type;
446
447     if (s->avctx->debug & FF_DEBUG_PICT_INFO)
448         av_log(s->avctx, AV_LOG_INFO, "tables: %d / %d c:%d %dx%d t:%d %s%s%s%s\n",
449             s->last_deltaset, s->last_vectable, s->compression, s->block_width,
450             s->block_height, s->block_type,
451             s->flags & FLAG_KEYFRAME ? " KEY" : "",
452             s->flags & FLAG_INTERFRAME ? " INTER" : "",
453             s->flags & FLAG_SPRITE ? " SPRITE" : "",
454             s->flags & FLAG_INTERPOLATED ? " INTERPOL" : "");
455
456     return header.header_size;    
457 }
458
459 static int truemotion1_decode_init(AVCodecContext *avctx)
460 {
461     TrueMotion1Context *s = (TrueMotion1Context *)avctx->priv_data;
462
463     s->avctx = avctx;
464
465     // FIXME: it may change ?
466 //    if (avctx->bits_per_sample == 24)
467 //      avctx->pix_fmt = PIX_FMT_RGB24;
468 //    else
469 //      avctx->pix_fmt = PIX_FMT_RGB555;
470
471     avctx->has_b_frames = 0;
472     s->frame.data[0] = s->prev_frame.data[0] = NULL;
473
474     /* there is a vertical predictor for each pixel in a line; each vertical
475      * predictor is 0 to start with */
476     s->vert_pred = 
477         (unsigned int *)av_malloc(s->avctx->width * sizeof(unsigned short));
478
479     return 0;
480 }
481
482 /*
483 Block decoding order:
484
485 dxi: Y-Y
486 dxic: Y-C-Y
487 dxic2: Y-C-Y-C
488
489 hres,vres,i,i%vres (0 < i < 4)
490 2x2 0: 0 dxic2
491 2x2 1: 1 dxi
492 2x2 2: 0 dxic2
493 2x2 3: 1 dxi
494 2x4 0: 0 dxic2
495 2x4 1: 1 dxi
496 2x4 2: 2 dxi
497 2x4 3: 3 dxi
498 4x2 0: 0 dxic
499 4x2 1: 1 dxi
500 4x2 2: 0 dxic
501 4x2 3: 1 dxi
502 4x4 0: 0 dxic
503 4x4 1: 1 dxi
504 4x4 2: 2 dxi
505 4x4 3: 3 dxi
506 */
507
508 #define GET_NEXT_INDEX() \
509 {\
510     if (index_stream_index >= s->index_stream_size) { \
511         av_log(s->avctx, AV_LOG_INFO, " help! truemotion1 decoder went out of bounds\n"); \
512         return; \
513     } \
514     index = s->index_stream[index_stream_index++] * 4; \
515 }
516
517 #define APPLY_C_PREDICTOR() \
518     predictor_pair = s->c_predictor_table[index]; \
519     horiz_pred += (predictor_pair >> 1); \
520     if (predictor_pair & 1) { \
521         GET_NEXT_INDEX() \
522         if (!index) { \
523             GET_NEXT_INDEX() \
524             predictor_pair = s->c_predictor_table[index]; \
525             horiz_pred += ((predictor_pair >> 1) * 5); \
526             if (predictor_pair & 1) \
527                 GET_NEXT_INDEX() \
528             else \
529                 index++; \
530         } \
531     } else \
532         index++;
533
534 #define APPLY_C_PREDICTOR_24() \
535     predictor_pair = s->c_predictor_table[index]; \
536     c_horiz_pred += (predictor_pair >> 1); \
537     if (predictor_pair & 1) { \
538         GET_NEXT_INDEX() \
539         if (!index) { \
540             GET_NEXT_INDEX() \
541             predictor_pair = s->fat_c_predictor_table[index]; \
542             c_horiz_pred += (predictor_pair >> 1); \
543             if (predictor_pair & 1) \
544                 GET_NEXT_INDEX() \
545             else \
546                 index++; \
547         } \
548     } else \
549         index++; 
550 //    c_last+coff = clast+c_horiz_pred;
551
552
553 #define APPLY_Y_PREDICTOR() \
554     predictor_pair = s->y_predictor_table[index]; \
555     horiz_pred += (predictor_pair >> 1); \
556     if (predictor_pair & 1) { \
557         GET_NEXT_INDEX() \
558         if (!index) { \
559             GET_NEXT_INDEX() \
560             predictor_pair = s->y_predictor_table[index]; \
561             horiz_pred += ((predictor_pair >> 1) * 5); \
562             if (predictor_pair & 1) \
563                 GET_NEXT_INDEX() \
564             else \
565                 index++; \
566         } \
567     } else \
568         index++;
569
570 #define APPLY_Y_PREDICTOR_24() \
571     predictor_pair = s->y_predictor_table[index]; \
572     horiz_pred += (predictor_pair >> 1); \
573     if (predictor_pair & 1) { \
574         GET_NEXT_INDEX() \
575         if (!index) { \
576             GET_NEXT_INDEX() \
577             predictor_pair = s->fat_y_predictor_table[index]; \
578             horiz_pred += (predictor_pair >> 1); \
579             if (predictor_pair & 1) \
580                 GET_NEXT_INDEX() \
581             else \
582                 index++; \
583         } \
584     } else \
585         index++;
586
587 #define OUTPUT_PIXEL_PAIR() \
588     *current_pixel_pair = *vert_pred + horiz_pred; \
589     *vert_pred++ = *current_pixel_pair++; \
590     prev_pixel_pair++;
591
592 static void truemotion1_decode_16bit(TrueMotion1Context *s)
593 {
594     int y;
595     int pixels_left;  /* remaining pixels on this line */
596     unsigned int predictor_pair;
597     unsigned int horiz_pred;
598     unsigned int *vert_pred;
599     unsigned int *current_pixel_pair;
600     unsigned int *prev_pixel_pair;
601     unsigned char *current_line = s->frame.data[0];
602     unsigned char *prev_line = s->prev_frame.data[0];
603     int keyframe = s->flags & FLAG_KEYFRAME;
604
605     /* these variables are for managing the stream of macroblock change bits */
606     unsigned char *mb_change_bits = s->mb_change_bits;
607     unsigned char mb_change_byte;
608     unsigned char mb_change_byte_mask;
609     int mb_change_index;
610
611     /* these variables are for managing the main index stream */
612     int index_stream_index = 0;  /* yes, the index into the index stream */
613     int index;
614
615     /* clean out the line buffer */
616     memset(s->vert_pred, 0, s->avctx->width * sizeof(unsigned short));
617
618     GET_NEXT_INDEX();
619
620     for (y = 0; y < s->avctx->height; y++) {
621
622         /* re-init variables for the next line iteration */
623         horiz_pred = 0;
624         current_pixel_pair = (unsigned int *)current_line;
625         prev_pixel_pair = (unsigned int *)prev_line;
626         vert_pred = s->vert_pred;
627         mb_change_index = 0;
628         mb_change_byte = mb_change_bits[mb_change_index++];
629         mb_change_byte_mask = 0x01;
630         pixels_left = s->avctx->width;
631
632         while (pixels_left > 0) {
633
634             if (keyframe || ((mb_change_byte & mb_change_byte_mask) == 0)) {
635
636                 switch (y & 3) {
637                 case 0:
638                     /* if macroblock width is 2, apply C-Y-C-Y; else 
639                      * apply C-Y-Y */
640                     if (s->block_width == 2) {
641                         APPLY_C_PREDICTOR();
642                         APPLY_Y_PREDICTOR();
643                         OUTPUT_PIXEL_PAIR();
644                         APPLY_C_PREDICTOR();
645                         APPLY_Y_PREDICTOR();
646                         OUTPUT_PIXEL_PAIR();
647                     } else {
648                         APPLY_C_PREDICTOR();
649                         APPLY_Y_PREDICTOR();
650                         OUTPUT_PIXEL_PAIR();
651                         APPLY_Y_PREDICTOR();
652                         OUTPUT_PIXEL_PAIR();
653                     }
654                     break;
655
656                 case 1:
657                 case 3:
658                     /* always apply 2 Y predictors on these iterations */
659                     APPLY_Y_PREDICTOR();
660                     OUTPUT_PIXEL_PAIR();
661                     APPLY_Y_PREDICTOR();
662                     OUTPUT_PIXEL_PAIR();
663                     break;
664
665                 case 2:
666                     /* this iteration might be C-Y-C-Y, Y-Y, or C-Y-Y 
667                      * depending on the macroblock type */
668                     if (s->block_type == BLOCK_2x2) {
669                         APPLY_C_PREDICTOR();
670                         APPLY_Y_PREDICTOR();
671                         OUTPUT_PIXEL_PAIR();
672                         APPLY_C_PREDICTOR();
673                         APPLY_Y_PREDICTOR();
674                         OUTPUT_PIXEL_PAIR();
675                     } else if (s->block_type == BLOCK_4x2) {
676                         APPLY_C_PREDICTOR();
677                         APPLY_Y_PREDICTOR();
678                         OUTPUT_PIXEL_PAIR();
679                         APPLY_Y_PREDICTOR();
680                         OUTPUT_PIXEL_PAIR();
681                     } else {
682                         APPLY_Y_PREDICTOR();
683                         OUTPUT_PIXEL_PAIR();
684                         APPLY_Y_PREDICTOR();
685                         OUTPUT_PIXEL_PAIR();
686                     }
687                     break;
688                 }
689
690             } else {
691
692                 /* skip (copy) four pixels, but reassign the horizontal 
693                  * predictor */
694                 *current_pixel_pair = *prev_pixel_pair++;
695                 *vert_pred++ = *current_pixel_pair++;
696                 *current_pixel_pair = *prev_pixel_pair++;
697                 horiz_pred = *current_pixel_pair - *vert_pred;
698                 *vert_pred++ = *current_pixel_pair++;
699                 
700             }
701
702             if (!keyframe) {
703                 mb_change_byte_mask <<= 1;
704
705                 /* next byte */
706                 if (!mb_change_byte_mask) {
707                     mb_change_byte = mb_change_bits[mb_change_index++];
708                     mb_change_byte_mask = 0x01;
709                 }
710             }
711
712             pixels_left -= 4;
713         }
714
715         /* next change row */
716         if (((y + 1) & 3) == 0)
717             mb_change_bits += s->mb_change_bits_row_size;
718
719         current_line += s->frame.linesize[0];
720         prev_line += s->prev_frame.linesize[0];
721     }
722 }
723
724 static void truemotion1_decode_24bit(TrueMotion1Context *s)
725 {
726     int y;
727     int pixels_left;  /* remaining pixels on this line */
728     unsigned int predictor_pair;
729     unsigned int horiz_pred;
730     unsigned int c_horiz_pred;
731     unsigned int *vert_pred;
732     unsigned int *current_pixel_pair;
733     unsigned int *prev_pixel_pair;
734     unsigned char *current_line = s->frame.data[0];
735     unsigned char *prev_line = s->prev_frame.data[0];
736     int keyframe = s->flags & FLAG_KEYFRAME;
737
738     /* these variables are for managing the stream of macroblock change bits */
739     unsigned char *mb_change_bits = s->mb_change_bits;
740     unsigned char mb_change_byte;
741     unsigned char mb_change_byte_mask;
742     int mb_change_index;
743
744     /* these variables are for managing the main index stream */
745     int index_stream_index = 0;  /* yes, the index into the index stream */
746     int index;
747
748     /* clean out the line buffer */
749     memset(s->vert_pred, 0, s->avctx->width * sizeof(unsigned short));
750
751     GET_NEXT_INDEX();
752
753     for (y = 0; y < s->avctx->height; y++) {
754
755         /* re-init variables for the next line iteration */
756         horiz_pred = c_horiz_pred = 0;
757         current_pixel_pair = (unsigned int *)current_line;
758         prev_pixel_pair = (unsigned int *)prev_line;
759         vert_pred = s->vert_pred;
760         mb_change_index = 0;
761         mb_change_byte = mb_change_bits[mb_change_index++];
762         mb_change_byte_mask = 0x01;
763         pixels_left = s->avctx->width;
764
765         while (pixels_left > 0) {
766
767             if (keyframe || ((mb_change_byte & mb_change_byte_mask) == 0)) {
768
769                 switch (y & 3) {
770                 case 0:
771                     /* if macroblock width is 2, apply C-Y-C-Y; else 
772                      * apply C-Y-Y */
773                     if (s->block_width == 2) {
774                         APPLY_C_PREDICTOR_24();
775                         APPLY_Y_PREDICTOR_24();
776                         OUTPUT_PIXEL_PAIR();
777 //                        OUTPUT_PIXEL_PAIR_24_C();
778                         APPLY_C_PREDICTOR_24();
779                         APPLY_Y_PREDICTOR_24();
780                         OUTPUT_PIXEL_PAIR();
781 //                        OUTPUT_PIXEL_PAIR_24_C();
782                     } else {
783                         APPLY_C_PREDICTOR_24();
784                         APPLY_Y_PREDICTOR_24();
785                         OUTPUT_PIXEL_PAIR();
786 //                        OUTPUT_PIXEL_PAIR_24_C();
787                         APPLY_Y_PREDICTOR_24();
788                         OUTPUT_PIXEL_PAIR();
789 //                        OUTPUT_PIXEL_PAIR_24_C();
790                     }
791                     break;
792
793                 case 1:
794                 case 3:
795                     /* always apply 2 Y predictors on these iterations */
796                     APPLY_Y_PREDICTOR_24();
797                     OUTPUT_PIXEL_PAIR();
798                     APPLY_Y_PREDICTOR_24();
799                     OUTPUT_PIXEL_PAIR();
800                     break;
801
802                 case 2:
803                     /* this iteration might be C-Y-C-Y, Y-Y, or C-Y-Y 
804                      * depending on the macroblock type */
805                     if (s->block_type == BLOCK_2x2) {
806                         APPLY_C_PREDICTOR_24();
807                         APPLY_Y_PREDICTOR_24();
808                         OUTPUT_PIXEL_PAIR();
809 //                        OUTPUT_PIXEL_PAIR_24_C();
810                         APPLY_C_PREDICTOR_24();
811                         APPLY_Y_PREDICTOR_24();
812                         OUTPUT_PIXEL_PAIR();
813 //                        OUTPUT_PIXEL_PAIR_24_C();
814                     } else if (s->block_type == BLOCK_4x2) {
815                         APPLY_C_PREDICTOR_24();
816                         APPLY_Y_PREDICTOR_24();
817                         OUTPUT_PIXEL_PAIR();
818 //                        OUTPUT_PIXEL_PAIR_24_C();
819                         APPLY_Y_PREDICTOR_24();
820                         OUTPUT_PIXEL_PAIR();
821 //                        OUTPUT_PIXEL_PAIR_24_C();
822                     } else {
823                         APPLY_Y_PREDICTOR_24();
824                         OUTPUT_PIXEL_PAIR();
825                         APPLY_Y_PREDICTOR_24();
826                         OUTPUT_PIXEL_PAIR();
827                     }
828                     break;
829                 }
830
831             } else {
832
833                 /* skip (copy) four pixels, but reassign the horizontal 
834                  * predictor */
835                 *current_pixel_pair = *prev_pixel_pair++;
836                 *vert_pred++ = *current_pixel_pair++;
837                 *current_pixel_pair = *prev_pixel_pair++;
838                 horiz_pred = *current_pixel_pair - *vert_pred;
839 //              c_horiz_pred = *current_pixel_pair - *vert_pred;
840                 *vert_pred++ = *current_pixel_pair++;
841                 
842             }
843
844             if (!keyframe) {
845                 mb_change_byte_mask <<= 1;
846
847                 /* next byte */
848                 if (!mb_change_byte_mask) {
849                     mb_change_byte = mb_change_bits[mb_change_index++];
850                     mb_change_byte_mask = 0x01;
851                 }
852             }
853
854             pixels_left -= 4;
855         }
856
857         /* next change row */
858         if (((y + 1) & 3) == 0)
859             mb_change_bits += s->mb_change_bits_row_size;
860
861         current_line += s->frame.linesize[0];
862         prev_line += s->prev_frame.linesize[0];
863     }
864 }
865
866
867 static int truemotion1_decode_frame(AVCodecContext *avctx,
868                                     void *data, int *data_size,
869                                     uint8_t *buf, int buf_size)
870 {
871     TrueMotion1Context *s = (TrueMotion1Context *)avctx->priv_data;
872
873     s->buf = buf;
874     s->size = buf_size;
875
876     if (truemotion1_decode_header(s) == -1)
877         return -1;
878
879     s->frame.reference = 1;
880     if (avctx->get_buffer(avctx, &s->frame) < 0) {
881         av_log(s->avctx, AV_LOG_ERROR, "get_buffer() failed\n");
882         return -1;
883     }
884
885     /* check for a do-nothing frame and copy the previous frame */
886     if (compression_types[s->compression].algorithm == ALGO_NOP)
887     {
888         memcpy(s->frame.data[0], s->prev_frame.data[0],
889             s->frame.linesize[0] * s->avctx->height);
890     } else if (compression_types[s->compression].algorithm == ALGO_RGB24H) {
891         truemotion1_decode_24bit(s);
892     } else {
893         truemotion1_decode_16bit(s);
894     }
895
896     if (s->prev_frame.data[0])
897         avctx->release_buffer(avctx, &s->prev_frame);
898
899     /* shuffle frames */
900     s->prev_frame = s->frame;
901
902     *data_size = sizeof(AVFrame);
903     *(AVFrame*)data = s->frame;
904
905     /* report that the buffer was completely consumed */
906     return buf_size;
907 }
908
909 static int truemotion1_decode_end(AVCodecContext *avctx)
910 {
911     TrueMotion1Context *s = (TrueMotion1Context *)avctx->priv_data;
912
913     /* release the last frame */
914     if (s->prev_frame.data[0])
915         avctx->release_buffer(avctx, &s->prev_frame);
916
917     av_free(s->vert_pred);
918
919     return 0;
920 }
921
922 AVCodec truemotion1_decoder = {
923     "truemotion1",
924     CODEC_TYPE_VIDEO,
925     CODEC_ID_TRUEMOTION1,
926     sizeof(TrueMotion1Context),
927     truemotion1_decode_init,
928     NULL,
929     truemotion1_decode_end,
930     truemotion1_decode_frame,
931     CODEC_CAP_DR1,
932 };