]> git.sesse.net Git - ffmpeg/blob - libavcodec/vc1.c
Move the ratecontrol related code from mpegvideo.h to a separate header file.
[ffmpeg] / libavcodec / vc1.c
1 /*
2  * VC-1 and WMV3 decoder
3  * Copyright (c) 2006 Konstantin Shishkov
4  * Partly based on vc9.c (c) 2005 Anonymous, Alex Beregszaszi, Michael Niedermayer
5  *
6  * This library is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU Lesser General Public
8  * License as published by the Free Software Foundation; either
9  * version 2 of the License, or (at your option) any later version.
10  *
11  * This library is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14  * Lesser General Public License for more details.
15  *
16  * You should have received a copy of the GNU Lesser General Public
17  * License along with this library; if not, write to the Free Software
18  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
19  *
20  */
21
22 /**
23  * @file vc1.c
24  * VC-1 and WMV3 decoder
25  *
26  */
27 #include "common.h"
28 #include "dsputil.h"
29 #include "avcodec.h"
30 #include "mpegvideo.h"
31 #include "vc1data.h"
32 #include "vc1acdata.h"
33
34 #undef NDEBUG
35 #include <assert.h>
36
37 extern const uint32_t ff_table0_dc_lum[120][2], ff_table1_dc_lum[120][2];
38 extern const uint32_t ff_table0_dc_chroma[120][2], ff_table1_dc_chroma[120][2];
39 extern VLC ff_msmp4_dc_luma_vlc[2], ff_msmp4_dc_chroma_vlc[2];
40 #define MB_INTRA_VLC_BITS 9
41 extern VLC ff_msmp4_mb_i_vlc;
42 extern const uint16_t ff_msmp4_mb_i_table[64][2];
43 #define DC_VLC_BITS 9
44 #define AC_VLC_BITS 9
45 static const uint16_t table_mb_intra[64][2];
46
47
48 /** Available Profiles */
49 //@{
50 enum Profile {
51     PROFILE_SIMPLE,
52     PROFILE_MAIN,
53     PROFILE_COMPLEX, ///< TODO: WMV9 specific
54     PROFILE_ADVANCED
55 };
56 //@}
57
58 /** Sequence quantizer mode */
59 //@{
60 enum QuantMode {
61     QUANT_FRAME_IMPLICIT,    ///< Implicitly specified at frame level
62     QUANT_FRAME_EXPLICIT,    ///< Explicitly specified at frame level
63     QUANT_NON_UNIFORM,       ///< Non-uniform quant used for all frames
64     QUANT_UNIFORM            ///< Uniform quant used for all frames
65 };
66 //@}
67
68 /** Where quant can be changed */
69 //@{
70 enum DQProfile {
71     DQPROFILE_FOUR_EDGES,
72     DQPROFILE_DOUBLE_EDGES,
73     DQPROFILE_SINGLE_EDGE,
74     DQPROFILE_ALL_MBS
75 };
76 //@}
77
78 /** @name Where quant can be changed
79  */
80 //@{
81 enum DQSingleEdge {
82     DQSINGLE_BEDGE_LEFT,
83     DQSINGLE_BEDGE_TOP,
84     DQSINGLE_BEDGE_RIGHT,
85     DQSINGLE_BEDGE_BOTTOM
86 };
87 //@}
88
89 /** Which pair of edges is quantized with ALTPQUANT */
90 //@{
91 enum DQDoubleEdge {
92     DQDOUBLE_BEDGE_TOPLEFT,
93     DQDOUBLE_BEDGE_TOPRIGHT,
94     DQDOUBLE_BEDGE_BOTTOMRIGHT,
95     DQDOUBLE_BEDGE_BOTTOMLEFT
96 };
97 //@}
98
99 /** MV modes for P frames */
100 //@{
101 enum MVModes {
102     MV_PMODE_1MV_HPEL_BILIN,
103     MV_PMODE_1MV,
104     MV_PMODE_1MV_HPEL,
105     MV_PMODE_MIXED_MV,
106     MV_PMODE_INTENSITY_COMP
107 };
108 //@}
109
110 /** @name MV types for B frames */
111 //@{
112 enum BMVTypes {
113     BMV_TYPE_BACKWARD,
114     BMV_TYPE_FORWARD,
115     BMV_TYPE_INTERPOLATED
116 };
117 //@}
118
119 /** @name Block types for P/B frames */
120 //@{
121 enum TransformTypes {
122     TT_8X8,
123     TT_8X4_BOTTOM,
124     TT_8X4_TOP,
125     TT_8X4, //Both halves
126     TT_4X8_RIGHT,
127     TT_4X8_LEFT,
128     TT_4X8, //Both halves
129     TT_4X4
130 };
131 //@}
132
133 /** Table for conversion between TTBLK and TTMB */
134 static const int ttblk_to_tt[3][8] = {
135   { TT_8X4, TT_4X8, TT_8X8, TT_4X4, TT_8X4_TOP, TT_8X4_BOTTOM, TT_4X8_RIGHT, TT_4X8_LEFT },
136   { TT_8X8, TT_4X8_RIGHT, TT_4X8_LEFT, TT_4X4, TT_8X4, TT_4X8, TT_8X4_BOTTOM, TT_8X4_TOP },
137   { TT_8X8, TT_4X8, TT_4X4, TT_8X4_BOTTOM, TT_4X8_RIGHT, TT_4X8_LEFT, TT_8X4, TT_8X4_TOP }
138 };
139
140 static const int ttfrm_to_tt[4] = { TT_8X8, TT_8X4, TT_4X8, TT_4X4 };
141
142 /** MV P mode - the 5th element is only used for mode 1 */
143 static const uint8_t mv_pmode_table[2][5] = {
144   { MV_PMODE_1MV_HPEL_BILIN, MV_PMODE_1MV, MV_PMODE_1MV_HPEL, MV_PMODE_INTENSITY_COMP, MV_PMODE_MIXED_MV },
145   { MV_PMODE_1MV, MV_PMODE_MIXED_MV, MV_PMODE_1MV_HPEL, MV_PMODE_INTENSITY_COMP, MV_PMODE_1MV_HPEL_BILIN }
146 };
147 static const uint8_t mv_pmode_table2[2][4] = {
148   { MV_PMODE_1MV_HPEL_BILIN, MV_PMODE_1MV, MV_PMODE_1MV_HPEL, MV_PMODE_MIXED_MV },
149   { MV_PMODE_1MV, MV_PMODE_MIXED_MV, MV_PMODE_1MV_HPEL, MV_PMODE_1MV_HPEL_BILIN }
150 };
151
152 /** One more frame type */
153 #define BI_TYPE 7
154
155 static const int fps_nr[5] = { 24, 25, 30, 50, 60 },
156   fps_dr[2] = { 1000, 1001 };
157 static const uint8_t pquant_table[3][32] = {
158   {  /* Implicit quantizer */
159      0,  1,  2,  3,  4,  5,  6,  7,  8,  6,  7,  8,  9, 10, 11, 12,
160     13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 27, 29, 31
161   },
162   {  /* Explicit quantizer, pquantizer uniform */
163      0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15,
164     16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31
165   },
166   {  /* Explicit quantizer, pquantizer non-uniform */
167      0,  1,  1,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13,
168     14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 29, 31
169   }
170 };
171
172 /** @name VC-1 VLC tables and defines
173  *  @todo TODO move this into the context
174  */
175 //@{
176 #define VC1_BFRACTION_VLC_BITS 7
177 static VLC vc1_bfraction_vlc;
178 #define VC1_IMODE_VLC_BITS 4
179 static VLC vc1_imode_vlc;
180 #define VC1_NORM2_VLC_BITS 3
181 static VLC vc1_norm2_vlc;
182 #define VC1_NORM6_VLC_BITS 9
183 static VLC vc1_norm6_vlc;
184 /* Could be optimized, one table only needs 8 bits */
185 #define VC1_TTMB_VLC_BITS 9 //12
186 static VLC vc1_ttmb_vlc[3];
187 #define VC1_MV_DIFF_VLC_BITS 9 //15
188 static VLC vc1_mv_diff_vlc[4];
189 #define VC1_CBPCY_P_VLC_BITS 9 //14
190 static VLC vc1_cbpcy_p_vlc[4];
191 #define VC1_4MV_BLOCK_PATTERN_VLC_BITS 6
192 static VLC vc1_4mv_block_pattern_vlc[4];
193 #define VC1_TTBLK_VLC_BITS 5
194 static VLC vc1_ttblk_vlc[3];
195 #define VC1_SUBBLKPAT_VLC_BITS 6
196 static VLC vc1_subblkpat_vlc[3];
197
198 static VLC vc1_ac_coeff_table[8];
199 //@}
200
201 enum CodingSet {
202     CS_HIGH_MOT_INTRA = 0,
203     CS_HIGH_MOT_INTER,
204     CS_LOW_MOT_INTRA,
205     CS_LOW_MOT_INTER,
206     CS_MID_RATE_INTRA,
207     CS_MID_RATE_INTER,
208     CS_HIGH_RATE_INTRA,
209     CS_HIGH_RATE_INTER
210 };
211
212 /** @name Overlap conditions for Advanced Profile */
213 //@{
214 enum COTypes {
215     CONDOVER_NONE = 0,
216     CONDOVER_ALL,
217     CONDOVER_SELECT
218 };
219 //@}
220
221
222 /** The VC1 Context
223  * @fixme Change size wherever another size is more efficient
224  * Many members are only used for Advanced Profile
225  */
226 typedef struct VC1Context{
227     MpegEncContext s;
228
229     int bits;
230
231     /** Simple/Main Profile sequence header */
232     //@{
233     int res_sm;           ///< reserved, 2b
234     int res_x8;           ///< reserved
235     int multires;         ///< frame-level RESPIC syntax element present
236     int res_fasttx;       ///< reserved, always 1
237     int res_transtab;     ///< reserved, always 0
238     int rangered;         ///< RANGEREDFRM (range reduction) syntax element present
239                           ///< at frame level
240     int res_rtm_flag;     ///< reserved, set to 1
241     int reserved;         ///< reserved
242     //@}
243
244     /** Advanced Profile */
245     //@{
246     int level;            ///< 3bits, for Advanced/Simple Profile, provided by TS layer
247     int chromaformat;     ///< 2bits, 2=4:2:0, only defined
248     int postprocflag;     ///< Per-frame processing suggestion flag present
249     int broadcast;        ///< TFF/RFF present
250     int interlace;        ///< Progressive/interlaced (RPTFTM syntax element)
251     int tfcntrflag;       ///< TFCNTR present
252     int panscanflag;      ///< NUMPANSCANWIN, TOPLEFT{X,Y}, BOTRIGHT{X,Y} present
253     int extended_dmv;     ///< Additional extended dmv range at P/B frame-level
254     int color_prim;       ///< 8bits, chroma coordinates of the color primaries
255     int transfer_char;    ///< 8bits, Opto-electronic transfer characteristics
256     int matrix_coef;      ///< 8bits, Color primaries->YCbCr transform matrix
257     int hrd_param_flag;   ///< Presence of Hypothetical Reference
258                           ///< Decoder parameters
259     int psf;              ///< Progressive Segmented Frame
260     //@}
261
262     /** Sequence header data for all Profiles
263      * TODO: choose between ints, uint8_ts and monobit flags
264      */
265     //@{
266     int profile;          ///< 2bits, Profile
267     int frmrtq_postproc;  ///< 3bits,
268     int bitrtq_postproc;  ///< 5bits, quantized framerate-based postprocessing strength
269     int fastuvmc;         ///< Rounding of qpel vector to hpel ? (not in Simple)
270     int extended_mv;      ///< Ext MV in P/B (not in Simple)
271     int dquant;           ///< How qscale varies with MBs, 2bits (not in Simple)
272     int vstransform;      ///< variable-size [48]x[48] transform type + info
273     int overlap;          ///< overlapped transforms in use
274     int quantizer_mode;   ///< 2bits, quantizer mode used for sequence, see QUANT_*
275     int finterpflag;      ///< INTERPFRM present
276     //@}
277
278     /** Frame decoding info for all profiles */
279     //@{
280     uint8_t mv_mode;      ///< MV coding monde
281     uint8_t mv_mode2;     ///< Secondary MV coding mode (B frames)
282     int k_x;              ///< Number of bits for MVs (depends on MV range)
283     int k_y;              ///< Number of bits for MVs (depends on MV range)
284     int range_x, range_y; ///< MV range
285     uint8_t pq, altpq;    ///< Current/alternate frame quantizer scale
286     /** pquant parameters */
287     //@{
288     uint8_t dquantfrm;
289     uint8_t dqprofile;
290     uint8_t dqsbedge;
291     uint8_t dqbilevel;
292     //@}
293     /** AC coding set indexes
294      * @see 8.1.1.10, p(1)10
295      */
296     //@{
297     int c_ac_table_index; ///< Chroma index from ACFRM element
298     int y_ac_table_index; ///< Luma index from AC2FRM element
299     //@}
300     int ttfrm;            ///< Transform type info present at frame level
301     uint8_t ttmbf;        ///< Transform type flag
302     uint8_t ttblk4x4;     ///< Value of ttblk which indicates a 4x4 transform
303     int codingset;        ///< index of current table set from 11.8 to use for luma block decoding
304     int codingset2;       ///< index of current table set from 11.8 to use for chroma block decoding
305     int pqindex;          ///< raw pqindex used in coding set selection
306     int a_avail, c_avail;
307     uint8_t *mb_type_base, *mb_type[3];
308
309
310     /** Luma compensation parameters */
311     //@{
312     uint8_t lumscale;
313     uint8_t lumshift;
314     //@}
315     int16_t bfraction;    ///< Relative position % anchors=> how to scale MVs
316     uint8_t halfpq;       ///< Uniform quant over image and qp+.5
317     uint8_t respic;       ///< Frame-level flag for resized images
318     int buffer_fullness;  ///< HRD info
319     /** Ranges:
320      * -# 0 -> [-64n 63.f] x [-32, 31.f]
321      * -# 1 -> [-128, 127.f] x [-64, 63.f]
322      * -# 2 -> [-512, 511.f] x [-128, 127.f]
323      * -# 3 -> [-1024, 1023.f] x [-256, 255.f]
324      */
325     uint8_t mvrange;
326     uint8_t pquantizer;           ///< Uniform (over sequence) quantizer in use
327     VLC *cbpcy_vlc;               ///< CBPCY VLC table
328     int tt_index;                 ///< Index for Transform Type tables
329     uint8_t* mv_type_mb_plane;    ///< bitplane for mv_type == (4MV)
330     uint8_t* direct_mb_plane;     ///< bitplane for "direct" MBs
331     int mv_type_is_raw;           ///< mv type mb plane is not coded
332     int dmb_is_raw;               ///< direct mb plane is raw
333     int skip_is_raw;              ///< skip mb plane is not coded
334     uint8_t luty[256], lutuv[256]; // lookup tables used for intensity compensation
335     int use_ic;                   ///< use intensity compensation in B-frames
336     int rnd;                      ///< rounding control
337
338     /** Frame decoding info for S/M profiles only */
339     //@{
340     uint8_t rangeredfrm; ///< out_sample = CLIP((in_sample-128)*2+128)
341     uint8_t interpfrm;
342     //@}
343
344     /** Frame decoding info for Advanced profile */
345     //@{
346     uint8_t fcm; ///< 0->Progressive, 2->Frame-Interlace, 3->Field-Interlace
347     uint8_t numpanscanwin;
348     uint8_t tfcntr;
349     uint8_t rptfrm, tff, rff;
350     uint16_t topleftx;
351     uint16_t toplefty;
352     uint16_t bottomrightx;
353     uint16_t bottomrighty;
354     uint8_t uvsamp;
355     uint8_t postproc;
356     int hrd_num_leaky_buckets;
357     uint8_t bit_rate_exponent;
358     uint8_t buffer_size_exponent;
359     uint8_t* acpred_plane;       ///< AC prediction flags bitplane
360     int acpred_is_raw;
361     uint8_t* over_flags_plane;   ///< Overflags bitplane
362     int overflg_is_raw;
363     uint8_t condover;
364     uint16_t *hrd_rate, *hrd_buffer;
365     uint8_t *hrd_fullness;
366     uint8_t range_mapy_flag;
367     uint8_t range_mapuv_flag;
368     uint8_t range_mapy;
369     uint8_t range_mapuv;
370     //@}
371
372     int p_frame_skipped;
373     int bi_type;
374 } VC1Context;
375
376 /**
377  * Get unary code of limited length
378  * @fixme FIXME Slow and ugly
379  * @param gb GetBitContext
380  * @param[in] stop The bitstop value (unary code of 1's or 0's)
381  * @param[in] len Maximum length
382  * @return Unary length/index
383  */
384 static int get_prefix(GetBitContext *gb, int stop, int len)
385 {
386 #if 1
387     int i;
388
389     for(i = 0; i < len && get_bits1(gb) != stop; i++);
390     return i;
391 /*  int i = 0, tmp = !stop;
392
393   while (i != len && tmp != stop)
394   {
395     tmp = get_bits(gb, 1);
396     i++;
397   }
398   if (i == len && tmp != stop) return len+1;
399   return i;*/
400 #else
401   unsigned int buf;
402   int log;
403
404   OPEN_READER(re, gb);
405   UPDATE_CACHE(re, gb);
406   buf=GET_CACHE(re, gb); //Still not sure
407   if (stop) buf = ~buf;
408
409   log= av_log2(-buf); //FIXME: -?
410   if (log < limit){
411     LAST_SKIP_BITS(re, gb, log+1);
412     CLOSE_READER(re, gb);
413     return log;
414   }
415
416   LAST_SKIP_BITS(re, gb, limit);
417   CLOSE_READER(re, gb);
418   return limit;
419 #endif
420 }
421
422 static inline int decode210(GetBitContext *gb){
423     int n;
424     n = get_bits1(gb);
425     if (n == 1)
426         return 0;
427     else
428         return 2 - get_bits1(gb);
429 }
430
431 /**
432  * Init VC-1 specific tables and VC1Context members
433  * @param v The VC1Context to initialize
434  * @return Status
435  */
436 static int vc1_init_common(VC1Context *v)
437 {
438     static int done = 0;
439     int i = 0;
440
441     v->hrd_rate = v->hrd_buffer = NULL;
442
443     /* VLC tables */
444     if(!done)
445     {
446         done = 1;
447         init_vlc(&vc1_bfraction_vlc, VC1_BFRACTION_VLC_BITS, 23,
448                  vc1_bfraction_bits, 1, 1,
449                  vc1_bfraction_codes, 1, 1, 1);
450         init_vlc(&vc1_norm2_vlc, VC1_NORM2_VLC_BITS, 4,
451                  vc1_norm2_bits, 1, 1,
452                  vc1_norm2_codes, 1, 1, 1);
453         init_vlc(&vc1_norm6_vlc, VC1_NORM6_VLC_BITS, 64,
454                  vc1_norm6_bits, 1, 1,
455                  vc1_norm6_codes, 2, 2, 1);
456         init_vlc(&vc1_imode_vlc, VC1_IMODE_VLC_BITS, 7,
457                  vc1_imode_bits, 1, 1,
458                  vc1_imode_codes, 1, 1, 1);
459         for (i=0; i<3; i++)
460         {
461             init_vlc(&vc1_ttmb_vlc[i], VC1_TTMB_VLC_BITS, 16,
462                      vc1_ttmb_bits[i], 1, 1,
463                      vc1_ttmb_codes[i], 2, 2, 1);
464             init_vlc(&vc1_ttblk_vlc[i], VC1_TTBLK_VLC_BITS, 8,
465                      vc1_ttblk_bits[i], 1, 1,
466                      vc1_ttblk_codes[i], 1, 1, 1);
467             init_vlc(&vc1_subblkpat_vlc[i], VC1_SUBBLKPAT_VLC_BITS, 15,
468                      vc1_subblkpat_bits[i], 1, 1,
469                      vc1_subblkpat_codes[i], 1, 1, 1);
470         }
471         for(i=0; i<4; i++)
472         {
473             init_vlc(&vc1_4mv_block_pattern_vlc[i], VC1_4MV_BLOCK_PATTERN_VLC_BITS, 16,
474                      vc1_4mv_block_pattern_bits[i], 1, 1,
475                      vc1_4mv_block_pattern_codes[i], 1, 1, 1);
476             init_vlc(&vc1_cbpcy_p_vlc[i], VC1_CBPCY_P_VLC_BITS, 64,
477                      vc1_cbpcy_p_bits[i], 1, 1,
478                      vc1_cbpcy_p_codes[i], 2, 2, 1);
479             init_vlc(&vc1_mv_diff_vlc[i], VC1_MV_DIFF_VLC_BITS, 73,
480                      vc1_mv_diff_bits[i], 1, 1,
481                      vc1_mv_diff_codes[i], 2, 2, 1);
482         }
483         for(i=0; i<8; i++)
484             init_vlc(&vc1_ac_coeff_table[i], AC_VLC_BITS, vc1_ac_sizes[i],
485                      &vc1_ac_tables[i][0][1], 8, 4,
486                      &vc1_ac_tables[i][0][0], 8, 4, 1);
487         init_vlc(&ff_msmp4_mb_i_vlc, MB_INTRA_VLC_BITS, 64,
488                  &ff_msmp4_mb_i_table[0][1], 4, 2,
489                  &ff_msmp4_mb_i_table[0][0], 4, 2, 1);
490     }
491
492     /* Other defaults */
493     v->pq = -1;
494     v->mvrange = 0; /* 7.1.1.18, p80 */
495
496     return 0;
497 }
498
499 /***********************************************************************/
500 /**
501  * @defgroup bitplane VC9 Bitplane decoding
502  * @see 8.7, p56
503  * @{
504  */
505
506 /** @addtogroup bitplane
507  * Imode types
508  * @{
509  */
510 enum Imode {
511     IMODE_RAW,
512     IMODE_NORM2,
513     IMODE_DIFF2,
514     IMODE_NORM6,
515     IMODE_DIFF6,
516     IMODE_ROWSKIP,
517     IMODE_COLSKIP
518 };
519 /** @} */ //imode defines
520
521 /** Decode rows by checking if they are skipped
522  * @param plane Buffer to store decoded bits
523  * @param[in] width Width of this buffer
524  * @param[in] height Height of this buffer
525  * @param[in] stride of this buffer
526  */
527 static void decode_rowskip(uint8_t* plane, int width, int height, int stride, GetBitContext *gb){
528     int x, y;
529
530     for (y=0; y<height; y++){
531         if (!get_bits(gb, 1)) //rowskip
532             memset(plane, 0, width);
533         else
534             for (x=0; x<width; x++)
535                 plane[x] = get_bits(gb, 1);
536         plane += stride;
537     }
538 }
539
540 /** Decode columns by checking if they are skipped
541  * @param plane Buffer to store decoded bits
542  * @param[in] width Width of this buffer
543  * @param[in] height Height of this buffer
544  * @param[in] stride of this buffer
545  * @fixme FIXME: Optimize
546  */
547 static void decode_colskip(uint8_t* plane, int width, int height, int stride, GetBitContext *gb){
548     int x, y;
549
550     for (x=0; x<width; x++){
551         if (!get_bits(gb, 1)) //colskip
552             for (y=0; y<height; y++)
553                 plane[y*stride] = 0;
554         else
555             for (y=0; y<height; y++)
556                 plane[y*stride] = get_bits(gb, 1);
557         plane ++;
558     }
559 }
560
561 /** Decode a bitplane's bits
562  * @param bp Bitplane where to store the decode bits
563  * @param v VC-1 context for bit reading and logging
564  * @return Status
565  * @fixme FIXME: Optimize
566  */
567 static int bitplane_decoding(uint8_t* data, int *raw_flag, VC1Context *v)
568 {
569     GetBitContext *gb = &v->s.gb;
570
571     int imode, x, y, code, offset;
572     uint8_t invert, *planep = data;
573     int width, height, stride;
574
575     width = v->s.mb_width;
576     height = v->s.mb_height;
577     stride = v->s.mb_stride;
578     invert = get_bits(gb, 1);
579     imode = get_vlc2(gb, vc1_imode_vlc.table, VC1_IMODE_VLC_BITS, 1);
580
581     *raw_flag = 0;
582     switch (imode)
583     {
584     case IMODE_RAW:
585         //Data is actually read in the MB layer (same for all tests == "raw")
586         *raw_flag = 1; //invert ignored
587         return invert;
588     case IMODE_DIFF2:
589     case IMODE_NORM2:
590         if ((height * width) & 1)
591         {
592             *planep++ = get_bits(gb, 1);
593             offset = 1;
594         }
595         else offset = 0;
596         // decode bitplane as one long line
597         for (y = offset; y < height * width; y += 2) {
598             code = get_vlc2(gb, vc1_norm2_vlc.table, VC1_NORM2_VLC_BITS, 1);
599             *planep++ = code & 1;
600             offset++;
601             if(offset == width) {
602                 offset = 0;
603                 planep += stride - width;
604             }
605             *planep++ = code >> 1;
606             offset++;
607             if(offset == width) {
608                 offset = 0;
609                 planep += stride - width;
610             }
611         }
612         break;
613     case IMODE_DIFF6:
614     case IMODE_NORM6:
615         if(!(height % 3) && (width % 3)) { // use 2x3 decoding
616             for(y = 0; y < height; y+= 3) {
617                 for(x = width & 1; x < width; x += 2) {
618                     code = get_vlc2(gb, vc1_norm6_vlc.table, VC1_NORM6_VLC_BITS, 2);
619                     if(code < 0){
620                         av_log(v->s.avctx, AV_LOG_DEBUG, "invalid NORM-6 VLC\n");
621                         return -1;
622                     }
623                     planep[x + 0] = (code >> 0) & 1;
624                     planep[x + 1] = (code >> 1) & 1;
625                     planep[x + 0 + stride] = (code >> 2) & 1;
626                     planep[x + 1 + stride] = (code >> 3) & 1;
627                     planep[x + 0 + stride * 2] = (code >> 4) & 1;
628                     planep[x + 1 + stride * 2] = (code >> 5) & 1;
629                 }
630                 planep += stride * 3;
631             }
632             if(width & 1) decode_colskip(data, 1, height, stride, &v->s.gb);
633         } else { // 3x2
634             planep += (height & 1) * stride;
635             for(y = height & 1; y < height; y += 2) {
636                 for(x = width % 3; x < width; x += 3) {
637                     code = get_vlc2(gb, vc1_norm6_vlc.table, VC1_NORM6_VLC_BITS, 2);
638                     if(code < 0){
639                         av_log(v->s.avctx, AV_LOG_DEBUG, "invalid NORM-6 VLC\n");
640                         return -1;
641                     }
642                     planep[x + 0] = (code >> 0) & 1;
643                     planep[x + 1] = (code >> 1) & 1;
644                     planep[x + 2] = (code >> 2) & 1;
645                     planep[x + 0 + stride] = (code >> 3) & 1;
646                     planep[x + 1 + stride] = (code >> 4) & 1;
647                     planep[x + 2 + stride] = (code >> 5) & 1;
648                 }
649                 planep += stride * 2;
650             }
651             x = width % 3;
652             if(x) decode_colskip(data  ,             x, height    , stride, &v->s.gb);
653             if(height & 1) decode_rowskip(data+x, width - x, 1, stride, &v->s.gb);
654         }
655         break;
656     case IMODE_ROWSKIP:
657         decode_rowskip(data, width, height, stride, &v->s.gb);
658         break;
659     case IMODE_COLSKIP:
660         decode_colskip(data, width, height, stride, &v->s.gb);
661         break;
662     default: break;
663     }
664
665     /* Applying diff operator */
666     if (imode == IMODE_DIFF2 || imode == IMODE_DIFF6)
667     {
668         planep = data;
669         planep[0] ^= invert;
670         for (x=1; x<width; x++)
671             planep[x] ^= planep[x-1];
672         for (y=1; y<height; y++)
673         {
674             planep += stride;
675             planep[0] ^= planep[-stride];
676             for (x=1; x<width; x++)
677             {
678                 if (planep[x-1] != planep[x-stride]) planep[x] ^= invert;
679                 else                                 planep[x] ^= planep[x-1];
680             }
681         }
682     }
683     else if (invert)
684     {
685         planep = data;
686         for (x=0; x<stride*height; x++) planep[x] = !planep[x]; //FIXME stride
687     }
688     return (imode<<1) + invert;
689 }
690
691 /** @} */ //Bitplane group
692
693 /***********************************************************************/
694 /** VOP Dquant decoding
695  * @param v VC-1 Context
696  */
697 static int vop_dquant_decoding(VC1Context *v)
698 {
699     GetBitContext *gb = &v->s.gb;
700     int pqdiff;
701
702     //variable size
703     if (v->dquant == 2)
704     {
705         pqdiff = get_bits(gb, 3);
706         if (pqdiff == 7) v->altpq = get_bits(gb, 5);
707         else v->altpq = v->pq + pqdiff + 1;
708     }
709     else
710     {
711         v->dquantfrm = get_bits(gb, 1);
712         if ( v->dquantfrm )
713         {
714             v->dqprofile = get_bits(gb, 2);
715             switch (v->dqprofile)
716             {
717             case DQPROFILE_SINGLE_EDGE:
718             case DQPROFILE_DOUBLE_EDGES:
719                 v->dqsbedge = get_bits(gb, 2);
720                 break;
721             case DQPROFILE_ALL_MBS:
722                 v->dqbilevel = get_bits(gb, 1);
723             default: break; //Forbidden ?
724             }
725             if (v->dqbilevel || v->dqprofile != DQPROFILE_ALL_MBS)
726             {
727                 pqdiff = get_bits(gb, 3);
728                 if (pqdiff == 7) v->altpq = get_bits(gb, 5);
729                 else v->altpq = v->pq + pqdiff + 1;
730             }
731         }
732     }
733     return 0;
734 }
735
736 /** Put block onto picture
737  */
738 static void vc1_put_block(VC1Context *v, DCTELEM block[6][64])
739 {
740     uint8_t *Y;
741     int ys, us, vs;
742     DSPContext *dsp = &v->s.dsp;
743
744     if(v->rangeredfrm) {
745         int i, j, k;
746         for(k = 0; k < 6; k++)
747             for(j = 0; j < 8; j++)
748                 for(i = 0; i < 8; i++)
749                     block[k][i + j*8] = ((block[k][i + j*8] - 128) << 1) + 128;
750
751     }
752     ys = v->s.current_picture.linesize[0];
753     us = v->s.current_picture.linesize[1];
754     vs = v->s.current_picture.linesize[2];
755     Y = v->s.dest[0];
756
757     dsp->put_pixels_clamped(block[0], Y, ys);
758     dsp->put_pixels_clamped(block[1], Y + 8, ys);
759     Y += ys * 8;
760     dsp->put_pixels_clamped(block[2], Y, ys);
761     dsp->put_pixels_clamped(block[3], Y + 8, ys);
762
763     if(!(v->s.flags & CODEC_FLAG_GRAY)) {
764         dsp->put_pixels_clamped(block[4], v->s.dest[1], us);
765         dsp->put_pixels_clamped(block[5], v->s.dest[2], vs);
766     }
767 }
768
769 /** Do motion compensation over 1 macroblock
770  * Mostly adapted hpel_motion and qpel_motion from mpegvideo.c
771  */
772 static void vc1_mc_1mv(VC1Context *v, int dir)
773 {
774     MpegEncContext *s = &v->s;
775     DSPContext *dsp = &v->s.dsp;
776     uint8_t *srcY, *srcU, *srcV;
777     int dxy, uvdxy, mx, my, uvmx, uvmy, src_x, src_y, uvsrc_x, uvsrc_y;
778
779     if(!v->s.last_picture.data[0])return;
780
781     mx = s->mv[dir][0][0];
782     my = s->mv[dir][0][1];
783
784     // store motion vectors for further use in B frames
785     if(s->pict_type == P_TYPE) {
786         s->current_picture.motion_val[1][s->block_index[0]][0] = mx;
787         s->current_picture.motion_val[1][s->block_index[0]][1] = my;
788     }
789     uvmx = (mx + ((mx & 3) == 3)) >> 1;
790     uvmy = (my + ((my & 3) == 3)) >> 1;
791     if(!dir) {
792         srcY = s->last_picture.data[0];
793         srcU = s->last_picture.data[1];
794         srcV = s->last_picture.data[2];
795     } else {
796         srcY = s->next_picture.data[0];
797         srcU = s->next_picture.data[1];
798         srcV = s->next_picture.data[2];
799     }
800
801     src_x = s->mb_x * 16 + (mx >> 2);
802     src_y = s->mb_y * 16 + (my >> 2);
803     uvsrc_x = s->mb_x * 8 + (uvmx >> 2);
804     uvsrc_y = s->mb_y * 8 + (uvmy >> 2);
805
806     src_x   = clip(  src_x, -16, s->mb_width  * 16);
807     src_y   = clip(  src_y, -16, s->mb_height * 16);
808     uvsrc_x = clip(uvsrc_x,  -8, s->mb_width  *  8);
809     uvsrc_y = clip(uvsrc_y,  -8, s->mb_height *  8);
810
811     srcY += src_y * s->linesize + src_x;
812     srcU += uvsrc_y * s->uvlinesize + uvsrc_x;
813     srcV += uvsrc_y * s->uvlinesize + uvsrc_x;
814
815     /* for grayscale we should not try to read from unknown area */
816     if(s->flags & CODEC_FLAG_GRAY) {
817         srcU = s->edge_emu_buffer + 18 * s->linesize;
818         srcV = s->edge_emu_buffer + 18 * s->linesize;
819     }
820
821     if(v->rangeredfrm || (v->mv_mode == MV_PMODE_INTENSITY_COMP)
822        || (unsigned)(src_x - s->mspel) > s->h_edge_pos - (mx&3) - 16 - s->mspel*3
823        || (unsigned)(src_y - s->mspel) > s->v_edge_pos - (my&3) - 16 - s->mspel*3){
824         uint8_t *uvbuf= s->edge_emu_buffer + 19 * s->linesize;
825
826         srcY -= s->mspel * (1 + s->linesize);
827         ff_emulated_edge_mc(s->edge_emu_buffer, srcY, s->linesize, 17+s->mspel*2, 17+s->mspel*2,
828                             src_x - s->mspel, src_y - s->mspel, s->h_edge_pos, s->v_edge_pos);
829         srcY = s->edge_emu_buffer;
830         ff_emulated_edge_mc(uvbuf     , srcU, s->uvlinesize, 8+1, 8+1,
831                             uvsrc_x, uvsrc_y, s->h_edge_pos >> 1, s->v_edge_pos >> 1);
832         ff_emulated_edge_mc(uvbuf + 16, srcV, s->uvlinesize, 8+1, 8+1,
833                             uvsrc_x, uvsrc_y, s->h_edge_pos >> 1, s->v_edge_pos >> 1);
834         srcU = uvbuf;
835         srcV = uvbuf + 16;
836         /* if we deal with range reduction we need to scale source blocks */
837         if(v->rangeredfrm) {
838             int i, j;
839             uint8_t *src, *src2;
840
841             src = srcY;
842             for(j = 0; j < 17 + s->mspel*2; j++) {
843                 for(i = 0; i < 17 + s->mspel*2; i++) src[i] = ((src[i] - 128) >> 1) + 128;
844                 src += s->linesize;
845             }
846             src = srcU; src2 = srcV;
847             for(j = 0; j < 9; j++) {
848                 for(i = 0; i < 9; i++) {
849                     src[i] = ((src[i] - 128) >> 1) + 128;
850                     src2[i] = ((src2[i] - 128) >> 1) + 128;
851                 }
852                 src += s->uvlinesize;
853                 src2 += s->uvlinesize;
854             }
855         }
856         /* if we deal with intensity compensation we need to scale source blocks */
857         if(v->mv_mode == MV_PMODE_INTENSITY_COMP) {
858             int i, j;
859             uint8_t *src, *src2;
860
861             src = srcY;
862             for(j = 0; j < 17 + s->mspel*2; j++) {
863                 for(i = 0; i < 17 + s->mspel*2; i++) src[i] = v->luty[src[i]];
864                 src += s->linesize;
865             }
866             src = srcU; src2 = srcV;
867             for(j = 0; j < 9; j++) {
868                 for(i = 0; i < 9; i++) {
869                     src[i] = v->lutuv[src[i]];
870                     src2[i] = v->lutuv[src2[i]];
871                 }
872                 src += s->uvlinesize;
873                 src2 += s->uvlinesize;
874             }
875         }
876         srcY += s->mspel * (1 + s->linesize);
877     }
878
879     if(v->fastuvmc) {
880         uvmx = uvmx + ((uvmx<0)?(uvmx&1):-(uvmx&1));
881         uvmy = uvmy + ((uvmy<0)?(uvmy&1):-(uvmy&1));
882     }
883
884     if(s->mspel) {
885         dxy = ((my & 3) << 2) | (mx & 3);
886         dsp->put_vc1_mspel_pixels_tab[dxy](s->dest[0]    , srcY    , s->linesize, v->rnd);
887         dsp->put_vc1_mspel_pixels_tab[dxy](s->dest[0] + 8, srcY + 8, s->linesize, v->rnd);
888         srcY += s->linesize * 8;
889         dsp->put_vc1_mspel_pixels_tab[dxy](s->dest[0] + 8 * s->linesize    , srcY    , s->linesize, v->rnd);
890         dsp->put_vc1_mspel_pixels_tab[dxy](s->dest[0] + 8 * s->linesize + 8, srcY + 8, s->linesize, v->rnd);
891     } else { // hpel mc - always used for luma
892         dxy = (my & 2) | ((mx & 2) >> 1);
893
894         if(!v->rnd)
895             dsp->put_pixels_tab[0][dxy](s->dest[0], srcY, s->linesize, 16);
896         else
897             dsp->put_no_rnd_pixels_tab[0][dxy](s->dest[0], srcY, s->linesize, 16);
898     }
899
900     if(s->flags & CODEC_FLAG_GRAY) return;
901     /* Chroma MC always uses qpel bilinear */
902     uvdxy = ((uvmy & 3) << 2) | (uvmx & 3);
903     uvmx = (uvmx&3)<<1;
904     uvmy = (uvmy&3)<<1;
905     if(!v->rnd){
906         dsp->put_h264_chroma_pixels_tab[0](s->dest[1], srcU, s->uvlinesize, 8, uvmx, uvmy);
907         dsp->put_h264_chroma_pixels_tab[0](s->dest[2], srcV, s->uvlinesize, 8, uvmx, uvmy);
908     }else{
909         dsp->put_no_rnd_h264_chroma_pixels_tab[0](s->dest[1], srcU, s->uvlinesize, 8, uvmx, uvmy);
910         dsp->put_no_rnd_h264_chroma_pixels_tab[0](s->dest[2], srcV, s->uvlinesize, 8, uvmx, uvmy);
911     }
912 }
913
914 /** Do motion compensation for 4-MV macroblock - luminance block
915  */
916 static void vc1_mc_4mv_luma(VC1Context *v, int n)
917 {
918     MpegEncContext *s = &v->s;
919     DSPContext *dsp = &v->s.dsp;
920     uint8_t *srcY;
921     int dxy, mx, my, src_x, src_y;
922     int off;
923
924     if(!v->s.last_picture.data[0])return;
925     mx = s->mv[0][n][0];
926     my = s->mv[0][n][1];
927     srcY = s->last_picture.data[0];
928
929     off = s->linesize * 4 * (n&2) + (n&1) * 8;
930
931     src_x = s->mb_x * 16 + (n&1) * 8 + (mx >> 2);
932     src_y = s->mb_y * 16 + (n&2) * 4 + (my >> 2);
933
934     src_x   = clip(  src_x, -16, s->mb_width  * 16);
935     src_y   = clip(  src_y, -16, s->mb_height * 16);
936
937     srcY += src_y * s->linesize + src_x;
938
939     if(v->rangeredfrm || (v->mv_mode == MV_PMODE_INTENSITY_COMP)
940        || (unsigned)(src_x - s->mspel) > s->h_edge_pos - (mx&3) - 8 - s->mspel*2
941        || (unsigned)(src_y - s->mspel) > s->v_edge_pos - (my&3) - 8 - s->mspel*2){
942         srcY -= s->mspel * (1 + s->linesize);
943         ff_emulated_edge_mc(s->edge_emu_buffer, srcY, s->linesize, 9+s->mspel*2, 9+s->mspel*2,
944                             src_x - s->mspel, src_y - s->mspel, s->h_edge_pos, s->v_edge_pos);
945         srcY = s->edge_emu_buffer;
946         /* if we deal with range reduction we need to scale source blocks */
947         if(v->rangeredfrm) {
948             int i, j;
949             uint8_t *src;
950
951             src = srcY;
952             for(j = 0; j < 9 + s->mspel*2; j++) {
953                 for(i = 0; i < 9 + s->mspel*2; i++) src[i] = ((src[i] - 128) >> 1) + 128;
954                 src += s->linesize;
955             }
956         }
957         /* if we deal with intensity compensation we need to scale source blocks */
958         if(v->mv_mode == MV_PMODE_INTENSITY_COMP) {
959             int i, j;
960             uint8_t *src;
961
962             src = srcY;
963             for(j = 0; j < 9 + s->mspel*2; j++) {
964                 for(i = 0; i < 9 + s->mspel*2; i++) src[i] = v->luty[src[i]];
965                 src += s->linesize;
966             }
967         }
968         srcY += s->mspel * (1 + s->linesize);
969     }
970
971     if(s->mspel) {
972         dxy = ((my & 3) << 2) | (mx & 3);
973         dsp->put_vc1_mspel_pixels_tab[dxy](s->dest[0] + off, srcY, s->linesize, v->rnd);
974     } else { // hpel mc - always used for luma
975         dxy = (my & 2) | ((mx & 2) >> 1);
976         if(!v->rnd)
977             dsp->put_pixels_tab[1][dxy](s->dest[0] + off, srcY, s->linesize, 8);
978         else
979             dsp->put_no_rnd_pixels_tab[1][dxy](s->dest[0] + off, srcY, s->linesize, 8);
980     }
981 }
982
983 static inline int median4(int a, int b, int c, int d)
984 {
985     if(a < b) {
986         if(c < d) return (FFMIN(b, d) + FFMAX(a, c)) / 2;
987         else      return (FFMIN(b, c) + FFMAX(a, d)) / 2;
988     } else {
989         if(c < d) return (FFMIN(a, d) + FFMAX(b, c)) / 2;
990         else      return (FFMIN(a, c) + FFMAX(b, d)) / 2;
991     }
992 }
993
994
995 /** Do motion compensation for 4-MV macroblock - both chroma blocks
996  */
997 static void vc1_mc_4mv_chroma(VC1Context *v)
998 {
999     MpegEncContext *s = &v->s;
1000     DSPContext *dsp = &v->s.dsp;
1001     uint8_t *srcU, *srcV;
1002     int uvdxy, uvmx, uvmy, uvsrc_x, uvsrc_y;
1003     int i, idx, tx = 0, ty = 0;
1004     int mvx[4], mvy[4], intra[4];
1005     static const int count[16] = { 0, 1, 1, 2, 1, 2, 2, 3, 1, 2, 2, 3, 2, 3, 3, 4};
1006
1007     if(!v->s.last_picture.data[0])return;
1008     if(s->flags & CODEC_FLAG_GRAY) return;
1009
1010     for(i = 0; i < 4; i++) {
1011         mvx[i] = s->mv[0][i][0];
1012         mvy[i] = s->mv[0][i][1];
1013         intra[i] = v->mb_type[0][s->block_index[i]];
1014     }
1015
1016     /* calculate chroma MV vector from four luma MVs */
1017     idx = (intra[3] << 3) | (intra[2] << 2) | (intra[1] << 1) | intra[0];
1018     if(!idx) { // all blocks are inter
1019         tx = median4(mvx[0], mvx[1], mvx[2], mvx[3]);
1020         ty = median4(mvy[0], mvy[1], mvy[2], mvy[3]);
1021     } else if(count[idx] == 1) { // 3 inter blocks
1022         switch(idx) {
1023         case 0x1:
1024             tx = mid_pred(mvx[1], mvx[2], mvx[3]);
1025             ty = mid_pred(mvy[1], mvy[2], mvy[3]);
1026             break;
1027         case 0x2:
1028             tx = mid_pred(mvx[0], mvx[2], mvx[3]);
1029             ty = mid_pred(mvy[0], mvy[2], mvy[3]);
1030             break;
1031         case 0x4:
1032             tx = mid_pred(mvx[0], mvx[1], mvx[3]);
1033             ty = mid_pred(mvy[0], mvy[1], mvy[3]);
1034             break;
1035         case 0x8:
1036             tx = mid_pred(mvx[0], mvx[1], mvx[2]);
1037             ty = mid_pred(mvy[0], mvy[1], mvy[2]);
1038             break;
1039         }
1040     } else if(count[idx] == 2) {
1041         int t1 = 0, t2 = 0;
1042         for(i=0; i<3;i++) if(!intra[i]) {t1 = i; break;}
1043         for(i= t1+1; i<4; i++)if(!intra[i]) {t2 = i; break;}
1044         tx = (mvx[t1] + mvx[t2]) / 2;
1045         ty = (mvy[t1] + mvy[t2]) / 2;
1046     } else
1047         return; //no need to do MC for inter blocks
1048
1049     s->current_picture.motion_val[1][s->block_index[0]][0] = tx;
1050     s->current_picture.motion_val[1][s->block_index[0]][1] = ty;
1051     uvmx = (tx + ((tx&3) == 3)) >> 1;
1052     uvmy = (ty + ((ty&3) == 3)) >> 1;
1053
1054     uvsrc_x = s->mb_x * 8 + (uvmx >> 2);
1055     uvsrc_y = s->mb_y * 8 + (uvmy >> 2);
1056
1057     uvsrc_x = clip(uvsrc_x,  -8, s->mb_width  *  8);
1058     uvsrc_y = clip(uvsrc_y,  -8, s->mb_height *  8);
1059     srcU = s->last_picture.data[1] + uvsrc_y * s->uvlinesize + uvsrc_x;
1060     srcV = s->last_picture.data[2] + uvsrc_y * s->uvlinesize + uvsrc_x;
1061     if(v->rangeredfrm || (v->mv_mode == MV_PMODE_INTENSITY_COMP)
1062        || (unsigned)uvsrc_x > (s->h_edge_pos >> 1) - 9
1063        || (unsigned)uvsrc_y > (s->v_edge_pos >> 1) - 9){
1064         ff_emulated_edge_mc(s->edge_emu_buffer     , srcU, s->uvlinesize, 8+1, 8+1,
1065                             uvsrc_x, uvsrc_y, s->h_edge_pos >> 1, s->v_edge_pos >> 1);
1066         ff_emulated_edge_mc(s->edge_emu_buffer + 16, srcV, s->uvlinesize, 8+1, 8+1,
1067                             uvsrc_x, uvsrc_y, s->h_edge_pos >> 1, s->v_edge_pos >> 1);
1068         srcU = s->edge_emu_buffer;
1069         srcV = s->edge_emu_buffer + 16;
1070
1071         /* if we deal with range reduction we need to scale source blocks */
1072         if(v->rangeredfrm) {
1073             int i, j;
1074             uint8_t *src, *src2;
1075
1076             src = srcU; src2 = srcV;
1077             for(j = 0; j < 9; j++) {
1078                 for(i = 0; i < 9; i++) {
1079                     src[i] = ((src[i] - 128) >> 1) + 128;
1080                     src2[i] = ((src2[i] - 128) >> 1) + 128;
1081                 }
1082                 src += s->uvlinesize;
1083                 src2 += s->uvlinesize;
1084             }
1085         }
1086         /* if we deal with intensity compensation we need to scale source blocks */
1087         if(v->mv_mode == MV_PMODE_INTENSITY_COMP) {
1088             int i, j;
1089             uint8_t *src, *src2;
1090
1091             src = srcU; src2 = srcV;
1092             for(j = 0; j < 9; j++) {
1093                 for(i = 0; i < 9; i++) {
1094                     src[i] = v->lutuv[src[i]];
1095                     src2[i] = v->lutuv[src2[i]];
1096                 }
1097                 src += s->uvlinesize;
1098                 src2 += s->uvlinesize;
1099             }
1100         }
1101     }
1102
1103     if(v->fastuvmc) {
1104         uvmx = uvmx + ((uvmx<0)?(uvmx&1):-(uvmx&1));
1105         uvmy = uvmy + ((uvmy<0)?(uvmy&1):-(uvmy&1));
1106     }
1107
1108     /* Chroma MC always uses qpel bilinear */
1109     uvdxy = ((uvmy & 3) << 2) | (uvmx & 3);
1110     uvmx = (uvmx&3)<<1;
1111     uvmy = (uvmy&3)<<1;
1112     if(!v->rnd){
1113         dsp->put_h264_chroma_pixels_tab[0](s->dest[1], srcU, s->uvlinesize, 8, uvmx, uvmy);
1114         dsp->put_h264_chroma_pixels_tab[0](s->dest[2], srcV, s->uvlinesize, 8, uvmx, uvmy);
1115     }else{
1116         dsp->put_no_rnd_h264_chroma_pixels_tab[0](s->dest[1], srcU, s->uvlinesize, 8, uvmx, uvmy);
1117         dsp->put_no_rnd_h264_chroma_pixels_tab[0](s->dest[2], srcV, s->uvlinesize, 8, uvmx, uvmy);
1118     }
1119 }
1120
1121 static int decode_sequence_header_adv(VC1Context *v, GetBitContext *gb);
1122
1123 /**
1124  * Decode Simple/Main Profiles sequence header
1125  * @see Figure 7-8, p16-17
1126  * @param avctx Codec context
1127  * @param gb GetBit context initialized from Codec context extra_data
1128  * @return Status
1129  */
1130 static int decode_sequence_header(AVCodecContext *avctx, GetBitContext *gb)
1131 {
1132     VC1Context *v = avctx->priv_data;
1133
1134     av_log(avctx, AV_LOG_DEBUG, "Header: %0X\n", show_bits(gb, 32));
1135     v->profile = get_bits(gb, 2);
1136     if (v->profile == 2)
1137     {
1138         av_log(avctx, AV_LOG_ERROR, "Profile value 2 is forbidden (and WMV3 Complex Profile is unsupported)\n");
1139         return -1;
1140     }
1141
1142     if (v->profile == PROFILE_ADVANCED)
1143     {
1144         return decode_sequence_header_adv(v, gb);
1145     }
1146     else
1147     {
1148         v->res_sm = get_bits(gb, 2); //reserved
1149         if (v->res_sm)
1150         {
1151             av_log(avctx, AV_LOG_ERROR,
1152                    "Reserved RES_SM=%i is forbidden\n", v->res_sm);
1153             return -1;
1154         }
1155     }
1156
1157     // (fps-2)/4 (->30)
1158     v->frmrtq_postproc = get_bits(gb, 3); //common
1159     // (bitrate-32kbps)/64kbps
1160     v->bitrtq_postproc = get_bits(gb, 5); //common
1161     v->s.loop_filter = get_bits(gb, 1); //common
1162     if(v->s.loop_filter == 1 && v->profile == PROFILE_SIMPLE)
1163     {
1164         av_log(avctx, AV_LOG_ERROR,
1165                "LOOPFILTER shell not be enabled in simple profile\n");
1166     }
1167
1168     v->res_x8 = get_bits(gb, 1); //reserved
1169     if (v->res_x8)
1170     {
1171         av_log(avctx, AV_LOG_ERROR,
1172                "1 for reserved RES_X8 is forbidden\n");
1173         //return -1;
1174     }
1175     v->multires = get_bits(gb, 1);
1176     v->res_fasttx = get_bits(gb, 1);
1177     if (!v->res_fasttx)
1178     {
1179         av_log(avctx, AV_LOG_ERROR,
1180                "0 for reserved RES_FASTTX is forbidden\n");
1181         //return -1;
1182     }
1183
1184     v->fastuvmc =  get_bits(gb, 1); //common
1185     if (!v->profile && !v->fastuvmc)
1186     {
1187         av_log(avctx, AV_LOG_ERROR,
1188                "FASTUVMC unavailable in Simple Profile\n");
1189         return -1;
1190     }
1191     v->extended_mv =  get_bits(gb, 1); //common
1192     if (!v->profile && v->extended_mv)
1193     {
1194         av_log(avctx, AV_LOG_ERROR,
1195                "Extended MVs unavailable in Simple Profile\n");
1196         return -1;
1197     }
1198     v->dquant =  get_bits(gb, 2); //common
1199     v->vstransform =  get_bits(gb, 1); //common
1200
1201     v->res_transtab = get_bits(gb, 1);
1202     if (v->res_transtab)
1203     {
1204         av_log(avctx, AV_LOG_ERROR,
1205                "1 for reserved RES_TRANSTAB is forbidden\n");
1206         return -1;
1207     }
1208
1209     v->overlap = get_bits(gb, 1); //common
1210
1211     v->s.resync_marker = get_bits(gb, 1);
1212     v->rangered = get_bits(gb, 1);
1213     if (v->rangered && v->profile == PROFILE_SIMPLE)
1214     {
1215         av_log(avctx, AV_LOG_INFO,
1216                "RANGERED should be set to 0 in simple profile\n");
1217     }
1218
1219     v->s.max_b_frames = avctx->max_b_frames = get_bits(gb, 3); //common
1220     v->quantizer_mode = get_bits(gb, 2); //common
1221
1222     v->finterpflag = get_bits(gb, 1); //common
1223     v->res_rtm_flag = get_bits(gb, 1); //reserved
1224     if (!v->res_rtm_flag)
1225     {
1226 //            av_log(avctx, AV_LOG_ERROR,
1227 //                   "0 for reserved RES_RTM_FLAG is forbidden\n");
1228         av_log(avctx, AV_LOG_ERROR,
1229                "Old WMV3 version detected, only I-frames will be decoded\n");
1230         //return -1;
1231     }
1232     av_log(avctx, AV_LOG_DEBUG,
1233                "Profile %i:\nfrmrtq_postproc=%i, bitrtq_postproc=%i\n"
1234                "LoopFilter=%i, MultiRes=%i, FastUVMC=%i, Extended MV=%i\n"
1235                "Rangered=%i, VSTransform=%i, Overlap=%i, SyncMarker=%i\n"
1236                "DQuant=%i, Quantizer mode=%i, Max B frames=%i\n",
1237                v->profile, v->frmrtq_postproc, v->bitrtq_postproc,
1238                v->s.loop_filter, v->multires, v->fastuvmc, v->extended_mv,
1239                v->rangered, v->vstransform, v->overlap, v->s.resync_marker,
1240                v->dquant, v->quantizer_mode, avctx->max_b_frames
1241                );
1242     return 0;
1243 }
1244
1245 static int decode_sequence_header_adv(VC1Context *v, GetBitContext *gb)
1246 {
1247     v->res_rtm_flag = 1;
1248     v->level = get_bits(gb, 3);
1249     if(v->level >= 5)
1250     {
1251         av_log(v->s.avctx, AV_LOG_ERROR, "Reserved LEVEL %i\n",v->level);
1252     }
1253     v->chromaformat = get_bits(gb, 2);
1254     if (v->chromaformat != 1)
1255     {
1256         av_log(v->s.avctx, AV_LOG_ERROR,
1257                "Only 4:2:0 chroma format supported\n");
1258         return -1;
1259     }
1260
1261     // (fps-2)/4 (->30)
1262     v->frmrtq_postproc = get_bits(gb, 3); //common
1263     // (bitrate-32kbps)/64kbps
1264     v->bitrtq_postproc = get_bits(gb, 5); //common
1265     v->postprocflag = get_bits(gb, 1); //common
1266
1267     v->s.avctx->coded_width = (get_bits(gb, 12) + 1) << 1;
1268     v->s.avctx->coded_height = (get_bits(gb, 12) + 1) << 1;
1269     v->broadcast = get_bits1(gb);
1270     v->interlace = get_bits1(gb);
1271     v->tfcntrflag = get_bits1(gb);
1272     v->finterpflag = get_bits1(gb);
1273     get_bits1(gb); // reserved
1274     v->psf = get_bits1(gb);
1275     if(v->psf) { //PsF, 6.1.13
1276         av_log(v->s.avctx, AV_LOG_ERROR, "Progressive Segmented Frame mode: not supported (yet)\n");
1277         return -1;
1278     }
1279     if(get_bits1(gb)) { //Display Info - decoding is not affected by it
1280         int w, h, ar = 0;
1281         av_log(v->s.avctx, AV_LOG_INFO, "Display extended info:\n");
1282         w = get_bits(gb, 14);
1283         h = get_bits(gb, 14);
1284         av_log(v->s.avctx, AV_LOG_INFO, "Display dimensions: %ix%i\n", w, h);
1285         //TODO: store aspect ratio in AVCodecContext
1286         if(get_bits1(gb))
1287             ar = get_bits(gb, 4);
1288         if(ar == 15) {
1289             w = get_bits(gb, 8);
1290             h = get_bits(gb, 8);
1291         }
1292
1293         if(get_bits1(gb)){ //framerate stuff
1294             if(get_bits1(gb)) {
1295                 get_bits(gb, 16);
1296             } else {
1297                 get_bits(gb, 8);
1298                 get_bits(gb, 4);
1299             }
1300         }
1301
1302         if(get_bits1(gb)){
1303             v->color_prim = get_bits(gb, 8);
1304             v->transfer_char = get_bits(gb, 8);
1305             v->matrix_coef = get_bits(gb, 8);
1306         }
1307     }
1308
1309     v->hrd_param_flag = get_bits1(gb);
1310     if(v->hrd_param_flag) {
1311         int i;
1312         v->hrd_num_leaky_buckets = get_bits(gb, 5);
1313         get_bits(gb, 4); //bitrate exponent
1314         get_bits(gb, 4); //buffer size exponent
1315         for(i = 0; i < v->hrd_num_leaky_buckets; i++) {
1316             get_bits(gb, 16); //hrd_rate[n]
1317             get_bits(gb, 16); //hrd_buffer[n]
1318         }
1319     }
1320     return 0;
1321 }
1322
1323 static int decode_entry_point(AVCodecContext *avctx, GetBitContext *gb)
1324 {
1325     VC1Context *v = avctx->priv_data;
1326     int i;
1327
1328     av_log(avctx, AV_LOG_DEBUG, "Entry point: %08X\n", show_bits_long(gb, 32));
1329     get_bits1(gb); // broken link
1330     avctx->max_b_frames = 1 - get_bits1(gb); // 'closed entry' also signalize possible B-frames
1331     v->panscanflag = get_bits1(gb);
1332     get_bits1(gb); // refdist flag
1333     v->s.loop_filter = get_bits1(gb);
1334     v->fastuvmc = get_bits1(gb);
1335     v->extended_mv = get_bits1(gb);
1336     v->dquant = get_bits(gb, 2);
1337     v->vstransform = get_bits1(gb);
1338     v->overlap = get_bits1(gb);
1339     v->quantizer_mode = get_bits(gb, 2);
1340
1341     if(v->hrd_param_flag){
1342         for(i = 0; i < v->hrd_num_leaky_buckets; i++) {
1343             get_bits(gb, 8); //hrd_full[n]
1344         }
1345     }
1346
1347     if(get_bits1(gb)){
1348         avctx->coded_width = (get_bits(gb, 12)+1)<<1;
1349         avctx->coded_height = (get_bits(gb, 12)+1)<<1;
1350     }
1351     if(v->extended_mv)
1352         v->extended_dmv = get_bits1(gb);
1353     if(get_bits1(gb)) {
1354         av_log(avctx, AV_LOG_ERROR, "Luma scaling is not supported, expect wrong picture\n");
1355         skip_bits(gb, 3); // Y range, ignored for now
1356     }
1357     if(get_bits1(gb)) {
1358         av_log(avctx, AV_LOG_ERROR, "Chroma scaling is not supported, expect wrong picture\n");
1359         skip_bits(gb, 3); // UV range, ignored for now
1360     }
1361
1362     return 0;
1363 }
1364
1365 static int vc1_parse_frame_header(VC1Context *v, GetBitContext* gb)
1366 {
1367     int pqindex, lowquant, status;
1368
1369     if(v->finterpflag) v->interpfrm = get_bits(gb, 1);
1370     skip_bits(gb, 2); //framecnt unused
1371     v->rangeredfrm = 0;
1372     if (v->rangered) v->rangeredfrm = get_bits(gb, 1);
1373     v->s.pict_type = get_bits(gb, 1);
1374     if (v->s.avctx->max_b_frames) {
1375         if (!v->s.pict_type) {
1376             if (get_bits(gb, 1)) v->s.pict_type = I_TYPE;
1377             else v->s.pict_type = B_TYPE;
1378         } else v->s.pict_type = P_TYPE;
1379     } else v->s.pict_type = v->s.pict_type ? P_TYPE : I_TYPE;
1380
1381     v->bi_type = 0;
1382     if(v->s.pict_type == B_TYPE) {
1383         v->bfraction = get_vlc2(gb, vc1_bfraction_vlc.table, VC1_BFRACTION_VLC_BITS, 1);
1384         v->bfraction = vc1_bfraction_lut[v->bfraction];
1385         if(v->bfraction == 0) {
1386             v->s.pict_type = BI_TYPE;
1387         }
1388     }
1389     if(v->s.pict_type == I_TYPE || v->s.pict_type == BI_TYPE)
1390         get_bits(gb, 7); // skip buffer fullness
1391
1392     /* calculate RND */
1393     if(v->s.pict_type == I_TYPE || v->s.pict_type == BI_TYPE)
1394         v->rnd = 1;
1395     if(v->s.pict_type == P_TYPE)
1396         v->rnd ^= 1;
1397
1398     /* Quantizer stuff */
1399     pqindex = get_bits(gb, 5);
1400     if (v->quantizer_mode == QUANT_FRAME_IMPLICIT)
1401         v->pq = pquant_table[0][pqindex];
1402     else
1403         v->pq = pquant_table[1][pqindex];
1404
1405     v->pquantizer = 1;
1406     if (v->quantizer_mode == QUANT_FRAME_IMPLICIT)
1407         v->pquantizer = pqindex < 9;
1408     if (v->quantizer_mode == QUANT_NON_UNIFORM)
1409         v->pquantizer = 0;
1410     v->pqindex = pqindex;
1411     if (pqindex < 9) v->halfpq = get_bits(gb, 1);
1412     else v->halfpq = 0;
1413     if (v->quantizer_mode == QUANT_FRAME_EXPLICIT)
1414         v->pquantizer = get_bits(gb, 1);
1415     v->dquantfrm = 0;
1416     if (v->extended_mv == 1) v->mvrange = get_prefix(gb, 0, 3);
1417     v->k_x = v->mvrange + 9 + (v->mvrange >> 1); //k_x can be 9 10 12 13
1418     v->k_y = v->mvrange + 8; //k_y can be 8 9 10 11
1419     v->range_x = 1 << (v->k_x - 1);
1420     v->range_y = 1 << (v->k_y - 1);
1421     if (v->profile == PROFILE_ADVANCED)
1422     {
1423         if (v->postprocflag) v->postproc = get_bits(gb, 1);
1424     }
1425     else
1426         if (v->multires && v->s.pict_type != B_TYPE) v->respic = get_bits(gb, 2);
1427
1428 //av_log(v->s.avctx, AV_LOG_INFO, "%c Frame: QP=[%i]%i (+%i/2) %i\n",
1429 //        (v->s.pict_type == P_TYPE) ? 'P' : ((v->s.pict_type == I_TYPE) ? 'I' : 'B'), pqindex, v->pq, v->halfpq, v->rangeredfrm);
1430
1431     if(v->s.pict_type == I_TYPE || v->s.pict_type == P_TYPE) v->use_ic = 0;
1432
1433     switch(v->s.pict_type) {
1434     case P_TYPE:
1435         if (v->pq < 5) v->tt_index = 0;
1436         else if(v->pq < 13) v->tt_index = 1;
1437         else v->tt_index = 2;
1438
1439         lowquant = (v->pq > 12) ? 0 : 1;
1440         v->mv_mode = mv_pmode_table[lowquant][get_prefix(gb, 1, 4)];
1441         if (v->mv_mode == MV_PMODE_INTENSITY_COMP)
1442         {
1443             int scale, shift, i;
1444             v->mv_mode2 = mv_pmode_table2[lowquant][get_prefix(gb, 1, 3)];
1445             v->lumscale = get_bits(gb, 6);
1446             v->lumshift = get_bits(gb, 6);
1447             v->use_ic = 1;
1448             /* fill lookup tables for intensity compensation */
1449             if(!v->lumscale) {
1450                 scale = -64;
1451                 shift = (255 - v->lumshift * 2) << 6;
1452                 if(v->lumshift > 31)
1453                     shift += 128 << 6;
1454             } else {
1455                 scale = v->lumscale + 32;
1456                 if(v->lumshift > 31)
1457                     shift = (v->lumshift - 64) << 6;
1458                 else
1459                     shift = v->lumshift << 6;
1460             }
1461             for(i = 0; i < 256; i++) {
1462                 v->luty[i] = clip_uint8((scale * i + shift + 32) >> 6);
1463                 v->lutuv[i] = clip_uint8((scale * (i - 128) + 128*64 + 32) >> 6);
1464             }
1465         }
1466         if(v->mv_mode == MV_PMODE_1MV_HPEL || v->mv_mode == MV_PMODE_1MV_HPEL_BILIN)
1467             v->s.quarter_sample = 0;
1468         else if(v->mv_mode == MV_PMODE_INTENSITY_COMP) {
1469             if(v->mv_mode2 == MV_PMODE_1MV_HPEL || v->mv_mode2 == MV_PMODE_1MV_HPEL_BILIN)
1470                 v->s.quarter_sample = 0;
1471             else
1472                 v->s.quarter_sample = 1;
1473         } else
1474             v->s.quarter_sample = 1;
1475         v->s.mspel = !(v->mv_mode == MV_PMODE_1MV_HPEL_BILIN || (v->mv_mode == MV_PMODE_INTENSITY_COMP && v->mv_mode2 == MV_PMODE_1MV_HPEL_BILIN));
1476
1477         if ((v->mv_mode == MV_PMODE_INTENSITY_COMP &&
1478                  v->mv_mode2 == MV_PMODE_MIXED_MV)
1479                 || v->mv_mode == MV_PMODE_MIXED_MV)
1480         {
1481             status = bitplane_decoding(v->mv_type_mb_plane, &v->mv_type_is_raw, v);
1482             if (status < 0) return -1;
1483             av_log(v->s.avctx, AV_LOG_DEBUG, "MB MV Type plane encoding: "
1484                    "Imode: %i, Invert: %i\n", status>>1, status&1);
1485         } else {
1486             v->mv_type_is_raw = 0;
1487             memset(v->mv_type_mb_plane, 0, v->s.mb_stride * v->s.mb_height);
1488         }
1489         status = bitplane_decoding(v->s.mbskip_table, &v->skip_is_raw, v);
1490         if (status < 0) return -1;
1491         av_log(v->s.avctx, AV_LOG_DEBUG, "MB Skip plane encoding: "
1492                "Imode: %i, Invert: %i\n", status>>1, status&1);
1493
1494         /* Hopefully this is correct for P frames */
1495         v->s.mv_table_index = get_bits(gb, 2); //but using vc1_ tables
1496         v->cbpcy_vlc = &vc1_cbpcy_p_vlc[get_bits(gb, 2)];
1497
1498         if (v->dquant)
1499         {
1500             av_log(v->s.avctx, AV_LOG_DEBUG, "VOP DQuant info\n");
1501             vop_dquant_decoding(v);
1502         }
1503
1504         v->ttfrm = 0; //FIXME Is that so ?
1505         if (v->vstransform)
1506         {
1507             v->ttmbf = get_bits(gb, 1);
1508             if (v->ttmbf)
1509             {
1510                 v->ttfrm = ttfrm_to_tt[get_bits(gb, 2)];
1511             }
1512         } else {
1513             v->ttmbf = 1;
1514             v->ttfrm = TT_8X8;
1515         }
1516         break;
1517     case B_TYPE:
1518         if (v->pq < 5) v->tt_index = 0;
1519         else if(v->pq < 13) v->tt_index = 1;
1520         else v->tt_index = 2;
1521
1522         lowquant = (v->pq > 12) ? 0 : 1;
1523         v->mv_mode = get_bits1(gb) ? MV_PMODE_1MV : MV_PMODE_1MV_HPEL_BILIN;
1524         v->s.quarter_sample = (v->mv_mode == MV_PMODE_1MV);
1525         v->s.mspel = v->s.quarter_sample;
1526
1527         status = bitplane_decoding(v->direct_mb_plane, &v->dmb_is_raw, v);
1528         if (status < 0) return -1;
1529         av_log(v->s.avctx, AV_LOG_DEBUG, "MB Direct Type plane encoding: "
1530                "Imode: %i, Invert: %i\n", status>>1, status&1);
1531         status = bitplane_decoding(v->s.mbskip_table, &v->skip_is_raw, v);
1532         if (status < 0) return -1;
1533         av_log(v->s.avctx, AV_LOG_DEBUG, "MB Skip plane encoding: "
1534                "Imode: %i, Invert: %i\n", status>>1, status&1);
1535
1536         v->s.mv_table_index = get_bits(gb, 2);
1537         v->cbpcy_vlc = &vc1_cbpcy_p_vlc[get_bits(gb, 2)];
1538
1539         if (v->dquant)
1540         {
1541             av_log(v->s.avctx, AV_LOG_DEBUG, "VOP DQuant info\n");
1542             vop_dquant_decoding(v);
1543         }
1544
1545         v->ttfrm = 0;
1546         if (v->vstransform)
1547         {
1548             v->ttmbf = get_bits(gb, 1);
1549             if (v->ttmbf)
1550             {
1551                 v->ttfrm = ttfrm_to_tt[get_bits(gb, 2)];
1552             }
1553         } else {
1554             v->ttmbf = 1;
1555             v->ttfrm = TT_8X8;
1556         }
1557         break;
1558     }
1559
1560     /* AC Syntax */
1561     v->c_ac_table_index = decode012(gb);
1562     if (v->s.pict_type == I_TYPE || v->s.pict_type == BI_TYPE)
1563     {
1564         v->y_ac_table_index = decode012(gb);
1565     }
1566     /* DC Syntax */
1567     v->s.dc_table_index = get_bits(gb, 1);
1568
1569     if(v->s.pict_type == BI_TYPE) {
1570         v->s.pict_type = B_TYPE;
1571         v->bi_type = 1;
1572     }
1573     return 0;
1574 }
1575
1576 static int vc1_parse_frame_header_adv(VC1Context *v, GetBitContext* gb)
1577 {
1578     int fcm;
1579     int pqindex, lowquant;
1580     int status;
1581
1582     v->p_frame_skipped = 0;
1583
1584     if(v->interlace)
1585         fcm = decode012(gb);
1586     switch(get_prefix(gb, 0, 4)) {
1587     case 0:
1588         v->s.pict_type = P_TYPE;
1589         break;
1590     case 1:
1591         v->s.pict_type = B_TYPE;
1592         return -1;
1593 //      break;
1594     case 2:
1595         v->s.pict_type = I_TYPE;
1596         break;
1597     case 3:
1598         v->s.pict_type = BI_TYPE;
1599         break;
1600     case 4:
1601         v->s.pict_type = P_TYPE; // skipped pic
1602         v->p_frame_skipped = 1;
1603         return 0;
1604     }
1605     if(v->tfcntrflag)
1606         get_bits(gb, 8);
1607     if(v->broadcast) {
1608         if(!v->interlace || v->panscanflag) {
1609             get_bits(gb, 2);
1610         } else {
1611             get_bits1(gb);
1612             get_bits1(gb);
1613         }
1614     }
1615     if(v->panscanflag) {
1616         //...
1617     }
1618     v->rnd = get_bits1(gb);
1619     if(v->interlace)
1620         v->uvsamp = get_bits1(gb);
1621     if(v->finterpflag) v->interpfrm = get_bits(gb, 1);
1622     pqindex = get_bits(gb, 5);
1623     v->pqindex = pqindex;
1624     if (v->quantizer_mode == QUANT_FRAME_IMPLICIT)
1625         v->pq = pquant_table[0][pqindex];
1626     else
1627         v->pq = pquant_table[1][pqindex];
1628
1629     v->pquantizer = 1;
1630     if (v->quantizer_mode == QUANT_FRAME_IMPLICIT)
1631         v->pquantizer = pqindex < 9;
1632     if (v->quantizer_mode == QUANT_NON_UNIFORM)
1633         v->pquantizer = 0;
1634     v->pqindex = pqindex;
1635     if (pqindex < 9) v->halfpq = get_bits(gb, 1);
1636     else v->halfpq = 0;
1637     if (v->quantizer_mode == QUANT_FRAME_EXPLICIT)
1638         v->pquantizer = get_bits(gb, 1);
1639
1640     switch(v->s.pict_type) {
1641     case I_TYPE:
1642     case BI_TYPE:
1643         status = bitplane_decoding(v->acpred_plane, &v->acpred_is_raw, v);
1644         if (status < 0) return -1;
1645         av_log(v->s.avctx, AV_LOG_DEBUG, "ACPRED plane encoding: "
1646                 "Imode: %i, Invert: %i\n", status>>1, status&1);
1647         v->condover = CONDOVER_NONE;
1648         if(v->overlap && v->pq <= 8) {
1649             v->condover = decode012(gb);
1650             if(v->condover == CONDOVER_SELECT) {
1651                 status = bitplane_decoding(v->over_flags_plane, &v->overflg_is_raw, v);
1652                 if (status < 0) return -1;
1653                 av_log(v->s.avctx, AV_LOG_DEBUG, "CONDOVER plane encoding: "
1654                         "Imode: %i, Invert: %i\n", status>>1, status&1);
1655             }
1656         }
1657         break;
1658     case P_TYPE:
1659         if(v->postprocflag)
1660             v->postproc = get_bits1(gb);
1661         if (v->extended_mv) v->mvrange = get_prefix(gb, 0, 3);
1662         else v->mvrange = 0;
1663         v->k_x = v->mvrange + 9 + (v->mvrange >> 1); //k_x can be 9 10 12 13
1664         v->k_y = v->mvrange + 8; //k_y can be 8 9 10 11
1665         v->range_x = 1 << (v->k_x - 1);
1666         v->range_y = 1 << (v->k_y - 1);
1667
1668         if (v->pq < 5) v->tt_index = 0;
1669         else if(v->pq < 13) v->tt_index = 1;
1670         else v->tt_index = 2;
1671
1672         lowquant = (v->pq > 12) ? 0 : 1;
1673         v->mv_mode = mv_pmode_table[lowquant][get_prefix(gb, 1, 4)];
1674         if (v->mv_mode == MV_PMODE_INTENSITY_COMP)
1675         {
1676             int scale, shift, i;
1677             v->mv_mode2 = mv_pmode_table2[lowquant][get_prefix(gb, 1, 3)];
1678             v->lumscale = get_bits(gb, 6);
1679             v->lumshift = get_bits(gb, 6);
1680             /* fill lookup tables for intensity compensation */
1681             if(!v->lumscale) {
1682                 scale = -64;
1683                 shift = (255 - v->lumshift * 2) << 6;
1684                 if(v->lumshift > 31)
1685                     shift += 128 << 6;
1686             } else {
1687                 scale = v->lumscale + 32;
1688                 if(v->lumshift > 31)
1689                     shift = (v->lumshift - 64) << 6;
1690                 else
1691                     shift = v->lumshift << 6;
1692             }
1693             for(i = 0; i < 256; i++) {
1694                 v->luty[i] = clip_uint8((scale * i + shift + 32) >> 6);
1695                 v->lutuv[i] = clip_uint8((scale * (i - 128) + 128*64 + 32) >> 6);
1696             }
1697         }
1698         if(v->mv_mode == MV_PMODE_1MV_HPEL || v->mv_mode == MV_PMODE_1MV_HPEL_BILIN)
1699             v->s.quarter_sample = 0;
1700         else if(v->mv_mode == MV_PMODE_INTENSITY_COMP) {
1701             if(v->mv_mode2 == MV_PMODE_1MV_HPEL || v->mv_mode2 == MV_PMODE_1MV_HPEL_BILIN)
1702                 v->s.quarter_sample = 0;
1703             else
1704                 v->s.quarter_sample = 1;
1705         } else
1706             v->s.quarter_sample = 1;
1707         v->s.mspel = !(v->mv_mode == MV_PMODE_1MV_HPEL_BILIN || (v->mv_mode == MV_PMODE_INTENSITY_COMP && v->mv_mode2 == MV_PMODE_1MV_HPEL_BILIN));
1708
1709         if ((v->mv_mode == MV_PMODE_INTENSITY_COMP &&
1710                  v->mv_mode2 == MV_PMODE_MIXED_MV)
1711                 || v->mv_mode == MV_PMODE_MIXED_MV)
1712         {
1713             status = bitplane_decoding(v->mv_type_mb_plane, &v->mv_type_is_raw, v);
1714             if (status < 0) return -1;
1715             av_log(v->s.avctx, AV_LOG_DEBUG, "MB MV Type plane encoding: "
1716                    "Imode: %i, Invert: %i\n", status>>1, status&1);
1717         } else {
1718             v->mv_type_is_raw = 0;
1719             memset(v->mv_type_mb_plane, 0, v->s.mb_stride * v->s.mb_height);
1720         }
1721         status = bitplane_decoding(v->s.mbskip_table, &v->skip_is_raw, v);
1722         if (status < 0) return -1;
1723         av_log(v->s.avctx, AV_LOG_DEBUG, "MB Skip plane encoding: "
1724                "Imode: %i, Invert: %i\n", status>>1, status&1);
1725
1726         /* Hopefully this is correct for P frames */
1727         v->s.mv_table_index = get_bits(gb, 2); //but using vc1_ tables
1728         v->cbpcy_vlc = &vc1_cbpcy_p_vlc[get_bits(gb, 2)];
1729         if (v->dquant)
1730         {
1731             av_log(v->s.avctx, AV_LOG_DEBUG, "VOP DQuant info\n");
1732             vop_dquant_decoding(v);
1733         }
1734
1735         v->ttfrm = 0; //FIXME Is that so ?
1736         if (v->vstransform)
1737         {
1738             v->ttmbf = get_bits(gb, 1);
1739             if (v->ttmbf)
1740             {
1741                 v->ttfrm = ttfrm_to_tt[get_bits(gb, 2)];
1742             }
1743         } else {
1744             v->ttmbf = 1;
1745             v->ttfrm = TT_8X8;
1746         }
1747         break;
1748     }
1749
1750     /* AC Syntax */
1751     v->c_ac_table_index = decode012(gb);
1752     if (v->s.pict_type == I_TYPE || v->s.pict_type == BI_TYPE)
1753     {
1754         v->y_ac_table_index = decode012(gb);
1755     }
1756     /* DC Syntax */
1757     v->s.dc_table_index = get_bits(gb, 1);
1758     if (v->s.pict_type == I_TYPE && v->dquant) {
1759         av_log(v->s.avctx, AV_LOG_DEBUG, "VOP DQuant info\n");
1760         vop_dquant_decoding(v);
1761     }
1762
1763     v->bi_type = 0;
1764     if(v->s.pict_type == BI_TYPE) {
1765         v->s.pict_type = B_TYPE;
1766         v->bi_type = 1;
1767     }
1768     return 0;
1769 }
1770
1771 /***********************************************************************/
1772 /**
1773  * @defgroup block VC-1 Block-level functions
1774  * @see 7.1.4, p91 and 8.1.1.7, p(1)04
1775  * @{
1776  */
1777
1778 /**
1779  * @def GET_MQUANT
1780  * @brief Get macroblock-level quantizer scale
1781  */
1782 #define GET_MQUANT()                                           \
1783   if (v->dquantfrm)                                            \
1784   {                                                            \
1785     int edges = 0;                                             \
1786     if (v->dqprofile == DQPROFILE_ALL_MBS)                     \
1787     {                                                          \
1788       if (v->dqbilevel)                                        \
1789       {                                                        \
1790         mquant = (get_bits(gb, 1)) ? v->altpq : v->pq;         \
1791       }                                                        \
1792       else                                                     \
1793       {                                                        \
1794         mqdiff = get_bits(gb, 3);                              \
1795         if (mqdiff != 7) mquant = v->pq + mqdiff;              \
1796         else mquant = get_bits(gb, 5);                         \
1797       }                                                        \
1798     }                                                          \
1799     if(v->dqprofile == DQPROFILE_SINGLE_EDGE)                  \
1800         edges = 1 << v->dqsbedge;                              \
1801     else if(v->dqprofile == DQPROFILE_DOUBLE_EDGES)            \
1802         edges = (3 << v->dqsbedge) % 15;                       \
1803     else if(v->dqprofile == DQPROFILE_FOUR_EDGES)              \
1804         edges = 15;                                            \
1805     if((edges&1) && !s->mb_x)                                  \
1806         mquant = v->altpq;                                     \
1807     if((edges&2) && s->first_slice_line)                       \
1808         mquant = v->altpq;                                     \
1809     if((edges&4) && s->mb_x == (s->mb_width - 1))              \
1810         mquant = v->altpq;                                     \
1811     if((edges&8) && s->mb_y == (s->mb_height - 1))             \
1812         mquant = v->altpq;                                     \
1813   }
1814
1815 /**
1816  * @def GET_MVDATA(_dmv_x, _dmv_y)
1817  * @brief Get MV differentials
1818  * @see MVDATA decoding from 8.3.5.2, p(1)20
1819  * @param _dmv_x Horizontal differential for decoded MV
1820  * @param _dmv_y Vertical differential for decoded MV
1821  */
1822 #define GET_MVDATA(_dmv_x, _dmv_y)                                  \
1823   index = 1 + get_vlc2(gb, vc1_mv_diff_vlc[s->mv_table_index].table,\
1824                        VC1_MV_DIFF_VLC_BITS, 2);                    \
1825   if (index > 36)                                                   \
1826   {                                                                 \
1827     mb_has_coeffs = 1;                                              \
1828     index -= 37;                                                    \
1829   }                                                                 \
1830   else mb_has_coeffs = 0;                                           \
1831   s->mb_intra = 0;                                                  \
1832   if (!index) { _dmv_x = _dmv_y = 0; }                              \
1833   else if (index == 35)                                             \
1834   {                                                                 \
1835     _dmv_x = get_bits(gb, v->k_x - 1 + s->quarter_sample);          \
1836     _dmv_y = get_bits(gb, v->k_y - 1 + s->quarter_sample);          \
1837   }                                                                 \
1838   else if (index == 36)                                             \
1839   {                                                                 \
1840     _dmv_x = 0;                                                     \
1841     _dmv_y = 0;                                                     \
1842     s->mb_intra = 1;                                                \
1843   }                                                                 \
1844   else                                                              \
1845   {                                                                 \
1846     index1 = index%6;                                               \
1847     if (!s->quarter_sample && index1 == 5) val = 1;                 \
1848     else                                   val = 0;                 \
1849     if(size_table[index1] - val > 0)                                \
1850         val = get_bits(gb, size_table[index1] - val);               \
1851     else                                   val = 0;                 \
1852     sign = 0 - (val&1);                                             \
1853     _dmv_x = (sign ^ ((val>>1) + offset_table[index1])) - sign;     \
1854                                                                     \
1855     index1 = index/6;                                               \
1856     if (!s->quarter_sample && index1 == 5) val = 1;                 \
1857     else                                   val = 0;                 \
1858     if(size_table[index1] - val > 0)                                \
1859         val = get_bits(gb, size_table[index1] - val);               \
1860     else                                   val = 0;                 \
1861     sign = 0 - (val&1);                                             \
1862     _dmv_y = (sign ^ ((val>>1) + offset_table[index1])) - sign;     \
1863   }
1864
1865 /** Predict and set motion vector
1866  */
1867 static inline void vc1_pred_mv(MpegEncContext *s, int n, int dmv_x, int dmv_y, int mv1, int r_x, int r_y, uint8_t* is_intra)
1868 {
1869     int xy, wrap, off = 0;
1870     int16_t *A, *B, *C;
1871     int px, py;
1872     int sum;
1873
1874     /* scale MV difference to be quad-pel */
1875     dmv_x <<= 1 - s->quarter_sample;
1876     dmv_y <<= 1 - s->quarter_sample;
1877
1878     wrap = s->b8_stride;
1879     xy = s->block_index[n];
1880
1881     if(s->mb_intra){
1882         s->mv[0][n][0] = s->current_picture.motion_val[0][xy][0] = 0;
1883         s->mv[0][n][1] = s->current_picture.motion_val[0][xy][1] = 0;
1884         if(mv1) { /* duplicate motion data for 1-MV block */
1885             s->current_picture.motion_val[0][xy + 1][0] = 0;
1886             s->current_picture.motion_val[0][xy + 1][1] = 0;
1887             s->current_picture.motion_val[0][xy + wrap][0] = 0;
1888             s->current_picture.motion_val[0][xy + wrap][1] = 0;
1889             s->current_picture.motion_val[0][xy + wrap + 1][0] = 0;
1890             s->current_picture.motion_val[0][xy + wrap + 1][1] = 0;
1891         }
1892         return;
1893     }
1894
1895     C = s->current_picture.motion_val[0][xy - 1];
1896     A = s->current_picture.motion_val[0][xy - wrap];
1897     if(mv1)
1898         off = (s->mb_x == (s->mb_width - 1)) ? -1 : 2;
1899     else {
1900         //in 4-MV mode different blocks have different B predictor position
1901         switch(n){
1902         case 0:
1903             off = (s->mb_x > 0) ? -1 : 1;
1904             break;
1905         case 1:
1906             off = (s->mb_x == (s->mb_width - 1)) ? -1 : 1;
1907             break;
1908         case 2:
1909             off = 1;
1910             break;
1911         case 3:
1912             off = -1;
1913         }
1914     }
1915     B = s->current_picture.motion_val[0][xy - wrap + off];
1916
1917     if(!s->first_slice_line || (n==2 || n==3)) { // predictor A is not out of bounds
1918         if(s->mb_width == 1) {
1919             px = A[0];
1920             py = A[1];
1921         } else {
1922             px = mid_pred(A[0], B[0], C[0]);
1923             py = mid_pred(A[1], B[1], C[1]);
1924         }
1925     } else if(s->mb_x || (n==1 || n==3)) { // predictor C is not out of bounds
1926         px = C[0];
1927         py = C[1];
1928     } else {
1929         px = py = 0;
1930     }
1931     /* Pullback MV as specified in 8.3.5.3.4 */
1932     {
1933         int qx, qy, X, Y;
1934         qx = (s->mb_x << 6) + ((n==1 || n==3) ? 32 : 0);
1935         qy = (s->mb_y << 6) + ((n==2 || n==3) ? 32 : 0);
1936         X = (s->mb_width << 6) - 4;
1937         Y = (s->mb_height << 6) - 4;
1938         if(mv1) {
1939             if(qx + px < -60) px = -60 - qx;
1940             if(qy + py < -60) py = -60 - qy;
1941         } else {
1942             if(qx + px < -28) px = -28 - qx;
1943             if(qy + py < -28) py = -28 - qy;
1944         }
1945         if(qx + px > X) px = X - qx;
1946         if(qy + py > Y) py = Y - qy;
1947     }
1948     /* Calculate hybrid prediction as specified in 8.3.5.3.5 */
1949     if((!s->first_slice_line || (n==2 || n==3)) && (s->mb_x || (n==1 || n==3))) {
1950         if(is_intra[xy - wrap])
1951             sum = ABS(px) + ABS(py);
1952         else
1953             sum = ABS(px - A[0]) + ABS(py - A[1]);
1954         if(sum > 32) {
1955             if(get_bits1(&s->gb)) {
1956                 px = A[0];
1957                 py = A[1];
1958             } else {
1959                 px = C[0];
1960                 py = C[1];
1961             }
1962         } else {
1963             if(is_intra[xy - 1])
1964                 sum = ABS(px) + ABS(py);
1965             else
1966                 sum = ABS(px - C[0]) + ABS(py - C[1]);
1967             if(sum > 32) {
1968                 if(get_bits1(&s->gb)) {
1969                     px = A[0];
1970                     py = A[1];
1971                 } else {
1972                     px = C[0];
1973                     py = C[1];
1974                 }
1975             }
1976         }
1977     }
1978     /* store MV using signed modulus of MV range defined in 4.11 */
1979     s->mv[0][n][0] = s->current_picture.motion_val[0][xy][0] = ((px + dmv_x + r_x) & ((r_x << 1) - 1)) - r_x;
1980     s->mv[0][n][1] = s->current_picture.motion_val[0][xy][1] = ((py + dmv_y + r_y) & ((r_y << 1) - 1)) - r_y;
1981     if(mv1) { /* duplicate motion data for 1-MV block */
1982         s->current_picture.motion_val[0][xy + 1][0] = s->current_picture.motion_val[0][xy][0];
1983         s->current_picture.motion_val[0][xy + 1][1] = s->current_picture.motion_val[0][xy][1];
1984         s->current_picture.motion_val[0][xy + wrap][0] = s->current_picture.motion_val[0][xy][0];
1985         s->current_picture.motion_val[0][xy + wrap][1] = s->current_picture.motion_val[0][xy][1];
1986         s->current_picture.motion_val[0][xy + wrap + 1][0] = s->current_picture.motion_val[0][xy][0];
1987         s->current_picture.motion_val[0][xy + wrap + 1][1] = s->current_picture.motion_val[0][xy][1];
1988     }
1989 }
1990
1991 /** Motion compensation for direct or interpolated blocks in B-frames
1992  */
1993 static void vc1_interp_mc(VC1Context *v)
1994 {
1995     MpegEncContext *s = &v->s;
1996     DSPContext *dsp = &v->s.dsp;
1997     uint8_t *srcY, *srcU, *srcV;
1998     int dxy, uvdxy, mx, my, uvmx, uvmy, src_x, src_y, uvsrc_x, uvsrc_y;
1999
2000     if(!v->s.next_picture.data[0])return;
2001
2002     mx = s->mv[1][0][0];
2003     my = s->mv[1][0][1];
2004     uvmx = (mx + ((mx & 3) == 3)) >> 1;
2005     uvmy = (my + ((my & 3) == 3)) >> 1;
2006     srcY = s->next_picture.data[0];
2007     srcU = s->next_picture.data[1];
2008     srcV = s->next_picture.data[2];
2009
2010     src_x = s->mb_x * 16 + (mx >> 2);
2011     src_y = s->mb_y * 16 + (my >> 2);
2012     uvsrc_x = s->mb_x * 8 + (uvmx >> 2);
2013     uvsrc_y = s->mb_y * 8 + (uvmy >> 2);
2014
2015     src_x   = clip(  src_x, -16, s->mb_width  * 16);
2016     src_y   = clip(  src_y, -16, s->mb_height * 16);
2017     uvsrc_x = clip(uvsrc_x,  -8, s->mb_width  *  8);
2018     uvsrc_y = clip(uvsrc_y,  -8, s->mb_height *  8);
2019
2020     srcY += src_y * s->linesize + src_x;
2021     srcU += uvsrc_y * s->uvlinesize + uvsrc_x;
2022     srcV += uvsrc_y * s->uvlinesize + uvsrc_x;
2023
2024     /* for grayscale we should not try to read from unknown area */
2025     if(s->flags & CODEC_FLAG_GRAY) {
2026         srcU = s->edge_emu_buffer + 18 * s->linesize;
2027         srcV = s->edge_emu_buffer + 18 * s->linesize;
2028     }
2029
2030     if(v->rangeredfrm
2031        || (unsigned)src_x > s->h_edge_pos - (mx&3) - 16
2032        || (unsigned)src_y > s->v_edge_pos - (my&3) - 16){
2033         uint8_t *uvbuf= s->edge_emu_buffer + 19 * s->linesize;
2034
2035         srcY -= s->mspel * (1 + s->linesize);
2036         ff_emulated_edge_mc(s->edge_emu_buffer, srcY, s->linesize, 17+s->mspel*2, 17+s->mspel*2,
2037                             src_x - s->mspel, src_y - s->mspel, s->h_edge_pos, s->v_edge_pos);
2038         srcY = s->edge_emu_buffer;
2039         ff_emulated_edge_mc(uvbuf     , srcU, s->uvlinesize, 8+1, 8+1,
2040                             uvsrc_x, uvsrc_y, s->h_edge_pos >> 1, s->v_edge_pos >> 1);
2041         ff_emulated_edge_mc(uvbuf + 16, srcV, s->uvlinesize, 8+1, 8+1,
2042                             uvsrc_x, uvsrc_y, s->h_edge_pos >> 1, s->v_edge_pos >> 1);
2043         srcU = uvbuf;
2044         srcV = uvbuf + 16;
2045         /* if we deal with range reduction we need to scale source blocks */
2046         if(v->rangeredfrm) {
2047             int i, j;
2048             uint8_t *src, *src2;
2049
2050             src = srcY;
2051             for(j = 0; j < 17 + s->mspel*2; j++) {
2052                 for(i = 0; i < 17 + s->mspel*2; i++) src[i] = ((src[i] - 128) >> 1) + 128;
2053                 src += s->linesize;
2054             }
2055             src = srcU; src2 = srcV;
2056             for(j = 0; j < 9; j++) {
2057                 for(i = 0; i < 9; i++) {
2058                     src[i] = ((src[i] - 128) >> 1) + 128;
2059                     src2[i] = ((src2[i] - 128) >> 1) + 128;
2060                 }
2061                 src += s->uvlinesize;
2062                 src2 += s->uvlinesize;
2063             }
2064         }
2065         srcY += s->mspel * (1 + s->linesize);
2066     }
2067
2068     if(v->fastuvmc) {
2069         uvmx = uvmx + ((uvmx<0)?(uvmx&1):-(uvmx&1));
2070         uvmy = uvmy + ((uvmy<0)?(uvmy&1):-(uvmy&1));
2071     }
2072
2073     mx >>= 1;
2074     my >>= 1;
2075     dxy = ((my & 1) << 1) | (mx & 1);
2076
2077     dsp->avg_pixels_tab[0][dxy](s->dest[0], srcY, s->linesize, 16);
2078
2079     if(s->flags & CODEC_FLAG_GRAY) return;
2080     /* Chroma MC always uses qpel blilinear */
2081     uvdxy = ((uvmy & 3) << 2) | (uvmx & 3);
2082     uvmx = (uvmx&3)<<1;
2083     uvmy = (uvmy&3)<<1;
2084     dsp->avg_h264_chroma_pixels_tab[0](s->dest[1], srcU, s->uvlinesize, 8, uvmx, uvmy);
2085     dsp->avg_h264_chroma_pixels_tab[0](s->dest[2], srcV, s->uvlinesize, 8, uvmx, uvmy);
2086 }
2087
2088 static always_inline int scale_mv(int value, int bfrac, int inv, int qs)
2089 {
2090     int n = bfrac;
2091
2092 #if B_FRACTION_DEN==256
2093     if(inv)
2094         n -= 256;
2095     if(!qs)
2096         return 2 * ((value * n + 255) >> 9);
2097     return (value * n + 128) >> 8;
2098 #else
2099     if(inv)
2100         n -= B_FRACTION_DEN;
2101     if(!qs)
2102         return 2 * ((value * n + B_FRACTION_DEN - 1) / (2 * B_FRACTION_DEN));
2103     return (value * n + B_FRACTION_DEN/2) / B_FRACTION_DEN;
2104 #endif
2105 }
2106
2107 /** Reconstruct motion vector for B-frame and do motion compensation
2108  */
2109 static inline void vc1_b_mc(VC1Context *v, int dmv_x[2], int dmv_y[2], int direct, int mode)
2110 {
2111     int t;
2112
2113     if(v->use_ic) {
2114         v->mv_mode2 = v->mv_mode;
2115         v->mv_mode = MV_PMODE_INTENSITY_COMP;
2116     }
2117     if(direct) {
2118         vc1_mc_1mv(v, 0);
2119         vc1_interp_mc(v);
2120         if(v->use_ic) v->mv_mode = v->mv_mode2;
2121         return;
2122     }
2123     if(mode == BMV_TYPE_INTERPOLATED) {
2124         vc1_mc_1mv(v, 0);
2125         vc1_interp_mc(v);
2126         if(v->use_ic) v->mv_mode = v->mv_mode2;
2127         return;
2128     }
2129
2130     if(v->use_ic && (mode == BMV_TYPE_BACKWARD)) v->mv_mode = v->mv_mode2;
2131     vc1_mc_1mv(v, (mode == BMV_TYPE_BACKWARD));
2132     if(v->use_ic) v->mv_mode = v->mv_mode2;
2133 }
2134
2135 static inline void vc1_pred_b_mv(VC1Context *v, int dmv_x[2], int dmv_y[2], int direct, int mvtype)
2136 {
2137     MpegEncContext *s = &v->s;
2138     int xy, wrap, off = 0;
2139     int16_t *A, *B, *C;
2140     int px, py;
2141     int sum;
2142     int r_x, r_y;
2143     const uint8_t *is_intra = v->mb_type[0];
2144
2145     r_x = v->range_x;
2146     r_y = v->range_y;
2147     /* scale MV difference to be quad-pel */
2148     dmv_x[0] <<= 1 - s->quarter_sample;
2149     dmv_y[0] <<= 1 - s->quarter_sample;
2150     dmv_x[1] <<= 1 - s->quarter_sample;
2151     dmv_y[1] <<= 1 - s->quarter_sample;
2152
2153     wrap = s->b8_stride;
2154     xy = s->block_index[0];
2155
2156     if(s->mb_intra) {
2157         s->current_picture.motion_val[0][xy][0] =
2158         s->current_picture.motion_val[0][xy][1] =
2159         s->current_picture.motion_val[1][xy][0] =
2160         s->current_picture.motion_val[1][xy][1] = 0;
2161         return;
2162     }
2163     s->mv[0][0][0] = scale_mv(s->next_picture.motion_val[1][xy][0], v->bfraction, 0, s->quarter_sample);
2164     s->mv[0][0][1] = scale_mv(s->next_picture.motion_val[1][xy][1], v->bfraction, 0, s->quarter_sample);
2165     s->mv[1][0][0] = scale_mv(s->next_picture.motion_val[1][xy][0], v->bfraction, 1, s->quarter_sample);
2166     s->mv[1][0][1] = scale_mv(s->next_picture.motion_val[1][xy][1], v->bfraction, 1, s->quarter_sample);
2167     if(direct) {
2168         s->current_picture.motion_val[0][xy][0] = s->mv[0][0][0];
2169         s->current_picture.motion_val[0][xy][1] = s->mv[0][0][1];
2170         s->current_picture.motion_val[1][xy][0] = s->mv[1][0][0];
2171         s->current_picture.motion_val[1][xy][1] = s->mv[1][0][1];
2172         return;
2173     }
2174
2175     if((mvtype == BMV_TYPE_FORWARD) || (mvtype == BMV_TYPE_INTERPOLATED)) {
2176         C = s->current_picture.motion_val[0][xy - 2];
2177         A = s->current_picture.motion_val[0][xy - wrap*2];
2178         off = (s->mb_x == (s->mb_width - 1)) ? -2 : 2;
2179         B = s->current_picture.motion_val[0][xy - wrap*2 + off];
2180
2181         if(!s->first_slice_line) { // predictor A is not out of bounds
2182             if(s->mb_width == 1) {
2183                 px = A[0];
2184                 py = A[1];
2185             } else {
2186                 px = mid_pred(A[0], B[0], C[0]);
2187                 py = mid_pred(A[1], B[1], C[1]);
2188             }
2189         } else if(s->mb_x) { // predictor C is not out of bounds
2190             px = C[0];
2191             py = C[1];
2192         } else {
2193             px = py = 0;
2194         }
2195         /* Pullback MV as specified in 8.3.5.3.4 */
2196         {
2197             int qx, qy, X, Y;
2198             if(v->profile < PROFILE_ADVANCED) {
2199                 qx = (s->mb_x << 5);
2200                 qy = (s->mb_y << 5);
2201                 X = (s->mb_width << 5) - 4;
2202                 Y = (s->mb_height << 5) - 4;
2203                 if(qx + px < -28) px = -28 - qx;
2204                 if(qy + py < -28) py = -28 - qy;
2205                 if(qx + px > X) px = X - qx;
2206                 if(qy + py > Y) py = Y - qy;
2207             } else {
2208                 qx = (s->mb_x << 6);
2209                 qy = (s->mb_y << 6);
2210                 X = (s->mb_width << 6) - 4;
2211                 Y = (s->mb_height << 6) - 4;
2212                 if(qx + px < -60) px = -60 - qx;
2213                 if(qy + py < -60) py = -60 - qy;
2214                 if(qx + px > X) px = X - qx;
2215                 if(qy + py > Y) py = Y - qy;
2216             }
2217         }
2218         /* Calculate hybrid prediction as specified in 8.3.5.3.5 */
2219         if(0 && !s->first_slice_line && s->mb_x) {
2220             if(is_intra[xy - wrap])
2221                 sum = ABS(px) + ABS(py);
2222             else
2223                 sum = ABS(px - A[0]) + ABS(py - A[1]);
2224             if(sum > 32) {
2225                 if(get_bits1(&s->gb)) {
2226                     px = A[0];
2227                     py = A[1];
2228                 } else {
2229                     px = C[0];
2230                     py = C[1];
2231                 }
2232             } else {
2233                 if(is_intra[xy - 2])
2234                     sum = ABS(px) + ABS(py);
2235                 else
2236                     sum = ABS(px - C[0]) + ABS(py - C[1]);
2237                 if(sum > 32) {
2238                     if(get_bits1(&s->gb)) {
2239                         px = A[0];
2240                         py = A[1];
2241                     } else {
2242                         px = C[0];
2243                         py = C[1];
2244                     }
2245                 }
2246             }
2247         }
2248         /* store MV using signed modulus of MV range defined in 4.11 */
2249         s->mv[0][0][0] = ((px + dmv_x[0] + r_x) & ((r_x << 1) - 1)) - r_x;
2250         s->mv[0][0][1] = ((py + dmv_y[0] + r_y) & ((r_y << 1) - 1)) - r_y;
2251     }
2252     if((mvtype == BMV_TYPE_BACKWARD) || (mvtype == BMV_TYPE_INTERPOLATED)) {
2253         C = s->current_picture.motion_val[1][xy - 2];
2254         A = s->current_picture.motion_val[1][xy - wrap*2];
2255         off = (s->mb_x == (s->mb_width - 1)) ? -2 : 2;
2256         B = s->current_picture.motion_val[1][xy - wrap*2 + off];
2257
2258         if(!s->first_slice_line) { // predictor A is not out of bounds
2259             if(s->mb_width == 1) {
2260                 px = A[0];
2261                 py = A[1];
2262             } else {
2263                 px = mid_pred(A[0], B[0], C[0]);
2264                 py = mid_pred(A[1], B[1], C[1]);
2265             }
2266         } else if(s->mb_x) { // predictor C is not out of bounds
2267             px = C[0];
2268             py = C[1];
2269         } else {
2270             px = py = 0;
2271         }
2272         /* Pullback MV as specified in 8.3.5.3.4 */
2273         {
2274             int qx, qy, X, Y;
2275             if(v->profile < PROFILE_ADVANCED) {
2276                 qx = (s->mb_x << 5);
2277                 qy = (s->mb_y << 5);
2278                 X = (s->mb_width << 5) - 4;
2279                 Y = (s->mb_height << 5) - 4;
2280                 if(qx + px < -28) px = -28 - qx;
2281                 if(qy + py < -28) py = -28 - qy;
2282                 if(qx + px > X) px = X - qx;
2283                 if(qy + py > Y) py = Y - qy;
2284             } else {
2285                 qx = (s->mb_x << 6);
2286                 qy = (s->mb_y << 6);
2287                 X = (s->mb_width << 6) - 4;
2288                 Y = (s->mb_height << 6) - 4;
2289                 if(qx + px < -60) px = -60 - qx;
2290                 if(qy + py < -60) py = -60 - qy;
2291                 if(qx + px > X) px = X - qx;
2292                 if(qy + py > Y) py = Y - qy;
2293             }
2294         }
2295         /* Calculate hybrid prediction as specified in 8.3.5.3.5 */
2296         if(0 && !s->first_slice_line && s->mb_x) {
2297             if(is_intra[xy - wrap])
2298                 sum = ABS(px) + ABS(py);
2299             else
2300                 sum = ABS(px - A[0]) + ABS(py - A[1]);
2301             if(sum > 32) {
2302                 if(get_bits1(&s->gb)) {
2303                     px = A[0];
2304                     py = A[1];
2305                 } else {
2306                     px = C[0];
2307                     py = C[1];
2308                 }
2309             } else {
2310                 if(is_intra[xy - 2])
2311                     sum = ABS(px) + ABS(py);
2312                 else
2313                     sum = ABS(px - C[0]) + ABS(py - C[1]);
2314                 if(sum > 32) {
2315                     if(get_bits1(&s->gb)) {
2316                         px = A[0];
2317                         py = A[1];
2318                     } else {
2319                         px = C[0];
2320                         py = C[1];
2321                     }
2322                 }
2323             }
2324         }
2325         /* store MV using signed modulus of MV range defined in 4.11 */
2326
2327         s->mv[1][0][0] = ((px + dmv_x[1] + r_x) & ((r_x << 1) - 1)) - r_x;
2328         s->mv[1][0][1] = ((py + dmv_y[1] + r_y) & ((r_y << 1) - 1)) - r_y;
2329     }
2330     s->current_picture.motion_val[0][xy][0] = s->mv[0][0][0];
2331     s->current_picture.motion_val[0][xy][1] = s->mv[0][0][1];
2332     s->current_picture.motion_val[1][xy][0] = s->mv[1][0][0];
2333     s->current_picture.motion_val[1][xy][1] = s->mv[1][0][1];
2334 }
2335
2336 /** Get predicted DC value for I-frames only
2337  * prediction dir: left=0, top=1
2338  * @param s MpegEncContext
2339  * @param[in] n block index in the current MB
2340  * @param dc_val_ptr Pointer to DC predictor
2341  * @param dir_ptr Prediction direction for use in AC prediction
2342  */
2343 static inline int vc1_i_pred_dc(MpegEncContext *s, int overlap, int pq, int n,
2344                               int16_t **dc_val_ptr, int *dir_ptr)
2345 {
2346     int a, b, c, wrap, pred, scale;
2347     int16_t *dc_val;
2348     static const uint16_t dcpred[32] = {
2349     -1, 1024,  512,  341,  256,  205,  171,  146,  128,
2350          114,  102,   93,   85,   79,   73,   68,   64,
2351           60,   57,   54,   51,   49,   47,   45,   43,
2352           41,   39,   38,   37,   35,   34,   33
2353     };
2354
2355     /* find prediction - wmv3_dc_scale always used here in fact */
2356     if (n < 4)     scale = s->y_dc_scale;
2357     else           scale = s->c_dc_scale;
2358
2359     wrap = s->block_wrap[n];
2360     dc_val= s->dc_val[0] + s->block_index[n];
2361
2362     /* B A
2363      * C X
2364      */
2365     c = dc_val[ - 1];
2366     b = dc_val[ - 1 - wrap];
2367     a = dc_val[ - wrap];
2368
2369     if (pq < 9 || !overlap)
2370     {
2371         /* Set outer values */
2372         if (s->first_slice_line && (n!=2 && n!=3)) b=a=dcpred[scale];
2373         if (s->mb_x == 0 && (n!=1 && n!=3)) b=c=dcpred[scale];
2374     }
2375     else
2376     {
2377         /* Set outer values */
2378         if (s->first_slice_line && (n!=2 && n!=3)) b=a=0;
2379         if (s->mb_x == 0 && (n!=1 && n!=3)) b=c=0;
2380     }
2381
2382     if (abs(a - b) <= abs(b - c)) {
2383         pred = c;
2384         *dir_ptr = 1;//left
2385     } else {
2386         pred = a;
2387         *dir_ptr = 0;//top
2388     }
2389
2390     /* update predictor */
2391     *dc_val_ptr = &dc_val[0];
2392     return pred;
2393 }
2394
2395
2396 /** Get predicted DC value
2397  * prediction dir: left=0, top=1
2398  * @param s MpegEncContext
2399  * @param[in] n block index in the current MB
2400  * @param dc_val_ptr Pointer to DC predictor
2401  * @param dir_ptr Prediction direction for use in AC prediction
2402  */
2403 static inline int vc1_pred_dc(MpegEncContext *s, int overlap, int pq, int n,
2404                               int a_avail, int c_avail,
2405                               int16_t **dc_val_ptr, int *dir_ptr)
2406 {
2407     int a, b, c, wrap, pred, scale;
2408     int16_t *dc_val;
2409     int mb_pos = s->mb_x + s->mb_y * s->mb_stride;
2410     int q1, q2 = 0;
2411
2412     /* find prediction - wmv3_dc_scale always used here in fact */
2413     if (n < 4)     scale = s->y_dc_scale;
2414     else           scale = s->c_dc_scale;
2415
2416     wrap = s->block_wrap[n];
2417     dc_val= s->dc_val[0] + s->block_index[n];
2418
2419     /* B A
2420      * C X
2421      */
2422     c = dc_val[ - 1];
2423     b = dc_val[ - 1 - wrap];
2424     a = dc_val[ - wrap];
2425     /* scale predictors if needed */
2426     q1 = s->current_picture.qscale_table[mb_pos];
2427     if(c_avail && (n!= 1 && n!=3)) {
2428         q2 = s->current_picture.qscale_table[mb_pos - 1];
2429         if(q2 && q2 != q1)
2430             c = (c * s->y_dc_scale_table[q2] * vc1_dqscale[s->y_dc_scale_table[q1] - 1] + 0x20000) >> 18;
2431     }
2432     if(a_avail && (n!= 2 && n!=3)) {
2433         q2 = s->current_picture.qscale_table[mb_pos - s->mb_stride];
2434         if(q2 && q2 != q1)
2435             a = (a * s->y_dc_scale_table[q2] * vc1_dqscale[s->y_dc_scale_table[q1] - 1] + 0x20000) >> 18;
2436     }
2437     if(a_avail && c_avail && (n!=3)) {
2438         int off = mb_pos;
2439         if(n != 1) off--;
2440         if(n != 2) off -= s->mb_stride;
2441         q2 = s->current_picture.qscale_table[off];
2442         if(q2 && q2 != q1)
2443             b = (b * s->y_dc_scale_table[q2] * vc1_dqscale[s->y_dc_scale_table[q1] - 1] + 0x20000) >> 18;
2444     }
2445
2446     if(a_avail && c_avail) {
2447         if(abs(a - b) <= abs(b - c)) {
2448             pred = c;
2449             *dir_ptr = 1;//left
2450         } else {
2451             pred = a;
2452             *dir_ptr = 0;//top
2453         }
2454     } else if(a_avail) {
2455         pred = a;
2456         *dir_ptr = 0;//top
2457     } else if(c_avail) {
2458         pred = c;
2459         *dir_ptr = 1;//left
2460     } else {
2461         pred = 0;
2462         *dir_ptr = 1;//left
2463     }
2464
2465     /* update predictor */
2466     *dc_val_ptr = &dc_val[0];
2467     return pred;
2468 }
2469
2470
2471 /**
2472  * @defgroup std_mb VC1 Macroblock-level functions in Simple/Main Profiles
2473  * @see 7.1.4, p91 and 8.1.1.7, p(1)04
2474  * @{
2475  */
2476
2477 static inline int vc1_coded_block_pred(MpegEncContext * s, int n, uint8_t **coded_block_ptr)
2478 {
2479     int xy, wrap, pred, a, b, c;
2480
2481     xy = s->block_index[n];
2482     wrap = s->b8_stride;
2483
2484     /* B C
2485      * A X
2486      */
2487     a = s->coded_block[xy - 1       ];
2488     b = s->coded_block[xy - 1 - wrap];
2489     c = s->coded_block[xy     - wrap];
2490
2491     if (b == c) {
2492         pred = a;
2493     } else {
2494         pred = c;
2495     }
2496
2497     /* store value */
2498     *coded_block_ptr = &s->coded_block[xy];
2499
2500     return pred;
2501 }
2502
2503 /**
2504  * Decode one AC coefficient
2505  * @param v The VC1 context
2506  * @param last Last coefficient
2507  * @param skip How much zero coefficients to skip
2508  * @param value Decoded AC coefficient value
2509  * @see 8.1.3.4
2510  */
2511 static void vc1_decode_ac_coeff(VC1Context *v, int *last, int *skip, int *value, int codingset)
2512 {
2513     GetBitContext *gb = &v->s.gb;
2514     int index, escape, run = 0, level = 0, lst = 0;
2515
2516     index = get_vlc2(gb, vc1_ac_coeff_table[codingset].table, AC_VLC_BITS, 3);
2517     if (index != vc1_ac_sizes[codingset] - 1) {
2518         run = vc1_index_decode_table[codingset][index][0];
2519         level = vc1_index_decode_table[codingset][index][1];
2520         lst = index >= vc1_last_decode_table[codingset];
2521         if(get_bits(gb, 1))
2522             level = -level;
2523     } else {
2524         escape = decode210(gb);
2525         if (escape != 2) {
2526             index = get_vlc2(gb, vc1_ac_coeff_table[codingset].table, AC_VLC_BITS, 3);
2527             run = vc1_index_decode_table[codingset][index][0];
2528             level = vc1_index_decode_table[codingset][index][1];
2529             lst = index >= vc1_last_decode_table[codingset];
2530             if(escape == 0) {
2531                 if(lst)
2532                     level += vc1_last_delta_level_table[codingset][run];
2533                 else
2534                     level += vc1_delta_level_table[codingset][run];
2535             } else {
2536                 if(lst)
2537                     run += vc1_last_delta_run_table[codingset][level] + 1;
2538                 else
2539                     run += vc1_delta_run_table[codingset][level] + 1;
2540             }
2541             if(get_bits(gb, 1))
2542                 level = -level;
2543         } else {
2544             int sign;
2545             lst = get_bits(gb, 1);
2546             if(v->s.esc3_level_length == 0) {
2547                 if(v->pq < 8 || v->dquantfrm) { // table 59
2548                     v->s.esc3_level_length = get_bits(gb, 3);
2549                     if(!v->s.esc3_level_length)
2550                         v->s.esc3_level_length = get_bits(gb, 2) + 8;
2551                 } else { //table 60
2552                     v->s.esc3_level_length = get_prefix(gb, 1, 6) + 2;
2553                 }
2554                 v->s.esc3_run_length = 3 + get_bits(gb, 2);
2555             }
2556             run = get_bits(gb, v->s.esc3_run_length);
2557             sign = get_bits(gb, 1);
2558             level = get_bits(gb, v->s.esc3_level_length);
2559             if(sign)
2560                 level = -level;
2561         }
2562     }
2563
2564     *last = lst;
2565     *skip = run;
2566     *value = level;
2567 }
2568
2569 /** Decode intra block in intra frames - should be faster than decode_intra_block
2570  * @param v VC1Context
2571  * @param block block to decode
2572  * @param coded are AC coeffs present or not
2573  * @param codingset set of VLC to decode data
2574  */
2575 static int vc1_decode_i_block(VC1Context *v, DCTELEM block[64], int n, int coded, int codingset)
2576 {
2577     GetBitContext *gb = &v->s.gb;
2578     MpegEncContext *s = &v->s;
2579     int dc_pred_dir = 0; /* Direction of the DC prediction used */
2580     int run_diff, i;
2581     int16_t *dc_val;
2582     int16_t *ac_val, *ac_val2;
2583     int dcdiff;
2584
2585     /* Get DC differential */
2586     if (n < 4) {
2587         dcdiff = get_vlc2(&s->gb, ff_msmp4_dc_luma_vlc[s->dc_table_index].table, DC_VLC_BITS, 3);
2588     } else {
2589         dcdiff = get_vlc2(&s->gb, ff_msmp4_dc_chroma_vlc[s->dc_table_index].table, DC_VLC_BITS, 3);
2590     }
2591     if (dcdiff < 0){
2592         av_log(s->avctx, AV_LOG_ERROR, "Illegal DC VLC\n");
2593         return -1;
2594     }
2595     if (dcdiff)
2596     {
2597         if (dcdiff == 119 /* ESC index value */)
2598         {
2599             /* TODO: Optimize */
2600             if (v->pq == 1) dcdiff = get_bits(gb, 10);
2601             else if (v->pq == 2) dcdiff = get_bits(gb, 9);
2602             else dcdiff = get_bits(gb, 8);
2603         }
2604         else
2605         {
2606             if (v->pq == 1)
2607                 dcdiff = (dcdiff<<2) + get_bits(gb, 2) - 3;
2608             else if (v->pq == 2)
2609                 dcdiff = (dcdiff<<1) + get_bits(gb, 1) - 1;
2610         }
2611         if (get_bits(gb, 1))
2612             dcdiff = -dcdiff;
2613     }
2614
2615     /* Prediction */
2616     dcdiff += vc1_i_pred_dc(&v->s, v->overlap, v->pq, n, &dc_val, &dc_pred_dir);
2617     *dc_val = dcdiff;
2618
2619     /* Store the quantized DC coeff, used for prediction */
2620     if (n < 4) {
2621         block[0] = dcdiff * s->y_dc_scale;
2622     } else {
2623         block[0] = dcdiff * s->c_dc_scale;
2624     }
2625     /* Skip ? */
2626     run_diff = 0;
2627     i = 0;
2628     if (!coded) {
2629         goto not_coded;
2630     }
2631
2632     //AC Decoding
2633     i = 1;
2634
2635     {
2636         int last = 0, skip, value;
2637         const int8_t *zz_table;
2638         int scale;
2639         int k;
2640
2641         scale = v->pq * 2 + v->halfpq;
2642
2643         if(v->s.ac_pred) {
2644             if(!dc_pred_dir)
2645                 zz_table = vc1_horizontal_zz;
2646             else
2647                 zz_table = vc1_vertical_zz;
2648         } else
2649             zz_table = vc1_normal_zz;
2650
2651         ac_val = s->ac_val[0][0] + s->block_index[n] * 16;
2652         ac_val2 = ac_val;
2653         if(dc_pred_dir) //left
2654             ac_val -= 16;
2655         else //top
2656             ac_val -= 16 * s->block_wrap[n];
2657
2658         while (!last) {
2659             vc1_decode_ac_coeff(v, &last, &skip, &value, codingset);
2660             i += skip;
2661             if(i > 63)
2662                 break;
2663             block[zz_table[i++]] = value;
2664         }
2665
2666         /* apply AC prediction if needed */
2667         if(s->ac_pred) {
2668             if(dc_pred_dir) { //left
2669                 for(k = 1; k < 8; k++)
2670                     block[k << 3] += ac_val[k];
2671             } else { //top
2672                 for(k = 1; k < 8; k++)
2673                     block[k] += ac_val[k + 8];
2674             }
2675         }
2676         /* save AC coeffs for further prediction */
2677         for(k = 1; k < 8; k++) {
2678             ac_val2[k] = block[k << 3];
2679             ac_val2[k + 8] = block[k];
2680         }
2681
2682         /* scale AC coeffs */
2683         for(k = 1; k < 64; k++)
2684             if(block[k]) {
2685                 block[k] *= scale;
2686                 if(!v->pquantizer)
2687                     block[k] += (block[k] < 0) ? -v->pq : v->pq;
2688             }
2689
2690         if(s->ac_pred) i = 63;
2691     }
2692
2693 not_coded:
2694     if(!coded) {
2695         int k, scale;
2696         ac_val = s->ac_val[0][0] + s->block_index[n] * 16;
2697         ac_val2 = ac_val;
2698
2699         scale = v->pq * 2 + v->halfpq;
2700         memset(ac_val2, 0, 16 * 2);
2701         if(dc_pred_dir) {//left
2702             ac_val -= 16;
2703             if(s->ac_pred)
2704                 memcpy(ac_val2, ac_val, 8 * 2);
2705         } else {//top
2706             ac_val -= 16 * s->block_wrap[n];
2707             if(s->ac_pred)
2708                 memcpy(ac_val2 + 8, ac_val + 8, 8 * 2);
2709         }
2710
2711         /* apply AC prediction if needed */
2712         if(s->ac_pred) {
2713             if(dc_pred_dir) { //left
2714                 for(k = 1; k < 8; k++) {
2715                     block[k << 3] = ac_val[k] * scale;
2716                     if(!v->pquantizer && block[k << 3])
2717                         block[k << 3] += (block[k << 3] < 0) ? -v->pq : v->pq;
2718                 }
2719             } else { //top
2720                 for(k = 1; k < 8; k++) {
2721                     block[k] = ac_val[k + 8] * scale;
2722                     if(!v->pquantizer && block[k])
2723                         block[k] += (block[k] < 0) ? -v->pq : v->pq;
2724                 }
2725             }
2726             i = 63;
2727         }
2728     }
2729     s->block_last_index[n] = i;
2730
2731     return 0;
2732 }
2733
2734 /** Decode intra block in intra frames - should be faster than decode_intra_block
2735  * @param v VC1Context
2736  * @param block block to decode
2737  * @param coded are AC coeffs present or not
2738  * @param codingset set of VLC to decode data
2739  */
2740 static int vc1_decode_i_block_adv(VC1Context *v, DCTELEM block[64], int n, int coded, int codingset, int mquant)
2741 {
2742     GetBitContext *gb = &v->s.gb;
2743     MpegEncContext *s = &v->s;
2744     int dc_pred_dir = 0; /* Direction of the DC prediction used */
2745     int run_diff, i;
2746     int16_t *dc_val;
2747     int16_t *ac_val, *ac_val2;
2748     int dcdiff;
2749     int a_avail = v->a_avail, c_avail = v->c_avail;
2750     int use_pred = s->ac_pred;
2751     int scale;
2752     int q1, q2 = 0;
2753     int mb_pos = s->mb_x + s->mb_y * s->mb_stride;
2754
2755     /* Get DC differential */
2756     if (n < 4) {
2757         dcdiff = get_vlc2(&s->gb, ff_msmp4_dc_luma_vlc[s->dc_table_index].table, DC_VLC_BITS, 3);
2758     } else {
2759         dcdiff = get_vlc2(&s->gb, ff_msmp4_dc_chroma_vlc[s->dc_table_index].table, DC_VLC_BITS, 3);
2760     }
2761     if (dcdiff < 0){
2762         av_log(s->avctx, AV_LOG_ERROR, "Illegal DC VLC\n");
2763         return -1;
2764     }
2765     if (dcdiff)
2766     {
2767         if (dcdiff == 119 /* ESC index value */)
2768         {
2769             /* TODO: Optimize */
2770             if (mquant == 1) dcdiff = get_bits(gb, 10);
2771             else if (mquant == 2) dcdiff = get_bits(gb, 9);
2772             else dcdiff = get_bits(gb, 8);
2773         }
2774         else
2775         {
2776             if (mquant == 1)
2777                 dcdiff = (dcdiff<<2) + get_bits(gb, 2) - 3;
2778             else if (mquant == 2)
2779                 dcdiff = (dcdiff<<1) + get_bits(gb, 1) - 1;
2780         }
2781         if (get_bits(gb, 1))
2782             dcdiff = -dcdiff;
2783     }
2784
2785     /* Prediction */
2786     dcdiff += vc1_pred_dc(&v->s, v->overlap, mquant, n, v->a_avail, v->c_avail, &dc_val, &dc_pred_dir);
2787     *dc_val = dcdiff;
2788
2789     /* Store the quantized DC coeff, used for prediction */
2790     if (n < 4) {
2791         block[0] = dcdiff * s->y_dc_scale;
2792     } else {
2793         block[0] = dcdiff * s->c_dc_scale;
2794     }
2795     /* Skip ? */
2796     run_diff = 0;
2797     i = 0;
2798
2799     //AC Decoding
2800     i = 1;
2801
2802     /* check if AC is needed at all and adjust direction if needed */
2803     if(!a_avail) dc_pred_dir = 1;
2804     if(!c_avail) dc_pred_dir = 0;
2805     if(!a_avail && !c_avail) use_pred = 0;
2806     ac_val = s->ac_val[0][0] + s->block_index[n] * 16;
2807     ac_val2 = ac_val;
2808
2809     scale = mquant * 2 + v->halfpq;
2810
2811     if(dc_pred_dir) //left
2812         ac_val -= 16;
2813     else //top
2814         ac_val -= 16 * s->block_wrap[n];
2815
2816     q1 = s->current_picture.qscale_table[mb_pos];
2817     if(dc_pred_dir && c_avail) q2 = s->current_picture.qscale_table[mb_pos - 1];
2818     if(!dc_pred_dir && a_avail) q2 = s->current_picture.qscale_table[mb_pos - s->mb_stride];
2819     if(n && n<4) q2 = q1;
2820
2821     if(coded) {
2822         int last = 0, skip, value;
2823         const int8_t *zz_table;
2824         int k;
2825
2826         if(v->s.ac_pred) {
2827             if(!dc_pred_dir)
2828                 zz_table = vc1_horizontal_zz;
2829             else
2830                 zz_table = vc1_vertical_zz;
2831         } else
2832             zz_table = vc1_normal_zz;
2833
2834         while (!last) {
2835             vc1_decode_ac_coeff(v, &last, &skip, &value, codingset);
2836             i += skip;
2837             if(i > 63)
2838                 break;
2839             block[zz_table[i++]] = value;
2840         }
2841
2842         /* apply AC prediction if needed */
2843         if(use_pred) {
2844             /* scale predictors if needed*/
2845             if(q2 && q1!=q2) {
2846                 q1 = q1 * 2 - 1;
2847                 q2 = q2 * 2 - 1;
2848
2849                 if(dc_pred_dir) { //left
2850                     for(k = 1; k < 8; k++)
2851                         block[k << 3] += (ac_val[k] * q2 * vc1_dqscale[q1 - 1] + 0x20000) >> 18;
2852                 } else { //top
2853                     for(k = 1; k < 8; k++)
2854                         block[k] += (ac_val[k + 8] * q2 * vc1_dqscale[q1 - 1] + 0x20000) >> 18;
2855                 }
2856             } else {
2857                 if(dc_pred_dir) { //left
2858                     for(k = 1; k < 8; k++)
2859                         block[k << 3] += ac_val[k];
2860                 } else { //top
2861                     for(k = 1; k < 8; k++)
2862                         block[k] += ac_val[k + 8];
2863                 }
2864             }
2865         }
2866         /* save AC coeffs for further prediction */
2867         for(k = 1; k < 8; k++) {
2868             ac_val2[k] = block[k << 3];
2869             ac_val2[k + 8] = block[k];
2870         }
2871
2872         /* scale AC coeffs */
2873         for(k = 1; k < 64; k++)
2874             if(block[k]) {
2875                 block[k] *= scale;
2876                 if(!v->pquantizer)
2877                     block[k] += (block[k] < 0) ? -mquant : mquant;
2878             }
2879
2880         if(use_pred) i = 63;
2881     } else { // no AC coeffs
2882         int k;
2883
2884         memset(ac_val2, 0, 16 * 2);
2885         if(dc_pred_dir) {//left
2886             if(use_pred) {
2887                 memcpy(ac_val2, ac_val, 8 * 2);
2888                 if(q2 && q1!=q2) {
2889                     q1 = q1 * 2 - 1;
2890                     q2 = q2 * 2 - 1;
2891                     for(k = 1; k < 8; k++)
2892                         ac_val2[k] = (ac_val2[k] * q2 * vc1_dqscale[q1 - 1] + 0x20000) >> 18;
2893                 }
2894             }
2895         } else {//top
2896             if(use_pred) {
2897                 memcpy(ac_val2 + 8, ac_val + 8, 8 * 2);
2898                 if(q2 && q1!=q2) {
2899                     q1 = q1 * 2 - 1;
2900                     q2 = q2 * 2 - 1;
2901                     for(k = 1; k < 8; k++)
2902                         ac_val2[k + 8] = (ac_val2[k + 8] * q2 * vc1_dqscale[q1 - 1] + 0x20000) >> 18;
2903                 }
2904             }
2905         }
2906
2907         /* apply AC prediction if needed */
2908         if(use_pred) {
2909             if(dc_pred_dir) { //left
2910                 for(k = 1; k < 8; k++) {
2911                     block[k << 3] = ac_val2[k] * scale;
2912                     if(!v->pquantizer && block[k << 3])
2913                         block[k << 3] += (block[k << 3] < 0) ? -mquant : mquant;
2914                 }
2915             } else { //top
2916                 for(k = 1; k < 8; k++) {
2917                     block[k] = ac_val2[k + 8] * scale;
2918                     if(!v->pquantizer && block[k])
2919                         block[k] += (block[k] < 0) ? -mquant : mquant;
2920                 }
2921             }
2922             i = 63;
2923         }
2924     }
2925     s->block_last_index[n] = i;
2926
2927     return 0;
2928 }
2929
2930 /** Decode intra block in inter frames - more generic version than vc1_decode_i_block
2931  * @param v VC1Context
2932  * @param block block to decode
2933  * @param coded are AC coeffs present or not
2934  * @param mquant block quantizer
2935  * @param codingset set of VLC to decode data
2936  */
2937 static int vc1_decode_intra_block(VC1Context *v, DCTELEM block[64], int n, int coded, int mquant, int codingset)
2938 {
2939     GetBitContext *gb = &v->s.gb;
2940     MpegEncContext *s = &v->s;
2941     int dc_pred_dir = 0; /* Direction of the DC prediction used */
2942     int run_diff, i;
2943     int16_t *dc_val;
2944     int16_t *ac_val, *ac_val2;
2945     int dcdiff;
2946     int mb_pos = s->mb_x + s->mb_y * s->mb_stride;
2947     int a_avail = v->a_avail, c_avail = v->c_avail;
2948     int use_pred = s->ac_pred;
2949     int scale;
2950     int q1, q2 = 0;
2951
2952     /* XXX: Guard against dumb values of mquant */
2953     mquant = (mquant < 1) ? 0 : ( (mquant>31) ? 31 : mquant );
2954
2955     /* Set DC scale - y and c use the same */
2956     s->y_dc_scale = s->y_dc_scale_table[mquant];
2957     s->c_dc_scale = s->c_dc_scale_table[mquant];
2958
2959     /* Get DC differential */
2960     if (n < 4) {
2961         dcdiff = get_vlc2(&s->gb, ff_msmp4_dc_luma_vlc[s->dc_table_index].table, DC_VLC_BITS, 3);
2962     } else {
2963         dcdiff = get_vlc2(&s->gb, ff_msmp4_dc_chroma_vlc[s->dc_table_index].table, DC_VLC_BITS, 3);
2964     }
2965     if (dcdiff < 0){
2966         av_log(s->avctx, AV_LOG_ERROR, "Illegal DC VLC\n");
2967         return -1;
2968     }
2969     if (dcdiff)
2970     {
2971         if (dcdiff == 119 /* ESC index value */)
2972         {
2973             /* TODO: Optimize */
2974             if (mquant == 1) dcdiff = get_bits(gb, 10);
2975             else if (mquant == 2) dcdiff = get_bits(gb, 9);
2976             else dcdiff = get_bits(gb, 8);
2977         }
2978         else
2979         {
2980             if (mquant == 1)
2981                 dcdiff = (dcdiff<<2) + get_bits(gb, 2) - 3;
2982             else if (mquant == 2)
2983                 dcdiff = (dcdiff<<1) + get_bits(gb, 1) - 1;
2984         }
2985         if (get_bits(gb, 1))
2986             dcdiff = -dcdiff;
2987     }
2988
2989     /* Prediction */
2990     dcdiff += vc1_pred_dc(&v->s, v->overlap, mquant, n, a_avail, c_avail, &dc_val, &dc_pred_dir);
2991     *dc_val = dcdiff;
2992
2993     /* Store the quantized DC coeff, used for prediction */
2994
2995     if (n < 4) {
2996         block[0] = dcdiff * s->y_dc_scale;
2997     } else {
2998         block[0] = dcdiff * s->c_dc_scale;
2999     }
3000     /* Skip ? */
3001     run_diff = 0;
3002     i = 0;
3003
3004     //AC Decoding
3005     i = 1;
3006
3007     /* check if AC is needed at all and adjust direction if needed */
3008     if(!a_avail) dc_pred_dir = 1;
3009     if(!c_avail) dc_pred_dir = 0;
3010     if(!a_avail && !c_avail) use_pred = 0;
3011     ac_val = s->ac_val[0][0] + s->block_index[n] * 16;
3012     ac_val2 = ac_val;
3013
3014     scale = mquant * 2 + v->halfpq;
3015
3016     if(dc_pred_dir) //left
3017         ac_val -= 16;
3018     else //top
3019         ac_val -= 16 * s->block_wrap[n];
3020
3021     q1 = s->current_picture.qscale_table[mb_pos];
3022     if(dc_pred_dir && c_avail) q2 = s->current_picture.qscale_table[mb_pos - 1];
3023     if(!dc_pred_dir && a_avail) q2 = s->current_picture.qscale_table[mb_pos - s->mb_stride];
3024     if(n && n<4) q2 = q1;
3025
3026     if(coded) {
3027         int last = 0, skip, value;
3028         const int8_t *zz_table;
3029         int k;
3030
3031         zz_table = vc1_simple_progressive_8x8_zz;
3032
3033         while (!last) {
3034             vc1_decode_ac_coeff(v, &last, &skip, &value, codingset);
3035             i += skip;
3036             if(i > 63)
3037                 break;
3038             block[zz_table[i++]] = value;
3039         }
3040
3041         /* apply AC prediction if needed */
3042         if(use_pred) {
3043             /* scale predictors if needed*/
3044             if(q2 && q1!=q2) {
3045                 q1 = q1 * 2 - 1;
3046                 q2 = q2 * 2 - 1;
3047
3048                 if(dc_pred_dir) { //left
3049                     for(k = 1; k < 8; k++)
3050                         block[k << 3] += (ac_val[k] * q2 * vc1_dqscale[q1 - 1] + 0x20000) >> 18;
3051                 } else { //top
3052                     for(k = 1; k < 8; k++)
3053                         block[k] += (ac_val[k + 8] * q2 * vc1_dqscale[q1 - 1] + 0x20000) >> 18;
3054                 }
3055             } else {
3056                 if(dc_pred_dir) { //left
3057                     for(k = 1; k < 8; k++)
3058                         block[k << 3] += ac_val[k];
3059                 } else { //top
3060                     for(k = 1; k < 8; k++)
3061                         block[k] += ac_val[k + 8];
3062                 }
3063             }
3064         }
3065         /* save AC coeffs for further prediction */
3066         for(k = 1; k < 8; k++) {
3067             ac_val2[k] = block[k << 3];
3068             ac_val2[k + 8] = block[k];
3069         }
3070
3071         /* scale AC coeffs */
3072         for(k = 1; k < 64; k++)
3073             if(block[k]) {
3074                 block[k] *= scale;
3075                 if(!v->pquantizer)
3076                     block[k] += (block[k] < 0) ? -mquant : mquant;
3077             }
3078
3079         if(use_pred) i = 63;
3080     } else { // no AC coeffs
3081         int k;
3082
3083         memset(ac_val2, 0, 16 * 2);
3084         if(dc_pred_dir) {//left
3085             if(use_pred) {
3086                 memcpy(ac_val2, ac_val, 8 * 2);
3087                 if(q2 && q1!=q2) {
3088                     q1 = q1 * 2 - 1;
3089                     q2 = q2 * 2 - 1;
3090                     for(k = 1; k < 8; k++)
3091                         ac_val2[k] = (ac_val2[k] * q2 * vc1_dqscale[q1 - 1] + 0x20000) >> 18;
3092                 }
3093             }
3094         } else {//top
3095             if(use_pred) {
3096                 memcpy(ac_val2 + 8, ac_val + 8, 8 * 2);
3097                 if(q2 && q1!=q2) {
3098                     q1 = q1 * 2 - 1;
3099                     q2 = q2 * 2 - 1;
3100                     for(k = 1; k < 8; k++)
3101                         ac_val2[k + 8] = (ac_val2[k + 8] * q2 * vc1_dqscale[q1 - 1] + 0x20000) >> 18;
3102                 }
3103             }
3104         }
3105
3106         /* apply AC prediction if needed */
3107         if(use_pred) {
3108             if(dc_pred_dir) { //left
3109                 for(k = 1; k < 8; k++) {
3110                     block[k << 3] = ac_val2[k] * scale;
3111                     if(!v->pquantizer && block[k << 3])
3112                         block[k << 3] += (block[k << 3] < 0) ? -mquant : mquant;
3113                 }
3114             } else { //top
3115                 for(k = 1; k < 8; k++) {
3116                     block[k] = ac_val2[k + 8] * scale;
3117                     if(!v->pquantizer && block[k])
3118                         block[k] += (block[k] < 0) ? -mquant : mquant;
3119                 }
3120             }
3121             i = 63;
3122         }
3123     }
3124     s->block_last_index[n] = i;
3125
3126     return 0;
3127 }
3128
3129 /** Decode P block
3130  */
3131 static int vc1_decode_p_block(VC1Context *v, DCTELEM block[64], int n, int mquant, int ttmb, int first_block)
3132 {
3133     MpegEncContext *s = &v->s;
3134     GetBitContext *gb = &s->gb;
3135     int i, j;
3136     int subblkpat = 0;
3137     int scale, off, idx, last, skip, value;
3138     int ttblk = ttmb & 7;
3139
3140     if(ttmb == -1) {
3141         ttblk = ttblk_to_tt[v->tt_index][get_vlc2(gb, vc1_ttblk_vlc[v->tt_index].table, VC1_TTBLK_VLC_BITS, 1)];
3142     }
3143     if(ttblk == TT_4X4) {
3144         subblkpat = ~(get_vlc2(gb, vc1_subblkpat_vlc[v->tt_index].table, VC1_SUBBLKPAT_VLC_BITS, 1) + 1);
3145     }
3146     if((ttblk != TT_8X8 && ttblk != TT_4X4) && (v->ttmbf || (ttmb != -1 && (ttmb & 8) && !first_block))) {
3147         subblkpat = decode012(gb);
3148         if(subblkpat) subblkpat ^= 3; //swap decoded pattern bits
3149         if(ttblk == TT_8X4_TOP || ttblk == TT_8X4_BOTTOM) ttblk = TT_8X4;
3150         if(ttblk == TT_4X8_RIGHT || ttblk == TT_4X8_LEFT) ttblk = TT_4X8;
3151     }
3152     scale = 2 * mquant + v->halfpq;
3153
3154     // convert transforms like 8X4_TOP to generic TT and SUBBLKPAT
3155     if(ttblk == TT_8X4_TOP || ttblk == TT_8X4_BOTTOM) {
3156         subblkpat = 2 - (ttblk == TT_8X4_TOP);
3157         ttblk = TT_8X4;
3158     }
3159     if(ttblk == TT_4X8_RIGHT || ttblk == TT_4X8_LEFT) {
3160         subblkpat = 2 - (ttblk == TT_4X8_LEFT);
3161         ttblk = TT_4X8;
3162     }
3163     switch(ttblk) {
3164     case TT_8X8:
3165         i = 0;
3166         last = 0;
3167         while (!last) {
3168             vc1_decode_ac_coeff(v, &last, &skip, &value, v->codingset2);
3169             i += skip;
3170             if(i > 63)
3171                 break;
3172             idx = vc1_simple_progressive_8x8_zz[i++];
3173             block[idx] = value * scale;
3174             if(!v->pquantizer)
3175                 block[idx] += (block[idx] < 0) ? -mquant : mquant;
3176         }
3177         s->dsp.vc1_inv_trans_8x8(block);
3178         break;
3179     case TT_4X4:
3180         for(j = 0; j < 4; j++) {
3181             last = subblkpat & (1 << (3 - j));
3182             i = 0;
3183             off = (j & 1) * 4 + (j & 2) * 16;
3184             while (!last) {
3185                 vc1_decode_ac_coeff(v, &last, &skip, &value, v->codingset2);
3186                 i += skip;
3187                 if(i > 15)
3188                     break;
3189                 idx = vc1_simple_progressive_4x4_zz[i++];
3190                 block[idx + off] = value * scale;
3191                 if(!v->pquantizer)
3192                     block[idx + off] += (block[idx + off] < 0) ? -mquant : mquant;
3193             }
3194             if(!(subblkpat & (1 << (3 - j))))
3195                 s->dsp.vc1_inv_trans_4x4(block, j);
3196         }
3197         break;
3198     case TT_8X4:
3199         for(j = 0; j < 2; j++) {
3200             last = subblkpat & (1 << (1 - j));
3201             i = 0;
3202             off = j * 32;
3203             while (!last) {
3204                 vc1_decode_ac_coeff(v, &last, &skip, &value, v->codingset2);
3205                 i += skip;
3206                 if(i > 31)
3207                     break;
3208                 if(v->profile < PROFILE_ADVANCED)
3209                     idx = vc1_simple_progressive_8x4_zz[i++];
3210                 else
3211                     idx = vc1_adv_progressive_8x4_zz[i++];
3212                 block[idx + off] = value * scale;
3213                 if(!v->pquantizer)
3214                     block[idx + off] += (block[idx + off] < 0) ? -mquant : mquant;
3215             }
3216             if(!(subblkpat & (1 << (1 - j))))
3217                 s->dsp.vc1_inv_trans_8x4(block, j);
3218         }
3219         break;
3220     case TT_4X8:
3221         for(j = 0; j < 2; j++) {
3222             last = subblkpat & (1 << (1 - j));
3223             i = 0;
3224             off = j * 4;
3225             while (!last) {
3226                 vc1_decode_ac_coeff(v, &last, &skip, &value, v->codingset2);
3227                 i += skip;
3228                 if(i > 31)
3229                     break;
3230                 if(v->profile < PROFILE_ADVANCED)
3231                     idx = vc1_simple_progressive_4x8_zz[i++];
3232                 else
3233                     idx = vc1_adv_progressive_4x8_zz[i++];
3234                 block[idx + off] = value * scale;
3235                 if(!v->pquantizer)
3236                     block[idx + off] += (block[idx + off] < 0) ? -mquant : mquant;
3237             }
3238             if(!(subblkpat & (1 << (1 - j))))
3239                 s->dsp.vc1_inv_trans_4x8(block, j);
3240         }
3241         break;
3242     }
3243     return 0;
3244 }
3245
3246
3247 /** Decode one P-frame MB (in Simple/Main profile)
3248  */
3249 static int vc1_decode_p_mb(VC1Context *v)
3250 {
3251     MpegEncContext *s = &v->s;
3252     GetBitContext *gb = &s->gb;
3253     int i, j;
3254     int mb_pos = s->mb_x + s->mb_y * s->mb_stride;
3255     int cbp; /* cbp decoding stuff */
3256     int mqdiff, mquant; /* MB quantization */
3257     int ttmb = v->ttfrm; /* MB Transform type */
3258     int status;
3259
3260     static const int size_table[6] = { 0, 2, 3, 4, 5, 8 },
3261       offset_table[6] = { 0, 1, 3, 7, 15, 31 };
3262     int mb_has_coeffs = 1; /* last_flag */
3263     int dmv_x, dmv_y; /* Differential MV components */
3264     int index, index1; /* LUT indices */
3265     int val, sign; /* temp values */
3266     int first_block = 1;
3267     int dst_idx, off;
3268     int skipped, fourmv;
3269
3270     mquant = v->pq; /* Loosy initialization */
3271
3272     if (v->mv_type_is_raw)
3273         fourmv = get_bits1(gb);
3274     else
3275         fourmv = v->mv_type_mb_plane[mb_pos];
3276     if (v->skip_is_raw)
3277         skipped = get_bits1(gb);
3278     else
3279         skipped = v->s.mbskip_table[mb_pos];
3280
3281     s->dsp.clear_blocks(s->block[0]);
3282
3283     if (!fourmv) /* 1MV mode */
3284     {
3285         if (!skipped)
3286         {
3287             GET_MVDATA(dmv_x, dmv_y);
3288
3289             if (s->mb_intra) {
3290                 s->current_picture.motion_val[1][s->block_index[0]][0] = 0;
3291                 s->current_picture.motion_val[1][s->block_index[0]][1] = 0;
3292             }
3293             s->current_picture.mb_type[mb_pos] = s->mb_intra ? MB_TYPE_INTRA : MB_TYPE_16x16;
3294             vc1_pred_mv(s, 0, dmv_x, dmv_y, 1, v->range_x, v->range_y, v->mb_type[0]);
3295
3296             /* FIXME Set DC val for inter block ? */
3297             if (s->mb_intra && !mb_has_coeffs)
3298             {
3299                 GET_MQUANT();
3300                 s->ac_pred = get_bits(gb, 1);
3301                 cbp = 0;
3302             }
3303             else if (mb_has_coeffs)
3304             {
3305                 if (s->mb_intra) s->ac_pred = get_bits(gb, 1);
3306                 cbp = get_vlc2(&v->s.gb, v->cbpcy_vlc->table, VC1_CBPCY_P_VLC_BITS, 2);
3307                 GET_MQUANT();
3308             }
3309             else
3310             {
3311                 mquant = v->pq;
3312                 cbp = 0;
3313             }
3314             s->current_picture.qscale_table[mb_pos] = mquant;
3315
3316             if (!v->ttmbf && !s->mb_intra && mb_has_coeffs)
3317                 ttmb = get_vlc2(gb, vc1_ttmb_vlc[v->tt_index].table,
3318                                 VC1_TTMB_VLC_BITS, 2);
3319             if(!s->mb_intra) vc1_mc_1mv(v, 0);
3320             dst_idx = 0;
3321             for (i=0; i<6; i++)
3322             {
3323                 s->dc_val[0][s->block_index[i]] = 0;
3324                 dst_idx += i >> 2;
3325                 val = ((cbp >> (5 - i)) & 1);
3326                 off = (i & 4) ? 0 : ((i & 1) * 8 + (i & 2) * 4 * s->linesize);
3327                 v->mb_type[0][s->block_index[i]] = s->mb_intra;
3328                 if(s->mb_intra) {
3329                     /* check if prediction blocks A and C are available */
3330                     v->a_avail = v->c_avail = 0;
3331                     if(i == 2 || i == 3 || !s->first_slice_line)
3332                         v->a_avail = v->mb_type[0][s->block_index[i] - s->block_wrap[i]];
3333                     if(i == 1 || i == 3 || s->mb_x)
3334                         v->c_avail = v->mb_type[0][s->block_index[i] - 1];
3335
3336                     vc1_decode_intra_block(v, s->block[i], i, val, mquant, (i&4)?v->codingset2:v->codingset);
3337                     if((i>3) && (s->flags & CODEC_FLAG_GRAY)) continue;
3338                     s->dsp.vc1_inv_trans_8x8(s->block[i]);
3339                     if(v->rangeredfrm) for(j = 0; j < 64; j++) s->block[i][j] <<= 1;
3340                     for(j = 0; j < 64; j++) s->block[i][j] += 128;
3341                     s->dsp.put_pixels_clamped(s->block[i], s->dest[dst_idx] + off, s->linesize >> ((i & 4) >> 2));
3342                     if(v->pq >= 9 && v->overlap) {
3343                         if(v->a_avail)
3344                             s->dsp.vc1_v_overlap(s->dest[dst_idx] + off, s->linesize >> ((i & 4) >> 2), (i<4) ? ((i&1)>>1) : (s->mb_y&1));
3345                         if(v->c_avail)
3346                             s->dsp.vc1_h_overlap(s->dest[dst_idx] + off, s->linesize >> ((i & 4) >> 2), (i<4) ? (i&1) : (s->mb_x&1));
3347                     }
3348                 } else if(val) {
3349                     vc1_decode_p_block(v, s->block[i], i, mquant, ttmb, first_block);
3350                     if(!v->ttmbf && ttmb < 8) ttmb = -1;
3351                     first_block = 0;
3352                     if((i<4) || !(s->flags & CODEC_FLAG_GRAY))
3353                         s->dsp.add_pixels_clamped(s->block[i], s->dest[dst_idx] + off, (i&4)?s->uvlinesize:s->linesize);
3354                 }
3355             }
3356         }
3357         else //Skipped
3358         {
3359             s->mb_intra = 0;
3360             for(i = 0; i < 6; i++) {
3361                 v->mb_type[0][s->block_index[i]] = 0;
3362                 s->dc_val[0][s->block_index[i]] = 0;
3363             }
3364             s->current_picture.mb_type[mb_pos] = MB_TYPE_SKIP;
3365             s->current_picture.qscale_table[mb_pos] = 0;
3366             vc1_pred_mv(s, 0, 0, 0, 1, v->range_x, v->range_y, v->mb_type[0]);
3367             vc1_mc_1mv(v, 0);
3368             return 0;
3369         }
3370     } //1MV mode
3371     else //4MV mode
3372     {
3373         if (!skipped /* unskipped MB */)
3374         {
3375             int intra_count = 0, coded_inter = 0;
3376             int is_intra[6], is_coded[6];
3377             /* Get CBPCY */
3378             cbp = get_vlc2(&v->s.gb, v->cbpcy_vlc->table, VC1_CBPCY_P_VLC_BITS, 2);
3379             for (i=0; i<6; i++)
3380             {
3381                 val = ((cbp >> (5 - i)) & 1);
3382                 s->dc_val[0][s->block_index[i]] = 0;
3383                 s->mb_intra = 0;
3384                 if(i < 4) {
3385                     dmv_x = dmv_y = 0;
3386                     s->mb_intra = 0;
3387                     mb_has_coeffs = 0;
3388                     if(val) {
3389                         GET_MVDATA(dmv_x, dmv_y);
3390                     }
3391                     vc1_pred_mv(s, i, dmv_x, dmv_y, 0, v->range_x, v->range_y, v->mb_type[0]);
3392                     if(!s->mb_intra) vc1_mc_4mv_luma(v, i);
3393                     intra_count += s->mb_intra;
3394                     is_intra[i] = s->mb_intra;
3395                     is_coded[i] = mb_has_coeffs;
3396                 }
3397                 if(i&4){
3398                     is_intra[i] = (intra_count >= 3);
3399                     is_coded[i] = val;
3400                 }
3401                 if(i == 4) vc1_mc_4mv_chroma(v);
3402                 v->mb_type[0][s->block_index[i]] = is_intra[i];
3403                 if(!coded_inter) coded_inter = !is_intra[i] & is_coded[i];
3404             }
3405             // if there are no coded blocks then don't do anything more
3406             if(!intra_count && !coded_inter) return 0;
3407             dst_idx = 0;
3408             GET_MQUANT();
3409             s->current_picture.qscale_table[mb_pos] = mquant;
3410             /* test if block is intra and has pred */
3411             {
3412                 int intrapred = 0;
3413                 for(i=0; i<6; i++)
3414                     if(is_intra[i]) {
3415                         if(((!s->first_slice_line || (i==2 || i==3)) && v->mb_type[0][s->block_index[i] - s->block_wrap[i]])
3416                             || ((s->mb_x || (i==1 || i==3)) && v->mb_type[0][s->block_index[i] - 1])) {
3417                             intrapred = 1;
3418                             break;
3419                         }
3420                     }
3421                 if(intrapred)s->ac_pred = get_bits(gb, 1);
3422                 else s->ac_pred = 0;
3423             }
3424             if (!v->ttmbf && coded_inter)
3425                 ttmb = get_vlc2(gb, vc1_ttmb_vlc[v->tt_index].table, VC1_TTMB_VLC_BITS, 2);
3426             for (i=0; i<6; i++)
3427             {
3428                 dst_idx += i >> 2;
3429                 off = (i & 4) ? 0 : ((i & 1) * 8 + (i & 2) * 4 * s->linesize);
3430                 s->mb_intra = is_intra[i];
3431                 if (is_intra[i]) {
3432                     /* check if prediction blocks A and C are available */
3433                     v->a_avail = v->c_avail = 0;
3434                     if(i == 2 || i == 3 || !s->first_slice_line)
3435                         v->a_avail = v->mb_type[0][s->block_index[i] - s->block_wrap[i]];
3436                     if(i == 1 || i == 3 || s->mb_x)
3437                         v->c_avail = v->mb_type[0][s->block_index[i] - 1];
3438
3439                     vc1_decode_intra_block(v, s->block[i], i, is_coded[i], mquant, (i&4)?v->codingset2:v->codingset);
3440                     if((i>3) && (s->flags & CODEC_FLAG_GRAY)) continue;
3441                     s->dsp.vc1_inv_trans_8x8(s->block[i]);
3442                     if(v->rangeredfrm) for(j = 0; j < 64; j++) s->block[i][j] <<= 1;
3443                     for(j = 0; j < 64; j++) s->block[i][j] += 128;
3444                     s->dsp.put_pixels_clamped(s->block[i], s->dest[dst_idx] + off, (i&4)?s->uvlinesize:s->linesize);
3445                     if(v->pq >= 9 && v->overlap) {
3446                         if(v->a_avail)
3447                             s->dsp.vc1_v_overlap(s->dest[dst_idx] + off, s->linesize >> ((i & 4) >> 2), (i<4) ? ((i&1)>>1) : (s->mb_y&1));
3448                         if(v->c_avail)
3449                             s->dsp.vc1_h_overlap(s->dest[dst_idx] + off, s->linesize >> ((i & 4) >> 2), (i<4) ? (i&1) : (s->mb_x&1));
3450                     }
3451                 } else if(is_coded[i]) {
3452                     status = vc1_decode_p_block(v, s->block[i], i, mquant, ttmb, first_block);
3453                     if(!v->ttmbf && ttmb < 8) ttmb = -1;
3454                     first_block = 0;
3455                     if((i<4) || !(s->flags & CODEC_FLAG_GRAY))
3456                         s->dsp.add_pixels_clamped(s->block[i], s->dest[dst_idx] + off, (i&4)?s->uvlinesize:s->linesize);
3457                 }
3458             }
3459             return status;
3460         }
3461         else //Skipped MB
3462         {
3463             s->mb_intra = 0;
3464             s->current_picture.qscale_table[mb_pos] = 0;
3465             for (i=0; i<6; i++) {
3466                 v->mb_type[0][s->block_index[i]] = 0;
3467                 s->dc_val[0][s->block_index[i]] = 0;
3468             }
3469             for (i=0; i<4; i++)
3470             {
3471                 vc1_pred_mv(s, i, 0, 0, 0, v->range_x, v->range_y, v->mb_type[0]);
3472                 vc1_mc_4mv_luma(v, i);
3473             }
3474             vc1_mc_4mv_chroma(v);
3475             s->current_picture.qscale_table[mb_pos] = 0;
3476             return 0;
3477         }
3478     }
3479
3480     /* Should never happen */
3481     return -1;
3482 }
3483
3484 /** Decode one B-frame MB (in Main profile)
3485  */
3486 static void vc1_decode_b_mb(VC1Context *v)
3487 {
3488     MpegEncContext *s = &v->s;
3489     GetBitContext *gb = &s->gb;
3490     int i, j;
3491     int mb_pos = s->mb_x + s->mb_y * s->mb_stride;
3492     int cbp = 0; /* cbp decoding stuff */
3493     int mqdiff, mquant; /* MB quantization */
3494     int ttmb = v->ttfrm; /* MB Transform type */
3495
3496     static const int size_table[6] = { 0, 2, 3, 4, 5, 8 },
3497       offset_table[6] = { 0, 1, 3, 7, 15, 31 };
3498     int mb_has_coeffs = 0; /* last_flag */
3499     int index, index1; /* LUT indices */
3500     int val, sign; /* temp values */
3501     int first_block = 1;
3502     int dst_idx, off;
3503     int skipped, direct;
3504     int dmv_x[2], dmv_y[2];
3505     int bmvtype = BMV_TYPE_BACKWARD;
3506
3507     mquant = v->pq; /* Loosy initialization */
3508     s->mb_intra = 0;
3509
3510     if (v->dmb_is_raw)
3511         direct = get_bits1(gb);
3512     else
3513         direct = v->direct_mb_plane[mb_pos];
3514     if (v->skip_is_raw)
3515         skipped = get_bits1(gb);
3516     else
3517         skipped = v->s.mbskip_table[mb_pos];
3518
3519     s->dsp.clear_blocks(s->block[0]);
3520     dmv_x[0] = dmv_x[1] = dmv_y[0] = dmv_y[1] = 0;
3521     for(i = 0; i < 6; i++) {
3522         v->mb_type[0][s->block_index[i]] = 0;
3523         s->dc_val[0][s->block_index[i]] = 0;
3524     }
3525     s->current_picture.qscale_table[mb_pos] = 0;
3526
3527     if (!direct) {
3528         if (!skipped) {
3529             GET_MVDATA(dmv_x[0], dmv_y[0]);
3530             dmv_x[1] = dmv_x[0];
3531             dmv_y[1] = dmv_y[0];
3532         }
3533         if(skipped || !s->mb_intra) {
3534             bmvtype = decode012(gb);
3535             switch(bmvtype) {
3536             case 0:
3537                 bmvtype = (v->bfraction >= (B_FRACTION_DEN/2)) ? BMV_TYPE_BACKWARD : BMV_TYPE_FORWARD;
3538                 break;
3539             case 1:
3540                 bmvtype = (v->bfraction >= (B_FRACTION_DEN/2)) ? BMV_TYPE_FORWARD : BMV_TYPE_BACKWARD;
3541                 break;
3542             case 2:
3543                 bmvtype = BMV_TYPE_INTERPOLATED;
3544                 dmv_x[0] = dmv_y[0] = 0;
3545             }
3546         }
3547     }
3548     for(i = 0; i < 6; i++)
3549         v->mb_type[0][s->block_index[i]] = s->mb_intra;
3550
3551     if (skipped) {
3552         if(direct) bmvtype = BMV_TYPE_INTERPOLATED;
3553         vc1_pred_b_mv(v, dmv_x, dmv_y, direct, bmvtype);
3554         vc1_b_mc(v, dmv_x, dmv_y, direct, bmvtype);
3555         return;
3556     }
3557     if (direct) {
3558         cbp = get_vlc2(&v->s.gb, v->cbpcy_vlc->table, VC1_CBPCY_P_VLC_BITS, 2);
3559         GET_MQUANT();
3560         s->mb_intra = 0;
3561         mb_has_coeffs = 0;
3562         s->current_picture.qscale_table[mb_pos] = mquant;
3563         if(!v->ttmbf)
3564             ttmb = get_vlc2(gb, vc1_ttmb_vlc[v->tt_index].table, VC1_TTMB_VLC_BITS, 2);
3565         dmv_x[0] = dmv_y[0] = dmv_x[1] = dmv_y[1] = 0;
3566         vc1_pred_b_mv(v, dmv_x, dmv_y, direct, bmvtype);
3567         vc1_b_mc(v, dmv_x, dmv_y, direct, bmvtype);
3568     } else {
3569         if(!mb_has_coeffs && !s->mb_intra) {
3570             /* no coded blocks - effectively skipped */
3571             vc1_pred_b_mv(v, dmv_x, dmv_y, direct, bmvtype);
3572             vc1_b_mc(v, dmv_x, dmv_y, direct, bmvtype);
3573             return;
3574         }
3575         if(s->mb_intra && !mb_has_coeffs) {
3576             GET_MQUANT();
3577             s->current_picture.qscale_table[mb_pos] = mquant;
3578             s->ac_pred = get_bits1(gb);
3579             cbp = 0;
3580             vc1_pred_b_mv(v, dmv_x, dmv_y, direct, bmvtype);
3581         } else {
3582             if(bmvtype == BMV_TYPE_INTERPOLATED) {
3583                 GET_MVDATA(dmv_x[0], dmv_y[0]);
3584                 if(!mb_has_coeffs) {
3585                     /* interpolated skipped block */
3586                     vc1_pred_b_mv(v, dmv_x, dmv_y, direct, bmvtype);
3587                     vc1_b_mc(v, dmv_x, dmv_y, direct, bmvtype);
3588                     return;
3589                 }
3590             }
3591             vc1_pred_b_mv(v, dmv_x, dmv_y, direct, bmvtype);
3592             if(!s->mb_intra) {
3593                 vc1_b_mc(v, dmv_x, dmv_y, direct, bmvtype);
3594             }
3595             if(s->mb_intra)
3596                 s->ac_pred = get_bits1(gb);
3597             cbp = get_vlc2(&v->s.gb, v->cbpcy_vlc->table, VC1_CBPCY_P_VLC_BITS, 2);
3598             GET_MQUANT();
3599             s->current_picture.qscale_table[mb_pos] = mquant;
3600             if(!v->ttmbf && !s->mb_intra && mb_has_coeffs)
3601                 ttmb = get_vlc2(gb, vc1_ttmb_vlc[v->tt_index].table, VC1_TTMB_VLC_BITS, 2);
3602         }
3603     }
3604     dst_idx = 0;
3605     for (i=0; i<6; i++)
3606     {
3607         s->dc_val[0][s->block_index[i]] = 0;
3608         dst_idx += i >> 2;
3609         val = ((cbp >> (5 - i)) & 1);
3610         off = (i & 4) ? 0 : ((i & 1) * 8 + (i & 2) * 4 * s->linesize);
3611         v->mb_type[0][s->block_index[i]] = s->mb_intra;
3612         if(s->mb_intra) {
3613             /* check if prediction blocks A and C are available */
3614             v->a_avail = v->c_avail = 0;
3615             if(i == 2 || i == 3 || !s->first_slice_line)
3616                 v->a_avail = v->mb_type[0][s->block_index[i] - s->block_wrap[i]];
3617             if(i == 1 || i == 3 || s->mb_x)
3618                 v->c_avail = v->mb_type[0][s->block_index[i] - 1];
3619
3620             vc1_decode_intra_block(v, s->block[i], i, val, mquant, (i&4)?v->codingset2:v->codingset);
3621             if((i>3) && (s->flags & CODEC_FLAG_GRAY)) continue;
3622             s->dsp.vc1_inv_trans_8x8(s->block[i]);
3623             if(v->rangeredfrm) for(j = 0; j < 64; j++) s->block[i][j] <<= 1;
3624             for(j = 0; j < 64; j++) s->block[i][j] += 128;
3625             s->dsp.put_pixels_clamped(s->block[i], s->dest[dst_idx] + off, s->linesize >> ((i & 4) >> 2));
3626         } else if(val) {
3627             vc1_decode_p_block(v, s->block[i], i, mquant, ttmb, first_block);
3628             if(!v->ttmbf && ttmb < 8) ttmb = -1;
3629             first_block = 0;
3630             if((i<4) || !(s->flags & CODEC_FLAG_GRAY))
3631                 s->dsp.add_pixels_clamped(s->block[i], s->dest[dst_idx] + off, (i&4)?s->uvlinesize:s->linesize);
3632         }
3633     }
3634 }
3635
3636 /** Decode blocks of I-frame
3637  */
3638 static void vc1_decode_i_blocks(VC1Context *v)
3639 {
3640     int k, j;
3641     MpegEncContext *s = &v->s;
3642     int cbp, val;
3643     uint8_t *coded_val;
3644     int mb_pos;
3645
3646     /* select codingmode used for VLC tables selection */
3647     switch(v->y_ac_table_index){
3648     case 0:
3649         v->codingset = (v->pqindex <= 8) ? CS_HIGH_RATE_INTRA : CS_LOW_MOT_INTRA;
3650         break;
3651     case 1:
3652         v->codingset = CS_HIGH_MOT_INTRA;
3653         break;
3654     case 2:
3655         v->codingset = CS_MID_RATE_INTRA;
3656         break;
3657     }
3658
3659     switch(v->c_ac_table_index){
3660     case 0:
3661         v->codingset2 = (v->pqindex <= 8) ? CS_HIGH_RATE_INTER : CS_LOW_MOT_INTER;
3662         break;
3663     case 1:
3664         v->codingset2 = CS_HIGH_MOT_INTER;
3665         break;
3666     case 2:
3667         v->codingset2 = CS_MID_RATE_INTER;
3668         break;
3669     }
3670
3671     /* Set DC scale - y and c use the same */
3672     s->y_dc_scale = s->y_dc_scale_table[v->pq];
3673     s->c_dc_scale = s->c_dc_scale_table[v->pq];
3674
3675     //do frame decode
3676     s->mb_x = s->mb_y = 0;
3677     s->mb_intra = 1;
3678     s->first_slice_line = 1;
3679     ff_er_add_slice(s, 0, 0, s->mb_width - 1, s->mb_height - 1, (AC_END|DC_END|MV_END));
3680     for(s->mb_y = 0; s->mb_y < s->mb_height; s->mb_y++) {
3681         for(s->mb_x = 0; s->mb_x < s->mb_width; s->mb_x++) {
3682             ff_init_block_index(s);
3683             ff_update_block_index(s);
3684             s->dsp.clear_blocks(s->block[0]);
3685             mb_pos = s->mb_x + s->mb_y * s->mb_width;
3686             s->current_picture.mb_type[mb_pos] = MB_TYPE_INTRA;
3687             s->current_picture.qscale_table[mb_pos] = v->pq;
3688             s->current_picture.motion_val[1][s->block_index[0]][0] = 0;
3689             s->current_picture.motion_val[1][s->block_index[0]][1] = 0;
3690
3691             // do actual MB decoding and displaying
3692             cbp = get_vlc2(&v->s.gb, ff_msmp4_mb_i_vlc.table, MB_INTRA_VLC_BITS, 2);
3693             v->s.ac_pred = get_bits(&v->s.gb, 1);
3694
3695             for(k = 0; k < 6; k++) {
3696                 val = ((cbp >> (5 - k)) & 1);
3697
3698                 if (k < 4) {
3699                     int pred = vc1_coded_block_pred(&v->s, k, &coded_val);
3700                     val = val ^ pred;
3701                     *coded_val = val;
3702                 }
3703                 cbp |= val << (5 - k);
3704
3705                 vc1_decode_i_block(v, s->block[k], k, val, (k<4)? v->codingset : v->codingset2);
3706
3707                 s->dsp.vc1_inv_trans_8x8(s->block[k]);
3708                 if(v->pq >= 9 && v->overlap) {
3709                     for(j = 0; j < 64; j++) s->block[k][j] += 128;
3710                 }
3711             }
3712
3713             vc1_put_block(v, s->block);
3714             if(v->pq >= 9 && v->overlap) {
3715                 if(!s->first_slice_line) {
3716                     s->dsp.vc1_v_overlap(s->dest[0], s->linesize, 0);
3717                     s->dsp.vc1_v_overlap(s->dest[0] + 8, s->linesize, 0);
3718                     if(!(s->flags & CODEC_FLAG_GRAY)) {
3719                         s->dsp.vc1_v_overlap(s->dest[1], s->uvlinesize, s->mb_y&1);
3720                         s->dsp.vc1_v_overlap(s->dest[2], s->uvlinesize, s->mb_y&1);
3721                     }
3722                 }
3723                 s->dsp.vc1_v_overlap(s->dest[0] + 8 * s->linesize, s->linesize, 1);
3724                 s->dsp.vc1_v_overlap(s->dest[0] + 8 * s->linesize + 8, s->linesize, 1);
3725                 if(s->mb_x) {
3726                     s->dsp.vc1_h_overlap(s->dest[0], s->linesize, 0);
3727                     s->dsp.vc1_h_overlap(s->dest[0] + 8 * s->linesize, s->linesize, 0);
3728                     if(!(s->flags & CODEC_FLAG_GRAY)) {
3729                         s->dsp.vc1_h_overlap(s->dest[1], s->uvlinesize, s->mb_x&1);
3730                         s->dsp.vc1_h_overlap(s->dest[2], s->uvlinesize, s->mb_x&1);
3731                     }
3732                 }
3733                 s->dsp.vc1_h_overlap(s->dest[0] + 8, s->linesize, 1);
3734                 s->dsp.vc1_h_overlap(s->dest[0] + 8 * s->linesize + 8, s->linesize, 1);
3735             }
3736
3737             if(get_bits_count(&s->gb) > v->bits) {
3738                 av_log(s->avctx, AV_LOG_ERROR, "Bits overconsumption: %i > %i\n", get_bits_count(&s->gb), v->bits);
3739                 return;
3740             }
3741         }
3742         ff_draw_horiz_band(s, s->mb_y * 16, 16);
3743         s->first_slice_line = 0;
3744     }
3745 }
3746
3747 /** Decode blocks of I-frame for advanced profile
3748  */
3749 static void vc1_decode_i_blocks_adv(VC1Context *v)
3750 {
3751     int k, j;
3752     MpegEncContext *s = &v->s;
3753     int cbp, val;
3754     uint8_t *coded_val;
3755     int mb_pos;
3756     int mquant = v->pq;
3757     int mqdiff;
3758     int overlap;
3759     GetBitContext *gb = &s->gb;
3760
3761     /* select codingmode used for VLC tables selection */
3762     switch(v->y_ac_table_index){
3763     case 0:
3764         v->codingset = (v->pqindex <= 8) ? CS_HIGH_RATE_INTRA : CS_LOW_MOT_INTRA;
3765         break;
3766     case 1:
3767         v->codingset = CS_HIGH_MOT_INTRA;
3768         break;
3769     case 2:
3770         v->codingset = CS_MID_RATE_INTRA;
3771         break;
3772     }
3773
3774     switch(v->c_ac_table_index){
3775     case 0:
3776         v->codingset2 = (v->pqindex <= 8) ? CS_HIGH_RATE_INTER : CS_LOW_MOT_INTER;
3777         break;
3778     case 1:
3779         v->codingset2 = CS_HIGH_MOT_INTER;
3780         break;
3781     case 2:
3782         v->codingset2 = CS_MID_RATE_INTER;
3783         break;
3784     }
3785
3786     /* Set DC scale - y and c use the same */
3787     s->y_dc_scale = s->y_dc_scale_table[v->pq];
3788     s->c_dc_scale = s->c_dc_scale_table[v->pq];
3789
3790     //do frame decode
3791     s->mb_x = s->mb_y = 0;
3792     s->mb_intra = 1;
3793     s->first_slice_line = 1;
3794     ff_er_add_slice(s, 0, 0, s->mb_width - 1, s->mb_height - 1, (AC_END|DC_END|MV_END));
3795     for(s->mb_y = 0; s->mb_y < s->mb_height; s->mb_y++) {
3796         for(s->mb_x = 0; s->mb_x < s->mb_width; s->mb_x++) {
3797             ff_init_block_index(s);
3798             ff_update_block_index(s);
3799             s->dsp.clear_blocks(s->block[0]);
3800             mb_pos = s->mb_x + s->mb_y * s->mb_stride;
3801             s->current_picture.mb_type[mb_pos] = MB_TYPE_INTRA;
3802             s->current_picture.motion_val[1][s->block_index[0]][0] = 0;
3803             s->current_picture.motion_val[1][s->block_index[0]][1] = 0;
3804
3805             // do actual MB decoding and displaying
3806             cbp = get_vlc2(&v->s.gb, ff_msmp4_mb_i_vlc.table, MB_INTRA_VLC_BITS, 2);
3807             if(v->acpred_is_raw)
3808                 v->s.ac_pred = get_bits(&v->s.gb, 1);
3809             else
3810                 v->s.ac_pred = v->acpred_plane[mb_pos];
3811
3812             if(v->condover == CONDOVER_SELECT) {
3813                 if(v->overflg_is_raw)
3814                     overlap = get_bits(&v->s.gb, 1);
3815                 else
3816                     overlap = v->over_flags_plane[mb_pos];
3817             } else
3818                 overlap = (v->condover == CONDOVER_ALL);
3819
3820             GET_MQUANT();
3821
3822             s->current_picture.qscale_table[mb_pos] = mquant;
3823
3824             for(k = 0; k < 6; k++) {
3825                 val = ((cbp >> (5 - k)) & 1);
3826
3827                 if (k < 4) {
3828                     int pred = vc1_coded_block_pred(&v->s, k, &coded_val);
3829                     val = val ^ pred;
3830                     *coded_val = val;
3831                 }
3832                 cbp |= val << (5 - k);
3833
3834                 v->a_avail = !s->first_slice_line || (k==2 || k==3);
3835                 v->c_avail = !!s->mb_x || (k==1 || k==3);
3836
3837                 vc1_decode_i_block_adv(v, s->block[k], k, val, (k<4)? v->codingset : v->codingset2, mquant);
3838
3839                 s->dsp.vc1_inv_trans_8x8(s->block[k]);
3840                 for(j = 0; j < 64; j++) s->block[k][j] += 128;
3841             }
3842
3843             vc1_put_block(v, s->block);
3844             if(overlap) {
3845                 if(!s->first_slice_line) {
3846                     s->dsp.vc1_v_overlap(s->dest[0], s->linesize, 0);
3847                     s->dsp.vc1_v_overlap(s->dest[0] + 8, s->linesize, 0);
3848                     if(!(s->flags & CODEC_FLAG_GRAY)) {
3849                         s->dsp.vc1_v_overlap(s->dest[1], s->uvlinesize, s->mb_y&1);
3850                         s->dsp.vc1_v_overlap(s->dest[2], s->uvlinesize, s->mb_y&1);
3851                     }
3852                 }
3853                 s->dsp.vc1_v_overlap(s->dest[0] + 8 * s->linesize, s->linesize, 1);
3854                 s->dsp.vc1_v_overlap(s->dest[0] + 8 * s->linesize + 8, s->linesize, 1);
3855                 if(s->mb_x) {
3856                     s->dsp.vc1_h_overlap(s->dest[0], s->linesize, 0);
3857                     s->dsp.vc1_h_overlap(s->dest[0] + 8 * s->linesize, s->linesize, 0);
3858                     if(!(s->flags & CODEC_FLAG_GRAY)) {
3859                         s->dsp.vc1_h_overlap(s->dest[1], s->uvlinesize, s->mb_x&1);
3860                         s->dsp.vc1_h_overlap(s->dest[2], s->uvlinesize, s->mb_x&1);
3861                     }
3862                 }
3863                 s->dsp.vc1_h_overlap(s->dest[0] + 8, s->linesize, 1);
3864                 s->dsp.vc1_h_overlap(s->dest[0] + 8 * s->linesize + 8, s->linesize, 1);
3865             }
3866
3867             if(get_bits_count(&s->gb) > v->bits) {
3868                 av_log(s->avctx, AV_LOG_ERROR, "Bits overconsumption: %i > %i\n", get_bits_count(&s->gb), v->bits);
3869                 return;
3870             }
3871         }
3872         ff_draw_horiz_band(s, s->mb_y * 16, 16);
3873         s->first_slice_line = 0;
3874     }
3875 }
3876
3877 static void vc1_decode_p_blocks(VC1Context *v)
3878 {
3879     MpegEncContext *s = &v->s;
3880
3881     /* select codingmode used for VLC tables selection */
3882     switch(v->c_ac_table_index){
3883     case 0:
3884         v->codingset = (v->pqindex <= 8) ? CS_HIGH_RATE_INTRA : CS_LOW_MOT_INTRA;
3885         break;
3886     case 1:
3887         v->codingset = CS_HIGH_MOT_INTRA;
3888         break;
3889     case 2:
3890         v->codingset = CS_MID_RATE_INTRA;
3891         break;
3892     }
3893
3894     switch(v->c_ac_table_index){
3895     case 0:
3896         v->codingset2 = (v->pqindex <= 8) ? CS_HIGH_RATE_INTER : CS_LOW_MOT_INTER;
3897         break;
3898     case 1:
3899         v->codingset2 = CS_HIGH_MOT_INTER;
3900         break;
3901     case 2:
3902         v->codingset2 = CS_MID_RATE_INTER;
3903         break;
3904     }
3905
3906     ff_er_add_slice(s, 0, 0, s->mb_width - 1, s->mb_height - 1, (AC_END|DC_END|MV_END));
3907     s->first_slice_line = 1;
3908     for(s->mb_y = 0; s->mb_y < s->mb_height; s->mb_y++) {
3909         for(s->mb_x = 0; s->mb_x < s->mb_width; s->mb_x++) {
3910             ff_init_block_index(s);
3911             ff_update_block_index(s);
3912             s->dsp.clear_blocks(s->block[0]);
3913
3914             vc1_decode_p_mb(v);
3915             if(get_bits_count(&s->gb) > v->bits || get_bits_count(&s->gb) < 0) {
3916                 av_log(s->avctx, AV_LOG_ERROR, "Bits overconsumption: %i > %i at %ix%i\n", get_bits_count(&s->gb), v->bits,s->mb_x,s->mb_y);
3917                 return;
3918             }
3919         }
3920         ff_draw_horiz_band(s, s->mb_y * 16, 16);
3921         s->first_slice_line = 0;
3922     }
3923 }
3924
3925 static void vc1_decode_b_blocks(VC1Context *v)
3926 {
3927     MpegEncContext *s = &v->s;
3928
3929     /* select codingmode used for VLC tables selection */
3930     switch(v->c_ac_table_index){
3931     case 0:
3932         v->codingset = (v->pqindex <= 8) ? CS_HIGH_RATE_INTRA : CS_LOW_MOT_INTRA;
3933         break;
3934     case 1:
3935         v->codingset = CS_HIGH_MOT_INTRA;
3936         break;
3937     case 2:
3938         v->codingset = CS_MID_RATE_INTRA;
3939         break;
3940     }
3941
3942     switch(v->c_ac_table_index){
3943     case 0:
3944         v->codingset2 = (v->pqindex <= 8) ? CS_HIGH_RATE_INTER : CS_LOW_MOT_INTER;
3945         break;
3946     case 1:
3947         v->codingset2 = CS_HIGH_MOT_INTER;
3948         break;
3949     case 2:
3950         v->codingset2 = CS_MID_RATE_INTER;
3951         break;
3952     }
3953
3954     ff_er_add_slice(s, 0, 0, s->mb_width - 1, s->mb_height - 1, (AC_END|DC_END|MV_END));
3955     s->first_slice_line = 1;
3956     for(s->mb_y = 0; s->mb_y < s->mb_height; s->mb_y++) {
3957         for(s->mb_x = 0; s->mb_x < s->mb_width; s->mb_x++) {
3958             ff_init_block_index(s);
3959             ff_update_block_index(s);
3960             s->dsp.clear_blocks(s->block[0]);
3961
3962             vc1_decode_b_mb(v);
3963             if(get_bits_count(&s->gb) > v->bits || get_bits_count(&s->gb) < 0) {
3964                 av_log(s->avctx, AV_LOG_ERROR, "Bits overconsumption: %i > %i at %ix%i\n", get_bits_count(&s->gb), v->bits,s->mb_x,s->mb_y);
3965                 return;
3966             }
3967         }
3968         ff_draw_horiz_band(s, s->mb_y * 16, 16);
3969         s->first_slice_line = 0;
3970     }
3971 }
3972
3973 static void vc1_decode_skip_blocks(VC1Context *v)
3974 {
3975     MpegEncContext *s = &v->s;
3976
3977     ff_er_add_slice(s, 0, 0, s->mb_width - 1, s->mb_height - 1, (AC_END|DC_END|MV_END));
3978     s->first_slice_line = 1;
3979     for(s->mb_y = 0; s->mb_y < s->mb_height; s->mb_y++) {
3980         s->mb_x = 0;
3981         ff_init_block_index(s);
3982         ff_update_block_index(s);
3983         memcpy(s->dest[0], s->last_picture.data[0] + s->mb_y * 16 * s->linesize, s->linesize * 16);
3984         memcpy(s->dest[1], s->last_picture.data[1] + s->mb_y * 8 * s->uvlinesize, s->uvlinesize * 8);
3985         memcpy(s->dest[2], s->last_picture.data[2] + s->mb_y * 8 * s->uvlinesize, s->uvlinesize * 8);
3986         ff_draw_horiz_band(s, s->mb_y * 16, 16);
3987         s->first_slice_line = 0;
3988     }
3989     s->pict_type = P_TYPE;
3990 }
3991
3992 static void vc1_decode_blocks(VC1Context *v)
3993 {
3994
3995     v->s.esc3_level_length = 0;
3996
3997     switch(v->s.pict_type) {
3998     case I_TYPE:
3999         if(v->profile == PROFILE_ADVANCED)
4000             vc1_decode_i_blocks_adv(v);
4001         else
4002             vc1_decode_i_blocks(v);
4003         break;
4004     case P_TYPE:
4005         if(v->p_frame_skipped)
4006             vc1_decode_skip_blocks(v);
4007         else
4008             vc1_decode_p_blocks(v);
4009         break;
4010     case B_TYPE:
4011         if(v->bi_type)
4012             vc1_decode_i_blocks(v);
4013         else
4014             vc1_decode_b_blocks(v);
4015         break;
4016     }
4017 }
4018
4019
4020 /** Initialize a VC1/WMV3 decoder
4021  * @todo TODO: Handle VC-1 IDUs (Transport level?)
4022  * @todo TODO: Decypher remaining bits in extra_data
4023  */
4024 static int vc1_decode_init(AVCodecContext *avctx)
4025 {
4026     VC1Context *v = avctx->priv_data;
4027     MpegEncContext *s = &v->s;
4028     GetBitContext gb;
4029
4030     if (!avctx->extradata_size || !avctx->extradata) return -1;
4031     if (!(avctx->flags & CODEC_FLAG_GRAY))
4032         avctx->pix_fmt = PIX_FMT_YUV420P;
4033     else
4034         avctx->pix_fmt = PIX_FMT_GRAY8;
4035     v->s.avctx = avctx;
4036     avctx->flags |= CODEC_FLAG_EMU_EDGE;
4037     v->s.flags |= CODEC_FLAG_EMU_EDGE;
4038
4039     if(ff_h263_decode_init(avctx) < 0)
4040         return -1;
4041     if (vc1_init_common(v) < 0) return -1;
4042
4043     avctx->coded_width = avctx->width;
4044     avctx->coded_height = avctx->height;
4045     if (avctx->codec_id == CODEC_ID_WMV3)
4046     {
4047         int count = 0;
4048
4049         // looks like WMV3 has a sequence header stored in the extradata
4050         // advanced sequence header may be before the first frame
4051         // the last byte of the extradata is a version number, 1 for the
4052         // samples we can decode
4053
4054         init_get_bits(&gb, avctx->extradata, avctx->extradata_size*8);
4055
4056         if (decode_sequence_header(avctx, &gb) < 0)
4057           return -1;
4058
4059         count = avctx->extradata_size*8 - get_bits_count(&gb);
4060         if (count>0)
4061         {
4062             av_log(avctx, AV_LOG_INFO, "Extra data: %i bits left, value: %X\n",
4063                    count, get_bits(&gb, count));
4064         }
4065         else if (count < 0)
4066         {
4067             av_log(avctx, AV_LOG_INFO, "Read %i bits in overflow\n", -count);
4068         }
4069     } else { // VC1/WVC1
4070         int edata_size = avctx->extradata_size;
4071         uint8_t *edata = avctx->extradata;
4072
4073         if(avctx->extradata_size < 16) {
4074             av_log(avctx, AV_LOG_ERROR, "Extradata size too small: %i\n", edata_size);
4075             return -1;
4076         }
4077         while(edata_size > 8) {
4078             // test if we've found header
4079             if(BE_32(edata) == 0x0000010F) {
4080                 edata += 4;
4081                 edata_size -= 4;
4082                 break;
4083             }
4084             edata_size--;
4085             edata++;
4086         }
4087
4088         init_get_bits(&gb, edata, edata_size*8);
4089
4090         if (decode_sequence_header(avctx, &gb) < 0)
4091           return -1;
4092
4093         while(edata_size > 8) {
4094             // test if we've found entry point
4095             if(BE_32(edata) == 0x0000010E) {
4096                 edata += 4;
4097                 edata_size -= 4;
4098                 break;
4099             }
4100             edata_size--;
4101             edata++;
4102         }
4103
4104         init_get_bits(&gb, edata, edata_size*8);
4105
4106         if (decode_entry_point(avctx, &gb) < 0)
4107           return -1;
4108     }
4109     avctx->has_b_frames= !!(avctx->max_b_frames);
4110     s->low_delay = !avctx->has_b_frames;
4111
4112     s->mb_width = (avctx->coded_width+15)>>4;
4113     s->mb_height = (avctx->coded_height+15)>>4;
4114
4115     /* Allocate mb bitplanes */
4116     v->mv_type_mb_plane = av_malloc(s->mb_stride * s->mb_height);
4117     v->direct_mb_plane = av_malloc(s->mb_stride * s->mb_height);
4118     v->acpred_plane = av_malloc(s->mb_stride * s->mb_height);
4119     v->over_flags_plane = av_malloc(s->mb_stride * s->mb_height);
4120
4121     /* allocate block type info in that way so it could be used with s->block_index[] */
4122     v->mb_type_base = av_malloc(s->b8_stride * (s->mb_height * 2 + 1) + s->mb_stride * (s->mb_height + 1) * 2);
4123     v->mb_type[0] = v->mb_type_base + s->b8_stride + 1;
4124     v->mb_type[1] = v->mb_type_base + s->b8_stride * (s->mb_height * 2 + 1) + s->mb_stride + 1;
4125     v->mb_type[2] = v->mb_type[1] + s->mb_stride * (s->mb_height + 1);
4126
4127     /* Init coded blocks info */
4128     if (v->profile == PROFILE_ADVANCED)
4129     {
4130 //        if (alloc_bitplane(&v->over_flags_plane, s->mb_width, s->mb_height) < 0)
4131 //            return -1;
4132 //        if (alloc_bitplane(&v->ac_pred_plane, s->mb_width, s->mb_height) < 0)
4133 //            return -1;
4134     }
4135
4136     return 0;
4137 }
4138
4139
4140 /** Decode a VC1/WMV3 frame
4141  * @todo TODO: Handle VC-1 IDUs (Transport level?)
4142  */
4143 static int vc1_decode_frame(AVCodecContext *avctx,
4144                             void *data, int *data_size,
4145                             uint8_t *buf, int buf_size)
4146 {
4147     VC1Context *v = avctx->priv_data;
4148     MpegEncContext *s = &v->s;
4149     AVFrame *pict = data;
4150     uint8_t *buf2 = NULL;
4151
4152     /* no supplementary picture */
4153     if (buf_size == 0) {
4154         /* special case for last picture */
4155         if (s->low_delay==0 && s->next_picture_ptr) {
4156             *pict= *(AVFrame*)s->next_picture_ptr;
4157             s->next_picture_ptr= NULL;
4158
4159             *data_size = sizeof(AVFrame);
4160         }
4161
4162         return 0;
4163     }
4164
4165     //we need to set current_picture_ptr before reading the header, otherwise we cant store anyting im there
4166     if(s->current_picture_ptr==NULL || s->current_picture_ptr->data[0]){
4167         int i= ff_find_unused_picture(s, 0);
4168         s->current_picture_ptr= &s->picture[i];
4169     }
4170
4171     //for advanced profile we need to unescape buffer
4172     if (avctx->codec_id == CODEC_ID_VC1) {
4173         int i, buf_size2;
4174         buf2 = av_malloc(buf_size + FF_INPUT_BUFFER_PADDING_SIZE);
4175         buf_size2 = 0;
4176         for(i = 0; i < buf_size; i++) {
4177             if(buf[i] == 3 && i >= 2 && !buf[i-1] && !buf[i-2] && i < buf_size-1 && buf[i+1] < 4) {
4178                 buf2[buf_size2++] = buf[i+1];
4179                 i++;
4180             } else
4181                 buf2[buf_size2++] = buf[i];
4182         }
4183         init_get_bits(&s->gb, buf2, buf_size2*8);
4184     } else
4185         init_get_bits(&s->gb, buf, buf_size*8);
4186     // do parse frame header
4187     if(v->profile < PROFILE_ADVANCED) {
4188         if(vc1_parse_frame_header(v, &s->gb) == -1) {
4189             av_free(buf2);
4190             return -1;
4191         }
4192     } else {
4193         if(vc1_parse_frame_header_adv(v, &s->gb) == -1) {
4194             av_free(buf2);
4195             return -1;
4196         }
4197     }
4198
4199     if(s->pict_type != I_TYPE && !v->res_rtm_flag){
4200         av_free(buf2);
4201         return -1;
4202     }
4203
4204     // for hurry_up==5
4205     s->current_picture.pict_type= s->pict_type;
4206     s->current_picture.key_frame= s->pict_type == I_TYPE;
4207
4208     /* skip B-frames if we don't have reference frames */
4209     if(s->last_picture_ptr==NULL && (s->pict_type==B_TYPE || s->dropable)){
4210         av_free(buf2);
4211         return -1;//buf_size;
4212     }
4213     /* skip b frames if we are in a hurry */
4214     if(avctx->hurry_up && s->pict_type==B_TYPE) return -1;//buf_size;
4215     if(   (avctx->skip_frame >= AVDISCARD_NONREF && s->pict_type==B_TYPE)
4216        || (avctx->skip_frame >= AVDISCARD_NONKEY && s->pict_type!=I_TYPE)
4217        ||  avctx->skip_frame >= AVDISCARD_ALL) {
4218         av_free(buf2);
4219         return buf_size;
4220     }
4221     /* skip everything if we are in a hurry>=5 */
4222     if(avctx->hurry_up>=5) {
4223         av_free(buf2);
4224         return -1;//buf_size;
4225     }
4226
4227     if(s->next_p_frame_damaged){
4228         if(s->pict_type==B_TYPE)
4229             return buf_size;
4230         else
4231             s->next_p_frame_damaged=0;
4232     }
4233
4234     if(MPV_frame_start(s, avctx) < 0) {
4235         av_free(buf2);
4236         return -1;
4237     }
4238
4239     ff_er_frame_start(s);
4240
4241     v->bits = buf_size * 8;
4242     vc1_decode_blocks(v);
4243 //av_log(s->avctx, AV_LOG_INFO, "Consumed %i/%i bits\n", get_bits_count(&s->gb), buf_size*8);
4244 //  if(get_bits_count(&s->gb) > buf_size * 8)
4245 //      return -1;
4246     ff_er_frame_end(s);
4247
4248     MPV_frame_end(s);
4249
4250 assert(s->current_picture.pict_type == s->current_picture_ptr->pict_type);
4251 assert(s->current_picture.pict_type == s->pict_type);
4252     if (s->pict_type == B_TYPE || s->low_delay) {
4253         *pict= *(AVFrame*)s->current_picture_ptr;
4254     } else if (s->last_picture_ptr != NULL) {
4255         *pict= *(AVFrame*)s->last_picture_ptr;
4256     }
4257
4258     if(s->last_picture_ptr || s->low_delay){
4259         *data_size = sizeof(AVFrame);
4260         ff_print_debug_info(s, pict);
4261     }
4262
4263     /* Return the Picture timestamp as the frame number */
4264     /* we substract 1 because it is added on utils.c    */
4265     avctx->frame_number = s->picture_number - 1;
4266
4267     av_free(buf2);
4268     return buf_size;
4269 }
4270
4271
4272 /** Close a VC1/WMV3 decoder
4273  * @warning Initial try at using MpegEncContext stuff
4274  */
4275 static int vc1_decode_end(AVCodecContext *avctx)
4276 {
4277     VC1Context *v = avctx->priv_data;
4278
4279     av_freep(&v->hrd_rate);
4280     av_freep(&v->hrd_buffer);
4281     MPV_common_end(&v->s);
4282     av_freep(&v->mv_type_mb_plane);
4283     av_freep(&v->direct_mb_plane);
4284     av_freep(&v->acpred_plane);
4285     av_freep(&v->over_flags_plane);
4286     av_freep(&v->mb_type_base);
4287     return 0;
4288 }
4289
4290
4291 AVCodec vc1_decoder = {
4292     "vc1",
4293     CODEC_TYPE_VIDEO,
4294     CODEC_ID_VC1,
4295     sizeof(VC1Context),
4296     vc1_decode_init,
4297     NULL,
4298     vc1_decode_end,
4299     vc1_decode_frame,
4300     CODEC_CAP_DELAY,
4301     NULL
4302 };
4303
4304 AVCodec wmv3_decoder = {
4305     "wmv3",
4306     CODEC_TYPE_VIDEO,
4307     CODEC_ID_WMV3,
4308     sizeof(VC1Context),
4309     vc1_decode_init,
4310     NULL,
4311     vc1_decode_end,
4312     vc1_decode_frame,
4313     CODEC_CAP_DELAY,
4314     NULL
4315 };