]> git.sesse.net Git - ffmpeg/blob - libswscale/yuv2rgb.c
When converting from a non alpha format to an alpha format, defaults
[ffmpeg] / libswscale / yuv2rgb.c
1 /*
2  * software YUV to RGB converter
3  *
4  * Copyright (C) 2009 Konstantin Shishkov
5  *
6  * MMX/MMX2 template stuff (needed for fast movntq support),
7  * 1,4,8bpp support and context / deglobalize stuff
8  * by Michael Niedermayer (michaelni@gmx.at)
9  *
10  * This file is part of FFmpeg.
11  *
12  * FFmpeg is free software; you can redistribute it and/or
13  * modify it under the terms of the GNU Lesser General Public
14  * License as published by the Free Software Foundation; either
15  * version 2.1 of the License, or (at your option) any later version.
16  *
17  * FFmpeg is distributed in the hope that it will be useful,
18  * but WITHOUT ANY WARRANTY; without even the implied warranty of
19  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
20  * Lesser General Public License for more details.
21  *
22  * You should have received a copy of the GNU Lesser General Public
23  * License along with FFmpeg; if not, write to the Free Software
24  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
25  */
26
27 #include <stdio.h>
28 #include <stdlib.h>
29 #include <inttypes.h>
30 #include <assert.h>
31
32 #include "config.h"
33 #include "rgb2rgb.h"
34 #include "swscale.h"
35 #include "swscale_internal.h"
36
37 #define DITHER1XBPP // only for MMX
38
39 extern const uint8_t dither_8x8_32[8][8];
40 extern const uint8_t dither_8x8_73[8][8];
41 extern const uint8_t dither_8x8_220[8][8];
42
43 #if HAVE_MMX && CONFIG_GPL
44
45 /* hope these constant values are cache line aligned */
46 DECLARE_ASM_CONST(8, uint64_t, mmx_00ffw)   = 0x00ff00ff00ff00ffULL;
47 DECLARE_ASM_CONST(8, uint64_t, mmx_redmask) = 0xf8f8f8f8f8f8f8f8ULL;
48 DECLARE_ASM_CONST(8, uint64_t, mmx_grnmask) = 0xfcfcfcfcfcfcfcfcULL;
49
50 //MMX versions
51 #undef RENAME
52 #undef HAVE_MMX2
53 #undef HAVE_AMD3DNOW
54 #define HAVE_MMX2 0
55 #define HAVE_AMD3DNOW 0
56 #define RENAME(a) a ## _MMX
57 #include "yuv2rgb_template.c"
58
59 //MMX2 versions
60 #undef RENAME
61 #undef HAVE_MMX2
62 #define HAVE_MMX2 1
63 #define RENAME(a) a ## _MMX2
64 #include "yuv2rgb_template.c"
65
66 #endif /* HAVE_MMX && CONFIG_GPL */
67
68 const int32_t ff_yuv2rgb_coeffs[8][4] = {
69     {117504, 138453, 13954, 34903}, /* no sequence_display_extension */
70     {117504, 138453, 13954, 34903}, /* ITU-R Rec. 709 (1990) */
71     {104597, 132201, 25675, 53279}, /* unspecified */
72     {104597, 132201, 25675, 53279}, /* reserved */
73     {104448, 132798, 24759, 53109}, /* FCC */
74     {104597, 132201, 25675, 53279}, /* ITU-R Rec. 624-4 System B, G */
75     {104597, 132201, 25675, 53279}, /* SMPTE 170M */
76     {117579, 136230, 16907, 35559}  /* SMPTE 240M (1987) */
77 };
78
79 #define LOADCHROMA(i)                               \
80     U = pu[i];                                      \
81     V = pv[i];                                      \
82     r = (void *)c->table_rV[V];                     \
83     g = (void *)(c->table_gU[U] + c->table_gV[V]);  \
84     b = (void *)c->table_bU[U];
85
86 #define PUTRGB(dst,src,i,o)          \
87     Y = src[2*i+o];                  \
88     dst[2*i  ] = r[Y] + g[Y] + b[Y]; \
89     Y = src[2*i+1-o];                \
90     dst[2*i+1] = r[Y] + g[Y] + b[Y];
91
92 #define PUTRGB24(dst,src,i)                                  \
93     Y = src[2*i];                                            \
94     dst[6*i+0] = r[Y]; dst[6*i+1] = g[Y]; dst[6*i+2] = b[Y]; \
95     Y = src[2*i+1];                                          \
96     dst[6*i+3] = r[Y]; dst[6*i+4] = g[Y]; dst[6*i+5] = b[Y];
97
98 #define PUTBGR24(dst,src,i)                                  \
99     Y = src[2*i];                                            \
100     dst[6*i+0] = b[Y]; dst[6*i+1] = g[Y]; dst[6*i+2] = r[Y]; \
101     Y = src[2*i+1];                                          \
102     dst[6*i+3] = b[Y]; dst[6*i+4] = g[Y]; dst[6*i+5] = r[Y];
103
104 #define YUV2RGBFUNC(func_name, dst_type) \
105 static int func_name(SwsContext *c, uint8_t* src[], int srcStride[], int srcSliceY, \
106                      int srcSliceH, uint8_t* dst[], int dstStride[]){\
107     int y;\
108 \
109     if (c->srcFormat == PIX_FMT_YUV422P) {\
110         srcStride[1] *= 2;\
111         srcStride[2] *= 2;\
112     }\
113     for (y=0; y<srcSliceH; y+=2) {\
114         dst_type *dst_1 = (dst_type*)(dst[0] + (y+srcSliceY  )*dstStride[0]);\
115         dst_type *dst_2 = (dst_type*)(dst[0] + (y+srcSliceY+1)*dstStride[0]);\
116         dst_type av_unused *r, *b;\
117         dst_type *g;\
118         uint8_t *py_1 = src[0] + y*srcStride[0];\
119         uint8_t *py_2 = py_1 + srcStride[0];\
120         uint8_t *pu = src[1] + (y>>1)*srcStride[1];\
121         uint8_t *pv = src[2] + (y>>1)*srcStride[2];\
122         unsigned int h_size = c->dstW>>3;\
123         while (h_size--) {\
124             int av_unused U, V;\
125             int Y;\
126
127 #define ENDYUV2RGBLINE(dst_delta)\
128             pu += 4;\
129             pv += 4;\
130             py_1 += 8;\
131             py_2 += 8;\
132             dst_1 += dst_delta;\
133             dst_2 += dst_delta;\
134         }\
135         if (c->dstW & 4) {\
136             int av_unused Y, U, V;\
137
138 #define ENDYUV2RGBFUNC()\
139         }\
140     }\
141     return srcSliceH;\
142 }
143
144 #define CLOSEYUV2RGBFUNC(dst_delta)\
145     ENDYUV2RGBLINE(dst_delta)\
146     ENDYUV2RGBFUNC()
147
148 YUV2RGBFUNC(yuv2rgb_c_32, uint32_t)
149     LOADCHROMA(0);
150     PUTRGB(dst_1,py_1,0,0);
151     PUTRGB(dst_2,py_2,0,1);
152
153     LOADCHROMA(1);
154     PUTRGB(dst_2,py_2,1,1);
155     PUTRGB(dst_1,py_1,1,0);
156     LOADCHROMA(1);
157     PUTRGB(dst_2,py_2,1,1);
158     PUTRGB(dst_1,py_1,1,0);
159
160     LOADCHROMA(2);
161     PUTRGB(dst_1,py_1,2,0);
162     PUTRGB(dst_2,py_2,2,1);
163
164     LOADCHROMA(3);
165     PUTRGB(dst_2,py_2,3,1);
166     PUTRGB(dst_1,py_1,3,0);
167 ENDYUV2RGBLINE(8)
168     LOADCHROMA(0);
169     PUTRGB(dst_1,py_1,0,0);
170     PUTRGB(dst_2,py_2,0,1);
171
172     LOADCHROMA(1);
173     PUTRGB(dst_2,py_2,1,1);
174     PUTRGB(dst_1,py_1,1,0);
175 ENDYUV2RGBFUNC()
176
177 YUV2RGBFUNC(yuv2rgb_c_24_rgb, uint8_t)
178     LOADCHROMA(0);
179     PUTRGB24(dst_1,py_1,0);
180     PUTRGB24(dst_2,py_2,0);
181
182     LOADCHROMA(1);
183     PUTRGB24(dst_2,py_2,1);
184     PUTRGB24(dst_1,py_1,1);
185
186     LOADCHROMA(2);
187     PUTRGB24(dst_1,py_1,2);
188     PUTRGB24(dst_2,py_2,2);
189
190     LOADCHROMA(3);
191     PUTRGB24(dst_2,py_2,3);
192     PUTRGB24(dst_1,py_1,3);
193 ENDYUV2RGBLINE(24)
194     LOADCHROMA(0);
195     PUTRGB24(dst_1,py_1,0);
196     PUTRGB24(dst_2,py_2,0);
197
198     LOADCHROMA(1);
199     PUTRGB24(dst_2,py_2,1);
200     PUTRGB24(dst_1,py_1,1);
201 ENDYUV2RGBFUNC()
202
203 // only trivial mods from yuv2rgb_c_24_rgb
204 YUV2RGBFUNC(yuv2rgb_c_24_bgr, uint8_t)
205     LOADCHROMA(0);
206     PUTBGR24(dst_1,py_1,0);
207     PUTBGR24(dst_2,py_2,0);
208
209     LOADCHROMA(1);
210     PUTBGR24(dst_2,py_2,1);
211     PUTBGR24(dst_1,py_1,1);
212
213     LOADCHROMA(2);
214     PUTBGR24(dst_1,py_1,2);
215     PUTBGR24(dst_2,py_2,2);
216
217     LOADCHROMA(3);
218     PUTBGR24(dst_2,py_2,3);
219     PUTBGR24(dst_1,py_1,3);
220 ENDYUV2RGBLINE(24)
221     LOADCHROMA(0);
222     PUTBGR24(dst_1,py_1,0);
223     PUTBGR24(dst_2,py_2,0);
224
225     LOADCHROMA(1);
226     PUTBGR24(dst_2,py_2,1);
227     PUTBGR24(dst_1,py_1,1);
228 ENDYUV2RGBFUNC()
229
230 // This is exactly the same code as yuv2rgb_c_32 except for the types of
231 // r, g, b, dst_1, dst_2
232 YUV2RGBFUNC(yuv2rgb_c_16, uint16_t)
233     LOADCHROMA(0);
234     PUTRGB(dst_1,py_1,0,0);
235     PUTRGB(dst_2,py_2,0,1);
236
237     LOADCHROMA(1);
238     PUTRGB(dst_2,py_2,1,1);
239     PUTRGB(dst_1,py_1,1,0);
240
241     LOADCHROMA(2);
242     PUTRGB(dst_1,py_1,2,0);
243     PUTRGB(dst_2,py_2,2,1);
244
245     LOADCHROMA(3);
246     PUTRGB(dst_2,py_2,3,1);
247     PUTRGB(dst_1,py_1,3,0);
248 CLOSEYUV2RGBFUNC(8)
249
250 // This is exactly the same code as yuv2rgb_c_32 except for the types of
251 // r, g, b, dst_1, dst_2
252 YUV2RGBFUNC(yuv2rgb_c_8, uint8_t)
253     LOADCHROMA(0);
254     PUTRGB(dst_1,py_1,0,0);
255     PUTRGB(dst_2,py_2,0,1);
256
257     LOADCHROMA(1);
258     PUTRGB(dst_2,py_2,1,1);
259     PUTRGB(dst_1,py_1,1,0);
260
261     LOADCHROMA(2);
262     PUTRGB(dst_1,py_1,2,0);
263     PUTRGB(dst_2,py_2,2,1);
264
265     LOADCHROMA(3);
266     PUTRGB(dst_2,py_2,3,1);
267     PUTRGB(dst_1,py_1,3,0);
268 CLOSEYUV2RGBFUNC(8)
269
270 // r, g, b, dst_1, dst_2
271 YUV2RGBFUNC(yuv2rgb_c_8_ordered_dither, uint8_t)
272     const uint8_t *d32 = dither_8x8_32[y&7];
273     const uint8_t *d64 = dither_8x8_73[y&7];
274 #define PUTRGB8(dst,src,i,o)                                    \
275     Y = src[2*i];                                               \
276     dst[2*i]   = r[Y+d32[0+o]] + g[Y+d32[0+o]] + b[Y+d64[0+o]]; \
277     Y = src[2*i+1];                                             \
278     dst[2*i+1] = r[Y+d32[1+o]] + g[Y+d32[1+o]] + b[Y+d64[1+o]];
279
280     LOADCHROMA(0);
281     PUTRGB8(dst_1,py_1,0,0);
282     PUTRGB8(dst_2,py_2,0,0+8);
283
284     LOADCHROMA(1);
285     PUTRGB8(dst_2,py_2,1,2+8);
286     PUTRGB8(dst_1,py_1,1,2);
287
288     LOADCHROMA(2);
289     PUTRGB8(dst_1,py_1,2,4);
290     PUTRGB8(dst_2,py_2,2,4+8);
291
292     LOADCHROMA(3);
293     PUTRGB8(dst_2,py_2,3,6+8);
294     PUTRGB8(dst_1,py_1,3,6);
295 CLOSEYUV2RGBFUNC(8)
296
297
298 // This is exactly the same code as yuv2rgb_c_32 except for the types of
299 // r, g, b, dst_1, dst_2
300 YUV2RGBFUNC(yuv2rgb_c_4, uint8_t)
301     int acc;
302 #define PUTRGB4(dst,src,i)          \
303     Y = src[2*i];                   \
304     acc = r[Y] + g[Y] + b[Y];       \
305     Y = src[2*i+1];                 \
306     acc |= (r[Y] + g[Y] + b[Y])<<4; \
307     dst[i] = acc;
308
309     LOADCHROMA(0);
310     PUTRGB4(dst_1,py_1,0);
311     PUTRGB4(dst_2,py_2,0);
312
313     LOADCHROMA(1);
314     PUTRGB4(dst_2,py_2,1);
315     PUTRGB4(dst_1,py_1,1);
316
317     LOADCHROMA(2);
318     PUTRGB4(dst_1,py_1,2);
319     PUTRGB4(dst_2,py_2,2);
320
321     LOADCHROMA(3);
322     PUTRGB4(dst_2,py_2,3);
323     PUTRGB4(dst_1,py_1,3);
324 CLOSEYUV2RGBFUNC(4)
325
326 YUV2RGBFUNC(yuv2rgb_c_4_ordered_dither, uint8_t)
327     const uint8_t *d64 =  dither_8x8_73[y&7];
328     const uint8_t *d128 = dither_8x8_220[y&7];
329     int acc;
330
331 #define PUTRGB4D(dst,src,i,o)                                     \
332     Y = src[2*i];                                                 \
333     acc = r[Y+d128[0+o]] + g[Y+d64[0+o]] + b[Y+d128[0+o]];        \
334     Y = src[2*i+1];                                               \
335     acc |= (r[Y+d128[1+o]] + g[Y+d64[1+o]] + b[Y+d128[1+o]])<<4;  \
336     dst[i]= acc;
337
338     LOADCHROMA(0);
339     PUTRGB4D(dst_1,py_1,0,0);
340     PUTRGB4D(dst_2,py_2,0,0+8);
341
342     LOADCHROMA(1);
343     PUTRGB4D(dst_2,py_2,1,2+8);
344     PUTRGB4D(dst_1,py_1,1,2);
345
346     LOADCHROMA(2);
347     PUTRGB4D(dst_1,py_1,2,4);
348     PUTRGB4D(dst_2,py_2,2,4+8);
349
350     LOADCHROMA(3);
351     PUTRGB4D(dst_2,py_2,3,6+8);
352     PUTRGB4D(dst_1,py_1,3,6);
353 CLOSEYUV2RGBFUNC(4)
354
355 // This is exactly the same code as yuv2rgb_c_32 except for the types of
356 // r, g, b, dst_1, dst_2
357 YUV2RGBFUNC(yuv2rgb_c_4b, uint8_t)
358     LOADCHROMA(0);
359     PUTRGB(dst_1,py_1,0,0);
360     PUTRGB(dst_2,py_2,0,1);
361
362     LOADCHROMA(1);
363     PUTRGB(dst_2,py_2,1,1);
364     PUTRGB(dst_1,py_1,1,0);
365
366     LOADCHROMA(2);
367     PUTRGB(dst_1,py_1,2,0);
368     PUTRGB(dst_2,py_2,2,1);
369
370     LOADCHROMA(3);
371     PUTRGB(dst_2,py_2,3,1);
372     PUTRGB(dst_1,py_1,3,0);
373 CLOSEYUV2RGBFUNC(8)
374
375 YUV2RGBFUNC(yuv2rgb_c_4b_ordered_dither, uint8_t)
376     const uint8_t *d64 =  dither_8x8_73[y&7];
377     const uint8_t *d128 = dither_8x8_220[y&7];
378
379 #define PUTRGB4DB(dst,src,i,o)                                    \
380     Y = src[2*i];                                                 \
381     dst[2*i]   = r[Y+d128[0+o]] + g[Y+d64[0+o]] + b[Y+d128[0+o]]; \
382     Y = src[2*i+1];                                               \
383     dst[2*i+1] = r[Y+d128[1+o]] + g[Y+d64[1+o]] + b[Y+d128[1+o]];
384
385     LOADCHROMA(0);
386     PUTRGB4DB(dst_1,py_1,0,0);
387     PUTRGB4DB(dst_2,py_2,0,0+8);
388
389     LOADCHROMA(1);
390     PUTRGB4DB(dst_2,py_2,1,2+8);
391     PUTRGB4DB(dst_1,py_1,1,2);
392
393     LOADCHROMA(2);
394     PUTRGB4DB(dst_1,py_1,2,4);
395     PUTRGB4DB(dst_2,py_2,2,4+8);
396
397     LOADCHROMA(3);
398     PUTRGB4DB(dst_2,py_2,3,6+8);
399     PUTRGB4DB(dst_1,py_1,3,6);
400 CLOSEYUV2RGBFUNC(8)
401
402 YUV2RGBFUNC(yuv2rgb_c_1_ordered_dither, uint8_t)
403         const uint8_t *d128 = dither_8x8_220[y&7];
404         char out_1 = 0, out_2 = 0;
405         g= c->table_gU[128] + c->table_gV[128];
406
407 #define PUTRGB1(out,src,i,o)    \
408     Y = src[2*i];               \
409     out+= out + g[Y+d128[0+o]]; \
410     Y = src[2*i+1];             \
411     out+= out + g[Y+d128[1+o]];
412
413     PUTRGB1(out_1,py_1,0,0);
414     PUTRGB1(out_2,py_2,0,0+8);
415
416     PUTRGB1(out_2,py_2,1,2+8);
417     PUTRGB1(out_1,py_1,1,2);
418
419     PUTRGB1(out_1,py_1,2,4);
420     PUTRGB1(out_2,py_2,2,4+8);
421
422     PUTRGB1(out_2,py_2,3,6+8);
423     PUTRGB1(out_1,py_1,3,6);
424
425     dst_1[0]= out_1;
426     dst_2[0]= out_2;
427 CLOSEYUV2RGBFUNC(1)
428
429 SwsFunc sws_yuv2rgb_get_func_ptr(SwsContext *c)
430 {
431     SwsFunc t = NULL;
432 #if (HAVE_MMX2 || HAVE_MMX) && CONFIG_GPL
433     if (c->flags & SWS_CPU_CAPS_MMX2) {
434         switch (c->dstFormat) {
435         case PIX_FMT_RGB32:  return yuv420_rgb32_MMX2;
436         case PIX_FMT_BGR24:  return yuv420_rgb24_MMX2;
437         case PIX_FMT_RGB565: return yuv420_rgb16_MMX2;
438         case PIX_FMT_RGB555: return yuv420_rgb15_MMX2;
439         }
440     }
441     if (c->flags & SWS_CPU_CAPS_MMX) {
442         switch (c->dstFormat) {
443         case PIX_FMT_RGB32:  return yuv420_rgb32_MMX;
444         case PIX_FMT_BGR24:  return yuv420_rgb24_MMX;
445         case PIX_FMT_RGB565: return yuv420_rgb16_MMX;
446         case PIX_FMT_RGB555: return yuv420_rgb15_MMX;
447         }
448     }
449 #endif
450 #if HAVE_VIS
451     t = sws_yuv2rgb_init_vis(c);
452 #endif
453 #if CONFIG_MLIB
454     t = sws_yuv2rgb_init_mlib(c);
455 #endif
456 #if HAVE_ALTIVEC && CONFIG_GPL
457     if (c->flags & SWS_CPU_CAPS_ALTIVEC)
458         t = sws_yuv2rgb_init_altivec(c);
459 #endif
460
461 #if ARCH_BFIN
462     if (c->flags & SWS_CPU_CAPS_BFIN)
463         t = sws_ff_bfin_yuv2rgb_get_func_ptr(c);
464 #endif
465
466     if (t)
467         return t;
468
469     av_log(c, AV_LOG_WARNING, "No accelerated colorspace conversion found.\n");
470
471     switch (c->dstFormat) {
472     case PIX_FMT_BGR32_1:
473     case PIX_FMT_RGB32_1:
474     case PIX_FMT_BGR32:
475     case PIX_FMT_RGB32:      return yuv2rgb_c_32;
476     case PIX_FMT_RGB24:      return yuv2rgb_c_24_rgb;
477     case PIX_FMT_BGR24:      return yuv2rgb_c_24_bgr;
478     case PIX_FMT_RGB565:
479     case PIX_FMT_BGR565:
480     case PIX_FMT_RGB555:
481     case PIX_FMT_BGR555:     return yuv2rgb_c_16;
482     case PIX_FMT_RGB8:
483     case PIX_FMT_BGR8:       return yuv2rgb_c_8_ordered_dither;
484     case PIX_FMT_RGB4:
485     case PIX_FMT_BGR4:       return yuv2rgb_c_4_ordered_dither;
486     case PIX_FMT_RGB4_BYTE:
487     case PIX_FMT_BGR4_BYTE:  return yuv2rgb_c_4b_ordered_dither;
488     case PIX_FMT_MONOBLACK:  return yuv2rgb_c_1_ordered_dither;
489     default:
490         assert(0);
491     }
492     return NULL;
493 }
494
495 static void fill_table(uint8_t* table[256], const int elemsize, const int inc, uint8_t *y_table)
496 {
497     int i;
498     int64_t cb = 0;
499
500     y_table -= elemsize * (inc >> 9);
501
502     for (i = 0; i < 256; i++) {
503         table[i] = y_table + elemsize * (cb >> 16);
504         cb += inc;
505     }
506 }
507
508 static void fill_gv_table(int table[256], const int elemsize, const int inc)
509 {
510     int i;
511     int64_t cb = 0;
512     int off = -(inc >> 9);
513
514     for (i = 0; i < 256; i++) {
515         table[i] = elemsize * (off + (cb >> 16));
516         cb += inc;
517     }
518 }
519
520 av_cold int sws_yuv2rgb_c_init_tables(SwsContext *c, const int inv_table[4], int fullRange,
521                                       int brightness, int contrast, int saturation)
522 {
523     const int isRgb =      c->dstFormat==PIX_FMT_RGB32
524                         || c->dstFormat==PIX_FMT_RGB32_1
525                         || c->dstFormat==PIX_FMT_BGR24
526                         || c->dstFormat==PIX_FMT_RGB565
527                         || c->dstFormat==PIX_FMT_RGB555
528                         || c->dstFormat==PIX_FMT_RGB8
529                         || c->dstFormat==PIX_FMT_RGB4
530                         || c->dstFormat==PIX_FMT_RGB4_BYTE
531                         || c->dstFormat==PIX_FMT_MONOBLACK;
532     const int bpp = fmt_depth(c->dstFormat);
533     uint8_t *y_table;
534     uint16_t *y_table16;
535     uint32_t *y_table32;
536     int i, base, rbase, gbase, bbase, abase;
537     const int yoffs = fullRange ? 384 : 326;
538
539     int64_t crv =  inv_table[0];
540     int64_t cbu =  inv_table[1];
541     int64_t cgu = -inv_table[2];
542     int64_t cgv = -inv_table[3];
543     int64_t cy  = 1<<16;
544     int64_t oy  = 0;
545
546     int64_t yb = 0;
547
548     if (!fullRange) {
549         cy = (cy*255) / 219;
550         oy = 16<<16;
551     } else {
552         crv = (crv*224) / 255;
553         cbu = (cbu*224) / 255;
554         cgu = (cgu*224) / 255;
555         cgv = (cgv*224) / 255;
556     }
557
558     cy  = (cy *contrast             ) >> 16;
559     crv = (crv*contrast * saturation) >> 32;
560     cbu = (cbu*contrast * saturation) >> 32;
561     cgu = (cgu*contrast * saturation) >> 32;
562     cgv = (cgv*contrast * saturation) >> 32;
563     oy -= 256*brightness;
564
565     //scale coefficients by cy
566     crv = ((crv << 16) + 0x8000) / cy;
567     cbu = ((cbu << 16) + 0x8000) / cy;
568     cgu = ((cgu << 16) + 0x8000) / cy;
569     cgv = ((cgv << 16) + 0x8000) / cy;
570
571     av_free(c->yuvTable);
572
573     switch (bpp) {
574     case 1:
575         c->yuvTable = av_malloc(1024);
576         y_table = c->yuvTable;
577         yb = -(384<<16) - oy;
578         for (i = 0; i < 1024-110; i++) {
579             y_table[i+110] = av_clip_uint8((yb + 0x8000) >> 16) >> 7;
580             yb += cy;
581         }
582         fill_table(c->table_gU, 1, cgu, y_table + yoffs);
583         fill_gv_table(c->table_gV, 1, cgv);
584         break;
585     case 4:
586     case 4|128:
587         rbase = isRgb ? 3 : 0;
588         gbase = 1;
589         bbase = isRgb ? 0 : 3;
590         c->yuvTable = av_malloc(1024*3);
591         y_table = c->yuvTable;
592         yb = -(384<<16) - oy;
593         for (i = 0; i < 1024-110; i++) {
594             int yval = av_clip_uint8((yb + 0x8000) >> 16);
595             y_table[i+110     ] =  (yval >> 7)       << rbase;
596             y_table[i+ 37+1024] = ((yval + 43) / 85) << gbase;
597             y_table[i+110+2048] =  (yval >> 7)       << bbase;
598             yb += cy;
599         }
600         fill_table(c->table_rV, 1, crv, y_table + yoffs);
601         fill_table(c->table_gU, 1, cgu, y_table + yoffs + 1024);
602         fill_table(c->table_bU, 1, cbu, y_table + yoffs + 2048);
603         fill_gv_table(c->table_gV, 1, cgv);
604         break;
605     case 8:
606         rbase = isRgb ? 5 : 0;
607         gbase = isRgb ? 2 : 3;
608         bbase = isRgb ? 0 : 6;
609         c->yuvTable = av_malloc(1024*3);
610         y_table = c->yuvTable;
611         yb = -(384<<16) - oy;
612         for (i = 0; i < 1024-38; i++) {
613             int yval = av_clip_uint8((yb + 0x8000) >> 16);
614             y_table[i+16     ] = ((yval + 18) / 36) << rbase;
615             y_table[i+16+1024] = ((yval + 18) / 36) << gbase;
616             y_table[i+37+2048] = ((yval + 43) / 85) << bbase;
617             yb += cy;
618         }
619         fill_table(c->table_rV, 1, crv, y_table + yoffs);
620         fill_table(c->table_gU, 1, cgu, y_table + yoffs + 1024);
621         fill_table(c->table_bU, 1, cbu, y_table + yoffs + 2048);
622         fill_gv_table(c->table_gV, 1, cgv);
623         break;
624     case 15:
625     case 16:
626         rbase = isRgb ? bpp - 5 : 0;
627         gbase = 5;
628         bbase = isRgb ? 0 : (bpp - 5);
629         c->yuvTable = av_malloc(1024*3*2);
630         y_table16 = c->yuvTable;
631         yb = -(384<<16) - oy;
632         for (i = 0; i < 1024; i++) {
633             uint8_t yval = av_clip_uint8((yb + 0x8000) >> 16);
634             y_table16[i     ] = (yval >> 3)          << rbase;
635             y_table16[i+1024] = (yval >> (18 - bpp)) << gbase;
636             y_table16[i+2048] = (yval >> 3)          << bbase;
637             yb += cy;
638         }
639         fill_table(c->table_rV, 2, crv, y_table16 + yoffs);
640         fill_table(c->table_gU, 2, cgu, y_table16 + yoffs + 1024);
641         fill_table(c->table_bU, 2, cbu, y_table16 + yoffs + 2048);
642         fill_gv_table(c->table_gV, 2, cgv);
643         break;
644     case 24:
645         c->yuvTable = av_malloc(1024);
646         y_table = c->yuvTable;
647         yb = -(384<<16) - oy;
648         for (i = 0; i < 1024; i++) {
649             y_table[i] = av_clip_uint8((yb + 0x8000) >> 16);
650             yb += cy;
651         }
652         fill_table(c->table_rV, 1, crv, y_table + yoffs);
653         fill_table(c->table_gU, 1, cgu, y_table + yoffs);
654         fill_table(c->table_bU, 1, cbu, y_table + yoffs);
655         fill_gv_table(c->table_gV, 1, cgv);
656         break;
657     case 32:
658         base = (c->dstFormat == PIX_FMT_RGB32_1 || c->dstFormat == PIX_FMT_BGR32_1) ? 8 : 0;
659         rbase = base + (isRgb ? 16 : 0);
660         gbase = base + 8;
661         bbase = base + (isRgb ? 0 : 16);
662         abase = (c->dstFormat == PIX_FMT_RGBA || c->dstFormat == PIX_FMT_BGRA) ? 24 : 0;
663         c->yuvTable = av_malloc(1024*3*4);
664         y_table32 = c->yuvTable;
665         yb = -(384<<16) - oy;
666         for (i = 0; i < 1024; i++) {
667             uint8_t yval = av_clip_uint8((yb + 0x8000) >> 16);
668             y_table32[i     ] = (yval << rbase) + (255 << abase);
669             y_table32[i+1024] = yval << gbase;
670             y_table32[i+2048] = yval << bbase;
671             yb += cy;
672         }
673         fill_table(c->table_rV, 4, crv, y_table32 + yoffs);
674         fill_table(c->table_gU, 4, cgu, y_table32 + yoffs + 1024);
675         fill_table(c->table_bU, 4, cbu, y_table32 + yoffs + 2048);
676         fill_gv_table(c->table_gV, 4, cgv);
677         break;
678     default:
679         c->yuvTable = NULL;
680         av_log(c, AV_LOG_ERROR, "%ibpp not supported by yuv2rgb\n", bpp);
681         return -1;
682     }
683     return 0;
684 }