]> git.sesse.net Git - ffmpeg/blob - libswscale/yuv2rgb.c
pan: drop unecessary includes.
[ffmpeg] / libswscale / yuv2rgb.c
1 /*
2  * software YUV to RGB converter
3  *
4  * Copyright (C) 2009 Konstantin Shishkov
5  *
6  * 1,4,8bpp support and context / deglobalize stuff
7  * by Michael Niedermayer (michaelni@gmx.at)
8  *
9  * This file is part of FFmpeg.
10  *
11  * FFmpeg is free software; you can redistribute it and/or
12  * modify it under the terms of the GNU Lesser General Public
13  * License as published by the Free Software Foundation; either
14  * version 2.1 of the License, or (at your option) any later version.
15  *
16  * FFmpeg is distributed in the hope that it will be useful,
17  * but WITHOUT ANY WARRANTY; without even the implied warranty of
18  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
19  * Lesser General Public License for more details.
20  *
21  * You should have received a copy of the GNU Lesser General Public
22  * License along with FFmpeg; if not, write to the Free Software
23  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
24  */
25
26 #include <stdio.h>
27 #include <stdlib.h>
28 #include <inttypes.h>
29 #include <assert.h>
30
31 #include "config.h"
32 #include "rgb2rgb.h"
33 #include "swscale.h"
34 #include "swscale_internal.h"
35 #include "libavutil/cpu.h"
36 #include "libavutil/bswap.h"
37 #include "libavutil/pixdesc.h"
38
39 extern const uint8_t dither_4x4_16[4][8];
40 extern const uint8_t dither_8x8_32[8][8];
41 extern const uint8_t dither_8x8_73[8][8];
42 extern const uint8_t dither_8x8_220[8][8];
43
44 const int32_t ff_yuv2rgb_coeffs[8][4] = {
45     {117504, 138453, 13954, 34903}, /* no sequence_display_extension */
46     {117504, 138453, 13954, 34903}, /* ITU-R Rec. 709 (1990) */
47     {104597, 132201, 25675, 53279}, /* unspecified */
48     {104597, 132201, 25675, 53279}, /* reserved */
49     {104448, 132798, 24759, 53109}, /* FCC */
50     {104597, 132201, 25675, 53279}, /* ITU-R Rec. 624-4 System B, G */
51     {104597, 132201, 25675, 53279}, /* SMPTE 170M */
52     {117579, 136230, 16907, 35559}  /* SMPTE 240M (1987) */
53 };
54
55 const int *sws_getCoefficients(int colorspace)
56 {
57     if (colorspace > 7 || colorspace < 0)
58         colorspace = SWS_CS_DEFAULT;
59     return ff_yuv2rgb_coeffs[colorspace];
60 }
61
62 #define LOADCHROMA(i)                               \
63     U = pu[i];                                      \
64     V = pv[i];                                      \
65     r = (void *)c->table_rV[V+YUVRGB_TABLE_HEADROOM];                     \
66     g = (void *)(c->table_gU[U+YUVRGB_TABLE_HEADROOM] + c->table_gV[V+YUVRGB_TABLE_HEADROOM]);  \
67     b = (void *)c->table_bU[U+YUVRGB_TABLE_HEADROOM];
68
69 #define PUTRGB(dst,src,i)            \
70     Y = src[2*i];                    \
71     dst[2*i  ] = r[Y] + g[Y] + b[Y]; \
72     Y = src[2*i+1];                  \
73     dst[2*i+1] = r[Y] + g[Y] + b[Y];
74
75 #define PUTRGB24(dst,src,i)                                  \
76     Y = src[2*i];                                            \
77     dst[6*i+0] = r[Y]; dst[6*i+1] = g[Y]; dst[6*i+2] = b[Y]; \
78     Y = src[2*i+1];                                          \
79     dst[6*i+3] = r[Y]; dst[6*i+4] = g[Y]; dst[6*i+5] = b[Y];
80
81 #define PUTBGR24(dst,src,i)                                  \
82     Y = src[2*i];                                            \
83     dst[6*i+0] = b[Y]; dst[6*i+1] = g[Y]; dst[6*i+2] = r[Y]; \
84     Y = src[2*i+1];                                          \
85     dst[6*i+3] = b[Y]; dst[6*i+4] = g[Y]; dst[6*i+5] = r[Y];
86
87 #define PUTRGBA(dst,ysrc,asrc,i,s)                      \
88     Y = ysrc[2*i];                                      \
89     dst[2*i  ] = r[Y] + g[Y] + b[Y] + (asrc[2*i  ]<<s); \
90     Y = ysrc[2*i+1];                                    \
91     dst[2*i+1] = r[Y] + g[Y] + b[Y] + (asrc[2*i+1]<<s);
92
93 #define PUTRGB48(dst,src,i)             \
94     Y = src[2*i];                       \
95     dst[12*i+ 0] = dst[12*i+ 1] = r[Y]; \
96     dst[12*i+ 2] = dst[12*i+ 3] = g[Y]; \
97     dst[12*i+ 4] = dst[12*i+ 5] = b[Y]; \
98     Y = src[2*i+1];                     \
99     dst[12*i+ 6] = dst[12*i+ 7] = r[Y]; \
100     dst[12*i+ 8] = dst[12*i+ 9] = g[Y]; \
101     dst[12*i+10] = dst[12*i+11] = b[Y];
102
103 #define PUTBGR48(dst,src,i)             \
104     Y = src[2*i];                       \
105     dst[12*i+ 0] = dst[12*i+ 1] = b[Y]; \
106     dst[12*i+ 2] = dst[12*i+ 3] = g[Y]; \
107     dst[12*i+ 4] = dst[12*i+ 5] = r[Y]; \
108     Y = src[2*i+1];                     \
109     dst[12*i+ 6] = dst[12*i+ 7] = b[Y]; \
110     dst[12*i+ 8] = dst[12*i+ 9] = g[Y]; \
111     dst[12*i+10] = dst[12*i+11] = r[Y];
112
113 #define YUV2RGBFUNC(func_name, dst_type, alpha) \
114 static int func_name(SwsContext *c, const uint8_t* src[], int srcStride[], int srcSliceY, \
115                      int srcSliceH, uint8_t* dst[], int dstStride[]) \
116 {\
117     int y;\
118 \
119     if (!alpha && c->srcFormat == PIX_FMT_YUV422P) {\
120         srcStride[1] *= 2;\
121         srcStride[2] *= 2;\
122     }\
123     for (y=0; y<srcSliceH; y+=2) {\
124         dst_type *dst_1 = (dst_type*)(dst[0] + (y+srcSliceY  )*dstStride[0]);\
125         dst_type *dst_2 = (dst_type*)(dst[0] + (y+srcSliceY+1)*dstStride[0]);\
126         dst_type av_unused *r, *b;\
127         dst_type *g;\
128         const uint8_t *py_1 = src[0] + y*srcStride[0];\
129         const uint8_t *py_2 = py_1 + srcStride[0];\
130         const uint8_t *pu = src[1] + (y>>1)*srcStride[1];\
131         const uint8_t *pv = src[2] + (y>>1)*srcStride[2];\
132         const uint8_t av_unused *pa_1, *pa_2;\
133         unsigned int h_size = c->dstW>>3;\
134         if (alpha) {\
135             pa_1 = src[3] + y*srcStride[3];\
136             pa_2 = pa_1 + srcStride[3];\
137         }\
138         while (h_size--) {\
139             int av_unused U, V;\
140             int Y;\
141
142 #define ENDYUV2RGBLINE(dst_delta)\
143             pu += 4;\
144             pv += 4;\
145             py_1 += 8;\
146             py_2 += 8;\
147             dst_1 += dst_delta;\
148             dst_2 += dst_delta;\
149         }\
150         if (c->dstW & 4) {\
151             int av_unused Y, U, V;\
152
153 #define ENDYUV2RGBFUNC()\
154         }\
155     }\
156     return srcSliceH;\
157 }
158
159 #define CLOSEYUV2RGBFUNC(dst_delta)\
160     ENDYUV2RGBLINE(dst_delta)\
161     ENDYUV2RGBFUNC()
162
163 YUV2RGBFUNC(yuv2rgb_c_48, uint8_t, 0)
164     LOADCHROMA(0);
165     PUTRGB48(dst_1,py_1,0);
166     PUTRGB48(dst_2,py_2,0);
167
168     LOADCHROMA(1);
169     PUTRGB48(dst_2,py_2,1);
170     PUTRGB48(dst_1,py_1,1);
171
172     LOADCHROMA(2);
173     PUTRGB48(dst_1,py_1,2);
174     PUTRGB48(dst_2,py_2,2);
175
176     LOADCHROMA(3);
177     PUTRGB48(dst_2,py_2,3);
178     PUTRGB48(dst_1,py_1,3);
179 ENDYUV2RGBLINE(48)
180     LOADCHROMA(0);
181     PUTRGB48(dst_1,py_1,0);
182     PUTRGB48(dst_2,py_2,0);
183
184     LOADCHROMA(1);
185     PUTRGB48(dst_2,py_2,1);
186     PUTRGB48(dst_1,py_1,1);
187 ENDYUV2RGBFUNC()
188
189 YUV2RGBFUNC(yuv2rgb_c_bgr48, uint8_t, 0)
190     LOADCHROMA(0);
191     PUTBGR48(dst_1,py_1,0);
192     PUTBGR48(dst_2,py_2,0);
193
194     LOADCHROMA(1);
195     PUTBGR48(dst_2,py_2,1);
196     PUTBGR48(dst_1,py_1,1);
197
198     LOADCHROMA(2);
199     PUTBGR48(dst_1,py_1,2);
200     PUTBGR48(dst_2,py_2,2);
201
202     LOADCHROMA(3);
203     PUTBGR48(dst_2,py_2,3);
204     PUTBGR48(dst_1,py_1,3);
205 ENDYUV2RGBLINE(48)
206     LOADCHROMA(0);
207     PUTBGR48(dst_1,py_1,0);
208     PUTBGR48(dst_2,py_2,0);
209
210     LOADCHROMA(1);
211     PUTBGR48(dst_2,py_2,1);
212     PUTBGR48(dst_1,py_1,1);
213 ENDYUV2RGBFUNC()
214
215 YUV2RGBFUNC(yuv2rgb_c_32, uint32_t, 0)
216     LOADCHROMA(0);
217     PUTRGB(dst_1,py_1,0);
218     PUTRGB(dst_2,py_2,0);
219
220     LOADCHROMA(1);
221     PUTRGB(dst_2,py_2,1);
222     PUTRGB(dst_1,py_1,1);
223
224     LOADCHROMA(2);
225     PUTRGB(dst_1,py_1,2);
226     PUTRGB(dst_2,py_2,2);
227
228     LOADCHROMA(3);
229     PUTRGB(dst_2,py_2,3);
230     PUTRGB(dst_1,py_1,3);
231 ENDYUV2RGBLINE(8)
232     LOADCHROMA(0);
233     PUTRGB(dst_1,py_1,0);
234     PUTRGB(dst_2,py_2,0);
235
236     LOADCHROMA(1);
237     PUTRGB(dst_2,py_2,1);
238     PUTRGB(dst_1,py_1,1);
239 ENDYUV2RGBFUNC()
240
241 YUV2RGBFUNC(yuva2rgba_c, uint32_t, 1)
242     LOADCHROMA(0);
243     PUTRGBA(dst_1,py_1,pa_1,0,24);
244     PUTRGBA(dst_2,py_2,pa_2,0,24);
245
246     LOADCHROMA(1);
247     PUTRGBA(dst_2,py_2,pa_1,1,24);
248     PUTRGBA(dst_1,py_1,pa_2,1,24);
249
250     LOADCHROMA(2);
251     PUTRGBA(dst_1,py_1,pa_1,2,24);
252     PUTRGBA(dst_2,py_2,pa_2,2,24);
253
254     LOADCHROMA(3);
255     PUTRGBA(dst_2,py_2,pa_1,3,24);
256     PUTRGBA(dst_1,py_1,pa_2,3,24);
257     pa_1 += 8;\
258     pa_2 += 8;\
259 ENDYUV2RGBLINE(8)
260     LOADCHROMA(0);
261     PUTRGBA(dst_1,py_1,pa_1,0,24);
262     PUTRGBA(dst_2,py_2,pa_2,0,24);
263
264     LOADCHROMA(1);
265     PUTRGBA(dst_2,py_2,pa_1,1,24);
266     PUTRGBA(dst_1,py_1,pa_2,1,24);
267 ENDYUV2RGBFUNC()
268
269 YUV2RGBFUNC(yuva2argb_c, uint32_t, 1)
270     LOADCHROMA(0);
271     PUTRGBA(dst_1,py_1,pa_1,0,0);
272     PUTRGBA(dst_2,py_2,pa_2,0,0);
273
274     LOADCHROMA(1);
275     PUTRGBA(dst_2,py_2,pa_2,1,0);
276     PUTRGBA(dst_1,py_1,pa_1,1,0);
277
278     LOADCHROMA(2);
279     PUTRGBA(dst_1,py_1,pa_1,2,0);
280     PUTRGBA(dst_2,py_2,pa_2,2,0);
281
282     LOADCHROMA(3);
283     PUTRGBA(dst_2,py_2,pa_2,3,0);
284     PUTRGBA(dst_1,py_1,pa_1,3,0);
285     pa_1 += 8;\
286     pa_2 += 8;\
287 ENDYUV2RGBLINE(8)
288     LOADCHROMA(0);
289     PUTRGBA(dst_1,py_1,pa_1,0,0);
290     PUTRGBA(dst_2,py_2,pa_2,0,0);
291
292     LOADCHROMA(1);
293     PUTRGBA(dst_2,py_2,pa_2,1,0);
294     PUTRGBA(dst_1,py_1,pa_1,1,0);
295 ENDYUV2RGBFUNC()
296
297 YUV2RGBFUNC(yuv2rgb_c_24_rgb, uint8_t, 0)
298     LOADCHROMA(0);
299     PUTRGB24(dst_1,py_1,0);
300     PUTRGB24(dst_2,py_2,0);
301
302     LOADCHROMA(1);
303     PUTRGB24(dst_2,py_2,1);
304     PUTRGB24(dst_1,py_1,1);
305
306     LOADCHROMA(2);
307     PUTRGB24(dst_1,py_1,2);
308     PUTRGB24(dst_2,py_2,2);
309
310     LOADCHROMA(3);
311     PUTRGB24(dst_2,py_2,3);
312     PUTRGB24(dst_1,py_1,3);
313 ENDYUV2RGBLINE(24)
314     LOADCHROMA(0);
315     PUTRGB24(dst_1,py_1,0);
316     PUTRGB24(dst_2,py_2,0);
317
318     LOADCHROMA(1);
319     PUTRGB24(dst_2,py_2,1);
320     PUTRGB24(dst_1,py_1,1);
321 ENDYUV2RGBFUNC()
322
323 // only trivial mods from yuv2rgb_c_24_rgb
324 YUV2RGBFUNC(yuv2rgb_c_24_bgr, uint8_t, 0)
325     LOADCHROMA(0);
326     PUTBGR24(dst_1,py_1,0);
327     PUTBGR24(dst_2,py_2,0);
328
329     LOADCHROMA(1);
330     PUTBGR24(dst_2,py_2,1);
331     PUTBGR24(dst_1,py_1,1);
332
333     LOADCHROMA(2);
334     PUTBGR24(dst_1,py_1,2);
335     PUTBGR24(dst_2,py_2,2);
336
337     LOADCHROMA(3);
338     PUTBGR24(dst_2,py_2,3);
339     PUTBGR24(dst_1,py_1,3);
340 ENDYUV2RGBLINE(24)
341     LOADCHROMA(0);
342     PUTBGR24(dst_1,py_1,0);
343     PUTBGR24(dst_2,py_2,0);
344
345     LOADCHROMA(1);
346     PUTBGR24(dst_2,py_2,1);
347     PUTBGR24(dst_1,py_1,1);
348 ENDYUV2RGBFUNC()
349
350 // This is exactly the same code as yuv2rgb_c_32 except for the types of
351 // r, g, b, dst_1, dst_2
352 YUV2RGBFUNC(yuv2rgb_c_16, uint16_t, 0)
353     LOADCHROMA(0);
354     PUTRGB(dst_1,py_1,0);
355     PUTRGB(dst_2,py_2,0);
356
357     LOADCHROMA(1);
358     PUTRGB(dst_2,py_2,1);
359     PUTRGB(dst_1,py_1,1);
360
361     LOADCHROMA(2);
362     PUTRGB(dst_1,py_1,2);
363     PUTRGB(dst_2,py_2,2);
364
365     LOADCHROMA(3);
366     PUTRGB(dst_2,py_2,3);
367     PUTRGB(dst_1,py_1,3);
368 CLOSEYUV2RGBFUNC(8)
369
370 // r, g, b, dst_1, dst_2
371 YUV2RGBFUNC(yuv2rgb_c_12_ordered_dither, uint16_t, 0)
372     const uint8_t *d16 = dither_4x4_16[y&3];
373 #define PUTRGB12(dst,src,i,o)                                   \
374     Y = src[2*i];                                               \
375     dst[2*i]   = r[Y+d16[0+o]] + g[Y+d16[0+o]] + b[Y+d16[0+o]]; \
376     Y = src[2*i+1];                                             \
377     dst[2*i+1] = r[Y+d16[1+o]] + g[Y+d16[1+o]] + b[Y+d16[1+o]];
378
379     LOADCHROMA(0);
380     PUTRGB12(dst_1,py_1,0,0);
381     PUTRGB12(dst_2,py_2,0,0+8);
382
383     LOADCHROMA(1);
384     PUTRGB12(dst_2,py_2,1,2+8);
385     PUTRGB12(dst_1,py_1,1,2);
386
387     LOADCHROMA(2);
388     PUTRGB12(dst_1,py_1,2,4);
389     PUTRGB12(dst_2,py_2,2,4+8);
390
391     LOADCHROMA(3);
392     PUTRGB12(dst_2,py_2,3,6+8);
393     PUTRGB12(dst_1,py_1,3,6);
394 CLOSEYUV2RGBFUNC(8)
395
396 // r, g, b, dst_1, dst_2
397 YUV2RGBFUNC(yuv2rgb_c_8_ordered_dither, uint8_t, 0)
398     const uint8_t *d32 = dither_8x8_32[y&7];
399     const uint8_t *d64 = dither_8x8_73[y&7];
400 #define PUTRGB8(dst,src,i,o)                                    \
401     Y = src[2*i];                                               \
402     dst[2*i]   = r[Y+d32[0+o]] + g[Y+d32[0+o]] + b[Y+d64[0+o]]; \
403     Y = src[2*i+1];                                             \
404     dst[2*i+1] = r[Y+d32[1+o]] + g[Y+d32[1+o]] + b[Y+d64[1+o]];
405
406     LOADCHROMA(0);
407     PUTRGB8(dst_1,py_1,0,0);
408     PUTRGB8(dst_2,py_2,0,0+8);
409
410     LOADCHROMA(1);
411     PUTRGB8(dst_2,py_2,1,2+8);
412     PUTRGB8(dst_1,py_1,1,2);
413
414     LOADCHROMA(2);
415     PUTRGB8(dst_1,py_1,2,4);
416     PUTRGB8(dst_2,py_2,2,4+8);
417
418     LOADCHROMA(3);
419     PUTRGB8(dst_2,py_2,3,6+8);
420     PUTRGB8(dst_1,py_1,3,6);
421 CLOSEYUV2RGBFUNC(8)
422
423 YUV2RGBFUNC(yuv2rgb_c_4_ordered_dither, uint8_t, 0)
424     const uint8_t *d64 =  dither_8x8_73[y&7];
425     const uint8_t *d128 = dither_8x8_220[y&7];
426     int acc;
427
428 #define PUTRGB4D(dst,src,i,o)                                     \
429     Y = src[2*i];                                                 \
430     acc = r[Y+d128[0+o]] + g[Y+d64[0+o]] + b[Y+d128[0+o]];        \
431     Y = src[2*i+1];                                               \
432     acc |= (r[Y+d128[1+o]] + g[Y+d64[1+o]] + b[Y+d128[1+o]])<<4;  \
433     dst[i]= acc;
434
435     LOADCHROMA(0);
436     PUTRGB4D(dst_1,py_1,0,0);
437     PUTRGB4D(dst_2,py_2,0,0+8);
438
439     LOADCHROMA(1);
440     PUTRGB4D(dst_2,py_2,1,2+8);
441     PUTRGB4D(dst_1,py_1,1,2);
442
443     LOADCHROMA(2);
444     PUTRGB4D(dst_1,py_1,2,4);
445     PUTRGB4D(dst_2,py_2,2,4+8);
446
447     LOADCHROMA(3);
448     PUTRGB4D(dst_2,py_2,3,6+8);
449     PUTRGB4D(dst_1,py_1,3,6);
450 CLOSEYUV2RGBFUNC(4)
451
452 YUV2RGBFUNC(yuv2rgb_c_4b_ordered_dither, uint8_t, 0)
453     const uint8_t *d64 =  dither_8x8_73[y&7];
454     const uint8_t *d128 = dither_8x8_220[y&7];
455
456 #define PUTRGB4DB(dst,src,i,o)                                    \
457     Y = src[2*i];                                                 \
458     dst[2*i]   = r[Y+d128[0+o]] + g[Y+d64[0+o]] + b[Y+d128[0+o]]; \
459     Y = src[2*i+1];                                               \
460     dst[2*i+1] = r[Y+d128[1+o]] + g[Y+d64[1+o]] + b[Y+d128[1+o]];
461
462     LOADCHROMA(0);
463     PUTRGB4DB(dst_1,py_1,0,0);
464     PUTRGB4DB(dst_2,py_2,0,0+8);
465
466     LOADCHROMA(1);
467     PUTRGB4DB(dst_2,py_2,1,2+8);
468     PUTRGB4DB(dst_1,py_1,1,2);
469
470     LOADCHROMA(2);
471     PUTRGB4DB(dst_1,py_1,2,4);
472     PUTRGB4DB(dst_2,py_2,2,4+8);
473
474     LOADCHROMA(3);
475     PUTRGB4DB(dst_2,py_2,3,6+8);
476     PUTRGB4DB(dst_1,py_1,3,6);
477 CLOSEYUV2RGBFUNC(8)
478
479 YUV2RGBFUNC(yuv2rgb_c_1_ordered_dither, uint8_t, 0)
480         const uint8_t *d128 = dither_8x8_220[y&7];
481         char out_1 = 0, out_2 = 0;
482         g= c->table_gU[128 + YUVRGB_TABLE_HEADROOM] + c->table_gV[128 + YUVRGB_TABLE_HEADROOM];
483
484 #define PUTRGB1(out,src,i,o)    \
485     Y = src[2*i];               \
486     out+= out + g[Y+d128[0+o]]; \
487     Y = src[2*i+1];             \
488     out+= out + g[Y+d128[1+o]];
489
490     PUTRGB1(out_1,py_1,0,0);
491     PUTRGB1(out_2,py_2,0,0+8);
492
493     PUTRGB1(out_2,py_2,1,2+8);
494     PUTRGB1(out_1,py_1,1,2);
495
496     PUTRGB1(out_1,py_1,2,4);
497     PUTRGB1(out_2,py_2,2,4+8);
498
499     PUTRGB1(out_2,py_2,3,6+8);
500     PUTRGB1(out_1,py_1,3,6);
501
502     dst_1[0]= out_1;
503     dst_2[0]= out_2;
504 CLOSEYUV2RGBFUNC(1)
505
506 SwsFunc ff_yuv2rgb_get_func_ptr(SwsContext *c)
507 {
508     SwsFunc t = NULL;
509
510     if (HAVE_MMX) {
511         t = ff_yuv2rgb_init_mmx(c);
512     } else if (HAVE_VIS) {
513         t = ff_yuv2rgb_init_vis(c);
514     } else if (CONFIG_MLIB) {
515         t = ff_yuv2rgb_init_mlib(c);
516     } else if (HAVE_ALTIVEC) {
517         t = ff_yuv2rgb_init_altivec(c);
518     } else if (ARCH_BFIN) {
519         t = ff_yuv2rgb_get_func_ptr_bfin(c);
520     }
521
522     if (t)
523         return t;
524
525     av_log(c, AV_LOG_WARNING, "No accelerated colorspace conversion found from %s to %s.\n",
526            av_get_pix_fmt_name(c->srcFormat), av_get_pix_fmt_name(c->dstFormat));
527
528     switch (c->dstFormat) {
529     case PIX_FMT_BGR48BE:
530     case PIX_FMT_BGR48LE:    return yuv2rgb_c_bgr48;
531     case PIX_FMT_RGB48BE:
532     case PIX_FMT_RGB48LE:    return yuv2rgb_c_48;
533     case PIX_FMT_ARGB:
534     case PIX_FMT_ABGR:       if (CONFIG_SWSCALE_ALPHA && c->srcFormat == PIX_FMT_YUVA420P) return yuva2argb_c;
535     case PIX_FMT_RGBA:
536     case PIX_FMT_BGRA:       return (CONFIG_SWSCALE_ALPHA && c->srcFormat == PIX_FMT_YUVA420P) ? yuva2rgba_c : yuv2rgb_c_32;
537     case PIX_FMT_RGB24:      return yuv2rgb_c_24_rgb;
538     case PIX_FMT_BGR24:      return yuv2rgb_c_24_bgr;
539     case PIX_FMT_RGB565:
540     case PIX_FMT_BGR565:
541     case PIX_FMT_RGB555:
542     case PIX_FMT_BGR555:     return yuv2rgb_c_16;
543     case PIX_FMT_RGB444:
544     case PIX_FMT_BGR444:     return yuv2rgb_c_12_ordered_dither;
545     case PIX_FMT_RGB8:
546     case PIX_FMT_BGR8:       return yuv2rgb_c_8_ordered_dither;
547     case PIX_FMT_RGB4:
548     case PIX_FMT_BGR4:       return yuv2rgb_c_4_ordered_dither;
549     case PIX_FMT_RGB4_BYTE:
550     case PIX_FMT_BGR4_BYTE:  return yuv2rgb_c_4b_ordered_dither;
551     case PIX_FMT_MONOBLACK:  return yuv2rgb_c_1_ordered_dither;
552     default:
553         assert(0);
554     }
555     return NULL;
556 }
557
558 static void fill_table(uint8_t* table[256 + 2*YUVRGB_TABLE_HEADROOM], const int elemsize, const int inc, void *y_tab)
559 {
560     int i;
561     uint8_t *y_table = y_tab;
562
563     y_table -= elemsize * (inc >> 9);
564
565     for (i = 0; i < 256 + 2*YUVRGB_TABLE_HEADROOM; i++) {
566         int64_t cb = av_clip(i-YUVRGB_TABLE_HEADROOM, 0, 255)*inc;
567         table[i] = y_table + elemsize * (cb >> 16);
568     }
569 }
570
571 static void fill_gv_table(int table[256 + 2*YUVRGB_TABLE_HEADROOM], const int elemsize, const int inc)
572 {
573     int i;
574     int off = -(inc >> 9);
575
576     for (i = 0; i < 256 + 2*YUVRGB_TABLE_HEADROOM; i++) {
577         int64_t cb = av_clip(i-YUVRGB_TABLE_HEADROOM, 0, 255)*inc;
578         table[i] = elemsize * (off + (cb >> 16));
579     }
580 }
581
582 static uint16_t roundToInt16(int64_t f)
583 {
584     int r= (f + (1<<15))>>16;
585          if (r<-0x7FFF) return 0x8000;
586     else if (r> 0x7FFF) return 0x7FFF;
587     else                return r;
588 }
589
590 av_cold int ff_yuv2rgb_c_init_tables(SwsContext *c, const int inv_table[4], int fullRange,
591                                      int brightness, int contrast, int saturation)
592 {
593     const int isRgb =      c->dstFormat==PIX_FMT_RGB32
594                         || c->dstFormat==PIX_FMT_RGB32_1
595                         || c->dstFormat==PIX_FMT_BGR24
596                         || c->dstFormat==PIX_FMT_RGB565BE
597                         || c->dstFormat==PIX_FMT_RGB565LE
598                         || c->dstFormat==PIX_FMT_RGB555BE
599                         || c->dstFormat==PIX_FMT_RGB555LE
600                         || c->dstFormat==PIX_FMT_RGB444BE
601                         || c->dstFormat==PIX_FMT_RGB444LE
602                         || c->dstFormat==PIX_FMT_RGB8
603                         || c->dstFormat==PIX_FMT_RGB4
604                         || c->dstFormat==PIX_FMT_RGB4_BYTE
605                         || c->dstFormat==PIX_FMT_MONOBLACK;
606     const int isNotNe =    c->dstFormat==PIX_FMT_NE(RGB565LE,RGB565BE)
607                         || c->dstFormat==PIX_FMT_NE(RGB555LE,RGB555BE)
608                         || c->dstFormat==PIX_FMT_NE(RGB444LE,RGB444BE)
609                         || c->dstFormat==PIX_FMT_NE(BGR565LE,BGR565BE)
610                         || c->dstFormat==PIX_FMT_NE(BGR555LE,BGR555BE)
611                         || c->dstFormat==PIX_FMT_NE(BGR444LE,BGR444BE);
612     const int bpp = c->dstFormatBpp;
613     uint8_t *y_table;
614     uint16_t *y_table16;
615     uint32_t *y_table32;
616     int i, base, rbase, gbase, bbase, av_uninit(abase), needAlpha;
617     const int yoffs = fullRange ? 384 : 326;
618
619     int64_t crv =  inv_table[0];
620     int64_t cbu =  inv_table[1];
621     int64_t cgu = -inv_table[2];
622     int64_t cgv = -inv_table[3];
623     int64_t cy  = 1<<16;
624     int64_t oy  = 0;
625
626     int64_t yb = 0;
627
628     if (!fullRange) {
629         cy = (cy*255) / 219;
630         oy = 16<<16;
631     } else {
632         crv = (crv*224) / 255;
633         cbu = (cbu*224) / 255;
634         cgu = (cgu*224) / 255;
635         cgv = (cgv*224) / 255;
636     }
637
638     cy  = (cy *contrast             ) >> 16;
639     crv = (crv*contrast * saturation) >> 32;
640     cbu = (cbu*contrast * saturation) >> 32;
641     cgu = (cgu*contrast * saturation) >> 32;
642     cgv = (cgv*contrast * saturation) >> 32;
643     oy -= 256*brightness;
644
645     c->uOffset=   0x0400040004000400LL;
646     c->vOffset=   0x0400040004000400LL;
647     c->yCoeff=    roundToInt16(cy *8192) * 0x0001000100010001ULL;
648     c->vrCoeff=   roundToInt16(crv*8192) * 0x0001000100010001ULL;
649     c->ubCoeff=   roundToInt16(cbu*8192) * 0x0001000100010001ULL;
650     c->vgCoeff=   roundToInt16(cgv*8192) * 0x0001000100010001ULL;
651     c->ugCoeff=   roundToInt16(cgu*8192) * 0x0001000100010001ULL;
652     c->yOffset=   roundToInt16(oy *   8) * 0x0001000100010001ULL;
653
654     c->yuv2rgb_y_coeff  = (int16_t)roundToInt16(cy <<13);
655     c->yuv2rgb_y_offset = (int16_t)roundToInt16(oy << 9);
656     c->yuv2rgb_v2r_coeff= (int16_t)roundToInt16(crv<<13);
657     c->yuv2rgb_v2g_coeff= (int16_t)roundToInt16(cgv<<13);
658     c->yuv2rgb_u2g_coeff= (int16_t)roundToInt16(cgu<<13);
659     c->yuv2rgb_u2b_coeff= (int16_t)roundToInt16(cbu<<13);
660
661     //scale coefficients by cy
662     crv = ((crv << 16) + 0x8000) / cy;
663     cbu = ((cbu << 16) + 0x8000) / cy;
664     cgu = ((cgu << 16) + 0x8000) / cy;
665     cgv = ((cgv << 16) + 0x8000) / cy;
666
667     av_free(c->yuvTable);
668
669     switch (bpp) {
670     case 1:
671         c->yuvTable = av_malloc(1024);
672         y_table = c->yuvTable;
673         yb = -(384<<16) - oy;
674         for (i = 0; i < 1024-110; i++) {
675             y_table[i+110] = av_clip_uint8((yb + 0x8000) >> 16) >> 7;
676             yb += cy;
677         }
678         fill_table(c->table_gU, 1, cgu, y_table + yoffs);
679         fill_gv_table(c->table_gV, 1, cgv);
680         break;
681     case 4:
682     case 4|128:
683         rbase = isRgb ? 3 : 0;
684         gbase = 1;
685         bbase = isRgb ? 0 : 3;
686         c->yuvTable = av_malloc(1024*3);
687         y_table = c->yuvTable;
688         yb = -(384<<16) - oy;
689         for (i = 0; i < 1024-110; i++) {
690             int yval = av_clip_uint8((yb + 0x8000) >> 16);
691             y_table[i+110     ] =  (yval >> 7)       << rbase;
692             y_table[i+ 37+1024] = ((yval + 43) / 85) << gbase;
693             y_table[i+110+2048] =  (yval >> 7)       << bbase;
694             yb += cy;
695         }
696         fill_table(c->table_rV, 1, crv, y_table + yoffs);
697         fill_table(c->table_gU, 1, cgu, y_table + yoffs + 1024);
698         fill_table(c->table_bU, 1, cbu, y_table + yoffs + 2048);
699         fill_gv_table(c->table_gV, 1, cgv);
700         break;
701     case 8:
702         rbase = isRgb ? 5 : 0;
703         gbase = isRgb ? 2 : 3;
704         bbase = isRgb ? 0 : 6;
705         c->yuvTable = av_malloc(1024*3);
706         y_table = c->yuvTable;
707         yb = -(384<<16) - oy;
708         for (i = 0; i < 1024-38; i++) {
709             int yval = av_clip_uint8((yb + 0x8000) >> 16);
710             y_table[i+16     ] = ((yval + 18) / 36) << rbase;
711             y_table[i+16+1024] = ((yval + 18) / 36) << gbase;
712             y_table[i+37+2048] = ((yval + 43) / 85) << bbase;
713             yb += cy;
714         }
715         fill_table(c->table_rV, 1, crv, y_table + yoffs);
716         fill_table(c->table_gU, 1, cgu, y_table + yoffs + 1024);
717         fill_table(c->table_bU, 1, cbu, y_table + yoffs + 2048);
718         fill_gv_table(c->table_gV, 1, cgv);
719         break;
720     case 12:
721         rbase = isRgb ? 8 : 0;
722         gbase = 4;
723         bbase = isRgb ? 0 : 8;
724         c->yuvTable = av_malloc(1024*3*2);
725         y_table16 = c->yuvTable;
726         yb = -(384<<16) - oy;
727         for (i = 0; i < 1024; i++) {
728             uint8_t yval = av_clip_uint8((yb + 0x8000) >> 16);
729             y_table16[i     ] = (yval >> 4) << rbase;
730             y_table16[i+1024] = (yval >> 4) << gbase;
731             y_table16[i+2048] = (yval >> 4) << bbase;
732             yb += cy;
733         }
734         if (isNotNe)
735             for (i = 0; i < 1024*3; i++)
736                 y_table16[i] = av_bswap16(y_table16[i]);
737         fill_table(c->table_rV, 2, crv, y_table16 + yoffs);
738         fill_table(c->table_gU, 2, cgu, y_table16 + yoffs + 1024);
739         fill_table(c->table_bU, 2, cbu, y_table16 + yoffs + 2048);
740         fill_gv_table(c->table_gV, 2, cgv);
741         break;
742     case 15:
743     case 16:
744         rbase = isRgb ? bpp - 5 : 0;
745         gbase = 5;
746         bbase = isRgb ? 0 : (bpp - 5);
747         c->yuvTable = av_malloc(1024*3*2);
748         y_table16 = c->yuvTable;
749         yb = -(384<<16) - oy;
750         for (i = 0; i < 1024; i++) {
751             uint8_t yval = av_clip_uint8((yb + 0x8000) >> 16);
752             y_table16[i     ] = (yval >> 3)          << rbase;
753             y_table16[i+1024] = (yval >> (18 - bpp)) << gbase;
754             y_table16[i+2048] = (yval >> 3)          << bbase;
755             yb += cy;
756         }
757         if(isNotNe)
758             for (i = 0; i < 1024*3; i++)
759                 y_table16[i] = av_bswap16(y_table16[i]);
760         fill_table(c->table_rV, 2, crv, y_table16 + yoffs);
761         fill_table(c->table_gU, 2, cgu, y_table16 + yoffs + 1024);
762         fill_table(c->table_bU, 2, cbu, y_table16 + yoffs + 2048);
763         fill_gv_table(c->table_gV, 2, cgv);
764         break;
765     case 24:
766     case 48:
767         c->yuvTable = av_malloc(1024);
768         y_table = c->yuvTable;
769         yb = -(384<<16) - oy;
770         for (i = 0; i < 1024; i++) {
771             y_table[i] = av_clip_uint8((yb + 0x8000) >> 16);
772             yb += cy;
773         }
774         fill_table(c->table_rV, 1, crv, y_table + yoffs);
775         fill_table(c->table_gU, 1, cgu, y_table + yoffs);
776         fill_table(c->table_bU, 1, cbu, y_table + yoffs);
777         fill_gv_table(c->table_gV, 1, cgv);
778         break;
779     case 32:
780         base = (c->dstFormat == PIX_FMT_RGB32_1 || c->dstFormat == PIX_FMT_BGR32_1) ? 8 : 0;
781         rbase = base + (isRgb ? 16 : 0);
782         gbase = base + 8;
783         bbase = base + (isRgb ? 0 : 16);
784         needAlpha = CONFIG_SWSCALE_ALPHA && isALPHA(c->srcFormat);
785         if (!needAlpha)
786             abase = (base + 24) & 31;
787         c->yuvTable = av_malloc(1024*3*4);
788         y_table32 = c->yuvTable;
789         yb = -(384<<16) - oy;
790         for (i = 0; i < 1024; i++) {
791             unsigned yval = av_clip_uint8((yb + 0x8000) >> 16);
792             y_table32[i     ] = (yval << rbase) + (needAlpha ? 0 : (255u << abase));
793             y_table32[i+1024] = yval << gbase;
794             y_table32[i+2048] = yval << bbase;
795             yb += cy;
796         }
797         fill_table(c->table_rV, 4, crv, y_table32 + yoffs);
798         fill_table(c->table_gU, 4, cgu, y_table32 + yoffs + 1024);
799         fill_table(c->table_bU, 4, cbu, y_table32 + yoffs + 2048);
800         fill_gv_table(c->table_gV, 4, cgv);
801         break;
802     default:
803         c->yuvTable = NULL;
804         av_log(c, AV_LOG_ERROR, "%ibpp not supported by yuv2rgb\n", bpp);
805         return -1;
806     }
807     return 0;
808 }