]> git.sesse.net Git - ffmpeg/blob - libswscale/yuv2rgb.c
h264_cabac: drop an always true condition
[ffmpeg] / libswscale / yuv2rgb.c
1 /*
2  * software YUV to RGB converter
3  *
4  * Copyright (C) 2009 Konstantin Shishkov
5  *
6  * 1,4,8bpp support and context / deglobalize stuff
7  * by Michael Niedermayer (michaelni@gmx.at)
8  *
9  * This file is part of Libav.
10  *
11  * Libav is free software; you can redistribute it and/or
12  * modify it under the terms of the GNU Lesser General Public
13  * License as published by the Free Software Foundation; either
14  * version 2.1 of the License, or (at your option) any later version.
15  *
16  * Libav is distributed in the hope that it will be useful,
17  * but WITHOUT ANY WARRANTY; without even the implied warranty of
18  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
19  * Lesser General Public License for more details.
20  *
21  * You should have received a copy of the GNU Lesser General Public
22  * License along with Libav; if not, write to the Free Software
23  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
24  */
25
26 #include <stdio.h>
27 #include <stdlib.h>
28 #include <inttypes.h>
29 #include <assert.h>
30
31 #include "libavutil/cpu.h"
32 #include "libavutil/bswap.h"
33 #include "config.h"
34 #include "rgb2rgb.h"
35 #include "swscale.h"
36 #include "swscale_internal.h"
37
38 /* Color space conversion coefficients for YCbCr -> RGB mapping.
39  *
40  * Entries are {crv, cbu, cgu, cgv}
41  *
42  *   crv = (255 / 224) * 65536 * (1 - cr) / 0.5
43  *   cbu = (255 / 224) * 65536 * (1 - cb) / 0.5
44  *   cgu = (255 / 224) * 65536 * (cb / cg) * (1 - cb) / 0.5
45  *   cgv = (255 / 224) * 65536 * (cr / cg) * (1 - cr) / 0.5
46  *
47  * where Y = cr * R + cg * G + cb * B and cr + cg + cb = 1.
48  */
49 const int32_t ff_yuv2rgb_coeffs[8][4] = {
50     { 117504, 138453, 13954, 34903 }, /* no sequence_display_extension */
51     { 117504, 138453, 13954, 34903 }, /* ITU-R Rec. 709 (1990) */
52     { 104597, 132201, 25675, 53279 }, /* unspecified */
53     { 104597, 132201, 25675, 53279 }, /* reserved */
54     { 104448, 132798, 24759, 53109 }, /* FCC */
55     { 104597, 132201, 25675, 53279 }, /* ITU-R Rec. 624-4 System B, G */
56     { 104597, 132201, 25675, 53279 }, /* SMPTE 170M */
57     { 117579, 136230, 16907, 35559 }  /* SMPTE 240M (1987) */
58 };
59
60 const int *sws_getCoefficients(int colorspace)
61 {
62     if (colorspace > 7 || colorspace < 0)
63         colorspace = SWS_CS_DEFAULT;
64     return ff_yuv2rgb_coeffs[colorspace];
65 }
66
67 #define LOADCHROMA(i)                               \
68     U = pu[i];                                      \
69     V = pv[i];                                      \
70     r = (void *)c->table_rV[V];                     \
71     g = (void *)(c->table_gU[U] + c->table_gV[V]);  \
72     b = (void *)c->table_bU[U];
73
74 #define PUTRGB(dst, src, i)                         \
75     Y              = src[2 * i];                    \
76     dst[2 * i]     = r[Y] + g[Y] + b[Y];            \
77     Y              = src[2 * i + 1];                \
78     dst[2 * i + 1] = r[Y] + g[Y] + b[Y];
79
80 #define PUTRGB24(dst, src, i)                       \
81     Y              = src[2 * i];                    \
82     dst[6 * i + 0] = r[Y];                          \
83     dst[6 * i + 1] = g[Y];                          \
84     dst[6 * i + 2] = b[Y];                          \
85     Y              = src[2 * i + 1];                \
86     dst[6 * i + 3] = r[Y];                          \
87     dst[6 * i + 4] = g[Y];                          \
88     dst[6 * i + 5] = b[Y];
89
90 #define PUTBGR24(dst, src, i)                       \
91     Y              = src[2 * i];                    \
92     dst[6 * i + 0] = b[Y];                          \
93     dst[6 * i + 1] = g[Y];                          \
94     dst[6 * i + 2] = r[Y];                          \
95     Y              = src[2 * i + 1];                \
96     dst[6 * i + 3] = b[Y];                          \
97     dst[6 * i + 4] = g[Y];                          \
98     dst[6 * i + 5] = r[Y];
99
100 #define PUTRGBA(dst, ysrc, asrc, i, s)                                  \
101     Y              = ysrc[2 * i];                                       \
102     dst[2 * i]     = r[Y] + g[Y] + b[Y] + (asrc[2 * i]     << s);       \
103     Y              = ysrc[2 * i + 1];                                   \
104     dst[2 * i + 1] = r[Y] + g[Y] + b[Y] + (asrc[2 * i + 1] << s);
105
106 #define PUTRGB48(dst, src, i)                       \
107     Y                = src[ 2 * i];                 \
108     dst[12 * i +  0] = dst[12 * i +  1] = r[Y];     \
109     dst[12 * i +  2] = dst[12 * i +  3] = g[Y];     \
110     dst[12 * i +  4] = dst[12 * i +  5] = b[Y];     \
111     Y                = src[ 2 * i + 1];             \
112     dst[12 * i +  6] = dst[12 * i +  7] = r[Y];     \
113     dst[12 * i +  8] = dst[12 * i +  9] = g[Y];     \
114     dst[12 * i + 10] = dst[12 * i + 11] = b[Y];
115
116 #define PUTBGR48(dst, src, i)                       \
117     Y                = src[2 * i];                  \
118     dst[12 * i +  0] = dst[12 * i +  1] = b[Y];     \
119     dst[12 * i +  2] = dst[12 * i +  3] = g[Y];     \
120     dst[12 * i +  4] = dst[12 * i +  5] = r[Y];     \
121     Y                = src[2  * i +  1];            \
122     dst[12 * i +  6] = dst[12 * i +  7] = b[Y];     \
123     dst[12 * i +  8] = dst[12 * i +  9] = g[Y];     \
124     dst[12 * i + 10] = dst[12 * i + 11] = r[Y];
125
126 #define YUV2RGBFUNC(func_name, dst_type, alpha)                             \
127     static int func_name(SwsContext *c, const uint8_t *src[],               \
128                          int srcStride[], int srcSliceY, int srcSliceH,     \
129                          uint8_t *dst[], int dstStride[])                   \
130     {                                                                       \
131         int y;                                                              \
132                                                                             \
133         if (!alpha && c->srcFormat == AV_PIX_FMT_YUV422P) {                    \
134             srcStride[1] *= 2;                                              \
135             srcStride[2] *= 2;                                              \
136         }                                                                   \
137         for (y = 0; y < srcSliceH; y += 2) {                                \
138             dst_type *dst_1 =                                               \
139                 (dst_type *)(dst[0] + (y + srcSliceY)     * dstStride[0]);  \
140             dst_type *dst_2 =                                               \
141                 (dst_type *)(dst[0] + (y + srcSliceY + 1) * dstStride[0]);  \
142             dst_type av_unused *r, *g, *b;                                  \
143             const uint8_t *py_1 = src[0] +  y       * srcStride[0];         \
144             const uint8_t *py_2 = py_1   +            srcStride[0];         \
145             const uint8_t *pu   = src[1] + (y >> 1) * srcStride[1];         \
146             const uint8_t *pv   = src[2] + (y >> 1) * srcStride[2];         \
147             const uint8_t av_unused *pa_1, *pa_2;                           \
148             unsigned int h_size = c->dstW >> 3;                             \
149             if (alpha) {                                                    \
150                 pa_1 = src[3] + y * srcStride[3];                           \
151                 pa_2 = pa_1   +     srcStride[3];                           \
152             }                                                               \
153             while (h_size--) {                                              \
154                 int av_unused U, V, Y;                                      \
155
156 #define ENDYUV2RGBLINE(dst_delta, ss)               \
157     pu    += 4 >> ss;                               \
158     pv    += 4 >> ss;                               \
159     py_1  += 8 >> ss;                               \
160     py_2  += 8 >> ss;                               \
161     dst_1 += dst_delta >> ss;                       \
162     dst_2 += dst_delta >> ss;                       \
163     }                                               \
164     if (c->dstW & (4 >> ss)) {                      \
165         int av_unused Y, U, V;                      \
166
167 #define ENDYUV2RGBFUNC()                            \
168             }                                       \
169         }                                           \
170         return srcSliceH;                           \
171     }
172
173 #define CLOSEYUV2RGBFUNC(dst_delta)                 \
174     ENDYUV2RGBLINE(dst_delta, 0)                    \
175     ENDYUV2RGBFUNC()
176
177 YUV2RGBFUNC(yuv2rgb_c_48, uint8_t, 0)
178     LOADCHROMA(0);
179     PUTRGB48(dst_1, py_1, 0);
180     PUTRGB48(dst_2, py_2, 0);
181
182     LOADCHROMA(1);
183     PUTRGB48(dst_2, py_2, 1);
184     PUTRGB48(dst_1, py_1, 1);
185
186     LOADCHROMA(2);
187     PUTRGB48(dst_1, py_1, 2);
188     PUTRGB48(dst_2, py_2, 2);
189
190     LOADCHROMA(3);
191     PUTRGB48(dst_2, py_2, 3);
192     PUTRGB48(dst_1, py_1, 3);
193 ENDYUV2RGBLINE(48, 0)
194     LOADCHROMA(0);
195     PUTRGB48(dst_1, py_1, 0);
196     PUTRGB48(dst_2, py_2, 0);
197
198     LOADCHROMA(1);
199     PUTRGB48(dst_2, py_2, 1);
200     PUTRGB48(dst_1, py_1, 1);
201 ENDYUV2RGBLINE(48, 1)
202     LOADCHROMA(0);
203     PUTRGB48(dst_1, py_1, 0);
204     PUTRGB48(dst_2, py_2, 0);
205 ENDYUV2RGBFUNC()
206
207 YUV2RGBFUNC(yuv2rgb_c_bgr48, uint8_t, 0)
208     LOADCHROMA(0);
209     PUTBGR48(dst_1, py_1, 0);
210     PUTBGR48(dst_2, py_2, 0);
211
212     LOADCHROMA(1);
213     PUTBGR48(dst_2, py_2, 1);
214     PUTBGR48(dst_1, py_1, 1);
215
216     LOADCHROMA(2);
217     PUTBGR48(dst_1, py_1, 2);
218     PUTBGR48(dst_2, py_2, 2);
219
220     LOADCHROMA(3);
221     PUTBGR48(dst_2, py_2, 3);
222     PUTBGR48(dst_1, py_1, 3);
223 ENDYUV2RGBLINE(48, 0)
224     LOADCHROMA(0);
225     PUTBGR48(dst_1, py_1, 0);
226     PUTBGR48(dst_2, py_2, 0);
227
228     LOADCHROMA(1);
229     PUTBGR48(dst_2, py_2, 1);
230     PUTBGR48(dst_1, py_1, 1);
231 ENDYUV2RGBLINE(48, 1)
232     LOADCHROMA(0);
233     PUTBGR48(dst_1, py_1, 0);
234     PUTBGR48(dst_2, py_2, 0);
235 ENDYUV2RGBFUNC()
236
237 YUV2RGBFUNC(yuv2rgb_c_32, uint32_t, 0)
238     LOADCHROMA(0);
239     PUTRGB(dst_1, py_1, 0);
240     PUTRGB(dst_2, py_2, 0);
241
242     LOADCHROMA(1);
243     PUTRGB(dst_2, py_2, 1);
244     PUTRGB(dst_1, py_1, 1);
245
246     LOADCHROMA(2);
247     PUTRGB(dst_1, py_1, 2);
248     PUTRGB(dst_2, py_2, 2);
249
250     LOADCHROMA(3);
251     PUTRGB(dst_2, py_2, 3);
252     PUTRGB(dst_1, py_1, 3);
253 ENDYUV2RGBLINE(8, 0)
254     LOADCHROMA(0);
255     PUTRGB(dst_1, py_1, 0);
256     PUTRGB(dst_2, py_2, 0);
257
258     LOADCHROMA(1);
259     PUTRGB(dst_2, py_2, 1);
260     PUTRGB(dst_1, py_1, 1);
261 ENDYUV2RGBLINE(8, 1)
262     LOADCHROMA(0);
263     PUTRGB(dst_1, py_1, 0);
264     PUTRGB(dst_2, py_2, 0);
265 ENDYUV2RGBFUNC()
266
267 YUV2RGBFUNC(yuva2rgba_c, uint32_t, 1)
268     LOADCHROMA(0);
269     PUTRGBA(dst_1, py_1, pa_1, 0, 24);
270     PUTRGBA(dst_2, py_2, pa_2, 0, 24);
271
272     LOADCHROMA(1);
273     PUTRGBA(dst_2, py_2, pa_2, 1, 24);
274     PUTRGBA(dst_1, py_1, pa_1, 1, 24);
275
276     LOADCHROMA(2);
277     PUTRGBA(dst_1, py_1, pa_1, 2, 24);
278     PUTRGBA(dst_2, py_2, pa_2, 2, 24);
279
280     LOADCHROMA(3);
281     PUTRGBA(dst_2, py_2, pa_2, 3, 24);
282     PUTRGBA(dst_1, py_1, pa_1, 3, 24);
283     pa_1 += 8;
284     pa_2 += 8;
285 ENDYUV2RGBLINE(8, 0)
286     LOADCHROMA(0);
287     PUTRGBA(dst_1, py_1, pa_1, 0, 24);
288     PUTRGBA(dst_2, py_2, pa_2, 0, 24);
289
290     LOADCHROMA(1);
291     PUTRGBA(dst_2, py_2, pa_2, 1, 24);
292     PUTRGBA(dst_1, py_1, pa_1, 1, 24);
293     pa_1 += 4;
294     pa_2 += 4;
295 ENDYUV2RGBLINE(8, 1)
296     LOADCHROMA(0);
297     PUTRGBA(dst_1, py_1, pa_1, 0, 24);
298     PUTRGBA(dst_2, py_2, pa_2, 0, 24);
299 ENDYUV2RGBFUNC()
300
301 YUV2RGBFUNC(yuva2argb_c, uint32_t, 1)
302     LOADCHROMA(0);
303     PUTRGBA(dst_1, py_1, pa_1, 0, 0);
304     PUTRGBA(dst_2, py_2, pa_2, 0, 0);
305
306     LOADCHROMA(1);
307     PUTRGBA(dst_2, py_2, pa_2, 1, 0);
308     PUTRGBA(dst_1, py_1, pa_1, 1, 0);
309
310     LOADCHROMA(2);
311     PUTRGBA(dst_1, py_1, pa_1, 2, 0);
312     PUTRGBA(dst_2, py_2, pa_2, 2, 0);
313
314     LOADCHROMA(3);
315     PUTRGBA(dst_2, py_2, pa_2, 3, 0);
316     PUTRGBA(dst_1, py_1, pa_1, 3, 0);
317     pa_1 += 8;
318     pa_2 += 8;
319 ENDYUV2RGBLINE(8, 0)
320     LOADCHROMA(0);
321     PUTRGBA(dst_1, py_1, pa_1, 0, 0);
322     PUTRGBA(dst_2, py_2, pa_2, 0, 0);
323
324     LOADCHROMA(1);
325     PUTRGBA(dst_2, py_2, pa_2, 1, 0);
326     PUTRGBA(dst_1, py_1, pa_1, 1, 0);
327     pa_1 += 4;
328     pa_2 += 4;
329 ENDYUV2RGBLINE(8, 1)
330     LOADCHROMA(0);
331     PUTRGBA(dst_1, py_1, pa_1, 0, 0);
332     PUTRGBA(dst_2, py_2, pa_2, 0, 0);
333 ENDYUV2RGBFUNC()
334
335 YUV2RGBFUNC(yuv2rgb_c_24_rgb, uint8_t, 0)
336     LOADCHROMA(0);
337     PUTRGB24(dst_1, py_1, 0);
338     PUTRGB24(dst_2, py_2, 0);
339
340     LOADCHROMA(1);
341     PUTRGB24(dst_2, py_2, 1);
342     PUTRGB24(dst_1, py_1, 1);
343
344     LOADCHROMA(2);
345     PUTRGB24(dst_1, py_1, 2);
346     PUTRGB24(dst_2, py_2, 2);
347
348     LOADCHROMA(3);
349     PUTRGB24(dst_2, py_2, 3);
350     PUTRGB24(dst_1, py_1, 3);
351 ENDYUV2RGBLINE(24, 0)
352     LOADCHROMA(0);
353     PUTRGB24(dst_1, py_1, 0);
354     PUTRGB24(dst_2, py_2, 0);
355
356     LOADCHROMA(1);
357     PUTRGB24(dst_2, py_2, 1);
358     PUTRGB24(dst_1, py_1, 1);
359 ENDYUV2RGBLINE(24, 1)
360     LOADCHROMA(0);
361     PUTRGB24(dst_1, py_1, 0);
362     PUTRGB24(dst_2, py_2, 0);
363 ENDYUV2RGBFUNC()
364
365 // only trivial mods from yuv2rgb_c_24_rgb
366 YUV2RGBFUNC(yuv2rgb_c_24_bgr, uint8_t, 0)
367     LOADCHROMA(0);
368     PUTBGR24(dst_1, py_1, 0);
369     PUTBGR24(dst_2, py_2, 0);
370
371     LOADCHROMA(1);
372     PUTBGR24(dst_2, py_2, 1);
373     PUTBGR24(dst_1, py_1, 1);
374
375     LOADCHROMA(2);
376     PUTBGR24(dst_1, py_1, 2);
377     PUTBGR24(dst_2, py_2, 2);
378
379     LOADCHROMA(3);
380     PUTBGR24(dst_2, py_2, 3);
381     PUTBGR24(dst_1, py_1, 3);
382 ENDYUV2RGBLINE(24, 0)
383     LOADCHROMA(0);
384     PUTBGR24(dst_1, py_1, 0);
385     PUTBGR24(dst_2, py_2, 0);
386
387     LOADCHROMA(1);
388     PUTBGR24(dst_2, py_2, 1);
389     PUTBGR24(dst_1, py_1, 1);
390 ENDYUV2RGBLINE(24, 1)
391     LOADCHROMA(0);
392     PUTBGR24(dst_1, py_1, 0);
393     PUTBGR24(dst_2, py_2, 0);
394 ENDYUV2RGBFUNC()
395
396 // This is exactly the same code as yuv2rgb_c_32 except for the types of
397 // r, g, b, dst_1, dst_2
398 YUV2RGBFUNC(yuv2rgb_c_16, uint16_t, 0)
399     LOADCHROMA(0);
400     PUTRGB(dst_1, py_1, 0);
401     PUTRGB(dst_2, py_2, 0);
402
403     LOADCHROMA(1);
404     PUTRGB(dst_2, py_2, 1);
405     PUTRGB(dst_1, py_1, 1);
406
407     LOADCHROMA(2);
408     PUTRGB(dst_1, py_1, 2);
409     PUTRGB(dst_2, py_2, 2);
410
411     LOADCHROMA(3);
412     PUTRGB(dst_2, py_2, 3);
413     PUTRGB(dst_1, py_1, 3);
414 CLOSEYUV2RGBFUNC(8)
415
416 // r, g, b, dst_1, dst_2
417 YUV2RGBFUNC(yuv2rgb_c_12_ordered_dither, uint16_t, 0)
418     const uint8_t *d16 = ff_dither_4x4_16[y & 3];
419
420 #define PUTRGB12(dst, src, i, o)                    \
421     Y              = src[2 * i];                    \
422     dst[2 * i]     = r[Y + d16[0 + o]] +            \
423                      g[Y + d16[0 + o]] +            \
424                      b[Y + d16[0 + o]];             \
425     Y              = src[2 * i + 1];                \
426     dst[2 * i + 1] = r[Y + d16[1 + o]] +            \
427                      g[Y + d16[1 + o]] +            \
428                      b[Y + d16[1 + o]];
429
430     LOADCHROMA(0);
431     PUTRGB12(dst_1, py_1, 0, 0);
432     PUTRGB12(dst_2, py_2, 0, 0 + 8);
433
434     LOADCHROMA(1);
435     PUTRGB12(dst_2, py_2, 1, 2 + 8);
436     PUTRGB12(dst_1, py_1, 1, 2);
437
438     LOADCHROMA(2);
439     PUTRGB12(dst_1, py_1, 2, 4);
440     PUTRGB12(dst_2, py_2, 2, 4 + 8);
441
442     LOADCHROMA(3);
443     PUTRGB12(dst_2, py_2, 3, 6 + 8);
444     PUTRGB12(dst_1, py_1, 3, 6);
445 CLOSEYUV2RGBFUNC(8)
446
447 // r, g, b, dst_1, dst_2
448 YUV2RGBFUNC(yuv2rgb_c_8_ordered_dither, uint8_t, 0)
449     const uint8_t *d32 = ff_dither_8x8_32[y & 7];
450     const uint8_t *d64 = ff_dither_8x8_73[y & 7];
451
452 #define PUTRGB8(dst, src, i, o)                     \
453     Y              = src[2 * i];                    \
454     dst[2 * i]     = r[Y + d32[0 + o]] +            \
455                      g[Y + d32[0 + o]] +            \
456                      b[Y + d64[0 + o]];             \
457     Y              = src[2 * i + 1];                \
458     dst[2 * i + 1] = r[Y + d32[1 + o]] +            \
459                      g[Y + d32[1 + o]] +            \
460                      b[Y + d64[1 + o]];
461
462     LOADCHROMA(0);
463     PUTRGB8(dst_1, py_1, 0, 0);
464     PUTRGB8(dst_2, py_2, 0, 0 + 8);
465
466     LOADCHROMA(1);
467     PUTRGB8(dst_2, py_2, 1, 2 + 8);
468     PUTRGB8(dst_1, py_1, 1, 2);
469
470     LOADCHROMA(2);
471     PUTRGB8(dst_1, py_1, 2, 4);
472     PUTRGB8(dst_2, py_2, 2, 4 + 8);
473
474     LOADCHROMA(3);
475     PUTRGB8(dst_2, py_2, 3, 6 + 8);
476     PUTRGB8(dst_1, py_1, 3, 6);
477 CLOSEYUV2RGBFUNC(8)
478
479 YUV2RGBFUNC(yuv2rgb_c_4_ordered_dither, uint8_t, 0)
480     const uint8_t * d64 = ff_dither_8x8_73[y & 7];
481     const uint8_t *d128 = ff_dither_8x8_220[y & 7];
482     int acc;
483
484 #define PUTRGB4D(dst, src, i, o)                    \
485     Y      = src[2 * i];                            \
486     acc    = r[Y + d128[0 + o]] +                   \
487              g[Y +  d64[0 + o]] +                   \
488              b[Y + d128[0 + o]];                    \
489     Y      = src[2 * i + 1];                        \
490     acc   |= (r[Y + d128[1 + o]] +                  \
491               g[Y +  d64[1 + o]] +                  \
492               b[Y + d128[1 + o]]) << 4;             \
493     dst[i] = acc;
494
495     LOADCHROMA(0);
496     PUTRGB4D(dst_1, py_1, 0, 0);
497     PUTRGB4D(dst_2, py_2, 0, 0 + 8);
498
499     LOADCHROMA(1);
500     PUTRGB4D(dst_2, py_2, 1, 2 + 8);
501     PUTRGB4D(dst_1, py_1, 1, 2);
502
503     LOADCHROMA(2);
504     PUTRGB4D(dst_1, py_1, 2, 4);
505     PUTRGB4D(dst_2, py_2, 2, 4 + 8);
506
507     LOADCHROMA(3);
508     PUTRGB4D(dst_2, py_2, 3, 6 + 8);
509     PUTRGB4D(dst_1, py_1, 3, 6);
510 CLOSEYUV2RGBFUNC(4)
511
512 YUV2RGBFUNC(yuv2rgb_c_4b_ordered_dither, uint8_t, 0)
513     const uint8_t *d64  = ff_dither_8x8_73[y & 7];
514     const uint8_t *d128 = ff_dither_8x8_220[y & 7];
515
516 #define PUTRGB4DB(dst, src, i, o)                   \
517     Y              = src[2 * i];                    \
518     dst[2 * i]     = r[Y + d128[0 + o]] +           \
519                      g[Y +  d64[0 + o]] +           \
520                      b[Y + d128[0 + o]];            \
521     Y              = src[2 * i + 1];                \
522     dst[2 * i + 1] = r[Y + d128[1 + o]] +           \
523                      g[Y +  d64[1 + o]] +           \
524                      b[Y + d128[1 + o]];
525
526     LOADCHROMA(0);
527     PUTRGB4DB(dst_1, py_1, 0, 0);
528     PUTRGB4DB(dst_2, py_2, 0, 0 + 8);
529
530     LOADCHROMA(1);
531     PUTRGB4DB(dst_2, py_2, 1, 2 + 8);
532     PUTRGB4DB(dst_1, py_1, 1, 2);
533
534     LOADCHROMA(2);
535     PUTRGB4DB(dst_1, py_1, 2, 4);
536     PUTRGB4DB(dst_2, py_2, 2, 4 + 8);
537
538     LOADCHROMA(3);
539     PUTRGB4DB(dst_2, py_2, 3, 6 + 8);
540     PUTRGB4DB(dst_1, py_1, 3, 6);
541 CLOSEYUV2RGBFUNC(8)
542
543 YUV2RGBFUNC(yuv2rgb_c_1_ordered_dither, uint8_t, 0)
544     const uint8_t *d128 = ff_dither_8x8_220[y & 7];
545     char out_1 = 0, out_2 = 0;
546     g = c->table_gU[128] + c->table_gV[128];
547
548 #define PUTRGB1(out, src, i, o)                     \
549     Y    = src[2 * i];                              \
550     out += out + g[Y + d128[0 + o]];                \
551     Y    = src[2 * i + 1];                          \
552     out += out + g[Y + d128[1 + o]];
553
554     PUTRGB1(out_1, py_1, 0, 0);
555     PUTRGB1(out_2, py_2, 0, 0 + 8);
556
557     PUTRGB1(out_2, py_2, 1, 2 + 8);
558     PUTRGB1(out_1, py_1, 1, 2);
559
560     PUTRGB1(out_1, py_1, 2, 4);
561     PUTRGB1(out_2, py_2, 2, 4 + 8);
562
563     PUTRGB1(out_2, py_2, 3, 6 + 8);
564     PUTRGB1(out_1, py_1, 3, 6);
565
566     dst_1[0] = out_1;
567     dst_2[0] = out_2;
568 CLOSEYUV2RGBFUNC(1)
569
570 SwsFunc ff_yuv2rgb_get_func_ptr(SwsContext *c)
571 {
572     SwsFunc t = NULL;
573
574     if (ARCH_PPC)
575         t = ff_yuv2rgb_init_ppc(c);
576     if (ARCH_X86)
577         t = ff_yuv2rgb_init_x86(c);
578
579     if (t)
580         return t;
581
582     av_log(c, AV_LOG_WARNING,
583            "No accelerated colorspace conversion found from %s to %s.\n",
584            sws_format_name(c->srcFormat), sws_format_name(c->dstFormat));
585
586     switch (c->dstFormat) {
587     case AV_PIX_FMT_BGR48BE:
588     case AV_PIX_FMT_BGR48LE:
589         return yuv2rgb_c_bgr48;
590     case AV_PIX_FMT_RGB48BE:
591     case AV_PIX_FMT_RGB48LE:
592         return yuv2rgb_c_48;
593     case AV_PIX_FMT_ARGB:
594     case AV_PIX_FMT_ABGR:
595         if (CONFIG_SWSCALE_ALPHA && c->srcFormat == AV_PIX_FMT_YUVA420P)
596             return yuva2argb_c;
597     case AV_PIX_FMT_RGBA:
598     case AV_PIX_FMT_BGRA:
599         if (CONFIG_SWSCALE_ALPHA && c->srcFormat == AV_PIX_FMT_YUVA420P)
600             return yuva2rgba_c;
601         else
602             return yuv2rgb_c_32;
603     case AV_PIX_FMT_RGB24:
604         return yuv2rgb_c_24_rgb;
605     case AV_PIX_FMT_BGR24:
606         return yuv2rgb_c_24_bgr;
607     case AV_PIX_FMT_RGB565:
608     case AV_PIX_FMT_BGR565:
609     case AV_PIX_FMT_RGB555:
610     case AV_PIX_FMT_BGR555:
611         return yuv2rgb_c_16;
612     case AV_PIX_FMT_RGB444:
613     case AV_PIX_FMT_BGR444:
614         return yuv2rgb_c_12_ordered_dither;
615     case AV_PIX_FMT_RGB8:
616     case AV_PIX_FMT_BGR8:
617         return yuv2rgb_c_8_ordered_dither;
618     case AV_PIX_FMT_RGB4:
619     case AV_PIX_FMT_BGR4:
620         return yuv2rgb_c_4_ordered_dither;
621     case AV_PIX_FMT_RGB4_BYTE:
622     case AV_PIX_FMT_BGR4_BYTE:
623         return yuv2rgb_c_4b_ordered_dither;
624     case AV_PIX_FMT_MONOBLACK:
625         return yuv2rgb_c_1_ordered_dither;
626     default:
627         assert(0);
628     }
629     return NULL;
630 }
631
632 static void fill_table(uint8_t *table[256], const int elemsize,
633                        const int inc, void *y_tab)
634 {
635     int i;
636     int64_t cb       = 0;
637     uint8_t *y_table = y_tab;
638
639     y_table -= elemsize * (inc >> 9);
640
641     for (i = 0; i < 256; i++) {
642         table[i] = y_table + elemsize * (cb >> 16);
643         cb      += inc;
644     }
645 }
646
647 static void fill_gv_table(int table[256], const int elemsize, const int inc)
648 {
649     int i;
650     int64_t cb = 0;
651     int off    = -(inc >> 9);
652
653     for (i = 0; i < 256; i++) {
654         table[i] = elemsize * (off + (cb >> 16));
655         cb      += inc;
656     }
657 }
658
659 static uint16_t roundToInt16(int64_t f)
660 {
661     int r = (f + (1 << 15)) >> 16;
662
663     if (r < -0x7FFF)
664         return 0x8000;
665     else if (r > 0x7FFF)
666         return 0x7FFF;
667     else
668         return r;
669 }
670
671 av_cold int ff_yuv2rgb_c_init_tables(SwsContext *c, const int inv_table[4],
672                                      int fullRange, int brightness,
673                                      int contrast, int saturation)
674 {
675     const int isRgb = c->dstFormat == AV_PIX_FMT_RGB32     ||
676                       c->dstFormat == AV_PIX_FMT_RGB32_1   ||
677                       c->dstFormat == AV_PIX_FMT_BGR24     ||
678                       c->dstFormat == AV_PIX_FMT_RGB565BE  ||
679                       c->dstFormat == AV_PIX_FMT_RGB565LE  ||
680                       c->dstFormat == AV_PIX_FMT_RGB555BE  ||
681                       c->dstFormat == AV_PIX_FMT_RGB555LE  ||
682                       c->dstFormat == AV_PIX_FMT_RGB444BE  ||
683                       c->dstFormat == AV_PIX_FMT_RGB444LE  ||
684                       c->dstFormat == AV_PIX_FMT_RGB8      ||
685                       c->dstFormat == AV_PIX_FMT_RGB4      ||
686                       c->dstFormat == AV_PIX_FMT_RGB4_BYTE ||
687                       c->dstFormat == AV_PIX_FMT_MONOBLACK;
688     const int isNotNe = c->dstFormat == AV_PIX_FMT_NE(RGB565LE, RGB565BE) ||
689                         c->dstFormat == AV_PIX_FMT_NE(RGB555LE, RGB555BE) ||
690                         c->dstFormat == AV_PIX_FMT_NE(RGB444LE, RGB444BE) ||
691                         c->dstFormat == AV_PIX_FMT_NE(BGR565LE, BGR565BE) ||
692                         c->dstFormat == AV_PIX_FMT_NE(BGR555LE, BGR555BE) ||
693                         c->dstFormat == AV_PIX_FMT_NE(BGR444LE, BGR444BE);
694     const int bpp = c->dstFormatBpp;
695     uint8_t *y_table;
696     uint16_t *y_table16;
697     uint32_t *y_table32;
698     int i, base, rbase, gbase, bbase, abase, needAlpha;
699     const int yoffs = fullRange ? 384 : 326;
700
701     int64_t crv =  inv_table[0];
702     int64_t cbu =  inv_table[1];
703     int64_t cgu = -inv_table[2];
704     int64_t cgv = -inv_table[3];
705     int64_t cy  = 1 << 16;
706     int64_t oy  = 0;
707     int64_t yb  = 0;
708
709     if (!fullRange) {
710         cy = (cy * 255) / 219;
711         oy = 16 << 16;
712     } else {
713         crv = (crv * 224) / 255;
714         cbu = (cbu * 224) / 255;
715         cgu = (cgu * 224) / 255;
716         cgv = (cgv * 224) / 255;
717     }
718
719     cy   = (cy  * contrast)              >> 16;
720     crv  = (crv * contrast * saturation) >> 32;
721     cbu  = (cbu * contrast * saturation) >> 32;
722     cgu  = (cgu * contrast * saturation) >> 32;
723     cgv  = (cgv * contrast * saturation) >> 32;
724     oy  -= 256 * brightness;
725
726     c->uOffset = 0x0400040004000400LL;
727     c->vOffset = 0x0400040004000400LL;
728     c->yCoeff  = roundToInt16(cy  * 8192) * 0x0001000100010001ULL;
729     c->vrCoeff = roundToInt16(crv * 8192) * 0x0001000100010001ULL;
730     c->ubCoeff = roundToInt16(cbu * 8192) * 0x0001000100010001ULL;
731     c->vgCoeff = roundToInt16(cgv * 8192) * 0x0001000100010001ULL;
732     c->ugCoeff = roundToInt16(cgu * 8192) * 0x0001000100010001ULL;
733     c->yOffset = roundToInt16(oy  *    8) * 0x0001000100010001ULL;
734
735     c->yuv2rgb_y_coeff   = (int16_t)roundToInt16(cy  << 13);
736     c->yuv2rgb_y_offset  = (int16_t)roundToInt16(oy  <<  9);
737     c->yuv2rgb_v2r_coeff = (int16_t)roundToInt16(crv << 13);
738     c->yuv2rgb_v2g_coeff = (int16_t)roundToInt16(cgv << 13);
739     c->yuv2rgb_u2g_coeff = (int16_t)roundToInt16(cgu << 13);
740     c->yuv2rgb_u2b_coeff = (int16_t)roundToInt16(cbu << 13);
741
742     //scale coefficients by cy
743     crv = ((crv << 16) + 0x8000) / cy;
744     cbu = ((cbu << 16) + 0x8000) / cy;
745     cgu = ((cgu << 16) + 0x8000) / cy;
746     cgv = ((cgv << 16) + 0x8000) / cy;
747
748     av_free(c->yuvTable);
749
750 #define ALLOC_YUV_TABLE(x)          \
751         c->yuvTable = av_malloc(x); \
752         if (!c->yuvTable)           \
753             return AVERROR(ENOMEM);
754     switch (bpp) {
755     case 1:
756         ALLOC_YUV_TABLE(1024);
757         y_table     = c->yuvTable;
758         yb = -(384 << 16) - oy;
759         for (i = 0; i < 1024 - 110; i++) {
760             y_table[i + 110]  = av_clip_uint8((yb + 0x8000) >> 16) >> 7;
761             yb               += cy;
762         }
763         fill_table(c->table_gU, 1, cgu, y_table + yoffs);
764         fill_gv_table(c->table_gV, 1, cgv);
765         break;
766     case 4:
767     case 4 | 128:
768         rbase       = isRgb ? 3 : 0;
769         gbase       = 1;
770         bbase       = isRgb ? 0 : 3;
771         ALLOC_YUV_TABLE(1024 * 3);
772         y_table     = c->yuvTable;
773         yb = -(384 << 16) - oy;
774         for (i = 0; i < 1024 - 110; i++) {
775             int yval                = av_clip_uint8((yb + 0x8000) >> 16);
776             y_table[i + 110]        = (yval >> 7)        << rbase;
777             y_table[i +  37 + 1024] = ((yval + 43) / 85) << gbase;
778             y_table[i + 110 + 2048] = (yval >> 7)        << bbase;
779             yb += cy;
780         }
781         fill_table(c->table_rV, 1, crv, y_table + yoffs);
782         fill_table(c->table_gU, 1, cgu, y_table + yoffs + 1024);
783         fill_table(c->table_bU, 1, cbu, y_table + yoffs + 2048);
784         fill_gv_table(c->table_gV, 1, cgv);
785         break;
786     case 8:
787         rbase       = isRgb ? 5 : 0;
788         gbase       = isRgb ? 2 : 3;
789         bbase       = isRgb ? 0 : 6;
790         ALLOC_YUV_TABLE(1024 * 3);
791         y_table     = c->yuvTable;
792         yb = -(384 << 16) - oy;
793         for (i = 0; i < 1024 - 38; i++) {
794             int yval               = av_clip_uint8((yb + 0x8000) >> 16);
795             y_table[i + 16]        = ((yval + 18) / 36) << rbase;
796             y_table[i + 16 + 1024] = ((yval + 18) / 36) << gbase;
797             y_table[i + 37 + 2048] = ((yval + 43) / 85) << bbase;
798             yb += cy;
799         }
800         fill_table(c->table_rV, 1, crv, y_table + yoffs);
801         fill_table(c->table_gU, 1, cgu, y_table + yoffs + 1024);
802         fill_table(c->table_bU, 1, cbu, y_table + yoffs + 2048);
803         fill_gv_table(c->table_gV, 1, cgv);
804         break;
805     case 12:
806         rbase       = isRgb ? 8 : 0;
807         gbase       = 4;
808         bbase       = isRgb ? 0 : 8;
809         ALLOC_YUV_TABLE(1024 * 3 * 2);
810         y_table16   = c->yuvTable;
811         yb = -(384 << 16) - oy;
812         for (i = 0; i < 1024; i++) {
813             uint8_t yval        = av_clip_uint8((yb + 0x8000) >> 16);
814             y_table16[i]        = (yval >> 4) << rbase;
815             y_table16[i + 1024] = (yval >> 4) << gbase;
816             y_table16[i + 2048] = (yval >> 4) << bbase;
817             yb += cy;
818         }
819         if (isNotNe)
820             for (i = 0; i < 1024 * 3; i++)
821                 y_table16[i] = av_bswap16(y_table16[i]);
822         fill_table(c->table_rV, 2, crv, y_table16 + yoffs);
823         fill_table(c->table_gU, 2, cgu, y_table16 + yoffs + 1024);
824         fill_table(c->table_bU, 2, cbu, y_table16 + yoffs + 2048);
825         fill_gv_table(c->table_gV, 2, cgv);
826         break;
827     case 15:
828     case 16:
829         rbase       = isRgb ? bpp - 5 : 0;
830         gbase       = 5;
831         bbase       = isRgb ? 0 : (bpp - 5);
832         ALLOC_YUV_TABLE(1024 * 3 * 2);
833         y_table16   = c->yuvTable;
834         yb = -(384 << 16) - oy;
835         for (i = 0; i < 1024; i++) {
836             uint8_t yval        = av_clip_uint8((yb + 0x8000) >> 16);
837             y_table16[i]        = (yval >> 3)          << rbase;
838             y_table16[i + 1024] = (yval >> (18 - bpp)) << gbase;
839             y_table16[i + 2048] = (yval >> 3)          << bbase;
840             yb += cy;
841         }
842         if (isNotNe)
843             for (i = 0; i < 1024 * 3; i++)
844                 y_table16[i] = av_bswap16(y_table16[i]);
845         fill_table(c->table_rV, 2, crv, y_table16 + yoffs);
846         fill_table(c->table_gU, 2, cgu, y_table16 + yoffs + 1024);
847         fill_table(c->table_bU, 2, cbu, y_table16 + yoffs + 2048);
848         fill_gv_table(c->table_gV, 2, cgv);
849         break;
850     case 24:
851     case 48:
852         ALLOC_YUV_TABLE(1024);
853         y_table     = c->yuvTable;
854         yb = -(384 << 16) - oy;
855         for (i = 0; i < 1024; i++) {
856             y_table[i]  = av_clip_uint8((yb + 0x8000) >> 16);
857             yb         += cy;
858         }
859         fill_table(c->table_rV, 1, crv, y_table + yoffs);
860         fill_table(c->table_gU, 1, cgu, y_table + yoffs);
861         fill_table(c->table_bU, 1, cbu, y_table + yoffs);
862         fill_gv_table(c->table_gV, 1, cgv);
863         break;
864     case 32:
865         base      = (c->dstFormat == AV_PIX_FMT_RGB32_1 ||
866                      c->dstFormat == AV_PIX_FMT_BGR32_1) ? 8 : 0;
867         rbase     = base + (isRgb ? 16 : 0);
868         gbase     = base + 8;
869         bbase     = base + (isRgb ? 0 : 16);
870         needAlpha = CONFIG_SWSCALE_ALPHA && isALPHA(c->srcFormat);
871         if (!needAlpha)
872             abase = (base + 24) & 31;
873         ALLOC_YUV_TABLE(1024 * 3 * 4);
874         y_table32   = c->yuvTable;
875         yb = -(384 << 16) - oy;
876         for (i = 0; i < 1024; i++) {
877             unsigned yval       = av_clip_uint8((yb + 0x8000) >> 16);
878             y_table32[i]        = (yval << rbase) +
879                                   (needAlpha ? 0 : (255u << abase));
880             y_table32[i + 1024] =  yval << gbase;
881             y_table32[i + 2048] =  yval << bbase;
882             yb += cy;
883         }
884         fill_table(c->table_rV, 4, crv, y_table32 + yoffs);
885         fill_table(c->table_gU, 4, cgu, y_table32 + yoffs + 1024);
886         fill_table(c->table_bU, 4, cbu, y_table32 + yoffs + 2048);
887         fill_gv_table(c->table_gV, 4, cgv);
888         break;
889     default:
890         c->yuvTable = NULL;
891         if(!isPlanar(c->dstFormat) || bpp <= 24)
892             av_log(c, AV_LOG_ERROR, "%ibpp not supported by yuv2rgb\n", bpp);
893         return -1;
894     }
895     return 0;
896 }