]> git.sesse.net Git - ffmpeg/blob - libavcodec/huffyuvenc.c
Merge commit 'f3202871598f59b570b31b01cfeb64b8fedbd700'
[ffmpeg] / libavcodec / huffyuvenc.c
1 /*
2  * Copyright (c) 2002-2014 Michael Niedermayer <michaelni@gmx.at>
3  *
4  * see http://www.pcisys.net/~melanson/codecs/huffyuv.txt for a description of
5  * the algorithm used
6  *
7  * This file is part of FFmpeg.
8  *
9  * FFmpeg is free software; you can redistribute it and/or
10  * modify it under the terms of the GNU Lesser General Public
11  * License as published by the Free Software Foundation; either
12  * version 2.1 of the License, or (at your option) any later version.
13  *
14  * FFmpeg is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
17  * Lesser General Public License for more details.
18  *
19  * You should have received a copy of the GNU Lesser General Public
20  * License along with FFmpeg; if not, write to the Free Software
21  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
22  *
23  * yuva, gray, 4:4:4, 4:1:1, 4:1:0 and >8 bit per sample support sponsored by NOA
24  */
25
26 /**
27  * @file
28  * huffyuv encoder
29  */
30
31 #include "avcodec.h"
32 #include "huffyuv.h"
33 #include "huffman.h"
34 #include "huffyuvencdsp.h"
35 #include "internal.h"
36 #include "put_bits.h"
37 #include "libavutil/opt.h"
38 #include "libavutil/pixdesc.h"
39
40 static inline void diff_bytes(HYuvContext *s, uint8_t *dst,
41                               const uint8_t *src0, const uint8_t *src1, int w)
42 {
43     if (s->bps <= 8) {
44         s->hencdsp.diff_bytes(dst, src0, src1, w);
45     } else {
46         s->llviddsp.diff_int16((uint16_t *)dst, (const uint16_t *)src0, (const uint16_t *)src1, s->n - 1, w);
47     }
48 }
49
50 static inline int sub_left_prediction(HYuvContext *s, uint8_t *dst,
51                                       const uint8_t *src, int w, int left)
52 {
53     int i;
54     if (s->bps <= 8) {
55         if (w < 32) {
56             for (i = 0; i < w; i++) {
57                 const int temp = src[i];
58                 dst[i] = temp - left;
59                 left   = temp;
60             }
61             return left;
62         } else {
63             for (i = 0; i < 16; i++) {
64                 const int temp = src[i];
65                 dst[i] = temp - left;
66                 left   = temp;
67             }
68             s->hencdsp.diff_bytes(dst + 16, src + 16, src + 15, w - 16);
69             return src[w-1];
70         }
71     } else {
72         const uint16_t *src16 = (const uint16_t *)src;
73         uint16_t       *dst16 = (      uint16_t *)dst;
74         if (w < 32) {
75             for (i = 0; i < w; i++) {
76                 const int temp = src16[i];
77                 dst16[i] = temp - left;
78                 left   = temp;
79             }
80             return left;
81         } else {
82             for (i = 0; i < 16; i++) {
83                 const int temp = src16[i];
84                 dst16[i] = temp - left;
85                 left   = temp;
86             }
87             s->llviddsp.diff_int16(dst16 + 16, src16 + 16, src16 + 15, s->n - 1, w - 16);
88             return src16[w-1];
89         }
90     }
91 }
92
93 static inline void sub_left_prediction_bgr32(HYuvContext *s, uint8_t *dst,
94                                              const uint8_t *src, int w,
95                                              int *red, int *green, int *blue,
96                                              int *alpha)
97 {
98     int i;
99     int r, g, b, a;
100     r = *red;
101     g = *green;
102     b = *blue;
103     a = *alpha;
104
105     for (i = 0; i < FFMIN(w, 4); i++) {
106         const int rt = src[i * 4 + R];
107         const int gt = src[i * 4 + G];
108         const int bt = src[i * 4 + B];
109         const int at = src[i * 4 + A];
110         dst[i * 4 + R] = rt - r;
111         dst[i * 4 + G] = gt - g;
112         dst[i * 4 + B] = bt - b;
113         dst[i * 4 + A] = at - a;
114         r = rt;
115         g = gt;
116         b = bt;
117         a = at;
118     }
119
120     s->hencdsp.diff_bytes(dst + 16, src + 16, src + 12, w * 4 - 16);
121
122     *red   = src[(w - 1) * 4 + R];
123     *green = src[(w - 1) * 4 + G];
124     *blue  = src[(w - 1) * 4 + B];
125     *alpha = src[(w - 1) * 4 + A];
126 }
127
128 static inline void sub_left_prediction_rgb24(HYuvContext *s, uint8_t *dst,
129                                              uint8_t *src, int w,
130                                              int *red, int *green, int *blue)
131 {
132     int i;
133     int r, g, b;
134     r = *red;
135     g = *green;
136     b = *blue;
137     for (i = 0; i < FFMIN(w, 16); i++) {
138         const int rt = src[i * 3 + 0];
139         const int gt = src[i * 3 + 1];
140         const int bt = src[i * 3 + 2];
141         dst[i * 3 + 0] = rt - r;
142         dst[i * 3 + 1] = gt - g;
143         dst[i * 3 + 2] = bt - b;
144         r = rt;
145         g = gt;
146         b = bt;
147     }
148
149     s->hencdsp.diff_bytes(dst + 48, src + 48, src + 48 - 3, w * 3 - 48);
150
151     *red   = src[(w - 1) * 3 + 0];
152     *green = src[(w - 1) * 3 + 1];
153     *blue  = src[(w - 1) * 3 + 2];
154 }
155
156 static void sub_median_prediction(HYuvContext *s, uint8_t *dst, const uint8_t *src1, const uint8_t *src2, int w, int *left, int *left_top)
157 {
158     if (s->bps <= 8) {
159         s->hencdsp.sub_hfyu_median_pred(dst, src1, src2, w , left, left_top);
160     } else {
161         s->llviddsp.sub_hfyu_median_pred_int16((uint16_t *)dst, (const uint16_t *)src1, (const uint16_t *)src2, s->n - 1, w , left, left_top);
162     }
163 }
164
165 static int store_table(HYuvContext *s, const uint8_t *len, uint8_t *buf)
166 {
167     int i;
168     int index = 0;
169     int n = s->vlc_n;
170
171     for (i = 0; i < n;) {
172         int val = len[i];
173         int repeat = 0;
174
175         for (; i < n && len[i] == val && repeat < 255; i++)
176             repeat++;
177
178         av_assert0(val < 32 && val >0 && repeat < 256 && repeat>0);
179         if (repeat > 7) {
180             buf[index++] = val;
181             buf[index++] = repeat;
182         } else {
183             buf[index++] = val | (repeat << 5);
184         }
185     }
186
187     return index;
188 }
189
190 static int store_huffman_tables(HYuvContext *s, uint8_t *buf)
191 {
192     int i, ret;
193     int size = 0;
194     int count = 3;
195
196     if (s->version > 2)
197         count = 1 + s->alpha + 2*s->chroma;
198
199     for (i = 0; i < count; i++) {
200         if ((ret = ff_huff_gen_len_table(s->len[i], s->stats[i], s->vlc_n, 0)) < 0)
201             return ret;
202
203         if (ff_huffyuv_generate_bits_table(s->bits[i], s->len[i], s->vlc_n) < 0) {
204             return -1;
205         }
206
207         size += store_table(s, s->len[i], buf + size);
208     }
209     return size;
210 }
211
212 static av_cold int encode_init(AVCodecContext *avctx)
213 {
214     HYuvContext *s = avctx->priv_data;
215     int i, j;
216     int ret;
217     const AVPixFmtDescriptor *desc = av_pix_fmt_desc_get(avctx->pix_fmt);
218
219     ff_huffyuv_common_init(avctx);
220     ff_huffyuvencdsp_init(&s->hencdsp);
221
222     avctx->extradata = av_mallocz(3*MAX_N + 4);
223     if (s->flags&AV_CODEC_FLAG_PASS1) {
224 #define STATS_OUT_SIZE 21*MAX_N*3 + 4
225         avctx->stats_out = av_mallocz(STATS_OUT_SIZE); // 21*256*3(%llu ) + 3(\n) + 1(0) = 16132
226         if (!avctx->stats_out)
227             return AVERROR(ENOMEM);
228     }
229     s->version = 2;
230
231     if (!avctx->extradata)
232         return AVERROR(ENOMEM);
233
234 #if FF_API_CODED_FRAME
235 FF_DISABLE_DEPRECATION_WARNINGS
236     avctx->coded_frame->pict_type = AV_PICTURE_TYPE_I;
237     avctx->coded_frame->key_frame = 1;
238 FF_ENABLE_DEPRECATION_WARNINGS
239 #endif
240
241     s->bps = desc->comp[0].depth;
242     s->yuv = !(desc->flags & AV_PIX_FMT_FLAG_RGB) && desc->nb_components >= 2;
243     s->chroma = desc->nb_components > 2;
244     s->alpha = !!(desc->flags & AV_PIX_FMT_FLAG_ALPHA);
245     av_pix_fmt_get_chroma_sub_sample(avctx->pix_fmt,
246                                      &s->chroma_h_shift,
247                                      &s->chroma_v_shift);
248
249     switch (avctx->pix_fmt) {
250     case AV_PIX_FMT_YUV420P:
251     case AV_PIX_FMT_YUV422P:
252         if (s->width & 1) {
253             av_log(avctx, AV_LOG_ERROR, "Width must be even for this colorspace.\n");
254             return AVERROR(EINVAL);
255         }
256         s->bitstream_bpp = avctx->pix_fmt == AV_PIX_FMT_YUV420P ? 12 : 16;
257         break;
258     case AV_PIX_FMT_YUV444P:
259     case AV_PIX_FMT_YUV410P:
260     case AV_PIX_FMT_YUV411P:
261     case AV_PIX_FMT_YUV440P:
262     case AV_PIX_FMT_GBRP:
263     case AV_PIX_FMT_GBRP9:
264     case AV_PIX_FMT_GBRP10:
265     case AV_PIX_FMT_GBRP12:
266     case AV_PIX_FMT_GBRP14:
267     case AV_PIX_FMT_GBRP16:
268     case AV_PIX_FMT_GRAY8:
269     case AV_PIX_FMT_GRAY16:
270     case AV_PIX_FMT_YUVA444P:
271     case AV_PIX_FMT_YUVA420P:
272     case AV_PIX_FMT_YUVA422P:
273     case AV_PIX_FMT_GBRAP:
274     case AV_PIX_FMT_GRAY8A:
275     case AV_PIX_FMT_YUV420P9:
276     case AV_PIX_FMT_YUV420P10:
277     case AV_PIX_FMT_YUV420P12:
278     case AV_PIX_FMT_YUV420P14:
279     case AV_PIX_FMT_YUV420P16:
280     case AV_PIX_FMT_YUV422P9:
281     case AV_PIX_FMT_YUV422P10:
282     case AV_PIX_FMT_YUV422P12:
283     case AV_PIX_FMT_YUV422P14:
284     case AV_PIX_FMT_YUV422P16:
285     case AV_PIX_FMT_YUV444P9:
286     case AV_PIX_FMT_YUV444P10:
287     case AV_PIX_FMT_YUV444P12:
288     case AV_PIX_FMT_YUV444P14:
289     case AV_PIX_FMT_YUV444P16:
290     case AV_PIX_FMT_YUVA420P9:
291     case AV_PIX_FMT_YUVA420P10:
292     case AV_PIX_FMT_YUVA420P16:
293     case AV_PIX_FMT_YUVA422P9:
294     case AV_PIX_FMT_YUVA422P10:
295     case AV_PIX_FMT_YUVA422P16:
296     case AV_PIX_FMT_YUVA444P9:
297     case AV_PIX_FMT_YUVA444P10:
298     case AV_PIX_FMT_YUVA444P16:
299         s->version = 3;
300         break;
301     case AV_PIX_FMT_RGB32:
302         s->bitstream_bpp = 32;
303         break;
304     case AV_PIX_FMT_RGB24:
305         s->bitstream_bpp = 24;
306         break;
307     default:
308         av_log(avctx, AV_LOG_ERROR, "format not supported\n");
309         return AVERROR(EINVAL);
310     }
311     s->n = 1<<s->bps;
312     s->vlc_n = FFMIN(s->n, MAX_VLC_N);
313
314     avctx->bits_per_coded_sample = s->bitstream_bpp;
315     s->decorrelate = s->bitstream_bpp >= 24 && !s->yuv && !(desc->flags & AV_PIX_FMT_FLAG_PLANAR);
316     s->predictor = avctx->prediction_method;
317     s->interlaced = avctx->flags & AV_CODEC_FLAG_INTERLACED_ME ? 1 : 0;
318     if (avctx->context_model == 1) {
319         s->context = avctx->context_model;
320         if (s->flags & (AV_CODEC_FLAG_PASS1 | AV_CODEC_FLAG_PASS2)) {
321             av_log(avctx, AV_LOG_ERROR,
322                    "context=1 is not compatible with "
323                    "2 pass huffyuv encoding\n");
324             return AVERROR(EINVAL);
325         }
326     }else s->context= 0;
327
328     if (avctx->codec->id == AV_CODEC_ID_HUFFYUV) {
329         if (avctx->pix_fmt == AV_PIX_FMT_YUV420P) {
330             av_log(avctx, AV_LOG_ERROR,
331                    "Error: YV12 is not supported by huffyuv; use "
332                    "vcodec=ffvhuff or format=422p\n");
333             return AVERROR(EINVAL);
334         }
335         if (avctx->context_model) {
336             av_log(avctx, AV_LOG_ERROR,
337                    "Error: per-frame huffman tables are not supported "
338                    "by huffyuv; use vcodec=ffvhuff\n");
339             return AVERROR(EINVAL);
340         }
341         if (s->version > 2) {
342             av_log(avctx, AV_LOG_ERROR,
343                    "Error: ver>2 is not supported "
344                    "by huffyuv; use vcodec=ffvhuff\n");
345             return AVERROR(EINVAL);
346         }
347         if (s->interlaced != ( s->height > 288 ))
348             av_log(avctx, AV_LOG_INFO,
349                    "using huffyuv 2.2.0 or newer interlacing flag\n");
350     }
351
352     if (s->version > 3 && avctx->strict_std_compliance > FF_COMPLIANCE_EXPERIMENTAL) {
353         av_log(avctx, AV_LOG_ERROR, "Ver > 3 is under development, files encoded with it may not be decodable with future versions!!!\n"
354                "Use vstrict=-2 / -strict -2 to use it anyway.\n");
355         return AVERROR(EINVAL);
356     }
357
358     if (s->bitstream_bpp >= 24 && s->predictor == MEDIAN && s->version <= 2) {
359         av_log(avctx, AV_LOG_ERROR,
360                "Error: RGB is incompatible with median predictor\n");
361         return AVERROR(EINVAL);
362     }
363
364     ((uint8_t*)avctx->extradata)[0] = s->predictor | (s->decorrelate << 6);
365     ((uint8_t*)avctx->extradata)[2] = s->interlaced ? 0x10 : 0x20;
366     if (s->context)
367         ((uint8_t*)avctx->extradata)[2] |= 0x40;
368     if (s->version < 3) {
369         ((uint8_t*)avctx->extradata)[1] = s->bitstream_bpp;
370         ((uint8_t*)avctx->extradata)[3] = 0;
371     } else {
372         ((uint8_t*)avctx->extradata)[1] = ((s->bps-1)<<4) | s->chroma_h_shift | (s->chroma_v_shift<<2);
373         if (s->chroma)
374             ((uint8_t*)avctx->extradata)[2] |= s->yuv ? 1 : 2;
375         if (s->alpha)
376             ((uint8_t*)avctx->extradata)[2] |= 4;
377         ((uint8_t*)avctx->extradata)[3] = 1;
378     }
379     s->avctx->extradata_size = 4;
380
381     if (avctx->stats_in) {
382         char *p = avctx->stats_in;
383
384         for (i = 0; i < 4; i++)
385             for (j = 0; j < s->vlc_n; j++)
386                 s->stats[i][j] = 1;
387
388         for (;;) {
389             for (i = 0; i < 4; i++) {
390                 char *next;
391
392                 for (j = 0; j < s->vlc_n; j++) {
393                     s->stats[i][j] += strtol(p, &next, 0);
394                     if (next == p) return -1;
395                     p = next;
396                 }
397             }
398             if (p[0] == 0 || p[1] == 0 || p[2] == 0) break;
399         }
400     } else {
401         for (i = 0; i < 4; i++)
402             for (j = 0; j < s->vlc_n; j++) {
403                 int d = FFMIN(j, s->vlc_n - j);
404
405                 s->stats[i][j] = 100000000 / (d*d + 1);
406             }
407     }
408
409     ret = store_huffman_tables(s, s->avctx->extradata + s->avctx->extradata_size);
410     if (ret < 0)
411         return ret;
412     s->avctx->extradata_size += ret;
413
414     if (s->context) {
415         for (i = 0; i < 4; i++) {
416             int pels = s->width * s->height / (i ? 40 : 10);
417             for (j = 0; j < s->vlc_n; j++) {
418                 int d = FFMIN(j, s->vlc_n - j);
419                 s->stats[i][j] = pels/(d*d + 1);
420             }
421         }
422     } else {
423         for (i = 0; i < 4; i++)
424             for (j = 0; j < s->vlc_n; j++)
425                 s->stats[i][j]= 0;
426     }
427
428     if (ff_huffyuv_alloc_temp(s)) {
429         ff_huffyuv_common_end(s);
430         return AVERROR(ENOMEM);
431     }
432
433     s->picture_number=0;
434
435     return 0;
436 }
437 static int encode_422_bitstream(HYuvContext *s, int offset, int count)
438 {
439     int i;
440     const uint8_t *y = s->temp[0] + offset;
441     const uint8_t *u = s->temp[1] + offset / 2;
442     const uint8_t *v = s->temp[2] + offset / 2;
443
444     if (s->pb.buf_end - s->pb.buf - (put_bits_count(&s->pb) >> 3) < 2 * 4 * count) {
445         av_log(s->avctx, AV_LOG_ERROR, "encoded frame too large\n");
446         return -1;
447     }
448
449 #define LOAD4\
450             int y0 = y[2 * i];\
451             int y1 = y[2 * i + 1];\
452             int u0 = u[i];\
453             int v0 = v[i];
454
455     count /= 2;
456
457     if (s->flags & AV_CODEC_FLAG_PASS1) {
458         for(i = 0; i < count; i++) {
459             LOAD4;
460             s->stats[0][y0]++;
461             s->stats[1][u0]++;
462             s->stats[0][y1]++;
463             s->stats[2][v0]++;
464         }
465     }
466     if (s->avctx->flags2 & AV_CODEC_FLAG2_NO_OUTPUT)
467         return 0;
468     if (s->context) {
469         for (i = 0; i < count; i++) {
470             LOAD4;
471             s->stats[0][y0]++;
472             put_bits(&s->pb, s->len[0][y0], s->bits[0][y0]);
473             s->stats[1][u0]++;
474             put_bits(&s->pb, s->len[1][u0], s->bits[1][u0]);
475             s->stats[0][y1]++;
476             put_bits(&s->pb, s->len[0][y1], s->bits[0][y1]);
477             s->stats[2][v0]++;
478             put_bits(&s->pb, s->len[2][v0], s->bits[2][v0]);
479         }
480     } else {
481         for(i = 0; i < count; i++) {
482             LOAD4;
483             put_bits(&s->pb, s->len[0][y0], s->bits[0][y0]);
484             put_bits(&s->pb, s->len[1][u0], s->bits[1][u0]);
485             put_bits(&s->pb, s->len[0][y1], s->bits[0][y1]);
486             put_bits(&s->pb, s->len[2][v0], s->bits[2][v0]);
487         }
488     }
489     return 0;
490 }
491
492 static int encode_plane_bitstream(HYuvContext *s, int width, int plane)
493 {
494     int i, count = width/2;
495
496     if (s->pb.buf_end - s->pb.buf - (put_bits_count(&s->pb) >> 3) < count * s->bps / 2) {
497         av_log(s->avctx, AV_LOG_ERROR, "encoded frame too large\n");
498         return -1;
499     }
500
501 #define LOADEND\
502             int y0 = s->temp[0][width-1];
503 #define LOADEND_14\
504             int y0 = s->temp16[0][width-1] & mask;
505 #define LOADEND_16\
506             int y0 = s->temp16[0][width-1];
507 #define STATEND\
508             s->stats[plane][y0]++;
509 #define STATEND_16\
510             s->stats[plane][y0>>2]++;
511 #define WRITEEND\
512             put_bits(&s->pb, s->len[plane][y0], s->bits[plane][y0]);
513 #define WRITEEND_16\
514             put_bits(&s->pb, s->len[plane][y0>>2], s->bits[plane][y0>>2]);\
515             put_bits(&s->pb, 2, y0&3);
516
517 #define LOAD2\
518             int y0 = s->temp[0][2 * i];\
519             int y1 = s->temp[0][2 * i + 1];
520 #define LOAD2_14\
521             int y0 = s->temp16[0][2 * i] & mask;\
522             int y1 = s->temp16[0][2 * i + 1] & mask;
523 #define LOAD2_16\
524             int y0 = s->temp16[0][2 * i];\
525             int y1 = s->temp16[0][2 * i + 1];
526 #define STAT2\
527             s->stats[plane][y0]++;\
528             s->stats[plane][y1]++;
529 #define STAT2_16\
530             s->stats[plane][y0>>2]++;\
531             s->stats[plane][y1>>2]++;
532 #define WRITE2\
533             put_bits(&s->pb, s->len[plane][y0], s->bits[plane][y0]);\
534             put_bits(&s->pb, s->len[plane][y1], s->bits[plane][y1]);
535 #define WRITE2_16\
536             put_bits(&s->pb, s->len[plane][y0>>2], s->bits[plane][y0>>2]);\
537             put_bits(&s->pb, 2, y0&3);\
538             put_bits(&s->pb, s->len[plane][y1>>2], s->bits[plane][y1>>2]);\
539             put_bits(&s->pb, 2, y1&3);
540
541     if (s->bps <= 8) {
542     if (s->flags & AV_CODEC_FLAG_PASS1) {
543         for (i = 0; i < count; i++) {
544             LOAD2;
545             STAT2;
546         }
547         if (width&1) {
548             LOADEND;
549             STATEND;
550         }
551     }
552     if (s->avctx->flags2 & AV_CODEC_FLAG2_NO_OUTPUT)
553         return 0;
554
555     if (s->context) {
556         for (i = 0; i < count; i++) {
557             LOAD2;
558             STAT2;
559             WRITE2;
560         }
561         if (width&1) {
562             LOADEND;
563             STATEND;
564             WRITEEND;
565         }
566     } else {
567         for (i = 0; i < count; i++) {
568             LOAD2;
569             WRITE2;
570         }
571         if (width&1) {
572             LOADEND;
573             WRITEEND;
574         }
575     }
576     } else if (s->bps <= 14) {
577         int mask = s->n - 1;
578         if (s->flags & AV_CODEC_FLAG_PASS1) {
579             for (i = 0; i < count; i++) {
580                 LOAD2_14;
581                 STAT2;
582             }
583             if (width&1) {
584                 LOADEND_14;
585                 STATEND;
586             }
587         }
588         if (s->avctx->flags2 & AV_CODEC_FLAG2_NO_OUTPUT)
589             return 0;
590
591         if (s->context) {
592             for (i = 0; i < count; i++) {
593                 LOAD2_14;
594                 STAT2;
595                 WRITE2;
596             }
597             if (width&1) {
598                 LOADEND_14;
599                 STATEND;
600                 WRITEEND;
601             }
602         } else {
603             for (i = 0; i < count; i++) {
604                 LOAD2_14;
605                 WRITE2;
606             }
607             if (width&1) {
608                 LOADEND_14;
609                 WRITEEND;
610             }
611         }
612     } else {
613         if (s->flags & AV_CODEC_FLAG_PASS1) {
614             for (i = 0; i < count; i++) {
615                 LOAD2_16;
616                 STAT2_16;
617             }
618             if (width&1) {
619                 LOADEND_16;
620                 STATEND_16;
621             }
622         }
623         if (s->avctx->flags2 & AV_CODEC_FLAG2_NO_OUTPUT)
624             return 0;
625
626         if (s->context) {
627             for (i = 0; i < count; i++) {
628                 LOAD2_16;
629                 STAT2_16;
630                 WRITE2_16;
631             }
632             if (width&1) {
633                 LOADEND_16;
634                 STATEND_16;
635                 WRITEEND_16;
636             }
637         } else {
638             for (i = 0; i < count; i++) {
639                 LOAD2_16;
640                 WRITE2_16;
641             }
642             if (width&1) {
643                 LOADEND_16;
644                 WRITEEND_16;
645             }
646         }
647     }
648 #undef LOAD2
649 #undef STAT2
650 #undef WRITE2
651     return 0;
652 }
653
654 static int encode_gray_bitstream(HYuvContext *s, int count)
655 {
656     int i;
657
658     if (s->pb.buf_end - s->pb.buf - (put_bits_count(&s->pb) >> 3) < 4 * count) {
659         av_log(s->avctx, AV_LOG_ERROR, "encoded frame too large\n");
660         return -1;
661     }
662
663 #define LOAD2\
664             int y0 = s->temp[0][2 * i];\
665             int y1 = s->temp[0][2 * i + 1];
666 #define STAT2\
667             s->stats[0][y0]++;\
668             s->stats[0][y1]++;
669 #define WRITE2\
670             put_bits(&s->pb, s->len[0][y0], s->bits[0][y0]);\
671             put_bits(&s->pb, s->len[0][y1], s->bits[0][y1]);
672
673     count /= 2;
674
675     if (s->flags & AV_CODEC_FLAG_PASS1) {
676         for (i = 0; i < count; i++) {
677             LOAD2;
678             STAT2;
679         }
680     }
681     if (s->avctx->flags2 & AV_CODEC_FLAG2_NO_OUTPUT)
682         return 0;
683
684     if (s->context) {
685         for (i = 0; i < count; i++) {
686             LOAD2;
687             STAT2;
688             WRITE2;
689         }
690     } else {
691         for (i = 0; i < count; i++) {
692             LOAD2;
693             WRITE2;
694         }
695     }
696     return 0;
697 }
698
699 static inline int encode_bgra_bitstream(HYuvContext *s, int count, int planes)
700 {
701     int i;
702
703     if (s->pb.buf_end - s->pb.buf - (put_bits_count(&s->pb) >> 3) <
704         4 * planes * count) {
705         av_log(s->avctx, AV_LOG_ERROR, "encoded frame too large\n");
706         return -1;
707     }
708
709 #define LOAD_GBRA                                                       \
710     int g = s->temp[0][planes == 3 ? 3 * i + 1 : 4 * i + G];            \
711     int b =(s->temp[0][planes == 3 ? 3 * i + 2 : 4 * i + B] - g) & 0xFF;\
712     int r =(s->temp[0][planes == 3 ? 3 * i + 0 : 4 * i + R] - g) & 0xFF;\
713     int a = s->temp[0][planes * i + A];
714
715 #define STAT_BGRA                                                       \
716     s->stats[0][b]++;                                                   \
717     s->stats[1][g]++;                                                   \
718     s->stats[2][r]++;                                                   \
719     if (planes == 4)                                                    \
720         s->stats[2][a]++;
721
722 #define WRITE_GBRA                                                      \
723     put_bits(&s->pb, s->len[1][g], s->bits[1][g]);                      \
724     put_bits(&s->pb, s->len[0][b], s->bits[0][b]);                      \
725     put_bits(&s->pb, s->len[2][r], s->bits[2][r]);                      \
726     if (planes == 4)                                                    \
727         put_bits(&s->pb, s->len[2][a], s->bits[2][a]);
728
729     if ((s->flags & AV_CODEC_FLAG_PASS1) &&
730         (s->avctx->flags2 & AV_CODEC_FLAG2_NO_OUTPUT)) {
731         for (i = 0; i < count; i++) {
732             LOAD_GBRA;
733             STAT_BGRA;
734         }
735     } else if (s->context || (s->flags & AV_CODEC_FLAG_PASS1)) {
736         for (i = 0; i < count; i++) {
737             LOAD_GBRA;
738             STAT_BGRA;
739             WRITE_GBRA;
740         }
741     } else {
742         for (i = 0; i < count; i++) {
743             LOAD_GBRA;
744             WRITE_GBRA;
745         }
746     }
747     return 0;
748 }
749
750 static int encode_frame(AVCodecContext *avctx, AVPacket *pkt,
751                         const AVFrame *pict, int *got_packet)
752 {
753     HYuvContext *s = avctx->priv_data;
754     const int width = s->width;
755     const int width2 = s->width>>1;
756     const int height = s->height;
757     const int fake_ystride = s->interlaced ? pict->linesize[0]*2  : pict->linesize[0];
758     const int fake_ustride = s->interlaced ? pict->linesize[1]*2  : pict->linesize[1];
759     const int fake_vstride = s->interlaced ? pict->linesize[2]*2  : pict->linesize[2];
760     const AVFrame * const p = pict;
761     int i, j, size = 0, ret;
762
763     if ((ret = ff_alloc_packet2(avctx, pkt, width * height * 3 * 4 + AV_INPUT_BUFFER_MIN_SIZE, 0)) < 0)
764         return ret;
765
766     if (s->context) {
767         size = store_huffman_tables(s, pkt->data);
768         if (size < 0)
769             return size;
770
771         for (i = 0; i < 4; i++)
772             for (j = 0; j < s->vlc_n; j++)
773                 s->stats[i][j] >>= 1;
774     }
775
776     init_put_bits(&s->pb, pkt->data + size, pkt->size - size);
777
778     if (avctx->pix_fmt == AV_PIX_FMT_YUV422P ||
779         avctx->pix_fmt == AV_PIX_FMT_YUV420P) {
780         int lefty, leftu, leftv, y, cy;
781
782         put_bits(&s->pb, 8, leftv = p->data[2][0]);
783         put_bits(&s->pb, 8, lefty = p->data[0][1]);
784         put_bits(&s->pb, 8, leftu = p->data[1][0]);
785         put_bits(&s->pb, 8,         p->data[0][0]);
786
787         lefty = sub_left_prediction(s, s->temp[0], p->data[0], width , 0);
788         leftu = sub_left_prediction(s, s->temp[1], p->data[1], width2, 0);
789         leftv = sub_left_prediction(s, s->temp[2], p->data[2], width2, 0);
790
791         encode_422_bitstream(s, 2, width-2);
792
793         if (s->predictor==MEDIAN) {
794             int lefttopy, lefttopu, lefttopv;
795             cy = y = 1;
796             if (s->interlaced) {
797                 lefty = sub_left_prediction(s, s->temp[0], p->data[0] + p->linesize[0], width , lefty);
798                 leftu = sub_left_prediction(s, s->temp[1], p->data[1] + p->linesize[1], width2, leftu);
799                 leftv = sub_left_prediction(s, s->temp[2], p->data[2] + p->linesize[2], width2, leftv);
800
801                 encode_422_bitstream(s, 0, width);
802                 y++; cy++;
803             }
804
805             lefty = sub_left_prediction(s, s->temp[0], p->data[0] + fake_ystride, 4, lefty);
806             leftu = sub_left_prediction(s, s->temp[1], p->data[1] + fake_ustride, 2, leftu);
807             leftv = sub_left_prediction(s, s->temp[2], p->data[2] + fake_vstride, 2, leftv);
808
809             encode_422_bitstream(s, 0, 4);
810
811             lefttopy = p->data[0][3];
812             lefttopu = p->data[1][1];
813             lefttopv = p->data[2][1];
814             s->hencdsp.sub_hfyu_median_pred(s->temp[0], p->data[0] + 4, p->data[0] + fake_ystride + 4, width  - 4, &lefty, &lefttopy);
815             s->hencdsp.sub_hfyu_median_pred(s->temp[1], p->data[1] + 2, p->data[1] + fake_ustride + 2, width2 - 2, &leftu, &lefttopu);
816             s->hencdsp.sub_hfyu_median_pred(s->temp[2], p->data[2] + 2, p->data[2] + fake_vstride + 2, width2 - 2, &leftv, &lefttopv);
817             encode_422_bitstream(s, 0, width - 4);
818             y++; cy++;
819
820             for (; y < height; y++,cy++) {
821                 uint8_t *ydst, *udst, *vdst;
822
823                 if (s->bitstream_bpp == 12) {
824                     while (2 * cy > y) {
825                         ydst = p->data[0] + p->linesize[0] * y;
826                         s->hencdsp.sub_hfyu_median_pred(s->temp[0], ydst - fake_ystride, ydst, width, &lefty, &lefttopy);
827                         encode_gray_bitstream(s, width);
828                         y++;
829                     }
830                     if (y >= height) break;
831                 }
832                 ydst = p->data[0] + p->linesize[0] * y;
833                 udst = p->data[1] + p->linesize[1] * cy;
834                 vdst = p->data[2] + p->linesize[2] * cy;
835
836                 s->hencdsp.sub_hfyu_median_pred(s->temp[0], ydst - fake_ystride, ydst, width,  &lefty, &lefttopy);
837                 s->hencdsp.sub_hfyu_median_pred(s->temp[1], udst - fake_ustride, udst, width2, &leftu, &lefttopu);
838                 s->hencdsp.sub_hfyu_median_pred(s->temp[2], vdst - fake_vstride, vdst, width2, &leftv, &lefttopv);
839
840                 encode_422_bitstream(s, 0, width);
841             }
842         } else {
843             for (cy = y = 1; y < height; y++, cy++) {
844                 uint8_t *ydst, *udst, *vdst;
845
846                 /* encode a luma only line & y++ */
847                 if (s->bitstream_bpp == 12) {
848                     ydst = p->data[0] + p->linesize[0] * y;
849
850                     if (s->predictor == PLANE && s->interlaced < y) {
851                         s->hencdsp.diff_bytes(s->temp[1], ydst, ydst - fake_ystride, width);
852
853                         lefty = sub_left_prediction(s, s->temp[0], s->temp[1], width , lefty);
854                     } else {
855                         lefty = sub_left_prediction(s, s->temp[0], ydst, width , lefty);
856                     }
857                     encode_gray_bitstream(s, width);
858                     y++;
859                     if (y >= height) break;
860                 }
861
862                 ydst = p->data[0] + p->linesize[0] * y;
863                 udst = p->data[1] + p->linesize[1] * cy;
864                 vdst = p->data[2] + p->linesize[2] * cy;
865
866                 if (s->predictor == PLANE && s->interlaced < cy) {
867                     s->hencdsp.diff_bytes(s->temp[1],          ydst, ydst - fake_ystride, width);
868                     s->hencdsp.diff_bytes(s->temp[2],          udst, udst - fake_ustride, width2);
869                     s->hencdsp.diff_bytes(s->temp[2] + width2, vdst, vdst - fake_vstride, width2);
870
871                     lefty = sub_left_prediction(s, s->temp[0], s->temp[1], width , lefty);
872                     leftu = sub_left_prediction(s, s->temp[1], s->temp[2], width2, leftu);
873                     leftv = sub_left_prediction(s, s->temp[2], s->temp[2] + width2, width2, leftv);
874                 } else {
875                     lefty = sub_left_prediction(s, s->temp[0], ydst, width , lefty);
876                     leftu = sub_left_prediction(s, s->temp[1], udst, width2, leftu);
877                     leftv = sub_left_prediction(s, s->temp[2], vdst, width2, leftv);
878                 }
879
880                 encode_422_bitstream(s, 0, width);
881             }
882         }
883     } else if(avctx->pix_fmt == AV_PIX_FMT_RGB32) {
884         uint8_t *data = p->data[0] + (height - 1) * p->linesize[0];
885         const int stride = -p->linesize[0];
886         const int fake_stride = -fake_ystride;
887         int y;
888         int leftr, leftg, leftb, lefta;
889
890         put_bits(&s->pb, 8, lefta = data[A]);
891         put_bits(&s->pb, 8, leftr = data[R]);
892         put_bits(&s->pb, 8, leftg = data[G]);
893         put_bits(&s->pb, 8, leftb = data[B]);
894
895         sub_left_prediction_bgr32(s, s->temp[0], data + 4, width - 1,
896                                   &leftr, &leftg, &leftb, &lefta);
897         encode_bgra_bitstream(s, width - 1, 4);
898
899         for (y = 1; y < s->height; y++) {
900             uint8_t *dst = data + y*stride;
901             if (s->predictor == PLANE && s->interlaced < y) {
902                 s->hencdsp.diff_bytes(s->temp[1], dst, dst - fake_stride, width * 4);
903                 sub_left_prediction_bgr32(s, s->temp[0], s->temp[1], width,
904                                           &leftr, &leftg, &leftb, &lefta);
905             } else {
906                 sub_left_prediction_bgr32(s, s->temp[0], dst, width,
907                                           &leftr, &leftg, &leftb, &lefta);
908             }
909             encode_bgra_bitstream(s, width, 4);
910         }
911     } else if (avctx->pix_fmt == AV_PIX_FMT_RGB24) {
912         uint8_t *data = p->data[0] + (height - 1) * p->linesize[0];
913         const int stride = -p->linesize[0];
914         const int fake_stride = -fake_ystride;
915         int y;
916         int leftr, leftg, leftb;
917
918         put_bits(&s->pb, 8, leftr = data[0]);
919         put_bits(&s->pb, 8, leftg = data[1]);
920         put_bits(&s->pb, 8, leftb = data[2]);
921         put_bits(&s->pb, 8, 0);
922
923         sub_left_prediction_rgb24(s, s->temp[0], data + 3, width - 1,
924                                   &leftr, &leftg, &leftb);
925         encode_bgra_bitstream(s, width-1, 3);
926
927         for (y = 1; y < s->height; y++) {
928             uint8_t *dst = data + y * stride;
929             if (s->predictor == PLANE && s->interlaced < y) {
930                 s->hencdsp.diff_bytes(s->temp[1], dst, dst - fake_stride,
931                                       width * 3);
932                 sub_left_prediction_rgb24(s, s->temp[0], s->temp[1], width,
933                                           &leftr, &leftg, &leftb);
934             } else {
935                 sub_left_prediction_rgb24(s, s->temp[0], dst, width,
936                                           &leftr, &leftg, &leftb);
937             }
938             encode_bgra_bitstream(s, width, 3);
939         }
940     } else if (s->version > 2) {
941         int plane;
942         for (plane = 0; plane < 1 + 2*s->chroma + s->alpha; plane++) {
943             int left, y;
944             int w = width;
945             int h = height;
946             int fake_stride = fake_ystride;
947
948             if (s->chroma && (plane == 1 || plane == 2)) {
949                 w >>= s->chroma_h_shift;
950                 h >>= s->chroma_v_shift;
951                 fake_stride = plane == 1 ? fake_ustride : fake_vstride;
952             }
953
954             left = sub_left_prediction(s, s->temp[0], p->data[plane], w , 0);
955
956             encode_plane_bitstream(s, w, plane);
957
958             if (s->predictor==MEDIAN) {
959                 int lefttop;
960                 y = 1;
961                 if (s->interlaced) {
962                     left = sub_left_prediction(s, s->temp[0], p->data[plane] + p->linesize[plane], w , left);
963
964                     encode_plane_bitstream(s, w, plane);
965                     y++;
966                 }
967
968                 lefttop = p->data[plane][0];
969
970                 for (; y < h; y++) {
971                     uint8_t *dst = p->data[plane] + p->linesize[plane] * y;
972
973                     sub_median_prediction(s, s->temp[0], dst - fake_stride, dst, w , &left, &lefttop);
974
975                     encode_plane_bitstream(s, w, plane);
976                 }
977             } else {
978                 for (y = 1; y < h; y++) {
979                     uint8_t *dst = p->data[plane] + p->linesize[plane] * y;
980
981                     if (s->predictor == PLANE && s->interlaced < y) {
982                         diff_bytes(s, s->temp[1], dst, dst - fake_stride, w);
983
984                         left = sub_left_prediction(s, s->temp[0], s->temp[1], w , left);
985                     } else {
986                         left = sub_left_prediction(s, s->temp[0], dst, w , left);
987                     }
988
989                     encode_plane_bitstream(s, w, plane);
990                 }
991             }
992         }
993     } else {
994         av_log(avctx, AV_LOG_ERROR, "Format not supported!\n");
995     }
996     emms_c();
997
998     size += (put_bits_count(&s->pb) + 31) / 8;
999     put_bits(&s->pb, 16, 0);
1000     put_bits(&s->pb, 15, 0);
1001     size /= 4;
1002
1003     if ((s->flags & AV_CODEC_FLAG_PASS1) && (s->picture_number & 31) == 0) {
1004         int j;
1005         char *p = avctx->stats_out;
1006         char *end = p + STATS_OUT_SIZE;
1007         for (i = 0; i < 4; i++) {
1008             for (j = 0; j < s->vlc_n; j++) {
1009                 snprintf(p, end-p, "%"PRIu64" ", s->stats[i][j]);
1010                 p += strlen(p);
1011                 s->stats[i][j]= 0;
1012             }
1013             snprintf(p, end-p, "\n");
1014             p++;
1015             if (end <= p)
1016                 return AVERROR(ENOMEM);
1017         }
1018     } else if (avctx->stats_out)
1019         avctx->stats_out[0] = '\0';
1020     if (!(s->avctx->flags2 & AV_CODEC_FLAG2_NO_OUTPUT)) {
1021         flush_put_bits(&s->pb);
1022         s->bdsp.bswap_buf((uint32_t *) pkt->data, (uint32_t *) pkt->data, size);
1023     }
1024
1025     s->picture_number++;
1026
1027     pkt->size   = size * 4;
1028     pkt->flags |= AV_PKT_FLAG_KEY;
1029     *got_packet = 1;
1030
1031     return 0;
1032 }
1033
1034 static av_cold int encode_end(AVCodecContext *avctx)
1035 {
1036     HYuvContext *s = avctx->priv_data;
1037
1038     ff_huffyuv_common_end(s);
1039
1040     av_freep(&avctx->extradata);
1041     av_freep(&avctx->stats_out);
1042
1043     return 0;
1044 }
1045
1046 static const AVOption options[] = {
1047     { "non_deterministic", "Allow multithreading for e.g. context=1 at the expense of determinism",
1048       offsetof(HYuvContext, non_determ), AV_OPT_TYPE_BOOL, { .i64 = 1 },
1049       0, 1, AV_OPT_FLAG_VIDEO_PARAM | AV_OPT_FLAG_ENCODING_PARAM },
1050     { NULL },
1051 };
1052
1053 static const AVClass normal_class = {
1054     .class_name = "huffyuv",
1055     .item_name  = av_default_item_name,
1056     .option     = options,
1057     .version    = LIBAVUTIL_VERSION_INT,
1058 };
1059
1060 static const AVClass ff_class = {
1061     .class_name = "ffvhuff",
1062     .item_name  = av_default_item_name,
1063     .option     = options,
1064     .version    = LIBAVUTIL_VERSION_INT,
1065 };
1066
1067 AVCodec ff_huffyuv_encoder = {
1068     .name           = "huffyuv",
1069     .long_name      = NULL_IF_CONFIG_SMALL("Huffyuv / HuffYUV"),
1070     .type           = AVMEDIA_TYPE_VIDEO,
1071     .id             = AV_CODEC_ID_HUFFYUV,
1072     .priv_data_size = sizeof(HYuvContext),
1073     .init           = encode_init,
1074     .encode2        = encode_frame,
1075     .close          = encode_end,
1076     .capabilities   = AV_CODEC_CAP_FRAME_THREADS | AV_CODEC_CAP_INTRA_ONLY,
1077     .priv_class     = &normal_class,
1078     .pix_fmts       = (const enum AVPixelFormat[]){
1079         AV_PIX_FMT_YUV422P, AV_PIX_FMT_RGB24,
1080         AV_PIX_FMT_RGB32, AV_PIX_FMT_NONE
1081     },
1082     .caps_internal  = FF_CODEC_CAP_INIT_THREADSAFE |
1083                       FF_CODEC_CAP_INIT_CLEANUP,
1084 };
1085
1086 #if CONFIG_FFVHUFF_ENCODER
1087 AVCodec ff_ffvhuff_encoder = {
1088     .name           = "ffvhuff",
1089     .long_name      = NULL_IF_CONFIG_SMALL("Huffyuv FFmpeg variant"),
1090     .type           = AVMEDIA_TYPE_VIDEO,
1091     .id             = AV_CODEC_ID_FFVHUFF,
1092     .priv_data_size = sizeof(HYuvContext),
1093     .init           = encode_init,
1094     .encode2        = encode_frame,
1095     .close          = encode_end,
1096     .capabilities   = AV_CODEC_CAP_FRAME_THREADS | AV_CODEC_CAP_INTRA_ONLY,
1097     .priv_class     = &ff_class,
1098     .pix_fmts       = (const enum AVPixelFormat[]){
1099         AV_PIX_FMT_YUV420P, AV_PIX_FMT_YUV422P, AV_PIX_FMT_YUV444P, AV_PIX_FMT_YUV411P,
1100         AV_PIX_FMT_YUV410P, AV_PIX_FMT_YUV440P,
1101         AV_PIX_FMT_GBRP,
1102         AV_PIX_FMT_GBRP9, AV_PIX_FMT_GBRP10, AV_PIX_FMT_GBRP12, AV_PIX_FMT_GBRP14,
1103         AV_PIX_FMT_GRAY8, AV_PIX_FMT_GRAY16,
1104         AV_PIX_FMT_YUVA420P, AV_PIX_FMT_YUVA422P, AV_PIX_FMT_YUVA444P,
1105         AV_PIX_FMT_GBRAP,
1106         AV_PIX_FMT_GRAY8A,
1107         AV_PIX_FMT_YUV420P9, AV_PIX_FMT_YUV420P10, AV_PIX_FMT_YUV420P12, AV_PIX_FMT_YUV420P14, AV_PIX_FMT_YUV420P16,
1108         AV_PIX_FMT_YUV422P9, AV_PIX_FMT_YUV422P10, AV_PIX_FMT_YUV422P12, AV_PIX_FMT_YUV422P14, AV_PIX_FMT_YUV422P16,
1109         AV_PIX_FMT_YUV444P9, AV_PIX_FMT_YUV444P10, AV_PIX_FMT_YUV444P12, AV_PIX_FMT_YUV444P14, AV_PIX_FMT_YUV444P16,
1110         AV_PIX_FMT_YUVA420P9, AV_PIX_FMT_YUVA420P10, AV_PIX_FMT_YUVA420P16,
1111         AV_PIX_FMT_YUVA422P9, AV_PIX_FMT_YUVA422P10, AV_PIX_FMT_YUVA422P16,
1112         AV_PIX_FMT_YUVA444P9, AV_PIX_FMT_YUVA444P10, AV_PIX_FMT_YUVA444P16,
1113         AV_PIX_FMT_RGB24,
1114         AV_PIX_FMT_RGB32, AV_PIX_FMT_NONE
1115     },
1116     .caps_internal  = FF_CODEC_CAP_INIT_THREADSAFE |
1117                       FF_CODEC_CAP_INIT_CLEANUP,
1118 };
1119 #endif