]> git.sesse.net Git - ffmpeg/blob - libavcodec/huffyuvenc.c
Merge remote-tracking branch 'qatar/master'
[ffmpeg] / libavcodec / huffyuvenc.c
1 /*
2  * Copyright (c) 2002-2014 Michael Niedermayer <michaelni@gmx.at>
3  *
4  * see http://www.pcisys.net/~melanson/codecs/huffyuv.txt for a description of
5  * the algorithm used
6  *
7  * This file is part of FFmpeg.
8  *
9  * FFmpeg is free software; you can redistribute it and/or
10  * modify it under the terms of the GNU Lesser General Public
11  * License as published by the Free Software Foundation; either
12  * version 2.1 of the License, or (at your option) any later version.
13  *
14  * FFmpeg is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
17  * Lesser General Public License for more details.
18  *
19  * You should have received a copy of the GNU Lesser General Public
20  * License along with FFmpeg; if not, write to the Free Software
21  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
22  *
23  * yuva, gray, 4:4:4, 4:1:1, 4:1:0 and >8 bit per sample support sponsored by NOA
24  */
25
26 /**
27  * @file
28  * huffyuv encoder
29  */
30
31 #include "avcodec.h"
32 #include "huffyuv.h"
33 #include "huffman.h"
34 #include "internal.h"
35 #include "put_bits.h"
36 #include "libavutil/pixdesc.h"
37
38 static inline void diff_bytes(HYuvContext *s, uint8_t *dst,
39                               const uint8_t *src0, const uint8_t *src1, int w)
40 {
41     if (s->bps <= 8) {
42         s->dsp.diff_bytes(dst, src0, src1, w);
43     } else {
44         s->llviddsp.diff_int16((uint16_t *)dst, (const uint16_t *)src0, (const uint16_t *)src1, s->n - 1, w);
45     }
46 }
47
48 static inline int sub_left_prediction(HYuvContext *s, uint8_t *dst,
49                                       const uint8_t *src, int w, int left)
50 {
51     int i;
52     if (s->bps <= 8) {
53         if (w < 32) {
54             for (i = 0; i < w; i++) {
55                 const int temp = src[i];
56                 dst[i] = temp - left;
57                 left   = temp;
58             }
59             return left;
60         } else {
61             for (i = 0; i < 16; i++) {
62                 const int temp = src[i];
63                 dst[i] = temp - left;
64                 left   = temp;
65             }
66             s->dsp.diff_bytes(dst + 16, src + 16, src + 15, w - 16);
67             return src[w-1];
68         }
69     } else {
70         const uint16_t *src16 = (const uint16_t *)src;
71         uint16_t       *dst16 = (      uint16_t *)dst;
72         if (w < 32) {
73             for (i = 0; i < w; i++) {
74                 const int temp = src16[i];
75                 dst16[i] = temp - left;
76                 left   = temp;
77             }
78             return left;
79         } else {
80             for (i = 0; i < 16; i++) {
81                 const int temp = src16[i];
82                 dst16[i] = temp - left;
83                 left   = temp;
84             }
85             s->llviddsp.diff_int16(dst16 + 16, src16 + 16, src16 + 15, s->n - 1, w - 16);
86             return src16[w-1];
87         }
88     }
89 }
90
91 static inline void sub_left_prediction_bgr32(HYuvContext *s, uint8_t *dst,
92                                              const uint8_t *src, int w,
93                                              int *red, int *green, int *blue,
94                                              int *alpha)
95 {
96     int i;
97     int r, g, b, a;
98     r = *red;
99     g = *green;
100     b = *blue;
101     a = *alpha;
102
103     for (i = 0; i < FFMIN(w, 4); i++) {
104         const int rt = src[i * 4 + R];
105         const int gt = src[i * 4 + G];
106         const int bt = src[i * 4 + B];
107         const int at = src[i * 4 + A];
108         dst[i * 4 + R] = rt - r;
109         dst[i * 4 + G] = gt - g;
110         dst[i * 4 + B] = bt - b;
111         dst[i * 4 + A] = at - a;
112         r = rt;
113         g = gt;
114         b = bt;
115         a = at;
116     }
117
118     s->dsp.diff_bytes(dst + 16, src + 16, src + 12, w * 4 - 16);
119
120     *red   = src[(w - 1) * 4 + R];
121     *green = src[(w - 1) * 4 + G];
122     *blue  = src[(w - 1) * 4 + B];
123     *alpha = src[(w - 1) * 4 + A];
124 }
125
126 static inline void sub_left_prediction_rgb24(HYuvContext *s, uint8_t *dst,
127                                              uint8_t *src, int w,
128                                              int *red, int *green, int *blue)
129 {
130     int i;
131     int r, g, b;
132     r = *red;
133     g = *green;
134     b = *blue;
135     for (i = 0; i < FFMIN(w, 16); i++) {
136         const int rt = src[i * 3 + 0];
137         const int gt = src[i * 3 + 1];
138         const int bt = src[i * 3 + 2];
139         dst[i * 3 + 0] = rt - r;
140         dst[i * 3 + 1] = gt - g;
141         dst[i * 3 + 2] = bt - b;
142         r = rt;
143         g = gt;
144         b = bt;
145     }
146
147     s->dsp.diff_bytes(dst + 48, src + 48, src + 48 - 3, w * 3 - 48);
148
149     *red   = src[(w - 1) * 3 + 0];
150     *green = src[(w - 1) * 3 + 1];
151     *blue  = src[(w - 1) * 3 + 2];
152 }
153
154 static void sub_median_prediction(HYuvContext *s, uint8_t *dst, const uint8_t *src1, const uint8_t *src2, int w, int *left, int *left_top)
155 {
156     if (s->bps <= 8) {
157         s->dsp.sub_hfyu_median_prediction(dst, src1, src2, w , left, left_top);
158     } else {
159         s->llviddsp.sub_hfyu_median_prediction_int16((uint16_t *)dst, (const uint16_t *)src1, (const uint16_t *)src2, s->n - 1, w , left, left_top);
160     }
161 }
162
163 static int store_table(HYuvContext *s, const uint8_t *len, uint8_t *buf)
164 {
165     int i;
166     int index = 0;
167     int n = s->vlc_n;
168
169     for (i = 0; i < n;) {
170         int val = len[i];
171         int repeat = 0;
172
173         for (; i < n && len[i] == val && repeat < 255; i++)
174             repeat++;
175
176         av_assert0(val < 32 && val >0 && repeat < 256 && repeat>0);
177         if (repeat > 7) {
178             buf[index++] = val;
179             buf[index++] = repeat;
180         } else {
181             buf[index++] = val | (repeat << 5);
182         }
183     }
184
185     return index;
186 }
187
188 static int store_huffman_tables(HYuvContext *s, uint8_t *buf)
189 {
190     int i, ret;
191     int size = 0;
192     int count = 3;
193
194     if (s->version > 2)
195         count = 1 + s->alpha + 2*s->chroma;
196
197     for (i = 0; i < count; i++) {
198         if ((ret = ff_huff_gen_len_table(s->len[i], s->stats[i], s->vlc_n)) < 0)
199             return ret;
200
201         if (ff_huffyuv_generate_bits_table(s->bits[i], s->len[i], s->vlc_n) < 0) {
202             return -1;
203         }
204
205         size += store_table(s, s->len[i], buf + size);
206     }
207     return size;
208 }
209
210 static av_cold int encode_init(AVCodecContext *avctx)
211 {
212     HYuvContext *s = avctx->priv_data;
213     int i, j;
214     int ret;
215     const AVPixFmtDescriptor *desc = av_pix_fmt_desc_get(avctx->pix_fmt);
216
217     ff_huffyuv_common_init(avctx);
218
219     avctx->extradata = av_mallocz(3*MAX_N + 4);
220     if (!avctx->extradata)
221         return AVERROR(ENOMEM);
222     if (s->flags&CODEC_FLAG_PASS1) {
223 #define STATS_OUT_SIZE 21*MAX_N*3 + 4
224         avctx->stats_out = av_mallocz(STATS_OUT_SIZE); // 21*256*3(%llu ) + 3(\n) + 1(0) = 16132
225         if (!avctx->stats_out)
226             return AVERROR(ENOMEM);
227     }
228     s->version = 2;
229
230     avctx->coded_frame = av_frame_alloc();
231     if (!avctx->coded_frame)
232         return AVERROR(ENOMEM);
233
234     avctx->coded_frame->pict_type = AV_PICTURE_TYPE_I;
235     avctx->coded_frame->key_frame = 1;
236
237     s->bps = desc->comp[0].depth_minus1 + 1;
238     s->yuv = !(desc->flags & AV_PIX_FMT_FLAG_RGB) && desc->nb_components >= 2;
239     s->chroma = desc->nb_components > 2;
240     s->alpha = !!(desc->flags & AV_PIX_FMT_FLAG_ALPHA);
241     av_pix_fmt_get_chroma_sub_sample(avctx->pix_fmt,
242                                      &s->chroma_h_shift,
243                                      &s->chroma_v_shift);
244
245     switch (avctx->pix_fmt) {
246     case AV_PIX_FMT_YUV420P:
247     case AV_PIX_FMT_YUV422P:
248         if (s->width & 1) {
249             av_log(avctx, AV_LOG_ERROR, "Width must be even for this colorspace.\n");
250             return AVERROR(EINVAL);
251         }
252         s->bitstream_bpp = avctx->pix_fmt == AV_PIX_FMT_YUV420P ? 12 : 16;
253         break;
254     case AV_PIX_FMT_YUV444P:
255     case AV_PIX_FMT_YUV410P:
256     case AV_PIX_FMT_YUV411P:
257     case AV_PIX_FMT_YUV440P:
258     case AV_PIX_FMT_GBRP:
259     case AV_PIX_FMT_GBRP9:
260     case AV_PIX_FMT_GBRP10:
261     case AV_PIX_FMT_GBRP12:
262     case AV_PIX_FMT_GBRP14:
263     case AV_PIX_FMT_GBRP16:
264     case AV_PIX_FMT_GRAY8:
265     case AV_PIX_FMT_GRAY16:
266     case AV_PIX_FMT_YUVA444P:
267     case AV_PIX_FMT_YUVA420P:
268     case AV_PIX_FMT_YUVA422P:
269     case AV_PIX_FMT_GBRAP:
270     case AV_PIX_FMT_GRAY8A:
271     case AV_PIX_FMT_YUV420P9:
272     case AV_PIX_FMT_YUV420P10:
273     case AV_PIX_FMT_YUV420P12:
274     case AV_PIX_FMT_YUV420P14:
275     case AV_PIX_FMT_YUV420P16:
276     case AV_PIX_FMT_YUV422P9:
277     case AV_PIX_FMT_YUV422P10:
278     case AV_PIX_FMT_YUV422P12:
279     case AV_PIX_FMT_YUV422P14:
280     case AV_PIX_FMT_YUV422P16:
281     case AV_PIX_FMT_YUV444P9:
282     case AV_PIX_FMT_YUV444P10:
283     case AV_PIX_FMT_YUV444P12:
284     case AV_PIX_FMT_YUV444P14:
285     case AV_PIX_FMT_YUV444P16:
286     case AV_PIX_FMT_YUVA420P9:
287     case AV_PIX_FMT_YUVA420P10:
288     case AV_PIX_FMT_YUVA420P16:
289     case AV_PIX_FMT_YUVA422P9:
290     case AV_PIX_FMT_YUVA422P10:
291     case AV_PIX_FMT_YUVA422P16:
292     case AV_PIX_FMT_YUVA444P9:
293     case AV_PIX_FMT_YUVA444P10:
294     case AV_PIX_FMT_YUVA444P16:
295         s->version = 3;
296         break;
297     case AV_PIX_FMT_RGB32:
298         s->bitstream_bpp = 32;
299         break;
300     case AV_PIX_FMT_RGB24:
301         s->bitstream_bpp = 24;
302         break;
303     default:
304         av_log(avctx, AV_LOG_ERROR, "format not supported\n");
305         return AVERROR(EINVAL);
306     }
307     s->n = 1<<s->bps;
308     s->vlc_n = FFMIN(s->n, MAX_VLC_N);
309
310     avctx->bits_per_coded_sample = s->bitstream_bpp;
311     s->decorrelate = s->bitstream_bpp >= 24 && !s->yuv && !(desc->flags & AV_PIX_FMT_FLAG_PLANAR);
312     s->predictor = avctx->prediction_method;
313     s->interlaced = avctx->flags&CODEC_FLAG_INTERLACED_ME ? 1 : 0;
314     if (avctx->context_model == 1) {
315         s->context = avctx->context_model;
316         if (s->flags & (CODEC_FLAG_PASS1|CODEC_FLAG_PASS2)) {
317             av_log(avctx, AV_LOG_ERROR,
318                    "context=1 is not compatible with "
319                    "2 pass huffyuv encoding\n");
320             return AVERROR(EINVAL);
321         }
322     }else s->context= 0;
323
324     if (avctx->codec->id == AV_CODEC_ID_HUFFYUV) {
325         if (avctx->pix_fmt == AV_PIX_FMT_YUV420P) {
326             av_log(avctx, AV_LOG_ERROR,
327                    "Error: YV12 is not supported by huffyuv; use "
328                    "vcodec=ffvhuff or format=422p\n");
329             return AVERROR(EINVAL);
330         }
331         if (avctx->context_model) {
332             av_log(avctx, AV_LOG_ERROR,
333                    "Error: per-frame huffman tables are not supported "
334                    "by huffyuv; use vcodec=ffvhuff\n");
335             return AVERROR(EINVAL);
336         }
337         if (s->version > 2) {
338             av_log(avctx, AV_LOG_ERROR,
339                    "Error: ver>2 is not supported "
340                    "by huffyuv; use vcodec=ffvhuff\n");
341             return AVERROR(EINVAL);
342         }
343         if (s->interlaced != ( s->height > 288 ))
344             av_log(avctx, AV_LOG_INFO,
345                    "using huffyuv 2.2.0 or newer interlacing flag\n");
346     }
347
348     if (s->version > 2 && avctx->strict_std_compliance > FF_COMPLIANCE_EXPERIMENTAL) {
349         av_log(avctx, AV_LOG_ERROR, "Ver > 2 is under development, files encoded with it may not be decodable with future versions!!!\n"
350                "Use vstrict=-2 / -strict -2 to use it anyway.\n");
351         return AVERROR(EINVAL);
352     }
353
354     if (s->bitstream_bpp >= 24 && s->predictor == MEDIAN && s->version <= 2) {
355         av_log(avctx, AV_LOG_ERROR,
356                "Error: RGB is incompatible with median predictor\n");
357         return AVERROR(EINVAL);
358     }
359
360     ((uint8_t*)avctx->extradata)[0] = s->predictor | (s->decorrelate << 6);
361     ((uint8_t*)avctx->extradata)[2] = s->interlaced ? 0x10 : 0x20;
362     if (s->context)
363         ((uint8_t*)avctx->extradata)[2] |= 0x40;
364     if (s->version < 3) {
365         ((uint8_t*)avctx->extradata)[1] = s->bitstream_bpp;
366         ((uint8_t*)avctx->extradata)[3] = 0;
367     } else {
368         ((uint8_t*)avctx->extradata)[1] = ((s->bps-1)<<4) | s->chroma_h_shift | (s->chroma_v_shift<<2);
369         if (s->chroma)
370             ((uint8_t*)avctx->extradata)[2] |= s->yuv ? 1 : 2;
371         if (s->alpha)
372             ((uint8_t*)avctx->extradata)[2] |= 4;
373         ((uint8_t*)avctx->extradata)[3] = 1;
374     }
375     s->avctx->extradata_size = 4;
376
377     if (avctx->stats_in) {
378         char *p = avctx->stats_in;
379
380         for (i = 0; i < 4; i++)
381             for (j = 0; j < s->vlc_n; j++)
382                 s->stats[i][j] = 1;
383
384         for (;;) {
385             for (i = 0; i < 4; i++) {
386                 char *next;
387
388                 for (j = 0; j < s->vlc_n; j++) {
389                     s->stats[i][j] += strtol(p, &next, 0);
390                     if (next == p) return -1;
391                     p = next;
392                 }
393             }
394             if (p[0] == 0 || p[1] == 0 || p[2] == 0) break;
395         }
396     } else {
397         for (i = 0; i < 4; i++)
398             for (j = 0; j < s->vlc_n; j++) {
399                 int d = FFMIN(j, s->vlc_n - j);
400
401                 s->stats[i][j] = 100000000 / (d + 1);
402             }
403     }
404
405     ret = store_huffman_tables(s, s->avctx->extradata + s->avctx->extradata_size);
406     if (ret < 0)
407         return ret;
408     s->avctx->extradata_size += ret;
409
410     if (s->context) {
411         for (i = 0; i < 4; i++) {
412             int pels = s->width * s->height / (i ? 40 : 10);
413             for (j = 0; j < s->vlc_n; j++) {
414                 int d = FFMIN(j, s->vlc_n - j);
415                 s->stats[i][j] = pels/(d + 1);
416             }
417         }
418     } else {
419         for (i = 0; i < 4; i++)
420             for (j = 0; j < s->vlc_n; j++)
421                 s->stats[i][j]= 0;
422     }
423
424     if (ff_huffyuv_alloc_temp(s)) {
425         ff_huffyuv_common_end(s);
426         return AVERROR(ENOMEM);
427     }
428
429     s->picture_number=0;
430
431     return 0;
432 }
433 static int encode_422_bitstream(HYuvContext *s, int offset, int count)
434 {
435     int i;
436     const uint8_t *y = s->temp[0] + offset;
437     const uint8_t *u = s->temp[1] + offset / 2;
438     const uint8_t *v = s->temp[2] + offset / 2;
439
440     if (s->pb.buf_end - s->pb.buf - (put_bits_count(&s->pb) >> 3) < 2 * 4 * count) {
441         av_log(s->avctx, AV_LOG_ERROR, "encoded frame too large\n");
442         return -1;
443     }
444
445 #define LOAD4\
446             int y0 = y[2 * i];\
447             int y1 = y[2 * i + 1];\
448             int u0 = u[i];\
449             int v0 = v[i];
450
451     count /= 2;
452
453     if (s->flags & CODEC_FLAG_PASS1) {
454         for(i = 0; i < count; i++) {
455             LOAD4;
456             s->stats[0][y0]++;
457             s->stats[1][u0]++;
458             s->stats[0][y1]++;
459             s->stats[2][v0]++;
460         }
461     }
462     if (s->avctx->flags2 & CODEC_FLAG2_NO_OUTPUT)
463         return 0;
464     if (s->context) {
465         for (i = 0; i < count; i++) {
466             LOAD4;
467             s->stats[0][y0]++;
468             put_bits(&s->pb, s->len[0][y0], s->bits[0][y0]);
469             s->stats[1][u0]++;
470             put_bits(&s->pb, s->len[1][u0], s->bits[1][u0]);
471             s->stats[0][y1]++;
472             put_bits(&s->pb, s->len[0][y1], s->bits[0][y1]);
473             s->stats[2][v0]++;
474             put_bits(&s->pb, s->len[2][v0], s->bits[2][v0]);
475         }
476     } else {
477         for(i = 0; i < count; i++) {
478             LOAD4;
479             put_bits(&s->pb, s->len[0][y0], s->bits[0][y0]);
480             put_bits(&s->pb, s->len[1][u0], s->bits[1][u0]);
481             put_bits(&s->pb, s->len[0][y1], s->bits[0][y1]);
482             put_bits(&s->pb, s->len[2][v0], s->bits[2][v0]);
483         }
484     }
485     return 0;
486 }
487
488 static int encode_plane_bitstream(HYuvContext *s, int count, int plane)
489 {
490     int i;
491
492     if (s->pb.buf_end - s->pb.buf - (put_bits_count(&s->pb) >> 3) < count * s->bps / 2) {
493         av_log(s->avctx, AV_LOG_ERROR, "encoded frame too large\n");
494         return -1;
495     }
496
497 #define LOAD2\
498             int y0 = s->temp[0][2 * i];\
499             int y1 = s->temp[0][2 * i + 1];
500 #define LOAD2_14\
501             int y0 = s->temp16[0][2 * i] & mask;\
502             int y1 = s->temp16[0][2 * i + 1] & mask;
503 #define LOAD2_16\
504             int y0 = s->temp16[0][2 * i];\
505             int y1 = s->temp16[0][2 * i + 1];
506 #define STAT2\
507             s->stats[plane][y0]++;\
508             s->stats[plane][y1]++;
509 #define STAT2_16\
510             s->stats[plane][y0>>2]++;\
511             s->stats[plane][y1>>2]++;
512 #define WRITE2\
513             put_bits(&s->pb, s->len[plane][y0], s->bits[plane][y0]);\
514             put_bits(&s->pb, s->len[plane][y1], s->bits[plane][y1]);
515 #define WRITE2_16\
516             put_bits(&s->pb, s->len[plane][y0>>2], s->bits[plane][y0>>2]);\
517             put_bits(&s->pb, 2, y0&3);\
518             put_bits(&s->pb, s->len[plane][y1>>2], s->bits[plane][y1>>2]);\
519             put_bits(&s->pb, 2, y1&3);
520
521     count /= 2;
522
523     if (s->bps <= 8) {
524     if (s->flags & CODEC_FLAG_PASS1) {
525         for (i = 0; i < count; i++) {
526             LOAD2;
527             STAT2;
528         }
529     }
530     if (s->avctx->flags2 & CODEC_FLAG2_NO_OUTPUT)
531         return 0;
532
533     if (s->context) {
534         for (i = 0; i < count; i++) {
535             LOAD2;
536             STAT2;
537             WRITE2;
538         }
539     } else {
540         for (i = 0; i < count; i++) {
541             LOAD2;
542             WRITE2;
543         }
544     }
545     } else if (s->bps <= 14) {
546         int mask = s->n - 1;
547         if (s->flags & CODEC_FLAG_PASS1) {
548             for (i = 0; i < count; i++) {
549                 LOAD2_14;
550                 STAT2;
551             }
552         }
553         if (s->avctx->flags2 & CODEC_FLAG2_NO_OUTPUT)
554             return 0;
555
556         if (s->context) {
557             for (i = 0; i < count; i++) {
558                 LOAD2_14;
559                 STAT2;
560                 WRITE2;
561             }
562         } else {
563             for (i = 0; i < count; i++) {
564                 LOAD2_14;
565                 WRITE2;
566             }
567         }
568     } else {
569         if (s->flags & CODEC_FLAG_PASS1) {
570             for (i = 0; i < count; i++) {
571                 LOAD2_16;
572                 STAT2_16;
573             }
574         }
575         if (s->avctx->flags2 & CODEC_FLAG2_NO_OUTPUT)
576             return 0;
577
578         if (s->context) {
579             for (i = 0; i < count; i++) {
580                 LOAD2_16;
581                 STAT2_16;
582                 WRITE2_16;
583             }
584         } else {
585             for (i = 0; i < count; i++) {
586                 LOAD2_16;
587                 WRITE2_16;
588             }
589         }
590     }
591 #undef LOAD2
592 #undef STAT2
593 #undef WRITE2
594     return 0;
595 }
596
597 static int encode_gray_bitstream(HYuvContext *s, int count)
598 {
599     int i;
600
601     if (s->pb.buf_end - s->pb.buf - (put_bits_count(&s->pb) >> 3) < 4 * count) {
602         av_log(s->avctx, AV_LOG_ERROR, "encoded frame too large\n");
603         return -1;
604     }
605
606 #define LOAD2\
607             int y0 = s->temp[0][2 * i];\
608             int y1 = s->temp[0][2 * i + 1];
609 #define STAT2\
610             s->stats[0][y0]++;\
611             s->stats[0][y1]++;
612 #define WRITE2\
613             put_bits(&s->pb, s->len[0][y0], s->bits[0][y0]);\
614             put_bits(&s->pb, s->len[0][y1], s->bits[0][y1]);
615
616     count /= 2;
617
618     if (s->flags & CODEC_FLAG_PASS1) {
619         for (i = 0; i < count; i++) {
620             LOAD2;
621             STAT2;
622         }
623     }
624     if (s->avctx->flags2 & CODEC_FLAG2_NO_OUTPUT)
625         return 0;
626
627     if (s->context) {
628         for (i = 0; i < count; i++) {
629             LOAD2;
630             STAT2;
631             WRITE2;
632         }
633     } else {
634         for (i = 0; i < count; i++) {
635             LOAD2;
636             WRITE2;
637         }
638     }
639     return 0;
640 }
641
642 static inline int encode_bgra_bitstream(HYuvContext *s, int count, int planes)
643 {
644     int i;
645
646     if (s->pb.buf_end - s->pb.buf - (put_bits_count(&s->pb) >> 3) <
647         4 * planes * count) {
648         av_log(s->avctx, AV_LOG_ERROR, "encoded frame too large\n");
649         return -1;
650     }
651
652 #define LOAD_GBRA                                                       \
653     int g = s->temp[0][planes == 3 ? 3 * i + 1 : 4 * i + G];            \
654     int b =(s->temp[0][planes == 3 ? 3 * i + 2 : 4 * i + B] - g) & 0xFF;\
655     int r =(s->temp[0][planes == 3 ? 3 * i + 0 : 4 * i + R] - g) & 0xFF;\
656     int a = s->temp[0][planes * i + A];
657
658 #define STAT_BGRA                                                       \
659     s->stats[0][b]++;                                                   \
660     s->stats[1][g]++;                                                   \
661     s->stats[2][r]++;                                                   \
662     if (planes == 4)                                                    \
663         s->stats[2][a]++;
664
665 #define WRITE_GBRA                                                      \
666     put_bits(&s->pb, s->len[1][g], s->bits[1][g]);                      \
667     put_bits(&s->pb, s->len[0][b], s->bits[0][b]);                      \
668     put_bits(&s->pb, s->len[2][r], s->bits[2][r]);                      \
669     if (planes == 4)                                                    \
670         put_bits(&s->pb, s->len[2][a], s->bits[2][a]);
671
672     if ((s->flags & CODEC_FLAG_PASS1) &&
673         (s->avctx->flags2 & CODEC_FLAG2_NO_OUTPUT)) {
674         for (i = 0; i < count; i++) {
675             LOAD_GBRA;
676             STAT_BGRA;
677         }
678     } else if (s->context || (s->flags & CODEC_FLAG_PASS1)) {
679         for (i = 0; i < count; i++) {
680             LOAD_GBRA;
681             STAT_BGRA;
682             WRITE_GBRA;
683         }
684     } else {
685         for (i = 0; i < count; i++) {
686             LOAD_GBRA;
687             WRITE_GBRA;
688         }
689     }
690     return 0;
691 }
692
693 static int encode_frame(AVCodecContext *avctx, AVPacket *pkt,
694                         const AVFrame *pict, int *got_packet)
695 {
696     HYuvContext *s = avctx->priv_data;
697     const int width = s->width;
698     const int width2 = s->width>>1;
699     const int height = s->height;
700     const int fake_ystride = s->interlaced ? pict->linesize[0]*2  : pict->linesize[0];
701     const int fake_ustride = s->interlaced ? pict->linesize[1]*2  : pict->linesize[1];
702     const int fake_vstride = s->interlaced ? pict->linesize[2]*2  : pict->linesize[2];
703     const AVFrame * const p = pict;
704     int i, j, size = 0, ret;
705
706     if ((ret = ff_alloc_packet2(avctx, pkt, width * height * 3 * 4 + FF_MIN_BUFFER_SIZE)) < 0)
707         return ret;
708
709     if (s->context) {
710         size = store_huffman_tables(s, pkt->data);
711         if (size < 0)
712             return size;
713
714         for (i = 0; i < 4; i++)
715             for (j = 0; j < s->vlc_n; j++)
716                 s->stats[i][j] >>= 1;
717     }
718
719     init_put_bits(&s->pb, pkt->data + size, pkt->size - size);
720
721     if (avctx->pix_fmt == AV_PIX_FMT_YUV422P ||
722         avctx->pix_fmt == AV_PIX_FMT_YUV420P) {
723         int lefty, leftu, leftv, y, cy;
724
725         put_bits(&s->pb, 8, leftv = p->data[2][0]);
726         put_bits(&s->pb, 8, lefty = p->data[0][1]);
727         put_bits(&s->pb, 8, leftu = p->data[1][0]);
728         put_bits(&s->pb, 8,         p->data[0][0]);
729
730         lefty = sub_left_prediction(s, s->temp[0], p->data[0], width , 0);
731         leftu = sub_left_prediction(s, s->temp[1], p->data[1], width2, 0);
732         leftv = sub_left_prediction(s, s->temp[2], p->data[2], width2, 0);
733
734         encode_422_bitstream(s, 2, width-2);
735
736         if (s->predictor==MEDIAN) {
737             int lefttopy, lefttopu, lefttopv;
738             cy = y = 1;
739             if (s->interlaced) {
740                 lefty = sub_left_prediction(s, s->temp[0], p->data[0] + p->linesize[0], width , lefty);
741                 leftu = sub_left_prediction(s, s->temp[1], p->data[1] + p->linesize[1], width2, leftu);
742                 leftv = sub_left_prediction(s, s->temp[2], p->data[2] + p->linesize[2], width2, leftv);
743
744                 encode_422_bitstream(s, 0, width);
745                 y++; cy++;
746             }
747
748             lefty = sub_left_prediction(s, s->temp[0], p->data[0] + fake_ystride, 4, lefty);
749             leftu = sub_left_prediction(s, s->temp[1], p->data[1] + fake_ustride, 2, leftu);
750             leftv = sub_left_prediction(s, s->temp[2], p->data[2] + fake_vstride, 2, leftv);
751
752             encode_422_bitstream(s, 0, 4);
753
754             lefttopy = p->data[0][3];
755             lefttopu = p->data[1][1];
756             lefttopv = p->data[2][1];
757             s->dsp.sub_hfyu_median_prediction(s->temp[0], p->data[0]+4, p->data[0] + fake_ystride + 4, width - 4 , &lefty, &lefttopy);
758             s->dsp.sub_hfyu_median_prediction(s->temp[1], p->data[1]+2, p->data[1] + fake_ustride + 2, width2 - 2, &leftu, &lefttopu);
759             s->dsp.sub_hfyu_median_prediction(s->temp[2], p->data[2]+2, p->data[2] + fake_vstride + 2, width2 - 2, &leftv, &lefttopv);
760             encode_422_bitstream(s, 0, width - 4);
761             y++; cy++;
762
763             for (; y < height; y++,cy++) {
764                 uint8_t *ydst, *udst, *vdst;
765
766                 if (s->bitstream_bpp == 12) {
767                     while (2 * cy > y) {
768                         ydst = p->data[0] + p->linesize[0] * y;
769                         s->dsp.sub_hfyu_median_prediction(s->temp[0], ydst - fake_ystride, ydst, width , &lefty, &lefttopy);
770                         encode_gray_bitstream(s, width);
771                         y++;
772                     }
773                     if (y >= height) break;
774                 }
775                 ydst = p->data[0] + p->linesize[0] * y;
776                 udst = p->data[1] + p->linesize[1] * cy;
777                 vdst = p->data[2] + p->linesize[2] * cy;
778
779                 s->dsp.sub_hfyu_median_prediction(s->temp[0], ydst - fake_ystride, ydst, width , &lefty, &lefttopy);
780                 s->dsp.sub_hfyu_median_prediction(s->temp[1], udst - fake_ustride, udst, width2, &leftu, &lefttopu);
781                 s->dsp.sub_hfyu_median_prediction(s->temp[2], vdst - fake_vstride, vdst, width2, &leftv, &lefttopv);
782
783                 encode_422_bitstream(s, 0, width);
784             }
785         } else {
786             for (cy = y = 1; y < height; y++, cy++) {
787                 uint8_t *ydst, *udst, *vdst;
788
789                 /* encode a luma only line & y++ */
790                 if (s->bitstream_bpp == 12) {
791                     ydst = p->data[0] + p->linesize[0] * y;
792
793                     if (s->predictor == PLANE && s->interlaced < y) {
794                         s->dsp.diff_bytes(s->temp[1], ydst, ydst - fake_ystride, width);
795
796                         lefty = sub_left_prediction(s, s->temp[0], s->temp[1], width , lefty);
797                     } else {
798                         lefty = sub_left_prediction(s, s->temp[0], ydst, width , lefty);
799                     }
800                     encode_gray_bitstream(s, width);
801                     y++;
802                     if (y >= height) break;
803                 }
804
805                 ydst = p->data[0] + p->linesize[0] * y;
806                 udst = p->data[1] + p->linesize[1] * cy;
807                 vdst = p->data[2] + p->linesize[2] * cy;
808
809                 if (s->predictor == PLANE && s->interlaced < cy) {
810                     s->dsp.diff_bytes(s->temp[1], ydst, ydst - fake_ystride, width);
811                     s->dsp.diff_bytes(s->temp[2], udst, udst - fake_ustride, width2);
812                     s->dsp.diff_bytes(s->temp[2] + width2, vdst, vdst - fake_vstride, width2);
813
814                     lefty = sub_left_prediction(s, s->temp[0], s->temp[1], width , lefty);
815                     leftu = sub_left_prediction(s, s->temp[1], s->temp[2], width2, leftu);
816                     leftv = sub_left_prediction(s, s->temp[2], s->temp[2] + width2, width2, leftv);
817                 } else {
818                     lefty = sub_left_prediction(s, s->temp[0], ydst, width , lefty);
819                     leftu = sub_left_prediction(s, s->temp[1], udst, width2, leftu);
820                     leftv = sub_left_prediction(s, s->temp[2], vdst, width2, leftv);
821                 }
822
823                 encode_422_bitstream(s, 0, width);
824             }
825         }
826     } else if(avctx->pix_fmt == AV_PIX_FMT_RGB32) {
827         uint8_t *data = p->data[0] + (height - 1) * p->linesize[0];
828         const int stride = -p->linesize[0];
829         const int fake_stride = -fake_ystride;
830         int y;
831         int leftr, leftg, leftb, lefta;
832
833         put_bits(&s->pb, 8, lefta = data[A]);
834         put_bits(&s->pb, 8, leftr = data[R]);
835         put_bits(&s->pb, 8, leftg = data[G]);
836         put_bits(&s->pb, 8, leftb = data[B]);
837
838         sub_left_prediction_bgr32(s, s->temp[0], data + 4, width - 1,
839                                   &leftr, &leftg, &leftb, &lefta);
840         encode_bgra_bitstream(s, width - 1, 4);
841
842         for (y = 1; y < s->height; y++) {
843             uint8_t *dst = data + y*stride;
844             if (s->predictor == PLANE && s->interlaced < y) {
845                 s->dsp.diff_bytes(s->temp[1], dst, dst - fake_stride, width * 4);
846                 sub_left_prediction_bgr32(s, s->temp[0], s->temp[1], width,
847                                           &leftr, &leftg, &leftb, &lefta);
848             } else {
849                 sub_left_prediction_bgr32(s, s->temp[0], dst, width,
850                                           &leftr, &leftg, &leftb, &lefta);
851             }
852             encode_bgra_bitstream(s, width, 4);
853         }
854     } else if (avctx->pix_fmt == AV_PIX_FMT_RGB24) {
855         uint8_t *data = p->data[0] + (height - 1) * p->linesize[0];
856         const int stride = -p->linesize[0];
857         const int fake_stride = -fake_ystride;
858         int y;
859         int leftr, leftg, leftb;
860
861         put_bits(&s->pb, 8, leftr = data[0]);
862         put_bits(&s->pb, 8, leftg = data[1]);
863         put_bits(&s->pb, 8, leftb = data[2]);
864         put_bits(&s->pb, 8, 0);
865
866         sub_left_prediction_rgb24(s, s->temp[0], data + 3, width - 1,
867                                   &leftr, &leftg, &leftb);
868         encode_bgra_bitstream(s, width-1, 3);
869
870         for (y = 1; y < s->height; y++) {
871             uint8_t *dst = data + y * stride;
872             if (s->predictor == PLANE && s->interlaced < y) {
873                 s->dsp.diff_bytes(s->temp[1], dst, dst - fake_stride,
874                                   width * 3);
875                 sub_left_prediction_rgb24(s, s->temp[0], s->temp[1], width,
876                                           &leftr, &leftg, &leftb);
877             } else {
878                 sub_left_prediction_rgb24(s, s->temp[0], dst, width,
879                                           &leftr, &leftg, &leftb);
880             }
881             encode_bgra_bitstream(s, width, 3);
882         }
883     } else if (s->version > 2) {
884         int plane;
885         for (plane = 0; plane < 1 + 2*s->chroma + s->alpha; plane++) {
886             int left, y;
887             int w = width;
888             int h = height;
889             int fake_stride = fake_ystride;
890
891             if (s->chroma && (plane == 1 || plane == 2)) {
892                 w >>= s->chroma_h_shift;
893                 h >>= s->chroma_v_shift;
894                 fake_stride = plane == 1 ? fake_ustride : fake_vstride;
895             }
896
897             left = sub_left_prediction(s, s->temp[0], p->data[plane], w , 0);
898
899             encode_plane_bitstream(s, w, plane);
900
901             if (s->predictor==MEDIAN) {
902                 int lefttop;
903                 y = 1;
904                 if (s->interlaced) {
905                     left = sub_left_prediction(s, s->temp[0], p->data[plane] + p->linesize[plane], w , left);
906
907                     encode_plane_bitstream(s, w, plane);
908                     y++;
909                 }
910
911                 lefttop = p->data[plane][0];
912
913                 for (; y < h; y++) {
914                     uint8_t *dst = p->data[plane] + p->linesize[plane] * y;
915
916                     sub_median_prediction(s, s->temp[0], dst - fake_stride, dst, w , &left, &lefttop);
917
918                     encode_plane_bitstream(s, w, plane);
919                 }
920             } else {
921                 for (y = 1; y < h; y++) {
922                     uint8_t *dst = p->data[plane] + p->linesize[plane] * y;
923
924                     if (s->predictor == PLANE && s->interlaced < y) {
925                         diff_bytes(s, s->temp[1], dst, dst - fake_stride, w);
926
927                         left = sub_left_prediction(s, s->temp[0], s->temp[1], w , left);
928                     } else {
929                         left = sub_left_prediction(s, s->temp[0], dst, w , left);
930                     }
931
932                     encode_plane_bitstream(s, w, plane);
933                 }
934             }
935         }
936     } else {
937         av_log(avctx, AV_LOG_ERROR, "Format not supported!\n");
938     }
939     emms_c();
940
941     size += (put_bits_count(&s->pb) + 31) / 8;
942     put_bits(&s->pb, 16, 0);
943     put_bits(&s->pb, 15, 0);
944     size /= 4;
945
946     if ((s->flags&CODEC_FLAG_PASS1) && (s->picture_number & 31) == 0) {
947         int j;
948         char *p = avctx->stats_out;
949         char *end = p + STATS_OUT_SIZE;
950         for (i = 0; i < 4; i++) {
951             for (j = 0; j < s->vlc_n; j++) {
952                 snprintf(p, end-p, "%"PRIu64" ", s->stats[i][j]);
953                 p += strlen(p);
954                 s->stats[i][j]= 0;
955             }
956             snprintf(p, end-p, "\n");
957             p++;
958             if (end <= p)
959                 return AVERROR(ENOMEM);
960         }
961     } else if (avctx->stats_out)
962         avctx->stats_out[0] = '\0';
963     if (!(s->avctx->flags2 & CODEC_FLAG2_NO_OUTPUT)) {
964         flush_put_bits(&s->pb);
965         s->dsp.bswap_buf((uint32_t*)pkt->data, (uint32_t*)pkt->data, size);
966     }
967
968     s->picture_number++;
969
970     pkt->size   = size * 4;
971     pkt->flags |= AV_PKT_FLAG_KEY;
972     *got_packet = 1;
973
974     return 0;
975 }
976
977 static av_cold int encode_end(AVCodecContext *avctx)
978 {
979     HYuvContext *s = avctx->priv_data;
980
981     ff_huffyuv_common_end(s);
982
983     av_freep(&avctx->extradata);
984     av_freep(&avctx->stats_out);
985
986     av_frame_free(&avctx->coded_frame);
987
988     return 0;
989 }
990
991 #if CONFIG_HUFFYUV_ENCODER
992 AVCodec ff_huffyuv_encoder = {
993     .name           = "huffyuv",
994     .long_name      = NULL_IF_CONFIG_SMALL("Huffyuv / HuffYUV"),
995     .type           = AVMEDIA_TYPE_VIDEO,
996     .id             = AV_CODEC_ID_HUFFYUV,
997     .priv_data_size = sizeof(HYuvContext),
998     .init           = encode_init,
999     .encode2        = encode_frame,
1000     .close          = encode_end,
1001     .capabilities   = CODEC_CAP_FRAME_THREADS | CODEC_CAP_INTRA_ONLY,
1002     .pix_fmts       = (const enum AVPixelFormat[]){
1003         AV_PIX_FMT_YUV422P, AV_PIX_FMT_RGB24,
1004         AV_PIX_FMT_RGB32, AV_PIX_FMT_NONE
1005     },
1006 };
1007 #endif
1008
1009 #if CONFIG_FFVHUFF_ENCODER
1010 AVCodec ff_ffvhuff_encoder = {
1011     .name           = "ffvhuff",
1012     .long_name      = NULL_IF_CONFIG_SMALL("Huffyuv FFmpeg variant"),
1013     .type           = AVMEDIA_TYPE_VIDEO,
1014     .id             = AV_CODEC_ID_FFVHUFF,
1015     .priv_data_size = sizeof(HYuvContext),
1016     .init           = encode_init,
1017     .encode2        = encode_frame,
1018     .close          = encode_end,
1019     .capabilities   = CODEC_CAP_FRAME_THREADS | CODEC_CAP_INTRA_ONLY,
1020     .pix_fmts       = (const enum AVPixelFormat[]){
1021         AV_PIX_FMT_YUV420P, AV_PIX_FMT_YUV422P, AV_PIX_FMT_YUV444P, AV_PIX_FMT_YUV411P,
1022         AV_PIX_FMT_YUV410P, AV_PIX_FMT_YUV440P,
1023         AV_PIX_FMT_GBRP,
1024         AV_PIX_FMT_GBRP9, AV_PIX_FMT_GBRP10, AV_PIX_FMT_GBRP12, AV_PIX_FMT_GBRP14,
1025         AV_PIX_FMT_GRAY8, AV_PIX_FMT_GRAY16,
1026         AV_PIX_FMT_YUVA420P, AV_PIX_FMT_YUVA422P, AV_PIX_FMT_YUVA444P,
1027         AV_PIX_FMT_GBRAP,
1028         AV_PIX_FMT_GRAY8A,
1029         AV_PIX_FMT_YUV420P9, AV_PIX_FMT_YUV420P10, AV_PIX_FMT_YUV420P12, AV_PIX_FMT_YUV420P14, AV_PIX_FMT_YUV420P16,
1030         AV_PIX_FMT_YUV422P9, AV_PIX_FMT_YUV422P10, AV_PIX_FMT_YUV422P12, AV_PIX_FMT_YUV422P14, AV_PIX_FMT_YUV422P16,
1031         AV_PIX_FMT_YUV444P9, AV_PIX_FMT_YUV444P10, AV_PIX_FMT_YUV444P12, AV_PIX_FMT_YUV444P14, AV_PIX_FMT_YUV444P16,
1032         AV_PIX_FMT_YUVA420P9, AV_PIX_FMT_YUVA420P10, AV_PIX_FMT_YUVA420P16,
1033         AV_PIX_FMT_YUVA422P9, AV_PIX_FMT_YUVA422P10, AV_PIX_FMT_YUVA422P16,
1034         AV_PIX_FMT_YUVA444P9, AV_PIX_FMT_YUVA444P10, AV_PIX_FMT_YUVA444P16,
1035         AV_PIX_FMT_RGB24,
1036         AV_PIX_FMT_RGB32, AV_PIX_FMT_NONE
1037     },
1038 };
1039 #endif