]> git.sesse.net Git - ffmpeg/blob - libavcodec/libvpxenc.c
avcodec/libvpxenc: fix alpha stride
[ffmpeg] / libavcodec / libvpxenc.c
1 /*
2  * Copyright (c) 2010, Google, Inc.
3  *
4  * This file is part of FFmpeg.
5  *
6  * FFmpeg is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU Lesser General Public
8  * License as published by the Free Software Foundation; either
9  * version 2.1 of the License, or (at your option) any later version.
10  *
11  * FFmpeg is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14  * Lesser General Public License for more details.
15  *
16  * You should have received a copy of the GNU Lesser General Public
17  * License along with FFmpeg; if not, write to the Free Software
18  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
19  */
20
21 /**
22  * @file
23  * VP8/9 encoder support via libvpx
24  */
25
26 #define VPX_DISABLE_CTRL_TYPECHECKS 1
27 #define VPX_CODEC_DISABLE_COMPAT    1
28 #include <vpx/vpx_encoder.h>
29 #include <vpx/vp8cx.h>
30
31 #include "avcodec.h"
32 #include "internal.h"
33 #include "libavutil/avassert.h"
34 #include "libvpx.h"
35 #include "profiles.h"
36 #include "libavutil/avstring.h"
37 #include "libavutil/base64.h"
38 #include "libavutil/common.h"
39 #include "libavutil/internal.h"
40 #include "libavutil/intreadwrite.h"
41 #include "libavutil/mathematics.h"
42 #include "libavutil/opt.h"
43
44 /**
45  * Portion of struct vpx_codec_cx_pkt from vpx_encoder.h.
46  * One encoded frame returned from the library.
47  */
48 struct FrameListData {
49     void *buf;                       /**< compressed data buffer */
50     size_t sz;                       /**< length of compressed data */
51     void *buf_alpha;
52     size_t sz_alpha;
53     int64_t pts;                     /**< time stamp to show frame
54                                           (in timebase units) */
55     unsigned long duration;          /**< duration to show frame
56                                           (in timebase units) */
57     uint32_t flags;                  /**< flags for this frame */
58     uint64_t sse[4];
59     int have_sse;                    /**< true if we have pending sse[] */
60     uint64_t frame_number;
61     struct FrameListData *next;
62 };
63
64 typedef struct VPxEncoderContext {
65     AVClass *class;
66     struct vpx_codec_ctx encoder;
67     struct vpx_image rawimg;
68     struct vpx_codec_ctx encoder_alpha;
69     struct vpx_image rawimg_alpha;
70     uint8_t is_alpha;
71     struct vpx_fixed_buf twopass_stats;
72     int deadline; //i.e., RT/GOOD/BEST
73     uint64_t sse[4];
74     int have_sse; /**< true if we have pending sse[] */
75     uint64_t frame_number;
76     struct FrameListData *coded_frame_list;
77
78     int cpu_used;
79     int sharpness;
80     /**
81      * VP8 specific flags, see VP8F_* below.
82      */
83     int flags;
84 #define VP8F_ERROR_RESILIENT 0x00000001 ///< Enable measures appropriate for streaming over lossy links
85 #define VP8F_AUTO_ALT_REF    0x00000002 ///< Enable automatic alternate reference frame generation
86
87     int auto_alt_ref;
88
89     int arnr_max_frames;
90     int arnr_strength;
91     int arnr_type;
92
93     int tune;
94
95     int lag_in_frames;
96     int error_resilient;
97     int crf;
98     int static_thresh;
99     int max_intra_rate;
100     int rc_undershoot_pct;
101     int rc_overshoot_pct;
102
103     char *vp8_ts_parameters;
104
105     // VP9-only
106     int lossless;
107     int tile_columns;
108     int tile_rows;
109     int frame_parallel;
110     int aq_mode;
111     int drop_threshold;
112     int noise_sensitivity;
113     int vpx_cs;
114     float level;
115     int row_mt;
116     int tune_content;
117     int corpus_complexity;
118     int tpl_model;
119     /**
120      * If the driver does not support ROI then warn the first time we
121      * encounter a frame with ROI side data.
122      */
123     int roi_warned;
124 } VPxContext;
125
126 /** String mappings for enum vp8e_enc_control_id */
127 static const char *const ctlidstr[] = {
128     [VP8E_SET_CPUUSED]           = "VP8E_SET_CPUUSED",
129     [VP8E_SET_ENABLEAUTOALTREF]  = "VP8E_SET_ENABLEAUTOALTREF",
130     [VP8E_SET_NOISE_SENSITIVITY] = "VP8E_SET_NOISE_SENSITIVITY",
131     [VP8E_SET_STATIC_THRESHOLD]  = "VP8E_SET_STATIC_THRESHOLD",
132     [VP8E_SET_TOKEN_PARTITIONS]  = "VP8E_SET_TOKEN_PARTITIONS",
133     [VP8E_SET_ARNR_MAXFRAMES]    = "VP8E_SET_ARNR_MAXFRAMES",
134     [VP8E_SET_ARNR_STRENGTH]     = "VP8E_SET_ARNR_STRENGTH",
135     [VP8E_SET_ARNR_TYPE]         = "VP8E_SET_ARNR_TYPE",
136     [VP8E_SET_TUNING]            = "VP8E_SET_TUNING",
137     [VP8E_SET_CQ_LEVEL]          = "VP8E_SET_CQ_LEVEL",
138     [VP8E_SET_MAX_INTRA_BITRATE_PCT] = "VP8E_SET_MAX_INTRA_BITRATE_PCT",
139     [VP8E_SET_SHARPNESS]               = "VP8E_SET_SHARPNESS",
140 #if CONFIG_LIBVPX_VP9_ENCODER
141     [VP9E_SET_LOSSLESS]                = "VP9E_SET_LOSSLESS",
142     [VP9E_SET_TILE_COLUMNS]            = "VP9E_SET_TILE_COLUMNS",
143     [VP9E_SET_TILE_ROWS]               = "VP9E_SET_TILE_ROWS",
144     [VP9E_SET_FRAME_PARALLEL_DECODING] = "VP9E_SET_FRAME_PARALLEL_DECODING",
145     [VP9E_SET_AQ_MODE]                 = "VP9E_SET_AQ_MODE",
146     [VP9E_SET_COLOR_SPACE]             = "VP9E_SET_COLOR_SPACE",
147 #if VPX_ENCODER_ABI_VERSION >= 11
148     [VP9E_SET_COLOR_RANGE]             = "VP9E_SET_COLOR_RANGE",
149 #endif
150 #if VPX_ENCODER_ABI_VERSION >= 12
151     [VP9E_SET_TARGET_LEVEL]            = "VP9E_SET_TARGET_LEVEL",
152     [VP9E_GET_LEVEL]                   = "VP9E_GET_LEVEL",
153 #endif
154 #ifdef VPX_CTRL_VP9E_SET_ROW_MT
155     [VP9E_SET_ROW_MT]                  = "VP9E_SET_ROW_MT",
156 #endif
157 #ifdef VPX_CTRL_VP9E_SET_TUNE_CONTENT
158     [VP9E_SET_TUNE_CONTENT]            = "VP9E_SET_TUNE_CONTENT",
159 #endif
160 #ifdef VPX_CTRL_VP9E_SET_TPL
161     [VP9E_SET_TPL]                     = "VP9E_SET_TPL",
162 #endif
163 #endif
164 };
165
166 static av_cold void log_encoder_error(AVCodecContext *avctx, const char *desc)
167 {
168     VPxContext *ctx = avctx->priv_data;
169     const char *error  = vpx_codec_error(&ctx->encoder);
170     const char *detail = vpx_codec_error_detail(&ctx->encoder);
171
172     av_log(avctx, AV_LOG_ERROR, "%s: %s\n", desc, error);
173     if (detail)
174         av_log(avctx, AV_LOG_ERROR, "  Additional information: %s\n", detail);
175 }
176
177 static av_cold void dump_enc_cfg(AVCodecContext *avctx,
178                                  const struct vpx_codec_enc_cfg *cfg)
179 {
180     int width = -30;
181     int level = AV_LOG_DEBUG;
182     int i;
183
184     av_log(avctx, level, "vpx_codec_enc_cfg\n");
185     av_log(avctx, level, "generic settings\n"
186            "  %*s%u\n  %*s%u\n  %*s%u\n  %*s%u\n  %*s%u\n"
187 #if CONFIG_LIBVPX_VP9_ENCODER
188            "  %*s%u\n  %*s%u\n"
189 #endif
190            "  %*s{%u/%u}\n  %*s%u\n  %*s%d\n  %*s%u\n",
191            width, "g_usage:",           cfg->g_usage,
192            width, "g_threads:",         cfg->g_threads,
193            width, "g_profile:",         cfg->g_profile,
194            width, "g_w:",               cfg->g_w,
195            width, "g_h:",               cfg->g_h,
196 #if CONFIG_LIBVPX_VP9_ENCODER
197            width, "g_bit_depth:",       cfg->g_bit_depth,
198            width, "g_input_bit_depth:", cfg->g_input_bit_depth,
199 #endif
200            width, "g_timebase:",        cfg->g_timebase.num, cfg->g_timebase.den,
201            width, "g_error_resilient:", cfg->g_error_resilient,
202            width, "g_pass:",            cfg->g_pass,
203            width, "g_lag_in_frames:",   cfg->g_lag_in_frames);
204     av_log(avctx, level, "rate control settings\n"
205            "  %*s%u\n  %*s%u\n  %*s%u\n  %*s%u\n"
206            "  %*s%d\n  %*s%p(%"SIZE_SPECIFIER")\n  %*s%u\n",
207            width, "rc_dropframe_thresh:",   cfg->rc_dropframe_thresh,
208            width, "rc_resize_allowed:",     cfg->rc_resize_allowed,
209            width, "rc_resize_up_thresh:",   cfg->rc_resize_up_thresh,
210            width, "rc_resize_down_thresh:", cfg->rc_resize_down_thresh,
211            width, "rc_end_usage:",          cfg->rc_end_usage,
212            width, "rc_twopass_stats_in:",   cfg->rc_twopass_stats_in.buf, cfg->rc_twopass_stats_in.sz,
213            width, "rc_target_bitrate:",     cfg->rc_target_bitrate);
214     av_log(avctx, level, "quantizer settings\n"
215            "  %*s%u\n  %*s%u\n",
216            width, "rc_min_quantizer:", cfg->rc_min_quantizer,
217            width, "rc_max_quantizer:", cfg->rc_max_quantizer);
218     av_log(avctx, level, "bitrate tolerance\n"
219            "  %*s%u\n  %*s%u\n",
220            width, "rc_undershoot_pct:", cfg->rc_undershoot_pct,
221            width, "rc_overshoot_pct:",  cfg->rc_overshoot_pct);
222     av_log(avctx, level, "temporal layering settings\n"
223            "  %*s%u\n", width, "ts_number_layers:", cfg->ts_number_layers);
224     av_log(avctx, level,
225            "\n  %*s", width, "ts_target_bitrate:");
226     for (i = 0; i < VPX_TS_MAX_LAYERS; i++)
227         av_log(avctx, level, "%u ", cfg->ts_target_bitrate[i]);
228     av_log(avctx, level, "\n");
229     av_log(avctx, level,
230            "\n  %*s", width, "ts_rate_decimator:");
231     for (i = 0; i < VPX_TS_MAX_LAYERS; i++)
232         av_log(avctx, level, "%u ", cfg->ts_rate_decimator[i]);
233     av_log(avctx, level, "\n");
234     av_log(avctx, level,
235            "\n  %*s%u\n", width, "ts_periodicity:", cfg->ts_periodicity);
236     av_log(avctx, level,
237            "\n  %*s", width, "ts_layer_id:");
238     for (i = 0; i < VPX_TS_MAX_PERIODICITY; i++)
239         av_log(avctx, level, "%u ", cfg->ts_layer_id[i]);
240     av_log(avctx, level, "\n");
241     av_log(avctx, level, "decoder buffer model\n"
242             "  %*s%u\n  %*s%u\n  %*s%u\n",
243             width, "rc_buf_sz:",         cfg->rc_buf_sz,
244             width, "rc_buf_initial_sz:", cfg->rc_buf_initial_sz,
245             width, "rc_buf_optimal_sz:", cfg->rc_buf_optimal_sz);
246     av_log(avctx, level, "2 pass rate control settings\n"
247            "  %*s%u\n  %*s%u\n  %*s%u\n",
248            width, "rc_2pass_vbr_bias_pct:",       cfg->rc_2pass_vbr_bias_pct,
249            width, "rc_2pass_vbr_minsection_pct:", cfg->rc_2pass_vbr_minsection_pct,
250            width, "rc_2pass_vbr_maxsection_pct:", cfg->rc_2pass_vbr_maxsection_pct);
251 #if VPX_ENCODER_ABI_VERSION >= 14
252     av_log(avctx, level, "  %*s%u\n",
253            width, "rc_2pass_vbr_corpus_complexity:", cfg->rc_2pass_vbr_corpus_complexity);
254 #endif
255     av_log(avctx, level, "keyframing settings\n"
256            "  %*s%d\n  %*s%u\n  %*s%u\n",
257            width, "kf_mode:",     cfg->kf_mode,
258            width, "kf_min_dist:", cfg->kf_min_dist,
259            width, "kf_max_dist:", cfg->kf_max_dist);
260     av_log(avctx, level, "\n");
261 }
262
263 static void coded_frame_add(void *list, struct FrameListData *cx_frame)
264 {
265     struct FrameListData **p = list;
266
267     while (*p)
268         p = &(*p)->next;
269     *p = cx_frame;
270     cx_frame->next = NULL;
271 }
272
273 static av_cold void free_coded_frame(struct FrameListData *cx_frame)
274 {
275     av_freep(&cx_frame->buf);
276     if (cx_frame->buf_alpha)
277         av_freep(&cx_frame->buf_alpha);
278     av_freep(&cx_frame);
279 }
280
281 static av_cold void free_frame_list(struct FrameListData *list)
282 {
283     struct FrameListData *p = list;
284
285     while (p) {
286         list = list->next;
287         free_coded_frame(p);
288         p = list;
289     }
290 }
291
292 static av_cold int codecctl_int(AVCodecContext *avctx,
293                                 enum vp8e_enc_control_id id, int val)
294 {
295     VPxContext *ctx = avctx->priv_data;
296     char buf[80];
297     int width = -30;
298     int res;
299
300     snprintf(buf, sizeof(buf), "%s:", ctlidstr[id]);
301     av_log(avctx, AV_LOG_DEBUG, "  %*s%d\n", width, buf, val);
302
303     res = vpx_codec_control(&ctx->encoder, id, val);
304     if (res != VPX_CODEC_OK) {
305         snprintf(buf, sizeof(buf), "Failed to set %s codec control",
306                  ctlidstr[id]);
307         log_encoder_error(avctx, buf);
308     }
309
310     return res == VPX_CODEC_OK ? 0 : AVERROR(EINVAL);
311 }
312
313 #if VPX_ENCODER_ABI_VERSION >= 12
314 static av_cold int codecctl_intp(AVCodecContext *avctx,
315                                  enum vp8e_enc_control_id id, int *val)
316 {
317     VPxContext *ctx = avctx->priv_data;
318     char buf[80];
319     int width = -30;
320     int res;
321
322     snprintf(buf, sizeof(buf), "%s:", ctlidstr[id]);
323     av_log(avctx, AV_LOG_DEBUG, "  %*s%d\n", width, buf, *val);
324
325     res = vpx_codec_control(&ctx->encoder, id, val);
326     if (res != VPX_CODEC_OK) {
327         snprintf(buf, sizeof(buf), "Failed to set %s codec control",
328                  ctlidstr[id]);
329         log_encoder_error(avctx, buf);
330     }
331
332     return res == VPX_CODEC_OK ? 0 : AVERROR(EINVAL);
333 }
334 #endif
335
336 static av_cold int vpx_free(AVCodecContext *avctx)
337 {
338     VPxContext *ctx = avctx->priv_data;
339
340 #if VPX_ENCODER_ABI_VERSION >= 12
341     if (avctx->codec_id == AV_CODEC_ID_VP9 && ctx->level >= 0 &&
342         !(avctx->flags & AV_CODEC_FLAG_PASS1)) {
343         int level_out = 0;
344         if (!codecctl_intp(avctx, VP9E_GET_LEVEL, &level_out))
345             av_log(avctx, AV_LOG_INFO, "Encoded level %.1f\n", level_out * 0.1);
346     }
347 #endif
348
349     vpx_codec_destroy(&ctx->encoder);
350     if (ctx->is_alpha)
351         vpx_codec_destroy(&ctx->encoder_alpha);
352     av_freep(&ctx->twopass_stats.buf);
353     av_freep(&avctx->stats_out);
354     free_frame_list(ctx->coded_frame_list);
355     return 0;
356 }
357
358 static void vp8_ts_parse_int_array(int *dest, char *value, size_t value_len, int max_entries)
359 {
360     int dest_idx = 0;
361     char *saveptr = NULL;
362     char *token = av_strtok(value, ",", &saveptr);
363
364     while (token && dest_idx < max_entries) {
365         dest[dest_idx++] = strtoul(token, NULL, 10);
366         token = av_strtok(NULL, ",", &saveptr);
367     }
368 }
369
370 static int vp8_ts_param_parse(struct vpx_codec_enc_cfg *enccfg, char *key, char *value)
371 {
372     size_t value_len = strlen(value);
373
374     if (!value_len)
375         return -1;
376
377     if (!strcmp(key, "ts_number_layers"))
378         enccfg->ts_number_layers = strtoul(value, &value, 10);
379     else if (!strcmp(key, "ts_target_bitrate"))
380         vp8_ts_parse_int_array(enccfg->ts_target_bitrate, value, value_len, VPX_TS_MAX_LAYERS);
381     else if (!strcmp(key, "ts_rate_decimator"))
382       vp8_ts_parse_int_array(enccfg->ts_rate_decimator, value, value_len, VPX_TS_MAX_LAYERS);
383     else if (!strcmp(key, "ts_periodicity"))
384         enccfg->ts_periodicity = strtoul(value, &value, 10);
385     else if (!strcmp(key, "ts_layer_id"))
386         vp8_ts_parse_int_array(enccfg->ts_layer_id, value, value_len, VPX_TS_MAX_PERIODICITY);
387
388     return 0;
389 }
390
391 #if CONFIG_LIBVPX_VP9_ENCODER
392 static int set_pix_fmt(AVCodecContext *avctx, vpx_codec_caps_t codec_caps,
393                        struct vpx_codec_enc_cfg *enccfg, vpx_codec_flags_t *flags,
394                        vpx_img_fmt_t *img_fmt)
395 {
396     VPxContext av_unused *ctx = avctx->priv_data;
397     enccfg->g_bit_depth = enccfg->g_input_bit_depth = 8;
398     switch (avctx->pix_fmt) {
399     case AV_PIX_FMT_YUV420P:
400     case AV_PIX_FMT_YUVA420P:
401         enccfg->g_profile = 0;
402         *img_fmt = VPX_IMG_FMT_I420;
403         return 0;
404     case AV_PIX_FMT_YUV422P:
405         enccfg->g_profile = 1;
406         *img_fmt = VPX_IMG_FMT_I422;
407         return 0;
408     case AV_PIX_FMT_YUV440P:
409         enccfg->g_profile = 1;
410         *img_fmt = VPX_IMG_FMT_I440;
411         return 0;
412     case AV_PIX_FMT_GBRP:
413         ctx->vpx_cs = VPX_CS_SRGB;
414     case AV_PIX_FMT_YUV444P:
415         enccfg->g_profile = 1;
416         *img_fmt = VPX_IMG_FMT_I444;
417         return 0;
418     case AV_PIX_FMT_YUV420P10:
419     case AV_PIX_FMT_YUV420P12:
420         if (codec_caps & VPX_CODEC_CAP_HIGHBITDEPTH) {
421             enccfg->g_bit_depth = enccfg->g_input_bit_depth =
422                 avctx->pix_fmt == AV_PIX_FMT_YUV420P10 ? 10 : 12;
423             enccfg->g_profile = 2;
424             *img_fmt = VPX_IMG_FMT_I42016;
425             *flags |= VPX_CODEC_USE_HIGHBITDEPTH;
426             return 0;
427         }
428         break;
429     case AV_PIX_FMT_YUV422P10:
430     case AV_PIX_FMT_YUV422P12:
431         if (codec_caps & VPX_CODEC_CAP_HIGHBITDEPTH) {
432             enccfg->g_bit_depth = enccfg->g_input_bit_depth =
433                 avctx->pix_fmt == AV_PIX_FMT_YUV422P10 ? 10 : 12;
434             enccfg->g_profile = 3;
435             *img_fmt = VPX_IMG_FMT_I42216;
436             *flags |= VPX_CODEC_USE_HIGHBITDEPTH;
437             return 0;
438         }
439         break;
440     case AV_PIX_FMT_YUV440P10:
441     case AV_PIX_FMT_YUV440P12:
442         if (codec_caps & VPX_CODEC_CAP_HIGHBITDEPTH) {
443             enccfg->g_bit_depth = enccfg->g_input_bit_depth =
444                 avctx->pix_fmt == AV_PIX_FMT_YUV440P10 ? 10 : 12;
445             enccfg->g_profile = 3;
446             *img_fmt = VPX_IMG_FMT_I44016;
447             *flags |= VPX_CODEC_USE_HIGHBITDEPTH;
448             return 0;
449         }
450         break;
451     case AV_PIX_FMT_GBRP10:
452     case AV_PIX_FMT_GBRP12:
453         ctx->vpx_cs = VPX_CS_SRGB;
454     case AV_PIX_FMT_YUV444P10:
455     case AV_PIX_FMT_YUV444P12:
456         if (codec_caps & VPX_CODEC_CAP_HIGHBITDEPTH) {
457             enccfg->g_bit_depth = enccfg->g_input_bit_depth =
458                 avctx->pix_fmt == AV_PIX_FMT_YUV444P10 ||
459                 avctx->pix_fmt == AV_PIX_FMT_GBRP10 ? 10 : 12;
460             enccfg->g_profile = 3;
461             *img_fmt = VPX_IMG_FMT_I44416;
462             *flags |= VPX_CODEC_USE_HIGHBITDEPTH;
463             return 0;
464         }
465         break;
466     default:
467         break;
468     }
469     av_log(avctx, AV_LOG_ERROR, "Unsupported pixel format.\n");
470     return AVERROR_INVALIDDATA;
471 }
472
473 static void set_colorspace(AVCodecContext *avctx)
474 {
475     enum vpx_color_space vpx_cs;
476     VPxContext *ctx = avctx->priv_data;
477
478     if (ctx->vpx_cs) {
479         vpx_cs = ctx->vpx_cs;
480     } else {
481         switch (avctx->colorspace) {
482         case AVCOL_SPC_RGB:         vpx_cs = VPX_CS_SRGB;      break;
483         case AVCOL_SPC_BT709:       vpx_cs = VPX_CS_BT_709;    break;
484         case AVCOL_SPC_UNSPECIFIED: vpx_cs = VPX_CS_UNKNOWN;   break;
485         case AVCOL_SPC_RESERVED:    vpx_cs = VPX_CS_RESERVED;  break;
486         case AVCOL_SPC_BT470BG:     vpx_cs = VPX_CS_BT_601;    break;
487         case AVCOL_SPC_SMPTE170M:   vpx_cs = VPX_CS_SMPTE_170; break;
488         case AVCOL_SPC_SMPTE240M:   vpx_cs = VPX_CS_SMPTE_240; break;
489         case AVCOL_SPC_BT2020_NCL:  vpx_cs = VPX_CS_BT_2020;   break;
490         default:
491             av_log(avctx, AV_LOG_WARNING, "Unsupported colorspace (%d)\n",
492                    avctx->colorspace);
493             return;
494         }
495     }
496     codecctl_int(avctx, VP9E_SET_COLOR_SPACE, vpx_cs);
497 }
498
499 #if VPX_ENCODER_ABI_VERSION >= 11
500 static void set_color_range(AVCodecContext *avctx)
501 {
502     enum vpx_color_range vpx_cr;
503     switch (avctx->color_range) {
504     case AVCOL_RANGE_UNSPECIFIED:
505     case AVCOL_RANGE_MPEG:       vpx_cr = VPX_CR_STUDIO_RANGE; break;
506     case AVCOL_RANGE_JPEG:       vpx_cr = VPX_CR_FULL_RANGE;   break;
507     default:
508         av_log(avctx, AV_LOG_WARNING, "Unsupported color range (%d)\n",
509                avctx->color_range);
510         return;
511     }
512
513     codecctl_int(avctx, VP9E_SET_COLOR_RANGE, vpx_cr);
514 }
515 #endif
516 #endif
517
518 /**
519  * Set the target bitrate to VPX library default. Also set CRF to 32 if needed.
520  */
521 static void set_vp8_defaults(AVCodecContext *avctx,
522                              struct vpx_codec_enc_cfg *enccfg)
523 {
524     VPxContext *ctx = avctx->priv_data;
525     av_assert0(!avctx->bit_rate);
526     avctx->bit_rate = enccfg->rc_target_bitrate * 1000;
527     if (enccfg->rc_end_usage == VPX_CQ) {
528         av_log(avctx, AV_LOG_WARNING,
529                "Bitrate not specified for constrained quality mode, using default of %dkbit/sec\n",
530                enccfg->rc_target_bitrate);
531     } else {
532         enccfg->rc_end_usage = VPX_CQ;
533         ctx->crf = 32;
534         av_log(avctx, AV_LOG_WARNING,
535                "Neither bitrate nor constrained quality specified, using default CRF of %d and bitrate of %dkbit/sec\n",
536                ctx->crf, enccfg->rc_target_bitrate);
537     }
538 }
539
540
541 #if CONFIG_LIBVPX_VP9_ENCODER
542 /**
543  * Keep the target bitrate at 0 to engage constant quality mode. If CRF is not
544  * set, use 32.
545  */
546 static void set_vp9_defaults(AVCodecContext *avctx,
547                              struct vpx_codec_enc_cfg *enccfg)
548 {
549     VPxContext *ctx = avctx->priv_data;
550     av_assert0(!avctx->bit_rate);
551     if (enccfg->rc_end_usage != VPX_Q && ctx->lossless < 0) {
552         enccfg->rc_end_usage = VPX_Q;
553         ctx->crf = 32;
554         av_log(avctx, AV_LOG_WARNING,
555                "Neither bitrate nor constrained quality specified, using default CRF of %d\n",
556                ctx->crf);
557     }
558 }
559 #endif
560
561 /**
562  * Called when the bitrate is not set. It sets appropriate default values for
563  * bitrate and CRF.
564  */
565 static void set_vpx_defaults(AVCodecContext *avctx,
566                              struct vpx_codec_enc_cfg *enccfg)
567 {
568     av_assert0(!avctx->bit_rate);
569 #if CONFIG_LIBVPX_VP9_ENCODER
570     if (avctx->codec_id == AV_CODEC_ID_VP9) {
571         set_vp9_defaults(avctx, enccfg);
572         return;
573     }
574 #endif
575     set_vp8_defaults(avctx, enccfg);
576 }
577
578 static av_cold int vpx_init(AVCodecContext *avctx,
579                             const struct vpx_codec_iface *iface)
580 {
581     VPxContext *ctx = avctx->priv_data;
582     struct vpx_codec_enc_cfg enccfg = { 0 };
583     struct vpx_codec_enc_cfg enccfg_alpha;
584     vpx_codec_flags_t flags = (avctx->flags & AV_CODEC_FLAG_PSNR) ? VPX_CODEC_USE_PSNR : 0;
585     AVCPBProperties *cpb_props;
586     int res;
587     vpx_img_fmt_t img_fmt = VPX_IMG_FMT_I420;
588 #if CONFIG_LIBVPX_VP9_ENCODER
589     vpx_codec_caps_t codec_caps = vpx_codec_get_caps(iface);
590 #endif
591
592     av_log(avctx, AV_LOG_INFO, "%s\n", vpx_codec_version_str());
593     av_log(avctx, AV_LOG_VERBOSE, "%s\n", vpx_codec_build_config());
594
595     if (avctx->pix_fmt == AV_PIX_FMT_YUVA420P)
596         ctx->is_alpha = 1;
597
598     if ((res = vpx_codec_enc_config_default(iface, &enccfg, 0)) != VPX_CODEC_OK) {
599         av_log(avctx, AV_LOG_ERROR, "Failed to get config: %s\n",
600                vpx_codec_err_to_string(res));
601         return AVERROR(EINVAL);
602     }
603
604 #if CONFIG_LIBVPX_VP9_ENCODER
605     if (avctx->codec_id == AV_CODEC_ID_VP9) {
606         if (set_pix_fmt(avctx, codec_caps, &enccfg, &flags, &img_fmt))
607             return AVERROR(EINVAL);
608     }
609 #endif
610
611     if(!avctx->bit_rate)
612         if(avctx->rc_max_rate || avctx->rc_buffer_size || avctx->rc_initial_buffer_occupancy) {
613             av_log( avctx, AV_LOG_ERROR, "Rate control parameters set without a bitrate\n");
614             return AVERROR(EINVAL);
615         }
616
617     dump_enc_cfg(avctx, &enccfg);
618
619     enccfg.g_w            = avctx->width;
620     enccfg.g_h            = avctx->height;
621     enccfg.g_timebase.num = avctx->time_base.num;
622     enccfg.g_timebase.den = avctx->time_base.den;
623     enccfg.g_threads      =
624         FFMIN(avctx->thread_count ? avctx->thread_count : av_cpu_count(), 16);
625     enccfg.g_lag_in_frames= ctx->lag_in_frames;
626
627     if (avctx->flags & AV_CODEC_FLAG_PASS1)
628         enccfg.g_pass = VPX_RC_FIRST_PASS;
629     else if (avctx->flags & AV_CODEC_FLAG_PASS2)
630         enccfg.g_pass = VPX_RC_LAST_PASS;
631     else
632         enccfg.g_pass = VPX_RC_ONE_PASS;
633
634     if (avctx->rc_min_rate == avctx->rc_max_rate &&
635         avctx->rc_min_rate == avctx->bit_rate && avctx->bit_rate) {
636         enccfg.rc_end_usage = VPX_CBR;
637     } else if (ctx->crf >= 0) {
638         enccfg.rc_end_usage = VPX_CQ;
639 #if CONFIG_LIBVPX_VP9_ENCODER
640         if (!avctx->bit_rate && avctx->codec_id == AV_CODEC_ID_VP9)
641             enccfg.rc_end_usage = VPX_Q;
642 #endif
643     }
644
645     if (avctx->bit_rate) {
646         enccfg.rc_target_bitrate = av_rescale_rnd(avctx->bit_rate, 1, 1000,
647                                                   AV_ROUND_NEAR_INF);
648     } else {
649         // Set bitrate to default value. Also sets CRF to default if needed.
650         set_vpx_defaults(avctx, &enccfg);
651     }
652
653     if (avctx->codec_id == AV_CODEC_ID_VP9 && ctx->lossless == 1) {
654         enccfg.rc_min_quantizer =
655         enccfg.rc_max_quantizer = 0;
656     } else {
657         if (avctx->qmin >= 0)
658             enccfg.rc_min_quantizer = avctx->qmin;
659         if (avctx->qmax >= 0)
660             enccfg.rc_max_quantizer = avctx->qmax;
661     }
662
663     if (enccfg.rc_end_usage == VPX_CQ
664 #if CONFIG_LIBVPX_VP9_ENCODER
665         || enccfg.rc_end_usage == VPX_Q
666 #endif
667        ) {
668         if (ctx->crf < enccfg.rc_min_quantizer || ctx->crf > enccfg.rc_max_quantizer) {
669             av_log(avctx, AV_LOG_ERROR,
670                    "CQ level %d must be between minimum and maximum quantizer value (%d-%d)\n",
671                    ctx->crf, enccfg.rc_min_quantizer, enccfg.rc_max_quantizer);
672             return AVERROR(EINVAL);
673         }
674     }
675
676 #if FF_API_PRIVATE_OPT
677 FF_DISABLE_DEPRECATION_WARNINGS
678     if (avctx->frame_skip_threshold)
679         ctx->drop_threshold = avctx->frame_skip_threshold;
680 FF_ENABLE_DEPRECATION_WARNINGS
681 #endif
682     enccfg.rc_dropframe_thresh = ctx->drop_threshold;
683
684     //0-100 (0 => CBR, 100 => VBR)
685     enccfg.rc_2pass_vbr_bias_pct           = lrint(avctx->qcompress * 100);
686     if (avctx->bit_rate)
687         enccfg.rc_2pass_vbr_minsection_pct =
688             avctx->rc_min_rate * 100LL / avctx->bit_rate;
689     if (avctx->rc_max_rate)
690         enccfg.rc_2pass_vbr_maxsection_pct =
691             avctx->rc_max_rate * 100LL / avctx->bit_rate;
692 #if CONFIG_LIBVPX_VP9_ENCODER
693     if (avctx->codec_id == AV_CODEC_ID_VP9) {
694 #if VPX_ENCODER_ABI_VERSION >= 14
695         if (ctx->corpus_complexity >= 0)
696             enccfg.rc_2pass_vbr_corpus_complexity = ctx->corpus_complexity;
697 #endif
698     }
699 #endif
700
701     if (avctx->rc_buffer_size)
702         enccfg.rc_buf_sz         =
703             avctx->rc_buffer_size * 1000LL / avctx->bit_rate;
704     if (avctx->rc_initial_buffer_occupancy)
705         enccfg.rc_buf_initial_sz =
706             avctx->rc_initial_buffer_occupancy * 1000LL / avctx->bit_rate;
707     enccfg.rc_buf_optimal_sz     = enccfg.rc_buf_sz * 5 / 6;
708     if (ctx->rc_undershoot_pct >= 0)
709         enccfg.rc_undershoot_pct = ctx->rc_undershoot_pct;
710     if (ctx->rc_overshoot_pct >= 0)
711         enccfg.rc_overshoot_pct = ctx->rc_overshoot_pct;
712
713     //_enc_init() will balk if kf_min_dist differs from max w/VPX_KF_AUTO
714     if (avctx->keyint_min >= 0 && avctx->keyint_min == avctx->gop_size)
715         enccfg.kf_min_dist = avctx->keyint_min;
716     if (avctx->gop_size >= 0)
717         enccfg.kf_max_dist = avctx->gop_size;
718
719     if (enccfg.g_pass == VPX_RC_FIRST_PASS)
720         enccfg.g_lag_in_frames = 0;
721     else if (enccfg.g_pass == VPX_RC_LAST_PASS) {
722         int decode_size, ret;
723
724         if (!avctx->stats_in) {
725             av_log(avctx, AV_LOG_ERROR, "No stats file for second pass\n");
726             return AVERROR_INVALIDDATA;
727         }
728
729         ctx->twopass_stats.sz  = strlen(avctx->stats_in) * 3 / 4;
730         ret = av_reallocp(&ctx->twopass_stats.buf, ctx->twopass_stats.sz);
731         if (ret < 0) {
732             av_log(avctx, AV_LOG_ERROR,
733                    "Stat buffer alloc (%"SIZE_SPECIFIER" bytes) failed\n",
734                    ctx->twopass_stats.sz);
735             ctx->twopass_stats.sz = 0;
736             return ret;
737         }
738         decode_size = av_base64_decode(ctx->twopass_stats.buf, avctx->stats_in,
739                                        ctx->twopass_stats.sz);
740         if (decode_size < 0) {
741             av_log(avctx, AV_LOG_ERROR, "Stat buffer decode failed\n");
742             return AVERROR_INVALIDDATA;
743         }
744
745         ctx->twopass_stats.sz      = decode_size;
746         enccfg.rc_twopass_stats_in = ctx->twopass_stats;
747     }
748
749     /* 0-3: For non-zero values the encoder increasingly optimizes for reduced
750        complexity playback on low powered devices at the expense of encode
751        quality. */
752     if (avctx->profile != FF_PROFILE_UNKNOWN)
753         enccfg.g_profile = avctx->profile;
754
755     enccfg.g_error_resilient = ctx->error_resilient || ctx->flags & VP8F_ERROR_RESILIENT;
756
757     if (CONFIG_LIBVPX_VP8_ENCODER && avctx->codec_id == AV_CODEC_ID_VP8 && ctx->vp8_ts_parameters) {
758         AVDictionary *dict    = NULL;
759         AVDictionaryEntry* en = NULL;
760
761         if (!av_dict_parse_string(&dict, ctx->vp8_ts_parameters, "=", ":", 0)) {
762             while ((en = av_dict_get(dict, "", en, AV_DICT_IGNORE_SUFFIX))) {
763                 if (vp8_ts_param_parse(&enccfg, en->key, en->value) < 0)
764                     av_log(avctx, AV_LOG_WARNING,
765                            "Error parsing option '%s = %s'.\n",
766                            en->key, en->value);
767             }
768
769             av_dict_free(&dict);
770         }
771     }
772
773     dump_enc_cfg(avctx, &enccfg);
774     /* Construct Encoder Context */
775     res = vpx_codec_enc_init(&ctx->encoder, iface, &enccfg, flags);
776     if (res != VPX_CODEC_OK) {
777         log_encoder_error(avctx, "Failed to initialize encoder");
778         return AVERROR(EINVAL);
779     }
780
781     if (ctx->is_alpha) {
782         enccfg_alpha = enccfg;
783         res = vpx_codec_enc_init(&ctx->encoder_alpha, iface, &enccfg_alpha, flags);
784         if (res != VPX_CODEC_OK) {
785             log_encoder_error(avctx, "Failed to initialize alpha encoder");
786             return AVERROR(EINVAL);
787         }
788     }
789
790     //codec control failures are currently treated only as warnings
791     av_log(avctx, AV_LOG_DEBUG, "vpx_codec_control\n");
792     codecctl_int(avctx, VP8E_SET_CPUUSED,          ctx->cpu_used);
793     if (ctx->flags & VP8F_AUTO_ALT_REF)
794         ctx->auto_alt_ref = 1;
795     if (ctx->auto_alt_ref >= 0)
796         codecctl_int(avctx, VP8E_SET_ENABLEAUTOALTREF,
797                      avctx->codec_id == AV_CODEC_ID_VP8 ? !!ctx->auto_alt_ref : ctx->auto_alt_ref);
798     if (ctx->arnr_max_frames >= 0)
799         codecctl_int(avctx, VP8E_SET_ARNR_MAXFRAMES,   ctx->arnr_max_frames);
800     if (ctx->arnr_strength >= 0)
801         codecctl_int(avctx, VP8E_SET_ARNR_STRENGTH,    ctx->arnr_strength);
802     if (ctx->arnr_type >= 0)
803         codecctl_int(avctx, VP8E_SET_ARNR_TYPE,        ctx->arnr_type);
804     if (ctx->tune >= 0)
805         codecctl_int(avctx, VP8E_SET_TUNING,           ctx->tune);
806
807     if (ctx->auto_alt_ref && ctx->is_alpha && avctx->codec_id == AV_CODEC_ID_VP8) {
808         av_log(avctx, AV_LOG_ERROR, "Transparency encoding with auto_alt_ref does not work\n");
809         return AVERROR(EINVAL);
810     }
811
812     if (ctx->sharpness >= 0)
813         codecctl_int(avctx, VP8E_SET_SHARPNESS, ctx->sharpness);
814
815     if (CONFIG_LIBVPX_VP8_ENCODER && avctx->codec_id == AV_CODEC_ID_VP8) {
816 #if FF_API_PRIVATE_OPT
817 FF_DISABLE_DEPRECATION_WARNINGS
818         if (avctx->noise_reduction)
819             ctx->noise_sensitivity = avctx->noise_reduction;
820 FF_ENABLE_DEPRECATION_WARNINGS
821 #endif
822         codecctl_int(avctx, VP8E_SET_NOISE_SENSITIVITY, ctx->noise_sensitivity);
823         codecctl_int(avctx, VP8E_SET_TOKEN_PARTITIONS,  av_log2(avctx->slices));
824     }
825     codecctl_int(avctx, VP8E_SET_STATIC_THRESHOLD,  ctx->static_thresh);
826     if (ctx->crf >= 0)
827         codecctl_int(avctx, VP8E_SET_CQ_LEVEL,          ctx->crf);
828     if (ctx->max_intra_rate >= 0)
829         codecctl_int(avctx, VP8E_SET_MAX_INTRA_BITRATE_PCT, ctx->max_intra_rate);
830
831 #if CONFIG_LIBVPX_VP9_ENCODER
832     if (avctx->codec_id == AV_CODEC_ID_VP9) {
833         if (ctx->lossless >= 0)
834             codecctl_int(avctx, VP9E_SET_LOSSLESS, ctx->lossless);
835         if (ctx->tile_columns >= 0)
836             codecctl_int(avctx, VP9E_SET_TILE_COLUMNS, ctx->tile_columns);
837         if (ctx->tile_rows >= 0)
838             codecctl_int(avctx, VP9E_SET_TILE_ROWS, ctx->tile_rows);
839         if (ctx->frame_parallel >= 0)
840             codecctl_int(avctx, VP9E_SET_FRAME_PARALLEL_DECODING, ctx->frame_parallel);
841         if (ctx->aq_mode >= 0)
842             codecctl_int(avctx, VP9E_SET_AQ_MODE, ctx->aq_mode);
843         set_colorspace(avctx);
844 #if VPX_ENCODER_ABI_VERSION >= 11
845         set_color_range(avctx);
846 #endif
847 #if VPX_ENCODER_ABI_VERSION >= 12
848         codecctl_int(avctx, VP9E_SET_TARGET_LEVEL, ctx->level < 0 ? 255 : lrint(ctx->level * 10));
849 #endif
850 #ifdef VPX_CTRL_VP9E_SET_ROW_MT
851         if (ctx->row_mt >= 0)
852             codecctl_int(avctx, VP9E_SET_ROW_MT, ctx->row_mt);
853 #endif
854 #ifdef VPX_CTRL_VP9E_SET_TUNE_CONTENT
855         if (ctx->tune_content >= 0)
856             codecctl_int(avctx, VP9E_SET_TUNE_CONTENT, ctx->tune_content);
857 #endif
858 #ifdef VPX_CTRL_VP9E_SET_TPL
859         if (ctx->tpl_model >= 0)
860             codecctl_int(avctx, VP9E_SET_TPL, ctx->tpl_model);
861 #endif
862     }
863 #endif
864
865     av_log(avctx, AV_LOG_DEBUG, "Using deadline: %d\n", ctx->deadline);
866
867     //provide dummy value to initialize wrapper, values will be updated each _encode()
868     vpx_img_wrap(&ctx->rawimg, img_fmt, avctx->width, avctx->height, 1,
869                  (unsigned char*)1);
870 #if CONFIG_LIBVPX_VP9_ENCODER
871     if (avctx->codec_id == AV_CODEC_ID_VP9 && (codec_caps & VPX_CODEC_CAP_HIGHBITDEPTH))
872         ctx->rawimg.bit_depth = enccfg.g_bit_depth;
873 #endif
874
875     if (ctx->is_alpha)
876         vpx_img_wrap(&ctx->rawimg_alpha, VPX_IMG_FMT_I420, avctx->width, avctx->height, 1,
877                      (unsigned char*)1);
878
879     cpb_props = ff_add_cpb_side_data(avctx);
880     if (!cpb_props)
881         return AVERROR(ENOMEM);
882
883     if (enccfg.rc_end_usage == VPX_CBR ||
884         enccfg.g_pass != VPX_RC_ONE_PASS) {
885         cpb_props->max_bitrate = avctx->rc_max_rate;
886         cpb_props->min_bitrate = avctx->rc_min_rate;
887         cpb_props->avg_bitrate = avctx->bit_rate;
888     }
889     cpb_props->buffer_size = avctx->rc_buffer_size;
890
891     return 0;
892 }
893
894 static inline void cx_pktcpy(struct FrameListData *dst,
895                              const struct vpx_codec_cx_pkt *src,
896                              const struct vpx_codec_cx_pkt *src_alpha,
897                              VPxContext *ctx)
898 {
899     dst->pts      = src->data.frame.pts;
900     dst->duration = src->data.frame.duration;
901     dst->flags    = src->data.frame.flags;
902     dst->sz       = src->data.frame.sz;
903     dst->buf      = src->data.frame.buf;
904     dst->have_sse = 0;
905     /* For alt-ref frame, don't store PSNR or increment frame_number */
906     if (!(dst->flags & VPX_FRAME_IS_INVISIBLE)) {
907         dst->frame_number = ++ctx->frame_number;
908         dst->have_sse = ctx->have_sse;
909         if (ctx->have_sse) {
910             /* associate last-seen SSE to the frame. */
911             /* Transfers ownership from ctx to dst. */
912             /* WARNING! This makes the assumption that PSNR_PKT comes
913                just before the frame it refers to! */
914             memcpy(dst->sse, ctx->sse, sizeof(dst->sse));
915             ctx->have_sse = 0;
916         }
917     } else {
918         dst->frame_number = -1;   /* sanity marker */
919     }
920     if (src_alpha) {
921         dst->buf_alpha = src_alpha->data.frame.buf;
922         dst->sz_alpha = src_alpha->data.frame.sz;
923     } else {
924         dst->buf_alpha = NULL;
925         dst->sz_alpha = 0;
926     }
927 }
928
929 /**
930  * Store coded frame information in format suitable for return from encode2().
931  *
932  * Write information from @a cx_frame to @a pkt
933  * @return packet data size on success
934  * @return a negative AVERROR on error
935  */
936 static int storeframe(AVCodecContext *avctx, struct FrameListData *cx_frame,
937                       AVPacket *pkt)
938 {
939     int ret = ff_alloc_packet2(avctx, pkt, cx_frame->sz, 0);
940     uint8_t *side_data;
941     if (ret >= 0) {
942         int pict_type;
943         memcpy(pkt->data, cx_frame->buf, pkt->size);
944         pkt->pts = pkt->dts = cx_frame->pts;
945 #if FF_API_CODED_FRAME
946 FF_DISABLE_DEPRECATION_WARNINGS
947         avctx->coded_frame->pts       = cx_frame->pts;
948         avctx->coded_frame->key_frame = !!(cx_frame->flags & VPX_FRAME_IS_KEY);
949 FF_ENABLE_DEPRECATION_WARNINGS
950 #endif
951
952         if (!!(cx_frame->flags & VPX_FRAME_IS_KEY)) {
953             pict_type = AV_PICTURE_TYPE_I;
954 #if FF_API_CODED_FRAME
955 FF_DISABLE_DEPRECATION_WARNINGS
956             avctx->coded_frame->pict_type = pict_type;
957 FF_ENABLE_DEPRECATION_WARNINGS
958 #endif
959             pkt->flags |= AV_PKT_FLAG_KEY;
960         } else {
961             pict_type = AV_PICTURE_TYPE_P;
962 #if FF_API_CODED_FRAME
963 FF_DISABLE_DEPRECATION_WARNINGS
964             avctx->coded_frame->pict_type = pict_type;
965 FF_ENABLE_DEPRECATION_WARNINGS
966 #endif
967         }
968
969         ff_side_data_set_encoder_stats(pkt, 0, cx_frame->sse + 1,
970                                        cx_frame->have_sse ? 3 : 0, pict_type);
971
972         if (cx_frame->have_sse) {
973             int i;
974             /* Beware of the Y/U/V/all order! */
975 #if FF_API_CODED_FRAME
976 FF_DISABLE_DEPRECATION_WARNINGS
977             avctx->coded_frame->error[0] = cx_frame->sse[1];
978             avctx->coded_frame->error[1] = cx_frame->sse[2];
979             avctx->coded_frame->error[2] = cx_frame->sse[3];
980             avctx->coded_frame->error[3] = 0;    // alpha
981 FF_ENABLE_DEPRECATION_WARNINGS
982 #endif
983             for (i = 0; i < 3; ++i) {
984                 avctx->error[i] += cx_frame->sse[i + 1];
985             }
986             cx_frame->have_sse = 0;
987         }
988         if (cx_frame->sz_alpha > 0) {
989             side_data = av_packet_new_side_data(pkt,
990                                                 AV_PKT_DATA_MATROSKA_BLOCKADDITIONAL,
991                                                 cx_frame->sz_alpha + 8);
992             if(!side_data) {
993                 av_packet_unref(pkt);
994                 av_free(pkt);
995                 return AVERROR(ENOMEM);
996             }
997             AV_WB64(side_data, 1);
998             memcpy(side_data + 8, cx_frame->buf_alpha, cx_frame->sz_alpha);
999         }
1000     } else {
1001         return ret;
1002     }
1003     return pkt->size;
1004 }
1005
1006 /**
1007  * Queue multiple output frames from the encoder, returning the front-most.
1008  * In cases where vpx_codec_get_cx_data() returns more than 1 frame append
1009  * the frame queue. Return the head frame if available.
1010  * @return Stored frame size
1011  * @return AVERROR(EINVAL) on output size error
1012  * @return AVERROR(ENOMEM) on coded frame queue data allocation error
1013  */
1014 static int queue_frames(AVCodecContext *avctx, AVPacket *pkt_out)
1015 {
1016     VPxContext *ctx = avctx->priv_data;
1017     const struct vpx_codec_cx_pkt *pkt;
1018     const struct vpx_codec_cx_pkt *pkt_alpha = NULL;
1019     const void *iter = NULL;
1020     const void *iter_alpha = NULL;
1021     int size = 0;
1022
1023     if (ctx->coded_frame_list) {
1024         struct FrameListData *cx_frame = ctx->coded_frame_list;
1025         /* return the leading frame if we've already begun queueing */
1026         size = storeframe(avctx, cx_frame, pkt_out);
1027         if (size < 0)
1028             return size;
1029         ctx->coded_frame_list = cx_frame->next;
1030         free_coded_frame(cx_frame);
1031     }
1032
1033     /* consume all available output from the encoder before returning. buffers
1034        are only good through the next vpx_codec call */
1035     while ((pkt = vpx_codec_get_cx_data(&ctx->encoder, &iter)) &&
1036            (!ctx->is_alpha ||
1037             (pkt_alpha = vpx_codec_get_cx_data(&ctx->encoder_alpha, &iter_alpha)))) {
1038         switch (pkt->kind) {
1039         case VPX_CODEC_CX_FRAME_PKT:
1040             if (!size) {
1041                 struct FrameListData cx_frame;
1042
1043                 /* avoid storing the frame when the list is empty and we haven't yet
1044                    provided a frame for output */
1045                 av_assert0(!ctx->coded_frame_list);
1046                 cx_pktcpy(&cx_frame, pkt, pkt_alpha, ctx);
1047                 size = storeframe(avctx, &cx_frame, pkt_out);
1048                 if (size < 0)
1049                     return size;
1050             } else {
1051                 struct FrameListData *cx_frame =
1052                     av_malloc(sizeof(struct FrameListData));
1053
1054                 if (!cx_frame) {
1055                     av_log(avctx, AV_LOG_ERROR,
1056                            "Frame queue element alloc failed\n");
1057                     return AVERROR(ENOMEM);
1058                 }
1059                 cx_pktcpy(cx_frame, pkt, pkt_alpha, ctx);
1060                 cx_frame->buf = av_malloc(cx_frame->sz);
1061
1062                 if (!cx_frame->buf) {
1063                     av_log(avctx, AV_LOG_ERROR,
1064                            "Data buffer alloc (%"SIZE_SPECIFIER" bytes) failed\n",
1065                            cx_frame->sz);
1066                     av_freep(&cx_frame);
1067                     return AVERROR(ENOMEM);
1068                 }
1069                 memcpy(cx_frame->buf, pkt->data.frame.buf, pkt->data.frame.sz);
1070                 if (ctx->is_alpha) {
1071                     cx_frame->buf_alpha = av_malloc(cx_frame->sz_alpha);
1072                     if (!cx_frame->buf_alpha) {
1073                         av_log(avctx, AV_LOG_ERROR,
1074                                "Data buffer alloc (%"SIZE_SPECIFIER" bytes) failed\n",
1075                                cx_frame->sz_alpha);
1076                         av_free(cx_frame);
1077                         return AVERROR(ENOMEM);
1078                     }
1079                     memcpy(cx_frame->buf_alpha, pkt_alpha->data.frame.buf, pkt_alpha->data.frame.sz);
1080                 }
1081                 coded_frame_add(&ctx->coded_frame_list, cx_frame);
1082             }
1083             break;
1084         case VPX_CODEC_STATS_PKT: {
1085             struct vpx_fixed_buf *stats = &ctx->twopass_stats;
1086             int err;
1087             if ((err = av_reallocp(&stats->buf,
1088                                    stats->sz +
1089                                    pkt->data.twopass_stats.sz)) < 0) {
1090                 stats->sz = 0;
1091                 av_log(avctx, AV_LOG_ERROR, "Stat buffer realloc failed\n");
1092                 return err;
1093             }
1094             memcpy((uint8_t*)stats->buf + stats->sz,
1095                    pkt->data.twopass_stats.buf, pkt->data.twopass_stats.sz);
1096             stats->sz += pkt->data.twopass_stats.sz;
1097             break;
1098         }
1099         case VPX_CODEC_PSNR_PKT:
1100             av_assert0(!ctx->have_sse);
1101             ctx->sse[0] = pkt->data.psnr.sse[0];
1102             ctx->sse[1] = pkt->data.psnr.sse[1];
1103             ctx->sse[2] = pkt->data.psnr.sse[2];
1104             ctx->sse[3] = pkt->data.psnr.sse[3];
1105             ctx->have_sse = 1;
1106             break;
1107         case VPX_CODEC_CUSTOM_PKT:
1108             //ignore unsupported/unrecognized packet types
1109             break;
1110         }
1111     }
1112
1113     return size;
1114 }
1115
1116 static int set_roi_map(AVCodecContext *avctx, const AVFrameSideData *sd, int frame_width, int frame_height,
1117                        vpx_roi_map_t *roi_map, int block_size, int segment_cnt)
1118 {
1119     /**
1120      * range of vpx_roi_map_t.delta_q[i] is [-63, 63]
1121      */
1122 #define MAX_DELTA_Q 63
1123
1124     const AVRegionOfInterest *roi = NULL;
1125     int nb_rois;
1126     uint32_t self_size;
1127     int segment_id;
1128
1129     /* record the mapping from delta_q to "segment id + 1" in segment_mapping[].
1130      * the range of delta_q is [-MAX_DELTA_Q, MAX_DELTA_Q],
1131      * and its corresponding array index is [0, 2 * MAX_DELTA_Q],
1132      * and so the length of the mapping array is 2 * MAX_DELTA_Q + 1.
1133      * "segment id + 1", so we can say there's no mapping if the value of array element is zero.
1134      */
1135     int segment_mapping[2 * MAX_DELTA_Q + 1] = { 0 };
1136
1137     memset(roi_map, 0, sizeof(*roi_map));
1138
1139     /* segment id 0 in roi_map is reserved for the areas not covered by AVRegionOfInterest.
1140      * segment id 0 in roi_map is also for the areas with AVRegionOfInterest.qoffset near 0.
1141      * (delta_q of segment id 0 is 0).
1142      */
1143     segment_mapping[MAX_DELTA_Q] = 1;
1144     segment_id = 1;
1145
1146     roi = (const AVRegionOfInterest*)sd->data;
1147     self_size = roi->self_size;
1148     if (!self_size || sd->size % self_size) {
1149         av_log(avctx, AV_LOG_ERROR, "Invalid AVRegionOfInterest.self_size.\n");
1150         return AVERROR(EINVAL);
1151     }
1152     nb_rois = sd->size / self_size;
1153
1154     /* This list must be iterated from zero because regions are
1155      * defined in order of decreasing importance. So discard less
1156      * important areas if they exceed the segment count.
1157      */
1158     for (int i = 0; i < nb_rois; i++) {
1159         int delta_q;
1160         int mapping_index;
1161
1162         roi = (const AVRegionOfInterest*)(sd->data + self_size * i);
1163         if (!roi->qoffset.den) {
1164             av_log(avctx, AV_LOG_ERROR, "AVRegionOfInterest.qoffset.den must not be zero.\n");
1165             return AVERROR(EINVAL);
1166         }
1167
1168         delta_q = (int)(roi->qoffset.num * 1.0f / roi->qoffset.den * MAX_DELTA_Q);
1169         delta_q = av_clip(delta_q, -MAX_DELTA_Q, MAX_DELTA_Q);
1170
1171         mapping_index = delta_q + MAX_DELTA_Q;
1172         if (!segment_mapping[mapping_index]) {
1173             if (segment_id == segment_cnt) {
1174                 av_log(avctx, AV_LOG_WARNING,
1175                        "ROI only supports %d segments (and segment 0 is reserved for non-ROIs), skipping the left ones.\n",
1176                        segment_cnt);
1177                 break;
1178             }
1179
1180             segment_mapping[mapping_index] = segment_id + 1;
1181             roi_map->delta_q[segment_id] = delta_q;
1182             segment_id++;
1183         }
1184     }
1185
1186     roi_map->rows = (frame_height + block_size - 1) / block_size;
1187     roi_map->cols = (frame_width  + block_size - 1) / block_size;
1188     roi_map->roi_map = av_mallocz_array(roi_map->rows * roi_map->cols, sizeof(*roi_map->roi_map));
1189     if (!roi_map->roi_map) {
1190         av_log(avctx, AV_LOG_ERROR, "roi_map alloc failed.\n");
1191         return AVERROR(ENOMEM);
1192     }
1193
1194     /* This list must be iterated in reverse, so for the case that
1195      * two regions are overlapping, the more important area takes effect.
1196      */
1197     for (int i = nb_rois - 1; i >= 0; i--) {
1198         int delta_q;
1199         int mapping_value;
1200         int starty, endy, startx, endx;
1201
1202         roi = (const AVRegionOfInterest*)(sd->data + self_size * i);
1203
1204         starty = av_clip(roi->top / block_size, 0, roi_map->rows);
1205         endy   = av_clip((roi->bottom + block_size - 1) / block_size, 0, roi_map->rows);
1206         startx = av_clip(roi->left / block_size, 0, roi_map->cols);
1207         endx   = av_clip((roi->right + block_size - 1) / block_size, 0, roi_map->cols);
1208
1209         delta_q = (int)(roi->qoffset.num * 1.0f / roi->qoffset.den * MAX_DELTA_Q);
1210         delta_q = av_clip(delta_q, -MAX_DELTA_Q, MAX_DELTA_Q);
1211
1212         mapping_value = segment_mapping[delta_q + MAX_DELTA_Q];
1213         if (mapping_value) {
1214             for (int y = starty; y < endy; y++)
1215                 for (int x = startx; x < endx; x++)
1216                     roi_map->roi_map[x + y * roi_map->cols] = mapping_value - 1;
1217         }
1218     }
1219
1220     return 0;
1221 }
1222
1223 static int vp9_encode_set_roi(AVCodecContext *avctx, int frame_width, int frame_height, const AVFrameSideData *sd)
1224 {
1225     VPxContext *ctx = avctx->priv_data;
1226
1227 #ifdef VPX_CTRL_VP9E_SET_ROI_MAP
1228     int version = vpx_codec_version();
1229     int major = VPX_VERSION_MAJOR(version);
1230     int minor = VPX_VERSION_MINOR(version);
1231     int patch = VPX_VERSION_PATCH(version);
1232
1233     if (major > 1 || (major == 1 && minor > 8) || (major == 1 && minor == 8 && patch >= 1)) {
1234         vpx_roi_map_t roi_map;
1235         const int segment_cnt = 8;
1236         const int block_size = 8;
1237         int ret;
1238
1239         if (ctx->aq_mode > 0 || ctx->cpu_used < 5 || ctx->deadline != VPX_DL_REALTIME) {
1240             if (!ctx->roi_warned) {
1241                 ctx->roi_warned = 1;
1242                 av_log(avctx, AV_LOG_WARNING, "ROI is only enabled when aq_mode is 0, cpu_used >= 5 "
1243                                               "and deadline is REALTIME, so skipping ROI.\n");
1244                 return AVERROR(EINVAL);
1245             }
1246         }
1247
1248         ret = set_roi_map(avctx, sd, frame_width, frame_height, &roi_map, block_size, segment_cnt);
1249         if (ret) {
1250             log_encoder_error(avctx, "Failed to set_roi_map.\n");
1251             return ret;
1252         }
1253
1254         memset(roi_map.ref_frame, -1, sizeof(roi_map.ref_frame));
1255
1256         if (vpx_codec_control(&ctx->encoder, VP9E_SET_ROI_MAP, &roi_map)) {
1257             log_encoder_error(avctx, "Failed to set VP9E_SET_ROI_MAP codec control.\n");
1258             ret = AVERROR_INVALIDDATA;
1259         }
1260         av_freep(&roi_map.roi_map);
1261         return ret;
1262     }
1263 #endif
1264
1265     if (!ctx->roi_warned) {
1266         ctx->roi_warned = 1;
1267         av_log(avctx, AV_LOG_WARNING, "ROI is not supported, please upgrade libvpx to version >= 1.8.1. "
1268                                       "You may need to rebuild ffmpeg.\n");
1269     }
1270     return 0;
1271 }
1272
1273 static int vp8_encode_set_roi(AVCodecContext *avctx, int frame_width, int frame_height, const AVFrameSideData *sd)
1274 {
1275     vpx_roi_map_t roi_map;
1276     const int segment_cnt = 4;
1277     const int block_size = 16;
1278     VPxContext *ctx = avctx->priv_data;
1279
1280     int ret = set_roi_map(avctx, sd, frame_width, frame_height, &roi_map, block_size, segment_cnt);
1281     if (ret) {
1282         log_encoder_error(avctx, "Failed to set_roi_map.\n");
1283         return ret;
1284     }
1285
1286     if (vpx_codec_control(&ctx->encoder, VP8E_SET_ROI_MAP, &roi_map)) {
1287         log_encoder_error(avctx, "Failed to set VP8E_SET_ROI_MAP codec control.\n");
1288         ret = AVERROR_INVALIDDATA;
1289     }
1290
1291     av_freep(&roi_map.roi_map);
1292     return ret;
1293 }
1294
1295 static int vpx_encode(AVCodecContext *avctx, AVPacket *pkt,
1296                       const AVFrame *frame, int *got_packet)
1297 {
1298     VPxContext *ctx = avctx->priv_data;
1299     struct vpx_image *rawimg = NULL;
1300     struct vpx_image *rawimg_alpha = NULL;
1301     int64_t timestamp = 0;
1302     int res, coded_size;
1303     vpx_enc_frame_flags_t flags = 0;
1304
1305     if (frame) {
1306         const AVFrameSideData *sd = av_frame_get_side_data(frame, AV_FRAME_DATA_REGIONS_OF_INTEREST);
1307         rawimg                      = &ctx->rawimg;
1308         rawimg->planes[VPX_PLANE_Y] = frame->data[0];
1309         rawimg->planes[VPX_PLANE_U] = frame->data[1];
1310         rawimg->planes[VPX_PLANE_V] = frame->data[2];
1311         rawimg->stride[VPX_PLANE_Y] = frame->linesize[0];
1312         rawimg->stride[VPX_PLANE_U] = frame->linesize[1];
1313         rawimg->stride[VPX_PLANE_V] = frame->linesize[2];
1314         if (ctx->is_alpha) {
1315             uint8_t *u_plane, *v_plane;
1316             rawimg_alpha = &ctx->rawimg_alpha;
1317             rawimg_alpha->planes[VPX_PLANE_Y] = frame->data[3];
1318             u_plane = av_malloc(frame->linesize[1] * frame->height);
1319             v_plane = av_malloc(frame->linesize[2] * frame->height);
1320             if (!u_plane || !v_plane) {
1321                 av_free(u_plane);
1322                 av_free(v_plane);
1323                 return AVERROR(ENOMEM);
1324             }
1325             memset(u_plane, 0x80, frame->linesize[1] * frame->height);
1326             rawimg_alpha->planes[VPX_PLANE_U] = u_plane;
1327             memset(v_plane, 0x80, frame->linesize[2] * frame->height);
1328             rawimg_alpha->planes[VPX_PLANE_V] = v_plane;
1329             rawimg_alpha->stride[VPX_PLANE_Y] = frame->linesize[3];
1330             rawimg_alpha->stride[VPX_PLANE_U] = frame->linesize[1];
1331             rawimg_alpha->stride[VPX_PLANE_V] = frame->linesize[2];
1332         }
1333         timestamp                   = frame->pts;
1334 #if VPX_IMAGE_ABI_VERSION >= 4
1335         switch (frame->color_range) {
1336         case AVCOL_RANGE_MPEG:
1337             rawimg->range = VPX_CR_STUDIO_RANGE;
1338             break;
1339         case AVCOL_RANGE_JPEG:
1340             rawimg->range = VPX_CR_FULL_RANGE;
1341             break;
1342         }
1343 #endif
1344         if (frame->pict_type == AV_PICTURE_TYPE_I)
1345             flags |= VPX_EFLAG_FORCE_KF;
1346         if (CONFIG_LIBVPX_VP8_ENCODER && avctx->codec_id == AV_CODEC_ID_VP8 && frame->metadata) {
1347             AVDictionaryEntry* en = av_dict_get(frame->metadata, "vp8-flags", NULL, 0);
1348             if (en) {
1349                 flags |= strtoul(en->value, NULL, 10);
1350             }
1351         }
1352
1353         if (sd) {
1354             if (avctx->codec_id == AV_CODEC_ID_VP8) {
1355                 vp8_encode_set_roi(avctx, frame->width, frame->height, sd);
1356             } else {
1357                 vp9_encode_set_roi(avctx, frame->width, frame->height, sd);
1358             }
1359         }
1360     }
1361
1362     res = vpx_codec_encode(&ctx->encoder, rawimg, timestamp,
1363                            avctx->ticks_per_frame, flags, ctx->deadline);
1364     if (res != VPX_CODEC_OK) {
1365         log_encoder_error(avctx, "Error encoding frame");
1366         return AVERROR_INVALIDDATA;
1367     }
1368
1369     if (ctx->is_alpha) {
1370         res = vpx_codec_encode(&ctx->encoder_alpha, rawimg_alpha, timestamp,
1371                                avctx->ticks_per_frame, flags, ctx->deadline);
1372         if (res != VPX_CODEC_OK) {
1373             log_encoder_error(avctx, "Error encoding alpha frame");
1374             return AVERROR_INVALIDDATA;
1375         }
1376     }
1377
1378     coded_size = queue_frames(avctx, pkt);
1379
1380     if (!frame && avctx->flags & AV_CODEC_FLAG_PASS1) {
1381         unsigned int b64_size = AV_BASE64_SIZE(ctx->twopass_stats.sz);
1382
1383         avctx->stats_out = av_malloc(b64_size);
1384         if (!avctx->stats_out) {
1385             av_log(avctx, AV_LOG_ERROR, "Stat buffer alloc (%d bytes) failed\n",
1386                    b64_size);
1387             return AVERROR(ENOMEM);
1388         }
1389         av_base64_encode(avctx->stats_out, b64_size, ctx->twopass_stats.buf,
1390                          ctx->twopass_stats.sz);
1391     }
1392
1393     if (rawimg_alpha) {
1394         av_freep(&rawimg_alpha->planes[VPX_PLANE_U]);
1395         av_freep(&rawimg_alpha->planes[VPX_PLANE_V]);
1396     }
1397
1398     *got_packet = !!coded_size;
1399     return 0;
1400 }
1401
1402 #define OFFSET(x) offsetof(VPxContext, x)
1403 #define VE AV_OPT_FLAG_VIDEO_PARAM | AV_OPT_FLAG_ENCODING_PARAM
1404
1405 #define COMMON_OPTIONS \
1406     { "lag-in-frames",   "Number of frames to look ahead for " \
1407                          "alternate reference frame selection",    OFFSET(lag_in_frames),   AV_OPT_TYPE_INT, {.i64 = -1},      -1,      INT_MAX, VE}, \
1408     { "arnr-maxframes",  "altref noise reduction max frame count", OFFSET(arnr_max_frames), AV_OPT_TYPE_INT, {.i64 = -1},      -1,      INT_MAX, VE}, \
1409     { "arnr-strength",   "altref noise reduction filter strength", OFFSET(arnr_strength),   AV_OPT_TYPE_INT, {.i64 = -1},      -1,      INT_MAX, VE}, \
1410     { "arnr-type",       "altref noise reduction filter type",     OFFSET(arnr_type),       AV_OPT_TYPE_INT, {.i64 = -1},      -1,      INT_MAX, VE, "arnr_type"}, \
1411     { "backward",        NULL, 0, AV_OPT_TYPE_CONST, {.i64 = 1}, 0, 0, VE, "arnr_type" }, \
1412     { "forward",         NULL, 0, AV_OPT_TYPE_CONST, {.i64 = 2}, 0, 0, VE, "arnr_type" }, \
1413     { "centered",        NULL, 0, AV_OPT_TYPE_CONST, {.i64 = 3}, 0, 0, VE, "arnr_type" }, \
1414     { "tune",            "Tune the encoding to a specific scenario", OFFSET(tune),          AV_OPT_TYPE_INT, {.i64 = -1},      -1,      INT_MAX, VE, "tune"}, \
1415     { "psnr",            NULL, 0, AV_OPT_TYPE_CONST, {.i64 = VP8_TUNE_PSNR}, 0, 0, VE, "tune"}, \
1416     { "ssim",            NULL, 0, AV_OPT_TYPE_CONST, {.i64 = VP8_TUNE_SSIM}, 0, 0, VE, "tune"}, \
1417     { "deadline",        "Time to spend encoding, in microseconds.", OFFSET(deadline),      AV_OPT_TYPE_INT, {.i64 = VPX_DL_GOOD_QUALITY}, INT_MIN, INT_MAX, VE, "quality"}, \
1418     { "best",            NULL, 0, AV_OPT_TYPE_CONST, {.i64 = VPX_DL_BEST_QUALITY}, 0, 0, VE, "quality"}, \
1419     { "good",            NULL, 0, AV_OPT_TYPE_CONST, {.i64 = VPX_DL_GOOD_QUALITY}, 0, 0, VE, "quality"}, \
1420     { "realtime",        NULL, 0, AV_OPT_TYPE_CONST, {.i64 = VPX_DL_REALTIME},     0, 0, VE, "quality"}, \
1421     { "error-resilient", "Error resilience configuration", OFFSET(error_resilient), AV_OPT_TYPE_FLAGS, {.i64 = 0}, INT_MIN, INT_MAX, VE, "er"}, \
1422     { "max-intra-rate",  "Maximum I-frame bitrate (pct) 0=unlimited",  OFFSET(max_intra_rate),  AV_OPT_TYPE_INT,  {.i64 = -1}, -1,      INT_MAX, VE}, \
1423     { "default",         "Improve resiliency against losses of whole frames", 0, AV_OPT_TYPE_CONST, {.i64 = VPX_ERROR_RESILIENT_DEFAULT}, 0, 0, VE, "er"}, \
1424     { "partitions",      "The frame partitions are independently decodable " \
1425                          "by the bool decoder, meaning that partitions can be decoded even " \
1426                          "though earlier partitions have been lost. Note that intra predicition" \
1427                          " is still done over the partition boundary.",       0, AV_OPT_TYPE_CONST, {.i64 = VPX_ERROR_RESILIENT_PARTITIONS}, 0, 0, VE, "er"}, \
1428     { "crf",              "Select the quality for constant quality mode", offsetof(VPxContext, crf), AV_OPT_TYPE_INT, {.i64 = -1}, -1, 63, VE }, \
1429     { "static-thresh",    "A change threshold on blocks below which they will be skipped by the encoder", OFFSET(static_thresh), AV_OPT_TYPE_INT, { .i64 = 0 }, 0, INT_MAX, VE }, \
1430     { "drop-threshold",   "Frame drop threshold", offsetof(VPxContext, drop_threshold), AV_OPT_TYPE_INT, {.i64 = 0 }, INT_MIN, INT_MAX, VE }, \
1431     { "noise-sensitivity", "Noise sensitivity", OFFSET(noise_sensitivity), AV_OPT_TYPE_INT, {.i64 = 0 }, 0, 4, VE}, \
1432     { "undershoot-pct",  "Datarate undershoot (min) target (%)", OFFSET(rc_undershoot_pct), AV_OPT_TYPE_INT, { .i64 = -1 }, -1, 100, VE }, \
1433     { "overshoot-pct",   "Datarate overshoot (max) target (%)", OFFSET(rc_overshoot_pct), AV_OPT_TYPE_INT, { .i64 = -1 }, -1, 1000, VE }, \
1434
1435 #define LEGACY_OPTIONS \
1436     {"speed", "", offsetof(VPxContext, cpu_used), AV_OPT_TYPE_INT, {.i64 = 1}, -16, 16, VE}, \
1437     {"quality", "", offsetof(VPxContext, deadline), AV_OPT_TYPE_INT, {.i64 = VPX_DL_GOOD_QUALITY}, INT_MIN, INT_MAX, VE, "quality"}, \
1438     {"vp8flags", "", offsetof(VPxContext, flags), AV_OPT_TYPE_FLAGS, {.i64 = 0}, 0, UINT_MAX, VE, "flags"}, \
1439     {"error_resilient", "enable error resilience", 0, AV_OPT_TYPE_CONST, {.i64 = VP8F_ERROR_RESILIENT}, INT_MIN, INT_MAX, VE, "flags"}, \
1440     {"altref", "enable use of alternate reference frames (VP8/2-pass only)", 0, AV_OPT_TYPE_CONST, {.i64 = VP8F_AUTO_ALT_REF}, INT_MIN, INT_MAX, VE, "flags"}, \
1441     {"arnr_max_frames", "altref noise reduction max frame count", offsetof(VPxContext, arnr_max_frames), AV_OPT_TYPE_INT, {.i64 = 0}, 0, 15, VE}, \
1442     {"arnr_strength", "altref noise reduction filter strength", offsetof(VPxContext, arnr_strength), AV_OPT_TYPE_INT, {.i64 = 3}, 0, 6, VE}, \
1443     {"arnr_type", "altref noise reduction filter type", offsetof(VPxContext, arnr_type), AV_OPT_TYPE_INT, {.i64 = 3}, 1, 3, VE}, \
1444     {"rc_lookahead", "Number of frames to look ahead for alternate reference frame selection", offsetof(VPxContext, lag_in_frames), AV_OPT_TYPE_INT, {.i64 = 25}, 0, 25, VE}, \
1445     {"sharpness", "Increase sharpness at the expense of lower PSNR", offsetof(VPxContext, sharpness), AV_OPT_TYPE_INT, {.i64 = -1}, -1, 7, VE},
1446
1447 #if CONFIG_LIBVPX_VP8_ENCODER
1448 static const AVOption vp8_options[] = {
1449     COMMON_OPTIONS
1450     { "auto-alt-ref",    "Enable use of alternate reference "
1451                          "frames (2-pass only)",                        OFFSET(auto_alt_ref),    AV_OPT_TYPE_INT, {.i64 = -1}, -1,  2, VE},
1452     { "cpu-used",        "Quality/Speed ratio modifier",                OFFSET(cpu_used),        AV_OPT_TYPE_INT, {.i64 = 1}, -16, 16, VE},
1453     { "ts-parameters",   "Temporal scaling configuration using a "
1454                          ":-separated list of key=value parameters",    OFFSET(vp8_ts_parameters), AV_OPT_TYPE_STRING, {.str=NULL},  0,  0, VE},
1455     LEGACY_OPTIONS
1456     { NULL }
1457 };
1458 #endif
1459
1460 #if CONFIG_LIBVPX_VP9_ENCODER
1461 static const AVOption vp9_options[] = {
1462     COMMON_OPTIONS
1463     { "auto-alt-ref",    "Enable use of alternate reference "
1464                          "frames (2-pass only)",                        OFFSET(auto_alt_ref),    AV_OPT_TYPE_INT, {.i64 = -1}, -1, 6, VE},
1465     { "cpu-used",        "Quality/Speed ratio modifier",                OFFSET(cpu_used),        AV_OPT_TYPE_INT, {.i64 = 1},  -8, 8, VE},
1466     { "lossless",        "Lossless mode",                               OFFSET(lossless),        AV_OPT_TYPE_INT, {.i64 = -1}, -1, 1, VE},
1467     { "tile-columns",    "Number of tile columns to use, log2",         OFFSET(tile_columns),    AV_OPT_TYPE_INT, {.i64 = -1}, -1, 6, VE},
1468     { "tile-rows",       "Number of tile rows to use, log2",            OFFSET(tile_rows),       AV_OPT_TYPE_INT, {.i64 = -1}, -1, 2, VE},
1469     { "frame-parallel",  "Enable frame parallel decodability features", OFFSET(frame_parallel),  AV_OPT_TYPE_BOOL,{.i64 = -1}, -1, 1, VE},
1470 #if VPX_ENCODER_ABI_VERSION >= 12
1471     { "aq-mode",         "adaptive quantization mode",                  OFFSET(aq_mode),         AV_OPT_TYPE_INT, {.i64 = -1}, -1, 4, VE, "aq_mode"},
1472 #else
1473     { "aq-mode",         "adaptive quantization mode",                  OFFSET(aq_mode),         AV_OPT_TYPE_INT, {.i64 = -1}, -1, 3, VE, "aq_mode"},
1474 #endif
1475     { "none",            "Aq not used",         0, AV_OPT_TYPE_CONST, {.i64 = 0}, 0, 0, VE, "aq_mode" },
1476     { "variance",        "Variance based Aq",   0, AV_OPT_TYPE_CONST, {.i64 = 1}, 0, 0, VE, "aq_mode" },
1477     { "complexity",      "Complexity based Aq", 0, AV_OPT_TYPE_CONST, {.i64 = 2}, 0, 0, VE, "aq_mode" },
1478     { "cyclic",          "Cyclic Refresh Aq",   0, AV_OPT_TYPE_CONST, {.i64 = 3}, 0, 0, VE, "aq_mode" },
1479 #if VPX_ENCODER_ABI_VERSION >= 12
1480     { "equator360",      "360 video Aq",        0, AV_OPT_TYPE_CONST, {.i64 = 4}, 0, 0, VE, "aq_mode" },
1481     {"level", "Specify level", OFFSET(level), AV_OPT_TYPE_FLOAT, {.dbl=-1}, -1, 6.2, VE},
1482 #endif
1483 #ifdef VPX_CTRL_VP9E_SET_ROW_MT
1484     {"row-mt", "Row based multi-threading", OFFSET(row_mt), AV_OPT_TYPE_BOOL, {.i64 = -1}, -1, 1, VE},
1485 #endif
1486 #ifdef VPX_CTRL_VP9E_SET_TUNE_CONTENT
1487 #if VPX_ENCODER_ABI_VERSION >= 14
1488     { "tune-content",    "Tune content type", OFFSET(tune_content), AV_OPT_TYPE_INT, {.i64 = -1}, -1, 2, VE, "tune_content" },
1489 #else
1490     { "tune-content",    "Tune content type", OFFSET(tune_content), AV_OPT_TYPE_INT, {.i64 = -1}, -1, 1, VE, "tune_content" },
1491 #endif
1492     { "default",         "Regular video content",                  0, AV_OPT_TYPE_CONST, {.i64 = 0}, 0, 0, VE, "tune_content" },
1493     { "screen",          "Screen capture content",                 0, AV_OPT_TYPE_CONST, {.i64 = 1}, 0, 0, VE, "tune_content" },
1494 #if VPX_ENCODER_ABI_VERSION >= 14
1495     { "film",            "Film content; improves grain retention", 0, AV_OPT_TYPE_CONST, {.i64 = 2}, 0, 0, VE, "tune_content" },
1496 #endif
1497 #endif
1498 #if VPX_ENCODER_ABI_VERSION >= 14
1499     { "corpus-complexity", "corpus vbr complexity midpoint", OFFSET(corpus_complexity), AV_OPT_TYPE_INT, {.i64 = -1}, -1, 10000, VE },
1500 #endif
1501 #ifdef VPX_CTRL_VP9E_SET_TPL
1502     { "enable-tpl",      "Enable temporal dependency model", OFFSET(tpl_model), AV_OPT_TYPE_BOOL, {.i64 = -1}, -1, 1, VE },
1503 #endif
1504     LEGACY_OPTIONS
1505     { NULL }
1506 };
1507 #endif
1508
1509 #undef COMMON_OPTIONS
1510 #undef LEGACY_OPTIONS
1511
1512 static const AVCodecDefault defaults[] = {
1513     { "b",                 "0" },
1514     { "qmin",             "-1" },
1515     { "qmax",             "-1" },
1516     { "g",                "-1" },
1517     { "keyint_min",       "-1" },
1518     { NULL },
1519 };
1520
1521 #if CONFIG_LIBVPX_VP8_ENCODER
1522 static av_cold int vp8_init(AVCodecContext *avctx)
1523 {
1524     return vpx_init(avctx, vpx_codec_vp8_cx());
1525 }
1526
1527 static const AVClass class_vp8 = {
1528     .class_name = "libvpx-vp8 encoder",
1529     .item_name  = av_default_item_name,
1530     .option     = vp8_options,
1531     .version    = LIBAVUTIL_VERSION_INT,
1532 };
1533
1534 AVCodec ff_libvpx_vp8_encoder = {
1535     .name           = "libvpx",
1536     .long_name      = NULL_IF_CONFIG_SMALL("libvpx VP8"),
1537     .type           = AVMEDIA_TYPE_VIDEO,
1538     .id             = AV_CODEC_ID_VP8,
1539     .priv_data_size = sizeof(VPxContext),
1540     .init           = vp8_init,
1541     .encode2        = vpx_encode,
1542     .close          = vpx_free,
1543     .capabilities   = AV_CODEC_CAP_DELAY | AV_CODEC_CAP_AUTO_THREADS,
1544     .pix_fmts       = (const enum AVPixelFormat[]){ AV_PIX_FMT_YUV420P, AV_PIX_FMT_YUVA420P, AV_PIX_FMT_NONE },
1545     .priv_class     = &class_vp8,
1546     .defaults       = defaults,
1547     .wrapper_name   = "libvpx",
1548 };
1549 #endif /* CONFIG_LIBVPX_VP8_ENCODER */
1550
1551 #if CONFIG_LIBVPX_VP9_ENCODER
1552 static av_cold int vp9_init(AVCodecContext *avctx)
1553 {
1554     return vpx_init(avctx, vpx_codec_vp9_cx());
1555 }
1556
1557 static const AVClass class_vp9 = {
1558     .class_name = "libvpx-vp9 encoder",
1559     .item_name  = av_default_item_name,
1560     .option     = vp9_options,
1561     .version    = LIBAVUTIL_VERSION_INT,
1562 };
1563
1564 AVCodec ff_libvpx_vp9_encoder = {
1565     .name           = "libvpx-vp9",
1566     .long_name      = NULL_IF_CONFIG_SMALL("libvpx VP9"),
1567     .type           = AVMEDIA_TYPE_VIDEO,
1568     .id             = AV_CODEC_ID_VP9,
1569     .priv_data_size = sizeof(VPxContext),
1570     .init           = vp9_init,
1571     .encode2        = vpx_encode,
1572     .close          = vpx_free,
1573     .capabilities   = AV_CODEC_CAP_DELAY | AV_CODEC_CAP_AUTO_THREADS,
1574     .profiles       = NULL_IF_CONFIG_SMALL(ff_vp9_profiles),
1575     .priv_class     = &class_vp9,
1576     .defaults       = defaults,
1577     .init_static_data = ff_vp9_init_static,
1578     .wrapper_name   = "libvpx",
1579 };
1580 #endif /* CONFIG_LIBVPX_VP9_ENCODER */