vaapi_encode: Support VBR mode

[ffmpeg] / libavcodec / huffyuvenc.c
diff --git a/libavcodec/huffyuvenc.c b/libavcodec/huffyuvenc.c

index 678304460c65e7c8204f952d5bb611810e348bca..a6ffd240171075cc22ab1a558e384f4bb92610c2 100644 (file)
--- a/libavcodec/huffyuvenc.c
+++ b/libavcodec/huffyuvenc.c
@@ -26,9 +26,13 @@
   * huffyuv encoder
   */
  
+#include "libavutil/opt.h"
+
  #include "avcodec.h"
  #include "huffyuv.h"
  #include "huffman.h"
+#include "huffyuvencdsp.h"
+#include "internal.h"
  #include "put_bits.h"
  
  static inline int sub_left_prediction(HYuvContext *s, uint8_t *dst,
@@ -48,7 +52,7 @@ static inline int sub_left_prediction(HYuvContext *s, uint8_t *dst,
              dst[i] = temp - left;
              left   = temp;
          }
-        s->dsp.diff_bytes(dst + 16, src + 16, src + 15, w - 16);
+        s->hencdsp.diff_bytes(dst + 16, src + 16, src + 15, w - 16);
          return src[w-1];
      }
  }
@@ -80,7 +84,7 @@ static inline void sub_left_prediction_bgr32(HYuvContext *s, uint8_t *dst,
          a = at;
      }
  
-    s->dsp.diff_bytes(dst + 16, src + 16, src + 12, w * 4 - 16);
+    s->hencdsp.diff_bytes(dst + 16, src + 16, src + 12, w * 4 - 16);
  
      *red   = src[(w - 1) * 4 + R];
      *green = src[(w - 1) * 4 + G];
@@ -109,7 +113,7 @@ static inline void sub_left_prediction_rgb24(HYuvContext *s, uint8_t *dst,
          b = bt;
      }
  
-    s->dsp.diff_bytes(dst + 48, src + 48, src + 48 - 3, w * 3 - 48);
+    s->hencdsp.diff_bytes(dst + 48, src + 48, src + 48 - 3, w * 3 - 48);
  
      *red   = src[(w - 1) * 3 + 0];
      *green = src[(w - 1) * 3 + 1];
@@ -146,12 +150,27 @@ static av_cold int encode_init(AVCodecContext *avctx)
      int i, j;
  
      ff_huffyuv_common_init(avctx);
+    ff_huffyuvencdsp_init(&s->hencdsp);
  
      avctx->extradata = av_mallocz(1024*30); // 256*3+4 == 772
      avctx->stats_out = av_mallocz(1024*30); // 21*256*3(%llu ) + 3(\n) + 1(0) = 16132
      s->version = 2;
  
-    avctx->coded_frame = &s->picture;
+    if (!avctx->extradata || !avctx->stats_out)
+        return AVERROR(ENOMEM);
+
+#if FF_API_CODED_FRAME
+FF_DISABLE_DEPRECATION_WARNINGS
+    avctx->coded_frame->pict_type = AV_PICTURE_TYPE_I;
+    avctx->coded_frame->key_frame = 1;
+FF_ENABLE_DEPRECATION_WARNINGS
+#endif
+#if FF_API_PRIVATE_OPT
+FF_DISABLE_DEPRECATION_WARNINGS
+    if (avctx->context_model == 1)
+        s->context = avctx->context_model;
+FF_ENABLE_DEPRECATION_WARNINGS
+#endif
  
      switch (avctx->pix_fmt) {
      case AV_PIX_FMT_YUV420P:
@@ -174,17 +193,21 @@ static av_cold int encode_init(AVCodecContext *avctx)
      }
      avctx->bits_per_coded_sample = s->bitstream_bpp;
      s->decorrelate = s->bitstream_bpp >= 24;
-    s->predictor = avctx->prediction_method;
-    s->interlaced = avctx->flags&CODEC_FLAG_INTERLACED_ME ? 1 : 0;
-    if (avctx->context_model == 1) {
-        s->context = avctx->context_model;
-        if (s->flags & (CODEC_FLAG_PASS1|CODEC_FLAG_PASS2)) {
+#if FF_API_PRIVATE_OPT
+FF_DISABLE_DEPRECATION_WARNINGS
+    if (avctx->prediction_method)
+        s->predictor = avctx->prediction_method;
+FF_ENABLE_DEPRECATION_WARNINGS
+#endif
+    s->interlaced = avctx->flags & AV_CODEC_FLAG_INTERLACED_ME ? 1 : 0;
+    if (s->context) {
+        if (s->flags & (AV_CODEC_FLAG_PASS1 | AV_CODEC_FLAG_PASS2)) {
              av_log(avctx, AV_LOG_ERROR,
                     "context=1 is not compatible with "
                     "2 pass huffyuv encoding\n");
              return -1;
          }
-    }else s->context= 0;
+    }
  
      if (avctx->codec->id == AV_CODEC_ID_HUFFYUV) {
          if (avctx->pix_fmt == AV_PIX_FMT_YUV420P) {
@@ -193,12 +216,14 @@ static av_cold int encode_init(AVCodecContext *avctx)
                     "vcodec=ffvhuff or format=422p\n");
              return -1;
          }
-        if (avctx->context_model) {
+#if FF_API_PRIVATE_OPT
+        if (s->context) {
              av_log(avctx, AV_LOG_ERROR,
                     "Error: per-frame huffman tables are not supported "
                     "by huffyuv; use vcodec=ffvhuff\n");
              return -1;
          }
+#endif
          if (s->interlaced != ( s->height > 288 ))
              av_log(avctx, AV_LOG_INFO,
                     "using huffyuv 2.2.0 or newer interlacing flag\n");
@@ -297,7 +322,7 @@ static int encode_422_bitstream(HYuvContext *s, int offset, int count)
  
      count /= 2;
  
-    if (s->flags & CODEC_FLAG_PASS1) {
+    if (s->flags & AV_CODEC_FLAG_PASS1) {
          for(i = 0; i < count; i++) {
              LOAD4;
              s->stats[0][y0]++;
@@ -306,7 +331,7 @@ static int encode_422_bitstream(HYuvContext *s, int offset, int count)
              s->stats[2][v0]++;
          }
      }
-    if (s->avctx->flags2 & CODEC_FLAG2_NO_OUTPUT)
+    if (s->avctx->flags2 & AV_CODEC_FLAG2_NO_OUTPUT)
          return 0;
      if (s->context) {
          for (i = 0; i < count; i++) {
@@ -353,13 +378,13 @@ static int encode_gray_bitstream(HYuvContext *s, int count)
  
      count /= 2;
  
-    if (s->flags & CODEC_FLAG_PASS1) {
+    if (s->flags & AV_CODEC_FLAG_PASS1) {
          for (i = 0; i < count; i++) {
              LOAD2;
              STAT2;
          }
      }
-    if (s->avctx->flags2 & CODEC_FLAG2_NO_OUTPUT)
+    if (s->avctx->flags2 & AV_CODEC_FLAG2_NO_OUTPUT)
          return 0;
  
      if (s->context) {
@@ -407,13 +432,13 @@ static inline int encode_bgra_bitstream(HYuvContext *s, int count, int planes)
      if (planes == 4)                                                    \
          put_bits(&s->pb, s->len[2][a], s->bits[2][a]);
  
-    if ((s->flags & CODEC_FLAG_PASS1) &&
-        (s->avctx->flags2 & CODEC_FLAG2_NO_OUTPUT)) {
+    if ((s->flags & AV_CODEC_FLAG_PASS1) &&
+        (s->avctx->flags2 & AV_CODEC_FLAG2_NO_OUTPUT)) {
          for (i = 0; i < count; i++) {
              LOAD_GBRA;
              STAT_BGRA;
          }
-    } else if (s->context || (s->flags & CODEC_FLAG_PASS1)) {
+    } else if (s->context || (s->flags & AV_CODEC_FLAG_PASS1)) {
          for (i = 0; i < count; i++) {
              LOAD_GBRA;
              STAT_BGRA;
@@ -438,19 +463,15 @@ static int encode_frame(AVCodecContext *avctx, AVPacket *pkt,
      const int fake_ystride = s->interlaced ? pict->linesize[0]*2  : pict->linesize[0];
      const int fake_ustride = s->interlaced ? pict->linesize[1]*2  : pict->linesize[1];
      const int fake_vstride = s->interlaced ? pict->linesize[2]*2  : pict->linesize[2];
-    AVFrame * const p = &s->picture;
+    const AVFrame * const p = pict;
      int i, j, size = 0, ret;
  
      if (!pkt->data &&
-        (ret = av_new_packet(pkt, width * height * 3 * 4 + FF_MIN_BUFFER_SIZE)) < 0) {
+        (ret = av_new_packet(pkt, width * height * 3 * 4 + AV_INPUT_BUFFER_MIN_SIZE)) < 0) {
          av_log(avctx, AV_LOG_ERROR, "Error allocating output packet.\n");
          return ret;
      }
  
-    *p = *pict;
-    p->pict_type = AV_PICTURE_TYPE_I;
-    p->key_frame = 1;
-
      if (s->context) {
          for (i = 0; i < 3; i++) {
              ff_huff_gen_len_table(s->len[i], s->stats[i]);
@@ -502,9 +523,9 @@ static int encode_frame(AVCodecContext *avctx, AVPacket *pkt,
              lefttopy = p->data[0][3];
              lefttopu = p->data[1][1];
              lefttopv = p->data[2][1];
-            s->dsp.sub_hfyu_median_prediction(s->temp[0], p->data[0]+4, p->data[0] + fake_ystride + 4, width - 4 , &lefty, &lefttopy);
-            s->dsp.sub_hfyu_median_prediction(s->temp[1], p->data[1]+2, p->data[1] + fake_ustride + 2, width2 - 2, &leftu, &lefttopu);
-            s->dsp.sub_hfyu_median_prediction(s->temp[2], p->data[2]+2, p->data[2] + fake_vstride + 2, width2 - 2, &leftv, &lefttopv);
+            s->hencdsp.sub_hfyu_median_pred(s->temp[0], p->data[0] + 4, p->data[0] + fake_ystride + 4, width  - 4, &lefty, &lefttopy);
+            s->hencdsp.sub_hfyu_median_pred(s->temp[1], p->data[1] + 2, p->data[1] + fake_ustride + 2, width2 - 2, &leftu, &lefttopu);
+            s->hencdsp.sub_hfyu_median_pred(s->temp[2], p->data[2] + 2, p->data[2] + fake_vstride + 2, width2 - 2, &leftv, &lefttopv);
              encode_422_bitstream(s, 0, width - 4);
              y++; cy++;
  
@@ -514,7 +535,7 @@ static int encode_frame(AVCodecContext *avctx, AVPacket *pkt,
                  if (s->bitstream_bpp == 12) {
                      while (2 * cy > y) {
                          ydst = p->data[0] + p->linesize[0] * y;
-                        s->dsp.sub_hfyu_median_prediction(s->temp[0], ydst - fake_ystride, ydst, width , &lefty, &lefttopy);
+                        s->hencdsp.sub_hfyu_median_pred(s->temp[0], ydst - fake_ystride, ydst, width, &lefty, &lefttopy);
                          encode_gray_bitstream(s, width);
                          y++;
                      }
@@ -524,9 +545,9 @@ static int encode_frame(AVCodecContext *avctx, AVPacket *pkt,
                  udst = p->data[1] + p->linesize[1] * cy;
                  vdst = p->data[2] + p->linesize[2] * cy;
  
-                s->dsp.sub_hfyu_median_prediction(s->temp[0], ydst - fake_ystride, ydst, width , &lefty, &lefttopy);
-                s->dsp.sub_hfyu_median_prediction(s->temp[1], udst - fake_ustride, udst, width2, &leftu, &lefttopu);
-                s->dsp.sub_hfyu_median_prediction(s->temp[2], vdst - fake_vstride, vdst, width2, &leftv, &lefttopv);
+                s->hencdsp.sub_hfyu_median_pred(s->temp[0], ydst - fake_ystride, ydst, width,  &lefty, &lefttopy);
+                s->hencdsp.sub_hfyu_median_pred(s->temp[1], udst - fake_ustride, udst, width2, &leftu, &lefttopu);
+                s->hencdsp.sub_hfyu_median_pred(s->temp[2], vdst - fake_vstride, vdst, width2, &leftv, &lefttopv);
  
                  encode_422_bitstream(s, 0, width);
              }
@@ -539,7 +560,7 @@ static int encode_frame(AVCodecContext *avctx, AVPacket *pkt,
                      ydst = p->data[0] + p->linesize[0] * y;
  
                      if (s->predictor == PLANE && s->interlaced < y) {
-                        s->dsp.diff_bytes(s->temp[1], ydst, ydst - fake_ystride, width);
+                        s->hencdsp.diff_bytes(s->temp[1], ydst, ydst - fake_ystride, width);
  
                          lefty = sub_left_prediction(s, s->temp[0], s->temp[1], width , lefty);
                      } else {
@@ -555,9 +576,9 @@ static int encode_frame(AVCodecContext *avctx, AVPacket *pkt,
                  vdst = p->data[2] + p->linesize[2] * cy;
  
                  if (s->predictor == PLANE && s->interlaced < cy) {
-                    s->dsp.diff_bytes(s->temp[1], ydst, ydst - fake_ystride, width);
-                    s->dsp.diff_bytes(s->temp[2], udst, udst - fake_ustride, width2);
-                    s->dsp.diff_bytes(s->temp[2] + width2, vdst, vdst - fake_vstride, width2);
+                    s->hencdsp.diff_bytes(s->temp[1],          ydst, ydst - fake_ystride, width);
+                    s->hencdsp.diff_bytes(s->temp[2],          udst, udst - fake_ustride, width2);
+                    s->hencdsp.diff_bytes(s->temp[2] + width2, vdst, vdst - fake_vstride, width2);
  
                      lefty = sub_left_prediction(s, s->temp[0], s->temp[1], width , lefty);
                      leftu = sub_left_prediction(s, s->temp[1], s->temp[2], width2, leftu);
@@ -590,7 +611,7 @@ static int encode_frame(AVCodecContext *avctx, AVPacket *pkt,
          for (y = 1; y < s->height; y++) {
              uint8_t *dst = data + y*stride;
              if (s->predictor == PLANE && s->interlaced < y) {
-                s->dsp.diff_bytes(s->temp[1], dst, dst - fake_stride, width * 4);
+                s->hencdsp.diff_bytes(s->temp[1], dst, dst - fake_stride, width * 4);
                  sub_left_prediction_bgr32(s, s->temp[0], s->temp[1], width,
                                            &leftr, &leftg, &leftb, &lefta);
              } else {
@@ -618,8 +639,8 @@ static int encode_frame(AVCodecContext *avctx, AVPacket *pkt,
          for (y = 1; y < s->height; y++) {
              uint8_t *dst = data + y * stride;
              if (s->predictor == PLANE && s->interlaced < y) {
-                s->dsp.diff_bytes(s->temp[1], dst, dst - fake_stride,
-                                  width * 3);
+                s->hencdsp.diff_bytes(s->temp[1], dst, dst - fake_stride,
+                                      width * 3);
                  sub_left_prediction_rgb24(s, s->temp[0], s->temp[1], width,
                                            &leftr, &leftg, &leftb);
              } else {
@@ -638,7 +659,7 @@ static int encode_frame(AVCodecContext *avctx, AVPacket *pkt,
      put_bits(&s->pb, 15, 0);
      size /= 4;
  
-    if ((s->flags&CODEC_FLAG_PASS1) && (s->picture_number & 31) == 0) {
+    if ((s->flags & AV_CODEC_FLAG_PASS1) && (s->picture_number & 31) == 0) {
          int j;
          char *p = avctx->stats_out;
          char *end = p + 1024*30;
@@ -653,9 +674,9 @@ static int encode_frame(AVCodecContext *avctx, AVPacket *pkt,
          }
      } else
          avctx->stats_out[0] = '\0';
-    if (!(s->avctx->flags2 & CODEC_FLAG2_NO_OUTPUT)) {
+    if (!(s->avctx->flags2 & AV_CODEC_FLAG2_NO_OUTPUT)) {
          flush_put_bits(&s->pb);
-        s->dsp.bswap_buf((uint32_t*)pkt->data, (uint32_t*)pkt->data, size);
+        s->bdsp.bswap_buf((uint32_t *) pkt->data, (uint32_t *) pkt->data, size);
      }
  
      s->picture_number++;
@@ -679,12 +700,37 @@ static av_cold int encode_end(AVCodecContext *avctx)
      return 0;
  }
  
-#if CONFIG_HUFFYUV_ENCODER
+#define OFFSET(x) offsetof(HYuvContext, x)
+#define VE AV_OPT_FLAG_VIDEO_PARAM | AV_OPT_FLAG_ENCODING_PARAM
+
+#define HUFF_CLASS(variant)                  \
+static const AVClass variant ## _class = {   \
+    .class_name = # variant,                 \
+    .item_name  = av_default_item_name,      \
+    .option     = variant ## _options,       \
+    .version    = LIBAVUTIL_VERSION_INT,     \
+}
+
+#define FF_HUFFYUV_COMMON_OPTS \
+{ "pred", "Prediction method", OFFSET(predictor), AV_OPT_TYPE_INT, { .i64 = LEFT }, LEFT, MEDIAN, VE, "pred" }, \
+    { "left",   NULL, 0, AV_OPT_TYPE_CONST, { .i64 = LEFT },   INT_MIN, INT_MAX, VE, "pred" }, \
+    { "plane",  NULL, 0, AV_OPT_TYPE_CONST, { .i64 = PLANE },  INT_MIN, INT_MAX, VE, "pred" }, \
+    { "median", NULL, 0, AV_OPT_TYPE_CONST, { .i64 = MEDIAN }, INT_MIN, INT_MAX, VE, "pred" }
+
+static const AVOption huffyuv_options[] = {
+    FF_HUFFYUV_COMMON_OPTS,
+    { NULL},
+};
+
+HUFF_CLASS(huffyuv);
+
  AVCodec ff_huffyuv_encoder = {
      .name           = "huffyuv",
+    .long_name      = NULL_IF_CONFIG_SMALL("Huffyuv / HuffYUV"),
      .type           = AVMEDIA_TYPE_VIDEO,
      .id             = AV_CODEC_ID_HUFFYUV,
      .priv_data_size = sizeof(HYuvContext),
+    .priv_class     = &huffyuv_class,
      .init           = encode_init,
      .encode2        = encode_frame,
      .close          = encode_end,
@@ -692,16 +738,26 @@ AVCodec ff_huffyuv_encoder = {
          AV_PIX_FMT_YUV422P, AV_PIX_FMT_RGB24,
          AV_PIX_FMT_RGB32, AV_PIX_FMT_NONE
      },
-    .long_name      = NULL_IF_CONFIG_SMALL("Huffyuv / HuffYUV"),
+    .caps_internal  = FF_CODEC_CAP_INIT_THREADSAFE |
+                      FF_CODEC_CAP_INIT_CLEANUP,
  };
-#endif
  
  #if CONFIG_FFVHUFF_ENCODER
+static const AVOption ffhuffyuv_options[] = {
+    FF_HUFFYUV_COMMON_OPTS,
+    { "context", "Set per-frame huffman tables", OFFSET(context), AV_OPT_TYPE_INT, { .i64 = 0 }, 0, 1, VE },
+    { NULL }
+};
+
+HUFF_CLASS(ffhuffyuv);
+
  AVCodec ff_ffvhuff_encoder = {
      .name           = "ffvhuff",
+    .long_name      = NULL_IF_CONFIG_SMALL("Huffyuv FFmpeg variant"),
      .type           = AVMEDIA_TYPE_VIDEO,
      .id             = AV_CODEC_ID_FFVHUFF,
      .priv_data_size = sizeof(HYuvContext),
+    .priv_class     = &ffhuffyuv_class,
      .init           = encode_init,
      .encode2        = encode_frame,
      .close          = encode_end,
@@ -709,6 +765,7 @@ AVCodec ff_ffvhuff_encoder = {
          AV_PIX_FMT_YUV420P, AV_PIX_FMT_YUV422P, AV_PIX_FMT_RGB24,
          AV_PIX_FMT_RGB32, AV_PIX_FMT_NONE
      },
-    .long_name      = NULL_IF_CONFIG_SMALL("Huffyuv FFmpeg variant"),
+    .caps_internal  = FF_CODEC_CAP_INIT_THREADSAFE |
+                      FF_CODEC_CAP_INIT_CLEANUP,
  };
  #endif