git.sesse.net Git - ffmpeg/blob - libavfilter/vf_zoompan.c

   1 /*
   2  * Copyright (c) 2013 Paul B Mahol
   3  *
   4  * This file is part of FFmpeg.
   5  *
   6  * FFmpeg is free software; you can redistribute it and/or
   7  * modify it under the terms of the GNU Lesser General Public
   8  * License as published by the Free Software Foundation; either
   9  * version 2.1 of the License, or (at your option) any later version.
  10  *
  11  * FFmpeg is distributed in the hope that it will be useful,
  12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
  13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
  14  * Lesser General Public License for more details.
  15  *
  16  * You should have received a copy of the GNU Lesser General Public
  17  * License along with FFmpeg; if not, write to the Free Software
  18  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
  19  */
  20
  21 #include "libavutil/avassert.h"
  22 #include "libavutil/eval.h"
  23 #include "libavutil/opt.h"
  24 #include "libavutil/pixdesc.h"
  25 #include "avfilter.h"
  26 #include "formats.h"
  27 #include "internal.h"
  28 #include "video.h"
  29 #include "libswscale/swscale.h"
  30
  31 static const char *const var_names[] = {
  32     "in_w",   "iw",
  33     "in_h",   "ih",
  34     "out_w",  "ow",
  35     "out_h",  "oh",
  36     "in",
  37     "on",
  38     "duration",
  39     "pduration",
  40     "time",
  41     "frame",
  42     "zoom",
  43     "pzoom",
  44     "x", "px",
  45     "y", "py",
  46     "a",
  47     "sar",
  48     "dar",
  49     "hsub",
  50     "vsub",
  51     NULL
  52 };
  53
  54 enum var_name {
  55     VAR_IN_W,   VAR_IW,
  56     VAR_IN_H,   VAR_IH,
  57     VAR_OUT_W,  VAR_OW,
  58     VAR_OUT_H,  VAR_OH,
  59     VAR_IN,
  60     VAR_ON,
  61     VAR_DURATION,
  62     VAR_PDURATION,
  63     VAR_TIME,
  64     VAR_FRAME,
  65     VAR_ZOOM,
  66     VAR_PZOOM,
  67     VAR_X, VAR_PX,
  68     VAR_Y, VAR_PY,
  69     VAR_A,
  70     VAR_SAR,
  71     VAR_DAR,
  72     VAR_HSUB,
  73     VAR_VSUB,
  74     VARS_NB
  75 };
  76
  77 typedef struct ZPcontext {
  78     const AVClass *class;
  79     char *zoom_expr_str;
  80     char *x_expr_str;
  81     char *y_expr_str;
  82     char *duration_expr_str;
  83     int w, h;
  84     double x, y;
  85     double prev_zoom;
  86     int prev_nb_frames;
  87     struct SwsContext *sws;
  88     int64_t frame_count;
  89     const AVPixFmtDescriptor *desc;
  90     AVFrame *in;
  91     double var_values[VARS_NB];
  92     int nb_frames;
  93     int current_frame;
  94     int finished;
  95     AVRational framerate;
  96 } ZPContext;
  97
  98 #define OFFSET(x) offsetof(ZPContext, x)
  99 #define FLAGS AV_OPT_FLAG_VIDEO_PARAM|AV_OPT_FLAG_FILTERING_PARAM
 100 static const AVOption zoompan_options[] = {
 101     { "zoom", "set the zoom expression", OFFSET(zoom_expr_str), AV_OPT_TYPE_STRING, {.str = "1" }, .flags = FLAGS },
 102     { "z", "set the zoom expression", OFFSET(zoom_expr_str), AV_OPT_TYPE_STRING, {.str = "1" }, .flags = FLAGS },
 103     { "x", "set the x expression", OFFSET(x_expr_str), AV_OPT_TYPE_STRING, {.str="0"}, .flags = FLAGS },
 104     { "y", "set the y expression", OFFSET(y_expr_str), AV_OPT_TYPE_STRING, {.str="0"}, .flags = FLAGS },
 105     { "d", "set the duration expression", OFFSET(duration_expr_str), AV_OPT_TYPE_STRING, {.str="90"}, .flags = FLAGS },
 106     { "s", "set the output image size", OFFSET(w), AV_OPT_TYPE_IMAGE_SIZE, {.str="hd720"}, .flags = FLAGS },
 107     { "fps", "set the output framerate", OFFSET(framerate), AV_OPT_TYPE_VIDEO_RATE, { .str = "25" }, 0, INT_MAX, .flags = FLAGS },
 108     { NULL }
 109 };
 110
 111 AVFILTER_DEFINE_CLASS(zoompan);
 112
 113 static av_cold int init(AVFilterContext *ctx)
 114 {
 115     ZPContext *s = ctx->priv;
 116
 117     s->prev_zoom = 1;
 118     return 0;
 119 }
 120
 121 static int config_output(AVFilterLink *outlink)
 122 {
 123     AVFilterContext *ctx = outlink->src;
 124     ZPContext *s = ctx->priv;
 125
 126     outlink->w = s->w;
 127     outlink->h = s->h;
 128     outlink->time_base = av_inv_q(s->framerate);
 129     outlink->frame_rate = s->framerate;
 130     s->desc = av_pix_fmt_desc_get(outlink->format);
 131
 132     return 0;
 133 }
 134
 135 static int output_single_frame(AVFilterContext *ctx, AVFrame *in, double *var_values, int i,
 136                                double *zoom, double *dx, double *dy)
 137 {
 138     ZPContext *s = ctx->priv;
 139     AVFilterLink *outlink = ctx->outputs[0];
 140     int64_t pts = s->frame_count;
 141     int k, x, y, w, h, ret = 0;
 142     uint8_t *input[4];
 143     int px[4], py[4];
 144     AVFrame *out;
 145
 146     var_values[VAR_TIME] = pts * av_q2d(outlink->time_base);
 147     var_values[VAR_FRAME] = i;
 148     var_values[VAR_ON] = outlink->frame_count + 1;
 149     if ((ret = av_expr_parse_and_eval(zoom, s->zoom_expr_str,
 150                                       var_names, var_values,
 151                                       NULL, NULL, NULL, NULL, NULL, 0, ctx)) < 0)
 152         return ret;
 153
 154     *zoom = av_clipd(*zoom, 1, 10);
 155     var_values[VAR_ZOOM] = *zoom;
 156     w = in->width * (1.0 / *zoom);
 157     h = in->height * (1.0 / *zoom);
 158
 159     if ((ret = av_expr_parse_and_eval(dx, s->x_expr_str,
 160                                       var_names, var_values,
 161                                       NULL, NULL, NULL, NULL, NULL, 0, ctx)) < 0)
 162         return ret;
 163     x = *dx = av_clipd(*dx, 0, FFMAX(in->width - w, 0));
 164     var_values[VAR_X] = *dx;
 165     x &= ~((1 << s->desc->log2_chroma_w) - 1);
 166
 167     if ((ret = av_expr_parse_and_eval(dy, s->y_expr_str,
 168                                       var_names, var_values,
 169                                       NULL, NULL, NULL, NULL, NULL, 0, ctx)) < 0)
 170         return ret;
 171     y = *dy = av_clipd(*dy, 0, FFMAX(in->height - h, 0));
 172     var_values[VAR_Y] = *dy;
 173     y &= ~((1 << s->desc->log2_chroma_h) - 1);
 174
 175     out = ff_get_video_buffer(outlink, outlink->w, outlink->h);
 176     if (!out) {
 177         ret = AVERROR(ENOMEM);
 178         return ret;
 179     }
 180
 181     px[1] = px[2] = AV_CEIL_RSHIFT(x, s->desc->log2_chroma_w);
 182     px[0] = px[3] = x;
 183
 184     py[1] = py[2] = AV_CEIL_RSHIFT(y, s->desc->log2_chroma_h);
 185     py[0] = py[3] = y;
 186
 187     s->sws = sws_alloc_context();
 188     if (!s->sws) {
 189         ret = AVERROR(ENOMEM);
 190         return ret;
 191     }
 192
 193     for (k = 0; in->data[k]; k++)
 194         input[k] = in->data[k] + py[k] * in->linesize[k] + px[k];
 195
 196     av_opt_set_int(s->sws, "srcw", w, 0);
 197     av_opt_set_int(s->sws, "srch", h, 0);
 198     av_opt_set_int(s->sws, "src_format", in->format, 0);
 199     av_opt_set_int(s->sws, "dstw", outlink->w, 0);
 200     av_opt_set_int(s->sws, "dsth", outlink->h, 0);
 201     av_opt_set_int(s->sws, "dst_format", outlink->format, 0);
 202     av_opt_set_int(s->sws, "sws_flags", SWS_BICUBIC, 0);
 203
 204     if ((ret = sws_init_context(s->sws, NULL, NULL)) < 0)
 205         return ret;
 206
 207     sws_scale(s->sws, (const uint8_t *const *)&input, in->linesize, 0, h, out->data, out->linesize);
 208
 209     out->pts = pts;
 210     s->frame_count++;
 211
 212     ret = ff_filter_frame(outlink, out);
 213     sws_freeContext(s->sws);
 214     s->sws = NULL;
 215     s->current_frame++;
 216     return ret;
 217 }
 218
 219 static int filter_frame(AVFilterLink *inlink, AVFrame *in)
 220 {
 221     AVFilterContext *ctx = inlink->dst;
 222     AVFilterLink *outlink = ctx->outputs[0];
 223     ZPContext *s = ctx->priv;
 224     double nb_frames;
 225     int ret;
 226
 227     av_assert0(s->in == NULL);
 228
 229     s->finished = 0;
 230     s->var_values[VAR_IN_W]  = s->var_values[VAR_IW] = in->width;
 231     s->var_values[VAR_IN_H]  = s->var_values[VAR_IH] = in->height;
 232     s->var_values[VAR_OUT_W] = s->var_values[VAR_OW] = s->w;
 233     s->var_values[VAR_OUT_H] = s->var_values[VAR_OH] = s->h;
 234     s->var_values[VAR_IN]    = inlink->frame_count + 1;
 235     s->var_values[VAR_ON]    = outlink->frame_count + 1;
 236     s->var_values[VAR_PX]    = s->x;
 237     s->var_values[VAR_PY]    = s->y;
 238     s->var_values[VAR_X]     = 0;
 239     s->var_values[VAR_Y]     = 0;
 240     s->var_values[VAR_PZOOM] = s->prev_zoom;
 241     s->var_values[VAR_ZOOM]  = 1;
 242     s->var_values[VAR_PDURATION] = s->prev_nb_frames;
 243     s->var_values[VAR_A]     = (double) in->width / in->height;
 244     s->var_values[VAR_SAR]   = inlink->sample_aspect_ratio.num ?
 245         (double) inlink->sample_aspect_ratio.num / inlink->sample_aspect_ratio.den : 1;
 246     s->var_values[VAR_DAR]   = s->var_values[VAR_A] * s->var_values[VAR_SAR];
 247     s->var_values[VAR_HSUB]  = 1 << s->desc->log2_chroma_w;
 248     s->var_values[VAR_VSUB]  = 1 << s->desc->log2_chroma_h;
 249
 250     if ((ret = av_expr_parse_and_eval(&nb_frames, s->duration_expr_str,
 251                                       var_names, s->var_values,
 252                                       NULL, NULL, NULL, NULL, NULL, 0, ctx)) < 0) {
 253         av_frame_free(&in);
 254         return ret;
 255     }
 256
 257     s->var_values[VAR_DURATION] = s->nb_frames = nb_frames;
 258     s->in = in;
 259
 260     return 0;
 261 }
 262
 263 static int request_frame(AVFilterLink *outlink)
 264 {
 265     AVFilterContext *ctx = outlink->src;
 266     ZPContext *s = ctx->priv;
 267     AVFrame *in = s->in;
 268     double zoom=1, dx=0, dy=0;
 269     int ret = -1;
 270
 271     if (in) {
 272         ret = output_single_frame(ctx, in, s->var_values, s->current_frame,
 273                                   &zoom, &dx, &dy);
 274         if (ret < 0)
 275             goto fail;
 276     }
 277
 278     if (s->current_frame >= s->nb_frames) {
 279         s->x = dx;
 280         s->y = dy;
 281         s->prev_zoom = zoom;
 282         s->prev_nb_frames = s->nb_frames;
 283         s->nb_frames = 0;
 284         s->current_frame = 0;
 285         av_frame_free(&s->in);
 286         s->finished = 1;
 287         ret = ff_request_frame(ctx->inputs[0]);
 288     }
 289
 290 fail:
 291     sws_freeContext(s->sws);
 292     s->sws = NULL;
 293
 294     return ret;
 295 }
 296
 297 static int poll_frame(AVFilterLink *link)
 298 {
 299     ZPContext *s = link->src->priv;
 300     return s->nb_frames - s->current_frame;
 301 }
 302
 303 static int query_formats(AVFilterContext *ctx)
 304 {
 305     static const enum AVPixelFormat pix_fmts[] = {
 306         AV_PIX_FMT_YUV444P,  AV_PIX_FMT_YUV422P,
 307         AV_PIX_FMT_YUV420P,  AV_PIX_FMT_YUV411P,
 308         AV_PIX_FMT_YUV410P,  AV_PIX_FMT_YUV440P,
 309         AV_PIX_FMT_YUVA444P, AV_PIX_FMT_YUVA422P,
 310         AV_PIX_FMT_YUVA420P,
 311         AV_PIX_FMT_YUVJ444P, AV_PIX_FMT_YUVJ440P,
 312         AV_PIX_FMT_YUVJ422P, AV_PIX_FMT_YUVJ420P,
 313         AV_PIX_FMT_YUVJ411P,
 314         AV_PIX_FMT_GBRP, AV_PIX_FMT_GBRAP,
 315         AV_PIX_FMT_GRAY8,
 316         AV_PIX_FMT_NONE
 317     };
 318
 319     AVFilterFormats *fmts_list = ff_make_format_list(pix_fmts);
 320     if (!fmts_list)
 321         return AVERROR(ENOMEM);
 322     return ff_set_common_formats(ctx, fmts_list);
 323 }
 324
 325 static av_cold void uninit(AVFilterContext *ctx)
 326 {
 327     ZPContext *s = ctx->priv;
 328
 329     sws_freeContext(s->sws);
 330     s->sws = NULL;
 331 }
 332
 333 static const AVFilterPad inputs[] = {
 334     {
 335         .name         = "default",
 336         .type         = AVMEDIA_TYPE_VIDEO,
 337         .filter_frame = filter_frame,
 338         .needs_fifo   = 1,
 339     },
 340     { NULL }
 341 };
 342
 343 static const AVFilterPad outputs[] = {
 344     {
 345         .name          = "default",
 346         .type          = AVMEDIA_TYPE_VIDEO,
 347         .config_props  = config_output,
 348         .poll_frame    = poll_frame,
 349         .request_frame = request_frame,
 350     },
 351     { NULL }
 352 };
 353
 354 AVFilter ff_vf_zoompan = {
 355     .name          = "zoompan",
 356     .description   = NULL_IF_CONFIG_SMALL("Apply Zoom & Pan effect."),
 357     .priv_size     = sizeof(ZPContext),
 358     .priv_class    = &zoompan_class,
 359     .init          = init,
 360     .uninit        = uninit,
 361     .query_formats = query_formats,
 362     .inputs        = inputs,
 363     .outputs       = outputs,
 364     .flags         = AVFILTER_FLAG_SUPPORT_TIMELINE_GENERIC,
 365 };