]> git.sesse.net Git - ffmpeg/blob - libavfilter/vf_zoompan.c
avformat/movenc: add option to use keys/mdta atoms for metadata
[ffmpeg] / libavfilter / vf_zoompan.c
1 /*
2  * Copyright (c) 2013 Paul B Mahol
3  *
4  * This file is part of FFmpeg.
5  *
6  * FFmpeg is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU Lesser General Public
8  * License as published by the Free Software Foundation; either
9  * version 2.1 of the License, or (at your option) any later version.
10  *
11  * FFmpeg is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14  * Lesser General Public License for more details.
15  *
16  * You should have received a copy of the GNU Lesser General Public
17  * License along with FFmpeg; if not, write to the Free Software
18  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
19  */
20
21 #include "libavutil/avassert.h"
22 #include "libavutil/eval.h"
23 #include "libavutil/opt.h"
24 #include "libavutil/pixdesc.h"
25 #include "avfilter.h"
26 #include "formats.h"
27 #include "internal.h"
28 #include "video.h"
29 #include "libswscale/swscale.h"
30
31 static const char *const var_names[] = {
32     "in_w",   "iw",
33     "in_h",   "ih",
34     "out_w",  "ow",
35     "out_h",  "oh",
36     "in",
37     "on",
38     "duration",
39     "pduration",
40     "time",
41     "frame",
42     "zoom",
43     "pzoom",
44     "x", "px",
45     "y", "py",
46     "a",
47     "sar",
48     "dar",
49     "hsub",
50     "vsub",
51     NULL
52 };
53
54 enum var_name {
55     VAR_IN_W,   VAR_IW,
56     VAR_IN_H,   VAR_IH,
57     VAR_OUT_W,  VAR_OW,
58     VAR_OUT_H,  VAR_OH,
59     VAR_IN,
60     VAR_ON,
61     VAR_DURATION,
62     VAR_PDURATION,
63     VAR_TIME,
64     VAR_FRAME,
65     VAR_ZOOM,
66     VAR_PZOOM,
67     VAR_X, VAR_PX,
68     VAR_Y, VAR_PY,
69     VAR_A,
70     VAR_SAR,
71     VAR_DAR,
72     VAR_HSUB,
73     VAR_VSUB,
74     VARS_NB
75 };
76
77 typedef struct ZPcontext {
78     const AVClass *class;
79     char *zoom_expr_str;
80     char *x_expr_str;
81     char *y_expr_str;
82     char *duration_expr_str;
83     int w, h;
84     double x, y;
85     double prev_zoom;
86     int prev_nb_frames;
87     struct SwsContext *sws;
88     int64_t frame_count;
89     const AVPixFmtDescriptor *desc;
90     AVFrame *in;
91     double var_values[VARS_NB];
92     int nb_frames;
93     int current_frame;
94     int finished;
95     AVRational framerate;
96 } ZPContext;
97
98 #define OFFSET(x) offsetof(ZPContext, x)
99 #define FLAGS AV_OPT_FLAG_VIDEO_PARAM|AV_OPT_FLAG_FILTERING_PARAM
100 static const AVOption zoompan_options[] = {
101     { "zoom", "set the zoom expression", OFFSET(zoom_expr_str), AV_OPT_TYPE_STRING, {.str = "1" }, .flags = FLAGS },
102     { "z", "set the zoom expression", OFFSET(zoom_expr_str), AV_OPT_TYPE_STRING, {.str = "1" }, .flags = FLAGS },
103     { "x", "set the x expression", OFFSET(x_expr_str), AV_OPT_TYPE_STRING, {.str="0"}, .flags = FLAGS },
104     { "y", "set the y expression", OFFSET(y_expr_str), AV_OPT_TYPE_STRING, {.str="0"}, .flags = FLAGS },
105     { "d", "set the duration expression", OFFSET(duration_expr_str), AV_OPT_TYPE_STRING, {.str="90"}, .flags = FLAGS },
106     { "s", "set the output image size", OFFSET(w), AV_OPT_TYPE_IMAGE_SIZE, {.str="hd720"}, .flags = FLAGS },
107     { "fps", "set the output framerate", OFFSET(framerate), AV_OPT_TYPE_VIDEO_RATE, { .str = "25" }, 0, INT_MAX, .flags = FLAGS },
108     { NULL }
109 };
110
111 AVFILTER_DEFINE_CLASS(zoompan);
112
113 static av_cold int init(AVFilterContext *ctx)
114 {
115     ZPContext *s = ctx->priv;
116
117     s->prev_zoom = 1;
118     return 0;
119 }
120
121 static int config_output(AVFilterLink *outlink)
122 {
123     AVFilterContext *ctx = outlink->src;
124     ZPContext *s = ctx->priv;
125
126     outlink->w = s->w;
127     outlink->h = s->h;
128     outlink->time_base = av_inv_q(s->framerate);
129     outlink->frame_rate = s->framerate;
130     s->desc = av_pix_fmt_desc_get(outlink->format);
131
132     return 0;
133 }
134
135 static int output_single_frame(AVFilterContext *ctx, AVFrame *in, double *var_values, int i,
136                                double *zoom, double *dx, double *dy)
137 {
138     ZPContext *s = ctx->priv;
139     AVFilterLink *outlink = ctx->outputs[0];
140     int64_t pts = s->frame_count;
141     int k, x, y, w, h, ret = 0;
142     uint8_t *input[4];
143     int px[4], py[4];
144     AVFrame *out;
145
146     var_values[VAR_TIME] = pts * av_q2d(outlink->time_base);
147     var_values[VAR_FRAME] = i;
148     var_values[VAR_ON] = outlink->frame_count + 1;
149     if ((ret = av_expr_parse_and_eval(zoom, s->zoom_expr_str,
150                                       var_names, var_values,
151                                       NULL, NULL, NULL, NULL, NULL, 0, ctx)) < 0)
152         return ret;
153
154     *zoom = av_clipd(*zoom, 1, 10);
155     var_values[VAR_ZOOM] = *zoom;
156     w = in->width * (1.0 / *zoom);
157     h = in->height * (1.0 / *zoom);
158
159     if ((ret = av_expr_parse_and_eval(dx, s->x_expr_str,
160                                       var_names, var_values,
161                                       NULL, NULL, NULL, NULL, NULL, 0, ctx)) < 0)
162         return ret;
163     x = *dx = av_clipd(*dx, 0, FFMAX(in->width - w, 0));
164     var_values[VAR_X] = *dx;
165     x &= ~((1 << s->desc->log2_chroma_w) - 1);
166
167     if ((ret = av_expr_parse_and_eval(dy, s->y_expr_str,
168                                       var_names, var_values,
169                                       NULL, NULL, NULL, NULL, NULL, 0, ctx)) < 0)
170         return ret;
171     y = *dy = av_clipd(*dy, 0, FFMAX(in->height - h, 0));
172     var_values[VAR_Y] = *dy;
173     y &= ~((1 << s->desc->log2_chroma_h) - 1);
174
175     out = ff_get_video_buffer(outlink, outlink->w, outlink->h);
176     if (!out) {
177         ret = AVERROR(ENOMEM);
178         return ret;
179     }
180
181     px[1] = px[2] = AV_CEIL_RSHIFT(x, s->desc->log2_chroma_w);
182     px[0] = px[3] = x;
183
184     py[1] = py[2] = AV_CEIL_RSHIFT(y, s->desc->log2_chroma_h);
185     py[0] = py[3] = y;
186
187     s->sws = sws_alloc_context();
188     if (!s->sws) {
189         ret = AVERROR(ENOMEM);
190         return ret;
191     }
192
193     for (k = 0; in->data[k]; k++)
194         input[k] = in->data[k] + py[k] * in->linesize[k] + px[k];
195
196     av_opt_set_int(s->sws, "srcw", w, 0);
197     av_opt_set_int(s->sws, "srch", h, 0);
198     av_opt_set_int(s->sws, "src_format", in->format, 0);
199     av_opt_set_int(s->sws, "dstw", outlink->w, 0);
200     av_opt_set_int(s->sws, "dsth", outlink->h, 0);
201     av_opt_set_int(s->sws, "dst_format", outlink->format, 0);
202     av_opt_set_int(s->sws, "sws_flags", SWS_BICUBIC, 0);
203
204     if ((ret = sws_init_context(s->sws, NULL, NULL)) < 0)
205         return ret;
206
207     sws_scale(s->sws, (const uint8_t *const *)&input, in->linesize, 0, h, out->data, out->linesize);
208
209     out->pts = pts;
210     s->frame_count++;
211
212     ret = ff_filter_frame(outlink, out);
213     sws_freeContext(s->sws);
214     s->sws = NULL;
215     s->current_frame++;
216     return ret;
217 }
218
219 static int filter_frame(AVFilterLink *inlink, AVFrame *in)
220 {
221     AVFilterContext *ctx = inlink->dst;
222     AVFilterLink *outlink = ctx->outputs[0];
223     ZPContext *s = ctx->priv;
224     double nb_frames;
225     int ret;
226
227     av_assert0(s->in == NULL);
228
229     s->finished = 0;
230     s->var_values[VAR_IN_W]  = s->var_values[VAR_IW] = in->width;
231     s->var_values[VAR_IN_H]  = s->var_values[VAR_IH] = in->height;
232     s->var_values[VAR_OUT_W] = s->var_values[VAR_OW] = s->w;
233     s->var_values[VAR_OUT_H] = s->var_values[VAR_OH] = s->h;
234     s->var_values[VAR_IN]    = inlink->frame_count + 1;
235     s->var_values[VAR_ON]    = outlink->frame_count + 1;
236     s->var_values[VAR_PX]    = s->x;
237     s->var_values[VAR_PY]    = s->y;
238     s->var_values[VAR_X]     = 0;
239     s->var_values[VAR_Y]     = 0;
240     s->var_values[VAR_PZOOM] = s->prev_zoom;
241     s->var_values[VAR_ZOOM]  = 1;
242     s->var_values[VAR_PDURATION] = s->prev_nb_frames;
243     s->var_values[VAR_A]     = (double) in->width / in->height;
244     s->var_values[VAR_SAR]   = inlink->sample_aspect_ratio.num ?
245         (double) inlink->sample_aspect_ratio.num / inlink->sample_aspect_ratio.den : 1;
246     s->var_values[VAR_DAR]   = s->var_values[VAR_A] * s->var_values[VAR_SAR];
247     s->var_values[VAR_HSUB]  = 1 << s->desc->log2_chroma_w;
248     s->var_values[VAR_VSUB]  = 1 << s->desc->log2_chroma_h;
249
250     if ((ret = av_expr_parse_and_eval(&nb_frames, s->duration_expr_str,
251                                       var_names, s->var_values,
252                                       NULL, NULL, NULL, NULL, NULL, 0, ctx)) < 0) {
253         av_frame_free(&in);
254         return ret;
255     }
256
257     s->var_values[VAR_DURATION] = s->nb_frames = nb_frames;
258     s->in = in;
259
260     return 0;
261 }
262
263 static int request_frame(AVFilterLink *outlink)
264 {
265     AVFilterContext *ctx = outlink->src;
266     ZPContext *s = ctx->priv;
267     AVFrame *in = s->in;
268     double zoom=1, dx=0, dy=0;
269     int ret = -1;
270
271     if (in) {
272         ret = output_single_frame(ctx, in, s->var_values, s->current_frame,
273                                   &zoom, &dx, &dy);
274         if (ret < 0)
275             goto fail;
276     }
277
278     if (s->current_frame >= s->nb_frames) {
279         s->x = dx;
280         s->y = dy;
281         s->prev_zoom = zoom;
282         s->prev_nb_frames = s->nb_frames;
283         s->nb_frames = 0;
284         s->current_frame = 0;
285         av_frame_free(&s->in);
286         s->finished = 1;
287         ret = ff_request_frame(ctx->inputs[0]);
288     }
289
290 fail:
291     sws_freeContext(s->sws);
292     s->sws = NULL;
293
294     return ret;
295 }
296
297 static int poll_frame(AVFilterLink *link)
298 {
299     ZPContext *s = link->src->priv;
300     return s->nb_frames - s->current_frame;
301 }
302
303 static int query_formats(AVFilterContext *ctx)
304 {
305     static const enum AVPixelFormat pix_fmts[] = {
306         AV_PIX_FMT_YUV444P,  AV_PIX_FMT_YUV422P,
307         AV_PIX_FMT_YUV420P,  AV_PIX_FMT_YUV411P,
308         AV_PIX_FMT_YUV410P,  AV_PIX_FMT_YUV440P,
309         AV_PIX_FMT_YUVA444P, AV_PIX_FMT_YUVA422P,
310         AV_PIX_FMT_YUVA420P,
311         AV_PIX_FMT_YUVJ444P, AV_PIX_FMT_YUVJ440P,
312         AV_PIX_FMT_YUVJ422P, AV_PIX_FMT_YUVJ420P,
313         AV_PIX_FMT_YUVJ411P,
314         AV_PIX_FMT_GBRP, AV_PIX_FMT_GBRAP,
315         AV_PIX_FMT_GRAY8,
316         AV_PIX_FMT_NONE
317     };
318
319     AVFilterFormats *fmts_list = ff_make_format_list(pix_fmts);
320     if (!fmts_list)
321         return AVERROR(ENOMEM);
322     return ff_set_common_formats(ctx, fmts_list);
323 }
324
325 static av_cold void uninit(AVFilterContext *ctx)
326 {
327     ZPContext *s = ctx->priv;
328
329     sws_freeContext(s->sws);
330     s->sws = NULL;
331 }
332
333 static const AVFilterPad inputs[] = {
334     {
335         .name         = "default",
336         .type         = AVMEDIA_TYPE_VIDEO,
337         .filter_frame = filter_frame,
338         .needs_fifo   = 1,
339     },
340     { NULL }
341 };
342
343 static const AVFilterPad outputs[] = {
344     {
345         .name          = "default",
346         .type          = AVMEDIA_TYPE_VIDEO,
347         .config_props  = config_output,
348         .poll_frame    = poll_frame,
349         .request_frame = request_frame,
350     },
351     { NULL }
352 };
353
354 AVFilter ff_vf_zoompan = {
355     .name          = "zoompan",
356     .description   = NULL_IF_CONFIG_SMALL("Apply Zoom & Pan effect."),
357     .priv_size     = sizeof(ZPContext),
358     .priv_class    = &zoompan_class,
359     .init          = init,
360     .uninit        = uninit,
361     .query_formats = query_formats,
362     .inputs        = inputs,
363     .outputs       = outputs,
364     .flags         = AVFILTER_FLAG_SUPPORT_TIMELINE_GENERIC,
365 };