]> git.sesse.net Git - ffmpeg/blob - libavfilter/vf_stack.c
doc/filters: Documentation to add sess_config option for tensorflow backend
[ffmpeg] / libavfilter / vf_stack.c
1 /*
2  * Copyright (c) 2015 Paul B. Mahol
3  *
4  * This file is part of FFmpeg.
5  *
6  * FFmpeg is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU Lesser General Public
8  * License as published by the Free Software Foundation; either
9  * version 2.1 of the License, or (at your option) any later version.
10  *
11  * FFmpeg is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14  * Lesser General Public License for more details.
15  *
16  * You should have received a copy of the GNU Lesser General Public
17  * License along with FFmpeg; if not, write to the Free Software
18  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
19  */
20
21 #include "libavutil/avstring.h"
22 #include "libavutil/imgutils.h"
23 #include "libavutil/opt.h"
24 #include "libavutil/parseutils.h"
25 #include "libavutil/pixdesc.h"
26
27 #include "avfilter.h"
28 #include "drawutils.h"
29 #include "formats.h"
30 #include "internal.h"
31 #include "framesync.h"
32 #include "video.h"
33
34 typedef struct StackItem {
35     int x[4], y[4];
36     int linesize[4];
37     int height[4];
38 } StackItem;
39
40 typedef struct StackContext {
41     const AVClass *class;
42     const AVPixFmtDescriptor *desc;
43     int nb_inputs;
44     char *layout;
45     int shortest;
46     int is_vertical;
47     int is_horizontal;
48     int nb_planes;
49     uint8_t fillcolor[4];
50     char *fillcolor_str;
51     int fillcolor_enable;
52
53     FFDrawContext draw;
54     FFDrawColor color;
55
56     StackItem *items;
57     AVFrame **frames;
58     FFFrameSync fs;
59 } StackContext;
60
61 static int query_formats(AVFilterContext *ctx)
62 {
63     AVFilterFormats *formats = NULL;
64     StackContext *s = ctx->priv;
65     int ret;
66
67     if (s->fillcolor_enable) {
68         return ff_set_common_formats(ctx, ff_draw_supported_pixel_formats(0));
69     }
70
71     ret = ff_formats_pixdesc_filter(&formats, 0,
72                                     AV_PIX_FMT_FLAG_HWACCEL |
73                                     AV_PIX_FMT_FLAG_BITSTREAM |
74                                     AV_PIX_FMT_FLAG_PAL);
75     if (ret < 0)
76         return ret;
77     return ff_set_common_formats(ctx, formats);
78 }
79
80 static av_cold int init(AVFilterContext *ctx)
81 {
82     StackContext *s = ctx->priv;
83     int i, ret;
84
85     if (!strcmp(ctx->filter->name, "vstack"))
86         s->is_vertical = 1;
87
88     if (!strcmp(ctx->filter->name, "hstack"))
89         s->is_horizontal = 1;
90
91     s->frames = av_calloc(s->nb_inputs, sizeof(*s->frames));
92     if (!s->frames)
93         return AVERROR(ENOMEM);
94
95     s->items = av_calloc(s->nb_inputs, sizeof(*s->items));
96     if (!s->items)
97         return AVERROR(ENOMEM);
98
99     if (!strcmp(ctx->filter->name, "xstack")) {
100         if (strcmp(s->fillcolor_str, "none") &&
101             av_parse_color(s->fillcolor, s->fillcolor_str, -1, ctx) >= 0) {
102             s->fillcolor_enable = 1;
103         } else {
104             s->fillcolor_enable = 0;
105         }
106         if (!s->layout) {
107             if (s->nb_inputs == 2) {
108                 s->layout = av_strdup("0_0|w0_0");
109                 if (!s->layout)
110                     return AVERROR(ENOMEM);
111             } else {
112                 av_log(ctx, AV_LOG_ERROR, "No layout specified.\n");
113                 return AVERROR(EINVAL);
114             }
115         }
116     }
117
118     for (i = 0; i < s->nb_inputs; i++) {
119         AVFilterPad pad = { 0 };
120
121         pad.type = AVMEDIA_TYPE_VIDEO;
122         pad.name = av_asprintf("input%d", i);
123         if (!pad.name)
124             return AVERROR(ENOMEM);
125
126         if ((ret = ff_insert_inpad(ctx, i, &pad)) < 0) {
127             av_freep(&pad.name);
128             return ret;
129         }
130     }
131
132     return 0;
133 }
134
135 static int process_slice(AVFilterContext *ctx, void *arg, int job, int nb_jobs)
136 {
137     StackContext *s = ctx->priv;
138     AVFrame *out = arg;
139     AVFrame **in = s->frames;
140     const int start = (s->nb_inputs *  job   ) / nb_jobs;
141     const int end   = (s->nb_inputs * (job+1)) / nb_jobs;
142
143     for (int i = start; i < end; i++) {
144         StackItem *item = &s->items[i];
145
146         for (int p = 0; p < s->nb_planes; p++) {
147             av_image_copy_plane(out->data[p] + out->linesize[p] * item->y[p] + item->x[p],
148                                 out->linesize[p],
149                                 in[i]->data[p],
150                                 in[i]->linesize[p],
151                                 item->linesize[p], item->height[p]);
152         }
153     }
154
155     return 0;
156 }
157
158 static int process_frame(FFFrameSync *fs)
159 {
160     AVFilterContext *ctx = fs->parent;
161     AVFilterLink *outlink = ctx->outputs[0];
162     StackContext *s = fs->opaque;
163     AVFrame **in = s->frames;
164     AVFrame *out;
165     int i, ret;
166
167     for (i = 0; i < s->nb_inputs; i++) {
168         if ((ret = ff_framesync_get_frame(&s->fs, i, &in[i], 0)) < 0)
169             return ret;
170     }
171
172     out = ff_get_video_buffer(outlink, outlink->w, outlink->h);
173     if (!out)
174         return AVERROR(ENOMEM);
175     out->pts = av_rescale_q(s->fs.pts, s->fs.time_base, outlink->time_base);
176     out->sample_aspect_ratio = outlink->sample_aspect_ratio;
177
178     if (s->fillcolor_enable)
179         ff_fill_rectangle(&s->draw, &s->color, out->data, out->linesize,
180                           0, 0, outlink->w, outlink->h);
181
182     ctx->internal->execute(ctx, process_slice, out, NULL, FFMIN(s->nb_inputs, ff_filter_get_nb_threads(ctx)));
183
184     return ff_filter_frame(outlink, out);
185 }
186
187 static int config_output(AVFilterLink *outlink)
188 {
189     AVFilterContext *ctx = outlink->src;
190     StackContext *s = ctx->priv;
191     AVRational frame_rate = ctx->inputs[0]->frame_rate;
192     AVRational sar = ctx->inputs[0]->sample_aspect_ratio;
193     int height = ctx->inputs[0]->h;
194     int width = ctx->inputs[0]->w;
195     FFFrameSyncIn *in;
196     int i, ret;
197
198     s->desc = av_pix_fmt_desc_get(outlink->format);
199     if (!s->desc)
200         return AVERROR_BUG;
201
202     if (s->is_vertical) {
203         for (i = 0; i < s->nb_inputs; i++) {
204             AVFilterLink *inlink = ctx->inputs[i];
205             StackItem *item = &s->items[i];
206
207             if (ctx->inputs[i]->w != width) {
208                 av_log(ctx, AV_LOG_ERROR, "Input %d width %d does not match input %d width %d.\n", i, ctx->inputs[i]->w, 0, width);
209                 return AVERROR(EINVAL);
210             }
211
212             if ((ret = av_image_fill_linesizes(item->linesize, inlink->format, inlink->w)) < 0) {
213                 return ret;
214             }
215
216             item->height[1] = item->height[2] = AV_CEIL_RSHIFT(inlink->h, s->desc->log2_chroma_h);
217             item->height[0] = item->height[3] = inlink->h;
218
219             if (i) {
220                 item->y[1] = item->y[2] = AV_CEIL_RSHIFT(height, s->desc->log2_chroma_h);
221                 item->y[0] = item->y[3] = height;
222
223                 height += ctx->inputs[i]->h;
224             }
225         }
226     } else if (s->is_horizontal) {
227         for (i = 0; i < s->nb_inputs; i++) {
228             AVFilterLink *inlink = ctx->inputs[i];
229             StackItem *item = &s->items[i];
230
231             if (ctx->inputs[i]->h != height) {
232                 av_log(ctx, AV_LOG_ERROR, "Input %d height %d does not match input %d height %d.\n", i, ctx->inputs[i]->h, 0, height);
233                 return AVERROR(EINVAL);
234             }
235
236             if ((ret = av_image_fill_linesizes(item->linesize, inlink->format, inlink->w)) < 0) {
237                 return ret;
238             }
239
240             item->height[1] = item->height[2] = AV_CEIL_RSHIFT(inlink->h, s->desc->log2_chroma_h);
241             item->height[0] = item->height[3] = inlink->h;
242
243             if (i) {
244                 if ((ret = av_image_fill_linesizes(item->x, inlink->format, width)) < 0) {
245                     return ret;
246                 }
247
248                 width += ctx->inputs[i]->w;
249             }
250         }
251     } else {
252         char *arg, *p = s->layout, *saveptr = NULL;
253         char *arg2, *p2, *saveptr2 = NULL;
254         char *arg3, *p3, *saveptr3 = NULL;
255         int inw, inh, size;
256
257         if (s->fillcolor_enable) {
258             ff_draw_init(&s->draw, ctx->inputs[0]->format, 0);
259             ff_draw_color(&s->draw, &s->color, s->fillcolor);
260         }
261
262         for (i = 0; i < s->nb_inputs; i++) {
263             AVFilterLink *inlink = ctx->inputs[i];
264             StackItem *item = &s->items[i];
265
266             if (!(arg = av_strtok(p, "|", &saveptr)))
267                 return AVERROR(EINVAL);
268
269             p = NULL;
270
271             if ((ret = av_image_fill_linesizes(item->linesize, inlink->format, inlink->w)) < 0) {
272                 return ret;
273             }
274
275             item->height[1] = item->height[2] = AV_CEIL_RSHIFT(inlink->h, s->desc->log2_chroma_h);
276             item->height[0] = item->height[3] = inlink->h;
277
278             p2 = arg;
279             inw = inh = 0;
280
281             for (int j = 0; j < 2; j++) {
282                 if (!(arg2 = av_strtok(p2, "_", &saveptr2)))
283                     return AVERROR(EINVAL);
284
285                 p2 = NULL;
286                 p3 = arg2;
287                 while ((arg3 = av_strtok(p3, "+", &saveptr3))) {
288                     p3 = NULL;
289                     if (sscanf(arg3, "w%d", &size) == 1) {
290                         if (size == i || size < 0 || size >= s->nb_inputs)
291                             return AVERROR(EINVAL);
292
293                         if (!j)
294                             inw += ctx->inputs[size]->w;
295                         else
296                             inh += ctx->inputs[size]->w;
297                     } else if (sscanf(arg3, "h%d", &size) == 1) {
298                         if (size == i || size < 0 || size >= s->nb_inputs)
299                             return AVERROR(EINVAL);
300
301                         if (!j)
302                             inw += ctx->inputs[size]->h;
303                         else
304                             inh += ctx->inputs[size]->h;
305                     } else if (sscanf(arg3, "%d", &size) == 1) {
306                         if (size < 0)
307                             return AVERROR(EINVAL);
308
309                         if (!j)
310                             inw += size;
311                         else
312                             inh += size;
313                     } else {
314                         return AVERROR(EINVAL);
315                     }
316                 }
317             }
318
319             if ((ret = av_image_fill_linesizes(item->x, inlink->format, inw)) < 0) {
320                 return ret;
321             }
322
323             item->y[1] = item->y[2] = AV_CEIL_RSHIFT(inh, s->desc->log2_chroma_h);
324             item->y[0] = item->y[3] = inh;
325
326             width  = FFMAX(width,  inlink->w + inw);
327             height = FFMAX(height, inlink->h + inh);
328         }
329     }
330
331     s->nb_planes = av_pix_fmt_count_planes(outlink->format);
332
333     outlink->w          = width;
334     outlink->h          = height;
335     outlink->frame_rate = frame_rate;
336     outlink->sample_aspect_ratio = sar;
337
338     for (i = 1; i < s->nb_inputs; i++) {
339         AVFilterLink *inlink = ctx->inputs[i];
340         if (outlink->frame_rate.num != inlink->frame_rate.num ||
341             outlink->frame_rate.den != inlink->frame_rate.den) {
342             av_log(ctx, AV_LOG_VERBOSE,
343                     "Video inputs have different frame rates, output will be VFR\n");
344             outlink->frame_rate = av_make_q(1, 0);
345             break;
346         }
347     }
348
349     if ((ret = ff_framesync_init(&s->fs, ctx, s->nb_inputs)) < 0)
350         return ret;
351
352     in = s->fs.in;
353     s->fs.opaque = s;
354     s->fs.on_event = process_frame;
355
356     for (i = 0; i < s->nb_inputs; i++) {
357         AVFilterLink *inlink = ctx->inputs[i];
358
359         in[i].time_base = inlink->time_base;
360         in[i].sync   = 1;
361         in[i].before = EXT_STOP;
362         in[i].after  = s->shortest ? EXT_STOP : EXT_INFINITY;
363     }
364
365     ret = ff_framesync_configure(&s->fs);
366     outlink->time_base = s->fs.time_base;
367
368     return ret;
369 }
370
371 static av_cold void uninit(AVFilterContext *ctx)
372 {
373     StackContext *s = ctx->priv;
374     int i;
375
376     ff_framesync_uninit(&s->fs);
377     av_freep(&s->frames);
378     av_freep(&s->items);
379
380     for (i = 0; i < ctx->nb_inputs; i++)
381         av_freep(&ctx->input_pads[i].name);
382 }
383
384 static int activate(AVFilterContext *ctx)
385 {
386     StackContext *s = ctx->priv;
387     return ff_framesync_activate(&s->fs);
388 }
389
390 #define OFFSET(x) offsetof(StackContext, x)
391 #define FLAGS AV_OPT_FLAG_VIDEO_PARAM | AV_OPT_FLAG_FILTERING_PARAM
392 static const AVOption stack_options[] = {
393     { "inputs", "set number of inputs", OFFSET(nb_inputs), AV_OPT_TYPE_INT, {.i64=2}, 2, INT_MAX, .flags = FLAGS },
394     { "shortest", "force termination when the shortest input terminates", OFFSET(shortest), AV_OPT_TYPE_BOOL, {.i64=0}, 0, 1, .flags = FLAGS },
395     { NULL },
396 };
397
398 static const AVFilterPad outputs[] = {
399     {
400         .name          = "default",
401         .type          = AVMEDIA_TYPE_VIDEO,
402         .config_props  = config_output,
403     },
404     { NULL }
405 };
406
407 #if CONFIG_HSTACK_FILTER
408
409 #define hstack_options stack_options
410 AVFILTER_DEFINE_CLASS(hstack);
411
412 const AVFilter ff_vf_hstack = {
413     .name          = "hstack",
414     .description   = NULL_IF_CONFIG_SMALL("Stack video inputs horizontally."),
415     .priv_size     = sizeof(StackContext),
416     .priv_class    = &hstack_class,
417     .query_formats = query_formats,
418     .outputs       = outputs,
419     .init          = init,
420     .uninit        = uninit,
421     .activate      = activate,
422     .flags         = AVFILTER_FLAG_DYNAMIC_INPUTS | AVFILTER_FLAG_SLICE_THREADS,
423 };
424
425 #endif /* CONFIG_HSTACK_FILTER */
426
427 #if CONFIG_VSTACK_FILTER
428
429 #define vstack_options stack_options
430 AVFILTER_DEFINE_CLASS(vstack);
431
432 const AVFilter ff_vf_vstack = {
433     .name          = "vstack",
434     .description   = NULL_IF_CONFIG_SMALL("Stack video inputs vertically."),
435     .priv_size     = sizeof(StackContext),
436     .priv_class    = &vstack_class,
437     .query_formats = query_formats,
438     .outputs       = outputs,
439     .init          = init,
440     .uninit        = uninit,
441     .activate      = activate,
442     .flags         = AVFILTER_FLAG_DYNAMIC_INPUTS | AVFILTER_FLAG_SLICE_THREADS,
443 };
444
445 #endif /* CONFIG_VSTACK_FILTER */
446
447 #if CONFIG_XSTACK_FILTER
448
449 static const AVOption xstack_options[] = {
450     { "inputs", "set number of inputs", OFFSET(nb_inputs), AV_OPT_TYPE_INT, {.i64=2}, 2, INT_MAX, .flags = FLAGS },
451     { "layout", "set custom layout", OFFSET(layout), AV_OPT_TYPE_STRING, {.str=NULL}, 0, 0, .flags = FLAGS },
452     { "shortest", "force termination when the shortest input terminates", OFFSET(shortest), AV_OPT_TYPE_BOOL, {.i64=0}, 0, 1, .flags = FLAGS },
453     { "fill",  "set the color for unused pixels", OFFSET(fillcolor_str), AV_OPT_TYPE_STRING, {.str = "none"}, .flags = FLAGS },
454     { NULL },
455 };
456
457 AVFILTER_DEFINE_CLASS(xstack);
458
459 const AVFilter ff_vf_xstack = {
460     .name          = "xstack",
461     .description   = NULL_IF_CONFIG_SMALL("Stack video inputs into custom layout."),
462     .priv_size     = sizeof(StackContext),
463     .priv_class    = &xstack_class,
464     .query_formats = query_formats,
465     .outputs       = outputs,
466     .init          = init,
467     .uninit        = uninit,
468     .activate      = activate,
469     .flags         = AVFILTER_FLAG_DYNAMIC_INPUTS | AVFILTER_FLAG_SLICE_THREADS,
470 };
471
472 #endif /* CONFIG_XSTACK_FILTER */