]> git.sesse.net Git - ffmpeg/blob - libavfilter/vf_neighbor.c
avfilter/vf_identity: fix typo
[ffmpeg] / libavfilter / vf_neighbor.c
1 /*
2  * Copyright (c) 2012-2013 Oka Motofumi (chikuzen.mo at gmail dot com)
3  * Copyright (c) 2015 Paul B Mahol
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include "libavutil/imgutils.h"
23 #include "libavutil/intreadwrite.h"
24 #include "libavutil/pixdesc.h"
25 #include "libavutil/opt.h"
26 #include "avfilter.h"
27 #include "formats.h"
28 #include "internal.h"
29 #include "video.h"
30
31 typedef struct ThreadData {
32     AVFrame *in, *out;
33 } ThreadData;
34
35 typedef struct NContext {
36     const AVClass *class;
37     int planeheight[4];
38     int planewidth[4];
39     int nb_planes;
40     int threshold[4];
41     int coordinates;
42
43     int depth;
44     int max;
45     int bpc;
46
47     void (*filter)(uint8_t *dst, const uint8_t *p1, int width,
48                    int threshold, const uint8_t *coordinates[], int coord,
49                    int maxc);
50 } NContext;
51
52 static int query_formats(AVFilterContext *ctx)
53 {
54     static const enum AVPixelFormat pix_fmts[] = {
55         AV_PIX_FMT_YUVA444P, AV_PIX_FMT_YUV444P, AV_PIX_FMT_YUV440P,
56         AV_PIX_FMT_YUVJ444P, AV_PIX_FMT_YUVJ440P,
57         AV_PIX_FMT_YUVA422P, AV_PIX_FMT_YUV422P, AV_PIX_FMT_YUVA420P, AV_PIX_FMT_YUV420P,
58         AV_PIX_FMT_YUVJ422P, AV_PIX_FMT_YUVJ420P,
59         AV_PIX_FMT_YUVJ411P, AV_PIX_FMT_YUV411P, AV_PIX_FMT_YUV410P,
60         AV_PIX_FMT_YUV420P9, AV_PIX_FMT_YUV422P9, AV_PIX_FMT_YUV444P9,
61         AV_PIX_FMT_YUV420P10, AV_PIX_FMT_YUV422P10, AV_PIX_FMT_YUV444P10,
62         AV_PIX_FMT_YUV420P12, AV_PIX_FMT_YUV422P12, AV_PIX_FMT_YUV444P12, AV_PIX_FMT_YUV440P12,
63         AV_PIX_FMT_YUV420P14, AV_PIX_FMT_YUV422P14, AV_PIX_FMT_YUV444P14,
64         AV_PIX_FMT_YUV420P16, AV_PIX_FMT_YUV422P16, AV_PIX_FMT_YUV444P16,
65         AV_PIX_FMT_YUVA420P9, AV_PIX_FMT_YUVA422P9, AV_PIX_FMT_YUVA444P9,
66         AV_PIX_FMT_YUVA420P10, AV_PIX_FMT_YUVA422P10, AV_PIX_FMT_YUVA444P10,
67         AV_PIX_FMT_YUVA422P12, AV_PIX_FMT_YUVA444P12,
68         AV_PIX_FMT_YUVA420P16, AV_PIX_FMT_YUVA422P16, AV_PIX_FMT_YUVA444P16,
69         AV_PIX_FMT_GBRP, AV_PIX_FMT_GBRP9, AV_PIX_FMT_GBRP10,
70         AV_PIX_FMT_GBRP12, AV_PIX_FMT_GBRP14, AV_PIX_FMT_GBRP16,
71         AV_PIX_FMT_GBRAP, AV_PIX_FMT_GBRAP10, AV_PIX_FMT_GBRAP12, AV_PIX_FMT_GBRAP16,
72         AV_PIX_FMT_GRAY8, AV_PIX_FMT_GRAY9, AV_PIX_FMT_GRAY10, AV_PIX_FMT_GRAY12, AV_PIX_FMT_GRAY14, AV_PIX_FMT_GRAY16,
73         AV_PIX_FMT_NONE
74     };
75
76     return ff_set_common_formats(ctx, ff_make_format_list(pix_fmts));
77 }
78
79 static void erosion(uint8_t *dst, const uint8_t *p1, int width,
80                     int threshold, const uint8_t *coordinates[], int coord,
81                     int maxc)
82 {
83     int x, i;
84
85     for (x = 0; x < width; x++) {
86         int min = p1[x];
87         int limit = FFMAX(min - threshold, 0);
88
89         for (i = 0; i < 8; i++) {
90             if (coord & (1 << i)) {
91                 min = FFMIN(min, *(coordinates[i] + x));
92             }
93             min = FFMAX(min, limit);
94         }
95
96         dst[x] = min;
97     }
98 }
99
100 static void erosion16(uint8_t *dstp, const uint8_t *p1, int width,
101                       int threshold, const uint8_t *coordinates[], int coord,
102                       int maxc)
103 {
104     uint16_t *dst = (uint16_t *)dstp;
105     int x, i;
106
107     for (x = 0; x < width; x++) {
108         int min = AV_RN16A(&p1[2 * x]);
109         int limit = FFMAX(min - threshold, 0);
110
111         for (i = 0; i < 8; i++) {
112             if (coord & (1 << i)) {
113                 min = FFMIN(min, AV_RN16A(coordinates[i] + x * 2));
114             }
115             min = FFMAX(min, limit);
116         }
117
118         dst[x] = min;
119     }
120 }
121
122 static void dilation(uint8_t *dst, const uint8_t *p1, int width,
123                      int threshold, const uint8_t *coordinates[], int coord,
124                      int maxc)
125 {
126     int x, i;
127
128     for (x = 0; x < width; x++) {
129         int max = p1[x];
130         int limit = FFMIN(max + threshold, 255);
131
132         for (i = 0; i < 8; i++) {
133             if (coord & (1 << i)) {
134                 max = FFMAX(max, *(coordinates[i] + x));
135             }
136             max = FFMIN(max, limit);
137         }
138
139         dst[x] = max;
140     }
141 }
142
143 static void dilation16(uint8_t *dstp, const uint8_t *p1, int width,
144                        int threshold, const uint8_t *coordinates[], int coord,
145                        int maxc)
146 {
147     uint16_t *dst = (uint16_t *)dstp;
148     int x, i;
149
150     for (x = 0; x < width; x++) {
151         int max = AV_RN16A(&p1[x * 2]);
152         int limit = FFMIN(max + threshold, maxc);
153
154         for (i = 0; i < 8; i++) {
155             if (coord & (1 << i)) {
156                 max = FFMAX(max, AV_RN16A(coordinates[i] + x * 2));
157             }
158             max = FFMIN(max, limit);
159         }
160
161         dst[x] = max;
162     }
163 }
164
165 static void deflate(uint8_t *dst, const uint8_t *p1, int width,
166                     int threshold, const uint8_t *coordinates[], int coord,
167                     int maxc)
168 {
169     int x, i;
170
171     for (x = 0; x < width; x++) {
172         int sum = 0;
173         int limit = FFMAX(p1[x] - threshold, 0);
174
175         for (i = 0; i < 8; sum += *(coordinates[i++] + x));
176
177         dst[x] = FFMAX(FFMIN(sum / 8, p1[x]), limit);
178     }
179 }
180
181 static void deflate16(uint8_t *dstp, const uint8_t *p1, int width,
182                       int threshold, const uint8_t *coordinates[], int coord,
183                       int maxc)
184 {
185     uint16_t *dst = (uint16_t *)dstp;
186     int x, i;
187
188     for (x = 0; x < width; x++) {
189         int sum = 0;
190         int limit = FFMAX(AV_RN16A(&p1[2 * x]) - threshold, 0);
191
192         for (i = 0; i < 8; sum += AV_RN16A(coordinates[i++] + x * 2));
193
194         dst[x] = FFMAX(FFMIN(sum / 8, AV_RN16A(&p1[2 * x])), limit);
195     }
196 }
197
198 static void inflate(uint8_t *dst, const uint8_t *p1, int width,
199                     int threshold, const uint8_t *coordinates[], int coord,
200                     int maxc)
201 {
202     int x, i;
203
204     for (x = 0; x < width; x++) {
205         int sum = 0;
206         int limit = FFMIN(p1[x] + threshold, 255);
207
208         for (i = 0; i < 8; sum += *(coordinates[i++] + x));
209
210         dst[x] = FFMIN(FFMAX(sum / 8, p1[x]), limit);
211     }
212 }
213
214 static void inflate16(uint8_t *dstp, const uint8_t *p1, int width,
215                       int threshold, const uint8_t *coordinates[], int coord,
216                       int maxc)
217 {
218     uint16_t *dst = (uint16_t *)dstp;
219     int x, i;
220
221     for (x = 0; x < width; x++) {
222         int sum = 0;
223         int limit = FFMIN(AV_RN16A(&p1[2 * x]) + threshold, maxc);
224
225         for (i = 0; i < 8; sum += AV_RN16A(coordinates[i++] + x * 2));
226
227         dst[x] = FFMIN(FFMAX(sum / 8, AV_RN16A(&p1[x * 2])), limit);
228     }
229 }
230
231 static int config_input(AVFilterLink *inlink)
232 {
233     AVFilterContext *ctx = inlink->dst;
234     NContext *s = ctx->priv;
235     const AVPixFmtDescriptor *desc = av_pix_fmt_desc_get(inlink->format);
236
237     s->depth = desc->comp[0].depth;
238     s->max = (1 << s->depth) - 1;
239     s->bpc = (s->depth + 7) / 8;
240
241     s->planewidth[1] = s->planewidth[2] = AV_CEIL_RSHIFT(inlink->w, desc->log2_chroma_w);
242     s->planewidth[0] = s->planewidth[3] = inlink->w;
243     s->planeheight[1] = s->planeheight[2] = AV_CEIL_RSHIFT(inlink->h, desc->log2_chroma_h);
244     s->planeheight[0] = s->planeheight[3] = inlink->h;
245
246     s->nb_planes = av_pix_fmt_count_planes(inlink->format);
247
248     if (!strcmp(ctx->filter->name, "erosion"))
249         s->filter = s->depth > 8 ? erosion16 : erosion;
250     else if (!strcmp(ctx->filter->name, "dilation"))
251         s->filter = s->depth > 8 ? dilation16 : dilation;
252     else if (!strcmp(ctx->filter->name, "deflate"))
253         s->filter = s->depth > 8 ? deflate16 : deflate;
254     else if (!strcmp(ctx->filter->name, "inflate"))
255         s->filter = s->depth > 8 ? inflate16 : inflate;
256
257     return 0;
258 }
259
260 static int filter_slice(AVFilterContext *ctx, void *arg, int jobnr, int nb_jobs)
261 {
262     NContext *s = ctx->priv;
263     ThreadData *td = arg;
264     AVFrame *out = td->out;
265     AVFrame *in = td->in;
266     int plane, y;
267
268     for (plane = 0; plane < s->nb_planes; plane++) {
269         const int bpc = s->bpc;
270         const int threshold = s->threshold[plane];
271         const int stride = in->linesize[plane];
272         const int dstride = out->linesize[plane];
273         const int height = s->planeheight[plane];
274         const int width  = s->planewidth[plane];
275         const int slice_start = (height * jobnr) / nb_jobs;
276         const int slice_end = (height * (jobnr+1)) / nb_jobs;
277         const uint8_t *src = (const uint8_t *)in->data[plane] + slice_start * stride;
278         uint8_t *dst = out->data[plane] + slice_start * dstride;
279
280         if (!threshold) {
281             av_image_copy_plane(dst, dstride, src, stride, width * bpc, slice_end - slice_start);
282             continue;
283         }
284
285         for (y = slice_start; y < slice_end; y++) {
286             const int nh = y > 0;
287             const int ph = y < height - 1;
288             const uint8_t *coordinates[] = { src - nh * stride, src + 1 * bpc - nh * stride, src + 2 * bpc - nh * stride,
289                                              src,                                            src + 2 * bpc,
290                                              src + ph * stride, src + 1 * bpc + ph * stride, src + 2 * bpc + ph * stride};
291
292             const uint8_t *coordinateslb[] = { src + 1 * bpc - nh * stride, src - nh * stride, src + 1 * bpc - nh * stride,
293                                                src + 1 * bpc,                                  src + 1 * bpc,
294                                                src + 1 * bpc + ph * stride, src + ph * stride, src + 1 * bpc + ph * stride};
295
296             const uint8_t *coordinatesrb[] = { src + (width - 2) * bpc - nh * stride, src + (width - 1) * bpc - nh * stride, src + (width - 2) * bpc - nh * stride,
297                                                src + (width - 2) * bpc,                                                      src + (width - 2) * bpc,
298                                                src + (width - 2) * bpc + ph * stride, src + (width - 1) * bpc + ph * stride, src + (width - 2) * bpc + ph * stride};
299
300             s->filter(dst,                         src,                     1,         threshold, coordinateslb, s->coordinates, s->max);
301             if (width > 1) {
302                 s->filter(dst          + 1  * bpc, src          + 1  * bpc, width - 2, threshold, coordinates,   s->coordinates, s->max);
303                 s->filter(dst + (width - 1) * bpc, src + (width - 1) * bpc, 1,         threshold, coordinatesrb, s->coordinates, s->max);
304             }
305
306             src += stride;
307             dst += dstride;
308         }
309     }
310
311     return 0;
312 }
313
314 static int filter_frame(AVFilterLink *inlink, AVFrame *in)
315 {
316     AVFilterContext *ctx = inlink->dst;
317     AVFilterLink *outlink = ctx->outputs[0];
318     NContext *s = ctx->priv;
319     ThreadData td;
320     AVFrame *out;
321
322     out = ff_get_video_buffer(outlink, outlink->w, outlink->h);
323     if (!out) {
324         av_frame_free(&in);
325         return AVERROR(ENOMEM);
326     }
327     av_frame_copy_props(out, in);
328
329     td.in = in;
330     td.out = out;
331     ctx->internal->execute(ctx, filter_slice, &td, NULL, FFMIN(s->planeheight[1], ff_filter_get_nb_threads(ctx)));
332
333     av_frame_free(&in);
334     return ff_filter_frame(outlink, out);
335 }
336
337 static const AVFilterPad neighbor_inputs[] = {
338     {
339         .name         = "default",
340         .type         = AVMEDIA_TYPE_VIDEO,
341         .filter_frame = filter_frame,
342         .config_props = config_input,
343     },
344     { NULL }
345 };
346
347 static const AVFilterPad neighbor_outputs[] = {
348     {
349         .name = "default",
350         .type = AVMEDIA_TYPE_VIDEO,
351     },
352     { NULL }
353 };
354
355 #define OFFSET(x) offsetof(NContext, x)
356 #define FLAGS AV_OPT_FLAG_FILTERING_PARAM|AV_OPT_FLAG_VIDEO_PARAM|AV_OPT_FLAG_RUNTIME_PARAM
357
358 #define DEFINE_NEIGHBOR_FILTER(name_, description_)          \
359 AVFILTER_DEFINE_CLASS(name_);                                \
360                                                              \
361 const AVFilter ff_vf_##name_ = {                                   \
362     .name          = #name_,                                 \
363     .description   = NULL_IF_CONFIG_SMALL(description_),     \
364     .priv_size     = sizeof(NContext),                       \
365     .priv_class    = &name_##_class,                         \
366     .query_formats = query_formats,                          \
367     .inputs        = neighbor_inputs,                        \
368     .outputs       = neighbor_outputs,                       \
369     .flags         = AVFILTER_FLAG_SUPPORT_TIMELINE_GENERIC| \
370                      AVFILTER_FLAG_SLICE_THREADS,            \
371     .process_command = ff_filter_process_command,            \
372 }
373
374 /* The following options are shared between all filters here;
375  * the de/inflate filters only use the threshold* options. */
376 #define DEINFLATE_OPTIONS_OFFSET (CONFIG_EROSION_FILTER || CONFIG_DILATION_FILTER)
377 static const AVOption options[] = {
378 #if CONFIG_EROSION_FILTER || CONFIG_DILATION_FILTER
379     { "coordinates", "set coordinates",               OFFSET(coordinates),    AV_OPT_TYPE_INT, {.i64=255},   0, 255,   FLAGS },
380 #endif
381     { "threshold0",  "set threshold for 1st plane",   OFFSET(threshold[0]),   AV_OPT_TYPE_INT, {.i64=65535}, 0, 65535, FLAGS },
382     { "threshold1",  "set threshold for 2nd plane",   OFFSET(threshold[1]),   AV_OPT_TYPE_INT, {.i64=65535}, 0, 65535, FLAGS },
383     { "threshold2",  "set threshold for 3rd plane",   OFFSET(threshold[2]),   AV_OPT_TYPE_INT, {.i64=65535}, 0, 65535, FLAGS },
384     { "threshold3",  "set threshold for 4th plane",   OFFSET(threshold[3]),   AV_OPT_TYPE_INT, {.i64=65535}, 0, 65535, FLAGS },
385     { NULL }
386 };
387
388 #if CONFIG_EROSION_FILTER
389
390 #define erosion_options options
391 DEFINE_NEIGHBOR_FILTER(erosion, "Apply erosion effect.");
392
393 #endif /* CONFIG_EROSION_FILTER */
394
395 #if CONFIG_DILATION_FILTER
396
397 #define dilation_options options
398 DEFINE_NEIGHBOR_FILTER(dilation, "Apply dilation effect.");
399
400 #endif /* CONFIG_DILATION_FILTER */
401
402 #if CONFIG_DEFLATE_FILTER
403
404 #define deflate_options &options[DEINFLATE_OPTIONS_OFFSET]
405 DEFINE_NEIGHBOR_FILTER(deflate, "Apply deflate effect.");
406
407 #endif /* CONFIG_DEFLATE_FILTER */
408
409 #if CONFIG_INFLATE_FILTER
410
411 #define inflate_options &options[DEINFLATE_OPTIONS_OFFSET]
412 DEFINE_NEIGHBOR_FILTER(inflate, "Apply inflate effect.");
413
414 #endif /* CONFIG_INFLATE_FILTER */