]> git.sesse.net Git - ffmpeg/blob - libavfilter/af_adelay.c
avfilter/af_adelay: allow setting delays in seconds
[ffmpeg] / libavfilter / af_adelay.c
1 /*
2  * Copyright (c) 2013 Paul B Mahol
3  *
4  * This file is part of FFmpeg.
5  *
6  * FFmpeg is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU Lesser General Public
8  * License as published by the Free Software Foundation; either
9  * version 2.1 of the License, or (at your option) any later version.
10  *
11  * FFmpeg is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14  * Lesser General Public License for more details.
15  *
16  * You should have received a copy of the GNU Lesser General Public
17  * License along with FFmpeg; if not, write to the Free Software
18  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
19  */
20
21 #include "libavutil/avstring.h"
22 #include "libavutil/eval.h"
23 #include "libavutil/opt.h"
24 #include "libavutil/samplefmt.h"
25 #include "avfilter.h"
26 #include "audio.h"
27 #include "filters.h"
28 #include "internal.h"
29
30 typedef struct ChanDelay {
31     int delay;
32     unsigned delay_index;
33     unsigned index;
34     uint8_t *samples;
35 } ChanDelay;
36
37 typedef struct AudioDelayContext {
38     const AVClass *class;
39     char *delays;
40     ChanDelay *chandelay;
41     int nb_delays;
42     int block_align;
43     int64_t padding;
44     int64_t max_delay;
45     int64_t next_pts;
46     int eof;
47
48     void (*delay_channel)(ChanDelay *d, int nb_samples,
49                           const uint8_t *src, uint8_t *dst);
50 } AudioDelayContext;
51
52 #define OFFSET(x) offsetof(AudioDelayContext, x)
53 #define A AV_OPT_FLAG_AUDIO_PARAM|AV_OPT_FLAG_FILTERING_PARAM
54
55 static const AVOption adelay_options[] = {
56     { "delays", "set list of delays for each channel", OFFSET(delays), AV_OPT_TYPE_STRING, {.str=NULL}, 0, 0, A },
57     { NULL }
58 };
59
60 AVFILTER_DEFINE_CLASS(adelay);
61
62 static int query_formats(AVFilterContext *ctx)
63 {
64     AVFilterChannelLayouts *layouts;
65     AVFilterFormats *formats;
66     static const enum AVSampleFormat sample_fmts[] = {
67         AV_SAMPLE_FMT_U8P, AV_SAMPLE_FMT_S16P, AV_SAMPLE_FMT_S32P,
68         AV_SAMPLE_FMT_FLTP, AV_SAMPLE_FMT_DBLP,
69         AV_SAMPLE_FMT_NONE
70     };
71     int ret;
72
73     layouts = ff_all_channel_counts();
74     if (!layouts)
75         return AVERROR(ENOMEM);
76     ret = ff_set_common_channel_layouts(ctx, layouts);
77     if (ret < 0)
78         return ret;
79
80     formats = ff_make_format_list(sample_fmts);
81     if (!formats)
82         return AVERROR(ENOMEM);
83     ret = ff_set_common_formats(ctx, formats);
84     if (ret < 0)
85         return ret;
86
87     formats = ff_all_samplerates();
88     if (!formats)
89         return AVERROR(ENOMEM);
90     return ff_set_common_samplerates(ctx, formats);
91 }
92
93 #define DELAY(name, type, fill)                                           \
94 static void delay_channel_## name ##p(ChanDelay *d, int nb_samples,       \
95                                       const uint8_t *ssrc, uint8_t *ddst) \
96 {                                                                         \
97     const type *src = (type *)ssrc;                                       \
98     type *dst = (type *)ddst;                                             \
99     type *samples = (type *)d->samples;                                   \
100                                                                           \
101     while (nb_samples) {                                                  \
102         if (d->delay_index < d->delay) {                                  \
103             const int len = FFMIN(nb_samples, d->delay - d->delay_index); \
104                                                                           \
105             memcpy(&samples[d->delay_index], src, len * sizeof(type));    \
106             memset(dst, fill, len * sizeof(type));                        \
107             d->delay_index += len;                                        \
108             src += len;                                                   \
109             dst += len;                                                   \
110             nb_samples -= len;                                            \
111         } else {                                                          \
112             *dst = samples[d->index];                                     \
113             samples[d->index] = *src;                                     \
114             nb_samples--;                                                 \
115             d->index++;                                                   \
116             src++, dst++;                                                 \
117             d->index = d->index >= d->delay ? 0 : d->index;               \
118         }                                                                 \
119     }                                                                     \
120 }
121
122 DELAY(u8,  uint8_t, 0x80)
123 DELAY(s16, int16_t, 0)
124 DELAY(s32, int32_t, 0)
125 DELAY(flt, float,   0)
126 DELAY(dbl, double,  0)
127
128 static int config_input(AVFilterLink *inlink)
129 {
130     AVFilterContext *ctx = inlink->dst;
131     AudioDelayContext *s = ctx->priv;
132     char *p, *arg, *saveptr = NULL;
133     int i;
134
135     s->chandelay = av_calloc(inlink->channels, sizeof(*s->chandelay));
136     if (!s->chandelay)
137         return AVERROR(ENOMEM);
138     s->nb_delays = inlink->channels;
139     s->block_align = av_get_bytes_per_sample(inlink->format);
140
141     p = s->delays;
142     for (i = 0; i < s->nb_delays; i++) {
143         ChanDelay *d = &s->chandelay[i];
144         float delay, div;
145         char type = 0;
146         int ret;
147
148         if (!(arg = av_strtok(p, "|", &saveptr)))
149             break;
150
151         p = NULL;
152
153         ret = av_sscanf(arg, "%d%c", &d->delay, &type);
154         if (ret != 2 || type != 'S') {
155             div = type == 's' ? 1.0 : 1000.0;
156             av_sscanf(arg, "%f", &delay);
157             d->delay = delay * inlink->sample_rate / div;
158         }
159
160         if (d->delay < 0) {
161             av_log(ctx, AV_LOG_ERROR, "Delay must be non negative number.\n");
162             return AVERROR(EINVAL);
163         }
164     }
165
166     s->padding = s->chandelay[0].delay;
167     for (i = 1; i < s->nb_delays; i++) {
168         ChanDelay *d = &s->chandelay[i];
169
170         s->padding = FFMIN(s->padding, d->delay);
171     }
172
173     if (s->padding) {
174         for (i = 0; i < s->nb_delays; i++) {
175             ChanDelay *d = &s->chandelay[i];
176
177             d->delay -= s->padding;
178         }
179     }
180
181     for (i = 0; i < s->nb_delays; i++) {
182         ChanDelay *d = &s->chandelay[i];
183
184         if (!d->delay)
185             continue;
186
187         d->samples = av_malloc_array(d->delay, s->block_align);
188         if (!d->samples)
189             return AVERROR(ENOMEM);
190
191         s->max_delay = FFMAX(s->max_delay, d->delay);
192     }
193
194     switch (inlink->format) {
195     case AV_SAMPLE_FMT_U8P : s->delay_channel = delay_channel_u8p ; break;
196     case AV_SAMPLE_FMT_S16P: s->delay_channel = delay_channel_s16p; break;
197     case AV_SAMPLE_FMT_S32P: s->delay_channel = delay_channel_s32p; break;
198     case AV_SAMPLE_FMT_FLTP: s->delay_channel = delay_channel_fltp; break;
199     case AV_SAMPLE_FMT_DBLP: s->delay_channel = delay_channel_dblp; break;
200     }
201
202     return 0;
203 }
204
205 static int filter_frame(AVFilterLink *inlink, AVFrame *frame)
206 {
207     AVFilterContext *ctx = inlink->dst;
208     AudioDelayContext *s = ctx->priv;
209     AVFrame *out_frame;
210     int i;
211
212     if (ctx->is_disabled || !s->delays)
213         return ff_filter_frame(ctx->outputs[0], frame);
214
215     out_frame = ff_get_audio_buffer(ctx->outputs[0], frame->nb_samples);
216     if (!out_frame) {
217         av_frame_free(&frame);
218         return AVERROR(ENOMEM);
219     }
220     av_frame_copy_props(out_frame, frame);
221
222     for (i = 0; i < s->nb_delays; i++) {
223         ChanDelay *d = &s->chandelay[i];
224         const uint8_t *src = frame->extended_data[i];
225         uint8_t *dst = out_frame->extended_data[i];
226
227         if (!d->delay)
228             memcpy(dst, src, frame->nb_samples * s->block_align);
229         else
230             s->delay_channel(d, frame->nb_samples, src, dst);
231     }
232
233     out_frame->pts = s->next_pts;
234     s->next_pts += av_rescale_q(frame->nb_samples, (AVRational){1, inlink->sample_rate}, inlink->time_base);
235     av_frame_free(&frame);
236     return ff_filter_frame(ctx->outputs[0], out_frame);
237 }
238
239 static int activate(AVFilterContext *ctx)
240 {
241     AVFilterLink *inlink = ctx->inputs[0];
242     AVFilterLink *outlink = ctx->outputs[0];
243     AudioDelayContext *s = ctx->priv;
244     AVFrame *frame = NULL;
245     int ret, status;
246     int64_t pts;
247
248     FF_FILTER_FORWARD_STATUS_BACK(outlink, inlink);
249
250     if (s->padding) {
251         int nb_samples = FFMIN(s->padding, 2048);
252
253         frame = ff_get_audio_buffer(outlink, nb_samples);
254         if (!frame)
255             return AVERROR(ENOMEM);
256         s->padding -= nb_samples;
257
258         av_samples_set_silence(frame->extended_data, 0,
259                                frame->nb_samples,
260                                outlink->channels,
261                                frame->format);
262
263         frame->pts = s->next_pts;
264         if (s->next_pts != AV_NOPTS_VALUE)
265             s->next_pts += av_rescale_q(nb_samples, (AVRational){1, outlink->sample_rate}, outlink->time_base);
266
267         return ff_filter_frame(outlink, frame);
268     }
269
270     ret = ff_inlink_consume_frame(inlink, &frame);
271     if (ret < 0)
272         return ret;
273
274     if (ret > 0)
275         return filter_frame(inlink, frame);
276
277     if (ff_inlink_acknowledge_status(inlink, &status, &pts)) {
278         if (status == AVERROR_EOF)
279             s->eof = 1;
280     }
281
282     if (s->eof && s->max_delay) {
283         int nb_samples = FFMIN(s->max_delay, 2048);
284
285         frame = ff_get_audio_buffer(outlink, nb_samples);
286         if (!frame)
287             return AVERROR(ENOMEM);
288         s->max_delay -= nb_samples;
289
290         av_samples_set_silence(frame->extended_data, 0,
291                                frame->nb_samples,
292                                outlink->channels,
293                                frame->format);
294
295         frame->pts = s->next_pts;
296         return filter_frame(inlink, frame);
297     }
298
299     if (s->eof && s->max_delay == 0) {
300         ff_outlink_set_status(outlink, AVERROR_EOF, s->next_pts);
301         return 0;
302     }
303
304     if (!s->eof)
305         FF_FILTER_FORWARD_WANTED(outlink, inlink);
306
307     return FFERROR_NOT_READY;
308 }
309
310 static av_cold void uninit(AVFilterContext *ctx)
311 {
312     AudioDelayContext *s = ctx->priv;
313
314     if (s->chandelay) {
315         for (int i = 0; i < s->nb_delays; i++)
316             av_freep(&s->chandelay[i].samples);
317     }
318     av_freep(&s->chandelay);
319 }
320
321 static const AVFilterPad adelay_inputs[] = {
322     {
323         .name         = "default",
324         .type         = AVMEDIA_TYPE_AUDIO,
325         .config_props = config_input,
326     },
327     { NULL }
328 };
329
330 static const AVFilterPad adelay_outputs[] = {
331     {
332         .name = "default",
333         .type = AVMEDIA_TYPE_AUDIO,
334     },
335     { NULL }
336 };
337
338 AVFilter ff_af_adelay = {
339     .name          = "adelay",
340     .description   = NULL_IF_CONFIG_SMALL("Delay one or more audio channels."),
341     .query_formats = query_formats,
342     .priv_size     = sizeof(AudioDelayContext),
343     .priv_class    = &adelay_class,
344     .activate      = activate,
345     .uninit        = uninit,
346     .inputs        = adelay_inputs,
347     .outputs       = adelay_outputs,
348     .flags         = AVFILTER_FLAG_SUPPORT_TIMELINE_INTERNAL,
349 };