]> git.sesse.net Git - ffmpeg/blob - libavfilter/vf_drawtext.c
9fb3cea2265eaeb865f2aa7de37a3b49b227ed50
[ffmpeg] / libavfilter / vf_drawtext.c
1 /*
2  * Copyright (c) 2011 Stefano Sabatini
3  * Copyright (c) 2010 S.N. Hemanth Meenakshisundaram
4  * Copyright (c) 2003 Gustavo Sverzut Barbieri <gsbarbieri@yahoo.com.br>
5  *
6  * This file is part of FFmpeg.
7  *
8  * FFmpeg is free software; you can redistribute it and/or
9  * modify it under the terms of the GNU Lesser General Public
10  * License as published by the Free Software Foundation; either
11  * version 2.1 of the License, or (at your option) any later version.
12  *
13  * FFmpeg is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16  * Lesser General Public License for more details.
17  *
18  * You should have received a copy of the GNU Lesser General Public
19  * License along with FFmpeg; if not, write to the Free Software
20  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
21  */
22
23 /**
24  * @file
25  * drawtext filter, based on the original FFmpeg vhook/drawtext.c
26  * filter by Gustavo Sverzut Barbieri
27  */
28
29 #include <sys/time.h>
30 #include <time.h>
31
32 #include "libavutil/colorspace.h"
33 #include "libavutil/file.h"
34 #include "libavutil/opt.h"
35 #include "libavutil/parseutils.h"
36 #include "libavutil/pixdesc.h"
37 #include "libavutil/tree.h"
38 #include "avfilter.h"
39 #include "drawutils.h"
40
41 #undef time
42
43 #include <ft2build.h>
44 #include <freetype/config/ftheader.h>
45 #include FT_FREETYPE_H
46 #include FT_GLYPH_H
47
48 typedef struct {
49     const AVClass *class;
50     uint8_t *fontfile;              ///< font to be used
51     uint8_t *text;                  ///< text to be drawn
52     uint8_t *text_priv;             ///< used to detect whether text changed
53     int ft_load_flags;              ///< flags used for loading fonts, see FT_LOAD_*
54     FT_Vector *positions;           ///< positions for each element in the text
55     char *textfile;                 ///< file with text to be drawn
56     unsigned int x;                 ///< x position to start drawing text
57     unsigned int y;                 ///< y position to start drawing text
58     unsigned int fontsize;          ///< font size to use
59     char *fontcolor_string;         ///< font color as string
60     char *boxcolor_string;          ///< box color as string
61     uint8_t fontcolor[4];           ///< foreground color
62     uint8_t boxcolor[4];            ///< background color
63     uint8_t fontcolor_rgba[4];      ///< foreground color in RGBA
64     uint8_t boxcolor_rgba[4];       ///< background color in RGBA
65
66     short int draw_box;             ///< draw box around text - true or false
67     int use_kerning;                ///< font kerning is used - true/false
68     int tabsize;                    ///< tab size
69
70     FT_Library library;             ///< freetype font library handle
71     FT_Face face;                   ///< freetype font face handle
72     struct AVTreeNode *glyphs;      ///< rendered glyphs, stored using the UTF-32 char code
73     int hsub, vsub;                 ///< chroma subsampling values
74     int is_packed_rgb;
75     int pixel_step[4];              ///< distance in bytes between the component of each pixel
76     uint8_t rgba_map[4];            ///< map RGBA offsets to the positions in the packed RGBA format
77     uint8_t *box_line[4];           ///< line used for filling the box background
78 } DrawTextContext;
79
80 #define OFFSET(x) offsetof(DrawTextContext, x)
81
82 static const AVOption drawtext_options[]= {
83 {"fontfile", "set font file",        OFFSET(fontfile),         FF_OPT_TYPE_STRING, 0,  CHAR_MIN, CHAR_MAX },
84 {"text",     "set text",             OFFSET(text),             FF_OPT_TYPE_STRING, 0,  CHAR_MIN, CHAR_MAX },
85 {"textfile", "set text file",        OFFSET(textfile),         FF_OPT_TYPE_STRING, 0,  CHAR_MIN, CHAR_MAX },
86 {"fontcolor","set foreground color", OFFSET(fontcolor_string), FF_OPT_TYPE_STRING, 0,  CHAR_MIN, CHAR_MAX },
87 {"boxcolor", "set box color",        OFFSET(boxcolor_string),  FF_OPT_TYPE_STRING, 0,  CHAR_MIN, CHAR_MAX },
88 {"box",      "set box",              OFFSET(draw_box),         FF_OPT_TYPE_INT,    0,         0,        1 },
89 {"fontsize", "set font size",        OFFSET(fontsize),         FF_OPT_TYPE_INT,   16,         1,       72 },
90 {"x",        "set x",                OFFSET(x),                FF_OPT_TYPE_INT,    0,         0,  INT_MAX },
91 {"y",        "set y",                OFFSET(y),                FF_OPT_TYPE_INT,    0,         0,  INT_MAX },
92 {"tabsize",  "set tab size",         OFFSET(tabsize),          FF_OPT_TYPE_INT,    4,         0,  INT_MAX },
93
94 /* FT_LOAD_* flags */
95 {"ft_load_flags", "set font loading flags for libfreetype",   OFFSET(ft_load_flags),  FF_OPT_TYPE_FLAGS,  FT_LOAD_DEFAULT|FT_LOAD_RENDER, 0, INT_MAX, 0, "ft_load_flags" },
96 {"default",                     "set default",                     0, FF_OPT_TYPE_CONST, FT_LOAD_DEFAULT,                     INT_MIN, INT_MAX, 0, "ft_load_flags" },
97 {"no_scale",                    "set no_scale",                    0, FF_OPT_TYPE_CONST, FT_LOAD_NO_SCALE,                    INT_MIN, INT_MAX, 0, "ft_load_flags" },
98 {"no_hinting",                  "set no_hinting",                  0, FF_OPT_TYPE_CONST, FT_LOAD_NO_HINTING,                  INT_MIN, INT_MAX, 0, "ft_load_flags" },
99 {"render",                      "set render",                      0, FF_OPT_TYPE_CONST, FT_LOAD_RENDER,                      INT_MIN, INT_MAX, 0, "ft_load_flags" },
100 {"no_bitmap",                   "set no_bitmap",                   0, FF_OPT_TYPE_CONST, FT_LOAD_NO_BITMAP,                   INT_MIN, INT_MAX, 0, "ft_load_flags" },
101 {"vertical_layout",             "set vertical_layout",             0, FF_OPT_TYPE_CONST, FT_LOAD_VERTICAL_LAYOUT,             INT_MIN, INT_MAX, 0, "ft_load_flags" },
102 {"force_autohint",              "set force_autohint",              0, FF_OPT_TYPE_CONST, FT_LOAD_FORCE_AUTOHINT,              INT_MIN, INT_MAX, 0, "ft_load_flags" },
103 {"crop_bitmap",                 "set crop_bitmap",                 0, FF_OPT_TYPE_CONST, FT_LOAD_CROP_BITMAP,                 INT_MIN, INT_MAX, 0, "ft_load_flags" },
104 {"pedantic",                    "set pedantic",                    0, FF_OPT_TYPE_CONST, FT_LOAD_PEDANTIC,                    INT_MIN, INT_MAX, 0, "ft_load_flags" },
105 {"ignore_global_advance_width", "set ignore_global_advance_width", 0, FF_OPT_TYPE_CONST, FT_LOAD_IGNORE_GLOBAL_ADVANCE_WIDTH, INT_MIN, INT_MAX, 0, "ft_load_flags" },
106 {"no_recurse",                  "set no_recurse",                  0, FF_OPT_TYPE_CONST, FT_LOAD_NO_RECURSE,                  INT_MIN, INT_MAX, 0, "ft_load_flags" },
107 {"ignore_transform",            "set ignore_transform",            0, FF_OPT_TYPE_CONST, FT_LOAD_IGNORE_TRANSFORM,            INT_MIN, INT_MAX, 0, "ft_load_flags" },
108 {"monochrome",                  "set monochrome",                  0, FF_OPT_TYPE_CONST, FT_LOAD_MONOCHROME,                  INT_MIN, INT_MAX, 0, "ft_load_flags" },
109 {"linear_design",               "set linear_design",               0, FF_OPT_TYPE_CONST, FT_LOAD_LINEAR_DESIGN,               INT_MIN, INT_MAX, 0, "ft_load_flags" },
110 {"no_autohint",                 "set no_autohint",                 0, FF_OPT_TYPE_CONST, FT_LOAD_NO_AUTOHINT,                 INT_MIN, INT_MAX, 0, "ft_load_flags" },
111 {NULL},
112 };
113
114 static const char *drawtext_get_name(void *ctx)
115 {
116     return "drawtext";
117 }
118
119 static const AVClass drawtext_class = {
120     "DrawTextContext",
121     drawtext_get_name,
122     drawtext_options
123 };
124
125 #undef __FTERRORS_H__
126 #define FT_ERROR_START_LIST {
127 #define FT_ERRORDEF(e, v, s) { (e), (s) },
128 #define FT_ERROR_END_LIST { 0, NULL } };
129
130 struct ft_error
131 {
132     int err;
133     const char *err_msg;
134 } static ft_errors[] =
135 #include FT_ERRORS_H
136
137 #define FT_ERRMSG(e) ft_errors[e].err_msg
138
139 typedef struct {
140     FT_Glyph *glyph;
141     uint32_t code;
142     FT_Bitmap bitmap; ///< array holding bitmaps of font
143     FT_BBox bbox;
144     int advance;
145     int bitmap_left;
146     int bitmap_top;
147 } Glyph;
148
149 static int glyph_cmp(void *key, const void *b)
150 {
151     const Glyph *a = key, *bb = b;
152     int64_t diff = (int64_t)a->code - (int64_t)bb->code;
153     return diff > 0 ? 1 : diff < 0 ? -1 : 0;
154 }
155
156 /**
157  * Load glyphs corresponding to the UTF-32 codepoint code.
158  */
159 static int load_glyph(AVFilterContext *ctx, Glyph **glyph_ptr, uint32_t code)
160 {
161     DrawTextContext *dtext = ctx->priv;
162     Glyph *glyph;
163     struct AVTreeNode *node = NULL;
164     int ret;
165
166     /* load glyph into dtext->face->glyph */
167     if (FT_Load_Char(dtext->face, code, dtext->ft_load_flags))
168         return AVERROR(EINVAL);
169
170     /* save glyph */
171     if (!(glyph = av_mallocz(sizeof(*glyph))) ||
172         !(glyph->glyph = av_mallocz(sizeof(*glyph->glyph)))) {
173         ret = AVERROR(ENOMEM);
174         goto error;
175     }
176     glyph->code  = code;
177
178     if (FT_Get_Glyph(dtext->face->glyph, glyph->glyph)) {
179         ret = AVERROR(EINVAL);
180         goto error;
181     }
182
183     glyph->bitmap      = dtext->face->glyph->bitmap;
184     glyph->bitmap_left = dtext->face->glyph->bitmap_left;
185     glyph->bitmap_top  = dtext->face->glyph->bitmap_top;
186     glyph->advance     = dtext->face->glyph->advance.x >> 6;
187
188     /* measure text height to calculate text_height (or the maximum text height) */
189     FT_Glyph_Get_CBox(*glyph->glyph, ft_glyph_bbox_pixels, &glyph->bbox);
190
191     /* cache the newly created glyph */
192     if (!(node = av_mallocz(av_tree_node_size))) {
193         ret = AVERROR(ENOMEM);
194         goto error;
195     }
196     av_tree_insert(&dtext->glyphs, glyph, glyph_cmp, &node);
197
198     if (glyph_ptr)
199         *glyph_ptr = glyph;
200     return 0;
201
202 error:
203     if (glyph)
204         av_freep(&glyph->glyph);
205     av_freep(&glyph);
206     av_freep(&node);
207     return ret;
208 }
209
210 static av_cold int init(AVFilterContext *ctx, const char *args, void *opaque)
211 {
212     int err;
213     DrawTextContext *dtext = ctx->priv;
214     Glyph *glyph;
215
216     dtext->class = &drawtext_class;
217     av_opt_set_defaults2(dtext, 0, 0);
218     dtext->fontcolor_string = av_strdup("black");
219     dtext->boxcolor_string = av_strdup("white");
220
221     if ((err = (av_set_options_string(dtext, args, "=", ":"))) < 0) {
222         av_log(ctx, AV_LOG_ERROR, "Error parsing options string: '%s'\n", args);
223         return err;
224     }
225
226     if (!dtext->fontfile) {
227         av_log(ctx, AV_LOG_ERROR, "No font filename provided\n");
228         return AVERROR(EINVAL);
229     }
230
231     if (dtext->textfile) {
232         uint8_t *textbuf;
233         size_t textbuf_size;
234
235         if (dtext->text) {
236             av_log(ctx, AV_LOG_ERROR,
237                    "Both text and text file provided. Please provide only one\n");
238             return AVERROR(EINVAL);
239         }
240         if ((err = av_file_map(dtext->textfile, &textbuf, &textbuf_size, 0, ctx)) < 0) {
241             av_log(ctx, AV_LOG_ERROR,
242                    "The text file '%s' could not be read or is empty\n",
243                    dtext->textfile);
244             return err;
245         }
246
247         if (!(dtext->text = av_malloc(textbuf_size+1)))
248             return AVERROR(ENOMEM);
249         memcpy(dtext->text, textbuf, textbuf_size);
250         dtext->text[textbuf_size] = 0;
251         av_file_unmap(textbuf, textbuf_size);
252     }
253
254     if (!dtext->text) {
255         av_log(ctx, AV_LOG_ERROR,
256                "Either text or a valid file must be provided\n");
257         return AVERROR(EINVAL);
258     }
259
260     if ((err = av_parse_color(dtext->fontcolor_rgba, dtext->fontcolor_string, -1, ctx))) {
261         av_log(ctx, AV_LOG_ERROR,
262                "Invalid font color '%s'\n", dtext->fontcolor_string);
263         return err;
264     }
265
266     if ((err = av_parse_color(dtext->boxcolor_rgba, dtext->boxcolor_string, -1, ctx))) {
267         av_log(ctx, AV_LOG_ERROR,
268                "Invalid box color '%s'\n", dtext->boxcolor_string);
269         return err;
270     }
271
272     if ((err = FT_Init_FreeType(&(dtext->library)))) {
273         av_log(ctx, AV_LOG_ERROR,
274                "Could not load FreeType: %s\n", FT_ERRMSG(err));
275         return AVERROR(EINVAL);
276     }
277
278     /* load the face, and set up the encoding, which is by default UTF-8 */
279     if ((err = FT_New_Face(dtext->library, dtext->fontfile, 0, &dtext->face))) {
280         av_log(ctx, AV_LOG_ERROR, "Could not load fontface from file '%s': %s\n",
281                dtext->fontfile, FT_ERRMSG(err));
282         return AVERROR(EINVAL);
283     }
284     if ((err = FT_Set_Pixel_Sizes(dtext->face, 0, dtext->fontsize))) {
285         av_log(ctx, AV_LOG_ERROR, "Could not set font size to %d pixels: %s\n",
286                dtext->fontsize, FT_ERRMSG(err));
287         return AVERROR(EINVAL);
288     }
289
290     dtext->use_kerning = FT_HAS_KERNING(dtext->face);
291
292     /* load the fallback glyph with code 0 */
293     load_glyph(ctx, NULL, 0);
294
295     /* set the tabsize in pixels */
296     if ((err = load_glyph(ctx, &glyph, ' ') < 0)) {
297         av_log(ctx, AV_LOG_ERROR, "Could not set tabsize.\n");
298         return err;
299     }
300     dtext->tabsize *= glyph->advance;
301
302 #if !HAVE_LOCALTIME_R
303     av_log(ctx, AV_LOG_WARNING, "strftime() expansion unavailable!\n");
304 #endif
305
306     return 0;
307 }
308
309 static int query_formats(AVFilterContext *ctx)
310 {
311     static const enum PixelFormat pix_fmts[] = {
312         PIX_FMT_ARGB,    PIX_FMT_RGBA,
313         PIX_FMT_ABGR,    PIX_FMT_BGRA,
314         PIX_FMT_RGB24,   PIX_FMT_BGR24,
315         PIX_FMT_YUV420P, PIX_FMT_YUV444P,
316         PIX_FMT_YUV422P, PIX_FMT_YUV411P,
317         PIX_FMT_YUV410P, PIX_FMT_YUV440P,
318         PIX_FMT_NONE
319     };
320
321     avfilter_set_common_formats(ctx, avfilter_make_format_list(pix_fmts));
322     return 0;
323 }
324
325 static int glyph_enu_free(void *opaque, void *elem)
326 {
327     av_free(elem);
328     return 0;
329 }
330
331 static av_cold void uninit(AVFilterContext *ctx)
332 {
333     DrawTextContext *dtext = ctx->priv;
334     int i;
335
336     av_freep(&dtext->fontfile);
337     av_freep(&dtext->text);
338     av_freep(&dtext->fontcolor_string);
339     av_freep(&dtext->boxcolor_string);
340     av_freep(&dtext->positions);
341     av_tree_enumerate(dtext->glyphs, NULL, NULL, glyph_enu_free);
342     av_tree_destroy(dtext->glyphs);
343     dtext->glyphs = 0;
344     FT_Done_Face(dtext->face);
345     FT_Done_FreeType(dtext->library);
346
347     for (i = 0; i < 4; i++) {
348         av_freep(&dtext->box_line[i]);
349         dtext->pixel_step[i] = 0;
350     }
351
352 }
353
354 static int config_input(AVFilterLink *inlink)
355 {
356     DrawTextContext *dtext = inlink->dst->priv;
357     const AVPixFmtDescriptor *pix_desc = &av_pix_fmt_descriptors[inlink->format];
358     int ret;
359
360     dtext->hsub = pix_desc->log2_chroma_w;
361     dtext->vsub = pix_desc->log2_chroma_h;
362
363     if ((ret =
364          ff_fill_line_with_color(dtext->box_line, dtext->pixel_step,
365                                  inlink->w, dtext->boxcolor,
366                                  inlink->format, dtext->boxcolor_rgba,
367                                  &dtext->is_packed_rgb, dtext->rgba_map)) < 0)
368         return ret;
369
370     if (!dtext->is_packed_rgb) {
371         uint8_t *rgba = dtext->fontcolor_rgba;
372         dtext->fontcolor[0] = RGB_TO_Y_CCIR(rgba[0], rgba[1], rgba[2]);
373         dtext->fontcolor[1] = RGB_TO_U_CCIR(rgba[0], rgba[1], rgba[2], 0);
374         dtext->fontcolor[2] = RGB_TO_V_CCIR(rgba[0], rgba[1], rgba[2], 0);
375         dtext->fontcolor[3] = rgba[3];
376     }
377
378     return 0;
379 }
380
381 #define GET_BITMAP_VAL(r, c)                                            \
382     bitmap->pixel_mode == FT_PIXEL_MODE_MONO ?                          \
383         (bitmap->buffer[(r) * bitmap->pitch + ((c)>>3)] & (0x80 >> ((c)&7))) * 255 : \
384          bitmap->buffer[(r) * bitmap->pitch +  (c)]
385
386 #define SET_PIXEL_YUV(picref, yuva_color, val, x, y, hsub, vsub) {           \
387     luma_pos    = ((x)          ) + ((y)          ) * picref->linesize[0]; \
388     chroma_pos1 = ((x) >> (hsub)) + ((y) >> (vsub)) * picref->linesize[1]; \
389     chroma_pos2 = ((x) >> (hsub)) + ((y) >> (vsub)) * picref->linesize[2]; \
390     alpha = (yuva_color[3] * (val)) / 255;                               \
391     picref->data[0][luma_pos] = (alpha * yuva_color[0] + (255 - alpha) * picref->data[0][luma_pos]) >> 8; \
392     picref->data[1][chroma_pos1] = (alpha * yuva_color[1] + (255 - alpha) * picref->data[1][chroma_pos1]) >> 8; \
393     picref->data[2][chroma_pos2] = (alpha * yuva_color[2] + (255 - alpha) * picref->data[2][chroma_pos2]) >> 8; \
394 }
395
396 static inline int draw_glyph_yuv(AVFilterBufferRef *picref, FT_Bitmap *bitmap, unsigned int x,
397                                  unsigned int y, unsigned int width, unsigned int height,
398                                  const uint8_t yuva_color[4], int hsub, int vsub)
399 {
400     int r, c, alpha;
401     unsigned int luma_pos, chroma_pos1, chroma_pos2;
402     uint8_t src_val, dst_pixel[4];
403
404     for (r = 0; r < bitmap->rows && r+y < height; r++) {
405         for (c = 0; c < bitmap->width && c+x < width; c++) {
406             /* get pixel in the picref (destination) */
407             dst_pixel[0] = picref->data[0][  c+x           +  (y+r)          * picref->linesize[0]];
408             dst_pixel[1] = picref->data[1][((c+x) >> hsub) + ((y+r) >> vsub) * picref->linesize[1]];
409             dst_pixel[2] = picref->data[2][((c+x) >> hsub) + ((y+r) >> vsub) * picref->linesize[2]];
410
411             /* get intensity value in the glyph bitmap (source) */
412             src_val = GET_BITMAP_VAL(r, c);
413             if (!src_val)
414                 continue;
415
416             SET_PIXEL_YUV(picref, yuva_color, src_val, c+x, y+r, hsub, vsub);
417         }
418     }
419
420     return 0;
421 }
422
423 #define SET_PIXEL_RGB(picref, rgba_color, val, x, y, pixel_step, r_off, g_off, b_off, a_off) { \
424     p   = picref->data[0] + (x) * pixel_step + ((y) * picref->linesize[0]); \
425     alpha = (rgba_color[3] * (val)) / 255;                              \
426     *(p+r_off) = (alpha * rgba_color[0] + (255 - alpha) * *(p+r_off)) >> 8; \
427     *(p+g_off) = (alpha * rgba_color[1] + (255 - alpha) * *(p+g_off)) >> 8; \
428     *(p+b_off) = (alpha * rgba_color[2] + (255 - alpha) * *(p+b_off)) >> 8; \
429 }
430
431 static inline int draw_glyph_rgb(AVFilterBufferRef *picref, FT_Bitmap *bitmap,
432                                  unsigned int x, unsigned int y,
433                                  unsigned int width, unsigned int height, int pixel_step,
434                                  const uint8_t rgba_color[4], const uint8_t rgba_map[4])
435 {
436     int r, c, alpha;
437     uint8_t *p;
438     uint8_t src_val, dst_pixel[4];
439
440     for (r = 0; r < bitmap->rows && r+y < height; r++) {
441         for (c = 0; c < bitmap->width && c+x < width; c++) {
442             /* get pixel in the picref (destination) */
443             dst_pixel[0] = picref->data[0][(c+x + rgba_map[0]) * pixel_step +
444                                            (y+r) * picref->linesize[0]];
445             dst_pixel[1] = picref->data[0][(c+x + rgba_map[1]) * pixel_step +
446                                            (y+r) * picref->linesize[0]];
447             dst_pixel[2] = picref->data[0][(c+x + rgba_map[2]) * pixel_step +
448                                            (y+r) * picref->linesize[0]];
449
450             /* get intensity value in the glyph bitmap (source) */
451             src_val = GET_BITMAP_VAL(r, c);
452             if (!src_val)
453                 continue;
454
455             SET_PIXEL_RGB(picref, rgba_color, src_val, c+x, y+r, pixel_step,
456                           rgba_map[0], rgba_map[1], rgba_map[2], rgba_map[3]);
457         }
458     }
459
460     return 0;
461 }
462
463 static inline void drawbox(AVFilterBufferRef *picref, unsigned int x, unsigned int y,
464                            unsigned int width, unsigned int height,
465                            uint8_t *line[4], int pixel_step[4], uint8_t color[4],
466                            int hsub, int vsub, int is_rgba_packed, uint8_t rgba_map[4])
467 {
468     int i, j, alpha;
469
470     if (color[3] != 0xFF) {
471         if (is_rgba_packed) {
472             uint8_t *p;
473             for (j = 0; j < height; j++)
474                 for (i = 0; i < width; i++)
475                     SET_PIXEL_RGB(picref, color, 255, i+x, y+j, pixel_step[0],
476                                   rgba_map[0], rgba_map[1], rgba_map[2], rgba_map[3]);
477         } else {
478             unsigned int luma_pos, chroma_pos1, chroma_pos2;
479             for (j = 0; j < height; j++)
480                 for (i = 0; i < width; i++)
481                     SET_PIXEL_YUV(picref, color, 255, i+x, y+j, hsub, vsub);
482         }
483     } else {
484         ff_draw_rectangle(picref->data, picref->linesize,
485                           line, pixel_step, hsub, vsub,
486                           x, y, width, height);
487     }
488 }
489
490 static inline int is_newline(uint32_t c)
491 {
492     return (c == '\n' || c == '\r' || c == '\f' || c == '\v');
493 }
494
495 static int draw_text(AVFilterContext *ctx, AVFilterBufferRef *picref,
496                      int width, int height)
497 {
498     DrawTextContext *dtext = ctx->priv;
499     uint32_t code = 0, prev_code = 0;
500     int x = 0, y = 0, i = 0;
501     int text_height, baseline;
502     uint8_t *p;
503     int str_w = 0;
504     int y_min = 32000, y_max = -32000;
505     FT_Vector delta;
506     Glyph *glyph = NULL, *prev_glyph = NULL;
507     Glyph dummy = { 0 };
508
509     if (dtext->text != dtext->text_priv) {
510 #if HAVE_LOCALTIME_R
511         time_t now = time(0);
512         struct tm ltime;
513         uint8_t *buf = NULL;
514         int     buflen = 2*strlen(dtext->text) + 1, len;
515
516         localtime_r(&now, &ltime);
517
518         while ((buf = av_realloc(buf, buflen))) {
519             *buf = 1;
520             if ((len = strftime(buf, buflen, dtext->text, &ltime)) != 0 || *buf == 0)
521                 break;
522             buflen *= 2;
523         }
524         if (!buf)
525             return AVERROR(ENOMEM);
526         av_freep(&dtext->text);
527         dtext->text = dtext->text_priv = buf;
528 #else
529         dtext->text_priv = dtext->text;
530 #endif
531         if (!(dtext->positions = av_realloc(dtext->positions,
532                                             strlen(dtext->text)*sizeof(*dtext->positions))))
533             return AVERROR(ENOMEM);
534     }
535
536     x = dtext->x;
537     y = dtext->y;
538
539     /* load and cache glyphs */
540     for (i = 0, p = dtext->text; *p; i++) {
541         GET_UTF8(code, *p++, continue;);
542
543         /* get glyph */
544         dummy.code = code;
545         glyph = av_tree_find(dtext->glyphs, &dummy, glyph_cmp, NULL);
546         if (!glyph)
547             load_glyph(ctx, &glyph, code);
548
549         y_min = FFMIN(glyph->bbox.yMin, y_min);
550         y_max = FFMAX(glyph->bbox.yMax, y_max);
551     }
552     text_height = y_max - y_min;
553     baseline    = y_max;
554
555     /* compute and save position for each glyph */
556     glyph = NULL;
557     for (i = 0, p = dtext->text; *p; i++) {
558         GET_UTF8(code, *p++, continue;);
559
560         /* skip the \n in the sequence \r\n */
561         if (prev_code == '\r' && code == '\n')
562             continue;
563
564         prev_code = code;
565         if (is_newline(code)) {
566             str_w = FFMAX(str_w, x - dtext->x);
567             y += text_height;
568             x = dtext->x;
569             continue;
570         }
571
572         /* get glyph */
573         prev_glyph = glyph;
574         dummy.code = code;
575         glyph = av_tree_find(dtext->glyphs, &dummy, glyph_cmp, NULL);
576
577         /* kerning */
578         if (dtext->use_kerning && prev_glyph && glyph->code) {
579             FT_Get_Kerning(dtext->face, prev_glyph->code, glyph->code,
580                            ft_kerning_default, &delta);
581             x += delta.x >> 6;
582         }
583
584         if (x + glyph->bbox.xMax >= width) {
585             str_w = FFMAX(str_w, x - dtext->x);
586             y += text_height;
587             x = dtext->x;
588         }
589
590         /* save position */
591         dtext->positions[i].x = x + glyph->bitmap_left;
592         dtext->positions[i].y = y - glyph->bitmap_top + baseline;
593         if (code == '\t') x  = (x / dtext->tabsize + 1)*dtext->tabsize;
594         else              x += glyph->advance;
595     }
596
597     str_w = FFMIN(width - dtext->x - 1, FFMAX(str_w, x - dtext->x));
598     y     = FFMIN(y + text_height, height - 1);
599
600     /* draw box */
601     if (dtext->draw_box)
602         drawbox(picref, dtext->x, dtext->y, str_w, y-dtext->y,
603                 dtext->box_line, dtext->pixel_step, dtext->boxcolor,
604                 dtext->hsub, dtext->vsub, dtext->is_packed_rgb, dtext->rgba_map);
605
606     /* draw glyphs */
607     for (i = 0, p = dtext->text; *p; i++) {
608         Glyph dummy = { 0 };
609         GET_UTF8(code, *p++, continue;);
610
611         /* skip new line chars, just go to new line */
612         if (is_newline(code) || code == ' ' || code == '\t')
613             continue;
614
615         dummy.code = code;
616         glyph = av_tree_find(dtext->glyphs, &dummy, glyph_cmp, NULL);
617
618         if (glyph->bitmap.pixel_mode != FT_PIXEL_MODE_MONO &&
619             glyph->bitmap.pixel_mode != FT_PIXEL_MODE_GRAY)
620             return AVERROR(EINVAL);
621
622         if (dtext->is_packed_rgb) {
623             draw_glyph_rgb(picref, &glyph->bitmap,
624                            dtext->positions[i].x, dtext->positions[i].y, width, height,
625                            dtext->pixel_step[0], dtext->fontcolor_rgba, dtext->rgba_map);
626         } else {
627             draw_glyph_yuv(picref, &glyph->bitmap,
628                            dtext->positions[i].x, dtext->positions[i].y, width, height,
629                            dtext->fontcolor, dtext->hsub, dtext->vsub);
630         }
631     }
632
633     return 0;
634 }
635
636 static void null_draw_slice(AVFilterLink *link, int y, int h, int slice_dir) { }
637
638 static void end_frame(AVFilterLink *inlink)
639 {
640     AVFilterLink *outlink = inlink->dst->outputs[0];
641     AVFilterBufferRef *picref = inlink->cur_buf;
642
643     draw_text(inlink->dst, picref, picref->video->w, picref->video->h);
644
645     avfilter_draw_slice(outlink, 0, picref->video->h, 1);
646     avfilter_end_frame(outlink);
647 }
648
649 AVFilter avfilter_vf_drawtext = {
650     .name          = "drawtext",
651     .description   = NULL_IF_CONFIG_SMALL("Draw text on top of video frames using libfreetype library."),
652     .priv_size     = sizeof(DrawTextContext),
653     .init          = init,
654     .uninit        = uninit,
655     .query_formats = query_formats,
656
657     .inputs    = (AVFilterPad[]) {{ .name             = "default",
658                                     .type             = AVMEDIA_TYPE_VIDEO,
659                                     .get_video_buffer = avfilter_null_get_video_buffer,
660                                     .start_frame      = avfilter_null_start_frame,
661                                     .draw_slice       = null_draw_slice,
662                                     .end_frame        = end_frame,
663                                     .config_props     = config_input,
664                                     .min_perms        = AV_PERM_WRITE |
665                                                         AV_PERM_READ,
666                                     .rej_perms        = AV_PERM_PRESERVE },
667                                   { .name = NULL}},
668     .outputs   = (AVFilterPad[]) {{ .name             = "default",
669                                     .type             = AVMEDIA_TYPE_VIDEO, },
670                                   { .name = NULL}},
671 };