]> git.sesse.net Git - ffmpeg/blob - libavcodec/ccaption_dec.c
avcodec/ccaption_dec: rework non-real-time mode with pop-on captions by delaying
[ffmpeg] / libavcodec / ccaption_dec.c
1 /*
2  * Closed Caption Decoding
3  * Copyright (c) 2015 Anshul Maheshwari
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include "avcodec.h"
23 #include "ass.h"
24 #include "libavutil/opt.h"
25
26 #define SCREEN_ROWS 15
27 #define SCREEN_COLUMNS 32
28
29 #define SET_FLAG(var, val)   ( (var) |=   ( 1 << (val)) )
30 #define UNSET_FLAG(var, val) ( (var) &=  ~( 1 << (val)) )
31 #define CHECK_FLAG(var, val) ( (var) &    ( 1 << (val)) )
32
33 static const AVRational ms_tb = {1, 1000};
34
35 enum cc_mode {
36     CCMODE_POPON,
37     CCMODE_PAINTON,
38     CCMODE_ROLLUP,
39     CCMODE_TEXT,
40 };
41
42 enum cc_color_code {
43     CCCOL_WHITE,
44     CCCOL_GREEN,
45     CCCOL_BLUE,
46     CCCOL_CYAN,
47     CCCOL_RED,
48     CCCOL_YELLOW,
49     CCCOL_MAGENTA,
50     CCCOL_USERDEFINED,
51     CCCOL_BLACK,
52     CCCOL_TRANSPARENT,
53 };
54
55 enum cc_font {
56     CCFONT_REGULAR,
57     CCFONT_ITALICS,
58     CCFONT_UNDERLINED,
59     CCFONT_UNDERLINED_ITALICS,
60 };
61
62 enum cc_charset {
63     CCSET_BASIC_AMERICAN,
64     CCSET_SPECIAL_AMERICAN,
65     CCSET_EXTENDED_SPANISH_FRENCH_MISC,
66     CCSET_EXTENDED_PORTUGUESE_GERMAN_DANISH,
67 };
68
69 static const char *charset_overrides[4][128] =
70 {
71     [CCSET_BASIC_AMERICAN] = {
72         [0x27] = "\u2019",
73         [0x2a] = "\u00e1",
74         [0x5c] = "\u00e9",
75         [0x5e] = "\u00ed",
76         [0x5f] = "\u00f3",
77         [0x60] = "\u00fa",
78         [0x7b] = "\u00e7",
79         [0x7c] = "\u00f7",
80         [0x7d] = "\u00d1",
81         [0x7e] = "\u00f1",
82         [0x7f] = "\u2588"
83     },
84     [CCSET_SPECIAL_AMERICAN] = {
85         [0x30] = "\u00ae",
86         [0x31] = "\u00b0",
87         [0x32] = "\u00bd",
88         [0x33] = "\u00bf",
89         [0x34] = "\u2122",
90         [0x35] = "\u00a2",
91         [0x36] = "\u00a3",
92         [0x37] = "\u266a",
93         [0x38] = "\u00e0",
94         [0x39] = "\u00A0",
95         [0x3a] = "\u00e8",
96         [0x3b] = "\u00e2",
97         [0x3c] = "\u00ea",
98         [0x3d] = "\u00ee",
99         [0x3e] = "\u00f4",
100         [0x3f] = "\u00fb",
101     },
102     [CCSET_EXTENDED_SPANISH_FRENCH_MISC] = {
103         [0x20] = "\u00c1",
104         [0x21] = "\u00c9",
105         [0x22] = "\u00d3",
106         [0x23] = "\u00da",
107         [0x24] = "\u00dc",
108         [0x25] = "\u00fc",
109         [0x26] = "\u00b4",
110         [0x27] = "\u00a1",
111         [0x28] = "*",
112         [0x29] = "\u2018",
113         [0x2a] = "-",
114         [0x2b] = "\u00a9",
115         [0x2c] = "\u2120",
116         [0x2d] = "\u00b7",
117         [0x2e] = "\u201c",
118         [0x2f] = "\u201d",
119         [0x30] = "\u00c0",
120         [0x31] = "\u00c2",
121         [0x32] = "\u00c7",
122         [0x33] = "\u00c8",
123         [0x34] = "\u00ca",
124         [0x35] = "\u00cb",
125         [0x36] = "\u00eb",
126         [0x37] = "\u00ce",
127         [0x38] = "\u00cf",
128         [0x39] = "\u00ef",
129         [0x3a] = "\u00d4",
130         [0x3b] = "\u00d9",
131         [0x3c] = "\u00f9",
132         [0x3d] = "\u00db",
133         [0x3e] = "\u00ab",
134         [0x3f] = "\u00bb",
135     },
136     [CCSET_EXTENDED_PORTUGUESE_GERMAN_DANISH] = {
137         [0x20] = "\u00c3",
138         [0x21] = "\u00e3",
139         [0x22] = "\u00cd",
140         [0x23] = "\u00cc",
141         [0x24] = "\u00ec",
142         [0x25] = "\u00d2",
143         [0x26] = "\u00f2",
144         [0x27] = "\u00d5",
145         [0x28] = "\u00f5",
146         [0x29] = "{",
147         [0x2a] = "}",
148         [0x2b] = "\\",
149         [0x2c] = "^",
150         [0x2d] = "_",
151         [0x2e] = "|",
152         [0x2f] = "~",
153         [0x30] = "\u00c4",
154         [0x31] = "\u00e4",
155         [0x32] = "\u00d6",
156         [0x33] = "\u00f6",
157         [0x34] = "\u00df",
158         [0x35] = "\u00a5",
159         [0x36] = "\u00a4",
160         [0x37] = "\u00a6",
161         [0x38] = "\u00c5",
162         [0x39] = "\u00e5",
163         [0x3a] = "\u00d8",
164         [0x3b] = "\u00f8",
165         [0x3c] = "\u250c",
166         [0x3d] = "\u2510",
167         [0x3e] = "\u2514",
168         [0x3f] = "\u2518",
169     },
170 };
171
172 static const unsigned char pac2_attribs[32][3] = // Color, font, ident
173 {
174     { CCCOL_WHITE,   CCFONT_REGULAR,            0 },  // 0x40 || 0x60
175     { CCCOL_WHITE,   CCFONT_UNDERLINED,         0 },  // 0x41 || 0x61
176     { CCCOL_GREEN,   CCFONT_REGULAR,            0 },  // 0x42 || 0x62
177     { CCCOL_GREEN,   CCFONT_UNDERLINED,         0 },  // 0x43 || 0x63
178     { CCCOL_BLUE,    CCFONT_REGULAR,            0 },  // 0x44 || 0x64
179     { CCCOL_BLUE,    CCFONT_UNDERLINED,         0 },  // 0x45 || 0x65
180     { CCCOL_CYAN,    CCFONT_REGULAR,            0 },  // 0x46 || 0x66
181     { CCCOL_CYAN,    CCFONT_UNDERLINED,         0 },  // 0x47 || 0x67
182     { CCCOL_RED,     CCFONT_REGULAR,            0 },  // 0x48 || 0x68
183     { CCCOL_RED,     CCFONT_UNDERLINED,         0 },  // 0x49 || 0x69
184     { CCCOL_YELLOW,  CCFONT_REGULAR,            0 },  // 0x4a || 0x6a
185     { CCCOL_YELLOW,  CCFONT_UNDERLINED,         0 },  // 0x4b || 0x6b
186     { CCCOL_MAGENTA, CCFONT_REGULAR,            0 },  // 0x4c || 0x6c
187     { CCCOL_MAGENTA, CCFONT_UNDERLINED,         0 },  // 0x4d || 0x6d
188     { CCCOL_WHITE,   CCFONT_ITALICS,            0 },  // 0x4e || 0x6e
189     { CCCOL_WHITE,   CCFONT_UNDERLINED_ITALICS, 0 },  // 0x4f || 0x6f
190     { CCCOL_WHITE,   CCFONT_REGULAR,            0 },  // 0x50 || 0x70
191     { CCCOL_WHITE,   CCFONT_UNDERLINED,         0 },  // 0x51 || 0x71
192     { CCCOL_WHITE,   CCFONT_REGULAR,            4 },  // 0x52 || 0x72
193     { CCCOL_WHITE,   CCFONT_UNDERLINED,         4 },  // 0x53 || 0x73
194     { CCCOL_WHITE,   CCFONT_REGULAR,            8 },  // 0x54 || 0x74
195     { CCCOL_WHITE,   CCFONT_UNDERLINED,         8 },  // 0x55 || 0x75
196     { CCCOL_WHITE,   CCFONT_REGULAR,           12 },  // 0x56 || 0x76
197     { CCCOL_WHITE,   CCFONT_UNDERLINED,        12 },  // 0x57 || 0x77
198     { CCCOL_WHITE,   CCFONT_REGULAR,           16 },  // 0x58 || 0x78
199     { CCCOL_WHITE,   CCFONT_UNDERLINED,        16 },  // 0x59 || 0x79
200     { CCCOL_WHITE,   CCFONT_REGULAR,           20 },  // 0x5a || 0x7a
201     { CCCOL_WHITE,   CCFONT_UNDERLINED,        20 },  // 0x5b || 0x7b
202     { CCCOL_WHITE,   CCFONT_REGULAR,           24 },  // 0x5c || 0x7c
203     { CCCOL_WHITE,   CCFONT_UNDERLINED,        24 },  // 0x5d || 0x7d
204     { CCCOL_WHITE,   CCFONT_REGULAR,           28 },  // 0x5e || 0x7e
205     { CCCOL_WHITE,   CCFONT_UNDERLINED,        28 }   // 0x5f || 0x7f
206     /* total 32 entries */
207 };
208
209 struct Screen {
210     /* +1 is used to compensate null character of string */
211     uint8_t characters[SCREEN_ROWS+1][SCREEN_COLUMNS+1];
212     uint8_t charsets[SCREEN_ROWS+1][SCREEN_COLUMNS+1];
213     uint8_t colors[SCREEN_ROWS+1][SCREEN_COLUMNS+1];
214     uint8_t fonts[SCREEN_ROWS+1][SCREEN_COLUMNS+1];
215     /*
216      * Bitmask of used rows; if a bit is not set, the
217      * corresponding row is not used.
218      * for setting row 1  use row | (1 << 0)
219      * for setting row 15 use row | (1 << 14)
220      */
221     int16_t row_used;
222 };
223
224 typedef struct CCaptionSubContext {
225     AVClass *class;
226     int real_time;
227     struct Screen screen[2];
228     int active_screen;
229     uint8_t cursor_row;
230     uint8_t cursor_column;
231     uint8_t cursor_color;
232     uint8_t cursor_font;
233     uint8_t cursor_charset;
234     AVBPrint buffer[2];
235     int buffer_index;
236     int buffer_changed;
237     int rollup;
238     enum cc_mode mode;
239     int64_t buffer_time[2];
240     int screen_touched;
241     int64_t last_real_time;
242     char prev_cmd[2];
243     int readorder;
244 } CCaptionSubContext;
245
246 static av_cold int init_decoder(AVCodecContext *avctx)
247 {
248     int ret;
249     CCaptionSubContext *ctx = avctx->priv_data;
250
251     av_bprint_init(&ctx->buffer[0], 0, AV_BPRINT_SIZE_UNLIMITED);
252     av_bprint_init(&ctx->buffer[1], 0, AV_BPRINT_SIZE_UNLIMITED);
253     /* taking by default roll up to 2 */
254     ctx->mode = CCMODE_ROLLUP;
255     ctx->rollup = 2;
256     ctx->cursor_row = 10;
257     ret = ff_ass_subtitle_header(avctx, "Monospace",
258                                  ASS_DEFAULT_FONT_SIZE,
259                                  ASS_DEFAULT_COLOR,
260                                  ASS_DEFAULT_BACK_COLOR,
261                                  ASS_DEFAULT_BOLD,
262                                  ASS_DEFAULT_ITALIC,
263                                  ASS_DEFAULT_UNDERLINE,
264                                  3,
265                                  ASS_DEFAULT_ALIGNMENT);
266     if (ret < 0) {
267         return ret;
268     }
269
270     return ret;
271 }
272
273 static av_cold int close_decoder(AVCodecContext *avctx)
274 {
275     CCaptionSubContext *ctx = avctx->priv_data;
276     av_bprint_finalize(&ctx->buffer[0], NULL);
277     av_bprint_finalize(&ctx->buffer[1], NULL);
278     return 0;
279 }
280
281 static void flush_decoder(AVCodecContext *avctx)
282 {
283     CCaptionSubContext *ctx = avctx->priv_data;
284     ctx->screen[0].row_used = 0;
285     ctx->screen[1].row_used = 0;
286     ctx->prev_cmd[0] = 0;
287     ctx->prev_cmd[1] = 0;
288     ctx->mode = CCMODE_ROLLUP;
289     ctx->rollup = 2;
290     ctx->cursor_row = 10;
291     ctx->cursor_column = 0;
292     ctx->cursor_font = 0;
293     ctx->cursor_color = 0;
294     ctx->cursor_charset = 0;
295     ctx->active_screen = 0;
296     ctx->last_real_time = 0;
297     ctx->screen_touched = 0;
298     ctx->buffer_changed = 0;
299     if (!(avctx->flags2 & AV_CODEC_FLAG2_RO_FLUSH_NOOP))
300         ctx->readorder = 0;
301     av_bprint_clear(&ctx->buffer[0]);
302     av_bprint_clear(&ctx->buffer[1]);
303 }
304
305 /**
306  * @param ctx closed caption context just to print log
307  */
308 static void write_char(CCaptionSubContext *ctx, struct Screen *screen, char ch)
309 {
310     uint8_t col = ctx->cursor_column;
311     char *row = screen->characters[ctx->cursor_row];
312     char *font = screen->fonts[ctx->cursor_row];
313     char *color = screen->colors[ctx->cursor_row];
314     char *charset = screen->charsets[ctx->cursor_row];
315
316     if (col < SCREEN_COLUMNS) {
317         row[col] = ch;
318         font[col] = ctx->cursor_font;
319         color[col] = ctx->cursor_color;
320         charset[col] = ctx->cursor_charset;
321         ctx->cursor_charset = CCSET_BASIC_AMERICAN;
322         if (ch) ctx->cursor_column++;
323         return;
324     }
325     /* We have extra space at end only for null character */
326     else if (col == SCREEN_COLUMNS && ch == 0) {
327         row[col] = ch;
328         return;
329     }
330     else {
331         av_log(ctx, AV_LOG_WARNING, "Data Ignored since exceeding screen width\n");
332         return;
333     }
334 }
335
336 /**
337  * This function after validating parity bit, also remove it from data pair.
338  * The first byte doesn't pass parity, we replace it with a solid blank
339  * and process the pair.
340  * If the second byte doesn't pass parity, it returns INVALIDDATA
341  * user can ignore the whole pair and pass the other pair.
342  */
343 static int validate_cc_data_pair(uint8_t *cc_data_pair)
344 {
345     uint8_t cc_valid = (*cc_data_pair & 4) >>2;
346     uint8_t cc_type = *cc_data_pair & 3;
347
348     if (!cc_valid)
349         return AVERROR_INVALIDDATA;
350
351     // if EIA-608 data then verify parity.
352     if (cc_type==0 || cc_type==1) {
353         if (!av_parity(cc_data_pair[2])) {
354             return AVERROR_INVALIDDATA;
355         }
356         if (!av_parity(cc_data_pair[1])) {
357             cc_data_pair[1]=0x7F;
358         }
359     }
360
361     //Skip non-data
362     if ((cc_data_pair[0] == 0xFA || cc_data_pair[0] == 0xFC || cc_data_pair[0] == 0xFD)
363          && (cc_data_pair[1] & 0x7F) == 0 && (cc_data_pair[2] & 0x7F) == 0)
364         return AVERROR_PATCHWELCOME;
365
366     //skip 708 data
367     if (cc_type == 3 || cc_type == 2)
368         return AVERROR_PATCHWELCOME;
369
370     return 0;
371 }
372
373 static struct Screen *get_writing_screen(CCaptionSubContext *ctx)
374 {
375     switch (ctx->mode) {
376     case CCMODE_POPON:
377         // use Inactive screen
378         return ctx->screen + !ctx->active_screen;
379     case CCMODE_PAINTON:
380     case CCMODE_ROLLUP:
381     case CCMODE_TEXT:
382         // use active screen
383         return ctx->screen + ctx->active_screen;
384     }
385     /* It was never an option */
386     return NULL;
387 }
388
389 static void roll_up(CCaptionSubContext *ctx)
390 {
391     struct Screen *screen;
392     int i, keep_lines;
393
394     if (ctx->mode == CCMODE_TEXT)
395         return;
396
397     screen = get_writing_screen(ctx);
398
399     /* +1 signify cursor_row starts from 0
400      * Can't keep lines less then row cursor pos
401      */
402     keep_lines = FFMIN(ctx->cursor_row + 1, ctx->rollup);
403
404     for (i = 0; i < SCREEN_ROWS; i++) {
405         if (i > ctx->cursor_row - keep_lines && i <= ctx->cursor_row)
406             continue;
407         UNSET_FLAG(screen->row_used, i);
408     }
409
410     for (i = 0; i < keep_lines && screen->row_used; i++) {
411         const int i_row = ctx->cursor_row - keep_lines + i + 1;
412
413         memcpy(screen->characters[i_row], screen->characters[i_row+1], SCREEN_COLUMNS);
414         memcpy(screen->colors[i_row], screen->colors[i_row+1], SCREEN_COLUMNS);
415         memcpy(screen->fonts[i_row], screen->fonts[i_row+1], SCREEN_COLUMNS);
416         memcpy(screen->charsets[i_row], screen->charsets[i_row+1], SCREEN_COLUMNS);
417         if (CHECK_FLAG(screen->row_used, i_row + 1))
418             SET_FLAG(screen->row_used, i_row);
419     }
420
421     UNSET_FLAG(screen->row_used, ctx->cursor_row);
422 }
423
424 static int capture_screen(CCaptionSubContext *ctx)
425 {
426     int i, j, tab = 0;
427     struct Screen *screen = ctx->screen + ctx->active_screen;
428     enum cc_font prev_font = CCFONT_REGULAR;
429     enum cc_color_code prev_color = CCCOL_WHITE;
430     const int bidx = ctx->buffer_index;
431
432     av_bprint_clear(&ctx->buffer[bidx]);
433
434     for (i = 0; screen->row_used && i < SCREEN_ROWS; i++)
435     {
436         if (CHECK_FLAG(screen->row_used, i)) {
437             const char *row = screen->characters[i];
438             const char *charset = screen->charsets[i];
439             j = 0;
440             while (row[j] == ' ' && charset[j] == CCSET_BASIC_AMERICAN)
441                 j++;
442             if (!tab || j < tab)
443                 tab = j;
444         }
445     }
446
447     for (i = 0; screen->row_used && i < SCREEN_ROWS; i++)
448     {
449         if (CHECK_FLAG(screen->row_used, i)) {
450             const char *row = screen->characters[i];
451             const char *font = screen->fonts[i];
452             const char *color = screen->colors[i];
453             const char *charset = screen->charsets[i];
454             const char *override;
455             int x, y, seen_char = 0;
456             j = 0;
457
458             /* skip leading space */
459             while (row[j] == ' ' && charset[j] == CCSET_BASIC_AMERICAN && j < tab)
460                 j++;
461
462             x = ASS_DEFAULT_PLAYRESX * (0.1 + 0.0250 * j);
463             y = ASS_DEFAULT_PLAYRESY * (0.1 + 0.0533 * i);
464             av_bprintf(&ctx->buffer[bidx], "{\\an7}{\\pos(%d,%d)}", x, y);
465
466             for (; j < SCREEN_COLUMNS; j++) {
467                 const char *e_tag = "", *s_tag = "", *c_tag = "";
468
469                 if (row[j] == 0)
470                     break;
471
472                 if (prev_font != font[j]) {
473                     switch (prev_font) {
474                     case CCFONT_ITALICS:
475                         e_tag = "{\\i0}";
476                         break;
477                     case CCFONT_UNDERLINED:
478                         e_tag = "{\\u0}";
479                         break;
480                     case CCFONT_UNDERLINED_ITALICS:
481                         e_tag = "{\\u0}{\\i0}";
482                         break;
483                     }
484                     switch (font[j]) {
485                     case CCFONT_ITALICS:
486                         s_tag = "{\\i1}";
487                         break;
488                     case CCFONT_UNDERLINED:
489                         s_tag = "{\\u1}";
490                         break;
491                     case CCFONT_UNDERLINED_ITALICS:
492                         s_tag = "{\\u1}{\\i1}";
493                         break;
494                     }
495                 }
496                 if (prev_color != color[j]) {
497                     switch (color[j]) {
498                     case CCCOL_WHITE:
499                         c_tag = "{\\c&HFFFFFF&}";
500                         break;
501                     case CCCOL_GREEN:
502                         c_tag = "{\\c&H00FF00&}";
503                         break;
504                     case CCCOL_BLUE:
505                         c_tag = "{\\c&HFF0000&}";
506                         break;
507                     case CCCOL_CYAN:
508                         c_tag = "{\\c&HFFFF00&}";
509                         break;
510                     case CCCOL_RED:
511                         c_tag = "{\\c&H0000FF&}";
512                         break;
513                     case CCCOL_YELLOW:
514                         c_tag = "{\\c&H00FFFF&}";
515                         break;
516                     case CCCOL_MAGENTA:
517                         c_tag = "{\\c&HFF00FF&}";
518                         break;
519                     }
520                 }
521
522                 prev_font = font[j];
523                 prev_color = color[j];
524                 override = charset_overrides[(int)charset[j]][(int)row[j]];
525                 if (override) {
526                     av_bprintf(&ctx->buffer[bidx], "%s%s%s%s", e_tag, s_tag, c_tag, override);
527                     seen_char = 1;
528                 } else if (row[j] == ' ' && !seen_char) {
529                     av_bprintf(&ctx->buffer[bidx], "%s%s%s\\h", e_tag, s_tag, c_tag);
530                 } else {
531                     av_bprintf(&ctx->buffer[bidx], "%s%s%s%c", e_tag, s_tag, c_tag, row[j]);
532                     seen_char = 1;
533                 }
534
535             }
536             av_bprintf(&ctx->buffer[bidx], "\\N");
537         }
538     }
539     if (!av_bprint_is_complete(&ctx->buffer[bidx]))
540         return AVERROR(ENOMEM);
541     if (screen->row_used && ctx->buffer[bidx].len >= 2) {
542         ctx->buffer[bidx].len -= 2;
543         ctx->buffer[bidx].str[ctx->buffer[bidx].len] = 0;
544     }
545     ctx->buffer_changed = 1;
546     return 0;
547 }
548
549 static void update_time(CCaptionSubContext *ctx, int64_t pts)
550 {
551     ctx->buffer_time[0] = ctx->buffer_time[1];
552     ctx->buffer_time[1] = pts;
553 }
554
555 static void handle_textattr(CCaptionSubContext *ctx, uint8_t hi, uint8_t lo)
556 {
557     int i = lo - 0x20;
558     struct Screen *screen = get_writing_screen(ctx);
559
560     if (i >= 32)
561         return;
562
563     ctx->cursor_color = pac2_attribs[i][0];
564     ctx->cursor_font = pac2_attribs[i][1];
565
566     SET_FLAG(screen->row_used, ctx->cursor_row);
567     write_char(ctx, screen, ' ');
568 }
569
570 static void handle_pac(CCaptionSubContext *ctx, uint8_t hi, uint8_t lo)
571 {
572     static const int8_t row_map[] = {
573         11, -1, 1, 2, 3, 4, 12, 13, 14, 15, 5, 6, 7, 8, 9, 10
574     };
575     const int index = ( (hi<<1) & 0x0e) | ( (lo>>5) & 0x01 );
576     struct Screen *screen = get_writing_screen(ctx);
577     int indent, i;
578
579     if (row_map[index] <= 0) {
580         av_log(ctx, AV_LOG_DEBUG, "Invalid pac index encountered\n");
581         return;
582     }
583
584     lo &= 0x1f;
585
586     ctx->cursor_row = row_map[index] - 1;
587     ctx->cursor_color =  pac2_attribs[lo][0];
588     ctx->cursor_font = pac2_attribs[lo][1];
589     ctx->cursor_charset = CCSET_BASIC_AMERICAN;
590     ctx->cursor_column = 0;
591     indent = pac2_attribs[lo][2];
592     for (i = 0; i < indent; i++) {
593         write_char(ctx, screen, ' ');
594     }
595 }
596
597 static int handle_edm(CCaptionSubContext *ctx)
598 {
599     struct Screen *screen = ctx->screen + ctx->active_screen;
600     int ret;
601
602     // In buffered mode, keep writing to screen until it is wiped.
603     // Before wiping the display, capture contents to emit subtitle.
604     if (!ctx->real_time)
605         ret = capture_screen(ctx);
606
607     screen->row_used = 0;
608
609     // In realtime mode, emit an empty caption so the last one doesn't
610     // stay on the screen.
611     if (ctx->real_time)
612         ret = capture_screen(ctx);
613
614     return ret;
615 }
616
617 static int handle_eoc(CCaptionSubContext *ctx)
618 {
619     int ret;
620
621     ctx->active_screen = !ctx->active_screen;
622
623     // In buffered mode, we wait til the *next* EOC and
624     // capture what was already on the screen since the last EOC.
625     if (!ctx->real_time)
626         ret = handle_edm(ctx);
627
628     ctx->cursor_column = 0;
629
630     // In realtime mode, we display the buffered contents (after
631     // flipping the buffer to active above) as soon as EOC arrives.
632     if (ctx->real_time)
633         ret = capture_screen(ctx);
634
635     return ret;
636 }
637
638 static void handle_delete_end_of_row(CCaptionSubContext *ctx)
639 {
640     struct Screen *screen = get_writing_screen(ctx);
641     write_char(ctx, screen, 0);
642 }
643
644 static void handle_char(CCaptionSubContext *ctx, char hi, char lo)
645 {
646     struct Screen *screen = get_writing_screen(ctx);
647
648     SET_FLAG(screen->row_used, ctx->cursor_row);
649
650     switch (hi) {
651       case 0x11:
652         ctx->cursor_charset = CCSET_SPECIAL_AMERICAN;
653         break;
654       case 0x12:
655         if (ctx->cursor_column > 0)
656             ctx->cursor_column -= 1;
657         ctx->cursor_charset = CCSET_EXTENDED_SPANISH_FRENCH_MISC;
658         break;
659       case 0x13:
660         if (ctx->cursor_column > 0)
661             ctx->cursor_column -= 1;
662         ctx->cursor_charset = CCSET_EXTENDED_PORTUGUESE_GERMAN_DANISH;
663         break;
664       default:
665         ctx->cursor_charset = CCSET_BASIC_AMERICAN;
666         write_char(ctx, screen, hi);
667         break;
668     }
669
670     if (lo) {
671         write_char(ctx, screen, lo);
672     }
673     write_char(ctx, screen, 0);
674
675     if (ctx->mode != CCMODE_POPON)
676         ctx->screen_touched = 1;
677
678     if (lo)
679        ff_dlog(ctx, "(%c,%c)\n", hi, lo);
680     else
681        ff_dlog(ctx, "(%c)\n", hi);
682 }
683
684 static int process_cc608(CCaptionSubContext *ctx, uint8_t hi, uint8_t lo)
685 {
686     int ret = 0;
687
688     if (hi == ctx->prev_cmd[0] && lo == ctx->prev_cmd[1]) {
689         return 0;
690     }
691
692     /* set prev command */
693     ctx->prev_cmd[0] = hi;
694     ctx->prev_cmd[1] = lo;
695
696     if ( (hi == 0x10 && (lo >= 0x40 && lo <= 0x5f)) ||
697        ( (hi >= 0x11 && hi <= 0x17) && (lo >= 0x40 && lo <= 0x7f) ) ) {
698         handle_pac(ctx, hi, lo);
699     } else if ( ( hi == 0x11 && lo >= 0x20 && lo <= 0x2f ) ||
700                 ( hi == 0x17 && lo >= 0x2e && lo <= 0x2f) ) {
701         handle_textattr(ctx, hi, lo);
702     } else if (hi == 0x14 || hi == 0x15 || hi == 0x1c) {
703         switch (lo) {
704         case 0x20:
705             /* resume caption loading */
706             ctx->mode = CCMODE_POPON;
707             break;
708         case 0x24:
709             handle_delete_end_of_row(ctx);
710             break;
711         case 0x25:
712         case 0x26:
713         case 0x27:
714             ctx->rollup = lo - 0x23;
715             ctx->mode = CCMODE_ROLLUP;
716             break;
717         case 0x29:
718             /* resume direct captioning */
719             ctx->mode = CCMODE_PAINTON;
720             break;
721         case 0x2b:
722             /* resume text display */
723             ctx->mode = CCMODE_TEXT;
724             break;
725         case 0x2c:
726             /* erase display memory */
727             handle_edm(ctx);
728             break;
729         case 0x2d:
730             /* carriage return */
731             ff_dlog(ctx, "carriage return\n");
732             if (!ctx->real_time)
733                 ret = capture_screen(ctx);
734             roll_up(ctx);
735             ctx->cursor_column = 0;
736             break;
737         case 0x2e:
738             /* erase buffered (non displayed) memory */
739             // Only in realtime mode. In buffered mode, we re-use the inactive screen
740             // for our own buffering.
741             if (ctx->real_time) {
742                 struct Screen *screen = ctx->screen + !ctx->active_screen;
743                 screen->row_used = 0;
744             }
745             break;
746         case 0x2f:
747             /* end of caption */
748             ff_dlog(ctx, "handle_eoc\n");
749             ret = handle_eoc(ctx);
750             break;
751         default:
752             ff_dlog(ctx, "Unknown command 0x%hhx 0x%hhx\n", hi, lo);
753             break;
754         }
755     } else if (hi >= 0x11 && hi <= 0x13) {
756         /* Special characters */
757         handle_char(ctx, hi, lo);
758     } else if (hi >= 0x20) {
759         /* Standard characters (always in pairs) */
760         handle_char(ctx, hi, lo);
761         ctx->prev_cmd[0] = ctx->prev_cmd[1] = 0;
762     } else if (hi == 0x17 && lo >= 0x21 && lo <= 0x23) {
763         int i;
764         /* Tab offsets (spacing) */
765         for (i = 0; i < lo - 0x20; i++) {
766             handle_char(ctx, ' ', 0);
767         }
768     } else {
769         /* Ignoring all other non data code */
770         ff_dlog(ctx, "Unknown command 0x%hhx 0x%hhx\n", hi, lo);
771     }
772
773     return ret;
774 }
775
776 static int decode(AVCodecContext *avctx, void *data, int *got_sub, AVPacket *avpkt)
777 {
778     CCaptionSubContext *ctx = avctx->priv_data;
779     AVSubtitle *sub = data;
780     int64_t in_time = sub->pts;
781     int64_t start_time;
782     int64_t end_time;
783     int bidx = ctx->buffer_index;
784     uint8_t *bptr = NULL;
785     int len = avpkt->size;
786     int ret = 0;
787     int i;
788
789     bptr = avpkt->data;
790
791     for (i = 0; i < len; i += 3) {
792         uint8_t cc_type = *(bptr + i) & 3;
793         if (validate_cc_data_pair(bptr + i))
794             continue;
795         /* ignoring data field 1 */
796         if (cc_type == 1)
797             continue;
798
799         ret = process_cc608(ctx, bptr[i + 1] & 0x7f, bptr[i + 2] & 0x7f);
800         if (ret < 0)
801             return ret;
802
803         if (!ctx->buffer_changed)
804             continue;
805         ctx->buffer_changed = 0;
806
807         if (!ctx->real_time && ctx->mode == CCMODE_POPON)
808             ctx->buffer_index = bidx = !ctx->buffer_index;
809
810         update_time(ctx, in_time);
811
812         if (ctx->buffer[bidx].str[0] || ctx->real_time) {
813             ff_dlog(ctx, "cdp writing data (%s)\n", ctx->buffer[bidx].str);
814             start_time = ctx->buffer_time[0];
815             sub->pts = start_time;
816             end_time = ctx->buffer_time[1];
817             if (!ctx->real_time)
818                 sub->end_display_time = av_rescale_q(end_time - start_time,
819                                                      AV_TIME_BASE_Q, ms_tb);
820             else
821                 sub->end_display_time = -1;
822             ret = ff_ass_add_rect(sub, ctx->buffer[bidx].str, ctx->readorder++, 0, NULL, NULL);
823             if (ret < 0)
824                 return ret;
825             ctx->last_real_time = sub->pts;
826             ctx->screen_touched = 0;
827         }
828     }
829
830     if (!bptr && !ctx->real_time && ctx->buffer[!ctx->buffer_index].str[0]) {
831         bidx = !ctx->buffer_index;
832         ret = ff_ass_add_rect(sub, ctx->buffer[bidx].str, ctx->readorder++, 0, NULL, NULL);
833         if (ret < 0)
834             return ret;
835         sub->pts = ctx->buffer_time[1];
836         sub->end_display_time = av_rescale_q(ctx->buffer_time[1] - ctx->buffer_time[0],
837                                              AV_TIME_BASE_Q, ms_tb);
838         if (sub->end_display_time == 0)
839             sub->end_display_time = ctx->buffer[bidx].len * 20;
840     }
841
842     if (ctx->real_time && ctx->screen_touched &&
843         sub->pts > ctx->last_real_time + av_rescale_q(200, ms_tb, AV_TIME_BASE_Q)) {
844         ctx->last_real_time = sub->pts;
845         ctx->screen_touched = 0;
846
847         capture_screen(ctx);
848         ctx->buffer_changed = 0;
849
850         ret = ff_ass_add_rect(sub, ctx->buffer[bidx].str, ctx->readorder++, 0, NULL, NULL);
851         if (ret < 0)
852             return ret;
853         sub->end_display_time = -1;
854     }
855
856     *got_sub = sub->num_rects > 0;
857     return ret;
858 }
859
860 #define OFFSET(x) offsetof(CCaptionSubContext, x)
861 #define SD AV_OPT_FLAG_SUBTITLE_PARAM | AV_OPT_FLAG_DECODING_PARAM
862 static const AVOption options[] = {
863     { "real_time", "emit subtitle events as they are decoded for real-time display", OFFSET(real_time), AV_OPT_TYPE_BOOL, { .i64 = 0 }, 0, 1, SD },
864     {NULL}
865 };
866
867 static const AVClass ccaption_dec_class = {
868     .class_name = "Closed caption Decoder",
869     .item_name  = av_default_item_name,
870     .option     = options,
871     .version    = LIBAVUTIL_VERSION_INT,
872 };
873
874 AVCodec ff_ccaption_decoder = {
875     .name           = "cc_dec",
876     .long_name      = NULL_IF_CONFIG_SMALL("Closed Caption (EIA-608 / CEA-708)"),
877     .type           = AVMEDIA_TYPE_SUBTITLE,
878     .id             = AV_CODEC_ID_EIA_608,
879     .priv_data_size = sizeof(CCaptionSubContext),
880     .init           = init_decoder,
881     .close          = close_decoder,
882     .flush          = flush_decoder,
883     .decode         = decode,
884     .priv_class     = &ccaption_dec_class,
885     .capabilities   = AV_CODEC_CAP_DELAY,
886 };