]> git.sesse.net Git - ffmpeg/blob - libavcodec/a64multienc.c
a64multienc: Do not entangle coded_frame
[ffmpeg] / libavcodec / a64multienc.c
1 /*
2  * a64 video encoder - multicolor modes
3  * Copyright (c) 2009 Tobias Bindhammer
4  *
5  * This file is part of Libav.
6  *
7  * Libav is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * Libav is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with Libav; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 /**
23  * @file
24  * a64 video encoder - multicolor modes
25  */
26
27 #include "a64enc.h"
28 #include "a64colors.h"
29 #include "a64tables.h"
30 #include "elbg.h"
31 #include "internal.h"
32 #include "libavutil/common.h"
33 #include "libavutil/intreadwrite.h"
34
35 #define DITHERSTEPS   8
36 #define CHARSET_CHARS 256
37 #define INTERLACED    1
38 #define CROP_SCREENS  1
39
40 /* gray gradient */
41 static const int mc_colors[5]={0x0,0xb,0xc,0xf,0x1};
42
43 /* other possible gradients - to be tested */
44 //static const int mc_colors[5]={0x0,0x8,0xa,0xf,0x7};
45 //static const int mc_colors[5]={0x0,0x9,0x8,0xa,0x3};
46
47 static void to_meta_with_crop(AVCodecContext *avctx,
48                               const AVFrame *p, int *dest)
49 {
50     int blockx, blocky, x, y;
51     int luma = 0;
52     int height = FFMIN(avctx->height, C64YRES);
53     int width  = FFMIN(avctx->width , C64XRES);
54     uint8_t *src = p->data[0];
55
56     for (blocky = 0; blocky < C64YRES; blocky += 8) {
57         for (blockx = 0; blockx < C64XRES; blockx += 8) {
58             for (y = blocky; y < blocky + 8 && y < C64YRES; y++) {
59                 for (x = blockx; x < blockx + 8 && x < C64XRES; x += 2) {
60                     if(x < width && y < height) {
61                         /* build average over 2 pixels */
62                         luma = (src[(x + 0 + y * p->linesize[0])] +
63                                 src[(x + 1 + y * p->linesize[0])]) / 2;
64                         /* write blocks as linear data now so they are suitable for elbg */
65                         dest[0] = luma;
66                     }
67                     dest++;
68                 }
69             }
70         }
71     }
72 }
73
74 static void render_charset(AVCodecContext *avctx, uint8_t *charset,
75                            uint8_t *colrammap)
76 {
77     A64Context *c = avctx->priv_data;
78     uint8_t row1, row2;
79     int charpos, x, y;
80     int a, b;
81     uint8_t pix;
82     int lowdiff, highdiff;
83     int *best_cb = c->mc_best_cb;
84     static uint8_t index1[256];
85     static uint8_t index2[256];
86     static uint8_t dither[256];
87     int i;
88     int distance;
89
90     /* generate lookup-tables for dither and index before looping */
91     i = 0;
92     for (a=0; a < 256; a++) {
93         if(i < c->mc_pal_size -1 && a == c->mc_luma_vals[i + 1]) {
94             distance = c->mc_luma_vals[i + 1] - c->mc_luma_vals[i];
95             for(b = 0; b <= distance; b++) {
96                   dither[c->mc_luma_vals[i] + b] = b * (DITHERSTEPS - 1) / distance;
97             }
98             i++;
99         }
100         if(i >= c->mc_pal_size - 1) dither[a] = 0;
101         index1[a] = i;
102         index2[a] = FFMIN(i + 1, c->mc_pal_size - 1);
103     }
104
105     /* and render charset */
106     for (charpos = 0; charpos < CHARSET_CHARS; charpos++) {
107         lowdiff  = 0;
108         highdiff = 0;
109         for (y = 0; y < 8; y++) {
110             row1 = 0; row2 = 0;
111             for (x = 0; x < 4; x++) {
112                 pix = best_cb[y * 4 + x];
113
114                 /* accumulate error for brightest/darkest color */
115                 if (index1[pix] >= 3)
116                     highdiff += pix - c->mc_luma_vals[3];
117                 if (index1[pix] < 1)
118                     lowdiff += c->mc_luma_vals[1] - pix;
119
120                 row1 <<= 2;
121
122                 if (INTERLACED) {
123                     row2 <<= 2;
124                     if (interlaced_dither_patterns[dither[pix]][(y & 3) * 2 + 0][x & 3])
125                         row1 |= 3-(index2[pix] & 3);
126                     else
127                         row1 |= 3-(index1[pix] & 3);
128
129                     if (interlaced_dither_patterns[dither[pix]][(y & 3) * 2 + 1][x & 3])
130                         row2 |= 3-(index2[pix] & 3);
131                     else
132                         row2 |= 3-(index1[pix] & 3);
133                 }
134                 else {
135                     if (multi_dither_patterns[dither[pix]][(y & 3)][x & 3])
136                         row1 |= 3-(index2[pix] & 3);
137                     else
138                         row1 |= 3-(index1[pix] & 3);
139                 }
140             }
141             charset[y+0x000] = row1;
142             if (INTERLACED) charset[y+0x800] = row2;
143         }
144         /* do we need to adjust pixels? */
145         if (highdiff > 0 && lowdiff > 0 && c->mc_use_5col) {
146             if (lowdiff > highdiff) {
147                 for (x = 0; x < 32; x++)
148                     best_cb[x] = FFMIN(c->mc_luma_vals[3], best_cb[x]);
149             } else {
150                 for (x = 0; x < 32; x++)
151                     best_cb[x] = FFMAX(c->mc_luma_vals[1], best_cb[x]);
152             }
153             charpos--;          /* redo now adjusted char */
154         /* no adjustment needed, all fine */
155         } else {
156             /* advance pointers */
157             best_cb += 32;
158             charset += 8;
159
160             /* remember colorram value */
161             colrammap[charpos] = (highdiff > 0);
162         }
163     }
164 }
165
166 static av_cold int a64multi_close_encoder(AVCodecContext *avctx)
167 {
168     A64Context *c = avctx->priv_data;
169     av_frame_free(&avctx->coded_frame);
170     av_free(c->mc_meta_charset);
171     av_free(c->mc_best_cb);
172     av_free(c->mc_charset);
173     av_free(c->mc_charmap);
174     av_free(c->mc_colram);
175     return 0;
176 }
177
178 static av_cold int a64multi_encode_init(AVCodecContext *avctx)
179 {
180     A64Context *c = avctx->priv_data;
181     int a;
182     av_lfg_init(&c->randctx, 1);
183
184     if (avctx->global_quality < 1) {
185         c->mc_lifetime = 4;
186     } else {
187         c->mc_lifetime = avctx->global_quality /= FF_QP2LAMBDA;
188     }
189
190     av_log(avctx, AV_LOG_INFO, "charset lifetime set to %d frame(s)\n", c->mc_lifetime);
191
192     c->mc_frame_counter = 0;
193     c->mc_use_5col      = avctx->codec->id == AV_CODEC_ID_A64_MULTI5;
194     c->mc_pal_size      = 4 + c->mc_use_5col;
195
196     /* precalc luma values for later use */
197     for (a = 0; a < c->mc_pal_size; a++) {
198         c->mc_luma_vals[a]=a64_palette[mc_colors[a]][0] * 0.30 +
199                            a64_palette[mc_colors[a]][1] * 0.59 +
200                            a64_palette[mc_colors[a]][2] * 0.11;
201     }
202
203     if (!(c->mc_meta_charset = av_malloc(32000 * c->mc_lifetime * sizeof(int))) ||
204        !(c->mc_best_cb       = av_malloc(CHARSET_CHARS * 32 * sizeof(int)))     ||
205        !(c->mc_charmap       = av_mallocz(1000 * c->mc_lifetime * sizeof(int))) ||
206        !(c->mc_colram        = av_mallocz(CHARSET_CHARS * sizeof(uint8_t)))     ||
207        !(c->mc_charset       = av_malloc(0x800 * (INTERLACED+1) * sizeof(uint8_t)))) {
208         av_log(avctx, AV_LOG_ERROR, "Failed to allocate buffer memory.\n");
209         return AVERROR(ENOMEM);
210     }
211
212     /* set up extradata */
213     if (!(avctx->extradata = av_mallocz(8 * 4 + FF_INPUT_BUFFER_PADDING_SIZE))) {
214         av_log(avctx, AV_LOG_ERROR, "Failed to allocate memory for extradata.\n");
215         return AVERROR(ENOMEM);
216     }
217     avctx->extradata_size = 8 * 4;
218     AV_WB32(avctx->extradata, c->mc_lifetime);
219     AV_WB32(avctx->extradata + 16, INTERLACED);
220
221     avctx->coded_frame = av_frame_alloc();
222     if (!avctx->coded_frame) {
223         a64multi_close_encoder(avctx);
224         return AVERROR(ENOMEM);
225     }
226
227     avctx->coded_frame->pict_type = AV_PICTURE_TYPE_I;
228     avctx->coded_frame->key_frame = 1;
229     if (!avctx->codec_tag)
230          avctx->codec_tag = AV_RL32("a64m");
231
232     c->next_pts = AV_NOPTS_VALUE;
233
234     return 0;
235 }
236
237 static void a64_compress_colram(unsigned char *buf, int *charmap, uint8_t *colram)
238 {
239     int a;
240     uint8_t temp;
241     /* only needs to be done in 5col mode */
242     /* XXX could be squeezed to 0x80 bytes */
243     for (a = 0; a < 256; a++) {
244         temp  = colram[charmap[a + 0x000]] << 0;
245         temp |= colram[charmap[a + 0x100]] << 1;
246         temp |= colram[charmap[a + 0x200]] << 2;
247         if (a < 0xe8) temp |= colram[charmap[a + 0x300]] << 3;
248         buf[a] = temp << 2;
249     }
250 }
251
252 static int a64multi_encode_frame(AVCodecContext *avctx, AVPacket *pkt,
253                                  const AVFrame *pict, int *got_packet)
254 {
255     A64Context *c = avctx->priv_data;
256
257     int frame;
258     int x, y;
259     int b_height;
260     int b_width;
261
262     int req_size, ret;
263     uint8_t *buf;
264
265     int *charmap     = c->mc_charmap;
266     uint8_t *colram  = c->mc_colram;
267     uint8_t *charset = c->mc_charset;
268     int *meta        = c->mc_meta_charset;
269     int *best_cb     = c->mc_best_cb;
270
271     int charset_size = 0x800 * (INTERLACED + 1);
272     int colram_size  = 0x100 * c->mc_use_5col;
273     int screen_size;
274
275     if(CROP_SCREENS) {
276         b_height = FFMIN(avctx->height,C64YRES) >> 3;
277         b_width  = FFMIN(avctx->width ,C64XRES) >> 3;
278         screen_size = b_width * b_height;
279     } else {
280         b_height = C64YRES >> 3;
281         b_width  = C64XRES >> 3;
282         screen_size = 0x400;
283     }
284
285     /* no data, means end encoding asap */
286     if (!pict) {
287         /* all done, end encoding */
288         if (!c->mc_lifetime) return 0;
289         /* no more frames in queue, prepare to flush remaining frames */
290         if (!c->mc_frame_counter) {
291             c->mc_lifetime = 0;
292         }
293         /* still frames in queue so limit lifetime to remaining frames */
294         else c->mc_lifetime = c->mc_frame_counter;
295     /* still new data available */
296     } else {
297         /* fill up mc_meta_charset with data until lifetime exceeds */
298         if (c->mc_frame_counter < c->mc_lifetime) {
299             avctx->coded_frame->pict_type = AV_PICTURE_TYPE_I;
300             avctx->coded_frame->key_frame = 1;
301             to_meta_with_crop(avctx, pict, meta + 32000 * c->mc_frame_counter);
302             c->mc_frame_counter++;
303             if (c->next_pts == AV_NOPTS_VALUE)
304                 c->next_pts = pict->pts;
305             /* lifetime is not reached so wait for next frame first */
306             return 0;
307         }
308     }
309
310     /* lifetime reached so now convert X frames at once */
311     if (c->mc_frame_counter == c->mc_lifetime) {
312         req_size = 0;
313         /* any frames to encode? */
314         if (c->mc_lifetime) {
315             req_size = charset_size + c->mc_lifetime*(screen_size + colram_size);
316             if ((ret = ff_alloc_packet(pkt, req_size)) < 0) {
317                 av_log(avctx, AV_LOG_ERROR, "Error getting output packet of size %d.\n", req_size);
318                 return ret;
319             }
320             buf = pkt->data;
321
322             /* calc optimal new charset + charmaps */
323             ret = ff_init_elbg(meta, 32, 1000 * c->mc_lifetime, best_cb,
324                                CHARSET_CHARS, 50, charmap, &c->randctx);
325             if (ret < 0)
326                 return ret;
327             ret = ff_do_elbg(meta, 32, 1000 * c->mc_lifetime, best_cb,
328                              CHARSET_CHARS, 50, charmap, &c->randctx);
329             if (ret < 0)
330                 return ret;
331
332             /* create colorram map and a c64 readable charset */
333             render_charset(avctx, charset, colram);
334
335             /* copy charset to buf */
336             memcpy(buf, charset, charset_size);
337
338             /* advance pointers */
339             buf      += charset_size;
340             charset  += charset_size;
341         }
342
343         /* write x frames to buf */
344         for (frame = 0; frame < c->mc_lifetime; frame++) {
345             /* copy charmap to buf. buf is uchar*, charmap is int*, so no memcpy here, sorry */
346             for (y = 0; y < b_height; y++) {
347                 for (x = 0; x < b_width; x++) {
348                     buf[y * b_width + x] = charmap[y * b_width + x];
349                 }
350             }
351             /* advance pointers */
352             buf += screen_size;
353             req_size += screen_size;
354
355             /* compress and copy colram to buf */
356             if (c->mc_use_5col) {
357                 a64_compress_colram(buf, charmap, colram);
358                 /* advance pointers */
359                 buf += colram_size;
360                 req_size += colram_size;
361             }
362
363             /* advance to next charmap */
364             charmap += 1000;
365         }
366
367         AV_WB32(avctx->extradata + 4,  c->mc_frame_counter);
368         AV_WB32(avctx->extradata + 8,  charset_size);
369         AV_WB32(avctx->extradata + 12, screen_size + colram_size);
370
371         /* reset counter */
372         c->mc_frame_counter = 0;
373
374         pkt->pts = pkt->dts = c->next_pts;
375         c->next_pts         = AV_NOPTS_VALUE;
376
377         pkt->size   = req_size;
378         pkt->flags |= AV_PKT_FLAG_KEY;
379         *got_packet = !!req_size;
380     }
381     return 0;
382 }
383
384 AVCodec ff_a64multi_encoder = {
385     .name           = "a64multi",
386     .long_name      = NULL_IF_CONFIG_SMALL("Multicolor charset for Commodore 64"),
387     .type           = AVMEDIA_TYPE_VIDEO,
388     .id             = AV_CODEC_ID_A64_MULTI,
389     .priv_data_size = sizeof(A64Context),
390     .init           = a64multi_encode_init,
391     .encode2        = a64multi_encode_frame,
392     .close          = a64multi_close_encoder,
393     .pix_fmts       = (const enum AVPixelFormat[]) {AV_PIX_FMT_GRAY8, AV_PIX_FMT_NONE},
394     .capabilities   = CODEC_CAP_DELAY,
395 };
396
397 AVCodec ff_a64multi5_encoder = {
398     .name           = "a64multi5",
399     .long_name      = NULL_IF_CONFIG_SMALL("Multicolor charset for Commodore 64, extended with 5th color (colram)"),
400     .type           = AVMEDIA_TYPE_VIDEO,
401     .id             = AV_CODEC_ID_A64_MULTI5,
402     .priv_data_size = sizeof(A64Context),
403     .init           = a64multi_encode_init,
404     .encode2        = a64multi_encode_frame,
405     .close          = a64multi_close_encoder,
406     .pix_fmts       = (const enum AVPixelFormat[]) {AV_PIX_FMT_GRAY8, AV_PIX_FMT_NONE},
407     .capabilities   = CODEC_CAP_DELAY,
408 };