]> git.sesse.net Git - ffmpeg/blob - libavcodec/libopenjpegenc.c
Merge remote-tracking branch 'qatar/master'
[ffmpeg] / libavcodec / libopenjpegenc.c
1 /*
2  * JPEG 2000 encoding support via OpenJPEG
3  * Copyright (c) 2011 Michael Bradshaw <mbradshaw@sorensonmedia.com>
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 /**
23 * @file
24 * JPEG 2000 encoder using libopenjpeg
25 */
26
27 #include "libavutil/opt.h"
28 #include "libavutil/imgutils.h"
29 #include "libavutil/avassert.h"
30 #include "avcodec.h"
31 #include "libavutil/intreadwrite.h"
32 #include "internal.h"
33 #define  OPJ_STATIC
34 #include <openjpeg.h>
35
36 typedef struct {
37     AVClass *avclass;
38     opj_image_t *image;
39     opj_cparameters_t enc_params;
40     opj_cinfo_t *compress;
41     opj_event_mgr_t event_mgr;
42     int format;
43     int profile;
44     int cinema_mode;
45     int prog_order;
46     int numresolution;
47     int numlayers;
48     int disto_alloc;
49     int fixed_alloc;
50     int fixed_quality;
51 } LibOpenJPEGContext;
52
53 static void error_callback(const char *msg, void *data)
54 {
55     av_log((AVCodecContext*)data, AV_LOG_ERROR, "libopenjpeg: %s\n", msg);
56 }
57
58 static void warning_callback(const char *msg, void *data)
59 {
60     av_log((AVCodecContext*)data, AV_LOG_WARNING, "libopenjpeg: %s\n", msg);
61 }
62
63 static opj_image_t *mj2_create_image(AVCodecContext *avctx, opj_cparameters_t *parameters)
64 {
65     opj_image_cmptparm_t *cmptparm;
66     opj_image_t *img;
67     int i;
68     int sub_dx[4];
69     int sub_dy[4];
70     int numcomps;
71     OPJ_COLOR_SPACE color_space = CLRSPC_UNKNOWN;
72
73     sub_dx[0] = sub_dx[3] = 1;
74     sub_dy[0] = sub_dy[3] = 1;
75     sub_dx[1] = sub_dx[2] = 1<<av_pix_fmt_descriptors[avctx->pix_fmt].log2_chroma_w;
76     sub_dy[1] = sub_dy[2] = 1<<av_pix_fmt_descriptors[avctx->pix_fmt].log2_chroma_h;
77
78     numcomps = av_pix_fmt_descriptors[avctx->pix_fmt].nb_components;
79
80     switch (avctx->pix_fmt) {
81     case PIX_FMT_GRAY8:
82     case PIX_FMT_GRAY8A:
83     case PIX_FMT_GRAY16:
84         color_space = CLRSPC_GRAY;
85         break;
86     case PIX_FMT_RGB24:
87     case PIX_FMT_RGBA:
88     case PIX_FMT_RGB48:
89     case PIX_FMT_RGBA64:
90         color_space = CLRSPC_SRGB;
91         break;
92     case PIX_FMT_YUV420P:
93     case PIX_FMT_YUV422P:
94     case PIX_FMT_YUV440P:
95     case PIX_FMT_YUV444P:
96     case PIX_FMT_YUVA420P:
97     case PIX_FMT_YUV420P9:
98     case PIX_FMT_YUV422P9:
99     case PIX_FMT_YUV444P9:
100     case PIX_FMT_YUV420P10:
101     case PIX_FMT_YUV422P10:
102     case PIX_FMT_YUV444P10:
103     case PIX_FMT_YUV420P16:
104     case PIX_FMT_YUV422P16:
105     case PIX_FMT_YUV444P16:
106         color_space = CLRSPC_SYCC;
107         break;
108     default:
109         av_log(avctx, AV_LOG_ERROR, "The requested pixel format '%s' is not supported\n", av_get_pix_fmt_name(avctx->pix_fmt));
110         return NULL;
111     }
112
113     cmptparm = av_mallocz(numcomps * sizeof(opj_image_cmptparm_t));
114     if (!cmptparm) {
115         av_log(avctx, AV_LOG_ERROR, "Not enough memory");
116         return NULL;
117     }
118     for (i = 0; i < numcomps; i++) {
119         cmptparm[i].prec = av_pix_fmt_descriptors[avctx->pix_fmt].comp[i].depth_minus1 + 1;
120         cmptparm[i].bpp = av_pix_fmt_descriptors[avctx->pix_fmt].comp[i].depth_minus1 + 1;
121         cmptparm[i].sgnd = 0;
122         cmptparm[i].dx = sub_dx[i];
123         cmptparm[i].dy = sub_dy[i];
124         cmptparm[i].w = avctx->width / sub_dx[i];
125         cmptparm[i].h = avctx->height / sub_dy[i];
126     }
127
128     img = opj_image_create(numcomps, cmptparm, color_space);
129     av_freep(&cmptparm);
130     return img;
131 }
132
133 static av_cold int libopenjpeg_encode_init(AVCodecContext *avctx)
134 {
135     LibOpenJPEGContext *ctx = avctx->priv_data;
136
137     opj_set_default_encoder_parameters(&ctx->enc_params);
138     ctx->enc_params.cp_rsiz = ctx->profile;
139     ctx->enc_params.mode = !!avctx->global_quality;
140     ctx->enc_params.cp_cinema = ctx->cinema_mode;
141     ctx->enc_params.prog_order = ctx->prog_order;
142     ctx->enc_params.numresolution = ctx->numresolution;
143     ctx->enc_params.cp_disto_alloc = ctx->disto_alloc;
144     ctx->enc_params.cp_fixed_alloc = ctx->fixed_alloc;
145     ctx->enc_params.cp_fixed_quality = ctx->fixed_quality;
146     ctx->enc_params.tcp_numlayers = ctx->numlayers;
147     ctx->enc_params.tcp_rates[0] = FFMAX(avctx->compression_level, 0) * 2;
148
149     ctx->compress = opj_create_compress(ctx->format);
150     if (!ctx->compress) {
151         av_log(avctx, AV_LOG_ERROR, "Error creating the compressor\n");
152         return AVERROR(ENOMEM);
153     }
154
155     avctx->coded_frame = avcodec_alloc_frame();
156     if (!avctx->coded_frame) {
157         av_freep(&ctx->compress);
158         av_log(avctx, AV_LOG_ERROR, "Error allocating coded frame\n");
159         return AVERROR(ENOMEM);
160     }
161
162     ctx->image = mj2_create_image(avctx, &ctx->enc_params);
163     if (!ctx->image) {
164         av_freep(&ctx->compress);
165         av_freep(&avctx->coded_frame);
166         av_log(avctx, AV_LOG_ERROR, "Error creating the mj2 image\n");
167         return AVERROR(EINVAL);
168     }
169
170     memset(&ctx->event_mgr, 0, sizeof(opj_event_mgr_t));
171     ctx->event_mgr.error_handler = error_callback;
172     ctx->event_mgr.warning_handler = warning_callback;
173     ctx->event_mgr.info_handler = NULL;
174     opj_set_event_mgr((opj_common_ptr)ctx->compress, &ctx->event_mgr, avctx);
175
176     return 0;
177 }
178
179 static int libopenjpeg_copy_packed8(AVCodecContext *avctx, const AVFrame *frame, opj_image_t *image)
180 {
181     int compno;
182     int x;
183     int y;
184     int image_index;
185     int frame_index;
186     const int numcomps = image->numcomps;
187
188     for (compno = 0; compno < numcomps; ++compno) {
189         if (image->comps[compno].w > frame->linesize[0] / numcomps) {
190             av_log(avctx, AV_LOG_ERROR, "Error: frame's linesize is too small for the image\n");
191             return 0;
192         }
193     }
194
195     for (compno = 0; compno < numcomps; ++compno) {
196         for (y = 0; y < avctx->height; ++y) {
197             image_index = y * avctx->width;
198             frame_index = y * frame->linesize[0] + compno;
199             for (x = 0; x < avctx->width; ++x) {
200                 image->comps[compno].data[image_index++] = frame->data[0][frame_index];
201                 frame_index += numcomps;
202             }
203         }
204     }
205
206     return 1;
207 }
208
209 static int libopenjpeg_copy_packed16(AVCodecContext *avctx, const AVFrame *frame, opj_image_t *image)
210 {
211     int compno;
212     int x;
213     int y;
214     int image_index;
215     int frame_index;
216     const int numcomps = image->numcomps;
217     uint16_t *frame_ptr = (uint16_t*)frame->data[0];
218
219     for (compno = 0; compno < numcomps; ++compno) {
220         if (image->comps[compno].w > frame->linesize[0] / numcomps) {
221             av_log(avctx, AV_LOG_ERROR, "Error: frame's linesize is too small for the image\n");
222             return 0;
223         }
224     }
225
226     for (compno = 0; compno < numcomps; ++compno) {
227         for (y = 0; y < avctx->height; ++y) {
228             image_index = y * avctx->width;
229             frame_index = y * (frame->linesize[0] / 2) + compno;
230             for (x = 0; x < avctx->width; ++x) {
231                 image->comps[compno].data[image_index++] = frame_ptr[frame_index];
232                 frame_index += numcomps;
233             }
234         }
235     }
236
237     return 1;
238 }
239
240 static int libopenjpeg_copy_unpacked8(AVCodecContext *avctx, const AVFrame *frame, opj_image_t *image)
241 {
242     int compno;
243     int x;
244     int y;
245     int width;
246     int height;
247     int image_index;
248     int frame_index;
249     const int numcomps = image->numcomps;
250
251     for (compno = 0; compno < numcomps; ++compno) {
252         if (image->comps[compno].w > frame->linesize[compno]) {
253             av_log(avctx, AV_LOG_ERROR, "Error: frame's linesize is too small for the image\n");
254             return 0;
255         }
256     }
257
258     for (compno = 0; compno < numcomps; ++compno) {
259         width = avctx->width / image->comps[compno].dx;
260         height = avctx->height / image->comps[compno].dy;
261         for (y = 0; y < height; ++y) {
262             image_index = y * width;
263             frame_index = y * frame->linesize[compno];
264             for (x = 0; x < width; ++x) {
265                 image->comps[compno].data[image_index++] = frame->data[compno][frame_index++];
266             }
267         }
268     }
269
270     return 1;
271 }
272
273 static int libopenjpeg_copy_unpacked16(AVCodecContext *avctx, const AVFrame *frame, opj_image_t *image)
274 {
275     int compno;
276     int x;
277     int y;
278     int width;
279     int height;
280     int image_index;
281     int frame_index;
282     const int numcomps = image->numcomps;
283     uint16_t *frame_ptr;
284
285     for (compno = 0; compno < numcomps; ++compno) {
286         if (image->comps[compno].w > frame->linesize[compno]) {
287             av_log(avctx, AV_LOG_ERROR, "Error: frame's linesize is too small for the image\n");
288             return 0;
289         }
290     }
291
292     for (compno = 0; compno < numcomps; ++compno) {
293         width = avctx->width / image->comps[compno].dx;
294         height = avctx->height / image->comps[compno].dy;
295         frame_ptr = (uint16_t*)frame->data[compno];
296         for (y = 0; y < height; ++y) {
297             image_index = y * width;
298             frame_index = y * (frame->linesize[compno] / 2);
299             for (x = 0; x < width; ++x) {
300                 image->comps[compno].data[image_index++] = frame_ptr[frame_index++];
301             }
302         }
303     }
304
305     return 1;
306 }
307
308 static int libopenjpeg_encode_frame(AVCodecContext *avctx, AVPacket *pkt,
309                                     const AVFrame *frame, int *got_packet)
310 {
311     LibOpenJPEGContext *ctx = avctx->priv_data;
312     opj_cinfo_t *compress = ctx->compress;
313     opj_image_t *image = ctx->image;
314     opj_cio_t *stream;
315     int cpyresult = 0;
316     int ret, len;
317
318     // x0, y0 is the top left corner of the image
319     // x1, y1 is the width, height of the reference grid
320     image->x0 = 0;
321     image->y0 = 0;
322     image->x1 = (avctx->width - 1) * ctx->enc_params.subsampling_dx + 1;
323     image->y1 = (avctx->height - 1) * ctx->enc_params.subsampling_dy + 1;
324
325     switch (avctx->pix_fmt) {
326     case PIX_FMT_RGB24:
327     case PIX_FMT_RGBA:
328     case PIX_FMT_GRAY8A:
329         cpyresult = libopenjpeg_copy_packed8(avctx, frame, image);
330         break;
331     case PIX_FMT_RGB48:
332     case PIX_FMT_RGBA64:
333         cpyresult = libopenjpeg_copy_packed16(avctx, frame, image);
334         break;
335     case PIX_FMT_GRAY8:
336     case PIX_FMT_YUV420P:
337     case PIX_FMT_YUV422P:
338     case PIX_FMT_YUV440P:
339     case PIX_FMT_YUV444P:
340     case PIX_FMT_YUVA420P:
341         cpyresult = libopenjpeg_copy_unpacked8(avctx, frame, image);
342         break;
343     case PIX_FMT_GRAY16:
344     case PIX_FMT_YUV420P9:
345     case PIX_FMT_YUV420P10:
346     case PIX_FMT_YUV420P16:
347     case PIX_FMT_YUV422P9:
348     case PIX_FMT_YUV422P10:
349     case PIX_FMT_YUV422P16:
350     case PIX_FMT_YUV444P9:
351     case PIX_FMT_YUV444P10:
352     case PIX_FMT_YUV444P16:
353         cpyresult = libopenjpeg_copy_unpacked16(avctx, frame, image);
354         break;
355     default:
356         av_log(avctx, AV_LOG_ERROR, "The frame's pixel format '%s' is not supported\n", av_get_pix_fmt_name(avctx->pix_fmt));
357         return AVERROR(EINVAL);
358         break;
359     }
360
361     if (!cpyresult) {
362         av_log(avctx, AV_LOG_ERROR, "Could not copy the frame data to the internal image buffer\n");
363         return -1;
364     }
365
366     opj_setup_encoder(compress, &ctx->enc_params, image);
367     stream = opj_cio_open((opj_common_ptr)compress, NULL, 0);
368     if (!stream) {
369         av_log(avctx, AV_LOG_ERROR, "Error creating the cio stream\n");
370         return AVERROR(ENOMEM);
371     }
372
373     if (!opj_encode(compress, stream, image, NULL)) {
374         opj_cio_close(stream);
375         av_log(avctx, AV_LOG_ERROR, "Error during the opj encode\n");
376         return -1;
377     }
378
379     len = cio_tell(stream);
380     if ((ret = ff_alloc_packet2(avctx, pkt, len)) < 0) {
381         opj_cio_close(stream);
382         return ret;
383     }
384
385     memcpy(pkt->data, stream->buffer, len);
386     pkt->flags |= AV_PKT_FLAG_KEY;
387     *got_packet = 1;
388     opj_cio_close(stream);
389     return 0;
390 }
391
392 static av_cold int libopenjpeg_encode_close(AVCodecContext *avctx)
393 {
394     LibOpenJPEGContext *ctx = avctx->priv_data;
395
396     opj_destroy_compress(ctx->compress);
397     opj_image_destroy(ctx->image);
398     av_freep(&avctx->coded_frame);
399     return 0 ;
400 }
401
402 #define OFFSET(x) offsetof(LibOpenJPEGContext, x)
403 #define VE AV_OPT_FLAG_VIDEO_PARAM | AV_OPT_FLAG_ENCODING_PARAM
404 static const AVOption options[] = {
405     { "format",        "Codec Format",      OFFSET(format),        AV_OPT_TYPE_INT,   { CODEC_JP2   }, CODEC_J2K, CODEC_JP2,   VE, "format"      },
406     { "j2k",           NULL,                0,                     AV_OPT_TYPE_CONST, { CODEC_J2K   }, 0,         0,           VE, "format"      },
407     { "jp2",           NULL,                0,                     AV_OPT_TYPE_CONST, { CODEC_JP2   }, 0,         0,           VE, "format"      },
408     { "profile",       NULL,                OFFSET(profile),       AV_OPT_TYPE_INT,   { STD_RSIZ    }, STD_RSIZ,  CINEMA4K,    VE, "profile"     },
409     { "jpeg2000",      NULL,                0,                     AV_OPT_TYPE_CONST, { STD_RSIZ    }, 0,         0,           VE, "profile"     },
410     { "cinema2k",      NULL,                0,                     AV_OPT_TYPE_CONST, { CINEMA2K    }, 0,         0,           VE, "profile"     },
411     { "cinema4k",      NULL,                0,                     AV_OPT_TYPE_CONST, { CINEMA4K    }, 0,         0,           VE, "profile"     },
412     { "cinema_mode",   "Digital Cinema",    OFFSET(cinema_mode),   AV_OPT_TYPE_INT,   { OFF         }, OFF,       CINEMA4K_24, VE, "cinema_mode" },
413     { "off",           NULL,                0,                     AV_OPT_TYPE_CONST, { OFF         }, 0,         0,           VE, "cinema_mode" },
414     { "2k_24",         NULL,                0,                     AV_OPT_TYPE_CONST, { CINEMA2K_24 }, 0,         0,           VE, "cinema_mode" },
415     { "2k_48",         NULL,                0,                     AV_OPT_TYPE_CONST, { CINEMA2K_48 }, 0,         0,           VE, "cinema_mode" },
416     { "4k_24",         NULL,                0,                     AV_OPT_TYPE_CONST, { CINEMA4K_24 }, 0,         0,           VE, "cinema_mode" },
417     { "prog_order",    "Progression Order", OFFSET(prog_order),    AV_OPT_TYPE_INT,   { LRCP        }, LRCP,      CPRL,        VE, "prog_order"  },
418     { "lrcp",          NULL,                0,                     AV_OPT_TYPE_CONST, { LRCP        }, 0,         0,           VE, "prog_order"  },
419     { "rlcp",          NULL,                0,                     AV_OPT_TYPE_CONST, { RLCP        }, 0,         0,           VE, "prog_order"  },
420     { "rpcl",          NULL,                0,                     AV_OPT_TYPE_CONST, { RPCL        }, 0,         0,           VE, "prog_order"  },
421     { "pcrl",          NULL,                0,                     AV_OPT_TYPE_CONST, { PCRL        }, 0,         0,           VE, "prog_order"  },
422     { "cprl",          NULL,                0,                     AV_OPT_TYPE_CONST, { CPRL        }, 0,         0,           VE, "prog_order"  },
423     { "numresolution", NULL,                OFFSET(numresolution), AV_OPT_TYPE_INT,   { 6           }, 1,         10,          VE                },
424     { "numlayers",     NULL,                OFFSET(numlayers),     AV_OPT_TYPE_INT,   { 1           }, 1,         10,          VE                },
425     { "disto_alloc",   NULL,                OFFSET(disto_alloc),   AV_OPT_TYPE_INT,   { 1           }, 0,         1,           VE                },
426     { "fixed_alloc",   NULL,                OFFSET(fixed_alloc),   AV_OPT_TYPE_INT,   { 0           }, 0,         1,           VE                },
427     { "fixed_quality", NULL,                OFFSET(fixed_quality), AV_OPT_TYPE_INT,   { 0           }, 0,         1,           VE                },
428     { NULL },
429 };
430
431 static const AVClass class = {
432     .class_name = "libopenjpeg",
433     .item_name  = av_default_item_name,
434     .option     = options,
435     .version    = LIBAVUTIL_VERSION_INT,
436 };
437
438 AVCodec ff_libopenjpeg_encoder = {
439     .name           = "libopenjpeg",
440     .type           = AVMEDIA_TYPE_VIDEO,
441     .id             = CODEC_ID_JPEG2000,
442     .priv_data_size = sizeof(LibOpenJPEGContext),
443     .init           = libopenjpeg_encode_init,
444     .encode2        = libopenjpeg_encode_frame,
445     .close          = libopenjpeg_encode_close,
446     .capabilities   = 0,
447     .pix_fmts = (const enum PixelFormat[]){PIX_FMT_RGB24,PIX_FMT_RGBA,PIX_FMT_RGB48,PIX_FMT_RGBA64,
448                                            PIX_FMT_GRAY8,PIX_FMT_GRAY8A,PIX_FMT_GRAY16,
449                                            PIX_FMT_YUV420P,PIX_FMT_YUV422P,PIX_FMT_YUVA420P,
450                                            PIX_FMT_YUV440P,PIX_FMT_YUV444P,
451                                            PIX_FMT_YUV420P9,PIX_FMT_YUV422P9,PIX_FMT_YUV444P9,
452                                            PIX_FMT_YUV420P10,PIX_FMT_YUV422P10,PIX_FMT_YUV444P10,
453                                            PIX_FMT_YUV420P16,PIX_FMT_YUV422P16,PIX_FMT_YUV444P16,
454                                            PIX_FMT_NONE},
455     .long_name = NULL_IF_CONFIG_SMALL("OpenJPEG JPEG 2000"),
456     .priv_class     = &class,
457 };