]> git.sesse.net Git - ffmpeg/blob - libavcodec/rawdec.c
Merge commit '4506a854a4d846692ba71daeeff661dc214c8fa2'
[ffmpeg] / libavcodec / rawdec.c
1 /*
2  * Raw Video Decoder
3  * Copyright (c) 2001 Fabrice Bellard
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 /**
23  * @file
24  * Raw Video Decoder
25  */
26
27 #include "avcodec.h"
28 #include "internal.h"
29 #include "raw.h"
30 #include "libavutil/avassert.h"
31 #include "libavutil/buffer.h"
32 #include "libavutil/common.h"
33 #include "libavutil/intreadwrite.h"
34 #include "libavutil/imgutils.h"
35 #include "libavutil/opt.h"
36
37 typedef struct RawVideoContext {
38     AVClass *av_class;
39     AVBufferRef *palette;
40     int frame_size;  /* size of the frame in bytes */
41     int flip;
42     int is_2_4_bpp; // 2 or 4 bpp raw in avi/mov
43     int is_yuv2;
44     int is_lt_16bpp; // 16bpp pixfmt and bits_per_coded_sample < 16
45     int tff;
46 } RawVideoContext;
47
48 static const AVOption options[]={
49 {"top", "top field first", offsetof(RawVideoContext, tff), AV_OPT_TYPE_INT, {.i64 = -1}, -1, 1, AV_OPT_FLAG_DECODING_PARAM|AV_OPT_FLAG_VIDEO_PARAM},
50 {NULL}
51 };
52
53 static const AVClass rawdec_class = {
54     .class_name = "rawdec",
55     .option     = options,
56     .version    = LIBAVUTIL_VERSION_INT,
57 };
58
59 static const PixelFormatTag pix_fmt_bps_avi[] = {
60     { AV_PIX_FMT_MONOWHITE, 1 },
61     { AV_PIX_FMT_PAL8,    2 },
62     { AV_PIX_FMT_PAL8,    4 },
63     { AV_PIX_FMT_PAL8,    8 },
64     { AV_PIX_FMT_RGB444LE, 12 },
65     { AV_PIX_FMT_RGB555LE, 15 },
66     { AV_PIX_FMT_RGB555LE, 16 },
67     { AV_PIX_FMT_BGR24,  24 },
68     { AV_PIX_FMT_BGRA,   32 },
69     { AV_PIX_FMT_NONE,    0 },
70 };
71
72 static const PixelFormatTag pix_fmt_bps_mov[] = {
73     { AV_PIX_FMT_MONOWHITE, 1 },
74     { AV_PIX_FMT_PAL8,      2 },
75     { AV_PIX_FMT_PAL8,      4 },
76     { AV_PIX_FMT_PAL8,      8 },
77     // FIXME swscale does not support 16 bit in .mov, sample 16bit.mov
78     // http://developer.apple.com/documentation/QuickTime/QTFF/QTFFChap3/qtff3.html
79     { AV_PIX_FMT_RGB555BE, 16 },
80     { AV_PIX_FMT_RGB24,    24 },
81     { AV_PIX_FMT_ARGB,     32 },
82     { AV_PIX_FMT_MONOWHITE,33 },
83     { AV_PIX_FMT_NONE,      0 },
84 };
85
86 enum AVPixelFormat avpriv_find_pix_fmt(const PixelFormatTag *tags,
87                                        unsigned int fourcc)
88 {
89     while (tags->pix_fmt >= 0) {
90         if (tags->fourcc == fourcc)
91             return tags->pix_fmt;
92         tags++;
93     }
94     return AV_PIX_FMT_NONE;
95 }
96
97 #if LIBAVCODEC_VERSION_MAJOR < 55
98 enum AVPixelFormat ff_find_pix_fmt(const PixelFormatTag *tags, unsigned int fourcc)
99 {
100     return avpriv_find_pix_fmt(tags, fourcc);
101 }
102 #endif
103
104 static av_cold int raw_init_decoder(AVCodecContext *avctx)
105 {
106     RawVideoContext *context = avctx->priv_data;
107     const AVPixFmtDescriptor *desc;
108
109     if (   avctx->codec_tag == MKTAG('r','a','w',' ')
110         || avctx->codec_tag == MKTAG('N','O','1','6'))
111         avctx->pix_fmt = avpriv_find_pix_fmt(pix_fmt_bps_mov,
112                                       avctx->bits_per_coded_sample & 0x1f);
113     else if (avctx->codec_tag == MKTAG('W', 'R', 'A', 'W'))
114         avctx->pix_fmt = avpriv_find_pix_fmt(pix_fmt_bps_avi,
115                                       avctx->bits_per_coded_sample);
116     else if (avctx->codec_tag)
117         avctx->pix_fmt = avpriv_find_pix_fmt(ff_raw_pix_fmt_tags, avctx->codec_tag);
118     else if (avctx->pix_fmt == AV_PIX_FMT_NONE && avctx->bits_per_coded_sample)
119         avctx->pix_fmt = avpriv_find_pix_fmt(pix_fmt_bps_avi,
120                                       avctx->bits_per_coded_sample);
121
122     desc = av_pix_fmt_desc_get(avctx->pix_fmt);
123     if (!desc) {
124         av_log(avctx, AV_LOG_ERROR, "Invalid pixel format.\n");
125         return AVERROR(EINVAL);
126     }
127
128     if (desc->flags & (AV_PIX_FMT_FLAG_PAL | AV_PIX_FMT_FLAG_PSEUDOPAL)) {
129         context->palette = av_buffer_alloc(AVPALETTE_SIZE);
130         if (!context->palette)
131             return AVERROR(ENOMEM);
132         if (desc->flags & AV_PIX_FMT_FLAG_PSEUDOPAL)
133             avpriv_set_systematic_pal2((uint32_t*)context->palette->data, avctx->pix_fmt);
134         else
135             memset(context->palette->data, 0, AVPALETTE_SIZE);
136     }
137
138     if (((avctx->bits_per_coded_sample & 0x1f) == 4 || (avctx->bits_per_coded_sample & 0x1f) == 2) &&
139         avctx->pix_fmt == AV_PIX_FMT_PAL8 &&
140        (!avctx->codec_tag || avctx->codec_tag == MKTAG('r','a','w',' '))) {
141         context->is_2_4_bpp = 1;
142         context->frame_size = avpicture_get_size(avctx->pix_fmt,
143                                                  FFALIGN(avctx->width, 16),
144                                                  avctx->height);
145     } else {
146         context->is_lt_16bpp = av_get_bits_per_pixel(desc) == 16 && avctx->bits_per_coded_sample && avctx->bits_per_coded_sample < 16;
147         context->frame_size = avpicture_get_size(avctx->pix_fmt, avctx->width,
148                                                  avctx->height);
149     }
150
151     if ((avctx->extradata_size >= 9 &&
152          !memcmp(avctx->extradata + avctx->extradata_size - 9, "BottomUp", 9)) ||
153         avctx->codec_tag == MKTAG('c','y','u','v') ||
154         avctx->codec_tag == MKTAG(3, 0, 0, 0) ||
155         avctx->codec_tag == MKTAG('W','R','A','W'))
156         context->flip = 1;
157
158     if (avctx->codec_tag == AV_RL32("yuv2") &&
159         avctx->pix_fmt   == AV_PIX_FMT_YUYV422)
160         context->is_yuv2 = 1;
161
162     return 0;
163 }
164
165 static void flip(AVCodecContext *avctx, AVPicture *picture)
166 {
167     picture->data[0]     += picture->linesize[0] * (avctx->height - 1);
168     picture->linesize[0] *= -1;
169 }
170
171 static int raw_decode(AVCodecContext *avctx, void *data, int *got_frame,
172                       AVPacket *avpkt)
173 {
174     const AVPixFmtDescriptor *desc = av_pix_fmt_desc_get(avctx->pix_fmt);
175     RawVideoContext *context       = avctx->priv_data;
176     const uint8_t *buf             = avpkt->data;
177     int buf_size                   = avpkt->size;
178     int linesize_align             = 4;
179     int res, len;
180     int need_copy                  = !avpkt->buf || context->is_2_4_bpp || context->is_yuv2 || context->is_lt_16bpp;
181
182     AVFrame   *frame   = data;
183     AVPicture *picture = data;
184
185     frame->pict_type        = AV_PICTURE_TYPE_I;
186     frame->key_frame        = 1;
187     frame->reordered_opaque = avctx->reordered_opaque;
188     frame->pkt_pts          = avctx->internal->pkt->pts;
189     av_frame_set_pkt_pos     (frame, avctx->internal->pkt->pos);
190     av_frame_set_pkt_duration(frame, avctx->internal->pkt->duration);
191
192     if (context->tff >= 0) {
193         frame->interlaced_frame = 1;
194         frame->top_field_first  = context->tff;
195     }
196
197     if ((res = av_image_check_size(avctx->width, avctx->height, 0, avctx)) < 0)
198         return res;
199
200     if (need_copy)
201         frame->buf[0] = av_buffer_alloc(FFMAX(context->frame_size, buf_size));
202     else
203         frame->buf[0] = av_buffer_ref(avpkt->buf);
204     if (!frame->buf[0])
205         return AVERROR(ENOMEM);
206
207     //2bpp and 4bpp raw in avi and mov (yes this is ugly ...)
208     if (context->is_2_4_bpp) {
209         int i;
210         uint8_t *dst = frame->buf[0]->data;
211         buf_size = context->frame_size - AVPALETTE_SIZE;
212         if ((avctx->bits_per_coded_sample & 0x1f) == 4) {
213             for (i = 0; 2 * i + 1 < buf_size && i<avpkt->size; i++) {
214                 dst[2 * i + 0] = buf[i] >> 4;
215                 dst[2 * i + 1] = buf[i] & 15;
216             }
217             linesize_align = 8;
218         } else {
219             av_assert0((avctx->bits_per_coded_sample & 0x1f) == 2);
220             for (i = 0; 4 * i + 3 < buf_size && i<avpkt->size; i++) {
221                 dst[4 * i + 0] = buf[i] >> 6;
222                 dst[4 * i + 1] = buf[i] >> 4 & 3;
223                 dst[4 * i + 2] = buf[i] >> 2 & 3;
224                 dst[4 * i + 3] = buf[i]      & 3;
225             }
226             linesize_align = 16;
227         }
228         buf = dst;
229     } else if (context->is_lt_16bpp) {
230         int i;
231         uint8_t *dst = frame->buf[0]->data;
232         if (desc->flags & AV_PIX_FMT_FLAG_BE) {
233             for (i = 0; i + 1 < buf_size; i += 2)
234                 AV_WB16(dst + i, AV_RB16(buf + i) << (16 - avctx->bits_per_coded_sample));
235         } else {
236             for (i = 0; i + 1 < buf_size; i += 2)
237                 AV_WL16(dst + i, AV_RL16(buf + i) << (16 - avctx->bits_per_coded_sample));
238         }
239         buf = dst;
240     } else if (need_copy) {
241         memcpy(frame->buf[0]->data, buf, buf_size);
242         buf = frame->buf[0]->data;
243     }
244
245     if (avctx->codec_tag == MKTAG('A', 'V', '1', 'x') ||
246         avctx->codec_tag == MKTAG('A', 'V', 'u', 'p'))
247         buf += buf_size - context->frame_size;
248
249     len = context->frame_size - (avctx->pix_fmt==AV_PIX_FMT_PAL8 ? AVPALETTE_SIZE : 0);
250     if (buf_size < len) {
251         av_log(avctx, AV_LOG_ERROR, "Invalid buffer size, packet size %d < expected frame_size %d\n", buf_size, len);
252         av_buffer_unref(&frame->buf[0]);
253         return AVERROR(EINVAL);
254     }
255
256     if ((res = avpicture_fill(picture, buf, avctx->pix_fmt,
257                               avctx->width, avctx->height)) < 0) {
258         av_buffer_unref(&frame->buf[0]);
259         return res;
260     }
261
262     if (avctx->pix_fmt == AV_PIX_FMT_PAL8) {
263         const uint8_t *pal = av_packet_get_side_data(avpkt, AV_PKT_DATA_PALETTE,
264                                                      NULL);
265
266         if (pal) {
267             av_buffer_unref(&context->palette);
268             context->palette = av_buffer_alloc(AVPALETTE_SIZE);
269             if (!context->palette) {
270                 av_buffer_unref(&frame->buf[0]);
271                 return AVERROR(ENOMEM);
272             }
273             memcpy(context->palette->data, pal, AVPALETTE_SIZE);
274             frame->palette_has_changed = 1;
275         }
276     }
277
278     if ((avctx->pix_fmt==AV_PIX_FMT_BGR24    ||
279         avctx->pix_fmt==AV_PIX_FMT_GRAY8    ||
280         avctx->pix_fmt==AV_PIX_FMT_RGB555LE ||
281         avctx->pix_fmt==AV_PIX_FMT_RGB555BE ||
282         avctx->pix_fmt==AV_PIX_FMT_RGB565LE ||
283         avctx->pix_fmt==AV_PIX_FMT_MONOWHITE ||
284         avctx->pix_fmt==AV_PIX_FMT_PAL8) &&
285         FFALIGN(frame->linesize[0], linesize_align) * avctx->height <= buf_size)
286         frame->linesize[0] = FFALIGN(frame->linesize[0], linesize_align);
287
288     if (avctx->pix_fmt == AV_PIX_FMT_NV12 && avctx->codec_tag == MKTAG('N', 'V', '1', '2') &&
289         FFALIGN(frame->linesize[0], linesize_align) * avctx->height +
290         FFALIGN(frame->linesize[1], linesize_align) * ((avctx->height + 1) / 2) <= buf_size) {
291         int la0 = FFALIGN(frame->linesize[0], linesize_align);
292         frame->data[1] += (la0 - frame->linesize[0]) * avctx->height;
293         frame->linesize[0] = la0;
294         frame->linesize[1] = FFALIGN(frame->linesize[1], linesize_align);
295     }
296
297     if ((avctx->pix_fmt == AV_PIX_FMT_PAL8 && buf_size < context->frame_size) ||
298         (desc->flags & AV_PIX_FMT_FLAG_PSEUDOPAL)) {
299         frame->buf[1]  = av_buffer_ref(context->palette);
300         if (!frame->buf[1]) {
301             av_buffer_unref(&frame->buf[0]);
302             return AVERROR(ENOMEM);
303         }
304         frame->data[1] = frame->buf[1]->data;
305     }
306
307     if (avctx->pix_fmt == AV_PIX_FMT_BGR24 &&
308         ((frame->linesize[0] + 3) & ~3) * avctx->height <= buf_size)
309         frame->linesize[0] = (frame->linesize[0] + 3) & ~3;
310
311     if (context->flip)
312         flip(avctx, picture);
313
314     if (avctx->codec_tag == MKTAG('Y', 'V', '1', '2') ||
315         avctx->codec_tag == MKTAG('Y', 'V', '1', '6') ||
316         avctx->codec_tag == MKTAG('Y', 'V', '2', '4') ||
317         avctx->codec_tag == MKTAG('Y', 'V', 'U', '9'))
318         FFSWAP(uint8_t *, picture->data[1], picture->data[2]);
319
320     if (avctx->codec_tag == AV_RL32("I420") && (avctx->width+1)*(avctx->height+1) * 3/2 == buf_size) {
321         picture->data[1] = picture->data[1] +  (avctx->width+1)*(avctx->height+1) -avctx->width*avctx->height;
322         picture->data[2] = picture->data[2] + ((avctx->width+1)*(avctx->height+1) -avctx->width*avctx->height)*5/4;
323     }
324
325     if (avctx->codec_tag == AV_RL32("yuv2") &&
326         avctx->pix_fmt   == AV_PIX_FMT_YUYV422) {
327         int x, y;
328         uint8_t *line = picture->data[0];
329         for (y = 0; y < avctx->height; y++) {
330             for (x = 0; x < avctx->width; x++)
331                 line[2 * x + 1] ^= 0x80;
332             line += picture->linesize[0];
333         }
334     }
335     if (avctx->codec_tag == AV_RL32("YVYU") &&
336         avctx->pix_fmt   == AV_PIX_FMT_YUYV422) {
337         int x, y;
338         uint8_t *line = picture->data[0];
339         for(y = 0; y < avctx->height; y++) {
340             for(x = 0; x < avctx->width - 1; x += 2)
341                 FFSWAP(uint8_t, line[2*x + 1], line[2*x + 3]);
342             line += picture->linesize[0];
343         }
344     }
345
346     if (avctx->field_order > AV_FIELD_PROGRESSIVE) { /* we have interlaced material flagged in container */
347         frame->interlaced_frame = 1;
348         if (avctx->field_order == AV_FIELD_TT || avctx->field_order == AV_FIELD_TB)
349             frame->top_field_first = 1;
350     }
351
352     *got_frame = 1;
353     return buf_size;
354 }
355
356 static av_cold int raw_close_decoder(AVCodecContext *avctx)
357 {
358     RawVideoContext *context = avctx->priv_data;
359
360     av_buffer_unref(&context->palette);
361     return 0;
362 }
363
364 AVCodec ff_rawvideo_decoder = {
365     .name           = "rawvideo",
366     .long_name      = NULL_IF_CONFIG_SMALL("raw video"),
367     .type           = AVMEDIA_TYPE_VIDEO,
368     .id             = AV_CODEC_ID_RAWVIDEO,
369     .priv_data_size = sizeof(RawVideoContext),
370     .init           = raw_init_decoder,
371     .close          = raw_close_decoder,
372     .decode         = raw_decode,
373     .priv_class     = &rawdec_class,
374 };