]> git.sesse.net Git - ffmpeg/blob - libavcodec/v210dec.c
sgidec: make compiler optimize away memcpy call in inner loop.
[ffmpeg] / libavcodec / v210dec.c
1 /*
2  * V210 decoder
3  *
4  * Copyright (C) 2009 Michael Niedermayer <michaelni@gmx.at>
5  * Copyright (c) 2009 Baptiste Coudurier <baptiste dot coudurier at gmail dot com>
6  *
7  * This file is part of FFmpeg.
8  *
9  * FFmpeg is free software; you can redistribute it and/or
10  * modify it under the terms of the GNU Lesser General Public
11  * License as published by the Free Software Foundation; either
12  * version 2.1 of the License, or (at your option) any later version.
13  *
14  * FFmpeg is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
17  * Lesser General Public License for more details.
18  *
19  * You should have received a copy of the GNU Lesser General Public
20  * License along with FFmpeg; if not, write to the Free Software
21  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
22  */
23
24 #include "avcodec.h"
25 #include "v210dec.h"
26 #include "libavutil/bswap.h"
27
28 #define READ_PIXELS(a, b, c)         \
29     do {                             \
30         val  = av_le2ne32(*src++);   \
31         *a++ =  val & 0x3FF;         \
32         *b++ = (val >> 10) & 0x3FF;  \
33         *c++ = (val >> 20) & 0x3FF;  \
34     } while (0)
35
36 static void v210_planar_unpack_c(const uint32_t *src, uint16_t *y, uint16_t *u, uint16_t *v, int width)
37 {
38     uint32_t val;
39     int i;
40
41     for( i = 0; i < width-5; i += 6 ){
42         READ_PIXELS(u, y, v);
43         READ_PIXELS(y, u, y);
44         READ_PIXELS(v, y, u);
45         READ_PIXELS(y, v, y);
46     }
47 }
48
49 static av_cold int decode_init(AVCodecContext *avctx)
50 {
51     V210DecContext *s = avctx->priv_data;
52
53     if (avctx->width & 1) {
54         av_log(avctx, AV_LOG_ERROR, "v210 needs even width\n");
55         return -1;
56     }
57     avctx->pix_fmt             = PIX_FMT_YUV422P10;
58     avctx->bits_per_raw_sample = 10;
59
60     avctx->coded_frame         = avcodec_alloc_frame();
61
62     s->unpack_frame            = v210_planar_unpack_c;
63
64     if (HAVE_MMX)
65         v210_x86_init(s);
66
67     return 0;
68 }
69
70 static int decode_frame(AVCodecContext *avctx, void *data, int *data_size,
71                         AVPacket *avpkt)
72 {
73     V210DecContext *s = avctx->priv_data;
74
75     int h, w, stride, aligned_input;
76     AVFrame *pic = avctx->coded_frame;
77     const uint8_t *psrc = avpkt->data;
78     uint16_t *y, *u, *v;
79
80     if (s->custom_stride )
81         stride = s->custom_stride;
82     else {
83         int aligned_width = ((avctx->width + 47) / 48) * 48;
84         stride = aligned_width * 8 / 3;
85     }
86
87     aligned_input = !((uintptr_t)psrc & 0xf) && !(stride & 0xf);
88     if (aligned_input != s->aligned_input) {
89         s->aligned_input = aligned_input;
90         if (HAVE_MMX)
91             v210_x86_init(s);
92     }
93
94     if (pic->data[0])
95         avctx->release_buffer(avctx, pic);
96
97     if (avpkt->size < stride * avctx->height) {
98         av_log(avctx, AV_LOG_ERROR, "packet too small\n");
99         return -1;
100     }
101
102     pic->reference = 0;
103     if (avctx->get_buffer(avctx, pic) < 0)
104         return -1;
105
106     y = (uint16_t*)pic->data[0];
107     u = (uint16_t*)pic->data[1];
108     v = (uint16_t*)pic->data[2];
109     pic->pict_type = AV_PICTURE_TYPE_I;
110     pic->key_frame = 1;
111
112     for (h = 0; h < avctx->height; h++) {
113         const uint32_t *src = (const uint32_t*)psrc;
114         uint32_t val;
115
116         w = (avctx->width / 6) * 6;
117         s->unpack_frame(src, y, u, v, w);
118
119         y += w;
120         u += w >> 1;
121         v += w >> 1;
122         src += (w << 1) / 3;
123
124         if (w < avctx->width - 1) {
125             READ_PIXELS(u, y, v);
126
127             val  = av_le2ne32(*src++);
128             *y++ =  val & 0x3FF;
129             if (w < avctx->width - 3) {
130                 *u++ = (val >> 10) & 0x3FF;
131                 *y++ = (val >> 20) & 0x3FF;
132
133                 val  = av_le2ne32(*src++);
134                 *v++ =  val & 0x3FF;
135                 *y++ = (val >> 10) & 0x3FF;
136             }
137         }
138
139         psrc += stride;
140         y += pic->linesize[0] / 2 - avctx->width;
141         u += pic->linesize[1] / 2 - avctx->width / 2;
142         v += pic->linesize[2] / 2 - avctx->width / 2;
143     }
144
145     *data_size = sizeof(AVFrame);
146     *(AVFrame*)data = *avctx->coded_frame;
147
148     return avpkt->size;
149 }
150
151 static av_cold int decode_close(AVCodecContext *avctx)
152 {
153     AVFrame *pic = avctx->coded_frame;
154     if (pic->data[0])
155         avctx->release_buffer(avctx, pic);
156     av_freep(&avctx->coded_frame);
157
158     return 0;
159 }
160
161 #define V210DEC_FLAGS AV_OPT_FLAG_DECODING_PARAM | AV_OPT_FLAG_VIDEO_PARAM
162 static const AVOption v210dec_options[] = {
163     {"custom_stride", "Custom V210 stride", offsetof(V210DecContext, custom_stride), FF_OPT_TYPE_INT,
164      {.dbl = 0}, INT_MIN, INT_MAX, V210DEC_FLAGS},
165     {NULL}
166 };
167
168 static const AVClass v210dec_class = {
169     "V210 Decoder",
170     av_default_item_name,
171     v210dec_options,
172     LIBAVUTIL_VERSION_INT,
173 };
174
175 AVCodec ff_v210_decoder = {
176     .name           = "v210",
177     .type           = AVMEDIA_TYPE_VIDEO,
178     .id             = CODEC_ID_V210,
179     .priv_data_size = sizeof(V210DecContext),
180     .init           = decode_init,
181     .close          = decode_close,
182     .decode         = decode_frame,
183     .capabilities   = CODEC_CAP_DR1,
184     .long_name = NULL_IF_CONFIG_SMALL("Uncompressed 4:2:2 10-bit"),
185     .priv_class     = &v210dec_class,
186 };