]> git.sesse.net Git - ffmpeg/blob - libavcodec/v210dec.c
libavcodec Adding ff_v210_planar_unpack AVX2
[ffmpeg] / libavcodec / v210dec.c
1 /*
2  * V210 decoder
3  *
4  * Copyright (C) 2009 Michael Niedermayer <michaelni@gmx.at>
5  * Copyright (c) 2009 Baptiste Coudurier <baptiste dot coudurier at gmail dot com>
6  *
7  * This file is part of FFmpeg.
8  *
9  * FFmpeg is free software; you can redistribute it and/or
10  * modify it under the terms of the GNU Lesser General Public
11  * License as published by the Free Software Foundation; either
12  * version 2.1 of the License, or (at your option) any later version.
13  *
14  * FFmpeg is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
17  * Lesser General Public License for more details.
18  *
19  * You should have received a copy of the GNU Lesser General Public
20  * License along with FFmpeg; if not, write to the Free Software
21  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
22  */
23
24 #include "avcodec.h"
25 #include "internal.h"
26 #include "v210dec.h"
27 #include "libavutil/bswap.h"
28 #include "libavutil/internal.h"
29 #include "libavutil/mem.h"
30 #include "libavutil/intreadwrite.h"
31
32 #define READ_PIXELS(a, b, c)         \
33     do {                             \
34         val  = av_le2ne32(*src++);   \
35         *a++ =  val & 0x3FF;         \
36         *b++ = (val >> 10) & 0x3FF;  \
37         *c++ = (val >> 20) & 0x3FF;  \
38     } while (0)
39
40 static void v210_planar_unpack_c(const uint32_t *src, uint16_t *y, uint16_t *u, uint16_t *v, int width)
41 {
42     uint32_t val;
43     int i;
44
45     for( i = 0; i < width-5; i += 6 ){
46         READ_PIXELS(u, y, v);
47         READ_PIXELS(y, u, y);
48         READ_PIXELS(v, y, u);
49         READ_PIXELS(y, v, y);
50     }
51 }
52
53 av_cold void ff_v210dec_init(V210DecContext *s)
54 {
55     s->unpack_frame = v210_planar_unpack_c;
56     if (ARCH_X86)
57         ff_v210_x86_init(s);
58 }
59
60 static av_cold int decode_init(AVCodecContext *avctx)
61 {
62     V210DecContext *s = avctx->priv_data;
63
64     avctx->pix_fmt             = AV_PIX_FMT_YUV422P10;
65     avctx->bits_per_raw_sample = 10;
66
67     s->aligned_input = 0;
68     ff_v210dec_init(s);
69
70     return 0;
71 }
72
73 static int decode_frame(AVCodecContext *avctx, void *data, int *got_frame,
74                         AVPacket *avpkt)
75 {
76     V210DecContext *s = avctx->priv_data;
77
78     int h, w, ret, stride, aligned_input;
79     AVFrame *pic = data;
80     const uint8_t *psrc = avpkt->data;
81     uint16_t *y, *u, *v;
82
83     if (s->custom_stride )
84         stride = s->custom_stride;
85     else {
86         int aligned_width = ((avctx->width + 47) / 48) * 48;
87         stride = aligned_width * 8 / 3;
88     }
89
90     if (avpkt->size < stride * avctx->height) {
91         if ((((avctx->width + 23) / 24) * 24 * 8) / 3 * avctx->height == avpkt->size) {
92             stride = avpkt->size / avctx->height;
93             if (!s->stride_warning_shown)
94                 av_log(avctx, AV_LOG_WARNING, "Broken v210 with too small padding (64 byte) detected\n");
95             s->stride_warning_shown = 1;
96         } else {
97             av_log(avctx, AV_LOG_ERROR, "packet too small\n");
98             return AVERROR_INVALIDDATA;
99         }
100     }
101     if (   avctx->codec_tag == MKTAG('C', '2', '1', '0')
102         && avpkt->size > 64
103         && AV_RN32(psrc) == AV_RN32("INFO")
104         && avpkt->size - 64 >= stride * avctx->height)
105         psrc += 64;
106
107     aligned_input = !((uintptr_t)psrc & 0xf) && !(stride & 0xf);
108     if (aligned_input != s->aligned_input) {
109         s->aligned_input = aligned_input;
110         ff_v210dec_init(s);
111     }
112
113     if ((ret = ff_get_buffer(avctx, pic, 0)) < 0)
114         return ret;
115
116     y = (uint16_t*)pic->data[0];
117     u = (uint16_t*)pic->data[1];
118     v = (uint16_t*)pic->data[2];
119     pic->pict_type = AV_PICTURE_TYPE_I;
120     pic->key_frame = 1;
121
122     for (h = 0; h < avctx->height; h++) {
123         const uint32_t *src = (const uint32_t*)psrc;
124         uint32_t val;
125
126         w = (avctx->width / 12) * 12;
127         s->unpack_frame(src, y, u, v, w);
128
129         y += w;
130         u += w >> 1;
131         v += w >> 1;
132         src += (w << 1) / 3;
133
134         if (w < avctx->width - 5) {
135             READ_PIXELS(u, y, v);
136             READ_PIXELS(y, u, y);
137             READ_PIXELS(v, y, u);
138             READ_PIXELS(y, v, y);
139             w += 6;
140         }
141
142         if (w < avctx->width - 1) {
143             READ_PIXELS(u, y, v);
144
145             val  = av_le2ne32(*src++);
146             *y++ =  val & 0x3FF;
147             if (w < avctx->width - 3) {
148                 *u++ = (val >> 10) & 0x3FF;
149                 *y++ = (val >> 20) & 0x3FF;
150
151                 val  = av_le2ne32(*src++);
152                 *v++ =  val & 0x3FF;
153                 *y++ = (val >> 10) & 0x3FF;
154             }
155         }
156
157         psrc += stride;
158         y += pic->linesize[0] / 2 - avctx->width + (avctx->width & 1);
159         u += pic->linesize[1] / 2 - avctx->width / 2;
160         v += pic->linesize[2] / 2 - avctx->width / 2;
161     }
162
163     if (avctx->field_order > AV_FIELD_PROGRESSIVE) {
164         /* we have interlaced material flagged in container */
165         pic->interlaced_frame = 1;
166         if (avctx->field_order == AV_FIELD_TT || avctx->field_order == AV_FIELD_TB)
167             pic->top_field_first = 1;
168     }
169
170     *got_frame      = 1;
171
172     return avpkt->size;
173 }
174
175 #define V210DEC_FLAGS AV_OPT_FLAG_DECODING_PARAM | AV_OPT_FLAG_VIDEO_PARAM
176 static const AVOption v210dec_options[] = {
177     {"custom_stride", "Custom V210 stride", offsetof(V210DecContext, custom_stride), AV_OPT_TYPE_INT,
178      {.i64 = 0}, INT_MIN, INT_MAX, V210DEC_FLAGS},
179     {NULL}
180 };
181
182 static const AVClass v210dec_class = {
183     .class_name = "V210 Decoder",
184     .item_name  = av_default_item_name,
185     .option     = v210dec_options,
186     .version    = LIBAVUTIL_VERSION_INT,
187 };
188
189 AVCodec ff_v210_decoder = {
190     .name           = "v210",
191     .long_name      = NULL_IF_CONFIG_SMALL("Uncompressed 4:2:2 10-bit"),
192     .type           = AVMEDIA_TYPE_VIDEO,
193     .id             = AV_CODEC_ID_V210,
194     .priv_data_size = sizeof(V210DecContext),
195     .init           = decode_init,
196     .decode         = decode_frame,
197     .capabilities   = AV_CODEC_CAP_DR1,
198     .priv_class     = &v210dec_class,
199 };