git.sesse.net Git - ffmpeg/blob - libavcodec/v210enc.c

   1 /*
   2  * V210 encoder
   3  *
   4  * Copyright (C) 2009 Michael Niedermayer <michaelni@gmx.at>
   5  * Copyright (c) 2009 Baptiste Coudurier <baptiste dot coudurier at gmail dot com>
   6  *
   7  * This file is part of FFmpeg.
   8  *
   9  * FFmpeg is free software; you can redistribute it and/or
  10  * modify it under the terms of the GNU Lesser General Public
  11  * License as published by the Free Software Foundation; either
  12  * version 2.1 of the License, or (at your option) any later version.
  13  *
  14  * FFmpeg is distributed in the hope that it will be useful,
  15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
  16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
  17  * Lesser General Public License for more details.
  18  *
  19  * You should have received a copy of the GNU Lesser General Public
  20  * License along with FFmpeg; if not, write to the Free Software
  21  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
  22  */
  23
  24 #include "avcodec.h"
  25 #include "bytestream.h"
  26 #include "internal.h"
  27 #include "v210enc.h"
  28
  29 #define CLIP(v) av_clip(v, 4, 1019)
  30 #define CLIP8(v) av_clip(v, 1, 254)
  31
  32 #define WRITE_PIXELS(a, b, c)           \
  33     do {                                \
  34         val  =  CLIP(*a++);             \
  35         val |= (CLIP(*b++) << 10) |     \
  36                (CLIP(*c++) << 20);      \
  37         AV_WL32(dst, val);              \
  38         dst += 4;                       \
  39     } while (0)
  40
  41 #define WRITE_PIXELS8(a, b, c)          \
  42     do {                                \
  43         val  = (CLIP8(*a++) << 2);      \
  44         val |= (CLIP8(*b++) << 12) |    \
  45                (CLIP8(*c++) << 22);     \
  46         AV_WL32(dst, val);              \
  47         dst += 4;                       \
  48     } while (0)
  49
  50 static void v210_planar_pack_8_c(const uint8_t *y, const uint8_t *u,
  51                                  const uint8_t *v, uint8_t *dst,
  52                                  ptrdiff_t width)
  53 {
  54     uint32_t val;
  55     int i;
  56
  57     /* unroll this to match the assembly */
  58     for (i = 0; i < width - 11; i += 12) {
  59         WRITE_PIXELS8(u, y, v);
  60         WRITE_PIXELS8(y, u, y);
  61         WRITE_PIXELS8(v, y, u);
  62         WRITE_PIXELS8(y, v, y);
  63         WRITE_PIXELS8(u, y, v);
  64         WRITE_PIXELS8(y, u, y);
  65         WRITE_PIXELS8(v, y, u);
  66         WRITE_PIXELS8(y, v, y);
  67     }
  68 }
  69
  70 static void v210_planar_pack_10_c(const uint16_t *y, const uint16_t *u,
  71                                   const uint16_t *v, uint8_t *dst,
  72                                   ptrdiff_t width)
  73 {
  74     uint32_t val;
  75     int i;
  76
  77     for (i = 0; i < width - 5; i += 6) {
  78         WRITE_PIXELS(u, y, v);
  79         WRITE_PIXELS(y, u, y);
  80         WRITE_PIXELS(v, y, u);
  81         WRITE_PIXELS(y, v, y);
  82     }
  83 }
  84
  85 av_cold void ff_v210enc_init(V210EncContext *s)
  86 {
  87     s->pack_line_8  = v210_planar_pack_8_c;
  88     s->pack_line_10 = v210_planar_pack_10_c;
  89     s->sample_factor_8  = 1;
  90     s->sample_factor_10 = 1;
  91
  92     if (ARCH_X86)
  93         ff_v210enc_init_x86(s);
  94 }
  95
  96 static av_cold int encode_init(AVCodecContext *avctx)
  97 {
  98     V210EncContext *s = avctx->priv_data;
  99
 100     if (avctx->width & 1) {
 101         av_log(avctx, AV_LOG_ERROR, "v210 needs even width\n");
 102         return AVERROR(EINVAL);
 103     }
 104
 105 #if FF_API_CODED_FRAME
 106 FF_DISABLE_DEPRECATION_WARNINGS
 107     avctx->coded_frame->pict_type = AV_PICTURE_TYPE_I;
 108 FF_ENABLE_DEPRECATION_WARNINGS
 109 #endif
 110
 111     ff_v210enc_init(s);
 112
 113     avctx->bits_per_coded_sample = 20;
 114     avctx->bit_rate = ff_guess_coded_bitrate(avctx) * 16 / 15;
 115
 116     return 0;
 117 }
 118
 119 static int encode_frame(AVCodecContext *avctx, AVPacket *pkt,
 120                         const AVFrame *pic, int *got_packet)
 121 {
 122     V210EncContext *s = avctx->priv_data;
 123     int aligned_width = ((avctx->width + 47) / 48) * 48;
 124     int stride = aligned_width * 8 / 3;
 125     int line_padding = stride - ((avctx->width * 8 + 11) / 12) * 4;
 126     AVFrameSideData *side_data;
 127     int h, w, ret;
 128     uint8_t *dst;
 129
 130     ret = ff_alloc_packet2(avctx, pkt, avctx->height * stride, avctx->height * stride);
 131     if (ret < 0) {
 132         av_log(avctx, AV_LOG_ERROR, "Error getting output packet.\n");
 133         return ret;
 134     }
 135     dst = pkt->data;
 136
 137     if (pic->format == AV_PIX_FMT_YUV422P10) {
 138         const uint16_t *y = (const uint16_t *)pic->data[0];
 139         const uint16_t *u = (const uint16_t *)pic->data[1];
 140         const uint16_t *v = (const uint16_t *)pic->data[2];
 141
 142         const int sample_size = 6 * s->sample_factor_10;
 143         const int sample_w    = avctx->width / sample_size;
 144
 145         for (h = 0; h < avctx->height; h++) {
 146             uint32_t val;
 147             w = sample_w * sample_size;
 148             s->pack_line_10(y, u, v, dst, w);
 149
 150             y += w;
 151             u += w >> 1;
 152             v += w >> 1;
 153             dst += sample_w * 16 * s->sample_factor_10;
 154
 155             for (; w < avctx->width - 5; w += 6) {
 156                 WRITE_PIXELS(u, y, v);
 157                 WRITE_PIXELS(y, u, y);
 158                 WRITE_PIXELS(v, y, u);
 159                 WRITE_PIXELS(y, v, y);
 160             }
 161             if (w < avctx->width - 1) {
 162                 WRITE_PIXELS(u, y, v);
 163
 164                 val = CLIP(*y++);
 165                 if (w == avctx->width - 2) {
 166                     AV_WL32(dst, val);
 167                     dst += 4;
 168                 }
 169             }
 170             if (w < avctx->width - 3) {
 171                 val |= (CLIP(*u++) << 10) | (CLIP(*y++) << 20);
 172                 AV_WL32(dst, val);
 173                 dst += 4;
 174
 175                 val = CLIP(*v++) | (CLIP(*y++) << 10);
 176                 AV_WL32(dst, val);
 177                 dst += 4;
 178             }
 179
 180             memset(dst, 0, line_padding);
 181             dst += line_padding;
 182             y += pic->linesize[0] / 2 - avctx->width;
 183             u += pic->linesize[1] / 2 - avctx->width / 2;
 184             v += pic->linesize[2] / 2 - avctx->width / 2;
 185         }
 186     } else if(pic->format == AV_PIX_FMT_YUV422P) {
 187         const uint8_t *y = pic->data[0];
 188         const uint8_t *u = pic->data[1];
 189         const uint8_t *v = pic->data[2];
 190
 191         const int sample_size = 12 * s->sample_factor_8;
 192         const int sample_w    = avctx->width / sample_size;
 193
 194         for (h = 0; h < avctx->height; h++) {
 195             uint32_t val;
 196             w = sample_w * sample_size;
 197             s->pack_line_8(y, u, v, dst, w);
 198
 199             y += w;
 200             u += w >> 1;
 201             v += w >> 1;
 202             dst += sample_w * 32 * s->sample_factor_8;
 203
 204             for (; w < avctx->width - 5; w += 6) {
 205                 WRITE_PIXELS8(u, y, v);
 206                 WRITE_PIXELS8(y, u, y);
 207                 WRITE_PIXELS8(v, y, u);
 208                 WRITE_PIXELS8(y, v, y);
 209             }
 210             if (w < avctx->width - 1) {
 211                 WRITE_PIXELS8(u, y, v);
 212
 213                 val = CLIP8(*y++) << 2;
 214                 if (w == avctx->width - 2) {
 215                     AV_WL32(dst, val);
 216                     dst += 4;
 217                 }
 218             }
 219             if (w < avctx->width - 3) {
 220                 val |= (CLIP8(*u++) << 12) | (CLIP8(*y++) << 22);
 221                 AV_WL32(dst, val);
 222                 dst += 4;
 223
 224                 val = (CLIP8(*v++) << 2) | (CLIP8(*y++) << 12);
 225                 AV_WL32(dst, val);
 226                 dst += 4;
 227             }
 228             memset(dst, 0, line_padding);
 229             dst += line_padding;
 230
 231             y += pic->linesize[0] - avctx->width;
 232             u += pic->linesize[1] - avctx->width / 2;
 233             v += pic->linesize[2] - avctx->width / 2;
 234         }
 235     }
 236
 237     side_data = av_frame_get_side_data(pic, AV_FRAME_DATA_A53_CC);
 238     if (side_data && side_data->size) {
 239         uint8_t *buf = av_packet_new_side_data(pkt, AV_PKT_DATA_A53_CC, side_data->size);
 240         if (!buf)
 241             return AVERROR(ENOMEM);
 242         memcpy(buf, side_data->data, side_data->size);
 243     }
 244
 245     side_data = av_frame_get_side_data(pic, AV_FRAME_DATA_AFD);
 246     if (side_data && side_data->size) {
 247         uint8_t *buf = av_packet_new_side_data(pkt, AV_PKT_DATA_AFD, side_data->size);
 248         if (!buf)
 249             return AVERROR(ENOMEM);
 250         memcpy(buf, side_data->data, side_data->size);
 251     }
 252
 253     pkt->flags |= AV_PKT_FLAG_KEY;
 254     *got_packet = 1;
 255     return 0;
 256 }
 257
 258 AVCodec ff_v210_encoder = {
 259     .name           = "v210",
 260     .long_name      = NULL_IF_CONFIG_SMALL("Uncompressed 4:2:2 10-bit"),
 261     .type           = AVMEDIA_TYPE_VIDEO,
 262     .id             = AV_CODEC_ID_V210,
 263     .priv_data_size = sizeof(V210EncContext),
 264     .init           = encode_init,
 265     .encode2        = encode_frame,
 266     .pix_fmts       = (const enum AVPixelFormat[]){ AV_PIX_FMT_YUV422P10, AV_PIX_FMT_YUV422P, AV_PIX_FMT_NONE },
 267 };