Merge remote-tracking branch 'qatar/master'

[ffmpeg] / libavcodec / ffv1.c
diff --git a/libavcodec/ffv1.c b/libavcodec/ffv1.c

index 3f699105dc129e0b10be229ee7be954163e91557..f371c37676f4eaea9dafd0b1fa9214d261689208 100644 (file)
--- a/libavcodec/ffv1.c
+++ b/libavcodec/ffv1.c
@@ -26,12 +26,14 @@
   */
  
  #include "avcodec.h"
+#include "internal.h"
  #include "get_bits.h"
  #include "put_bits.h"
  #include "dsputil.h"
  #include "rangecoder.h"
  #include "golomb.h"
  #include "mathops.h"
+#include "libavutil/pixdesc.h"
  #include "libavutil/avassert.h"
  
  #define MAX_PLANES 4
@@ -165,6 +167,7 @@ typedef struct FFV1Context{
      int version;
      int width, height;
      int chroma_h_shift, chroma_v_shift;
+    int chroma_planes;
      int transparency;
      int flags;
      int picture_number;
@@ -195,6 +198,7 @@ typedef struct FFV1Context{
      int slice_height;
      int slice_x;
      int slice_y;
+    int bits_per_raw_sample;
  }FFV1Context;
  
  static av_always_inline int fold(int diff, int bits){
@@ -539,7 +543,7 @@ static void encode_plane(FFV1Context *s, uint8_t *src, int w, int h, int stride,
          sample[0][-1]= sample[1][0  ];
          sample[1][ w]= sample[1][w-1];
  //{START_TIMER
-        if(s->avctx->bits_per_raw_sample<=8){
+        if(s->bits_per_raw_sample<=8){
              for(x=0; x<w; x++){
                  sample[0][x]= src[x + stride*y];
              }
@@ -551,10 +555,10 @@ static void encode_plane(FFV1Context *s, uint8_t *src, int w, int h, int stride,
                  }
              }else{
                  for(x=0; x<w; x++){
-                    sample[0][x]= ((uint16_t*)(src + stride*y))[x] >> (16 - s->avctx->bits_per_raw_sample);
+                    sample[0][x]= ((uint16_t*)(src + stride*y))[x] >> (16 - s->bits_per_raw_sample);
                  }
              }
-            encode_line(s, w, sample, plane_index, s->avctx->bits_per_raw_sample);
+            encode_line(s, w, sample, plane_index, s->bits_per_raw_sample);
          }
  //STOP_TIMER("encode line")}
      }
@@ -639,10 +643,10 @@ static void write_header(FFV1Context *f){
          }
          put_symbol(c, state, f->colorspace, 0); //YUV cs type
          if(f->version>0)
-            put_symbol(c, state, f->avctx->bits_per_raw_sample, 0);
-        put_rac(c, state, 1); //chroma planes
-            put_symbol(c, state, f->chroma_h_shift, 0);
-            put_symbol(c, state, f->chroma_v_shift, 0);
+            put_symbol(c, state, f->bits_per_raw_sample, 0);
+        put_rac(c, state, f->chroma_planes);
+        put_symbol(c, state, f->chroma_h_shift, 0);
+        put_symbol(c, state, f->chroma_v_shift, 0);
          put_rac(c, state, f->transparency);
  
          write_quant_tables(c, f->quant_table);
@@ -671,7 +675,7 @@ static av_cold int common_init(AVCodecContext *avctx){
  
      avcodec_get_frame_defaults(&s->picture);
  
-    dsputil_init(&s->dsp, avctx);
+    ff_dsputil_init(&s->dsp, avctx);
  
      s->width = avctx->width;
      s->height= avctx->height;
@@ -781,10 +785,10 @@ static int write_extra_header(FFV1Context *f){
          }
      }
      put_symbol(c, state, f->colorspace, 0); //YUV cs type
-    put_symbol(c, state, f->avctx->bits_per_raw_sample, 0);
-    put_rac(c, state, 1); //chroma planes
-        put_symbol(c, state, f->chroma_h_shift, 0);
-        put_symbol(c, state, f->chroma_v_shift, 0);
+    put_symbol(c, state, f->bits_per_raw_sample, 0);
+    put_rac(c, state, f->chroma_planes);
+    put_symbol(c, state, f->chroma_h_shift, 0);
+    put_symbol(c, state, f->chroma_v_shift, 0);
      put_rac(c, state, f->transparency);
      put_symbol(c, state, f->num_h_slices-1, 0);
      put_symbol(c, state, f->num_v_slices-1, 0);
@@ -873,53 +877,28 @@ static av_cold int encode_init(AVCodecContext *avctx)
              s->state_transition[i]=ver2_state[i];
  
      s->plane_count=3;
-    for(i=0; i<256; i++){
-        s->quant_table_count=2;
-        if(avctx->bits_per_raw_sample <=8){
-            s->quant_tables[0][0][i]=           quant11[i];
-            s->quant_tables[0][1][i]=        11*quant11[i];
-            s->quant_tables[0][2][i]=     11*11*quant11[i];
-            s->quant_tables[1][0][i]=           quant11[i];
-            s->quant_tables[1][1][i]=        11*quant11[i];
-            s->quant_tables[1][2][i]=     11*11*quant5 [i];
-            s->quant_tables[1][3][i]=   5*11*11*quant5 [i];
-            s->quant_tables[1][4][i]= 5*5*11*11*quant5 [i];
-        }else{
-            s->quant_tables[0][0][i]=           quant9_10bit[i];
-            s->quant_tables[0][1][i]=        11*quant9_10bit[i];
-            s->quant_tables[0][2][i]=     11*11*quant9_10bit[i];
-            s->quant_tables[1][0][i]=           quant9_10bit[i];
-            s->quant_tables[1][1][i]=        11*quant9_10bit[i];
-            s->quant_tables[1][2][i]=     11*11*quant5_10bit[i];
-            s->quant_tables[1][3][i]=   5*11*11*quant5_10bit[i];
-            s->quant_tables[1][4][i]= 5*5*11*11*quant5_10bit[i];
-        }
-    }
-    s->context_count[0]= (11*11*11+1)/2;
-    s->context_count[1]= (11*11*5*5*5+1)/2;
-    memcpy(s->quant_table, s->quant_tables[avctx->context_model], sizeof(s->quant_table));
-
-    for(i=0; i<s->plane_count; i++){
-        PlaneContext * const p= &s->plane[i];
-
-        memcpy(p->quant_table, s->quant_table, sizeof(p->quant_table));
-        p->quant_table_index= avctx->context_model;
-        p->context_count= s->context_count[p->quant_table_index];
-    }
-
-    if(allocate_initial_states(s) < 0)
-        return AVERROR(ENOMEM);
-
-    avctx->coded_frame= &s->picture;
      switch(avctx->pix_fmt){
+    case PIX_FMT_YUV444P9:
+    case PIX_FMT_YUV422P9:
      case PIX_FMT_YUV420P9:
+        if (!avctx->bits_per_raw_sample)
+            s->bits_per_raw_sample = 9;
+    case PIX_FMT_YUV444P10:
      case PIX_FMT_YUV420P10:
      case PIX_FMT_YUV422P10:
          s->packed_at_lsb = 1;
+        if (!avctx->bits_per_raw_sample && !s->bits_per_raw_sample)
+            s->bits_per_raw_sample = 10;
+    case PIX_FMT_GRAY16:
      case PIX_FMT_YUV444P16:
      case PIX_FMT_YUV422P16:
      case PIX_FMT_YUV420P16:
-        if(avctx->bits_per_raw_sample <=8){
+        if (!avctx->bits_per_raw_sample && !s->bits_per_raw_sample) {
+            s->bits_per_raw_sample = 16;
+        } else if (!s->bits_per_raw_sample){
+            s->bits_per_raw_sample = avctx->bits_per_raw_sample;
+        }
+        if(s->bits_per_raw_sample <=8){
              av_log(avctx, AV_LOG_ERROR, "bits_per_raw_sample invalid\n");
              return -1;
          }
@@ -928,15 +907,19 @@ static av_cold int encode_init(AVCodecContext *avctx)
              return -1;
          }
          s->version= FFMAX(s->version, 1);
+    case PIX_FMT_GRAY8:
      case PIX_FMT_YUV444P:
+    case PIX_FMT_YUV440P:
      case PIX_FMT_YUV422P:
      case PIX_FMT_YUV420P:
      case PIX_FMT_YUV411P:
      case PIX_FMT_YUV410P:
+        s->chroma_planes= av_pix_fmt_descriptors[avctx->pix_fmt].nb_components < 3 ? 0 : 1;
          s->colorspace= 0;
          break;
      case PIX_FMT_YUVA444P:
      case PIX_FMT_YUVA420P:
+        s->chroma_planes= 1;
          s->colorspace= 0;
          s->transparency= 1;
          break;
@@ -951,6 +934,52 @@ static av_cold int encode_init(AVCodecContext *avctx)
          av_log(avctx, AV_LOG_ERROR, "format not supported\n");
          return -1;
      }
+    if (s->transparency) {
+        av_log(avctx, AV_LOG_WARNING, "Storing alpha plane, this will require a recent FFV1 decoder to playback!\n");
+    }
+    if (avctx->context_model > 1U) {
+        av_log(avctx, AV_LOG_ERROR, "Invalid context model %d, valid values are 0 and 1\n", avctx->context_model);
+        return AVERROR(EINVAL);
+    }
+
+    for(i=0; i<256; i++){
+        s->quant_table_count=2;
+        if(s->bits_per_raw_sample <=8){
+            s->quant_tables[0][0][i]=           quant11[i];
+            s->quant_tables[0][1][i]=        11*quant11[i];
+            s->quant_tables[0][2][i]=     11*11*quant11[i];
+            s->quant_tables[1][0][i]=           quant11[i];
+            s->quant_tables[1][1][i]=        11*quant11[i];
+            s->quant_tables[1][2][i]=     11*11*quant5 [i];
+            s->quant_tables[1][3][i]=   5*11*11*quant5 [i];
+            s->quant_tables[1][4][i]= 5*5*11*11*quant5 [i];
+        }else{
+            s->quant_tables[0][0][i]=           quant9_10bit[i];
+            s->quant_tables[0][1][i]=        11*quant9_10bit[i];
+            s->quant_tables[0][2][i]=     11*11*quant9_10bit[i];
+            s->quant_tables[1][0][i]=           quant9_10bit[i];
+            s->quant_tables[1][1][i]=        11*quant9_10bit[i];
+            s->quant_tables[1][2][i]=     11*11*quant5_10bit[i];
+            s->quant_tables[1][3][i]=   5*11*11*quant5_10bit[i];
+            s->quant_tables[1][4][i]= 5*5*11*11*quant5_10bit[i];
+        }
+    }
+    s->context_count[0]= (11*11*11+1)/2;
+    s->context_count[1]= (11*11*5*5*5+1)/2;
+    memcpy(s->quant_table, s->quant_tables[avctx->context_model], sizeof(s->quant_table));
+
+    for(i=0; i<s->plane_count; i++){
+        PlaneContext * const p= &s->plane[i];
+
+        memcpy(p->quant_table, s->quant_table, sizeof(p->quant_table));
+        p->quant_table_index= avctx->context_model;
+        p->context_count= s->context_count[p->quant_table_index];
+    }
+
+    if(allocate_initial_states(s) < 0)
+        return AVERROR(ENOMEM);
+
+    avctx->coded_frame= &s->picture;
      if(!s->transparency)
          s->plane_count= 2;
      avcodec_get_chroma_sub_sample(avctx->pix_fmt, &s->chroma_h_shift, &s->chroma_v_shift);
@@ -1070,12 +1099,12 @@ static void clear_state(FFV1Context *f){
                  }else
                  memset(p->state, 128, CONTEXT_SIZE*p->context_count);
              }else{
-            for(j=0; j<p->context_count; j++){
+                for(j=0; j<p->context_count; j++){
                      p->vlc_state[j].drift= 0;
                      p->vlc_state[j].error_sum= 4; //FFMAX((RANGE + 32)/64, 2);
                      p->vlc_state[j].bias= 0;
                      p->vlc_state[j].count= 1;
-            }
+                }
              }
          }
      }
@@ -1090,7 +1119,7 @@ static int encode_slice(AVCodecContext *c, void *arg){
      int x= fs->slice_x;
      int y= fs->slice_y;
      AVFrame * const p= &f->picture;
-    const int ps= (c->bits_per_raw_sample>8)+1;
+    const int ps= (f->bits_per_raw_sample>8)+1;
  
      if(f->colorspace==0){
          const int chroma_width = -((-width )>>f->chroma_h_shift);
@@ -1100,8 +1129,10 @@ static int encode_slice(AVCodecContext *c, void *arg){
  
          encode_plane(fs, p->data[0] + ps*x + y*p->linesize[0], width, height, p->linesize[0], 0);
  
-        encode_plane(fs, p->data[1] + ps*cx+cy*p->linesize[1], chroma_width, chroma_height, p->linesize[1], 1);
-        encode_plane(fs, p->data[2] + ps*cx+cy*p->linesize[2], chroma_width, chroma_height, p->linesize[2], 1);
+        if (f->chroma_planes){
+            encode_plane(fs, p->data[1] + ps*cx+cy*p->linesize[1], chroma_width, chroma_height, p->linesize[1], 1);
+            encode_plane(fs, p->data[2] + ps*cx+cy*p->linesize[2], chroma_width, chroma_height, p->linesize[2], 1);
+        }
          if (fs->transparency)
              encode_plane(fs, p->data[3] + ps*x + y*p->linesize[3], width, height, p->linesize[3], 2);
      }else{
@@ -1112,17 +1143,23 @@ static int encode_slice(AVCodecContext *c, void *arg){
      return 0;
  }
  
-static int encode_frame(AVCodecContext *avctx, unsigned char *buf, int buf_size, void *data){
+static int encode_frame(AVCodecContext *avctx, AVPacket *pkt,
+                        const AVFrame *pict, int *got_packet)
+{
      FFV1Context *f = avctx->priv_data;
      RangeCoder * const c= &f->slice_context[0]->c;
-    AVFrame *pict = data;
      AVFrame * const p= &f->picture;
      int used_count= 0;
      uint8_t keystate=128;
      uint8_t *buf_p;
-    int i;
+    int i, ret;
+
+    if ((ret = ff_alloc_packet2(avctx, pkt, avctx->width*avctx->height*((8*2+1+1)*4)/8
+                                  + FF_MIN_BUFFER_SIZE)) < 0) {
+        return ret;
+    }
  
-    ff_init_range_encoder(c, buf, buf_size);
+    ff_init_range_encoder(c, pkt->data, pkt->size);
      ff_build_rac_states(c, 0.05*(1LL<<32), 256-8);
  
      *p = *pict;
@@ -1142,7 +1179,7 @@ static int encode_frame(AVCodecContext *avctx, unsigned char *buf, int buf_size,
      if(!f->ac){
          used_count += ff_rac_terminate(c);
  //printf("pos=%d\n", used_count);
-        init_put_bits(&f->slice_context[0]->pb, buf + used_count, buf_size - used_count);
+        init_put_bits(&f->slice_context[0]->pb, pkt->data + used_count, pkt->size - used_count);
      }else if (f->ac>1){
          int i;
          for(i=1; i<256; i++){
@@ -1153,8 +1190,8 @@ static int encode_frame(AVCodecContext *avctx, unsigned char *buf, int buf_size,
  
      for(i=1; i<f->slice_count; i++){
          FFV1Context *fs= f->slice_context[i];
-        uint8_t *start= buf + (buf_size-used_count)*i/f->slice_count;
-        int len= buf_size/f->slice_count;
+        uint8_t *start = pkt->data + (pkt->size-used_count)*i/f->slice_count;
+        int len = pkt->size/f->slice_count;
  
          if(fs->ac){
              ff_init_range_encoder(&fs->c, start, len);
@@ -1164,7 +1201,7 @@ static int encode_frame(AVCodecContext *avctx, unsigned char *buf, int buf_size,
      }
      avctx->execute(avctx, encode_slice, &f->slice_context[0], NULL, f->slice_count, sizeof(void*));
  
-    buf_p=buf;
+    buf_p = pkt->data;
      for(i=0; i<f->slice_count; i++){
          FFV1Context *fs= f->slice_context[i];
          int bytes;
@@ -1179,7 +1216,7 @@ static int encode_frame(AVCodecContext *avctx, unsigned char *buf, int buf_size,
              used_count= 0;
          }
          if(i>0){
-            av_assert0(bytes < buf_size/f->slice_count);
+            av_assert0(bytes < pkt->size/f->slice_count);
              memmove(buf_p, fs->ac ? fs->c.bytestream_start : fs->pb.buf, bytes);
              av_assert0(bytes < (1<<24));
              AV_WB24(buf_p+bytes, bytes);
@@ -1232,7 +1269,11 @@ static int encode_frame(AVCodecContext *avctx, unsigned char *buf, int buf_size,
          avctx->stats_out[0] = '\0';
  
      f->picture_number++;
-    return buf_p-buf;
+    pkt->size   = buf_p - pkt->data;
+    pkt->flags |= AV_PKT_FLAG_KEY*p->key_frame;
+    *got_packet = 1;
+
+    return 0;
  }
  #endif /* CONFIG_FFV1_ENCODER */
  
@@ -1434,8 +1475,10 @@ static int decode_slice(AVCodecContext *c, void *arg){
          const int cy= y>>f->chroma_v_shift;
          decode_plane(fs, p->data[0] + ps*x + y*p->linesize[0], width, height, p->linesize[0], 0);
  
-        decode_plane(fs, p->data[1] + ps*cx+cy*p->linesize[1], chroma_width, chroma_height, p->linesize[1], 1);
-        decode_plane(fs, p->data[2] + ps*cx+cy*p->linesize[2], chroma_width, chroma_height, p->linesize[2], 1);
+        if (f->chroma_planes){
+            decode_plane(fs, p->data[1] + ps*cx+cy*p->linesize[1], chroma_width, chroma_height, p->linesize[1], 1);
+            decode_plane(fs, p->data[2] + ps*cx+cy*p->linesize[2], chroma_width, chroma_height, p->linesize[2], 1);
+        }
          if (fs->transparency)
              decode_plane(fs, p->data[3] + ps*x + y*p->linesize[3], width, height, p->linesize[3], 2);
      }else{
@@ -1566,7 +1609,7 @@ static int read_header(FFV1Context *f){
          f->colorspace= get_symbol(c, state, 0); //YUV cs type
          if(f->version>0)
              f->avctx->bits_per_raw_sample= get_symbol(c, state, 0);
-        get_rac(c, state); //no chroma = false
+        f->chroma_planes= get_rac(c, state);
          f->chroma_h_shift= get_symbol(c, state, 0);
          f->chroma_v_shift= get_symbol(c, state, 0);
          f->transparency= get_rac(c, state);
@@ -1574,9 +1617,15 @@ static int read_header(FFV1Context *f){
      }
  
      if(f->colorspace==0){
-        if(f->avctx->bits_per_raw_sample<=8 && !f->transparency){
+        if(!f->transparency && !f->chroma_planes){
+            if (f->avctx->bits_per_raw_sample<=8)
+                f->avctx->pix_fmt= PIX_FMT_GRAY8;
+            else
+                f->avctx->pix_fmt= PIX_FMT_GRAY16;
+        }else if(f->avctx->bits_per_raw_sample<=8 && !f->transparency){
              switch(16*f->chroma_h_shift + f->chroma_v_shift){
              case 0x00: f->avctx->pix_fmt= PIX_FMT_YUV444P; break;
+            case 0x01: f->avctx->pix_fmt= PIX_FMT_YUV440P; break;
              case 0x10: f->avctx->pix_fmt= PIX_FMT_YUV422P; break;
              case 0x11: f->avctx->pix_fmt= PIX_FMT_YUV420P; break;
              case 0x20: f->avctx->pix_fmt= PIX_FMT_YUV411P; break;
@@ -1594,19 +1643,21 @@ static int read_header(FFV1Context *f){
                  return -1;
              }
          }else if(f->avctx->bits_per_raw_sample==9) {
+            f->packed_at_lsb=1;
              switch(16*f->chroma_h_shift + f->chroma_v_shift){
-            case 0x00: f->avctx->pix_fmt= PIX_FMT_YUV444P16; break;
-            case 0x10: f->avctx->pix_fmt= PIX_FMT_YUV422P16; break;
-            case 0x11: f->avctx->pix_fmt= PIX_FMT_YUV420P9 ; f->packed_at_lsb=1; break;
+            case 0x00: f->avctx->pix_fmt= PIX_FMT_YUV444P9; break;
+            case 0x10: f->avctx->pix_fmt= PIX_FMT_YUV422P9; break;
+            case 0x11: f->avctx->pix_fmt= PIX_FMT_YUV420P9; break;
              default:
                  av_log(f->avctx, AV_LOG_ERROR, "format not supported\n");
                  return -1;
              }
          }else if(f->avctx->bits_per_raw_sample==10) {
+            f->packed_at_lsb=1;
              switch(16*f->chroma_h_shift + f->chroma_v_shift){
-            case 0x00: f->avctx->pix_fmt= PIX_FMT_YUV444P16; break;
-            case 0x10: f->avctx->pix_fmt= PIX_FMT_YUV422P10; f->packed_at_lsb=1; break;
-            case 0x11: f->avctx->pix_fmt= PIX_FMT_YUV420P10; f->packed_at_lsb=1; break;
+            case 0x00: f->avctx->pix_fmt= PIX_FMT_YUV444P10; break;
+            case 0x10: f->avctx->pix_fmt= PIX_FMT_YUV422P10; break;
+            case 0x11: f->avctx->pix_fmt= PIX_FMT_YUV420P10; break;
              default:
                  av_log(f->avctx, AV_LOG_ERROR, "format not supported\n");
                  return -1;
@@ -1812,10 +1863,10 @@ AVCodec ff_ffv1_encoder = {
      .id             = CODEC_ID_FFV1,
      .priv_data_size = sizeof(FFV1Context),
      .init           = encode_init,
-    .encode         = encode_frame,
+    .encode2        = encode_frame,
      .close          = common_end,
      .capabilities = CODEC_CAP_SLICE_THREADS,
-    .pix_fmts= (const enum PixelFormat[]){PIX_FMT_YUV420P, PIX_FMT_YUVA420P, PIX_FMT_YUV444P, PIX_FMT_YUVA444P, PIX_FMT_YUV422P, PIX_FMT_YUV411P, PIX_FMT_YUV410P, PIX_FMT_0RGB32, PIX_FMT_RGB32, PIX_FMT_YUV420P16, PIX_FMT_YUV422P16, PIX_FMT_YUV444P16, PIX_FMT_YUV420P9, PIX_FMT_YUV420P10, PIX_FMT_YUV422P10, PIX_FMT_NONE},
+    .pix_fmts= (const enum PixelFormat[]){PIX_FMT_YUV420P, PIX_FMT_YUVA420P, PIX_FMT_YUV444P, PIX_FMT_YUVA444P, PIX_FMT_YUV440P, PIX_FMT_YUV422P, PIX_FMT_YUV411P, PIX_FMT_YUV410P, PIX_FMT_0RGB32, PIX_FMT_RGB32, PIX_FMT_YUV420P16, PIX_FMT_YUV422P16, PIX_FMT_YUV444P16, PIX_FMT_YUV444P9, PIX_FMT_YUV422P9, PIX_FMT_YUV420P9, PIX_FMT_YUV420P10, PIX_FMT_YUV422P10, PIX_FMT_YUV444P10, PIX_FMT_GRAY16, PIX_FMT_GRAY8, PIX_FMT_NONE},
      .long_name= NULL_IF_CONFIG_SMALL("FFmpeg video codec #1"),
  };
  #endif