celp filters: Do not read earlier than the start of the 'out' vector.

[ffmpeg] / libavcodec / dca.c
diff --git a/libavcodec/dca.c b/libavcodec/dca.c

index e3c64660dbd451f54af4633bd36336271422923e..103f0588e3ef97759248b797129af1cb548de34f 100644 (file)
--- a/libavcodec/dca.c
+++ b/libavcodec/dca.c
@@ -29,6 +29,7 @@
  #include "libavutil/common.h"
  #include "libavutil/intmath.h"
  #include "libavutil/intreadwrite.h"
+#include "libavutil/mathematics.h"
  #include "libavutil/audioconvert.h"
  #include "avcodec.h"
  #include "dsputil.h"
@@ -38,19 +39,24 @@
  #include "dcadata.h"
  #include "dcahuff.h"
  #include "dca.h"
+#include "dca_parser.h"
  #include "synth_filter.h"
  #include "dcadsp.h"
  #include "fmtconvert.h"
  
+#if ARCH_ARM
+#   include "arm/dca.h"
+#endif
+
  //#define TRACE
  
-#define DCA_PRIM_CHANNELS_MAX (7)
-#define DCA_SUBBANDS (32)
-#define DCA_ABITS_MAX (32)      /* Should be 28 */
-#define DCA_SUBSUBFRAMES_MAX (4)
-#define DCA_SUBFRAMES_MAX (16)
-#define DCA_BLOCKS_MAX (16)
-#define DCA_LFE_MAX (3)
+#define DCA_PRIM_CHANNELS_MAX  (7)
+#define DCA_SUBBANDS          (32)
+#define DCA_ABITS_MAX         (32)      /* Should be 28 */
+#define DCA_SUBSUBFRAMES_MAX   (4)
+#define DCA_SUBFRAMES_MAX     (16)
+#define DCA_BLOCKS_MAX        (16)
+#define DCA_LFE_MAX            (3)
  
  enum DCAMode {
      DCA_MONO = 0,
@@ -123,28 +129,45 @@ static const int dca_ext_audio_descr_mask[] = {
   * OV -> center back
   * All 2 channel configurations -> AV_CH_LAYOUT_STEREO
   */
-
-static const int64_t dca_core_channel_layout[] = {
-    AV_CH_FRONT_CENTER,                                                      ///< 1, A
-    AV_CH_LAYOUT_STEREO,                                                     ///< 2, A + B (dual mono)
-    AV_CH_LAYOUT_STEREO,                                                     ///< 2, L + R (stereo)
-    AV_CH_LAYOUT_STEREO,                                                     ///< 2, (L+R) + (L-R) (sum-difference)
-    AV_CH_LAYOUT_STEREO,                                                     ///< 2, LT +RT (left and right total)
-    AV_CH_LAYOUT_STEREO|AV_CH_FRONT_CENTER,                                  ///< 3, C+L+R
-    AV_CH_LAYOUT_STEREO|AV_CH_BACK_CENTER,                                   ///< 3, L+R+S
-    AV_CH_LAYOUT_STEREO|AV_CH_FRONT_CENTER|AV_CH_BACK_CENTER,                ///< 4, C + L + R+ S
-    AV_CH_LAYOUT_STEREO|AV_CH_SIDE_LEFT|AV_CH_SIDE_RIGHT,                    ///< 4, L + R +SL+ SR
-    AV_CH_LAYOUT_STEREO|AV_CH_FRONT_CENTER|AV_CH_SIDE_LEFT|AV_CH_SIDE_RIGHT, ///< 5, C + L + R+ SL+SR
-    AV_CH_LAYOUT_STEREO|AV_CH_SIDE_LEFT|AV_CH_SIDE_RIGHT|AV_CH_FRONT_LEFT_OF_CENTER|AV_CH_FRONT_RIGHT_OF_CENTER,                    ///< 6, CL + CR + L + R + SL + SR
-    AV_CH_LAYOUT_STEREO|AV_CH_BACK_LEFT|AV_CH_BACK_RIGHT|AV_CH_FRONT_CENTER|AV_CH_BACK_CENTER,                                      ///< 6, C + L + R+ LR + RR + OV
-    AV_CH_FRONT_CENTER|AV_CH_FRONT_RIGHT_OF_CENTER|AV_CH_FRONT_LEFT_OF_CENTER|AV_CH_BACK_CENTER|AV_CH_BACK_LEFT|AV_CH_BACK_RIGHT,   ///< 6, CF+ CR+LF+ RF+LR + RR
-    AV_CH_FRONT_LEFT_OF_CENTER|AV_CH_FRONT_CENTER|AV_CH_FRONT_RIGHT_OF_CENTER|AV_CH_LAYOUT_STEREO|AV_CH_SIDE_LEFT|AV_CH_SIDE_RIGHT, ///< 7, CL + C + CR + L + R + SL + SR
-    AV_CH_FRONT_LEFT_OF_CENTER|AV_CH_FRONT_RIGHT_OF_CENTER|AV_CH_LAYOUT_STEREO|AV_CH_SIDE_LEFT|AV_CH_SIDE_RIGHT|AV_CH_BACK_LEFT|AV_CH_BACK_RIGHT, ///< 8, CL + CR + L + R + SL1 + SL2+ SR1 + SR2
-    AV_CH_FRONT_LEFT_OF_CENTER|AV_CH_FRONT_CENTER|AV_CH_FRONT_RIGHT_OF_CENTER|AV_CH_LAYOUT_STEREO|AV_CH_SIDE_LEFT|AV_CH_BACK_CENTER|AV_CH_SIDE_RIGHT, ///< 8, CL + C+ CR + L + R + SL + S+ SR
+static const uint64_t dca_core_channel_layout[] = {
+    AV_CH_FRONT_CENTER,                                                     ///< 1, A
+    AV_CH_LAYOUT_STEREO,                                                    ///< 2, A + B (dual mono)
+    AV_CH_LAYOUT_STEREO,                                                    ///< 2, L + R (stereo)
+    AV_CH_LAYOUT_STEREO,                                                    ///< 2, (L + R) + (L - R) (sum-difference)
+    AV_CH_LAYOUT_STEREO,                                                    ///< 2, LT + RT (left and right total)
+    AV_CH_LAYOUT_STEREO | AV_CH_FRONT_CENTER,                               ///< 3, C + L + R
+    AV_CH_LAYOUT_STEREO | AV_CH_BACK_CENTER,                                ///< 3, L + R + S
+    AV_CH_LAYOUT_STEREO | AV_CH_FRONT_CENTER | AV_CH_BACK_CENTER,           ///< 4, C + L + R + S
+    AV_CH_LAYOUT_STEREO | AV_CH_SIDE_LEFT | AV_CH_SIDE_RIGHT,               ///< 4, L + R + SL + SR
+
+    AV_CH_LAYOUT_STEREO | AV_CH_FRONT_CENTER | AV_CH_SIDE_LEFT |
+    AV_CH_SIDE_RIGHT,                                                       ///< 5, C + L + R + SL + SR
+
+    AV_CH_LAYOUT_STEREO | AV_CH_SIDE_LEFT | AV_CH_SIDE_RIGHT |
+    AV_CH_FRONT_LEFT_OF_CENTER | AV_CH_FRONT_RIGHT_OF_CENTER,               ///< 6, CL + CR + L + R + SL + SR
+
+    AV_CH_LAYOUT_STEREO | AV_CH_BACK_LEFT | AV_CH_BACK_RIGHT |
+    AV_CH_FRONT_CENTER  | AV_CH_BACK_CENTER,                                ///< 6, C + L + R + LR + RR + OV
+
+    AV_CH_FRONT_CENTER | AV_CH_FRONT_RIGHT_OF_CENTER |
+    AV_CH_FRONT_LEFT_OF_CENTER | AV_CH_BACK_CENTER   |
+    AV_CH_BACK_LEFT | AV_CH_BACK_RIGHT,                                     ///< 6, CF + CR + LF + RF + LR + RR
+
+    AV_CH_FRONT_LEFT_OF_CENTER | AV_CH_FRONT_CENTER   |
+    AV_CH_FRONT_RIGHT_OF_CENTER | AV_CH_LAYOUT_STEREO |
+    AV_CH_SIDE_LEFT | AV_CH_SIDE_RIGHT,                                     ///< 7, CL + C + CR + L + R + SL + SR
+
+    AV_CH_FRONT_LEFT_OF_CENTER | AV_CH_FRONT_RIGHT_OF_CENTER |
+    AV_CH_LAYOUT_STEREO | AV_CH_SIDE_LEFT | AV_CH_SIDE_RIGHT |
+    AV_CH_BACK_LEFT | AV_CH_BACK_RIGHT,                                     ///< 8, CL + CR + L + R + SL1 + SL2 + SR1 + SR2
+
+    AV_CH_FRONT_LEFT_OF_CENTER | AV_CH_FRONT_CENTER   |
+    AV_CH_FRONT_RIGHT_OF_CENTER | AV_CH_LAYOUT_STEREO |
+    AV_CH_SIDE_LEFT | AV_CH_BACK_CENTER | AV_CH_SIDE_RIGHT,                 ///< 8, CL + C + CR + L + R + SL + S + SR
  };
  
  static const int8_t dca_lfe_index[] = {
-    1,2,2,2,2,3,2,3,2,3,2,3,1,3,2,3
+    1, 2, 2, 2, 2, 3, 2, 3, 2, 3, 2, 3, 1, 3, 2, 3
  };
  
  static const int8_t dca_channel_reorder_lfe[][9] = {
@@ -223,19 +246,19 @@ static const int8_t dca_channel_reorder_nolfe_xch[][9] = {
      { 3,  2,  4,  0,  1,  5,  8,  7,  6},
  };
  
-#define DCA_DOLBY 101           /* FIXME */
+#define DCA_DOLBY                  101           /* FIXME */
  
-#define DCA_CHANNEL_BITS 6
-#define DCA_CHANNEL_MASK 0x3F
+#define DCA_CHANNEL_BITS             6
+#define DCA_CHANNEL_MASK          0x3F
  
-#define DCA_LFE 0x80
+#define DCA_LFE                   0x80
  
-#define HEADER_SIZE 14
+#define HEADER_SIZE                 14
  
-#define DCA_MAX_FRAME_SIZE 16384
-#define DCA_MAX_EXSS_HEADER_SIZE 4096
+#define DCA_MAX_FRAME_SIZE       16384
+#define DCA_MAX_EXSS_HEADER_SIZE  4096
  
-#define DCA_BUFFER_PADDING_SIZE 1024
+#define DCA_BUFFER_PADDING_SIZE   1024
  
  /** Bit allocation */
  typedef struct {
@@ -250,13 +273,16 @@ static BitAlloc dca_tmode;             ///< transition mode VLCs
  static BitAlloc dca_scalefactor;       ///< scalefactor VLCs
  static BitAlloc dca_smpl_bitalloc[11]; ///< samples VLCs
  
-static av_always_inline int get_bitalloc(GetBitContext *gb, BitAlloc *ba, int idx)
+static av_always_inline int get_bitalloc(GetBitContext *gb, BitAlloc *ba,
+                                         int idx)
  {
-    return get_vlc2(gb, ba->vlc[idx].table, ba->vlc[idx].bits, ba->wrap) + ba->offset;
+    return get_vlc2(gb, ba->vlc[idx].table, ba->vlc[idx].bits, ba->wrap) +
+           ba->offset;
  }
  
  typedef struct {
      AVCodecContext *avctx;
+    AVFrame frame;
      /* Frame header */
      int frame_type;             ///< type of the current frame
      int samples_deficit;        ///< deficit sample count
@@ -302,8 +328,8 @@ typedef struct {
      float scalefactor_adj[DCA_PRIM_CHANNELS_MAX][DCA_ABITS_MAX];   ///< scale factor adjustment
  
      /* Primary audio coding side information */
-    int subsubframes[DCA_SUBFRAMES_MAX];           ///< number of subsubframes
-    int partial_samples[DCA_SUBFRAMES_MAX];        ///< partial subsubframe samples count
+    int subsubframes[DCA_SUBFRAMES_MAX];                         ///< number of subsubframes
+    int partial_samples[DCA_SUBFRAMES_MAX];                      ///< partial subsubframe samples count
      int prediction_mode[DCA_PRIM_CHANNELS_MAX][DCA_SUBBANDS];    ///< prediction mode (ADPCM used or not)
      int prediction_vq[DCA_PRIM_CHANNELS_MAX][DCA_SUBBANDS];      ///< prediction VQ coefs
      int bitalloc[DCA_PRIM_CHANNELS_MAX][DCA_SUBBANDS];           ///< bit allocation index
@@ -320,23 +346,23 @@ typedef struct {
      int lfe_scale_factor;
  
      /* Subband samples history (for ADPCM) */
-    float subband_samples_hist[DCA_PRIM_CHANNELS_MAX][DCA_SUBBANDS][4];
-    DECLARE_ALIGNED(16, float, subband_fir_hist)[DCA_PRIM_CHANNELS_MAX][512];
-    DECLARE_ALIGNED(16, float, subband_fir_noidea)[DCA_PRIM_CHANNELS_MAX][32];
+    DECLARE_ALIGNED(16, float, subband_samples_hist)[DCA_PRIM_CHANNELS_MAX][DCA_SUBBANDS][4];
+    DECLARE_ALIGNED(32, float, subband_fir_hist)[DCA_PRIM_CHANNELS_MAX][512];
+    DECLARE_ALIGNED(32, float, subband_fir_noidea)[DCA_PRIM_CHANNELS_MAX][32];
      int hist_index[DCA_PRIM_CHANNELS_MAX];
-    DECLARE_ALIGNED(16, float, raXin)[32];
+    DECLARE_ALIGNED(32, float, raXin)[32];
  
      int output;                 ///< type of output
      float scale_bias;           ///< output scale
  
-    DECLARE_ALIGNED(16, float, subband_samples)[DCA_BLOCKS_MAX][DCA_PRIM_CHANNELS_MAX][DCA_SUBBANDS][8];
-    DECLARE_ALIGNED(16, float, samples)[(DCA_PRIM_CHANNELS_MAX+1)*256];
-    const float *samples_chanptr[DCA_PRIM_CHANNELS_MAX+1];
+    DECLARE_ALIGNED(32, float, subband_samples)[DCA_BLOCKS_MAX][DCA_PRIM_CHANNELS_MAX][DCA_SUBBANDS][8];
+    DECLARE_ALIGNED(32, float, samples)[(DCA_PRIM_CHANNELS_MAX + 1) * 256];
+    const float *samples_chanptr[DCA_PRIM_CHANNELS_MAX + 1];
  
      uint8_t dca_buffer[DCA_MAX_FRAME_SIZE + DCA_MAX_EXSS_HEADER_SIZE + DCA_BUFFER_PADDING_SIZE];
      int dca_buffer_size;        ///< how much data is in the dca_buffer
  
-    const int8_t* channel_order_tab;                             ///< channel reordering table, lfe and non lfe
+    const int8_t *channel_order_tab;  ///< channel reordering table, lfe and non lfe
      GetBitContext gb;
      /* Current position in DCA frame */
      int current_subframe;
@@ -411,13 +437,15 @@ static av_cold void dca_init_vlcs(void)
      }
  
      for (i = 0; i < 10; i++)
-        for (j = 0; j < 7; j++){
-            if (!bitalloc_codes[i][j]) break;
-            dca_smpl_bitalloc[i+1].offset = bitalloc_offsets[i];
-            dca_smpl_bitalloc[i+1].wrap = 1 + (j > 4);
-            dca_smpl_bitalloc[i+1].vlc[j].table = &dca_table[dca_vlc_offs[c]];
-            dca_smpl_bitalloc[i+1].vlc[j].table_allocated = dca_vlc_offs[c + 1] - dca_vlc_offs[c];
-            init_vlc(&dca_smpl_bitalloc[i+1].vlc[j], bitalloc_maxbits[i][j],
+        for (j = 0; j < 7; j++) {
+            if (!bitalloc_codes[i][j])
+                break;
+            dca_smpl_bitalloc[i + 1].offset                 = bitalloc_offsets[i];
+            dca_smpl_bitalloc[i + 1].wrap                   = 1 + (j > 4);
+            dca_smpl_bitalloc[i + 1].vlc[j].table           = &dca_table[dca_vlc_offs[c]];
+            dca_smpl_bitalloc[i + 1].vlc[j].table_allocated = dca_vlc_offs[c + 1] - dca_vlc_offs[c];
+
+            init_vlc(&dca_smpl_bitalloc[i + 1].vlc[j], bitalloc_maxbits[i][j],
                       bitalloc_sizes[i],
                       bitalloc_bits[i][j], 1, 1,
                       bitalloc_codes[i][j], 2, 2, INIT_VLC_USE_NEW_STATIC);
@@ -428,19 +456,19 @@ static av_cold void dca_init_vlcs(void)
  
  static inline void get_array(GetBitContext *gb, int *dst, int len, int bits)
  {
-    while(len--)
+    while (len--)
          *dst++ = get_bits(gb, bits);
  }
  
-static int dca_parse_audio_coding_header(DCAContext * s, int base_channel)
+static int dca_parse_audio_coding_header(DCAContext *s, int base_channel)
  {
      int i, j;
      static const float adj_table[4] = { 1.0, 1.1250, 1.2500, 1.4375 };
      static const int bitlen[11] = { 0, 1, 2, 2, 2, 2, 3, 3, 3, 3, 3 };
-    static const int thr[11] = { 0, 1, 3, 3, 3, 3, 7, 7, 7, 7, 7 };
+    static const int thr[11]    = { 0, 1, 3, 3, 3, 3, 7, 7, 7, 7, 7 };
  
-    s->total_channels    = get_bits(&s->gb, 3) + 1 + base_channel;
-    s->prim_channels     = s->total_channels;
+    s->total_channels = get_bits(&s->gb, 3) + 1 + base_channel;
+    s->prim_channels  = s->total_channels;
  
      if (s->prim_channels > DCA_PRIM_CHANNELS_MAX)
          s->prim_channels = DCA_PRIM_CHANNELS_MAX;
@@ -483,23 +511,28 @@ static int dca_parse_audio_coding_header(DCAContext * s, int base_channel)
          get_bits(&s->gb, 16);
      }
  
-    s->current_subframe = 0;
+    s->current_subframe    = 0;
      s->current_subsubframe = 0;
  
  #ifdef TRACE
      av_log(s->avctx, AV_LOG_DEBUG, "subframes: %i\n", s->subframes);
      av_log(s->avctx, AV_LOG_DEBUG, "prim channels: %i\n", s->prim_channels);
-    for (i = base_channel; i < s->prim_channels; i++){
-        av_log(s->avctx, AV_LOG_DEBUG, "subband activity: %i\n", s->subband_activity[i]);
-        av_log(s->avctx, AV_LOG_DEBUG, "vq start subband: %i\n", s->vq_start_subband[i]);
-        av_log(s->avctx, AV_LOG_DEBUG, "joint intensity: %i\n", s->joint_intensity[i]);
-        av_log(s->avctx, AV_LOG_DEBUG, "transient mode codebook: %i\n", s->transient_huffman[i]);
-        av_log(s->avctx, AV_LOG_DEBUG, "scale factor codebook: %i\n", s->scalefactor_huffman[i]);
-        av_log(s->avctx, AV_LOG_DEBUG, "bit allocation quantizer: %i\n", s->bitalloc_huffman[i]);
+    for (i = base_channel; i < s->prim_channels; i++) {
+        av_log(s->avctx, AV_LOG_DEBUG, "subband activity: %i\n",
+               s->subband_activity[i]);
+        av_log(s->avctx, AV_LOG_DEBUG, "vq start subband: %i\n",
+               s->vq_start_subband[i]);
+        av_log(s->avctx, AV_LOG_DEBUG, "joint intensity: %i\n",
+               s->joint_intensity[i]);
+        av_log(s->avctx, AV_LOG_DEBUG, "transient mode codebook: %i\n",
+               s->transient_huffman[i]);
+        av_log(s->avctx, AV_LOG_DEBUG, "scale factor codebook: %i\n",
+               s->scalefactor_huffman[i]);
+        av_log(s->avctx, AV_LOG_DEBUG, "bit allocation quantizer: %i\n",
+               s->bitalloc_huffman[i]);
          av_log(s->avctx, AV_LOG_DEBUG, "quant index huff:");
          for (j = 0; j < 11; j++)
-            av_log(s->avctx, AV_LOG_DEBUG, " %i",
-                   s->quant_index_huffman[i][j]);
+            av_log(s->avctx, AV_LOG_DEBUG, " %i", s->quant_index_huffman[i][j]);
          av_log(s->avctx, AV_LOG_DEBUG, "\n");
          av_log(s->avctx, AV_LOG_DEBUG, "scalefac adj:");
          for (j = 0; j < 11; j++)
@@ -508,15 +541,15 @@ static int dca_parse_audio_coding_header(DCAContext * s, int base_channel)
      }
  #endif
  
-  return 0;
+    return 0;
  }
  
-static int dca_parse_frame_header(DCAContext * s)
+static int dca_parse_frame_header(DCAContext *s)
  {
      init_get_bits(&s->gb, s->dca_buffer, s->dca_buffer_size * 8);
  
      /* Sync code */
-    get_bits(&s->gb, 32);
+    skip_bits_long(&s->gb, 32);
  
      /* Frame header */
      s->frame_type        = get_bits(&s->gb, 1);
@@ -525,15 +558,15 @@ static int dca_parse_frame_header(DCAContext * s)
      s->sample_blocks     = get_bits(&s->gb, 7) + 1;
      s->frame_size        = get_bits(&s->gb, 14) + 1;
      if (s->frame_size < 95)
-        return -1;
+        return AVERROR_INVALIDDATA;
      s->amode             = get_bits(&s->gb, 6);
      s->sample_rate       = dca_sample_rates[get_bits(&s->gb, 4)];
      if (!s->sample_rate)
-        return -1;
+        return AVERROR_INVALIDDATA;
      s->bit_rate_index    = get_bits(&s->gb, 5);
      s->bit_rate          = dca_bit_rates[s->bit_rate_index];
      if (!s->bit_rate)
-        return -1;
+        return AVERROR_INVALIDDATA;
  
      s->downmix           = get_bits(&s->gb, 1);
      s->dynrange          = get_bits(&s->gb, 1);
@@ -560,7 +593,8 @@ static int dca_parse_frame_header(DCAContext * s)
  
      /* FIXME: channels mixing levels */
      s->output = s->amode;
-    if (s->lfe) s->output |= DCA_LFE;
+    if (s->lfe)
+        s->output |= DCA_LFE;
  
  #ifdef TRACE
      av_log(s->avctx, AV_LOG_DEBUG, "frame type: %i\n", s->frame_type);
@@ -607,26 +641,33 @@ static int dca_parse_frame_header(DCAContext * s)
  }
  
  
-static inline int get_scale(GetBitContext *gb, int level, int value)
+static inline int get_scale(GetBitContext *gb, int level, int value, int log2range)
  {
-   if (level < 5) {
-       /* huffman encoded */
-       value += get_bitalloc(gb, &dca_scalefactor, level);
-   } else if (level < 8)
-       value = get_bits(gb, level + 1);
-   return value;
+    if (level < 5) {
+        /* huffman encoded */
+        value += get_bitalloc(gb, &dca_scalefactor, level);
+        value = av_clip(value, 0, (1 << log2range) - 1);
+    } else if (level < 8) {
+        if (level + 1 > log2range) {
+            skip_bits(gb, level + 1 - log2range);
+            value = get_bits(gb, log2range);
+        } else {
+            value = get_bits(gb, level + 1);
+        }
+    }
+    return value;
  }
  
-static int dca_subframe_header(DCAContext * s, int base_channel, int block_index)
+static int dca_subframe_header(DCAContext *s, int base_channel, int block_index)
  {
      /* Primary audio coding side information */
      int j, k;
  
      if (get_bits_left(&s->gb) < 0)
-        return -1;
+        return AVERROR_INVALIDDATA;
  
      if (!base_channel) {
-        s->subsubframes[s->current_subframe] = get_bits(&s->gb, 2) + 1;
+        s->subsubframes[s->current_subframe]    = get_bits(&s->gb, 2) + 1;
          s->partial_samples[s->current_subframe] = get_bits(&s->gb, 3);
      }
  
@@ -655,16 +696,16 @@ static int dca_subframe_header(DCAContext * s, int base_channel, int block_index
              else if (s->bitalloc_huffman[j] == 7) {
                  av_log(s->avctx, AV_LOG_ERROR,
                         "Invalid bit allocation index\n");
-                return -1;
+                return AVERROR_INVALIDDATA;
              } else {
                  s->bitalloc[j][k] =
                      get_bitalloc(&s->gb, &dca_bitalloc_index, s->bitalloc_huffman[j]);
              }
  
              if (s->bitalloc[j][k] > 26) {
-//                 av_log(s->avctx,AV_LOG_DEBUG,"bitalloc index [%i][%i] too big (%i)\n",
-//                          j, k, s->bitalloc[j][k]);
-                return -1;
+                // av_log(s->avctx, AV_LOG_DEBUG, "bitalloc index [%i][%i] too big (%i)\n",
+                //        j, k, s->bitalloc[j][k]);
+                return AVERROR_INVALIDDATA;
              }
          }
      }
@@ -682,31 +723,35 @@ static int dca_subframe_header(DCAContext * s, int base_channel, int block_index
      }
  
      if (get_bits_left(&s->gb) < 0)
-        return -1;
+        return AVERROR_INVALIDDATA;
  
      for (j = base_channel; j < s->prim_channels; j++) {
          const uint32_t *scale_table;
-        int scale_sum;
+        int scale_sum, log_size;
  
-        memset(s->scale_factor[j], 0, s->subband_activity[j] * sizeof(s->scale_factor[0][0][0]) * 2);
+        memset(s->scale_factor[j], 0,
+               s->subband_activity[j] * sizeof(s->scale_factor[0][0][0]) * 2);
  
-        if (s->scalefactor_huffman[j] == 6)
+        if (s->scalefactor_huffman[j] == 6) {
              scale_table = scale_factor_quant7;
-        else
+            log_size = 7;
+        } else {
              scale_table = scale_factor_quant6;
+            log_size = 6;
+        }
  
          /* When huffman coded, only the difference is encoded */
          scale_sum = 0;
  
          for (k = 0; k < s->subband_activity[j]; k++) {
              if (k >= s->vq_start_subband[j] || s->bitalloc[j][k] > 0) {
-                scale_sum = get_scale(&s->gb, s->scalefactor_huffman[j], scale_sum);
+                scale_sum = get_scale(&s->gb, s->scalefactor_huffman[j], scale_sum, log_size);
                  s->scale_factor[j][k][0] = scale_table[scale_sum];
              }
  
              if (k < s->vq_start_subband[j] && s->transition_mode[j][k]) {
                  /* Get second scale factor */
-                scale_sum = get_scale(&s->gb, s->scalefactor_huffman[j], scale_sum);
+                scale_sum = get_scale(&s->gb, s->scalefactor_huffman[j], scale_sum, log_size);
                  s->scale_factor[j][k][1] = scale_table[scale_sum];
              }
          }
@@ -720,7 +765,7 @@ static int dca_subframe_header(DCAContext * s, int base_channel, int block_index
      }
  
      if (get_bits_left(&s->gb) < 0)
-        return -1;
+        return AVERROR_INVALIDDATA;
  
      /* Scale factors for joint subband coding */
      for (j = base_channel; j < s->prim_channels; j++) {
@@ -735,8 +780,7 @@ static int dca_subframe_header(DCAContext * s, int base_channel, int block_index
               * (is this valid as well for joint scales ???) */
  
              for (k = s->subband_activity[j]; k < s->subband_activity[source_channel]; k++) {
-                scale = get_scale(&s->gb, s->joint_huff[j], 0);
-                scale += 64;    /* bias */
+                scale = get_scale(&s->gb, s->joint_huff[j], 64 /* bias */, 7);
                  s->joint_scale_factor[j][k] = scale;    /*joint_scale_table[scale]; */
              }
  
@@ -757,6 +801,11 @@ static int dca_subframe_header(DCAContext * s, int base_channel, int block_index
              }
          } else {
              int am = s->amode & DCA_CHANNEL_MASK;
+            if (am >= FF_ARRAY_ELEMS(dca_default_coeffs)) {
+                av_log(s->avctx, AV_LOG_ERROR,
+                       "Invalid channel mode %d\n", am);
+                return AVERROR_INVALIDDATA;
+            }
              for (j = base_channel; j < s->prim_channels; j++) {
                  s->downmix_coef[j][0] = dca_default_coeffs[am][j][0];
                  s->downmix_coef[j][1] = dca_default_coeffs[am][j][1];
@@ -796,7 +845,8 @@ static int dca_subframe_header(DCAContext * s, int base_channel, int block_index
          }
  
          /* Scale factor index */
-        s->lfe_scale_factor = scale_factor_quant7[get_bits(&s->gb, 8)];
+        skip_bits(&s->gb, 1);
+        s->lfe_scale_factor = scale_factor_quant7[get_bits(&s->gb, 7)];
  
          /* Quantization step size * scale factor */
          lfe_scale = 0.035 * s->lfe_scale_factor;
@@ -806,9 +856,11 @@ static int dca_subframe_header(DCAContext * s, int base_channel, int block_index
      }
  
  #ifdef TRACE
-    av_log(s->avctx, AV_LOG_DEBUG, "subsubframes: %i\n", s->subsubframes[s->current_subframe]);
+    av_log(s->avctx, AV_LOG_DEBUG, "subsubframes: %i\n",
+           s->subsubframes[s->current_subframe]);
      av_log(s->avctx, AV_LOG_DEBUG, "partial samples: %i\n",
             s->partial_samples[s->current_subframe]);
+
      for (j = base_channel; j < s->prim_channels; j++) {
          av_log(s->avctx, AV_LOG_DEBUG, "prediction mode:");
          for (k = 0; k < s->subband_activity[j]; k++)
@@ -817,12 +869,12 @@ static int dca_subframe_header(DCAContext * s, int base_channel, int block_index
      }
      for (j = base_channel; j < s->prim_channels; j++) {
          for (k = 0; k < s->subband_activity[j]; k++)
-                av_log(s->avctx, AV_LOG_DEBUG,
-                       "prediction coefs: %f, %f, %f, %f\n",
-                       (float) adpcm_vb[s->prediction_vq[j][k]][0] / 8192,
-                       (float) adpcm_vb[s->prediction_vq[j][k]][1] / 8192,
-                       (float) adpcm_vb[s->prediction_vq[j][k]][2] / 8192,
-                       (float) adpcm_vb[s->prediction_vq[j][k]][3] / 8192);
+            av_log(s->avctx, AV_LOG_DEBUG,
+                   "prediction coefs: %f, %f, %f, %f\n",
+                   (float) adpcm_vb[s->prediction_vq[j][k]][0] / 8192,
+                   (float) adpcm_vb[s->prediction_vq[j][k]][1] / 8192,
+                   (float) adpcm_vb[s->prediction_vq[j][k]][2] / 8192,
+                   (float) adpcm_vb[s->prediction_vq[j][k]][3] / 8192);
      }
      for (j = base_channel; j < s->prim_channels; j++) {
          av_log(s->avctx, AV_LOG_DEBUG, "bitalloc index: ");
@@ -858,8 +910,10 @@ static int dca_subframe_header(DCAContext * s, int base_channel, int block_index
      if (!base_channel && s->prim_channels > 2 && s->downmix) {
          av_log(s->avctx, AV_LOG_DEBUG, "Downmix coeffs:\n");
          for (j = 0; j < s->prim_channels; j++) {
-            av_log(s->avctx, AV_LOG_DEBUG, "Channel 0,%d = %f\n", j, dca_downmix_coeffs[s->downmix_coef[j][0]]);
-            av_log(s->avctx, AV_LOG_DEBUG, "Channel 1,%d = %f\n", j, dca_downmix_coeffs[s->downmix_coef[j][1]]);
+            av_log(s->avctx, AV_LOG_DEBUG, "Channel 0, %d = %f\n", j,
+                   dca_downmix_coeffs[s->downmix_coef[j][0]]);
+            av_log(s->avctx, AV_LOG_DEBUG, "Channel 1, %d = %f\n", j,
+                   dca_downmix_coeffs[s->downmix_coef[j][1]]);
          }
          av_log(s->avctx, AV_LOG_DEBUG, "\n");
      }
@@ -880,7 +934,7 @@ static int dca_subframe_header(DCAContext * s, int base_channel, int block_index
      return 0;
  }
  
-static void qmf_32_subbands(DCAContext * s, int chans,
+static void qmf_32_subbands(DCAContext *s, int chans,
                              float samples_in[32][8], float *samples_out,
                              float scale)
  {
@@ -890,7 +944,7 @@ static void qmf_32_subbands(DCAContext * s, int chans,
      int sb_act = s->subband_activity[chans];
      int subindex;
  
-    scale *= sqrt(1/8.0);
+    scale *= sqrt(1 / 8.0);
  
      /* Select filter */
      if (!s->multirate_inter)    /* Non-perfect reconstruction */
@@ -898,22 +952,24 @@ static void qmf_32_subbands(DCAContext * s, int chans,
      else                        /* Perfect reconstruction */
          prCoeff = fir_32bands_perfect;
  
+    for (i = sb_act; i < 32; i++)
+        s->raXin[i] = 0.0;
+
      /* Reconstructed channel sample index */
      for (subindex = 0; subindex < 8; subindex++) {
          /* Load in one sample from each subband and clear inactive subbands */
-        for (i = 0; i < sb_act; i++){
-            uint32_t v = AV_RN32A(&samples_in[i][subindex]) ^ ((i-1)&2)<<30;
+        for (i = 0; i < sb_act; i++) {
+            unsigned sign = (i - 1) & 2;
+            uint32_t v    = AV_RN32A(&samples_in[i][subindex]) ^ sign << 30;
              AV_WN32A(&s->raXin[i], v);
          }
-        for (; i < 32; i++)
-            s->raXin[i] = 0.0;
  
          s->synth.synth_filter_float(&s->imdct,
-                              s->subband_fir_hist[chans], &s->hist_index[chans],
-                              s->subband_fir_noidea[chans], prCoeff,
-                              samples_out, s->raXin, scale);
-        samples_out+= 32;
-
+                                    s->subband_fir_hist[chans],
+                                    &s->hist_index[chans],
+                                    s->subband_fir_noidea[chans], prCoeff,
+                                    samples_out, s->raXin, scale);
+        samples_out += 32;
      }
  }
  
@@ -943,45 +999,44 @@ static void lfe_interpolation_fir(DCAContext *s, int decimation_select,
      }
      /* Interpolation */
      for (deciindex = 0; deciindex < num_deci_sample; deciindex++) {
-        s->dcadsp.lfe_fir(samples_out, samples_in, prCoeff, decifactor,
-                          scale);
+        s->dcadsp.lfe_fir(samples_out, samples_in, prCoeff, decifactor, scale);
          samples_in++;
          samples_out += 2 * decifactor;
      }
  }
  
  /* downmixing routines */
-#define MIX_REAR1(samples, si1, rs, coef) \
-     samples[i]     += samples[si1] * coef[rs][0];  \
-     samples[i+256] += samples[si1] * coef[rs][1];
-
-#define MIX_REAR2(samples, si1, si2, rs, coef) \
-     samples[i]     += samples[si1] * coef[rs][0] + samples[si2] * coef[rs+1][0]; \
-     samples[i+256] += samples[si1] * coef[rs][1] + samples[si2] * coef[rs+1][1];
-
-#define MIX_FRONT3(samples, coef) \
-    t = samples[i+c]; \
-    u = samples[i+l]; \
-    v = samples[i+r]; \
+#define MIX_REAR1(samples, si1, rs, coef)           \
+    samples[i]     += samples[si1] * coef[rs][0];   \
+    samples[i+256] += samples[si1] * coef[rs][1];
+
+#define MIX_REAR2(samples, si1, si2, rs, coef)                                     \
+    samples[i]     += samples[si1] * coef[rs][0] + samples[si2] * coef[rs + 1][0]; \
+    samples[i+256] += samples[si1] * coef[rs][1] + samples[si2] * coef[rs + 1][1];
+
+#define MIX_FRONT3(samples, coef)                                      \
+    t = samples[i + c];                                                \
+    u = samples[i + l];                                                \
+    v = samples[i + r];                                                \
      samples[i]     = t * coef[0][0] + u * coef[1][0] + v * coef[2][0]; \
      samples[i+256] = t * coef[0][1] + u * coef[1][1] + v * coef[2][1];
  
-#define DOWNMIX_TO_STEREO(op1, op2) \
-    for (i = 0; i < 256; i++){ \
-        op1 \
-        op2 \
+#define DOWNMIX_TO_STEREO(op1, op2)             \
+    for (i = 0; i < 256; i++) {                 \
+        op1                                     \
+        op2                                     \
      }
  
  static void dca_downmix(float *samples, int srcfmt,
                          int downmix_coef[DCA_PRIM_CHANNELS_MAX][2],
                          const int8_t *channel_mapping)
  {
-    int c,l,r,sl,sr,s;
+    int c, l, r, sl, sr, s;
      int i;
      float t, u, v;
      float coef[DCA_PRIM_CHANNELS_MAX][2];
  
-    for (i=0; i<DCA_PRIM_CHANNELS_MAX; i++) {
+    for (i = 0; i < DCA_PRIM_CHANNELS_MAX; i++) {
          coef[i][0] = dca_downmix_coeffs[downmix_coef[i][0]];
          coef[i][1] = dca_downmix_coeffs[downmix_coef[i][1]];
      }
@@ -1000,11 +1055,11 @@ static void dca_downmix(float *samples, int srcfmt,
          c = channel_mapping[0] * 256;
          l = channel_mapping[1] * 256;
          r = channel_mapping[2] * 256;
-        DOWNMIX_TO_STEREO(MIX_FRONT3(samples, coef),);
+        DOWNMIX_TO_STEREO(MIX_FRONT3(samples, coef), );
          break;
      case DCA_2F1R:
          s = channel_mapping[2] * 256;
-        DOWNMIX_TO_STEREO(MIX_REAR1(samples, i + s, 2, coef),);
+        DOWNMIX_TO_STEREO(MIX_REAR1(samples, i + s, 2, coef), );
          break;
      case DCA_3F1R:
          c = channel_mapping[0] * 256;
@@ -1017,12 +1072,12 @@ static void dca_downmix(float *samples, int srcfmt,
      case DCA_2F2R:
          sl = channel_mapping[2] * 256;
          sr = channel_mapping[3] * 256;
-        DOWNMIX_TO_STEREO(MIX_REAR2(samples, i + sl, i + sr, 2, coef),);
+        DOWNMIX_TO_STEREO(MIX_REAR2(samples, i + sl, i + sr, 2, coef), );
          break;
      case DCA_3F2R:
-        c =  channel_mapping[0] * 256;
-        l =  channel_mapping[1] * 256;
-        r =  channel_mapping[2] * 256;
+        c  = channel_mapping[0] * 256;
+        l  = channel_mapping[1] * 256;
+        r  = channel_mapping[2] * 256;
          sl = channel_mapping[3] * 256;
          sr = channel_mapping[4] * 256;
          DOWNMIX_TO_STEREO(MIX_FRONT3(samples, coef),
@@ -1032,6 +1087,7 @@ static void dca_downmix(float *samples, int srcfmt,
  }
  
  
+#ifndef decode_blockcodes
  /* Very compact version of the block code decoder that does not use table
   * look-up but is slightly slower */
  static int decode_blockcode(int code, int levels, int *values)
@@ -1041,22 +1097,34 @@ static int decode_blockcode(int code, int levels, int *values)
  
      for (i = 0; i < 4; i++) {
          int div = FASTDIV(code, levels);
-        values[i] = code - offset - div*levels;
+        values[i] = code - offset - div * levels;
          code = div;
      }
  
-    if (code == 0)
-        return 0;
-    else {
-        av_log(NULL, AV_LOG_ERROR, "ERROR: block code look-up failed\n");
-        return -1;
-    }
+    return code;
+}
+
+static int decode_blockcodes(int code1, int code2, int levels, int *values)
+{
+    return decode_blockcode(code1, levels, values) |
+           decode_blockcode(code2, levels, values + 4);
  }
+#endif
+
+static const uint8_t abits_sizes[7]  = { 7, 10, 12, 13, 15, 17, 19 };
+static const uint8_t abits_levels[7] = { 3,  5,  7,  9, 13, 17, 25 };
  
-static const uint8_t abits_sizes[7] = { 7, 10, 12, 13, 15, 17, 19 };
-static const uint8_t abits_levels[7] = { 3, 5, 7, 9, 13, 17, 25 };
+#ifndef int8x8_fmul_int32
+static inline void int8x8_fmul_int32(float *dst, const int8_t *src, int scale)
+{
+    float fscale = scale / 16.0;
+    int i;
+    for (i = 0; i < 8; i++)
+        dst[i] = src[i] * fscale;
+}
+#endif
  
-static int dca_subsubframe(DCAContext * s, int base_channel, int block_index)
+static int dca_subsubframe(DCAContext *s, int base_channel, int block_index)
  {
      int k, l;
      int subsubframe = s->current_subsubframe;
@@ -1079,7 +1147,7 @@ static int dca_subsubframe(DCAContext * s, int base_channel, int block_index)
  
      for (k = base_channel; k < s->prim_channels; k++) {
          if (get_bits_left(&s->gb) < 0)
-            return -1;
+            return AVERROR_INVALIDDATA;
  
          for (l = 0; l < s->vq_start_subband[k]; l++) {
              int m;
@@ -1099,39 +1167,45 @@ static int dca_subsubframe(DCAContext * s, int base_channel, int block_index)
              /*
               * Extract bits from the bit stream
               */
-            if (!abits){
+            if (!abits) {
                  memset(subband_samples[k][l], 0, 8 * sizeof(subband_samples[0][0][0]));
              } else {
                  /* Deal with transients */
                  int sfi = s->transition_mode[k][l] && subsubframe >= s->transition_mode[k][l];
-                float rscale = quant_step_size * s->scale_factor[k][l][sfi] * s->scalefactor_adj[k][sel];
+                float rscale = quant_step_size * s->scale_factor[k][l][sfi] *
+                               s->scalefactor_adj[k][sel];
  
-                if (abits >= 11 || !dca_smpl_bitalloc[abits].vlc[sel].table){
-                    if (abits <= 7){
+                if (abits >= 11 || !dca_smpl_bitalloc[abits].vlc[sel].table) {
+                    if (abits <= 7) {
                          /* Block code */
-                        int block_code1, block_code2, size, levels;
+                        int block_code1, block_code2, size, levels, err;
  
-                        size = abits_sizes[abits-1];
-                        levels = abits_levels[abits-1];
+                        size   = abits_sizes[abits - 1];
+                        levels = abits_levels[abits - 1];
  
                          block_code1 = get_bits(&s->gb, size);
-                        /* FIXME Should test return value */
-                        decode_blockcode(block_code1, levels, block);
                          block_code2 = get_bits(&s->gb, size);
-                        decode_blockcode(block_code2, levels, &block[4]);
-                    }else{
+                        err = decode_blockcodes(block_code1, block_code2,
+                                                levels, block);
+                        if (err) {
+                            av_log(s->avctx, AV_LOG_ERROR,
+                                   "ERROR: block code look-up failed\n");
+                            return AVERROR_INVALIDDATA;
+                        }
+                    } else {
                          /* no coding */
                          for (m = 0; m < 8; m++)
                              block[m] = get_sbits(&s->gb, abits - 3);
                      }
-                }else{
+                } else {
                      /* Huffman coded */
                      for (m = 0; m < 8; m++)
-                        block[m] = get_bitalloc(&s->gb, &dca_smpl_bitalloc[abits], sel);
+                        block[m] = get_bitalloc(&s->gb,
+                                                &dca_smpl_bitalloc[abits], sel);
                  }
  
                  s->fmt_conv.int32_to_float_fmul_scalar(subband_samples[k][l],
-                                                  block, rscale, 8);
+                                                       block, rscale, 8);
              }
  
              /*
@@ -1148,8 +1222,7 @@ static int dca_subsubframe(DCAContext * s, int base_channel, int block_index)
                          else if (s->predictor_history)
                              subband_samples[k][l][m] +=
                                  (adpcm_vb[s->prediction_vq[k][l]][n - 1] *
-                                 s->subband_samples_hist[k][l][m - n +
-                                                               4] / 8192);
+                                 s->subband_samples_hist[k][l][m - n + 4] / 8192);
                  }
              }
          }
@@ -1160,19 +1233,17 @@ static int dca_subsubframe(DCAContext * s, int base_channel, int block_index)
          for (l = s->vq_start_subband[k]; l < s->subband_activity[k]; l++) {
              /* 1 vector -> 32 samples but we only need the 8 samples
               * for this subsubframe. */
-            int m;
+            int hfvq = s->high_freq_vq[k][l];
  
              if (!s->debug_flag & 0x01) {
-                av_log(s->avctx, AV_LOG_DEBUG, "Stream with high frequencies VQ coding\n");
+                av_log(s->avctx, AV_LOG_DEBUG,
+                       "Stream with high frequencies VQ coding\n");
                  s->debug_flag |= 0x01;
              }
  
-            for (m = 0; m < 8; m++) {
-                subband_samples[k][l][m] =
-                    high_freq_vq[s->high_freq_vq[k][l]][subsubframe * 8 +
-                                                        m]
-                    * (float) s->scale_factor[k][l][0] / 16.0;
-            }
+            int8x8_fmul_int32(subband_samples[k][l],
+                              &high_freq_vq[hfvq][subsubframe * 8],
+                              s->scale_factor[k][l][0]);
          }
      }
  
@@ -1190,23 +1261,25 @@ static int dca_subsubframe(DCAContext * s, int base_channel, int block_index)
      /* Backup predictor history for adpcm */
      for (k = base_channel; k < s->prim_channels; k++)
          for (l = 0; l < s->vq_start_subband[k]; l++)
-            memcpy(s->subband_samples_hist[k][l], &subband_samples[k][l][4],
-                        4 * sizeof(subband_samples[0][0][0]));
+            memcpy(s->subband_samples_hist[k][l],
+                   &subband_samples[k][l][4],
+                   4 * sizeof(subband_samples[0][0][0]));
  
      return 0;
  }
  
-static int dca_filter_channels(DCAContext * s, int block_index)
+static int dca_filter_channels(DCAContext *s, int block_index)
  {
      float (*subband_samples)[DCA_SUBBANDS][8] = s->subband_samples[block_index];
      int k;
  
      /* 32 subbands QMF */
      for (k = 0; k < s->prim_channels; k++) {
-/*        static float pcm_to_double[8] =
-            {32768.0, 32768.0, 524288.0, 524288.0, 0, 8388608.0, 8388608.0};*/
-         qmf_32_subbands(s, k, subband_samples[k], &s->samples[256 * s->channel_order_tab[k]],
-                         M_SQRT1_2*s->scale_bias /*pcm_to_double[s->source_pcm_res] */ );
+/*        static float pcm_to_double[8] = { 32768.0, 32768.0, 524288.0, 524288.0,
+                                            0, 8388608.0, 8388608.0 };*/
+        qmf_32_subbands(s, k, subband_samples[k],
+                        &s->samples[256 * s->channel_order_tab[k]],
+                        M_SQRT1_2 * s->scale_bias /* pcm_to_double[s->source_pcm_res] */);
      }
  
      /* Down mixing */
@@ -1219,7 +1292,7 @@ static int dca_filter_channels(DCAContext * s, int block_index)
          lfe_interpolation_fir(s, s->lfe, 2 * s->lfe,
                                s->lfe_data + 2 * s->lfe * (block_index + 4),
                                &s->samples[256 * dca_lfe_index[s->amode]],
-                              (1.0/256.0)*s->scale_bias);
+                              (1.0 / 256.0) * s->scale_bias);
          /* Outputs 20bits pcm samples */
      }
  
@@ -1227,7 +1300,7 @@ static int dca_filter_channels(DCAContext * s, int block_index)
  }
  
  
-static int dca_subframe_footer(DCAContext * s, int base_channel)
+static int dca_subframe_footer(DCAContext *s, int base_channel)
  {
      int aux_data_count = 0, i;
  
@@ -1238,7 +1311,7 @@ static int dca_subframe_footer(DCAContext * s, int base_channel)
      /* presumably optional information only appears in the core? */
      if (!base_channel) {
          if (s->timestamp)
-            get_bits(&s->gb, 32);
+            skip_bits_long(&s->gb, 32);
  
          if (s->aux_data)
              aux_data_count = get_bits(&s->gb, 6);
@@ -1259,14 +1332,15 @@ static int dca_subframe_footer(DCAContext * s, int base_channel)
   * @param s     pointer to the DCAContext
   */
  
-static int dca_decode_block(DCAContext * s, int base_channel, int block_index)
+static int dca_decode_block(DCAContext *s, int base_channel, int block_index)
  {
+    int ret;
  
      /* Sanity check */
      if (s->current_subframe >= s->subframes) {
          av_log(s->avctx, AV_LOG_DEBUG, "check failed: %i>%i",
                 s->current_subframe, s->subframes);
-        return -1;
+        return AVERROR_INVALIDDATA;
      }
  
      if (!s->current_subsubframe) {
@@ -1274,16 +1348,16 @@ static int dca_decode_block(DCAContext * s, int base_channel, int block_index)
          av_log(s->avctx, AV_LOG_DEBUG, "DSYNC dca_subframe_header\n");
  #endif
          /* Read subframe header */
-        if (dca_subframe_header(s, base_channel, block_index))
-            return -1;
+        if ((ret = dca_subframe_header(s, base_channel, block_index)))
+            return ret;
      }
  
      /* Read subsubframe */
  #ifdef TRACE
      av_log(s->avctx, AV_LOG_DEBUG, "DSYNC dca_subsubframe\n");
  #endif
-    if (dca_subsubframe(s, base_channel, block_index))
-        return -1;
+    if ((ret = dca_subsubframe(s, base_channel, block_index)))
+        return ret;
  
      /* Update state */
      s->current_subsubframe++;
@@ -1296,72 +1370,29 @@ static int dca_decode_block(DCAContext * s, int base_channel, int block_index)
          av_log(s->avctx, AV_LOG_DEBUG, "DSYNC dca_subframe_footer\n");
  #endif
          /* Read subframe footer */
-        if (dca_subframe_footer(s, base_channel))
-            return -1;
+        if ((ret = dca_subframe_footer(s, base_channel)))
+            return ret;
      }
  
      return 0;
  }
  
-/**
- * Convert bitstream to one representation based on sync marker
- */
-static int dca_convert_bitstream(const uint8_t * src, int src_size, uint8_t * dst,
-                          int max_size)
-{
-    uint32_t mrk;
-    int i, tmp;
-    const uint16_t *ssrc = (const uint16_t *) src;
-    uint16_t *sdst = (uint16_t *) dst;
-    PutBitContext pb;
-
-    if ((unsigned)src_size > (unsigned)max_size) {
-//        av_log(NULL, AV_LOG_ERROR, "Input frame size larger then DCA_MAX_FRAME_SIZE!\n");
-//        return -1;
-        src_size = max_size;
-    }
-
-    mrk = AV_RB32(src);
-    switch (mrk) {
-    case DCA_MARKER_RAW_BE:
-        memcpy(dst, src, src_size);
-        return src_size;
-    case DCA_MARKER_RAW_LE:
-        for (i = 0; i < (src_size + 1) >> 1; i++)
-            *sdst++ = av_bswap16(*ssrc++);
-        return src_size;
-    case DCA_MARKER_14B_BE:
-    case DCA_MARKER_14B_LE:
-        init_put_bits(&pb, dst, max_size);
-        for (i = 0; i < (src_size + 1) >> 1; i++, src += 2) {
-            tmp = ((mrk == DCA_MARKER_14B_BE) ? AV_RB16(src) : AV_RL16(src)) & 0x3FFF;
-            put_bits(&pb, 14, tmp);
-        }
-        flush_put_bits(&pb);
-        return (put_bits_count(&pb) + 7) >> 3;
-    default:
-        return -1;
-    }
-}
-
  /**
   * Return the number of channels in an ExSS speaker mask (HD)
   */
  static int dca_exss_mask2count(int mask)
  {
      /* count bits that mean speaker pairs twice */
-    return av_popcount(mask)
-        + av_popcount(mask & (
-            DCA_EXSS_CENTER_LEFT_RIGHT
-          | DCA_EXSS_FRONT_LEFT_RIGHT
-          | DCA_EXSS_FRONT_HIGH_LEFT_RIGHT
-          | DCA_EXSS_WIDE_LEFT_RIGHT
-          | DCA_EXSS_SIDE_LEFT_RIGHT
-          | DCA_EXSS_SIDE_HIGH_LEFT_RIGHT
-          | DCA_EXSS_SIDE_REAR_LEFT_RIGHT
-          | DCA_EXSS_REAR_LEFT_RIGHT
-          | DCA_EXSS_REAR_HIGH_LEFT_RIGHT
-          ));
+    return av_popcount(mask) +
+           av_popcount(mask & (DCA_EXSS_CENTER_LEFT_RIGHT      |
+                               DCA_EXSS_FRONT_LEFT_RIGHT       |
+                               DCA_EXSS_FRONT_HIGH_LEFT_RIGHT  |
+                               DCA_EXSS_WIDE_LEFT_RIGHT        |
+                               DCA_EXSS_SIDE_LEFT_RIGHT        |
+                               DCA_EXSS_SIDE_HIGH_LEFT_RIGHT   |
+                               DCA_EXSS_SIDE_REAR_LEFT_RIGHT   |
+                               DCA_EXSS_REAR_LEFT_RIGHT        |
+                               DCA_EXSS_REAR_HIGH_LEFT_RIGHT));
  }
  
  /**
@@ -1387,7 +1418,7 @@ static int dca_exss_parse_asset_header(DCAContext *s)
      int header_size;
      int channels;
      int embedded_stereo = 0;
-    int embedded_6ch = 0;
+    int embedded_6ch    = 0;
      int drc_code_present;
      int extensions_mask;
      int i, j;
@@ -1522,7 +1553,8 @@ static int dca_exss_parse_asset_header(DCAContext *s)
      if (!(extensions_mask & DCA_EXT_CORE))
          av_log(s->avctx, AV_LOG_WARNING, "DTS core detection mismatch.\n");
      if ((extensions_mask & DCA_CORE_EXTS) != s->core_ext_mask)
-        av_log(s->avctx, AV_LOG_WARNING, "DTS extensions detection mismatch (%d, %d)\n",
+        av_log(s->avctx, AV_LOG_WARNING,
+               "DTS extensions detection mismatch (%d, %d)\n",
                 extensions_mask & DCA_CORE_EXTS, s->core_ext_mask);
  
      return 0;
@@ -1535,8 +1567,6 @@ static void dca_exss_parse_header(DCAContext *s)
  {
      int ss_index;
      int blownup;
-    int header_size;
-    int hd_size;
      int num_audiop = 1;
      int num_assets = 1;
      int active_ss_mask[8];
@@ -1549,8 +1579,8 @@ static void dca_exss_parse_header(DCAContext *s)
      ss_index = get_bits(&s->gb, 2);
  
      blownup = get_bits1(&s->gb);
-    header_size = get_bits(&s->gb, 8 + 4 * blownup) + 1;
-    hd_size = get_bits_long(&s->gb, 16 + 4 * blownup) + 1;
+    skip_bits(&s->gb,  8 + 4 * blownup); // header_size
+    skip_bits(&s->gb, 16 + 4 * blownup); // hd_size
  
      s->static_fields = get_bits1(&s->gb);
      if (s->static_fields) {
@@ -1590,18 +1620,18 @@ static void dca_exss_parse_header(DCAContext *s)
              int mix_out_mask_size;
  
              skip_bits(&s->gb, 2); // adjustment level
-            mix_out_mask_size = (get_bits(&s->gb, 2) + 1) << 2;
-            s->num_mix_configs = get_bits(&s->gb, 2) + 1;
+            mix_out_mask_size  = (get_bits(&s->gb, 2) + 1) << 2;
+            s->num_mix_configs =  get_bits(&s->gb, 2) + 1;
  
              for (i = 0; i < s->num_mix_configs; i++) {
-                int mix_out_mask = get_bits(&s->gb, mix_out_mask_size);
+                int mix_out_mask        = get_bits(&s->gb, mix_out_mask_size);
                  s->mix_config_num_ch[i] = dca_exss_mask2count(mix_out_mask);
              }
          }
      }
  
      for (i = 0; i < num_assets; i++)
-        skip_bits_long(&s->gb, 16 + 4 * blownup); // asset size
+        skip_bits_long(&s->gb, 16 + 4 * blownup);  // asset size
  
      for (i = 0; i < num_assets; i++) {
          if (dca_exss_parse_asset_header(s))
@@ -1616,17 +1646,17 @@ static void dca_exss_parse_header(DCAContext *s)
   * Main frame decoding function
   * FIXME add arguments
   */
-static int dca_decode_frame(AVCodecContext * avctx,
-                            void *data, int *data_size,
-                            AVPacket *avpkt)
+static int dca_decode_frame(AVCodecContext *avctx, void *data,
+                            int *got_frame_ptr, AVPacket *avpkt)
  {
      const uint8_t *buf = avpkt->data;
      int buf_size = avpkt->size;
  
      int lfe_samples;
      int num_core_channels = 0;
-    int i;
-    int16_t *samples = data;
+    int i, ret;
+    float   *samples_flt;
+    int16_t *samples_s16;
      DCAContext *s = avctx->priv_data;
      int channels;
      int core_ss_end;
@@ -1634,27 +1664,29 @@ static int dca_decode_frame(AVCodecContext * avctx,
  
      s->xch_present = 0;
  
-    s->dca_buffer_size = dca_convert_bitstream(buf, buf_size, s->dca_buffer,
-                                               DCA_MAX_FRAME_SIZE + DCA_MAX_EXSS_HEADER_SIZE);
-    if (s->dca_buffer_size == -1) {
+    s->dca_buffer_size = ff_dca_convert_bitstream(buf, buf_size, s->dca_buffer,
+                                                  DCA_MAX_FRAME_SIZE + DCA_MAX_EXSS_HEADER_SIZE);
+    if (s->dca_buffer_size == AVERROR_INVALIDDATA) {
          av_log(avctx, AV_LOG_ERROR, "Not a valid DCA frame\n");
-        return -1;
+        return AVERROR_INVALIDDATA;
      }
  
      init_get_bits(&s->gb, s->dca_buffer, s->dca_buffer_size * 8);
-    if (dca_parse_frame_header(s) < 0) {
+    if ((ret = dca_parse_frame_header(s)) < 0) {
          //seems like the frame is corrupt, try with the next one
-        *data_size=0;
-        return buf_size;
+        return ret;
      }
      //set AVCodec values with parsed data
      avctx->sample_rate = s->sample_rate;
-    avctx->bit_rate = s->bit_rate;
+    avctx->bit_rate    = s->bit_rate;
  
      s->profile = FF_PROFILE_DTS;
  
      for (i = 0; i < (s->sample_blocks / 8); i++) {
-        dca_decode_block(s, 0, i);
+        if ((ret = dca_decode_block(s, 0, i))) {
+            av_log(avctx, AV_LOG_ERROR, "error decoding block\n");
+            return ret;
+        }
      }
  
      /* record number of core channels incase less than max channels are requested */
@@ -1678,69 +1710,71 @@ static int dca_decode_frame(AVCodecContext * avctx,
          /* extensions start at 32-bit boundaries into bitstream */
          skip_bits_long(&s->gb, (-get_bits_count(&s->gb)) & 31);
  
-    while(core_ss_end - get_bits_count(&s->gb) >= 32) {
-        uint32_t bits = get_bits_long(&s->gb, 32);
+        while (core_ss_end - get_bits_count(&s->gb) >= 32) {
+            uint32_t bits = get_bits_long(&s->gb, 32);
  
-        switch(bits) {
-        case 0x5a5a5a5a: {
-            int ext_amode, xch_fsize;
+            switch (bits) {
+            case 0x5a5a5a5a: {
+                int ext_amode, xch_fsize;
  
-            s->xch_base_channel = s->prim_channels;
+                s->xch_base_channel = s->prim_channels;
  
-            /* validate sync word using XCHFSIZE field */
-            xch_fsize = show_bits(&s->gb, 10);
-            if((s->frame_size != (get_bits_count(&s->gb) >> 3) - 4 + xch_fsize) &&
-               (s->frame_size != (get_bits_count(&s->gb) >> 3) - 4 + xch_fsize + 1))
-                continue;
+                /* validate sync word using XCHFSIZE field */
+                xch_fsize = show_bits(&s->gb, 10);
+                if ((s->frame_size != (get_bits_count(&s->gb) >> 3) - 4 + xch_fsize) &&
+                    (s->frame_size != (get_bits_count(&s->gb) >> 3) - 4 + xch_fsize + 1))
+                    continue;
  
-            /* skip length-to-end-of-frame field for the moment */
-            skip_bits(&s->gb, 10);
+                /* skip length-to-end-of-frame field for the moment */
+                skip_bits(&s->gb, 10);
  
-            s->core_ext_mask |= DCA_EXT_XCH;
+                s->core_ext_mask |= DCA_EXT_XCH;
  
-            /* extension amode should == 1, number of channels in extension */
-            /* AFAIK XCh is not used for more channels */
-            if ((ext_amode = get_bits(&s->gb, 4)) != 1) {
-                av_log(avctx, AV_LOG_ERROR, "XCh extension amode %d not"
-                       " supported!\n",ext_amode);
-                continue;
-            }
+                /* extension amode(number of channels in extension) should be 1 */
+                /* AFAIK XCh is not used for more channels */
+                if ((ext_amode = get_bits(&s->gb, 4)) != 1) {
+                    av_log(avctx, AV_LOG_ERROR, "XCh extension amode %d not"
+                           " supported!\n", ext_amode);
+                    continue;
+                }
  
-            /* much like core primary audio coding header */
-            dca_parse_audio_coding_header(s, s->xch_base_channel);
+                /* much like core primary audio coding header */
+                dca_parse_audio_coding_header(s, s->xch_base_channel);
  
-            for (i = 0; i < (s->sample_blocks / 8); i++) {
-                dca_decode_block(s, s->xch_base_channel, i);
+                for (i = 0; i < (s->sample_blocks / 8); i++)
+                    if ((ret = dca_decode_block(s, s->xch_base_channel, i))) {
+                        av_log(avctx, AV_LOG_ERROR, "error decoding XCh extension\n");
+                        continue;
+                    }
+
+                s->xch_present = 1;
+                break;
+            }
+            case 0x47004a03:
+                /* XXCh: extended channels */
+                /* usually found either in core or HD part in DTS-HD HRA streams,
+                 * but not in DTS-ES which contains XCh extensions instead */
+                s->core_ext_mask |= DCA_EXT_XXCH;
+                break;
+
+            case 0x1d95f262: {
+                int fsize96 = show_bits(&s->gb, 12) + 1;
+                if (s->frame_size != (get_bits_count(&s->gb) >> 3) - 4 + fsize96)
+                    continue;
+
+                av_log(avctx, AV_LOG_DEBUG, "X96 extension found at %d bits\n",
+                       get_bits_count(&s->gb));
+                skip_bits(&s->gb, 12);
+                av_log(avctx, AV_LOG_DEBUG, "FSIZE96 = %d bytes\n", fsize96);
+                av_log(avctx, AV_LOG_DEBUG, "REVNO = %d\n", get_bits(&s->gb, 4));
+
+                s->core_ext_mask |= DCA_EXT_X96;
+                break;
+            }
              }
  
-            s->xch_present = 1;
-            break;
-        }
-        case 0x47004a03:
-            /* XXCh: extended channels */
-            /* usually found either in core or HD part in DTS-HD HRA streams,
-             * but not in DTS-ES which contains XCh extensions instead */
-            s->core_ext_mask |= DCA_EXT_XXCH;
-            break;
-
-        case 0x1d95f262: {
-            int fsize96 = show_bits(&s->gb, 12) + 1;
-            if (s->frame_size != (get_bits_count(&s->gb) >> 3) - 4 + fsize96)
-                continue;
-
-            av_log(avctx, AV_LOG_DEBUG, "X96 extension found at %d bits\n", get_bits_count(&s->gb));
-            skip_bits(&s->gb, 12);
-            av_log(avctx, AV_LOG_DEBUG, "FSIZE96 = %d bytes\n", fsize96);
-            av_log(avctx, AV_LOG_DEBUG, "REVNO = %d\n", get_bits(&s->gb, 4));
-
-            s->core_ext_mask |= DCA_EXT_X96;
-            break;
-        }
+            skip_bits_long(&s->gb, (-get_bits_count(&s->gb)) & 31);
          }
-
-        skip_bits_long(&s->gb, (-get_bits_count(&s->gb)) & 31);
-    }
-
      } else {
          /* no supported extensions, skip the rest of the core substream */
          skip_bits_long(&s->gb, core_ss_end - get_bits_count(&s->gb));
@@ -1752,15 +1786,15 @@ static int dca_decode_frame(AVCodecContext * avctx,
          s->profile = FF_PROFILE_DTS_ES;
  
      /* check for ExSS (HD part) */
-    if (s->dca_buffer_size - s->frame_size > 32
-        && get_bits_long(&s->gb, 32) == DCA_HD_MARKER)
+    if (s->dca_buffer_size - s->frame_size > 32 &&
+        get_bits_long(&s->gb, 32) == DCA_HD_MARKER)
          dca_exss_parse_header(s);
  
      avctx->profile = s->profile;
  
      channels = s->prim_channels + !!s->lfe;
  
-    if (s->amode<16) {
+    if (s->amode < 16) {
          avctx->channel_layout = dca_core_channel_layout[s->amode];
  
          if (s->xch_present && (!avctx->request_channels ||
@@ -1784,7 +1818,7 @@ static int dca_decode_frame(AVCodecContext * avctx,
  
          if (channels > !!s->lfe &&
              s->channel_order_tab[channels - 1 - !!s->lfe] < 0)
-            return -1;
+            return AVERROR_INVALIDDATA;
  
          if (avctx->request_channels == 2 && s->prim_channels > 2) {
              channels = 2;
@@ -1792,13 +1826,13 @@ static int dca_decode_frame(AVCodecContext * avctx,
              avctx->channel_layout = AV_CH_LAYOUT_STEREO;
          }
      } else {
-        av_log(avctx, AV_LOG_ERROR, "Non standard configuration %d !\n",s->amode);
-        return -1;
+        av_log(avctx, AV_LOG_ERROR, "Non standard configuration %d !\n", s->amode);
+        return AVERROR_INVALIDDATA;
      }
  
  
      /* There is nothing that prevents a dts frame to change channel configuration
-       but FFmpeg doesn't support that so only set the channels if it is previously
+       but Libav doesn't support that so only set the channels if it is previously
         unset. Ideally during the first probe for channels the crc should be checked
         and only set avctx->channels when the crc is ok. Right now the decoder could
         set the channels based on a broken first frame.*/
@@ -1809,12 +1843,17 @@ static int dca_decode_frame(AVCodecContext * avctx,
      if (avctx->channels != channels) {
          av_log(avctx, AV_LOG_ERROR, "DCA decoder does not support number of "
                 "channels changing in stream. Skipping frame.\n");
-        return -1;
+        return AVERROR_PATCHWELCOME;
      }
  
-    if (*data_size < (s->sample_blocks / 8) * 256 * sizeof(int16_t) * channels)
-        return -1;
-    *data_size = 256 / 8 * s->sample_blocks * sizeof(int16_t) * channels;
+    /* get output buffer */
+    s->frame.nb_samples = 256 * (s->sample_blocks / 8);
+    if ((ret = avctx->get_buffer(avctx, &s->frame)) < 0) {
+        av_log(avctx, AV_LOG_ERROR, "get_buffer() failed\n");
+        return ret;
+    }
+    samples_flt = (float *)   s->frame.data[0];
+    samples_s16 = (int16_t *) s->frame.data[0];
  
      /* filter to get final output */
      for (i = 0; i < (s->sample_blocks / 8); i++) {
@@ -1822,26 +1861,33 @@ static int dca_decode_frame(AVCodecContext * avctx,
  
          /* If this was marked as a DTS-ES stream we need to subtract back- */
          /* channel from SL & SR to remove matrixed back-channel signal */
-        if((s->source_pcm_res & 1) && s->xch_present) {
-            float* back_chan = s->samples + s->channel_order_tab[s->xch_base_channel] * 256;
-            float* lt_chan   = s->samples + s->channel_order_tab[s->xch_base_channel - 2] * 256;
-            float* rt_chan   = s->samples + s->channel_order_tab[s->xch_base_channel - 1] * 256;
-            int j;
-            for(j = 0; j < 256; ++j) {
-                lt_chan[j] -= back_chan[j] * M_SQRT1_2;
-                rt_chan[j] -= back_chan[j] * M_SQRT1_2;
-            }
+        if ((s->source_pcm_res & 1) && s->xch_present) {
+            float *back_chan = s->samples + s->channel_order_tab[s->xch_base_channel]     * 256;
+            float *lt_chan   = s->samples + s->channel_order_tab[s->xch_base_channel - 2] * 256;
+            float *rt_chan   = s->samples + s->channel_order_tab[s->xch_base_channel - 1] * 256;
+            s->dsp.vector_fmac_scalar(lt_chan, back_chan, -M_SQRT1_2, 256);
+            s->dsp.vector_fmac_scalar(rt_chan, back_chan, -M_SQRT1_2, 256);
          }
  
-        s->fmt_conv.float_to_int16_interleave(samples, s->samples_chanptr, 256, channels);
-        samples += 256 * channels;
+        if (avctx->sample_fmt == AV_SAMPLE_FMT_FLT) {
+            s->fmt_conv.float_interleave(samples_flt, s->samples_chanptr, 256,
+                                         channels);
+            samples_flt += 256 * channels;
+        } else {
+            s->fmt_conv.float_to_int16_interleave(samples_s16,
+                                                  s->samples_chanptr, 256,
+                                                  channels);
+            samples_s16 += 256 * channels;
+        }
      }
  
      /* update lfe history */
      lfe_samples = 2 * s->lfe * (s->sample_blocks / 8);
-    for (i = 0; i < 2 * s->lfe * 4; i++) {
+    for (i = 0; i < 2 * s->lfe * 4; i++)
          s->lfe_data[i] = s->lfe_data[i + lfe_samples];
-    }
+
+    *got_frame_ptr    = 1;
+    *(AVFrame *) data = s->frame;
  
      return buf_size;
  }
@@ -1854,7 +1900,7 @@ static int dca_decode_frame(AVCodecContext * avctx,
   * @param avctx     pointer to the AVCodecContext
   */
  
-static av_cold int dca_decode_init(AVCodecContext * avctx)
+static av_cold int dca_decode_init(AVCodecContext *avctx)
  {
      DCAContext *s = avctx->priv_data;
      int i;
@@ -1862,17 +1908,22 @@ static av_cold int dca_decode_init(AVCodecContext * avctx)
      s->avctx = avctx;
      dca_init_vlcs();
  
-    dsputil_init(&s->dsp, avctx);
+    ff_dsputil_init(&s->dsp, avctx);
      ff_mdct_init(&s->imdct, 6, 1, 1.0);
      ff_synth_filter_init(&s->synth);
      ff_dcadsp_init(&s->dcadsp);
      ff_fmt_convert_init(&s->fmt_conv, avctx);
  
-    for (i = 0; i < DCA_PRIM_CHANNELS_MAX+1; i++)
+    for (i = 0; i < DCA_PRIM_CHANNELS_MAX + 1; i++)
          s->samples_chanptr[i] = s->samples + i * 256;
-    avctx->sample_fmt = AV_SAMPLE_FMT_S16;
  
-    s->scale_bias = 1.0;
+    if (avctx->request_sample_fmt == AV_SAMPLE_FMT_FLT) {
+        avctx->sample_fmt = AV_SAMPLE_FMT_FLT;
+        s->scale_bias     = 1.0 / 32768.0;
+    } else {
+        avctx->sample_fmt = AV_SAMPLE_FMT_S16;
+        s->scale_bias     = 1.0;
+    }
  
      /* allow downmixing to stereo */
      if (avctx->channels > 0 && avctx->request_channels < avctx->channels &&
@@ -1880,10 +1931,13 @@ static av_cold int dca_decode_init(AVCodecContext * avctx)
          avctx->channels = avctx->request_channels;
      }
  
+    avcodec_get_frame_defaults(&s->frame);
+    avctx->coded_frame = &s->frame;
+
      return 0;
  }
  
-static av_cold int dca_decode_end(AVCodecContext * avctx)
+static av_cold int dca_decode_end(AVCodecContext *avctx)
  {
      DCAContext *s = avctx->priv_data;
      ff_mdct_end(&s->imdct);
@@ -1900,14 +1954,17 @@ static const AVProfile profiles[] = {
  };
  
  AVCodec ff_dca_decoder = {
-    .name = "dca",
-    .type = AVMEDIA_TYPE_AUDIO,
-    .id = CODEC_ID_DTS,
-    .priv_data_size = sizeof(DCAContext),
-    .init = dca_decode_init,
-    .decode = dca_decode_frame,
-    .close = dca_decode_end,
-    .long_name = NULL_IF_CONFIG_SMALL("DCA (DTS Coherent Acoustics)"),
-    .capabilities = CODEC_CAP_CHANNEL_CONF,
-    .profiles = NULL_IF_CONFIG_SMALL(profiles),
+    .name            = "dca",
+    .type            = AVMEDIA_TYPE_AUDIO,
+    .id              = CODEC_ID_DTS,
+    .priv_data_size  = sizeof(DCAContext),
+    .init            = dca_decode_init,
+    .decode          = dca_decode_frame,
+    .close           = dca_decode_end,
+    .long_name       = NULL_IF_CONFIG_SMALL("DCA (DTS Coherent Acoustics)"),
+    .capabilities    = CODEC_CAP_CHANNEL_CONF | CODEC_CAP_DR1,
+    .sample_fmts     = (const enum AVSampleFormat[]) { AV_SAMPLE_FMT_FLT,
+                                                       AV_SAMPLE_FMT_S16,
+                                                       AV_SAMPLE_FMT_NONE },
+    .profiles        = NULL_IF_CONFIG_SMALL(profiles),
  };