]> git.sesse.net Git - ffmpeg/blob - libavcodec/wmalosslessdec.c
x86/simple_idct: use LOCAL_ALIGNED instead of DECLARE_ALIGNED
[ffmpeg] / libavcodec / wmalosslessdec.c
1 /*
2  * Windows Media Audio Lossless decoder
3  * Copyright (c) 2007 Baptiste Coudurier, Benjamin Larsson, Ulion
4  * Copyright (c) 2008 - 2011 Sascha Sommer, Benjamin Larsson
5  * Copyright (c) 2011 Andreas Ă–man
6  * Copyright (c) 2011 - 2012 Mashiat Sarker Shakkhar
7  *
8  * This file is part of FFmpeg.
9  *
10  * FFmpeg is free software; you can redistribute it and/or
11  * modify it under the terms of the GNU Lesser General Public
12  * License as published by the Free Software Foundation; either
13  * version 2.1 of the License, or (at your option) any later version.
14  *
15  * FFmpeg is distributed in the hope that it will be useful,
16  * but WITHOUT ANY WARRANTY; without even the implied warranty of
17  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
18  * Lesser General Public License for more details.
19  *
20  * You should have received a copy of the GNU Lesser General Public
21  * License along with FFmpeg; if not, write to the Free Software
22  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
23  */
24
25 #include "libavutil/attributes.h"
26 #include "libavutil/avassert.h"
27
28 #include "avcodec.h"
29 #include "internal.h"
30 #include "get_bits.h"
31 #include "put_bits.h"
32 #include "wma.h"
33 #include "wma_common.h"
34
35 /** current decoder limitations */
36 #define WMALL_MAX_CHANNELS      8                       ///< max number of handled channels
37 #define MAX_SUBFRAMES          32                       ///< max number of subframes per channel
38 #define MAX_BANDS              29                       ///< max number of scale factor bands
39 #define MAX_FRAMESIZE       32768                       ///< maximum compressed frame size
40 #define MAX_ORDER             256
41
42 #define WMALL_BLOCK_MIN_BITS    6                       ///< log2 of min block size
43 #define WMALL_BLOCK_MAX_BITS   14                       ///< log2 of max block size
44 #define WMALL_BLOCK_MAX_SIZE (1 << WMALL_BLOCK_MAX_BITS)    ///< maximum block size
45 #define WMALL_BLOCK_SIZES    (WMALL_BLOCK_MAX_BITS - WMALL_BLOCK_MIN_BITS + 1) ///< possible block sizes
46
47
48 /**
49  * @brief frame-specific decoder context for a single channel
50  */
51 typedef struct {
52     int16_t     prev_block_len;                         ///< length of the previous block
53     uint8_t     transmit_coefs;
54     uint8_t     num_subframes;
55     uint16_t    subframe_len[MAX_SUBFRAMES];            ///< subframe length in samples
56     uint16_t    subframe_offsets[MAX_SUBFRAMES];        ///< subframe positions in the current frame
57     uint8_t     cur_subframe;                           ///< current subframe number
58     uint16_t    decoded_samples;                        ///< number of already processed samples
59     int         quant_step;                             ///< quantization step for the current subframe
60     int         transient_counter;                      ///< number of transient samples from the beginning of the transient zone
61 } WmallChannelCtx;
62
63 /**
64  * @brief main decoder context
65  */
66 typedef struct WmallDecodeCtx {
67     /* generic decoder variables */
68     AVCodecContext  *avctx;
69     AVFrame         *frame;
70     uint8_t         frame_data[MAX_FRAMESIZE + FF_INPUT_BUFFER_PADDING_SIZE];  ///< compressed frame data
71     PutBitContext   pb;                             ///< context for filling the frame_data buffer
72
73     /* frame size dependent frame information (set during initialization) */
74     uint32_t        decode_flags;                   ///< used compression features
75     int             len_prefix;                     ///< frame is prefixed with its length
76     int             dynamic_range_compression;      ///< frame contains DRC data
77     uint8_t         bits_per_sample;                ///< integer audio sample size for the unscaled IMDCT output (used to scale to [-1.0, 1.0])
78     uint16_t        samples_per_frame;              ///< number of samples to output
79     uint16_t        log2_frame_size;
80     int8_t          num_channels;                   ///< number of channels in the stream (same as AVCodecContext.num_channels)
81     int8_t          lfe_channel;                    ///< lfe channel index
82     uint8_t         max_num_subframes;
83     uint8_t         subframe_len_bits;              ///< number of bits used for the subframe length
84     uint8_t         max_subframe_len_bit;           ///< flag indicating that the subframe is of maximum size when the first subframe length bit is 1
85     uint16_t        min_samples_per_subframe;
86
87     /* packet decode state */
88     GetBitContext   pgb;                            ///< bitstream reader context for the packet
89     int             next_packet_start;              ///< start offset of the next WMA packet in the demuxer packet
90     uint8_t         packet_offset;                  ///< offset to the frame in the packet
91     uint8_t         packet_sequence_number;         ///< current packet number
92     int             num_saved_bits;                 ///< saved number of bits
93     int             frame_offset;                   ///< frame offset in the bit reservoir
94     int             subframe_offset;                ///< subframe offset in the bit reservoir
95     uint8_t         packet_loss;                    ///< set in case of bitstream error
96     uint8_t         packet_done;                    ///< set when a packet is fully decoded
97
98     /* frame decode state */
99     uint32_t        frame_num;                      ///< current frame number (not used for decoding)
100     GetBitContext   gb;                             ///< bitstream reader context
101     int             buf_bit_size;                   ///< buffer size in bits
102     int16_t         *samples_16[WMALL_MAX_CHANNELS]; ///< current samplebuffer pointer (16-bit)
103     int32_t         *samples_32[WMALL_MAX_CHANNELS]; ///< current samplebuffer pointer (24-bit)
104     uint8_t         drc_gain;                       ///< gain for the DRC tool
105     int8_t          skip_frame;                     ///< skip output step
106     int8_t          parsed_all_subframes;           ///< all subframes decoded?
107
108     /* subframe/block decode state */
109     int16_t         subframe_len;                   ///< current subframe length
110     int8_t          channels_for_cur_subframe;      ///< number of channels that contain the subframe
111     int8_t          channel_indexes_for_cur_subframe[WMALL_MAX_CHANNELS];
112
113     WmallChannelCtx channel[WMALL_MAX_CHANNELS];    ///< per channel data
114
115     // WMA Lossless-specific
116
117     uint8_t do_arith_coding;
118     uint8_t do_ac_filter;
119     uint8_t do_inter_ch_decorr;
120     uint8_t do_mclms;
121     uint8_t do_lpc;
122
123     int8_t  acfilter_order;
124     int8_t  acfilter_scaling;
125     int64_t acfilter_coeffs[16];
126     int     acfilter_prevvalues[WMALL_MAX_CHANNELS][16];
127
128     int8_t  mclms_order;
129     int8_t  mclms_scaling;
130     int16_t mclms_coeffs[128];
131     int16_t mclms_coeffs_cur[4];
132     int16_t mclms_prevvalues[WMALL_MAX_CHANNELS * 2 * 32];
133     int16_t mclms_updates[WMALL_MAX_CHANNELS * 2 * 32];
134     int     mclms_recent;
135
136     int     movave_scaling;
137     int     quant_stepsize;
138
139     struct {
140         int order;
141         int scaling;
142         int coefsend;
143         int bitsend;
144         int16_t coefs[MAX_ORDER];
145         int16_t lms_prevvalues[MAX_ORDER * 2];
146         int16_t lms_updates[MAX_ORDER * 2];
147         int recent;
148     } cdlms[WMALL_MAX_CHANNELS][9];
149
150     int cdlms_ttl[WMALL_MAX_CHANNELS];
151
152     int bV3RTM;
153
154     int is_channel_coded[WMALL_MAX_CHANNELS];
155     int update_speed[WMALL_MAX_CHANNELS];
156
157     int transient[WMALL_MAX_CHANNELS];
158     int transient_pos[WMALL_MAX_CHANNELS];
159     int seekable_tile;
160
161     int ave_sum[WMALL_MAX_CHANNELS];
162
163     int channel_residues[WMALL_MAX_CHANNELS][WMALL_BLOCK_MAX_SIZE];
164
165     int lpc_coefs[WMALL_MAX_CHANNELS][40];
166     int lpc_order;
167     int lpc_scaling;
168     int lpc_intbits;
169
170     int channel_coeffs[WMALL_MAX_CHANNELS][WMALL_BLOCK_MAX_SIZE];
171 } WmallDecodeCtx;
172
173
174 static av_cold int decode_init(AVCodecContext *avctx)
175 {
176     WmallDecodeCtx *s  = avctx->priv_data;
177     uint8_t *edata_ptr = avctx->extradata;
178     unsigned int channel_mask;
179     int i, log2_max_num_subframes;
180
181     s->avctx = avctx;
182     init_put_bits(&s->pb, s->frame_data, MAX_FRAMESIZE);
183
184     if (avctx->extradata_size >= 18) {
185         s->decode_flags    = AV_RL16(edata_ptr + 14);
186         channel_mask       = AV_RL32(edata_ptr +  2);
187         s->bits_per_sample = AV_RL16(edata_ptr);
188         if (s->bits_per_sample == 16)
189             avctx->sample_fmt = AV_SAMPLE_FMT_S16P;
190         else if (s->bits_per_sample == 24) {
191             avctx->sample_fmt = AV_SAMPLE_FMT_S32P;
192             avpriv_report_missing_feature(avctx, "Bit-depth higher than 16");
193             return AVERROR_PATCHWELCOME;
194         } else {
195             av_log(avctx, AV_LOG_ERROR, "Unknown bit-depth: %d\n",
196                    s->bits_per_sample);
197             return AVERROR_INVALIDDATA;
198         }
199         /* dump the extradata */
200         for (i = 0; i < avctx->extradata_size; i++)
201             av_dlog(avctx, "[%x] ", avctx->extradata[i]);
202         av_dlog(avctx, "\n");
203
204     } else {
205         avpriv_request_sample(avctx, "Unsupported extradata size");
206         return AVERROR_PATCHWELCOME;
207     }
208
209     /* generic init */
210     s->log2_frame_size = av_log2(avctx->block_align) + 4;
211
212     /* frame info */
213     s->skip_frame  = 1; /* skip first frame */
214     s->packet_loss = 1;
215     s->len_prefix  = s->decode_flags & 0x40;
216
217     /* get frame len */
218     s->samples_per_frame = 1 << ff_wma_get_frame_len_bits(avctx->sample_rate,
219                                                           3, s->decode_flags);
220     av_assert0(s->samples_per_frame <= WMALL_BLOCK_MAX_SIZE);
221
222     /* init previous block len */
223     for (i = 0; i < avctx->channels; i++)
224         s->channel[i].prev_block_len = s->samples_per_frame;
225
226     /* subframe info */
227     log2_max_num_subframes  = (s->decode_flags & 0x38) >> 3;
228     s->max_num_subframes    = 1 << log2_max_num_subframes;
229     s->max_subframe_len_bit = 0;
230     s->subframe_len_bits    = av_log2(log2_max_num_subframes) + 1;
231
232     s->min_samples_per_subframe  = s->samples_per_frame / s->max_num_subframes;
233     s->dynamic_range_compression = s->decode_flags & 0x80;
234     s->bV3RTM                    = s->decode_flags & 0x100;
235
236     if (s->max_num_subframes > MAX_SUBFRAMES) {
237         av_log(avctx, AV_LOG_ERROR, "invalid number of subframes %i\n",
238                s->max_num_subframes);
239         return AVERROR_INVALIDDATA;
240     }
241
242     s->num_channels = avctx->channels;
243
244     /* extract lfe channel position */
245     s->lfe_channel = -1;
246
247     if (channel_mask & 8) {
248         unsigned int mask;
249         for (mask = 1; mask < 16; mask <<= 1)
250             if (channel_mask & mask)
251                 ++s->lfe_channel;
252     }
253
254     if (s->num_channels < 0) {
255         av_log(avctx, AV_LOG_ERROR, "invalid number of channels %d\n",
256                s->num_channels);
257         return AVERROR_INVALIDDATA;
258     } else if (s->num_channels > WMALL_MAX_CHANNELS) {
259         avpriv_request_sample(avctx,
260                               "More than %d channels", WMALL_MAX_CHANNELS);
261         return AVERROR_PATCHWELCOME;
262     }
263
264     s->frame = av_frame_alloc();
265     if (!s->frame)
266         return AVERROR(ENOMEM);
267
268     avctx->channel_layout = channel_mask;
269     return 0;
270 }
271
272 /**
273  * @brief Decode the subframe length.
274  * @param s      context
275  * @param offset sample offset in the frame
276  * @return decoded subframe length on success, < 0 in case of an error
277  */
278 static int decode_subframe_length(WmallDecodeCtx *s, int offset)
279 {
280     int frame_len_ratio, subframe_len, len;
281
282     /* no need to read from the bitstream when only one length is possible */
283     if (offset == s->samples_per_frame - s->min_samples_per_subframe)
284         return s->min_samples_per_subframe;
285
286     len             = av_log2(s->max_num_subframes - 1) + 1;
287     frame_len_ratio = get_bits(&s->gb, len);
288     subframe_len    = s->min_samples_per_subframe * (frame_len_ratio + 1);
289
290     /* sanity check the length */
291     if (subframe_len < s->min_samples_per_subframe ||
292         subframe_len > s->samples_per_frame) {
293         av_log(s->avctx, AV_LOG_ERROR, "broken frame: subframe_len %i\n",
294                subframe_len);
295         return AVERROR_INVALIDDATA;
296     }
297     return subframe_len;
298 }
299
300 /**
301  * @brief Decode how the data in the frame is split into subframes.
302  *       Every WMA frame contains the encoded data for a fixed number of
303  *       samples per channel. The data for every channel might be split
304  *       into several subframes. This function will reconstruct the list of
305  *       subframes for every channel.
306  *
307  *       If the subframes are not evenly split, the algorithm estimates the
308  *       channels with the lowest number of total samples.
309  *       Afterwards, for each of these channels a bit is read from the
310  *       bitstream that indicates if the channel contains a subframe with the
311  *       next subframe size that is going to be read from the bitstream or not.
312  *       If a channel contains such a subframe, the subframe size gets added to
313  *       the channel's subframe list.
314  *       The algorithm repeats these steps until the frame is properly divided
315  *       between the individual channels.
316  *
317  * @param s context
318  * @return 0 on success, < 0 in case of an error
319  */
320 static int decode_tilehdr(WmallDecodeCtx *s)
321 {
322     uint16_t num_samples[WMALL_MAX_CHANNELS] = { 0 }; /* sum of samples for all currently known subframes of a channel */
323     uint8_t  contains_subframe[WMALL_MAX_CHANNELS];   /* flag indicating if a channel contains the current subframe */
324     int channels_for_cur_subframe = s->num_channels;  /* number of channels that contain the current subframe */
325     int fixed_channel_layout = 0;                     /* flag indicating that all channels use the same subfra2me offsets and sizes */
326     int min_channel_len = 0;                          /* smallest sum of samples (channels with this length will be processed first) */
327     int c, tile_aligned;
328
329     /* reset tiling information */
330     for (c = 0; c < s->num_channels; c++)
331         s->channel[c].num_subframes = 0;
332
333     tile_aligned = get_bits1(&s->gb);
334     if (s->max_num_subframes == 1 || tile_aligned)
335         fixed_channel_layout = 1;
336
337     /* loop until the frame data is split between the subframes */
338     do {
339         int subframe_len, in_use = 0;
340
341         /* check which channels contain the subframe */
342         for (c = 0; c < s->num_channels; c++) {
343             if (num_samples[c] == min_channel_len) {
344                 if (fixed_channel_layout || channels_for_cur_subframe == 1 ||
345                    (min_channel_len == s->samples_per_frame - s->min_samples_per_subframe)) {
346                     contains_subframe[c] = in_use = 1;
347                 } else {
348                     if (get_bits1(&s->gb))
349                         contains_subframe[c] = in_use = 1;
350                 }
351             } else
352                 contains_subframe[c] = 0;
353         }
354
355         if (!in_use) {
356             av_log(s->avctx, AV_LOG_ERROR,
357                    "Found empty subframe\n");
358             return AVERROR_INVALIDDATA;
359         }
360
361         /* get subframe length, subframe_len == 0 is not allowed */
362         if ((subframe_len = decode_subframe_length(s, min_channel_len)) <= 0)
363             return AVERROR_INVALIDDATA;
364         /* add subframes to the individual channels and find new min_channel_len */
365         min_channel_len += subframe_len;
366         for (c = 0; c < s->num_channels; c++) {
367             WmallChannelCtx *chan = &s->channel[c];
368
369             if (contains_subframe[c]) {
370                 if (chan->num_subframes >= MAX_SUBFRAMES) {
371                     av_log(s->avctx, AV_LOG_ERROR,
372                            "broken frame: num subframes > 31\n");
373                     return AVERROR_INVALIDDATA;
374                 }
375                 chan->subframe_len[chan->num_subframes] = subframe_len;
376                 num_samples[c] += subframe_len;
377                 ++chan->num_subframes;
378                 if (num_samples[c] > s->samples_per_frame) {
379                     av_log(s->avctx, AV_LOG_ERROR, "broken frame: "
380                            "channel len(%d) > samples_per_frame(%d)\n",
381                            num_samples[c], s->samples_per_frame);
382                     return AVERROR_INVALIDDATA;
383                 }
384             } else if (num_samples[c] <= min_channel_len) {
385                 if (num_samples[c] < min_channel_len) {
386                     channels_for_cur_subframe = 0;
387                     min_channel_len = num_samples[c];
388                 }
389                 ++channels_for_cur_subframe;
390             }
391         }
392     } while (min_channel_len < s->samples_per_frame);
393
394     for (c = 0; c < s->num_channels; c++) {
395         int i, offset = 0;
396         for (i = 0; i < s->channel[c].num_subframes; i++) {
397             s->channel[c].subframe_offsets[i] = offset;
398             offset += s->channel[c].subframe_len[i];
399         }
400     }
401
402     return 0;
403 }
404
405 static void decode_ac_filter(WmallDecodeCtx *s)
406 {
407     int i;
408     s->acfilter_order   = get_bits(&s->gb, 4) + 1;
409     s->acfilter_scaling = get_bits(&s->gb, 4);
410
411     for (i = 0; i < s->acfilter_order; i++)
412         s->acfilter_coeffs[i] = (s->acfilter_scaling ?
413                                  get_bits(&s->gb, s->acfilter_scaling) : 0) + 1;
414 }
415
416 static void decode_mclms(WmallDecodeCtx *s)
417 {
418     s->mclms_order   = (get_bits(&s->gb, 4) + 1) * 2;
419     s->mclms_scaling = get_bits(&s->gb, 4);
420     if (get_bits1(&s->gb)) {
421         int i, send_coef_bits;
422         int cbits = av_log2(s->mclms_scaling + 1);
423         if (1 << cbits < s->mclms_scaling + 1)
424             cbits++;
425
426         send_coef_bits = (cbits ? get_bits(&s->gb, cbits) : 0) + 2;
427
428         for (i = 0; i < s->mclms_order * s->num_channels * s->num_channels; i++)
429             s->mclms_coeffs[i] = get_bits(&s->gb, send_coef_bits);
430
431         for (i = 0; i < s->num_channels; i++) {
432             int c;
433             for (c = 0; c < i; c++)
434                 s->mclms_coeffs_cur[i * s->num_channels + c] = get_bits(&s->gb, send_coef_bits);
435         }
436     }
437 }
438
439 static int decode_cdlms(WmallDecodeCtx *s)
440 {
441     int c, i;
442     int cdlms_send_coef = get_bits1(&s->gb);
443
444     for (c = 0; c < s->num_channels; c++) {
445         s->cdlms_ttl[c] = get_bits(&s->gb, 3) + 1;
446         for (i = 0; i < s->cdlms_ttl[c]; i++) {
447             s->cdlms[c][i].order = (get_bits(&s->gb, 7) + 1) * 8;
448             if (s->cdlms[c][i].order > MAX_ORDER) {
449                 av_log(s->avctx, AV_LOG_ERROR,
450                        "Order[%d][%d] %d > max (%d), not supported\n",
451                        c, i, s->cdlms[c][i].order, MAX_ORDER);
452                 s->cdlms[0][0].order = 0;
453                 return AVERROR_INVALIDDATA;
454             }
455         }
456
457         for (i = 0; i < s->cdlms_ttl[c]; i++)
458             s->cdlms[c][i].scaling = get_bits(&s->gb, 4);
459
460         if (cdlms_send_coef) {
461             for (i = 0; i < s->cdlms_ttl[c]; i++) {
462                 int cbits, shift_l, shift_r, j;
463                 cbits = av_log2(s->cdlms[c][i].order);
464                 if ((1 << cbits) < s->cdlms[c][i].order)
465                     cbits++;
466                 s->cdlms[c][i].coefsend = get_bits(&s->gb, cbits) + 1;
467
468                 cbits = av_log2(s->cdlms[c][i].scaling + 1);
469                 if ((1 << cbits) < s->cdlms[c][i].scaling + 1)
470                     cbits++;
471
472                 s->cdlms[c][i].bitsend = get_bits(&s->gb, cbits) + 2;
473                 shift_l = 32 - s->cdlms[c][i].bitsend;
474                 shift_r = 32 - s->cdlms[c][i].scaling - 2;
475                 for (j = 0; j < s->cdlms[c][i].coefsend; j++)
476                     s->cdlms[c][i].coefs[j] =
477                         (get_bits(&s->gb, s->cdlms[c][i].bitsend) << shift_l) >> shift_r;
478             }
479         }
480     }
481
482     return 0;
483 }
484
485 static int decode_channel_residues(WmallDecodeCtx *s, int ch, int tile_size)
486 {
487     int i = 0;
488     unsigned int ave_mean;
489     s->transient[ch] = get_bits1(&s->gb);
490     if (s->transient[ch]) {
491         s->transient_pos[ch] = get_bits(&s->gb, av_log2(tile_size));
492         if (s->transient_pos[ch])
493             s->transient[ch] = 0;
494         s->channel[ch].transient_counter =
495             FFMAX(s->channel[ch].transient_counter, s->samples_per_frame / 2);
496     } else if (s->channel[ch].transient_counter)
497         s->transient[ch] = 1;
498
499     if (s->seekable_tile) {
500         ave_mean = get_bits(&s->gb, s->bits_per_sample);
501         s->ave_sum[ch] = ave_mean << (s->movave_scaling + 1);
502     }
503
504     if (s->seekable_tile) {
505         if (s->do_inter_ch_decorr)
506             s->channel_residues[ch][0] = get_sbits_long(&s->gb, s->bits_per_sample + 1);
507         else
508             s->channel_residues[ch][0] = get_sbits_long(&s->gb, s->bits_per_sample);
509         i++;
510     }
511     for (; i < tile_size; i++) {
512         int quo = 0, rem, rem_bits, residue;
513         while(get_bits1(&s->gb)) {
514             quo++;
515             if (get_bits_left(&s->gb) <= 0)
516                 return -1;
517         }
518         if (quo >= 32)
519             quo += get_bits_long(&s->gb, get_bits(&s->gb, 5) + 1);
520
521         ave_mean = (s->ave_sum[ch] + (1 << s->movave_scaling)) >> (s->movave_scaling + 1);
522         if (ave_mean <= 1)
523             residue = quo;
524         else {
525             rem_bits = av_ceil_log2(ave_mean);
526             rem      = get_bits_long(&s->gb, rem_bits);
527             residue  = (quo << rem_bits) + rem;
528         }
529
530         s->ave_sum[ch] = residue + s->ave_sum[ch] -
531                          (s->ave_sum[ch] >> s->movave_scaling);
532
533         if (residue & 1)
534             residue = -(residue >> 1) - 1;
535         else
536             residue = residue >> 1;
537         s->channel_residues[ch][i] = residue;
538     }
539
540     return 0;
541
542 }
543
544 static void decode_lpc(WmallDecodeCtx *s)
545 {
546     int ch, i, cbits;
547     s->lpc_order   = get_bits(&s->gb, 5) + 1;
548     s->lpc_scaling = get_bits(&s->gb, 4);
549     s->lpc_intbits = get_bits(&s->gb, 3) + 1;
550     cbits = s->lpc_scaling + s->lpc_intbits;
551     for (ch = 0; ch < s->num_channels; ch++)
552         for (i = 0; i < s->lpc_order; i++)
553             s->lpc_coefs[ch][i] = get_sbits(&s->gb, cbits);
554 }
555
556 static void clear_codec_buffers(WmallDecodeCtx *s)
557 {
558     int ich, ilms;
559
560     memset(s->acfilter_coeffs,     0, sizeof(s->acfilter_coeffs));
561     memset(s->acfilter_prevvalues, 0, sizeof(s->acfilter_prevvalues));
562     memset(s->lpc_coefs,           0, sizeof(s->lpc_coefs));
563
564     memset(s->mclms_coeffs,     0, sizeof(s->mclms_coeffs));
565     memset(s->mclms_coeffs_cur, 0, sizeof(s->mclms_coeffs_cur));
566     memset(s->mclms_prevvalues, 0, sizeof(s->mclms_prevvalues));
567     memset(s->mclms_updates,    0, sizeof(s->mclms_updates));
568
569     for (ich = 0; ich < s->num_channels; ich++) {
570         for (ilms = 0; ilms < s->cdlms_ttl[ich]; ilms++) {
571             memset(s->cdlms[ich][ilms].coefs, 0,
572                    sizeof(s->cdlms[ich][ilms].coefs));
573             memset(s->cdlms[ich][ilms].lms_prevvalues, 0,
574                    sizeof(s->cdlms[ich][ilms].lms_prevvalues));
575             memset(s->cdlms[ich][ilms].lms_updates, 0,
576                    sizeof(s->cdlms[ich][ilms].lms_updates));
577         }
578         s->ave_sum[ich] = 0;
579     }
580 }
581
582 /**
583  * @brief Reset filter parameters and transient area at new seekable tile.
584  */
585 static void reset_codec(WmallDecodeCtx *s)
586 {
587     int ich, ilms;
588     s->mclms_recent = s->mclms_order * s->num_channels;
589     for (ich = 0; ich < s->num_channels; ich++) {
590         for (ilms = 0; ilms < s->cdlms_ttl[ich]; ilms++)
591             s->cdlms[ich][ilms].recent = s->cdlms[ich][ilms].order;
592         /* first sample of a seekable subframe is considered as the starting of
593             a transient area which is samples_per_frame samples long */
594         s->channel[ich].transient_counter = s->samples_per_frame;
595         s->transient[ich]     = 1;
596         s->transient_pos[ich] = 0;
597     }
598 }
599
600 static void mclms_update(WmallDecodeCtx *s, int icoef, int *pred)
601 {
602     int i, j, ich, pred_error;
603     int order        = s->mclms_order;
604     int num_channels = s->num_channels;
605     int range        = 1 << (s->bits_per_sample - 1);
606
607     for (ich = 0; ich < num_channels; ich++) {
608         pred_error = s->channel_residues[ich][icoef] - pred[ich];
609         if (pred_error > 0) {
610             for (i = 0; i < order * num_channels; i++)
611                 s->mclms_coeffs[i + ich * order * num_channels] +=
612                     s->mclms_updates[s->mclms_recent + i];
613             for (j = 0; j < ich; j++) {
614                 if (s->channel_residues[j][icoef] > 0)
615                     s->mclms_coeffs_cur[ich * num_channels + j] += 1;
616                 else if (s->channel_residues[j][icoef] < 0)
617                     s->mclms_coeffs_cur[ich * num_channels + j] -= 1;
618             }
619         } else if (pred_error < 0) {
620             for (i = 0; i < order * num_channels; i++)
621                 s->mclms_coeffs[i + ich * order * num_channels] -=
622                     s->mclms_updates[s->mclms_recent + i];
623             for (j = 0; j < ich; j++) {
624                 if (s->channel_residues[j][icoef] > 0)
625                     s->mclms_coeffs_cur[ich * num_channels + j] -= 1;
626                 else if (s->channel_residues[j][icoef] < 0)
627                     s->mclms_coeffs_cur[ich * num_channels + j] += 1;
628             }
629         }
630     }
631
632     for (ich = num_channels - 1; ich >= 0; ich--) {
633         s->mclms_recent--;
634         s->mclms_prevvalues[s->mclms_recent] = s->channel_residues[ich][icoef];
635         if (s->channel_residues[ich][icoef] > range - 1)
636             s->mclms_prevvalues[s->mclms_recent] = range - 1;
637         else if (s->channel_residues[ich][icoef] < -range)
638             s->mclms_prevvalues[s->mclms_recent] = -range;
639
640         s->mclms_updates[s->mclms_recent] = 0;
641         if (s->channel_residues[ich][icoef] > 0)
642             s->mclms_updates[s->mclms_recent] = 1;
643         else if (s->channel_residues[ich][icoef] < 0)
644             s->mclms_updates[s->mclms_recent] = -1;
645     }
646
647     if (s->mclms_recent == 0) {
648         memcpy(&s->mclms_prevvalues[order * num_channels],
649                s->mclms_prevvalues,
650                2 * order * num_channels);
651         memcpy(&s->mclms_updates[order * num_channels],
652                s->mclms_updates,
653                2 * order * num_channels);
654         s->mclms_recent = num_channels * order;
655     }
656 }
657
658 static void mclms_predict(WmallDecodeCtx *s, int icoef, int *pred)
659 {
660     int ich, i;
661     int order        = s->mclms_order;
662     int num_channels = s->num_channels;
663
664     for (ich = 0; ich < num_channels; ich++) {
665         pred[ich] = 0;
666         if (!s->is_channel_coded[ich])
667             continue;
668         for (i = 0; i < order * num_channels; i++)
669             pred[ich] += s->mclms_prevvalues[i + s->mclms_recent] *
670                          s->mclms_coeffs[i + order * num_channels * ich];
671         for (i = 0; i < ich; i++)
672             pred[ich] += s->channel_residues[i][icoef] *
673                          s->mclms_coeffs_cur[i + num_channels * ich];
674         pred[ich] += 1 << s->mclms_scaling - 1;
675         pred[ich] >>= s->mclms_scaling;
676         s->channel_residues[ich][icoef] += pred[ich];
677     }
678 }
679
680 static void revert_mclms(WmallDecodeCtx *s, int tile_size)
681 {
682     int icoef, pred[WMALL_MAX_CHANNELS] = { 0 };
683     for (icoef = 0; icoef < tile_size; icoef++) {
684         mclms_predict(s, icoef, pred);
685         mclms_update(s, icoef, pred);
686     }
687 }
688
689 static int lms_predict(WmallDecodeCtx *s, int ich, int ilms)
690 {
691     int pred = 0, icoef;
692     int recent = s->cdlms[ich][ilms].recent;
693
694     for (icoef = 0; icoef < s->cdlms[ich][ilms].order; icoef++)
695         pred += s->cdlms[ich][ilms].coefs[icoef] *
696                 s->cdlms[ich][ilms].lms_prevvalues[icoef + recent];
697
698     return pred;
699 }
700
701 static void lms_update(WmallDecodeCtx *s, int ich, int ilms,
702                        int input, int residue)
703 {
704     int icoef;
705     int recent = s->cdlms[ich][ilms].recent;
706     int range  = 1 << s->bits_per_sample - 1;
707
708     if (residue < 0) {
709         for (icoef = 0; icoef < s->cdlms[ich][ilms].order; icoef++)
710             s->cdlms[ich][ilms].coefs[icoef] -=
711                 s->cdlms[ich][ilms].lms_updates[icoef + recent];
712     } else if (residue > 0) {
713         for (icoef = 0; icoef < s->cdlms[ich][ilms].order; icoef++)
714             s->cdlms[ich][ilms].coefs[icoef] +=
715                 s->cdlms[ich][ilms].lms_updates[icoef + recent];
716     }
717
718     if (recent)
719         recent--;
720     else {
721         memcpy(&s->cdlms[ich][ilms].lms_prevvalues[s->cdlms[ich][ilms].order],
722                s->cdlms[ich][ilms].lms_prevvalues,
723                2 * s->cdlms[ich][ilms].order);
724         memcpy(&s->cdlms[ich][ilms].lms_updates[s->cdlms[ich][ilms].order],
725                s->cdlms[ich][ilms].lms_updates,
726                2 * s->cdlms[ich][ilms].order);
727         recent = s->cdlms[ich][ilms].order - 1;
728     }
729
730     s->cdlms[ich][ilms].lms_prevvalues[recent] = av_clip(input, -range, range - 1);
731     if (!input)
732         s->cdlms[ich][ilms].lms_updates[recent] = 0;
733     else if (input < 0)
734         s->cdlms[ich][ilms].lms_updates[recent] = -s->update_speed[ich];
735     else
736         s->cdlms[ich][ilms].lms_updates[recent] = s->update_speed[ich];
737
738     s->cdlms[ich][ilms].lms_updates[recent + (s->cdlms[ich][ilms].order >> 4)] >>= 2;
739     s->cdlms[ich][ilms].lms_updates[recent + (s->cdlms[ich][ilms].order >> 3)] >>= 1;
740     s->cdlms[ich][ilms].recent = recent;
741 }
742
743 static void use_high_update_speed(WmallDecodeCtx *s, int ich)
744 {
745     int ilms, recent, icoef;
746     for (ilms = s->cdlms_ttl[ich] - 1; ilms >= 0; ilms--) {
747         recent = s->cdlms[ich][ilms].recent;
748         if (s->update_speed[ich] == 16)
749             continue;
750         if (s->bV3RTM) {
751             for (icoef = 0; icoef < s->cdlms[ich][ilms].order; icoef++)
752                 s->cdlms[ich][ilms].lms_updates[icoef + recent] *= 2;
753         } else {
754             for (icoef = 0; icoef < s->cdlms[ich][ilms].order; icoef++)
755                 s->cdlms[ich][ilms].lms_updates[icoef] *= 2;
756         }
757     }
758     s->update_speed[ich] = 16;
759 }
760
761 static void use_normal_update_speed(WmallDecodeCtx *s, int ich)
762 {
763     int ilms, recent, icoef;
764     for (ilms = s->cdlms_ttl[ich] - 1; ilms >= 0; ilms--) {
765         recent = s->cdlms[ich][ilms].recent;
766         if (s->update_speed[ich] == 8)
767             continue;
768         if (s->bV3RTM)
769             for (icoef = 0; icoef < s->cdlms[ich][ilms].order; icoef++)
770                 s->cdlms[ich][ilms].lms_updates[icoef + recent] /= 2;
771         else
772             for (icoef = 0; icoef < s->cdlms[ich][ilms].order; icoef++)
773                 s->cdlms[ich][ilms].lms_updates[icoef] /= 2;
774     }
775     s->update_speed[ich] = 8;
776 }
777
778 static void revert_cdlms(WmallDecodeCtx *s, int ch,
779                          int coef_begin, int coef_end)
780 {
781     int icoef, pred, ilms, num_lms, residue, input;
782
783     num_lms = s->cdlms_ttl[ch];
784     for (ilms = num_lms - 1; ilms >= 0; ilms--) {
785         for (icoef = coef_begin; icoef < coef_end; icoef++) {
786             pred = 1 << (s->cdlms[ch][ilms].scaling - 1);
787             residue = s->channel_residues[ch][icoef];
788             pred += lms_predict(s, ch, ilms);
789             input = residue + (pred >> s->cdlms[ch][ilms].scaling);
790             lms_update(s, ch, ilms, input, residue);
791             s->channel_residues[ch][icoef] = input;
792         }
793     }
794 }
795
796 static void revert_inter_ch_decorr(WmallDecodeCtx *s, int tile_size)
797 {
798     if (s->num_channels != 2)
799         return;
800     else if (s->is_channel_coded[0] || s->is_channel_coded[1]) {
801         int icoef;
802         for (icoef = 0; icoef < tile_size; icoef++) {
803             s->channel_residues[0][icoef] -= s->channel_residues[1][icoef] >> 1;
804             s->channel_residues[1][icoef] += s->channel_residues[0][icoef];
805         }
806     }
807 }
808
809 static void revert_acfilter(WmallDecodeCtx *s, int tile_size)
810 {
811     int ich, pred, i, j;
812     int64_t *filter_coeffs = s->acfilter_coeffs;
813     int scaling            = s->acfilter_scaling;
814     int order              = s->acfilter_order;
815
816     for (ich = 0; ich < s->num_channels; ich++) {
817         int *prevvalues = s->acfilter_prevvalues[ich];
818         for (i = 0; i < order; i++) {
819             pred = 0;
820             for (j = 0; j < order; j++) {
821                 if (i <= j)
822                     pred += filter_coeffs[j] * prevvalues[j - i];
823                 else
824                     pred += s->channel_residues[ich][i - j - 1] * filter_coeffs[j];
825             }
826             pred >>= scaling;
827             s->channel_residues[ich][i] += pred;
828         }
829         for (i = order; i < tile_size; i++) {
830             pred = 0;
831             for (j = 0; j < order; j++)
832                 pred += s->channel_residues[ich][i - j - 1] * filter_coeffs[j];
833             pred >>= scaling;
834             s->channel_residues[ich][i] += pred;
835         }
836         for (j = 0; j < order; j++)
837             prevvalues[j] = s->channel_residues[ich][tile_size - j - 1];
838     }
839 }
840
841 static int decode_subframe(WmallDecodeCtx *s)
842 {
843     int offset        = s->samples_per_frame;
844     int subframe_len  = s->samples_per_frame;
845     int total_samples = s->samples_per_frame * s->num_channels;
846     int i, j, rawpcm_tile, padding_zeroes, res;
847
848     s->subframe_offset = get_bits_count(&s->gb);
849
850     /* reset channel context and find the next block offset and size
851         == the next block of the channel with the smallest number of
852         decoded samples */
853     for (i = 0; i < s->num_channels; i++) {
854         if (offset > s->channel[i].decoded_samples) {
855             offset = s->channel[i].decoded_samples;
856             subframe_len =
857                 s->channel[i].subframe_len[s->channel[i].cur_subframe];
858         }
859     }
860
861     /* get a list of all channels that contain the estimated block */
862     s->channels_for_cur_subframe = 0;
863     for (i = 0; i < s->num_channels; i++) {
864         const int cur_subframe = s->channel[i].cur_subframe;
865         /* subtract already processed samples */
866         total_samples -= s->channel[i].decoded_samples;
867
868         /* and count if there are multiple subframes that match our profile */
869         if (offset == s->channel[i].decoded_samples &&
870             subframe_len == s->channel[i].subframe_len[cur_subframe]) {
871             total_samples -= s->channel[i].subframe_len[cur_subframe];
872             s->channel[i].decoded_samples +=
873                 s->channel[i].subframe_len[cur_subframe];
874             s->channel_indexes_for_cur_subframe[s->channels_for_cur_subframe] = i;
875             ++s->channels_for_cur_subframe;
876         }
877     }
878
879     /* check if the frame will be complete after processing the
880         estimated block */
881     if (!total_samples)
882         s->parsed_all_subframes = 1;
883
884
885     s->seekable_tile = get_bits1(&s->gb);
886     if (s->seekable_tile) {
887         clear_codec_buffers(s);
888
889         s->do_arith_coding    = get_bits1(&s->gb);
890         if (s->do_arith_coding) {
891             avpriv_request_sample(s->avctx, "Arithmetic coding");
892             return AVERROR_PATCHWELCOME;
893         }
894         s->do_ac_filter       = get_bits1(&s->gb);
895         s->do_inter_ch_decorr = get_bits1(&s->gb);
896         s->do_mclms           = get_bits1(&s->gb);
897
898         if (s->do_ac_filter)
899             decode_ac_filter(s);
900
901         if (s->do_mclms)
902             decode_mclms(s);
903
904         if ((res = decode_cdlms(s)) < 0)
905             return res;
906         s->movave_scaling = get_bits(&s->gb, 3);
907         s->quant_stepsize = get_bits(&s->gb, 8) + 1;
908
909         reset_codec(s);
910     } else if (!s->cdlms[0][0].order) {
911         av_log(s->avctx, AV_LOG_DEBUG,
912                "Waiting for seekable tile\n");
913         av_frame_unref(s->frame);
914         return -1;
915     }
916
917     rawpcm_tile = get_bits1(&s->gb);
918
919     for (i = 0; i < s->num_channels; i++)
920         s->is_channel_coded[i] = 1;
921
922     if (!rawpcm_tile) {
923         for (i = 0; i < s->num_channels; i++)
924             s->is_channel_coded[i] = get_bits1(&s->gb);
925
926         if (s->bV3RTM) {
927             // LPC
928             s->do_lpc = get_bits1(&s->gb);
929             if (s->do_lpc) {
930                 decode_lpc(s);
931                 avpriv_request_sample(s->avctx, "Expect wrong output since "
932                                       "inverse LPC filter");
933             }
934         } else
935             s->do_lpc = 0;
936     }
937
938
939     if (get_bits1(&s->gb))
940         padding_zeroes = get_bits(&s->gb, 5);
941     else
942         padding_zeroes = 0;
943
944     if (rawpcm_tile) {
945         int bits = s->bits_per_sample - padding_zeroes;
946         if (bits <= 0) {
947             av_log(s->avctx, AV_LOG_ERROR,
948                    "Invalid number of padding bits in raw PCM tile\n");
949             return AVERROR_INVALIDDATA;
950         }
951         av_dlog(s->avctx, "RAWPCM %d bits per sample. "
952                 "total %d bits, remain=%d\n", bits,
953                 bits * s->num_channels * subframe_len, get_bits_count(&s->gb));
954         for (i = 0; i < s->num_channels; i++)
955             for (j = 0; j < subframe_len; j++)
956                 s->channel_coeffs[i][j] = get_sbits_long(&s->gb, bits);
957     } else {
958         for (i = 0; i < s->num_channels; i++)
959             if (s->is_channel_coded[i]) {
960                 decode_channel_residues(s, i, subframe_len);
961                 if (s->seekable_tile)
962                     use_high_update_speed(s, i);
963                 else
964                     use_normal_update_speed(s, i);
965                 revert_cdlms(s, i, 0, subframe_len);
966             } else {
967                 memset(s->channel_residues[i], 0, sizeof(**s->channel_residues) * subframe_len);
968             }
969     }
970     if (s->do_mclms)
971         revert_mclms(s, subframe_len);
972     if (s->do_inter_ch_decorr)
973         revert_inter_ch_decorr(s, subframe_len);
974     if (s->do_ac_filter)
975         revert_acfilter(s, subframe_len);
976
977     /* Dequantize */
978     if (s->quant_stepsize != 1)
979         for (i = 0; i < s->num_channels; i++)
980             for (j = 0; j < subframe_len; j++)
981                 s->channel_residues[i][j] *= s->quant_stepsize;
982
983     /* Write to proper output buffer depending on bit-depth */
984     for (i = 0; i < s->channels_for_cur_subframe; i++) {
985         int c = s->channel_indexes_for_cur_subframe[i];
986         int subframe_len = s->channel[c].subframe_len[s->channel[c].cur_subframe];
987
988         for (j = 0; j < subframe_len; j++) {
989             if (s->bits_per_sample == 16) {
990                 *s->samples_16[c]++ = (int16_t) s->channel_residues[c][j] << padding_zeroes;
991             } else {
992                 *s->samples_32[c]++ = s->channel_residues[c][j] << padding_zeroes;
993             }
994         }
995     }
996
997     /* handled one subframe */
998     for (i = 0; i < s->channels_for_cur_subframe; i++) {
999         int c = s->channel_indexes_for_cur_subframe[i];
1000         if (s->channel[c].cur_subframe >= s->channel[c].num_subframes) {
1001             av_log(s->avctx, AV_LOG_ERROR, "broken subframe\n");
1002             return AVERROR_INVALIDDATA;
1003         }
1004         ++s->channel[c].cur_subframe;
1005     }
1006     return 0;
1007 }
1008
1009 /**
1010  * @brief Decode one WMA frame.
1011  * @param s codec context
1012  * @return 0 if the trailer bit indicates that this is the last frame,
1013  *         1 if there are additional frames
1014  */
1015 static int decode_frame(WmallDecodeCtx *s)
1016 {
1017     GetBitContext* gb = &s->gb;
1018     int more_frames = 0, len = 0, i, ret;
1019
1020     s->frame->nb_samples = s->samples_per_frame;
1021     if ((ret = ff_get_buffer(s->avctx, s->frame, 0)) < 0) {
1022         /* return an error if no frame could be decoded at all */
1023         s->packet_loss = 1;
1024         return ret;
1025     }
1026     for (i = 0; i < s->num_channels; i++) {
1027         s->samples_16[i] = (int16_t *)s->frame->extended_data[i];
1028         s->samples_32[i] = (int32_t *)s->frame->extended_data[i];
1029     }
1030
1031     /* get frame length */
1032     if (s->len_prefix)
1033         len = get_bits(gb, s->log2_frame_size);
1034
1035     /* decode tile information */
1036     if (decode_tilehdr(s)) {
1037         s->packet_loss = 1;
1038         return 0;
1039     }
1040
1041     /* read drc info */
1042     if (s->dynamic_range_compression)
1043         s->drc_gain = get_bits(gb, 8);
1044
1045     /* no idea what these are for, might be the number of samples
1046        that need to be skipped at the beginning or end of a stream */
1047     if (get_bits1(gb)) {
1048         int av_unused skip;
1049
1050         /* usually true for the first frame */
1051         if (get_bits1(gb)) {
1052             skip = get_bits(gb, av_log2(s->samples_per_frame * 2));
1053             av_dlog(s->avctx, "start skip: %i\n", skip);
1054         }
1055
1056         /* sometimes true for the last frame */
1057         if (get_bits1(gb)) {
1058             skip = get_bits(gb, av_log2(s->samples_per_frame * 2));
1059             av_dlog(s->avctx, "end skip: %i\n", skip);
1060         }
1061
1062     }
1063
1064     /* reset subframe states */
1065     s->parsed_all_subframes = 0;
1066     for (i = 0; i < s->num_channels; i++) {
1067         s->channel[i].decoded_samples = 0;
1068         s->channel[i].cur_subframe    = 0;
1069     }
1070
1071     /* decode all subframes */
1072     while (!s->parsed_all_subframes) {
1073         if (decode_subframe(s) < 0) {
1074             s->packet_loss = 1;
1075             return 0;
1076         }
1077     }
1078
1079     av_dlog(s->avctx, "Frame done\n");
1080
1081     if (s->skip_frame)
1082         s->skip_frame = 0;
1083
1084     if (s->len_prefix) {
1085         if (len != (get_bits_count(gb) - s->frame_offset) + 2) {
1086             /* FIXME: not sure if this is always an error */
1087             av_log(s->avctx, AV_LOG_ERROR,
1088                    "frame[%i] would have to skip %i bits\n", s->frame_num,
1089                    len - (get_bits_count(gb) - s->frame_offset) - 1);
1090             s->packet_loss = 1;
1091             return 0;
1092         }
1093
1094         /* skip the rest of the frame data */
1095         skip_bits_long(gb, len - (get_bits_count(gb) - s->frame_offset) - 1);
1096     }
1097
1098     /* decode trailer bit */
1099     more_frames = get_bits1(gb);
1100     ++s->frame_num;
1101     return more_frames;
1102 }
1103
1104 /**
1105  * @brief Calculate remaining input buffer length.
1106  * @param s  codec context
1107  * @param gb bitstream reader context
1108  * @return remaining size in bits
1109  */
1110 static int remaining_bits(WmallDecodeCtx *s, GetBitContext *gb)
1111 {
1112     return s->buf_bit_size - get_bits_count(gb);
1113 }
1114
1115 /**
1116  * @brief Fill the bit reservoir with a (partial) frame.
1117  * @param s      codec context
1118  * @param gb     bitstream reader context
1119  * @param len    length of the partial frame
1120  * @param append decides whether to reset the buffer or not
1121  */
1122 static void save_bits(WmallDecodeCtx *s, GetBitContext* gb, int len,
1123                       int append)
1124 {
1125     int buflen;
1126     PutBitContext tmp;
1127
1128     /* when the frame data does not need to be concatenated, the input buffer
1129         is reset and additional bits from the previous frame are copied
1130         and skipped later so that a fast byte copy is possible */
1131
1132     if (!append) {
1133         s->frame_offset   = get_bits_count(gb) & 7;
1134         s->num_saved_bits = s->frame_offset;
1135         init_put_bits(&s->pb, s->frame_data, MAX_FRAMESIZE);
1136     }
1137
1138     buflen = (s->num_saved_bits + len + 8) >> 3;
1139
1140     if (len <= 0 || buflen > MAX_FRAMESIZE) {
1141         avpriv_request_sample(s->avctx, "Too small input buffer");
1142         s->packet_loss = 1;
1143         return;
1144     }
1145
1146     s->num_saved_bits += len;
1147     if (!append) {
1148         avpriv_copy_bits(&s->pb, gb->buffer + (get_bits_count(gb) >> 3),
1149                          s->num_saved_bits);
1150     } else {
1151         int align = 8 - (get_bits_count(gb) & 7);
1152         align = FFMIN(align, len);
1153         put_bits(&s->pb, align, get_bits(gb, align));
1154         len -= align;
1155         avpriv_copy_bits(&s->pb, gb->buffer + (get_bits_count(gb) >> 3), len);
1156     }
1157     skip_bits_long(gb, len);
1158
1159     tmp = s->pb;
1160     flush_put_bits(&tmp);
1161
1162     init_get_bits(&s->gb, s->frame_data, s->num_saved_bits);
1163     skip_bits(&s->gb, s->frame_offset);
1164 }
1165
1166 static int decode_packet(AVCodecContext *avctx, void *data, int *got_frame_ptr,
1167                          AVPacket* avpkt)
1168 {
1169     WmallDecodeCtx *s = avctx->priv_data;
1170     GetBitContext* gb  = &s->pgb;
1171     const uint8_t* buf = avpkt->data;
1172     int buf_size       = avpkt->size;
1173     int num_bits_prev_frame, packet_sequence_number, spliced_packet;
1174
1175     s->frame->nb_samples = 0;
1176
1177     if (s->packet_done || s->packet_loss) {
1178         s->packet_done = 0;
1179
1180         /* sanity check for the buffer length */
1181         if (buf_size < avctx->block_align)
1182             return 0;
1183
1184         s->next_packet_start = buf_size - avctx->block_align;
1185         buf_size             = avctx->block_align;
1186         s->buf_bit_size      = buf_size << 3;
1187
1188         /* parse packet header */
1189         init_get_bits(gb, buf, s->buf_bit_size);
1190         packet_sequence_number = get_bits(gb, 4);
1191         skip_bits(gb, 1);   // Skip seekable_frame_in_packet, currently ununused
1192         spliced_packet = get_bits1(gb);
1193         if (spliced_packet)
1194             avpriv_request_sample(avctx, "Bitstream splicing");
1195
1196         /* get number of bits that need to be added to the previous frame */
1197         num_bits_prev_frame = get_bits(gb, s->log2_frame_size);
1198
1199         /* check for packet loss */
1200         if (!s->packet_loss &&
1201             ((s->packet_sequence_number + 1) & 0xF) != packet_sequence_number) {
1202             s->packet_loss = 1;
1203             av_log(avctx, AV_LOG_ERROR, "Packet loss detected! seq %x vs %x\n",
1204                    s->packet_sequence_number, packet_sequence_number);
1205         }
1206         s->packet_sequence_number = packet_sequence_number;
1207
1208         if (num_bits_prev_frame > 0) {
1209             int remaining_packet_bits = s->buf_bit_size - get_bits_count(gb);
1210             if (num_bits_prev_frame >= remaining_packet_bits) {
1211                 num_bits_prev_frame = remaining_packet_bits;
1212                 s->packet_done = 1;
1213             }
1214
1215             /* Append the previous frame data to the remaining data from the
1216              * previous packet to create a full frame. */
1217             save_bits(s, gb, num_bits_prev_frame, 1);
1218
1219             /* decode the cross packet frame if it is valid */
1220             if (num_bits_prev_frame < remaining_packet_bits && !s->packet_loss)
1221                 decode_frame(s);
1222         } else if (s->num_saved_bits - s->frame_offset) {
1223             av_dlog(avctx, "ignoring %x previously saved bits\n",
1224                     s->num_saved_bits - s->frame_offset);
1225         }
1226
1227         if (s->packet_loss) {
1228             /* Reset number of saved bits so that the decoder does not start
1229              * to decode incomplete frames in the s->len_prefix == 0 case. */
1230             s->num_saved_bits = 0;
1231             s->packet_loss    = 0;
1232             init_put_bits(&s->pb, s->frame_data, MAX_FRAMESIZE);
1233         }
1234
1235     } else {
1236         int frame_size;
1237
1238         s->buf_bit_size = (avpkt->size - s->next_packet_start) << 3;
1239         init_get_bits(gb, avpkt->data, s->buf_bit_size);
1240         skip_bits(gb, s->packet_offset);
1241
1242         if (s->len_prefix && remaining_bits(s, gb) > s->log2_frame_size &&
1243             (frame_size = show_bits(gb, s->log2_frame_size)) &&
1244             frame_size <= remaining_bits(s, gb)) {
1245             save_bits(s, gb, frame_size, 0);
1246             s->packet_done = !decode_frame(s);
1247         } else if (!s->len_prefix
1248                    && s->num_saved_bits > get_bits_count(&s->gb)) {
1249             /* when the frames do not have a length prefix, we don't know the
1250              * compressed length of the individual frames however, we know what
1251              * part of a new packet belongs to the previous frame therefore we
1252              * save the incoming packet first, then we append the "previous
1253              * frame" data from the next packet so that we get a buffer that
1254              * only contains full frames */
1255             s->packet_done = !decode_frame(s);
1256         } else {
1257             s->packet_done = 1;
1258         }
1259     }
1260
1261     if (s->packet_done && !s->packet_loss &&
1262         remaining_bits(s, gb) > 0) {
1263         /* save the rest of the data so that it can be decoded
1264          * with the next packet */
1265         save_bits(s, gb, remaining_bits(s, gb), 0);
1266     }
1267
1268     *got_frame_ptr   = s->frame->nb_samples > 0;
1269     av_frame_move_ref(data, s->frame);
1270
1271     s->packet_offset = get_bits_count(gb) & 7;
1272
1273     return (s->packet_loss) ? AVERROR_INVALIDDATA : get_bits_count(gb) >> 3;
1274 }
1275
1276 static void flush(AVCodecContext *avctx)
1277 {
1278     WmallDecodeCtx *s    = avctx->priv_data;
1279     s->packet_loss       = 1;
1280     s->packet_done       = 0;
1281     s->num_saved_bits    = 0;
1282     s->frame_offset      = 0;
1283     s->next_packet_start = 0;
1284     s->cdlms[0][0].order = 0;
1285     s->frame->nb_samples = 0;
1286     init_put_bits(&s->pb, s->frame_data, MAX_FRAMESIZE);
1287 }
1288
1289 static av_cold int decode_close(AVCodecContext *avctx)
1290 {
1291     WmallDecodeCtx *s = avctx->priv_data;
1292
1293     av_frame_free(&s->frame);
1294
1295     return 0;
1296 }
1297
1298 AVCodec ff_wmalossless_decoder = {
1299     .name           = "wmalossless",
1300     .type           = AVMEDIA_TYPE_AUDIO,
1301     .id             = AV_CODEC_ID_WMALOSSLESS,
1302     .priv_data_size = sizeof(WmallDecodeCtx),
1303     .init           = decode_init,
1304     .close          = decode_close,
1305     .decode         = decode_packet,
1306     .flush          = flush,
1307     .capabilities   = CODEC_CAP_SUBFRAMES | CODEC_CAP_DR1 | CODEC_CAP_DELAY,
1308     .long_name      = NULL_IF_CONFIG_SMALL("Windows Media Audio Lossless"),
1309     .sample_fmts    = (const enum AVSampleFormat[]) { AV_SAMPLE_FMT_S16P,
1310                                                       AV_SAMPLE_FMT_S32P,
1311                                                       AV_SAMPLE_FMT_NONE },
1312 };