]> git.sesse.net Git - ffmpeg/blob - libavcodec/wavpack.c
Merge commit '50079a6aa93291e6dc9d9fb8d33da83f79e9311d'
[ffmpeg] / libavcodec / wavpack.c
1 /*
2  * WavPack lossless audio decoder
3  * Copyright (c) 2006,2011 Konstantin Shishkov
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #define BITSTREAM_READER_LE
23
24 #include "libavutil/channel_layout.h"
25 #include "avcodec.h"
26 #include "get_bits.h"
27 #include "internal.h"
28 #include "thread.h"
29 #include "unary.h"
30 #include "bytestream.h"
31 #include "wavpack.h"
32
33 /**
34  * @file
35  * WavPack lossless audio decoder
36  */
37
38 typedef struct SavedContext {
39     int offset;
40     int size;
41     int bits_used;
42     uint32_t crc;
43 } SavedContext;
44
45 typedef struct WavpackFrameContext {
46     AVCodecContext *avctx;
47     int frame_flags;
48     int stereo, stereo_in;
49     int joint;
50     uint32_t CRC;
51     GetBitContext gb;
52     int got_extra_bits;
53     uint32_t crc_extra_bits;
54     GetBitContext gb_extra_bits;
55     int data_size; // in bits
56     int samples;
57     int terms;
58     Decorr decorr[MAX_TERMS];
59     int zero, one, zeroes;
60     int extra_bits;
61     int and, or, shift;
62     int post_shift;
63     int hybrid, hybrid_bitrate;
64     int hybrid_maxclip, hybrid_minclip;
65     int float_flag;
66     int float_shift;
67     int float_max_exp;
68     WvChannel ch[2];
69     int pos;
70     SavedContext sc, extra_sc;
71 } WavpackFrameContext;
72
73 #define WV_MAX_FRAME_DECODERS 14
74
75 typedef struct WavpackContext {
76     AVCodecContext *avctx;
77
78     WavpackFrameContext *fdec[WV_MAX_FRAME_DECODERS];
79     int fdec_num;
80
81     int block;
82     int samples;
83     int ch_offset;
84 } WavpackContext;
85
86 #define LEVEL_DECAY(a)  ((a + 0x80) >> 8)
87
88 static av_always_inline int get_tail(GetBitContext *gb, int k)
89 {
90     int p, e, res;
91
92     if (k < 1)
93         return 0;
94     p   = av_log2(k);
95     e   = (1 << (p + 1)) - k - 1;
96     res = p ? get_bits(gb, p) : 0;
97     if (res >= e)
98         res = (res << 1) - e + get_bits1(gb);
99     return res;
100 }
101
102 static void update_error_limit(WavpackFrameContext *ctx)
103 {
104     int i, br[2], sl[2];
105
106     for (i = 0; i <= ctx->stereo_in; i++) {
107         ctx->ch[i].bitrate_acc += ctx->ch[i].bitrate_delta;
108         br[i]                   = ctx->ch[i].bitrate_acc >> 16;
109         sl[i]                   = LEVEL_DECAY(ctx->ch[i].slow_level);
110     }
111     if (ctx->stereo_in && ctx->hybrid_bitrate) {
112         int balance = (sl[1] - sl[0] + br[1] + 1) >> 1;
113         if (balance > br[0]) {
114             br[1] = br[0] << 1;
115             br[0] = 0;
116         } else if (-balance > br[0]) {
117             br[0] <<= 1;
118             br[1]   = 0;
119         } else {
120             br[1] = br[0] + balance;
121             br[0] = br[0] - balance;
122         }
123     }
124     for (i = 0; i <= ctx->stereo_in; i++) {
125         if (ctx->hybrid_bitrate) {
126             if (sl[i] - br[i] > -0x100)
127                 ctx->ch[i].error_limit = wp_exp2(sl[i] - br[i] + 0x100);
128             else
129                 ctx->ch[i].error_limit = 0;
130         } else {
131             ctx->ch[i].error_limit = wp_exp2(br[i]);
132         }
133     }
134 }
135
136 static int wv_get_value(WavpackFrameContext *ctx, GetBitContext *gb,
137                         int channel, int *last)
138 {
139     int t, t2;
140     int sign, base, add, ret;
141     WvChannel *c = &ctx->ch[channel];
142
143     *last = 0;
144
145     if ((ctx->ch[0].median[0] < 2U) && (ctx->ch[1].median[0] < 2U) &&
146         !ctx->zero && !ctx->one) {
147         if (ctx->zeroes) {
148             ctx->zeroes--;
149             if (ctx->zeroes) {
150                 c->slow_level -= LEVEL_DECAY(c->slow_level);
151                 return 0;
152             }
153         } else {
154             t = get_unary_0_33(gb);
155             if (t >= 2) {
156                 if (get_bits_left(gb) < t - 1)
157                     goto error;
158                 t = get_bits(gb, t - 1) | (1 << (t - 1));
159             } else {
160                 if (get_bits_left(gb) < 0)
161                     goto error;
162             }
163             ctx->zeroes = t;
164             if (ctx->zeroes) {
165                 memset(ctx->ch[0].median, 0, sizeof(ctx->ch[0].median));
166                 memset(ctx->ch[1].median, 0, sizeof(ctx->ch[1].median));
167                 c->slow_level -= LEVEL_DECAY(c->slow_level);
168                 return 0;
169             }
170         }
171     }
172
173     if (ctx->zero) {
174         t         = 0;
175         ctx->zero = 0;
176     } else {
177         t = get_unary_0_33(gb);
178         if (get_bits_left(gb) < 0)
179             goto error;
180         if (t == 16) {
181             t2 = get_unary_0_33(gb);
182             if (t2 < 2) {
183                 if (get_bits_left(gb) < 0)
184                     goto error;
185                 t += t2;
186             } else {
187                 if (get_bits_left(gb) < t2 - 1)
188                     goto error;
189                 t += get_bits(gb, t2 - 1) | (1 << (t2 - 1));
190             }
191         }
192
193         if (ctx->one) {
194             ctx->one = t & 1;
195             t        = (t >> 1) + 1;
196         } else {
197             ctx->one = t & 1;
198             t      >>= 1;
199         }
200         ctx->zero = !ctx->one;
201     }
202
203     if (ctx->hybrid && !channel)
204         update_error_limit(ctx);
205
206     if (!t) {
207         base = 0;
208         add  = GET_MED(0) - 1;
209         DEC_MED(0);
210     } else if (t == 1) {
211         base = GET_MED(0);
212         add  = GET_MED(1) - 1;
213         INC_MED(0);
214         DEC_MED(1);
215     } else if (t == 2) {
216         base = GET_MED(0) + GET_MED(1);
217         add  = GET_MED(2) - 1;
218         INC_MED(0);
219         INC_MED(1);
220         DEC_MED(2);
221     } else {
222         base = GET_MED(0) + GET_MED(1) + GET_MED(2) * (t - 2);
223         add  = GET_MED(2) - 1;
224         INC_MED(0);
225         INC_MED(1);
226         INC_MED(2);
227     }
228     if (!c->error_limit) {
229         if (add >= 0x2000000U) {
230             av_log(ctx->avctx, AV_LOG_ERROR, "k %d is too large\n", add);
231             goto error;
232         }
233         ret = base + get_tail(gb, add);
234         if (get_bits_left(gb) <= 0)
235             goto error;
236     } else {
237         int mid = (base * 2 + add + 1) >> 1;
238         while (add > c->error_limit) {
239             if (get_bits_left(gb) <= 0)
240                 goto error;
241             if (get_bits1(gb)) {
242                 add -= (mid - base);
243                 base = mid;
244             } else
245                 add = mid - base - 1;
246             mid = (base * 2 + add + 1) >> 1;
247         }
248         ret = mid;
249     }
250     sign = get_bits1(gb);
251     if (ctx->hybrid_bitrate)
252         c->slow_level += wp_log2(ret) - LEVEL_DECAY(c->slow_level);
253     return sign ? ~ret : ret;
254
255 error:
256     *last = 1;
257     return 0;
258 }
259
260 static inline int wv_get_value_integer(WavpackFrameContext *s, uint32_t *crc,
261                                        int S)
262 {
263     int bit;
264
265     if (s->extra_bits) {
266         S <<= s->extra_bits;
267
268         if (s->got_extra_bits &&
269             get_bits_left(&s->gb_extra_bits) >= s->extra_bits) {
270             S   |= get_bits(&s->gb_extra_bits, s->extra_bits);
271             *crc = *crc * 9 + (S & 0xffff) * 3 + ((unsigned)S >> 16);
272         }
273     }
274
275     bit = (S & s->and) | s->or;
276     bit = ((S + bit) << s->shift) - bit;
277
278     if (s->hybrid)
279         bit = av_clip(bit, s->hybrid_minclip, s->hybrid_maxclip);
280
281     return bit << s->post_shift;
282 }
283
284 static float wv_get_value_float(WavpackFrameContext *s, uint32_t *crc, int S)
285 {
286     union {
287         float    f;
288         uint32_t u;
289     } value;
290
291     unsigned int sign;
292     int exp = s->float_max_exp;
293
294     if (s->got_extra_bits) {
295         const int max_bits  = 1 + 23 + 8 + 1;
296         const int left_bits = get_bits_left(&s->gb_extra_bits);
297
298         if (left_bits + 8 * FF_INPUT_BUFFER_PADDING_SIZE < max_bits)
299             return 0.0;
300     }
301
302     if (S) {
303         S  <<= s->float_shift;
304         sign = S < 0;
305         if (sign)
306             S = -S;
307         if (S >= 0x1000000) {
308             if (s->got_extra_bits && get_bits1(&s->gb_extra_bits))
309                 S = get_bits(&s->gb_extra_bits, 23);
310             else
311                 S = 0;
312             exp = 255;
313         } else if (exp) {
314             int shift = 23 - av_log2(S);
315             exp = s->float_max_exp;
316             if (exp <= shift)
317                 shift = --exp;
318             exp -= shift;
319
320             if (shift) {
321                 S <<= shift;
322                 if ((s->float_flag & WV_FLT_SHIFT_ONES) ||
323                     (s->got_extra_bits &&
324                      (s->float_flag & WV_FLT_SHIFT_SAME) &&
325                      get_bits1(&s->gb_extra_bits))) {
326                     S |= (1 << shift) - 1;
327                 } else if (s->got_extra_bits &&
328                            (s->float_flag & WV_FLT_SHIFT_SENT)) {
329                     S |= get_bits(&s->gb_extra_bits, shift);
330                 }
331             }
332         } else {
333             exp = s->float_max_exp;
334         }
335         S &= 0x7fffff;
336     } else {
337         sign = 0;
338         exp  = 0;
339         if (s->got_extra_bits && (s->float_flag & WV_FLT_ZERO_SENT)) {
340             if (get_bits1(&s->gb_extra_bits)) {
341                 S = get_bits(&s->gb_extra_bits, 23);
342                 if (s->float_max_exp >= 25)
343                     exp = get_bits(&s->gb_extra_bits, 8);
344                 sign = get_bits1(&s->gb_extra_bits);
345             } else {
346                 if (s->float_flag & WV_FLT_ZERO_SIGN)
347                     sign = get_bits1(&s->gb_extra_bits);
348             }
349         }
350     }
351
352     *crc = *crc * 27 + S * 9 + exp * 3 + sign;
353
354     value.u = (sign << 31) | (exp << 23) | S;
355     return value.f;
356 }
357
358 static void wv_reset_saved_context(WavpackFrameContext *s)
359 {
360     s->pos    = 0;
361     s->sc.crc = s->extra_sc.crc = 0xFFFFFFFF;
362 }
363
364 static inline int wv_check_crc(WavpackFrameContext *s, uint32_t crc,
365                                uint32_t crc_extra_bits)
366 {
367     if (crc != s->CRC) {
368         av_log(s->avctx, AV_LOG_ERROR, "CRC error\n");
369         return AVERROR_INVALIDDATA;
370     }
371     if (s->got_extra_bits && crc_extra_bits != s->crc_extra_bits) {
372         av_log(s->avctx, AV_LOG_ERROR, "Extra bits CRC error\n");
373         return AVERROR_INVALIDDATA;
374     }
375
376     return 0;
377 }
378
379 static inline int wv_unpack_stereo(WavpackFrameContext *s, GetBitContext *gb,
380                                    void *dst_l, void *dst_r, const int type)
381 {
382     int i, j, count = 0;
383     int last, t;
384     int A, B, L, L2, R, R2;
385     int pos                 = s->pos;
386     uint32_t crc            = s->sc.crc;
387     uint32_t crc_extra_bits = s->extra_sc.crc;
388     int16_t *dst16_l        = dst_l;
389     int16_t *dst16_r        = dst_r;
390     int32_t *dst32_l        = dst_l;
391     int32_t *dst32_r        = dst_r;
392     float *dstfl_l          = dst_l;
393     float *dstfl_r          = dst_r;
394
395     s->one = s->zero = s->zeroes = 0;
396     do {
397         L = wv_get_value(s, gb, 0, &last);
398         if (last)
399             break;
400         R = wv_get_value(s, gb, 1, &last);
401         if (last)
402             break;
403         for (i = 0; i < s->terms; i++) {
404             t = s->decorr[i].value;
405             if (t > 0) {
406                 if (t > 8) {
407                     if (t & 1) {
408                         A = 2 * s->decorr[i].samplesA[0] - s->decorr[i].samplesA[1];
409                         B = 2 * s->decorr[i].samplesB[0] - s->decorr[i].samplesB[1];
410                     } else {
411                         A = (3 * s->decorr[i].samplesA[0] - s->decorr[i].samplesA[1]) >> 1;
412                         B = (3 * s->decorr[i].samplesB[0] - s->decorr[i].samplesB[1]) >> 1;
413                     }
414                     s->decorr[i].samplesA[1] = s->decorr[i].samplesA[0];
415                     s->decorr[i].samplesB[1] = s->decorr[i].samplesB[0];
416                     j                        = 0;
417                 } else {
418                     A = s->decorr[i].samplesA[pos];
419                     B = s->decorr[i].samplesB[pos];
420                     j = (pos + t) & 7;
421                 }
422                 if (type != AV_SAMPLE_FMT_S16P) {
423                     L2 = L + ((s->decorr[i].weightA * (int64_t)A + 512) >> 10);
424                     R2 = R + ((s->decorr[i].weightB * (int64_t)B + 512) >> 10);
425                 } else {
426                     L2 = L + ((s->decorr[i].weightA * A + 512) >> 10);
427                     R2 = R + ((s->decorr[i].weightB * B + 512) >> 10);
428                 }
429                 if (A && L)
430                     s->decorr[i].weightA -= ((((L ^ A) >> 30) & 2) - 1) * s->decorr[i].delta;
431                 if (B && R)
432                     s->decorr[i].weightB -= ((((R ^ B) >> 30) & 2) - 1) * s->decorr[i].delta;
433                 s->decorr[i].samplesA[j] = L = L2;
434                 s->decorr[i].samplesB[j] = R = R2;
435             } else if (t == -1) {
436                 if (type != AV_SAMPLE_FMT_S16P)
437                     L2 = L + ((s->decorr[i].weightA * (int64_t)s->decorr[i].samplesA[0] + 512) >> 10);
438                 else
439                     L2 = L + ((s->decorr[i].weightA * s->decorr[i].samplesA[0] + 512) >> 10);
440                 UPDATE_WEIGHT_CLIP(s->decorr[i].weightA, s->decorr[i].delta, s->decorr[i].samplesA[0], L);
441                 L = L2;
442                 if (type != AV_SAMPLE_FMT_S16P)
443                     R2 = R + ((s->decorr[i].weightB * (int64_t)L2 + 512) >> 10);
444                 else
445                     R2 = R + ((s->decorr[i].weightB * L2 + 512) >> 10);
446                 UPDATE_WEIGHT_CLIP(s->decorr[i].weightB, s->decorr[i].delta, L2, R);
447                 R                        = R2;
448                 s->decorr[i].samplesA[0] = R;
449             } else {
450                 if (type != AV_SAMPLE_FMT_S16P)
451                     R2 = R + ((s->decorr[i].weightB * (int64_t)s->decorr[i].samplesB[0] + 512) >> 10);
452                 else
453                     R2 = R + ((s->decorr[i].weightB * s->decorr[i].samplesB[0] + 512) >> 10);
454                 UPDATE_WEIGHT_CLIP(s->decorr[i].weightB, s->decorr[i].delta, s->decorr[i].samplesB[0], R);
455                 R = R2;
456
457                 if (t == -3) {
458                     R2                       = s->decorr[i].samplesA[0];
459                     s->decorr[i].samplesA[0] = R;
460                 }
461
462                 if (type != AV_SAMPLE_FMT_S16P)
463                     L2 = L + ((s->decorr[i].weightA * (int64_t)R2 + 512) >> 10);
464                 else
465                     L2 = L + ((s->decorr[i].weightA * R2 + 512) >> 10);
466                 UPDATE_WEIGHT_CLIP(s->decorr[i].weightA, s->decorr[i].delta, R2, L);
467                 L                        = L2;
468                 s->decorr[i].samplesB[0] = L;
469             }
470         }
471         pos = (pos + 1) & 7;
472         if (s->joint)
473             L += (R -= (L >> 1));
474         crc = (crc * 3 + L) * 3 + R;
475
476         if (type == AV_SAMPLE_FMT_FLTP) {
477             *dstfl_l++ = wv_get_value_float(s, &crc_extra_bits, L);
478             *dstfl_r++ = wv_get_value_float(s, &crc_extra_bits, R);
479         } else if (type == AV_SAMPLE_FMT_S32P) {
480             *dst32_l++ = wv_get_value_integer(s, &crc_extra_bits, L);
481             *dst32_r++ = wv_get_value_integer(s, &crc_extra_bits, R);
482         } else {
483             *dst16_l++ = wv_get_value_integer(s, &crc_extra_bits, L);
484             *dst16_r++ = wv_get_value_integer(s, &crc_extra_bits, R);
485         }
486         count++;
487     } while (!last && count < s->samples);
488
489     wv_reset_saved_context(s);
490
491     if (last && count < s->samples) {
492         int size = av_get_bytes_per_sample(type);
493         memset((uint8_t*)dst_l + count*size, 0, (s->samples-count)*size);
494         memset((uint8_t*)dst_r + count*size, 0, (s->samples-count)*size);
495     }
496
497     if ((s->avctx->err_recognition & AV_EF_CRCCHECK) &&
498         wv_check_crc(s, crc, crc_extra_bits))
499         return AVERROR_INVALIDDATA;
500
501     return 0;
502 }
503
504 static inline int wv_unpack_mono(WavpackFrameContext *s, GetBitContext *gb,
505                                  void *dst, const int type)
506 {
507     int i, j, count = 0;
508     int last, t;
509     int A, S, T;
510     int pos                  = s->pos;
511     uint32_t crc             = s->sc.crc;
512     uint32_t crc_extra_bits  = s->extra_sc.crc;
513     int16_t *dst16           = dst;
514     int32_t *dst32           = dst;
515     float *dstfl             = dst;
516
517     s->one = s->zero = s->zeroes = 0;
518     do {
519         T = wv_get_value(s, gb, 0, &last);
520         S = 0;
521         if (last)
522             break;
523         for (i = 0; i < s->terms; i++) {
524             t = s->decorr[i].value;
525             if (t > 8) {
526                 if (t & 1)
527                     A =  2 * s->decorr[i].samplesA[0] - s->decorr[i].samplesA[1];
528                 else
529                     A = (3 * s->decorr[i].samplesA[0] - s->decorr[i].samplesA[1]) >> 1;
530                 s->decorr[i].samplesA[1] = s->decorr[i].samplesA[0];
531                 j                        = 0;
532             } else {
533                 A = s->decorr[i].samplesA[pos];
534                 j = (pos + t) & 7;
535             }
536             if (type != AV_SAMPLE_FMT_S16P)
537                 S = T + ((s->decorr[i].weightA * (int64_t)A + 512) >> 10);
538             else
539                 S = T + ((s->decorr[i].weightA * A + 512) >> 10);
540             if (A && T)
541                 s->decorr[i].weightA -= ((((T ^ A) >> 30) & 2) - 1) * s->decorr[i].delta;
542             s->decorr[i].samplesA[j] = T = S;
543         }
544         pos = (pos + 1) & 7;
545         crc = crc * 3 + S;
546
547         if (type == AV_SAMPLE_FMT_FLTP) {
548             *dstfl++ = wv_get_value_float(s, &crc_extra_bits, S);
549         } else if (type == AV_SAMPLE_FMT_S32P) {
550             *dst32++ = wv_get_value_integer(s, &crc_extra_bits, S);
551         } else {
552             *dst16++ = wv_get_value_integer(s, &crc_extra_bits, S);
553         }
554         count++;
555     } while (!last && count < s->samples);
556
557     wv_reset_saved_context(s);
558
559     if (last && count < s->samples) {
560         int size = av_get_bytes_per_sample(type);
561         memset((uint8_t*)dst + count*size, 0, (s->samples-count)*size);
562     }
563
564     if (s->avctx->err_recognition & AV_EF_CRCCHECK) {
565         int ret = wv_check_crc(s, crc, crc_extra_bits);
566         if (ret < 0 && s->avctx->err_recognition & AV_EF_EXPLODE)
567             return ret;
568     }
569
570     return 0;
571 }
572
573 static av_cold int wv_alloc_frame_context(WavpackContext *c)
574 {
575     if (c->fdec_num == WV_MAX_FRAME_DECODERS)
576         return -1;
577
578     c->fdec[c->fdec_num] = av_mallocz(sizeof(**c->fdec));
579     if (!c->fdec[c->fdec_num])
580         return -1;
581     c->fdec_num++;
582     c->fdec[c->fdec_num - 1]->avctx = c->avctx;
583     wv_reset_saved_context(c->fdec[c->fdec_num - 1]);
584
585     return 0;
586 }
587
588 static int init_thread_copy(AVCodecContext *avctx)
589 {
590     WavpackContext *s = avctx->priv_data;
591     s->avctx = avctx;
592     return 0;
593 }
594
595 static av_cold int wavpack_decode_init(AVCodecContext *avctx)
596 {
597     WavpackContext *s = avctx->priv_data;
598
599     s->avctx = avctx;
600
601     s->fdec_num = 0;
602
603     return 0;
604 }
605
606 static av_cold int wavpack_decode_end(AVCodecContext *avctx)
607 {
608     WavpackContext *s = avctx->priv_data;
609     int i;
610
611     for (i = 0; i < s->fdec_num; i++)
612         av_freep(&s->fdec[i]);
613     s->fdec_num = 0;
614
615     return 0;
616 }
617
618 static int wavpack_decode_block(AVCodecContext *avctx, int block_no,
619                                 AVFrame *frame, const uint8_t *buf, int buf_size)
620 {
621     WavpackContext *wc = avctx->priv_data;
622     ThreadFrame tframe = { .f = frame };
623     WavpackFrameContext *s;
624     GetByteContext gb;
625     void *samples_l, *samples_r;
626     int ret;
627     int got_terms   = 0, got_weights = 0, got_samples = 0,
628         got_entropy = 0, got_bs      = 0, got_float   = 0, got_hybrid = 0;
629     int i, j, id, size, ssize, weights, t;
630     int bpp, chan = 0, chmask = 0, orig_bpp, sample_rate = 0;
631     int multiblock;
632
633     if (block_no >= wc->fdec_num && wv_alloc_frame_context(wc) < 0) {
634         av_log(avctx, AV_LOG_ERROR, "Error creating frame decode context\n");
635         return AVERROR_INVALIDDATA;
636     }
637
638     s = wc->fdec[block_no];
639     if (!s) {
640         av_log(avctx, AV_LOG_ERROR, "Context for block %d is not present\n",
641                block_no);
642         return AVERROR_INVALIDDATA;
643     }
644
645     memset(s->decorr, 0, MAX_TERMS * sizeof(Decorr));
646     memset(s->ch, 0, sizeof(s->ch));
647     s->extra_bits     = 0;
648     s->and            = s->or = s->shift = 0;
649     s->got_extra_bits = 0;
650
651     bytestream2_init(&gb, buf, buf_size);
652
653     s->samples = bytestream2_get_le32(&gb);
654     if (s->samples != wc->samples) {
655         av_log(avctx, AV_LOG_ERROR, "Mismatching number of samples in "
656                "a sequence: %d and %d\n", wc->samples, s->samples);
657         return AVERROR_INVALIDDATA;
658     }
659     s->frame_flags = bytestream2_get_le32(&gb);
660     bpp            = av_get_bytes_per_sample(avctx->sample_fmt);
661     orig_bpp       = ((s->frame_flags & 0x03) + 1) << 3;
662     multiblock     = (s->frame_flags & WV_SINGLE_BLOCK) != WV_SINGLE_BLOCK;
663
664     s->stereo         = !(s->frame_flags & WV_MONO);
665     s->stereo_in      =  (s->frame_flags & WV_FALSE_STEREO) ? 0 : s->stereo;
666     s->joint          =   s->frame_flags & WV_JOINT_STEREO;
667     s->hybrid         =   s->frame_flags & WV_HYBRID_MODE;
668     s->hybrid_bitrate =   s->frame_flags & WV_HYBRID_BITRATE;
669     s->post_shift     = bpp * 8 - orig_bpp + ((s->frame_flags >> 13) & 0x1f);
670     s->hybrid_maxclip =  ((1LL << (orig_bpp - 1)) - 1);
671     s->hybrid_minclip = ((-1LL << (orig_bpp - 1)));
672     s->CRC            = bytestream2_get_le32(&gb);
673
674     // parse metadata blocks
675     while (bytestream2_get_bytes_left(&gb)) {
676         id   = bytestream2_get_byte(&gb);
677         size = bytestream2_get_byte(&gb);
678         if (id & WP_IDF_LONG) {
679             size |= (bytestream2_get_byte(&gb)) << 8;
680             size |= (bytestream2_get_byte(&gb)) << 16;
681         }
682         size <<= 1; // size is specified in words
683         ssize  = size;
684         if (id & WP_IDF_ODD)
685             size--;
686         if (size < 0) {
687             av_log(avctx, AV_LOG_ERROR,
688                    "Got incorrect block %02X with size %i\n", id, size);
689             break;
690         }
691         if (bytestream2_get_bytes_left(&gb) < ssize) {
692             av_log(avctx, AV_LOG_ERROR,
693                    "Block size %i is out of bounds\n", size);
694             break;
695         }
696         switch (id & WP_IDF_MASK) {
697         case WP_ID_DECTERMS:
698             if (size > MAX_TERMS) {
699                 av_log(avctx, AV_LOG_ERROR, "Too many decorrelation terms\n");
700                 s->terms = 0;
701                 bytestream2_skip(&gb, ssize);
702                 continue;
703             }
704             s->terms = size;
705             for (i = 0; i < s->terms; i++) {
706                 uint8_t val = bytestream2_get_byte(&gb);
707                 s->decorr[s->terms - i - 1].value = (val & 0x1F) - 5;
708                 s->decorr[s->terms - i - 1].delta =  val >> 5;
709             }
710             got_terms = 1;
711             break;
712         case WP_ID_DECWEIGHTS:
713             if (!got_terms) {
714                 av_log(avctx, AV_LOG_ERROR, "No decorrelation terms met\n");
715                 continue;
716             }
717             weights = size >> s->stereo_in;
718             if (weights > MAX_TERMS || weights > s->terms) {
719                 av_log(avctx, AV_LOG_ERROR, "Too many decorrelation weights\n");
720                 bytestream2_skip(&gb, ssize);
721                 continue;
722             }
723             for (i = 0; i < weights; i++) {
724                 t = (int8_t)bytestream2_get_byte(&gb);
725                 s->decorr[s->terms - i - 1].weightA = t << 3;
726                 if (s->decorr[s->terms - i - 1].weightA > 0)
727                     s->decorr[s->terms - i - 1].weightA +=
728                         (s->decorr[s->terms - i - 1].weightA + 64) >> 7;
729                 if (s->stereo_in) {
730                     t = (int8_t)bytestream2_get_byte(&gb);
731                     s->decorr[s->terms - i - 1].weightB = t << 3;
732                     if (s->decorr[s->terms - i - 1].weightB > 0)
733                         s->decorr[s->terms - i - 1].weightB +=
734                             (s->decorr[s->terms - i - 1].weightB + 64) >> 7;
735                 }
736             }
737             got_weights = 1;
738             break;
739         case WP_ID_DECSAMPLES:
740             if (!got_terms) {
741                 av_log(avctx, AV_LOG_ERROR, "No decorrelation terms met\n");
742                 continue;
743             }
744             t = 0;
745             for (i = s->terms - 1; (i >= 0) && (t < size); i--) {
746                 if (s->decorr[i].value > 8) {
747                     s->decorr[i].samplesA[0] =
748                         wp_exp2(bytestream2_get_le16(&gb));
749                     s->decorr[i].samplesA[1] =
750                         wp_exp2(bytestream2_get_le16(&gb));
751
752                     if (s->stereo_in) {
753                         s->decorr[i].samplesB[0] =
754                             wp_exp2(bytestream2_get_le16(&gb));
755                         s->decorr[i].samplesB[1] =
756                             wp_exp2(bytestream2_get_le16(&gb));
757                         t                       += 4;
758                     }
759                     t += 4;
760                 } else if (s->decorr[i].value < 0) {
761                     s->decorr[i].samplesA[0] =
762                         wp_exp2(bytestream2_get_le16(&gb));
763                     s->decorr[i].samplesB[0] =
764                         wp_exp2(bytestream2_get_le16(&gb));
765                     t                       += 4;
766                 } else {
767                     for (j = 0; j < s->decorr[i].value; j++) {
768                         s->decorr[i].samplesA[j] =
769                             wp_exp2(bytestream2_get_le16(&gb));
770                         if (s->stereo_in) {
771                             s->decorr[i].samplesB[j] =
772                                 wp_exp2(bytestream2_get_le16(&gb));
773                         }
774                     }
775                     t += s->decorr[i].value * 2 * (s->stereo_in + 1);
776                 }
777             }
778             got_samples = 1;
779             break;
780         case WP_ID_ENTROPY:
781             if (size != 6 * (s->stereo_in + 1)) {
782                 av_log(avctx, AV_LOG_ERROR,
783                        "Entropy vars size should be %i, got %i.\n",
784                        6 * (s->stereo_in + 1), size);
785                 bytestream2_skip(&gb, ssize);
786                 continue;
787             }
788             for (j = 0; j <= s->stereo_in; j++)
789                 for (i = 0; i < 3; i++) {
790                     s->ch[j].median[i] = wp_exp2(bytestream2_get_le16(&gb));
791                 }
792             got_entropy = 1;
793             break;
794         case WP_ID_HYBRID:
795             if (s->hybrid_bitrate) {
796                 for (i = 0; i <= s->stereo_in; i++) {
797                     s->ch[i].slow_level = wp_exp2(bytestream2_get_le16(&gb));
798                     size               -= 2;
799                 }
800             }
801             for (i = 0; i < (s->stereo_in + 1); i++) {
802                 s->ch[i].bitrate_acc = bytestream2_get_le16(&gb) << 16;
803                 size                -= 2;
804             }
805             if (size > 0) {
806                 for (i = 0; i < (s->stereo_in + 1); i++) {
807                     s->ch[i].bitrate_delta =
808                         wp_exp2((int16_t)bytestream2_get_le16(&gb));
809                 }
810             } else {
811                 for (i = 0; i < (s->stereo_in + 1); i++)
812                     s->ch[i].bitrate_delta = 0;
813             }
814             got_hybrid = 1;
815             break;
816         case WP_ID_INT32INFO: {
817             uint8_t val[4];
818             if (size != 4) {
819                 av_log(avctx, AV_LOG_ERROR,
820                        "Invalid INT32INFO, size = %i\n",
821                        size);
822                 bytestream2_skip(&gb, ssize - 4);
823                 continue;
824             }
825             bytestream2_get_buffer(&gb, val, 4);
826             if (val[0]) {
827                 s->extra_bits = val[0];
828             } else if (val[1]) {
829                 s->shift = val[1];
830             } else if (val[2]) {
831                 s->and   = s->or = 1;
832                 s->shift = val[2];
833             } else if (val[3]) {
834                 s->and   = 1;
835                 s->shift = val[3];
836             }
837             /* original WavPack decoder forces 32-bit lossy sound to be treated
838              * as 24-bit one in order to have proper clipping */
839             if (s->hybrid && bpp == 4 && s->post_shift < 8 && s->shift > 8) {
840                 s->post_shift      += 8;
841                 s->shift           -= 8;
842                 s->hybrid_maxclip >>= 8;
843                 s->hybrid_minclip >>= 8;
844             }
845             break;
846         }
847         case WP_ID_FLOATINFO:
848             if (size != 4) {
849                 av_log(avctx, AV_LOG_ERROR,
850                        "Invalid FLOATINFO, size = %i\n", size);
851                 bytestream2_skip(&gb, ssize);
852                 continue;
853             }
854             s->float_flag    = bytestream2_get_byte(&gb);
855             s->float_shift   = bytestream2_get_byte(&gb);
856             s->float_max_exp = bytestream2_get_byte(&gb);
857             got_float        = 1;
858             bytestream2_skip(&gb, 1);
859             break;
860         case WP_ID_DATA:
861             s->sc.offset = bytestream2_tell(&gb);
862             s->sc.size   = size * 8;
863             if ((ret = init_get_bits8(&s->gb, gb.buffer, size)) < 0)
864                 return ret;
865             s->data_size = size * 8;
866             bytestream2_skip(&gb, size);
867             got_bs       = 1;
868             break;
869         case WP_ID_EXTRABITS:
870             if (size <= 4) {
871                 av_log(avctx, AV_LOG_ERROR, "Invalid EXTRABITS, size = %i\n",
872                        size);
873                 bytestream2_skip(&gb, size);
874                 continue;
875             }
876             s->extra_sc.offset = bytestream2_tell(&gb);
877             s->extra_sc.size   = size * 8;
878             if ((ret = init_get_bits8(&s->gb_extra_bits, gb.buffer, size)) < 0)
879                 return ret;
880             s->crc_extra_bits  = get_bits_long(&s->gb_extra_bits, 32);
881             bytestream2_skip(&gb, size);
882             s->got_extra_bits  = 1;
883             break;
884         case WP_ID_CHANINFO:
885             if (size <= 1) {
886                 av_log(avctx, AV_LOG_ERROR,
887                        "Insufficient channel information\n");
888                 return AVERROR_INVALIDDATA;
889             }
890             chan = bytestream2_get_byte(&gb);
891             switch (size - 2) {
892             case 0:
893                 chmask = bytestream2_get_byte(&gb);
894                 break;
895             case 1:
896                 chmask = bytestream2_get_le16(&gb);
897                 break;
898             case 2:
899                 chmask = bytestream2_get_le24(&gb);
900                 break;
901             case 3:
902                 chmask = bytestream2_get_le32(&gb);
903                 break;
904             case 5:
905                 bytestream2_skip(&gb, 1);
906                 chan  |= (bytestream2_get_byte(&gb) & 0xF) << 8;
907                 chmask = bytestream2_get_le16(&gb);
908                 break;
909             default:
910                 av_log(avctx, AV_LOG_ERROR, "Invalid channel info size %d\n",
911                        size);
912                 chan   = avctx->channels;
913                 chmask = avctx->channel_layout;
914             }
915             break;
916         case WP_ID_SAMPLE_RATE:
917             if (size != 3) {
918                 av_log(avctx, AV_LOG_ERROR, "Invalid custom sample rate.\n");
919                 return AVERROR_INVALIDDATA;
920             }
921             sample_rate = bytestream2_get_le24(&gb);
922             break;
923         default:
924             bytestream2_skip(&gb, size);
925         }
926         if (id & WP_IDF_ODD)
927             bytestream2_skip(&gb, 1);
928     }
929
930     if (!got_terms) {
931         av_log(avctx, AV_LOG_ERROR, "No block with decorrelation terms\n");
932         return AVERROR_INVALIDDATA;
933     }
934     if (!got_weights) {
935         av_log(avctx, AV_LOG_ERROR, "No block with decorrelation weights\n");
936         return AVERROR_INVALIDDATA;
937     }
938     if (!got_samples) {
939         av_log(avctx, AV_LOG_ERROR, "No block with decorrelation samples\n");
940         return AVERROR_INVALIDDATA;
941     }
942     if (!got_entropy) {
943         av_log(avctx, AV_LOG_ERROR, "No block with entropy info\n");
944         return AVERROR_INVALIDDATA;
945     }
946     if (s->hybrid && !got_hybrid) {
947         av_log(avctx, AV_LOG_ERROR, "Hybrid config not found\n");
948         return AVERROR_INVALIDDATA;
949     }
950     if (!got_bs) {
951         av_log(avctx, AV_LOG_ERROR, "Packed samples not found\n");
952         return AVERROR_INVALIDDATA;
953     }
954     if (!got_float && avctx->sample_fmt == AV_SAMPLE_FMT_FLTP) {
955         av_log(avctx, AV_LOG_ERROR, "Float information not found\n");
956         return AVERROR_INVALIDDATA;
957     }
958     if (s->got_extra_bits && avctx->sample_fmt != AV_SAMPLE_FMT_FLTP) {
959         const int size   = get_bits_left(&s->gb_extra_bits);
960         const int wanted = s->samples * s->extra_bits << s->stereo_in;
961         if (size < wanted) {
962             av_log(avctx, AV_LOG_ERROR, "Too small EXTRABITS\n");
963             s->got_extra_bits = 0;
964         }
965     }
966
967     if (!wc->ch_offset) {
968         int sr = (s->frame_flags >> 23) & 0xf;
969         if (sr == 0xf) {
970             if (!sample_rate) {
971                 av_log(avctx, AV_LOG_ERROR, "Custom sample rate missing.\n");
972                 return AVERROR_INVALIDDATA;
973             }
974             avctx->sample_rate = sample_rate;
975         } else
976             avctx->sample_rate = wv_rates[sr];
977
978         if (multiblock) {
979             if (chan)
980                 avctx->channels = chan;
981             if (chmask)
982                 avctx->channel_layout = chmask;
983         } else {
984             avctx->channels       = s->stereo ? 2 : 1;
985             avctx->channel_layout = s->stereo ? AV_CH_LAYOUT_STEREO :
986                                                 AV_CH_LAYOUT_MONO;
987         }
988
989         /* get output buffer */
990         frame->nb_samples = s->samples + 1;
991         if ((ret = ff_thread_get_buffer(avctx, &tframe, 0)) < 0)
992             return ret;
993         frame->nb_samples = s->samples;
994     }
995
996     if (wc->ch_offset + s->stereo >= avctx->channels) {
997         av_log(avctx, AV_LOG_WARNING, "Too many channels coded in a packet.\n");
998         return (avctx->err_recognition & AV_EF_EXPLODE) ? AVERROR_INVALIDDATA : 0;
999     }
1000
1001     samples_l = frame->extended_data[wc->ch_offset];
1002     if (s->stereo)
1003         samples_r = frame->extended_data[wc->ch_offset + 1];
1004
1005     wc->ch_offset += 1 + s->stereo;
1006
1007     if (s->stereo_in) {
1008         ret = wv_unpack_stereo(s, &s->gb, samples_l, samples_r, avctx->sample_fmt);
1009         if (ret < 0)
1010             return ret;
1011     } else {
1012         ret = wv_unpack_mono(s, &s->gb, samples_l, avctx->sample_fmt);
1013         if (ret < 0)
1014             return ret;
1015
1016         if (s->stereo)
1017             memcpy(samples_r, samples_l, bpp * s->samples);
1018     }
1019
1020     return 0;
1021 }
1022
1023 static void wavpack_decode_flush(AVCodecContext *avctx)
1024 {
1025     WavpackContext *s = avctx->priv_data;
1026     int i;
1027
1028     for (i = 0; i < s->fdec_num; i++)
1029         wv_reset_saved_context(s->fdec[i]);
1030 }
1031
1032 static int wavpack_decode_frame(AVCodecContext *avctx, void *data,
1033                                 int *got_frame_ptr, AVPacket *avpkt)
1034 {
1035     WavpackContext *s  = avctx->priv_data;
1036     const uint8_t *buf = avpkt->data;
1037     int buf_size       = avpkt->size;
1038     AVFrame *frame     = data;
1039     int frame_size, ret, frame_flags;
1040
1041     if (avpkt->size <= WV_HEADER_SIZE)
1042         return AVERROR_INVALIDDATA;
1043
1044     s->block     = 0;
1045     s->ch_offset = 0;
1046
1047     /* determine number of samples */
1048     s->samples  = AV_RL32(buf + 20);
1049     frame_flags = AV_RL32(buf + 24);
1050     if (s->samples <= 0 || s->samples > WV_MAX_SAMPLES) {
1051         av_log(avctx, AV_LOG_ERROR, "Invalid number of samples: %d\n",
1052                s->samples);
1053         return AVERROR_INVALIDDATA;
1054     }
1055
1056     if (frame_flags & 0x80) {
1057         avctx->sample_fmt = AV_SAMPLE_FMT_FLTP;
1058     } else if ((frame_flags & 0x03) <= 1) {
1059         avctx->sample_fmt = AV_SAMPLE_FMT_S16P;
1060     } else {
1061         avctx->sample_fmt          = AV_SAMPLE_FMT_S32P;
1062         avctx->bits_per_raw_sample = ((frame_flags & 0x03) + 1) << 3;
1063     }
1064
1065     while (buf_size > 0) {
1066         if (buf_size <= WV_HEADER_SIZE)
1067             break;
1068         frame_size = AV_RL32(buf + 4) - 12;
1069         buf       += 20;
1070         buf_size  -= 20;
1071         if (frame_size <= 0 || frame_size > buf_size) {
1072             av_log(avctx, AV_LOG_ERROR,
1073                    "Block %d has invalid size (size %d vs. %d bytes left)\n",
1074                    s->block, frame_size, buf_size);
1075             wavpack_decode_flush(avctx);
1076             return AVERROR_INVALIDDATA;
1077         }
1078         if ((ret = wavpack_decode_block(avctx, s->block,
1079                                         frame, buf, frame_size)) < 0) {
1080             wavpack_decode_flush(avctx);
1081             return ret;
1082         }
1083         s->block++;
1084         buf      += frame_size;
1085         buf_size -= frame_size;
1086     }
1087
1088     if (s->ch_offset != avctx->channels) {
1089         av_log(avctx, AV_LOG_ERROR, "Not enough channels coded in a packet.\n");
1090         return AVERROR_INVALIDDATA;
1091     }
1092
1093     *got_frame_ptr = 1;
1094
1095     return avpkt->size;
1096 }
1097
1098 AVCodec ff_wavpack_decoder = {
1099     .name           = "wavpack",
1100     .long_name      = NULL_IF_CONFIG_SMALL("WavPack"),
1101     .type           = AVMEDIA_TYPE_AUDIO,
1102     .id             = AV_CODEC_ID_WAVPACK,
1103     .priv_data_size = sizeof(WavpackContext),
1104     .init           = wavpack_decode_init,
1105     .close          = wavpack_decode_end,
1106     .decode         = wavpack_decode_frame,
1107     .flush          = wavpack_decode_flush,
1108     .init_thread_copy = ONLY_IF_THREADS_ENABLED(init_thread_copy),
1109     .capabilities   = CODEC_CAP_DR1 | CODEC_CAP_FRAME_THREADS,
1110 };