]> git.sesse.net Git - ffmpeg/blob - libavcodec/ra288.c
d2a45b2f00cb97e0381dc7c8b4f54af8b57179d1
[ffmpeg] / libavcodec / ra288.c
1 /*
2  * RealAudio 2.0 (28.8K)
3  * Copyright (c) 2003 the ffmpeg project
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include "avcodec.h"
23 #define ALT_BITSTREAM_READER_LE
24 #include "bitstream.h"
25 #include "ra288.h"
26
27 typedef struct {
28     float sp_lpc[36];      ///< LPC coefficients for speech data (spec: A)
29     float gain_lpc[10];    ///< LPC coefficients for gain (spec: GB)
30
31     float sp_hist[111];    ///< Speech data history (spec: SB)
32
33     /** Speech part of the gain autocorrelation (spec: REXP) */
34     float sp_rec[37];
35
36     float gain_hist[38];   ///< Log-gain history (spec: SBLG)
37
38     /** Recursive part of the gain autocorrelation (spec: REXPLG) */
39     float gain_rec[11];
40
41     float sp_block[41];    ///< Speech data of four blocks (spec: STTMP)
42     float gain_block[10];  ///< Gain data of four blocks (spec: GSTATE)
43 } RA288Context;
44
45 static inline float scalar_product_float(const float * v1, const float * v2,
46                                          int size)
47 {
48     float res = 0.;
49
50     while (size--)
51         res += *v1++ * *v2++;
52
53     return res;
54 }
55
56 static void colmult(float *tgt, const float *m1, const float *m2, int n)
57 {
58     while (n--)
59         *tgt++ = *m1++ * *m2++;
60 }
61
62 static void decode(RA288Context *ractx, float gain, int cb_coef)
63 {
64     int x, y;
65     double sumsum;
66     float sum, buffer[5];
67
68     memmove(ractx->sp_block + 5, ractx->sp_block, 36*sizeof(*ractx->sp_block));
69
70     for (x=4; x >= 0; x--)
71         ractx->sp_block[x] = -scalar_product_float(ractx->sp_block + x + 1,
72                                              ractx->sp_lpc, 36);
73
74     /* block 46 of G.728 spec */
75     sum = 32. - scalar_product_float(ractx->gain_lpc, ractx->gain_block, 10);
76
77     /* block 47 of G.728 spec */
78     sum = av_clipf(sum, 0, 60);
79
80     /* block 48 of G.728 spec */
81     sumsum = exp(sum * 0.1151292546497) * gain; /* pow(10.0,sum/20)*gain */
82
83     for (x=0; x < 5; x++)
84         buffer[x] = codetable[cb_coef][x] * sumsum;
85
86     sum = scalar_product_float(buffer, buffer, 5) / 5;
87
88     sum = FFMAX(sum, 1);
89
90     /* shift and store */
91     memmove(ractx->gain_block, ractx->gain_block - 1,
92             10 * sizeof(*ractx->gain_block));
93
94     *ractx->gain_block = 10 * log10(sum) - 32;
95
96     for (x=1; x < 5; x++)
97         for (y=x-1; y >= 0; y--)
98             buffer[x] -= ractx->sp_lpc[x-y-1] * buffer[y];
99
100     /* output */
101     for (x=0; x < 5; x++)
102         ractx->sp_block[4-x] =
103             av_clipf(ractx->sp_block[4-x] + buffer[x], -4095, 4095);
104 }
105
106 /**
107  * Converts autocorrelation coefficients to LPC coefficients using the
108  * Levinson-Durbin algorithm. See blocks 37 and 50 of the G.728 specification.
109  *
110  * @return 0 if success, -1 if fail
111  */
112 static int eval_lpc_coeffs(const float *in, float *tgt, int n)
113 {
114     int x, y;
115     double f0, f1, f2;
116
117     if (in[n] == 0)
118         return -1;
119
120     if ((f0 = *in) <= 0)
121         return -1;
122
123     in--; // To avoid a -1 subtraction in the inner loop
124
125     for (x=1; x <= n; x++) {
126         f1 = in[x+1];
127
128         for (y=0; y < x - 1; y++)
129             f1 += in[x-y]*tgt[y];
130
131         tgt[x-1] = f2 = -f1/f0;
132         for (y=0; y < x >> 1; y++) {
133             float temp = tgt[y] + tgt[x-y-2]*f2;
134             tgt[x-y-2] += tgt[y]*f2;
135             tgt[y] = temp;
136         }
137         if ((f0 += f1*f2) < 0)
138             return -1;
139     }
140
141     return 0;
142 }
143
144 static void prodsum(float *tgt, const float *src, int len, int n)
145 {
146     for (; n >= 0; n--)
147         tgt[n] = scalar_product_float(src, src - n, len);
148
149 }
150
151 /**
152  * Hybrid window filtering. See blocks 36 and 49 of the G.728 specification.
153  *
154  * @note This function is slightly different from that described in the spec.
155  *       It expects in[0] to be the newest sample and in[n-1] to be the oldest
156  *       one stored. The spec has in the more ordinary way (in[0] the oldest
157  *       and in[n-1] the newest).
158  *
159  * @param order   the order of the filter
160  * @param n       the length of the input
161  * @param non_rec the number of non-recursive samples
162  * @param out     the filter output
163  * @param in      pointer to the input of the filter
164  * @param hist    pointer to the input history of the filter. It is updated by
165  *                this function.
166  * @param out     pointer to the non-recursive part of the output
167  * @param out2    pointer to the recursive part of the output
168  * @param window  pointer to the windowing function table
169  */
170 static void do_hybrid_window(int order, int n, int non_rec, const float *in,
171                              float *out, float *hist, float *out2,
172                              const float *window)
173 {
174     unsigned int x;
175     float buffer1[order + 1];
176     float buffer2[order + 1];
177     float work[order + n + non_rec];
178
179     /* update history */
180     memmove(hist, hist + n, (order + non_rec)*sizeof(*hist));
181
182     for (x=0; x < n; x++)
183         hist[order + non_rec + x] = in[n-x-1];
184
185     colmult(work, window, hist, order + n + non_rec);
186
187     prodsum(buffer1, work + order    , n      , order);
188     prodsum(buffer2, work + order + n, non_rec, order);
189
190     for (x=0; x <= order; x++) {
191         out2[x] = out2[x] * 0.5625 + buffer1[x];
192         out [x] = out2[x]          + buffer2[x];
193     }
194
195     /* Multiply by the white noise correcting factor (WNCF) */
196     *out *= 257./256.;
197 }
198
199 /**
200  * Backward synthesis filter. Find the LPC coefficients from past speech data.
201  */
202 static void backward_filter(RA288Context *ractx)
203 {
204     float temp1[37]; // RTMP in the spec
205     float temp2[11]; // GPTPMP in the spec
206
207     do_hybrid_window(36, 40, 35, ractx->sp_block, temp1, ractx->sp_hist,
208                      ractx->sp_rec, syn_window);
209
210     if (!eval_lpc_coeffs(temp1, ractx->sp_lpc, 36))
211         colmult(ractx->sp_lpc, ractx->sp_lpc, syn_bw_tab, 36);
212
213     do_hybrid_window(10, 8, 20, ractx->gain_block, temp2, ractx->gain_hist,
214                      ractx->gain_rec, gain_window);
215
216     if (!eval_lpc_coeffs(temp2, ractx->gain_lpc, 10))
217         colmult(ractx->gain_lpc, ractx->gain_lpc, gain_bw_tab, 10);
218 }
219
220 static int ra288_decode_frame(AVCodecContext * avctx, void *data,
221                               int *data_size, const uint8_t * buf,
222                               int buf_size)
223 {
224     int16_t *out = data;
225     int x, y;
226     RA288Context *ractx = avctx->priv_data;
227     GetBitContext gb;
228
229     if (buf_size < avctx->block_align) {
230         av_log(avctx, AV_LOG_ERROR,
231                "Error! Input buffer is too small [%d<%d]\n",
232                buf_size, avctx->block_align);
233         return 0;
234     }
235
236     init_get_bits(&gb, buf, avctx->block_align * 8);
237
238     for (x=0; x < 32; x++) {
239         float gain = amptable[get_bits(&gb, 3)];
240         int cb_coef = get_bits(&gb, 6 + (x&1));
241         decode(ractx, gain, cb_coef);
242
243         for (y=0; y < 5; y++)
244             *(out++) = 8 * ractx->sp_block[4 - y];
245
246         if ((x & 7) == 3)
247             backward_filter(ractx);
248     }
249
250     *data_size = (char *)out - (char *)data;
251     return avctx->block_align;
252 }
253
254 AVCodec ra_288_decoder =
255 {
256     "real_288",
257     CODEC_TYPE_AUDIO,
258     CODEC_ID_RA_288,
259     sizeof(RA288Context),
260     NULL,
261     NULL,
262     NULL,
263     ra288_decode_frame,
264     .long_name = NULL_IF_CONFIG_SMALL("RealAudio 2.0 (28.8K)"),
265 };