]> git.sesse.net Git - ffmpeg/blob - libavcodec/oggvorbis.c
6% faster decode_cabac_residual
[ffmpeg] / libavcodec / oggvorbis.c
1 /**
2  * @file oggvorbis.c
3  * Ogg Vorbis codec support via libvorbisenc.
4  * @author Mark Hills <mark@pogo.org.uk>
5  */
6
7 #include <vorbis/vorbisenc.h>
8
9 #include "avcodec.h"
10
11 #undef NDEBUG
12 #include <assert.h>
13
14 #define OGGVORBIS_FRAME_SIZE 64
15
16 #define BUFFER_SIZE (1024*64)
17
18 typedef struct OggVorbisContext {
19     vorbis_info vi ;
20     vorbis_dsp_state vd ;
21     vorbis_block vb ;
22     uint8_t buffer[BUFFER_SIZE];
23     int buffer_index;
24
25     /* decoder */
26     vorbis_comment vc ;
27     ogg_packet op;
28 } OggVorbisContext ;
29
30
31 static int oggvorbis_init_encoder(vorbis_info *vi, AVCodecContext *avccontext) {
32
33     if(avccontext->flags & CODEC_FLAG_QSCALE) {
34         return vorbis_encode_init_vbr(vi, avccontext->channels,
35                 avccontext->sample_rate,
36                 avccontext->global_quality / (float)FF_QP2LAMBDA);
37     }
38 #ifdef OGGVORBIS_VBR_BY_ESTIMATE
39     /* variable bitrate by estimate */
40
41     return (vorbis_encode_setup_managed(vi, avccontext->channels,
42               avccontext->sample_rate, -1, avccontext->bit_rate, -1) ||
43             vorbis_encode_ctl(vi, OV_ECTL_RATEMANAGE_AVG, NULL) ||
44             vorbis_encode_setup_init(vi)) ;
45 #else
46     /* constant bitrate */
47
48     return vorbis_encode_init(vi, avccontext->channels,
49                   avccontext->sample_rate, -1, avccontext->bit_rate, -1) ;
50 #endif
51 }
52
53 static int oggvorbis_encode_init(AVCodecContext *avccontext) {
54     OggVorbisContext *context = avccontext->priv_data ;
55     ogg_packet header, header_comm, header_code;
56     uint8_t *p;
57     unsigned int offset, len;
58
59     vorbis_info_init(&context->vi) ;
60     if(oggvorbis_init_encoder(&context->vi, avccontext) < 0) {
61         av_log(avccontext, AV_LOG_ERROR, "oggvorbis_encode_init: init_encoder failed") ;
62         return -1 ;
63     }
64     vorbis_analysis_init(&context->vd, &context->vi) ;
65     vorbis_block_init(&context->vd, &context->vb) ;
66
67     vorbis_comment_init(&context->vc);
68     vorbis_comment_add_tag(&context->vc, "encoder", LIBAVCODEC_IDENT) ;
69
70     vorbis_analysis_headerout(&context->vd, &context->vc, &header,
71                                 &header_comm, &header_code);
72     
73     len = header.bytes + header_comm.bytes +  header_code.bytes;
74     avccontext->extradata_size= 64 + len + len/255;
75     p = avccontext->extradata= av_mallocz(avccontext->extradata_size);
76     p[0] = 2;
77     offset = 1;
78     offset += av_xiphlacing(&p[offset], header.bytes);
79     offset += av_xiphlacing(&p[offset], header_comm.bytes);
80     memcpy(&p[offset], header.packet, header.bytes);
81     offset += header.bytes;
82     memcpy(&p[offset], header_comm.packet, header_comm.bytes);
83     offset += header_comm.bytes;
84     memcpy(&p[offset], header_code.packet, header_code.bytes);
85     offset += header_code.bytes;
86     avccontext->extradata_size = offset;
87     avccontext->extradata= av_realloc(avccontext->extradata, avccontext->extradata_size);
88                                 
89 /*    vorbis_block_clear(&context->vb);
90     vorbis_dsp_clear(&context->vd);
91     vorbis_info_clear(&context->vi);*/
92     vorbis_comment_clear(&context->vc);
93        
94     avccontext->frame_size = OGGVORBIS_FRAME_SIZE ;
95  
96     avccontext->coded_frame= avcodec_alloc_frame();
97     avccontext->coded_frame->key_frame= 1;
98     
99     return 0 ;
100 }
101
102
103 static int oggvorbis_encode_frame(AVCodecContext *avccontext,
104                                   unsigned char *packets,
105                            int buf_size, void *data)
106 {
107     OggVorbisContext *context = avccontext->priv_data ;
108     float **buffer ;
109     ogg_packet op ;
110     signed short *audio = data ;
111     int l, samples = data ? OGGVORBIS_FRAME_SIZE : 0;
112
113     buffer = vorbis_analysis_buffer(&context->vd, samples) ;
114
115     if(context->vi.channels == 1) {
116         for(l = 0 ; l < samples ; l++)
117             buffer[0][l]=audio[l]/32768.f;
118     } else {
119         for(l = 0 ; l < samples ; l++){
120             buffer[0][l]=audio[l*2]/32768.f;
121             buffer[1][l]=audio[l*2+1]/32768.f;
122         }
123     }
124     
125     vorbis_analysis_wrote(&context->vd, samples) ; 
126
127     while(vorbis_analysis_blockout(&context->vd, &context->vb) == 1) {
128         vorbis_analysis(&context->vb, NULL);
129         vorbis_bitrate_addblock(&context->vb) ;
130
131         while(vorbis_bitrate_flushpacket(&context->vd, &op)) {
132             if(op.bytes==1) //id love to say this is a hack, bad sadly its not, appearently the end of stream decission is in libogg
133                 continue;
134             memcpy(context->buffer + context->buffer_index, &op, sizeof(ogg_packet));
135             context->buffer_index += sizeof(ogg_packet);
136             memcpy(context->buffer + context->buffer_index, op.packet, op.bytes);
137             context->buffer_index += op.bytes;
138 //            av_log(avccontext, AV_LOG_DEBUG, "e%d / %d\n", context->buffer_index, op.bytes);
139         }
140     }
141
142     l=0;
143     if(context->buffer_index){
144         ogg_packet *op2= (ogg_packet*)context->buffer;
145         op2->packet = context->buffer + sizeof(ogg_packet);
146
147         l=  op2->bytes;
148         avccontext->coded_frame->pts= av_rescale_q(op2->granulepos, (AVRational){1, avccontext->sample_rate}, avccontext->time_base);
149         //FIXME we should reorder the user supplied pts and not assume that they are spaced by 1/sample_rate
150
151         memcpy(packets, op2->packet, l);
152         context->buffer_index -= l + sizeof(ogg_packet);
153         memcpy(context->buffer, context->buffer + l + sizeof(ogg_packet), context->buffer_index);
154 //        av_log(avccontext, AV_LOG_DEBUG, "E%d\n", l);
155     }
156
157     return l;
158 }
159
160
161 static int oggvorbis_encode_close(AVCodecContext *avccontext) {
162     OggVorbisContext *context = avccontext->priv_data ;
163 /*  ogg_packet op ; */
164     
165     vorbis_analysis_wrote(&context->vd, 0) ; /* notify vorbisenc this is EOF */
166
167     vorbis_block_clear(&context->vb);
168     vorbis_dsp_clear(&context->vd);
169     vorbis_info_clear(&context->vi);
170
171     av_freep(&avccontext->coded_frame);
172     av_freep(&avccontext->extradata);
173   
174     return 0 ;
175 }
176
177
178 AVCodec oggvorbis_encoder = {
179     "vorbis",
180     CODEC_TYPE_AUDIO,
181     CODEC_ID_VORBIS,
182     sizeof(OggVorbisContext),
183     oggvorbis_encode_init,
184     oggvorbis_encode_frame,
185     oggvorbis_encode_close,
186     .capabilities= CODEC_CAP_DELAY,
187 } ;
188
189 static int oggvorbis_decode_init(AVCodecContext *avccontext) {
190     OggVorbisContext *context = avccontext->priv_data ;
191     uint8_t *p= avccontext->extradata;
192     int i, hsizes[3];
193     unsigned char *headers[3], *extradata = avccontext->extradata;
194
195     vorbis_info_init(&context->vi) ;
196     vorbis_comment_init(&context->vc) ;
197
198     if(! avccontext->extradata_size || ! p) {
199         av_log(avccontext, AV_LOG_ERROR, "vorbis extradata absent\n");
200         return -1;
201     }
202
203     if(p[0] == 0 && p[1] == 30) {
204         for(i = 0; i < 3; i++){
205             hsizes[i] = *p++ << 8;
206             hsizes[i] += *p++;
207             headers[i] = p;
208             p += hsizes[i];
209         }
210     } else if(*p == 2) {
211         unsigned int offset = 1;
212         p++;
213         for(i=0; i<2; i++) {
214             hsizes[i] = 0;
215             while((*p == 0xFF) && (offset < avccontext->extradata_size)) {
216                 hsizes[i] += 0xFF;
217                 offset++;
218                 p++;
219             }
220             if(offset >= avccontext->extradata_size - 1) {
221                 av_log(avccontext, AV_LOG_ERROR,
222                        "vorbis header sizes damaged\n");
223                 return -1;
224             }
225             hsizes[i] += *p;
226             offset++;
227             p++;
228         }
229         hsizes[2] = avccontext->extradata_size - hsizes[0]-hsizes[1]-offset;
230 #if 0
231         av_log(avccontext, AV_LOG_DEBUG,
232                "vorbis header sizes: %d, %d, %d, / extradata_len is %d \n",
233                hsizes[0], hsizes[1], hsizes[2], avccontext->extradata_size);
234 #endif
235         headers[0] = extradata + offset;
236         headers[1] = extradata + offset + hsizes[0];
237         headers[2] = extradata + offset + hsizes[0] + hsizes[1];
238     } else {
239         av_log(avccontext, AV_LOG_ERROR,
240                "vorbis initial header len is wrong: %d\n", *p);
241         return -1;
242     }
243
244     for(i=0; i<3; i++){
245         context->op.b_o_s= i==0;
246         context->op.bytes = hsizes[i];
247         context->op.packet = headers[i];
248         if(vorbis_synthesis_headerin(&context->vi, &context->vc, &context->op)<0){
249             av_log(avccontext, AV_LOG_ERROR, "%d. vorbis header damaged\n", i+1);
250             return -1;
251         }
252     }
253
254     avccontext->channels = context->vi.channels;
255     avccontext->sample_rate = context->vi.rate;
256     avccontext->time_base= (AVRational){1, avccontext->sample_rate};
257
258     vorbis_synthesis_init(&context->vd, &context->vi);
259     vorbis_block_init(&context->vd, &context->vb); 
260
261     return 0 ;
262 }
263
264
265 static inline int conv(int samples, float **pcm, char *buf, int channels) {
266     int i, j, val ;
267     ogg_int16_t *ptr, *data = (ogg_int16_t*)buf ;
268     float *mono ;
269  
270     for(i = 0 ; i < channels ; i++){
271         ptr = &data[i];
272         mono = pcm[i] ;
273         
274         for(j = 0 ; j < samples ; j++) {
275             
276             val = mono[j] * 32767.f;
277             
278             if(val > 32767) val = 32767 ;
279             if(val < -32768) val = -32768 ;
280                     
281             *ptr = val ;
282             ptr += channels;
283         }
284     }
285     
286     return 0 ;
287 }
288            
289         
290 static int oggvorbis_decode_frame(AVCodecContext *avccontext,
291                         void *data, int *data_size,
292                         uint8_t *buf, int buf_size)
293 {
294     OggVorbisContext *context = avccontext->priv_data ;
295     float **pcm ;
296     ogg_packet *op= &context->op;    
297     int samples, total_samples, total_bytes;
298  
299     if(!buf_size){
300     //FIXME flush
301         return 0;
302     }
303     
304     op->packet = buf;
305     op->bytes  = buf_size;
306
307 //    av_log(avccontext, AV_LOG_DEBUG, "%d %d %d %lld %lld %d %d\n", op->bytes, op->b_o_s, op->e_o_s, op->granulepos, op->packetno, buf_size, context->vi.rate);
308     
309 /*    for(i=0; i<op->bytes; i++)
310       av_log(avccontext, AV_LOG_DEBUG, "%02X ", op->packet[i]);
311     av_log(avccontext, AV_LOG_DEBUG, "\n");*/
312
313     if(vorbis_synthesis(&context->vb, op) == 0)
314         vorbis_synthesis_blockin(&context->vd, &context->vb) ;
315     
316     total_samples = 0 ;
317     total_bytes = 0 ;
318
319     while((samples = vorbis_synthesis_pcmout(&context->vd, &pcm)) > 0) {
320         conv(samples, pcm, (char*)data + total_bytes, context->vi.channels) ;
321         total_bytes += samples * 2 * context->vi.channels ;
322         total_samples += samples ;
323         vorbis_synthesis_read(&context->vd, samples) ;
324     }
325
326     *data_size = total_bytes ;   
327     return buf_size ;
328 }
329
330
331 static int oggvorbis_decode_close(AVCodecContext *avccontext) {
332     OggVorbisContext *context = avccontext->priv_data ;
333    
334     vorbis_info_clear(&context->vi) ;
335     vorbis_comment_clear(&context->vc) ;
336
337     return 0 ;
338 }
339
340
341 AVCodec oggvorbis_decoder = {
342     "vorbis",
343     CODEC_TYPE_AUDIO,
344     CODEC_ID_VORBIS,
345     sizeof(OggVorbisContext),
346     oggvorbis_decode_init,
347     NULL,
348     oggvorbis_decode_close,
349     oggvorbis_decode_frame,
350     .capabilities= CODEC_CAP_DELAY,
351 } ;