]> git.sesse.net Git - ffmpeg/blob - libavcodec/oggvorbis.c
c762e4c28d377073a7541b02aa0393b3513e1f93
[ffmpeg] / libavcodec / oggvorbis.c
1 /**
2  * @file oggvorbis.c
3  * Ogg Vorbis codec support via libvorbisenc.
4  * @author Mark Hills <mark@pogo.org.uk>
5  */
6
7 #include <vorbis/vorbisenc.h>
8
9 #include "avcodec.h"
10
11 #undef NDEBUG
12 #include <assert.h>
13
14 #define OGGVORBIS_FRAME_SIZE 64
15
16 #define BUFFER_SIZE (1024*64)
17
18 typedef struct OggVorbisContext {
19     vorbis_info vi ;
20     vorbis_dsp_state vd ;
21     vorbis_block vb ;
22     uint8_t buffer[BUFFER_SIZE];
23     int buffer_index;
24
25     /* decoder */
26     vorbis_comment vc ;
27     ogg_packet op;
28 } OggVorbisContext ;
29
30
31 static int oggvorbis_init_encoder(vorbis_info *vi, AVCodecContext *avccontext) {
32
33     if(avccontext->flags & CODEC_FLAG_QSCALE) {
34         return vorbis_encode_init_vbr(vi, avccontext->channels,
35                 avccontext->sample_rate,
36                 avccontext->global_quality / (float)FF_QP2LAMBDA);
37     }
38 #ifdef OGGVORBIS_VBR_BY_ESTIMATE
39     /* variable bitrate by estimate */
40
41     return (vorbis_encode_setup_managed(vi, avccontext->channels,
42               avccontext->sample_rate, -1, avccontext->bit_rate, -1) ||
43             vorbis_encode_ctl(vi, OV_ECTL_RATEMANAGE_AVG, NULL) ||
44             vorbis_encode_setup_init(vi)) ;
45 #else
46     /* constant bitrate */
47
48     return vorbis_encode_init(vi, avccontext->channels,
49                   avccontext->sample_rate, -1, avccontext->bit_rate, -1) ;
50 #endif
51 }
52
53 static int oggvorbis_encode_init(AVCodecContext *avccontext) {
54     OggVorbisContext *context = avccontext->priv_data ;
55     ogg_packet header, header_comm, header_code;
56     uint8_t *p;
57     unsigned int offset, len;
58
59     vorbis_info_init(&context->vi) ;
60     if(oggvorbis_init_encoder(&context->vi, avccontext) < 0) {
61         av_log(avccontext, AV_LOG_ERROR, "oggvorbis_encode_init: init_encoder failed") ;
62         return -1 ;
63     }
64     vorbis_analysis_init(&context->vd, &context->vi) ;
65     vorbis_block_init(&context->vd, &context->vb) ;
66
67     vorbis_comment_init(&context->vc);
68     vorbis_comment_add_tag(&context->vc, "encoder", LIBAVCODEC_IDENT) ;
69
70     vorbis_analysis_headerout(&context->vd, &context->vc, &header,
71                                 &header_comm, &header_code);
72     
73     len = header.bytes + header_comm.bytes +  header_code.bytes;
74     avccontext->extradata_size= 64 + len + len/255;
75     p = avccontext->extradata= av_mallocz(avccontext->extradata_size);
76     p[0] = 2;
77     offset = 1;
78     offset += av_xiphlacing(&p[offset], header.bytes);
79     offset += av_xiphlacing(&p[offset], header_comm.bytes);
80     memcpy(&p[offset], header.packet, header.bytes);
81     offset += header.bytes;
82     memcpy(&p[offset], header_comm.packet, header_comm.bytes);
83     offset += header_comm.bytes;
84     memcpy(&p[offset], header_code.packet, header_code.bytes);
85     offset += header_code.bytes;
86     avccontext->extradata_size = offset;
87     avccontext->extradata= av_realloc(avccontext->extradata, avccontext->extradata_size);
88                                 
89 /*    vorbis_block_clear(&context->vb);
90     vorbis_dsp_clear(&context->vd);
91     vorbis_info_clear(&context->vi);*/
92     vorbis_comment_clear(&context->vc);
93        
94     avccontext->frame_size = OGGVORBIS_FRAME_SIZE ;
95     avccontext->time_base.den = avccontext->sample_rate;
96     avccontext->time_base.num = 1;
97  
98     avccontext->coded_frame= avcodec_alloc_frame();
99     avccontext->coded_frame->key_frame= 1;
100     
101     return 0 ;
102 }
103
104
105 static int oggvorbis_encode_frame(AVCodecContext *avccontext,
106                                   unsigned char *packets,
107                            int buf_size, void *data)
108 {
109     OggVorbisContext *context = avccontext->priv_data ;
110     float **buffer ;
111     ogg_packet op ;
112     signed short *audio = data ;
113     int l, samples = data ? OGGVORBIS_FRAME_SIZE : 0;
114
115     buffer = vorbis_analysis_buffer(&context->vd, samples) ;
116
117     if(context->vi.channels == 1) {
118         for(l = 0 ; l < samples ; l++)
119             buffer[0][l]=audio[l]/32768.f;
120     } else {
121         for(l = 0 ; l < samples ; l++){
122             buffer[0][l]=audio[l*2]/32768.f;
123             buffer[1][l]=audio[l*2+1]/32768.f;
124         }
125     }
126     
127     vorbis_analysis_wrote(&context->vd, samples) ; 
128
129     while(vorbis_analysis_blockout(&context->vd, &context->vb) == 1) {
130         vorbis_analysis(&context->vb, NULL);
131         vorbis_bitrate_addblock(&context->vb) ;
132
133         while(vorbis_bitrate_flushpacket(&context->vd, &op)) {
134             if(op.bytes==1) //id love to say this is a hack, bad sadly its not, appearently the end of stream decission is in libogg
135                 continue;
136             memcpy(context->buffer + context->buffer_index, &op, sizeof(ogg_packet));
137             context->buffer_index += sizeof(ogg_packet);
138             memcpy(context->buffer + context->buffer_index, op.packet, op.bytes);
139             context->buffer_index += op.bytes;
140 //            av_log(avccontext, AV_LOG_DEBUG, "e%d / %d\n", context->buffer_index, op.bytes);
141         }
142     }
143
144     l=0;
145     if(context->buffer_index){
146         ogg_packet *op2= (ogg_packet*)context->buffer;
147         op2->packet = context->buffer + sizeof(ogg_packet);
148
149         l=  op2->bytes;
150         avccontext->coded_frame->pts= op2->granulepos;
151
152         memcpy(packets, op2->packet, l);
153         context->buffer_index -= l + sizeof(ogg_packet);
154         memcpy(context->buffer, context->buffer + l + sizeof(ogg_packet), context->buffer_index);
155 //        av_log(avccontext, AV_LOG_DEBUG, "E%d\n", l);
156     }
157
158     return l;
159 }
160
161
162 static int oggvorbis_encode_close(AVCodecContext *avccontext) {
163     OggVorbisContext *context = avccontext->priv_data ;
164 /*  ogg_packet op ; */
165     
166     vorbis_analysis_wrote(&context->vd, 0) ; /* notify vorbisenc this is EOF */
167
168     vorbis_block_clear(&context->vb);
169     vorbis_dsp_clear(&context->vd);
170     vorbis_info_clear(&context->vi);
171
172     av_freep(&avccontext->coded_frame);
173     av_freep(&avccontext->extradata);
174   
175     return 0 ;
176 }
177
178
179 AVCodec oggvorbis_encoder = {
180     "vorbis",
181     CODEC_TYPE_AUDIO,
182     CODEC_ID_VORBIS,
183     sizeof(OggVorbisContext),
184     oggvorbis_encode_init,
185     oggvorbis_encode_frame,
186     oggvorbis_encode_close,
187     .capabilities= CODEC_CAP_DELAY,
188 } ;
189
190 static int oggvorbis_decode_init(AVCodecContext *avccontext) {
191     OggVorbisContext *context = avccontext->priv_data ;
192     uint8_t *p= avccontext->extradata;
193     int i, hsizes[3];
194     unsigned char *headers[3], *extradata = avccontext->extradata;
195
196     vorbis_info_init(&context->vi) ;
197     vorbis_comment_init(&context->vc) ;
198
199     if(! avccontext->extradata_size || ! p) {
200         av_log(avccontext, AV_LOG_ERROR, "vorbis extradata absent\n");
201         return -1;
202     }
203
204     if(p[0] == 0 && p[1] == 30) {
205         for(i = 0; i < 3; i++){
206             hsizes[i] = *p++ << 8;
207             hsizes[i] += *p++;
208             headers[i] = p;
209             p += hsizes[i];
210         }
211     } else if(*p == 2) {
212         unsigned int offset = 1;
213         p++;
214         for(i=0; i<2; i++) {
215             hsizes[i] = 0;
216             while((*p == 0xFF) && (offset < avccontext->extradata_size)) {
217                 hsizes[i] += 0xFF;
218                 offset++;
219                 p++;
220             }
221             if(offset >= avccontext->extradata_size - 1) {
222                 av_log(avccontext, AV_LOG_ERROR,
223                        "vorbis header sizes damaged\n");
224                 return -1;
225             }
226             hsizes[i] += *p;
227             offset++;
228             p++;
229         }
230         hsizes[2] = avccontext->extradata_size - hsizes[0]-hsizes[1]-offset;
231 #if 0
232         av_log(avccontext, AV_LOG_DEBUG,
233                "vorbis header sizes: %d, %d, %d, / extradata_len is %d \n",
234                hsizes[0], hsizes[1], hsizes[2], avccontext->extradata_size);
235 #endif
236         headers[0] = extradata + offset;
237         headers[1] = extradata + offset + hsizes[0];
238         headers[2] = extradata + offset + hsizes[0] + hsizes[1];
239     } else {
240         av_log(avccontext, AV_LOG_ERROR,
241                "vorbis initial header len is wrong: %d\n", *p);
242         return -1;
243     }
244
245     for(i=0; i<3; i++){
246         context->op.b_o_s= i==0;
247         context->op.bytes = hsizes[i];
248         context->op.packet = headers[i];
249         if(vorbis_synthesis_headerin(&context->vi, &context->vc, &context->op)<0){
250             av_log(avccontext, AV_LOG_ERROR, "%d. vorbis header damaged\n", i+1);
251             return -1;
252         }
253     }
254
255     avccontext->channels = context->vi.channels;
256     avccontext->sample_rate = context->vi.rate;
257     avccontext->time_base= (AVRational){1, avccontext->sample_rate};
258
259     vorbis_synthesis_init(&context->vd, &context->vi);
260     vorbis_block_init(&context->vd, &context->vb); 
261
262     return 0 ;
263 }
264
265
266 static inline int conv(int samples, float **pcm, char *buf, int channels) {
267     int i, j, val ;
268     ogg_int16_t *ptr, *data = (ogg_int16_t*)buf ;
269     float *mono ;
270  
271     for(i = 0 ; i < channels ; i++){
272         ptr = &data[i];
273         mono = pcm[i] ;
274         
275         for(j = 0 ; j < samples ; j++) {
276             
277             val = mono[j] * 32767.f;
278             
279             if(val > 32767) val = 32767 ;
280             if(val < -32768) val = -32768 ;
281                     
282             *ptr = val ;
283             ptr += channels;
284         }
285     }
286     
287     return 0 ;
288 }
289            
290         
291 static int oggvorbis_decode_frame(AVCodecContext *avccontext,
292                         void *data, int *data_size,
293                         uint8_t *buf, int buf_size)
294 {
295     OggVorbisContext *context = avccontext->priv_data ;
296     float **pcm ;
297     ogg_packet *op= &context->op;    
298     int samples, total_samples, total_bytes,i;
299  
300     if(!buf_size){
301     //FIXME flush
302         return 0;
303     }
304     
305     op->packet = buf;
306     op->bytes  = buf_size;
307
308 //    av_log(avccontext, AV_LOG_DEBUG, "%d %d %d %lld %lld %d %d\n", op->bytes, op->b_o_s, op->e_o_s, op->granulepos, op->packetno, buf_size, context->vi.rate);
309     
310 /*    for(i=0; i<op->bytes; i++)
311       av_log(avccontext, AV_LOG_DEBUG, "%02X ", op->packet[i]);
312     av_log(avccontext, AV_LOG_DEBUG, "\n");*/
313
314     if(vorbis_synthesis(&context->vb, op) == 0)
315         vorbis_synthesis_blockin(&context->vd, &context->vb) ;
316     
317     total_samples = 0 ;
318     total_bytes = 0 ;
319
320     while((samples = vorbis_synthesis_pcmout(&context->vd, &pcm)) > 0) {
321         conv(samples, pcm, (char*)data + total_bytes, context->vi.channels) ;
322         total_bytes += samples * 2 * context->vi.channels ;
323         total_samples += samples ;
324         vorbis_synthesis_read(&context->vd, samples) ;
325     }
326
327     *data_size = total_bytes ;   
328     return buf_size ;
329 }
330
331
332 static int oggvorbis_decode_close(AVCodecContext *avccontext) {
333     OggVorbisContext *context = avccontext->priv_data ;
334    
335     vorbis_info_clear(&context->vi) ;
336     vorbis_comment_clear(&context->vc) ;
337
338     return 0 ;
339 }
340
341
342 AVCodec oggvorbis_decoder = {
343     "vorbis",
344     CODEC_TYPE_AUDIO,
345     CODEC_ID_VORBIS,
346     sizeof(OggVorbisContext),
347     oggvorbis_decode_init,
348     NULL,
349     oggvorbis_decode_close,
350     oggvorbis_decode_frame,
351     .capabilities= CODEC_CAP_DELAY,
352 } ;