]> git.sesse.net Git - ffmpeg/blob - libavcodec/libvo-aacenc.c
Merge commit '511cf612ac979f536fd65e14603a87ca5ad435f3'
[ffmpeg] / libavcodec / libvo-aacenc.c
1 /*
2  * AAC encoder wrapper
3  * Copyright (c) 2010 Martin Storsjo
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include <vo-aacenc/voAAC.h>
23 #include <vo-aacenc/cmnMemory.h>
24
25 #include "avcodec.h"
26 #include "audio_frame_queue.h"
27 #include "internal.h"
28 #include "mpeg4audio.h"
29
30 #define FRAME_SIZE 1024
31 #define ENC_DELAY  1600
32
33 typedef struct AACContext {
34     VO_AUDIO_CODECAPI codec_api;
35     VO_HANDLE handle;
36     VO_MEM_OPERATOR mem_operator;
37     VO_CODEC_INIT_USERDATA user_data;
38     VO_PBYTE end_buffer;
39     AudioFrameQueue afq;
40     int last_frame;
41     int last_samples;
42 } AACContext;
43
44
45 static int aac_encode_close(AVCodecContext *avctx)
46 {
47     AACContext *s = avctx->priv_data;
48
49     s->codec_api.Uninit(s->handle);
50 #if FF_API_OLD_ENCODE_AUDIO
51     av_freep(&avctx->coded_frame);
52 #endif
53     av_freep(&avctx->extradata);
54     ff_af_queue_close(&s->afq);
55     av_freep(&s->end_buffer);
56
57     return 0;
58 }
59
60 static av_cold int aac_encode_init(AVCodecContext *avctx)
61 {
62     AACContext *s = avctx->priv_data;
63     AACENC_PARAM params = { 0 };
64     int index, ret;
65
66 #if FF_API_OLD_ENCODE_AUDIO
67     avctx->coded_frame = avcodec_alloc_frame();
68     if (!avctx->coded_frame)
69         return AVERROR(ENOMEM);
70 #endif
71     avctx->frame_size = FRAME_SIZE;
72     avctx->delay      = ENC_DELAY;
73     s->last_frame     = 2;
74     ff_af_queue_init(avctx, &s->afq);
75
76     s->end_buffer = av_mallocz(avctx->frame_size * avctx->channels * 2);
77     if (!s->end_buffer) {
78         ret = AVERROR(ENOMEM);
79         goto error;
80     }
81
82     voGetAACEncAPI(&s->codec_api);
83
84     s->mem_operator.Alloc = cmnMemAlloc;
85     s->mem_operator.Copy = cmnMemCopy;
86     s->mem_operator.Free = cmnMemFree;
87     s->mem_operator.Set = cmnMemSet;
88     s->mem_operator.Check = cmnMemCheck;
89     s->user_data.memflag = VO_IMF_USERMEMOPERATOR;
90     s->user_data.memData = &s->mem_operator;
91     s->codec_api.Init(&s->handle, VO_AUDIO_CodingAAC, &s->user_data);
92
93     params.sampleRate = avctx->sample_rate;
94     params.bitRate    = avctx->bit_rate;
95     params.nChannels  = avctx->channels;
96     params.adtsUsed   = !(avctx->flags & CODEC_FLAG_GLOBAL_HEADER);
97     if (s->codec_api.SetParam(s->handle, VO_PID_AAC_ENCPARAM, &params)
98         != VO_ERR_NONE) {
99         av_log(avctx, AV_LOG_ERROR, "Unable to set encoding parameters\n");
100         ret = AVERROR(EINVAL);
101         goto error;
102     }
103
104     for (index = 0; index < 16; index++)
105         if (avctx->sample_rate == avpriv_mpeg4audio_sample_rates[index])
106             break;
107     if (index == 16) {
108         av_log(avctx, AV_LOG_ERROR, "Unsupported sample rate %d\n",
109                                     avctx->sample_rate);
110         ret = AVERROR(ENOSYS);
111         goto error;
112     }
113     if (avctx->flags & CODEC_FLAG_GLOBAL_HEADER) {
114         avctx->extradata_size = 2;
115         avctx->extradata      = av_mallocz(avctx->extradata_size +
116                                            FF_INPUT_BUFFER_PADDING_SIZE);
117         if (!avctx->extradata) {
118             ret = AVERROR(ENOMEM);
119             goto error;
120         }
121
122         avctx->extradata[0] = 0x02 << 3 | index >> 1;
123         avctx->extradata[1] = (index & 0x01) << 7 | avctx->channels << 3;
124     }
125     return 0;
126 error:
127     aac_encode_close(avctx);
128     return ret;
129 }
130
131 static int aac_encode_frame(AVCodecContext *avctx, AVPacket *avpkt,
132                             const AVFrame *frame, int *got_packet_ptr)
133 {
134     AACContext *s = avctx->priv_data;
135     VO_CODECBUFFER input = { 0 }, output = { 0 };
136     VO_AUDIO_OUTPUTINFO output_info = { { 0 } };
137     VO_PBYTE samples;
138     int ret;
139
140     /* handle end-of-stream small frame and flushing */
141     if (!frame) {
142         if (s->last_frame <= 0)
143             return 0;
144         if (s->last_samples > 0 && s->last_samples < ENC_DELAY - FRAME_SIZE) {
145             s->last_samples = 0;
146             s->last_frame--;
147         }
148         s->last_frame--;
149         memset(s->end_buffer, 0, 2 * avctx->channels * avctx->frame_size);
150         samples = s->end_buffer;
151     } else {
152         if (frame->nb_samples < avctx->frame_size) {
153             s->last_samples = frame->nb_samples;
154             memcpy(s->end_buffer, frame->data[0], 2 * avctx->channels * frame->nb_samples);
155             samples = s->end_buffer;
156         } else {
157             samples = (VO_PBYTE)frame->data[0];
158         }
159         /* add current frame to the queue */
160         if ((ret = ff_af_queue_add(&s->afq, frame) < 0))
161             return ret;
162     }
163
164     if ((ret = ff_alloc_packet2(avctx, avpkt, FFMAX(8192, 768 * avctx->channels))))
165         return ret;
166
167     input.Buffer  = samples;
168     input.Length  = 2 * avctx->channels * avctx->frame_size;
169     output.Buffer = avpkt->data;
170     output.Length = avpkt->size;
171
172     s->codec_api.SetInputData(s->handle, &input);
173     if (s->codec_api.GetOutputData(s->handle, &output, &output_info)
174         != VO_ERR_NONE) {
175         av_log(avctx, AV_LOG_ERROR, "Unable to encode frame\n");
176         return AVERROR(EINVAL);
177     }
178
179     /* Get the next frame pts/duration */
180     ff_af_queue_remove(&s->afq, avctx->frame_size, &avpkt->pts,
181                        &avpkt->duration);
182
183     avpkt->size = output.Length;
184     *got_packet_ptr = 1;
185     return 0;
186 }
187
188 /* duplicated from avpriv_mpeg4audio_sample_rates to avoid shared build
189  * failures */
190 static const int mpeg4audio_sample_rates[16] = {
191     96000, 88200, 64000, 48000, 44100, 32000,
192     24000, 22050, 16000, 12000, 11025, 8000, 7350
193 };
194
195 AVCodec ff_libvo_aacenc_encoder = {
196     .name           = "libvo_aacenc",
197     .type           = AVMEDIA_TYPE_AUDIO,
198     .id             = AV_CODEC_ID_AAC,
199     .priv_data_size = sizeof(AACContext),
200     .init           = aac_encode_init,
201     .encode2        = aac_encode_frame,
202     .close          = aac_encode_close,
203     .supported_samplerates = mpeg4audio_sample_rates,
204     .capabilities   = CODEC_CAP_SMALL_LAST_FRAME | CODEC_CAP_DELAY,
205     .sample_fmts    = (const enum AVSampleFormat[]){ AV_SAMPLE_FMT_S16,
206                                                      AV_SAMPLE_FMT_NONE },
207     .long_name      = NULL_IF_CONFIG_SMALL("Android VisualOn AAC (Advanced Audio Coding)"),
208 };