]> git.sesse.net Git - ffmpeg/blob - libavcodec/qsvenc.c
lavc: add Intel libmfx-based HEVC encoder
[ffmpeg] / libavcodec / qsvenc.c
1 /*
2  * Intel MediaSDK QSV encoder utility functions
3  *
4  * copyright (c) 2013 Yukinori Yamazoe
5  * copyright (c) 2015 Anton Khirnov
6  *
7  * This file is part of Libav.
8  *
9  * Libav is free software; you can redistribute it and/or
10  * modify it under the terms of the GNU Lesser General Public
11  * License as published by the Free Software Foundation; either
12  * version 2.1 of the License, or (at your option) any later version.
13  *
14  * Libav is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
17  * Lesser General Public License for more details.
18  *
19  * You should have received a copy of the GNU Lesser General Public
20  * License along with Libav; if not, write to the Free Software
21  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
22  */
23
24 #include <string.h>
25 #include <sys/types.h>
26 #include <mfx/mfxvideo.h>
27
28 #include "libavutil/common.h"
29 #include "libavutil/mem.h"
30 #include "libavutil/log.h"
31 #include "libavutil/time.h"
32 #include "libavutil/imgutils.h"
33
34 #include "avcodec.h"
35 #include "internal.h"
36 #include "qsv.h"
37 #include "qsv_internal.h"
38 #include "qsvenc.h"
39
40 static int init_video_param(AVCodecContext *avctx, QSVEncContext *q)
41 {
42     const char *ratecontrol_desc;
43
44     float quant;
45     int ret;
46
47     ret = ff_qsv_codec_id_to_mfx(avctx->codec_id);
48     if (ret < 0)
49         return AVERROR_BUG;
50     q->param.mfx.CodecId = ret;
51
52     q->width_align = avctx->codec_id == AV_CODEC_ID_HEVC ? 32 : 16;
53
54     if (avctx->level > 0)
55         q->param.mfx.CodecLevel = avctx->level;
56
57     q->param.mfx.CodecProfile       = q->profile;
58     q->param.mfx.TargetUsage        = q->preset;
59     q->param.mfx.GopPicSize         = FFMAX(0, avctx->gop_size);
60     q->param.mfx.GopRefDist         = FFMAX(-1, avctx->max_b_frames) + 1;
61     q->param.mfx.GopOptFlag         = avctx->flags & CODEC_FLAG_CLOSED_GOP ?
62                                       MFX_GOP_CLOSED : 0;
63     q->param.mfx.IdrInterval        = q->idr_interval;
64     q->param.mfx.NumSlice           = avctx->slices;
65     q->param.mfx.NumRefFrame        = FFMAX(0, avctx->refs);
66     q->param.mfx.EncodedOrder       = 0;
67     q->param.mfx.BufferSizeInKB     = 0;
68
69     q->param.mfx.FrameInfo.FourCC         = MFX_FOURCC_NV12;
70     q->param.mfx.FrameInfo.Width          = FFALIGN(avctx->width, q->width_align);
71     q->param.mfx.FrameInfo.Height         = FFALIGN(avctx->height, 32);
72     q->param.mfx.FrameInfo.CropX          = 0;
73     q->param.mfx.FrameInfo.CropY          = 0;
74     q->param.mfx.FrameInfo.CropW          = avctx->width;
75     q->param.mfx.FrameInfo.CropH          = avctx->height;
76     q->param.mfx.FrameInfo.AspectRatioW   = avctx->sample_aspect_ratio.num;
77     q->param.mfx.FrameInfo.AspectRatioH   = avctx->sample_aspect_ratio.den;
78     q->param.mfx.FrameInfo.PicStruct      = MFX_PICSTRUCT_PROGRESSIVE;
79     q->param.mfx.FrameInfo.ChromaFormat   = MFX_CHROMAFORMAT_YUV420;
80     q->param.mfx.FrameInfo.BitDepthLuma   = 8;
81     q->param.mfx.FrameInfo.BitDepthChroma = 8;
82
83     if (avctx->framerate.den > 0 && avctx->framerate.num > 0) {
84         q->param.mfx.FrameInfo.FrameRateExtN = avctx->framerate.num;
85         q->param.mfx.FrameInfo.FrameRateExtD = avctx->framerate.den;
86     } else {
87         q->param.mfx.FrameInfo.FrameRateExtN  = avctx->time_base.den;
88         q->param.mfx.FrameInfo.FrameRateExtD  = avctx->time_base.num;
89     }
90
91     if (avctx->flags & CODEC_FLAG_QSCALE) {
92         q->param.mfx.RateControlMethod = MFX_RATECONTROL_CQP;
93         ratecontrol_desc = "constant quantization parameter (CQP)";
94     } else if (avctx->rc_max_rate == avctx->bit_rate) {
95         q->param.mfx.RateControlMethod = MFX_RATECONTROL_CBR;
96         ratecontrol_desc = "constant bitrate (CBR)";
97     } else if (!avctx->rc_max_rate) {
98         q->param.mfx.RateControlMethod = MFX_RATECONTROL_AVBR;
99         ratecontrol_desc = "average variable bitrate (AVBR)";
100     } else {
101         q->param.mfx.RateControlMethod = MFX_RATECONTROL_VBR;
102         ratecontrol_desc = "variable bitrate (VBR)";
103     }
104
105     av_log(avctx, AV_LOG_VERBOSE, "Using the %s ratecontrol method\n", ratecontrol_desc);
106
107     switch (q->param.mfx.RateControlMethod) {
108     case MFX_RATECONTROL_CBR:
109     case MFX_RATECONTROL_VBR:
110         q->param.mfx.InitialDelayInKB = avctx->rc_initial_buffer_occupancy / 1000;
111         q->param.mfx.TargetKbps       = avctx->bit_rate / 1000;
112         q->param.mfx.MaxKbps          = avctx->bit_rate / 1000;
113         break;
114     case MFX_RATECONTROL_CQP:
115         quant = avctx->global_quality / FF_QP2LAMBDA;
116
117         q->param.mfx.QPI = av_clip(quant * fabs(avctx->i_quant_factor) + avctx->i_quant_offset, 0, 51);
118         q->param.mfx.QPP = av_clip(quant, 0, 51);
119         q->param.mfx.QPB = av_clip(quant * fabs(avctx->b_quant_factor) + avctx->b_quant_offset, 0, 51);
120
121         break;
122     case MFX_RATECONTROL_AVBR:
123         q->param.mfx.TargetKbps  = avctx->bit_rate / 1000;
124         q->param.mfx.Convergence = q->avbr_convergence;
125         q->param.mfx.Accuracy    = q->avbr_accuracy;
126         break;
127     }
128
129     // the HEVC encoder plugin currently fails if coding options
130     // are provided
131     if (avctx->codec_id != AV_CODEC_ID_HEVC) {
132         q->extco.Header.BufferId      = MFX_EXTBUFF_CODING_OPTION;
133         q->extco.Header.BufferSz      = sizeof(q->extco);
134         q->extco.CAVLC                = avctx->coder_type == FF_CODER_TYPE_VLC ?
135                                         MFX_CODINGOPTION_ON : MFX_CODINGOPTION_UNKNOWN;
136
137         q->extparam[0] = (mfxExtBuffer *)&q->extco;
138
139         q->param.ExtParam    = q->extparam;
140         q->param.NumExtParam = FF_ARRAY_ELEMS(q->extparam);
141     }
142
143     return 0;
144 }
145
146 static int qsv_retrieve_enc_params(AVCodecContext *avctx, QSVEncContext *q)
147 {
148     uint8_t sps_buf[128];
149     uint8_t pps_buf[128];
150
151     mfxExtCodingOptionSPSPPS extradata = {
152         .Header.BufferId = MFX_EXTBUFF_CODING_OPTION_SPSPPS,
153         .Header.BufferSz = sizeof(extradata),
154         .SPSBuffer = sps_buf, .SPSBufSize = sizeof(sps_buf),
155         .PPSBuffer = pps_buf, .PPSBufSize = sizeof(pps_buf)
156     };
157
158     mfxExtBuffer *ext_buffers[] = {
159         (mfxExtBuffer*)&extradata,
160     };
161
162     int need_pps = avctx->codec_id != AV_CODEC_ID_MPEG2VIDEO;
163     int ret;
164
165     q->param.ExtParam    = ext_buffers;
166     q->param.NumExtParam = FF_ARRAY_ELEMS(ext_buffers);
167
168     ret = MFXVideoENCODE_GetVideoParam(q->session, &q->param);
169     if (ret < 0)
170         return ff_qsv_error(ret);
171
172     q->packet_size = q->param.mfx.BufferSizeInKB * 1000;
173
174     if (!extradata.SPSBufSize || (need_pps && !extradata.PPSBufSize)) {
175         av_log(avctx, AV_LOG_ERROR, "No extradata returned from libmfx.\n");
176         return AVERROR_UNKNOWN;
177     }
178
179     avctx->extradata = av_malloc(extradata.SPSBufSize + need_pps * extradata.PPSBufSize +
180                                  FF_INPUT_BUFFER_PADDING_SIZE);
181     if (!avctx->extradata)
182         return AVERROR(ENOMEM);
183
184     memcpy(avctx->extradata,                        sps_buf, extradata.SPSBufSize);
185     if (need_pps)
186         memcpy(avctx->extradata + extradata.SPSBufSize, pps_buf, extradata.PPSBufSize);
187     avctx->extradata_size = extradata.SPSBufSize + need_pps * extradata.PPSBufSize;
188     memset(avctx->extradata + avctx->extradata_size, 0, FF_INPUT_BUFFER_PADDING_SIZE);
189
190     return 0;
191 }
192
193 int ff_qsv_enc_init(AVCodecContext *avctx, QSVEncContext *q)
194 {
195     int ret;
196
197     q->param.IOPattern  = MFX_IOPATTERN_IN_SYSTEM_MEMORY;
198     q->param.AsyncDepth = q->async_depth;
199
200     if (avctx->hwaccel_context) {
201         AVQSVContext *qsv = avctx->hwaccel_context;
202
203         q->session         = qsv->session;
204         q->param.IOPattern = qsv->iopattern;
205     }
206
207     if (!q->session) {
208         ret = ff_qsv_init_internal_session(avctx, &q->internal_session,
209                                            q->load_plugins);
210         if (ret < 0)
211             return ret;
212
213         q->session = q->internal_session;
214     }
215
216     ret = init_video_param(avctx, q);
217     if (ret < 0)
218         return ret;
219
220     ret = MFXVideoENCODE_QueryIOSurf(q->session, &q->param, &q->req);
221     if (ret < 0) {
222         av_log(avctx, AV_LOG_ERROR, "Error querying the encoding parameters\n");
223         return ff_qsv_error(ret);
224     }
225
226     ret = MFXVideoENCODE_Init(q->session, &q->param);
227     if (ret < 0) {
228         av_log(avctx, AV_LOG_ERROR, "Error initializing the encoder\n");
229         return ff_qsv_error(ret);
230     }
231
232     ret = qsv_retrieve_enc_params(avctx, q);
233     if (ret < 0) {
234         av_log(avctx, AV_LOG_ERROR, "Error retrieving encoding parameters.\n");
235         return ret;
236     }
237
238     avctx->coded_frame = av_frame_alloc();
239     if (!avctx->coded_frame)
240         return AVERROR(ENOMEM);
241
242     q->avctx = avctx;
243
244     return 0;
245 }
246
247 static void clear_unused_frames(QSVEncContext *q)
248 {
249     QSVFrame *cur = q->work_frames;
250     while (cur) {
251         if (cur->surface && !cur->surface->Data.Locked) {
252             cur->surface = NULL;
253             av_frame_unref(cur->frame);
254         }
255         cur = cur->next;
256     }
257 }
258
259 static int get_free_frame(QSVEncContext *q, QSVFrame **f)
260 {
261     QSVFrame *frame, **last;
262
263     clear_unused_frames(q);
264
265     frame = q->work_frames;
266     last  = &q->work_frames;
267     while (frame) {
268         if (!frame->surface) {
269             *f = frame;
270             return 0;
271         }
272
273         last  = &frame->next;
274         frame = frame->next;
275     }
276
277     frame = av_mallocz(sizeof(*frame));
278     if (!frame)
279         return AVERROR(ENOMEM);
280     frame->frame = av_frame_alloc();
281     if (!frame->frame) {
282         av_freep(&frame);
283         return AVERROR(ENOMEM);
284     }
285     *last = frame;
286
287     *f = frame;
288
289     return 0;
290 }
291
292 static int submit_frame(QSVEncContext *q, const AVFrame *frame,
293                         mfxFrameSurface1 **surface)
294 {
295     QSVFrame *qf;
296     int ret;
297
298     ret = get_free_frame(q, &qf);
299     if (ret < 0)
300         return ret;
301
302     if (frame->format == AV_PIX_FMT_QSV) {
303         ret = av_frame_ref(qf->frame, frame);
304         if (ret < 0)
305             return ret;
306
307         qf->surface = (mfxFrameSurface1*)qf->frame->data[3];
308         *surface = qf->surface;
309         return 0;
310     }
311
312     /* make a copy if the input is not padded as libmfx requires */
313     if (frame->height & 31 || frame->linesize[0] & (q->width_align - 1)) {
314         qf->frame->height = FFALIGN(frame->height, 32);
315         qf->frame->width  = FFALIGN(frame->width, q->width_align);
316
317         ret = ff_get_buffer(q->avctx, qf->frame, AV_GET_BUFFER_FLAG_REF);
318         if (ret < 0)
319             return ret;
320
321         qf->frame->height = frame->height;
322         qf->frame->width  = frame->width;
323         ret = av_frame_copy(qf->frame, frame);
324         if (ret < 0) {
325             av_frame_unref(qf->frame);
326             return ret;
327         }
328     } else {
329         ret = av_frame_ref(qf->frame, frame);
330         if (ret < 0)
331             return ret;
332     }
333
334     qf->surface_internal.Info = q->param.mfx.FrameInfo;
335
336     qf->surface_internal.Info.PicStruct =
337         !frame->interlaced_frame ? MFX_PICSTRUCT_PROGRESSIVE :
338         frame->top_field_first   ? MFX_PICSTRUCT_FIELD_TFF :
339                                    MFX_PICSTRUCT_FIELD_BFF;
340     if (frame->repeat_pict == 1)
341         qf->surface_internal.Info.PicStruct |= MFX_PICSTRUCT_FIELD_REPEATED;
342     else if (frame->repeat_pict == 2)
343         qf->surface_internal.Info.PicStruct |= MFX_PICSTRUCT_FRAME_DOUBLING;
344     else if (frame->repeat_pict == 4)
345         qf->surface_internal.Info.PicStruct |= MFX_PICSTRUCT_FRAME_TRIPLING;
346
347     qf->surface_internal.Data.PitchLow  = qf->frame->linesize[0];
348     qf->surface_internal.Data.Y         = qf->frame->data[0];
349     qf->surface_internal.Data.UV        = qf->frame->data[1];
350     qf->surface_internal.Data.TimeStamp = av_rescale_q(frame->pts, q->avctx->time_base, (AVRational){1, 90000});
351
352     qf->surface = &qf->surface_internal;
353
354     *surface = qf->surface;
355
356     return 0;
357 }
358
359 static void print_interlace_msg(AVCodecContext *avctx, QSVEncContext *q)
360 {
361     if (q->param.mfx.CodecId == MFX_CODEC_AVC) {
362         if (q->param.mfx.CodecProfile == MFX_PROFILE_AVC_BASELINE ||
363             q->param.mfx.CodecLevel < MFX_LEVEL_AVC_21 ||
364             q->param.mfx.CodecLevel > MFX_LEVEL_AVC_41)
365             av_log(avctx, AV_LOG_WARNING,
366                    "Interlaced coding is supported"
367                    " at Main/High Profile Level 2.1-4.1\n");
368     }
369 }
370
371 int ff_qsv_encode(AVCodecContext *avctx, QSVEncContext *q,
372                   AVPacket *pkt, const AVFrame *frame, int *got_packet)
373 {
374     mfxBitstream bs = { { { 0 } } };
375
376     mfxFrameSurface1 *surf = NULL;
377     mfxSyncPoint sync      = NULL;
378     int ret;
379
380     if (frame) {
381         ret = submit_frame(q, frame, &surf);
382         if (ret < 0) {
383             av_log(avctx, AV_LOG_ERROR, "Error submitting the frame for encoding.\n");
384             return ret;
385         }
386     }
387
388     ret = ff_alloc_packet(pkt, q->packet_size);
389     if (ret < 0) {
390         av_log(avctx, AV_LOG_ERROR, "Error allocating the output packet\n");
391         return ret;
392     }
393     bs.Data      = pkt->data;
394     bs.MaxLength = pkt->size;
395
396     do {
397         ret = MFXVideoENCODE_EncodeFrameAsync(q->session, NULL, surf, &bs, &sync);
398         if (ret == MFX_WRN_DEVICE_BUSY)
399             av_usleep(1);
400     } while (ret > 0);
401
402     if (ret < 0)
403         return (ret == MFX_ERR_MORE_DATA) ? 0 : ff_qsv_error(ret);
404
405     if (ret == MFX_WRN_INCOMPATIBLE_VIDEO_PARAM && frame->interlaced_frame)
406         print_interlace_msg(avctx, q);
407
408     if (sync) {
409         MFXVideoCORE_SyncOperation(q->session, sync, 60000);
410
411         if (bs.FrameType & MFX_FRAMETYPE_I || bs.FrameType & MFX_FRAMETYPE_xI)
412             avctx->coded_frame->pict_type = AV_PICTURE_TYPE_I;
413         else if (bs.FrameType & MFX_FRAMETYPE_P || bs.FrameType & MFX_FRAMETYPE_xP)
414             avctx->coded_frame->pict_type = AV_PICTURE_TYPE_P;
415         else if (bs.FrameType & MFX_FRAMETYPE_B || bs.FrameType & MFX_FRAMETYPE_xB)
416             avctx->coded_frame->pict_type = AV_PICTURE_TYPE_B;
417
418         pkt->dts  = av_rescale_q(bs.DecodeTimeStamp, (AVRational){1, 90000}, avctx->time_base);
419         pkt->pts  = av_rescale_q(bs.TimeStamp,       (AVRational){1, 90000}, avctx->time_base);
420         pkt->size = bs.DataLength;
421
422         if (bs.FrameType & MFX_FRAMETYPE_IDR ||
423             bs.FrameType & MFX_FRAMETYPE_xIDR)
424             pkt->flags |= AV_PKT_FLAG_KEY;
425
426         *got_packet = 1;
427     }
428
429     return 0;
430 }
431
432 int ff_qsv_enc_close(AVCodecContext *avctx, QSVEncContext *q)
433 {
434     QSVFrame *cur;
435
436     MFXVideoENCODE_Close(q->session);
437     if (q->internal_session)
438         MFXClose(q->internal_session);
439     q->session          = NULL;
440     q->internal_session = NULL;
441
442     cur = q->work_frames;
443     while (cur) {
444         q->work_frames = cur->next;
445         av_frame_free(&cur->frame);
446         av_freep(&cur);
447         cur = q->work_frames;
448     }
449
450     av_frame_free(&avctx->coded_frame);
451
452     return 0;
453 }