]> git.sesse.net Git - ffmpeg/blob - libavcodec/qsvenc.h
qsv: adding Multi Frame Encode support
[ffmpeg] / libavcodec / qsvenc.h
1 /*
2  * Intel MediaSDK QSV encoder utility functions
3  *
4  * copyright (c) 2013 Yukinori Yamazoe
5  *
6  * This file is part of Libav.
7  *
8  * Libav is free software; you can redistribute it and/or
9  * modify it under the terms of the GNU Lesser General Public
10  * License as published by the Free Software Foundation; either
11  * version 2.1 of the License, or (at your option) any later version.
12  *
13  * Libav is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16  * Lesser General Public License for more details.
17  *
18  * You should have received a copy of the GNU Lesser General Public
19  * License along with Libav; if not, write to the Free Software
20  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
21  */
22
23 #ifndef AVCODEC_QSVENC_H
24 #define AVCODEC_QSVENC_H
25
26 #include <stdint.h>
27 #include <sys/types.h>
28
29 #include <mfx/mfxvideo.h>
30
31 #include "libavutil/avutil.h"
32 #include "libavutil/fifo.h"
33
34 #include "avcodec.h"
35 #include "qsv_internal.h"
36
37 #define QSV_HAVE_CO2 QSV_VERSION_ATLEAST(1, 6)
38 #define QSV_HAVE_CO3 QSV_VERSION_ATLEAST(1, 11)
39
40 #define QSV_HAVE_TRELLIS QSV_VERSION_ATLEAST(1, 8)
41 #define QSV_HAVE_MAX_SLICE_SIZE QSV_VERSION_ATLEAST(1, 9)
42 #define QSV_HAVE_BREF_TYPE      QSV_VERSION_ATLEAST(1, 8)
43
44 #define QSV_HAVE_LA     QSV_VERSION_ATLEAST(1, 7)
45 #define QSV_HAVE_LA_DS  QSV_VERSION_ATLEAST(1, 8)
46 #define QSV_HAVE_LA_HRD QSV_VERSION_ATLEAST(1, 11)
47
48 #if defined(_WIN32)
49 #define QSV_HAVE_AVBR   QSV_VERSION_ATLEAST(1, 3)
50 #define QSV_HAVE_ICQ    QSV_VERSION_ATLEAST(1, 8)
51 #define QSV_HAVE_VCM    QSV_VERSION_ATLEAST(1, 8)
52 #define QSV_HAVE_QVBR   QSV_VERSION_ATLEAST(1, 11)
53 #define QSV_HAVE_MF     0
54 #else
55 #define QSV_HAVE_AVBR   0
56 #define QSV_HAVE_ICQ    0
57 #define QSV_HAVE_VCM    0
58 #define QSV_HAVE_QVBR   0
59 #define QSV_HAVE_MF     QSV_VERSION_ATLEAST(1, 25)
60 #endif
61
62 #if !QSV_HAVE_LA_DS
63 #define MFX_LOOKAHEAD_DS_OFF 0
64 #define MFX_LOOKAHEAD_DS_2x 0
65 #define MFX_LOOKAHEAD_DS_4x 0
66 #endif
67
68 #define QSV_COMMON_OPTS \
69 { "async_depth", "Maximum processing parallelism", OFFSET(qsv.async_depth), AV_OPT_TYPE_INT, { .i64 = ASYNC_DEPTH_DEFAULT }, 0, INT_MAX, VE },  \
70 { "avbr_accuracy",    "Accuracy of the AVBR ratecontrol",    OFFSET(qsv.avbr_accuracy),    AV_OPT_TYPE_INT, { .i64 = 0 }, 0, INT_MAX, VE },     \
71 { "avbr_convergence", "Convergence of the AVBR ratecontrol", OFFSET(qsv.avbr_convergence), AV_OPT_TYPE_INT, { .i64 = 0 }, 0, INT_MAX, VE },     \
72 { "preset", NULL, OFFSET(qsv.preset), AV_OPT_TYPE_INT, { .i64 = MFX_TARGETUSAGE_BALANCED }, 0, 7,   VE, "preset" },                             \
73 { "fast",   NULL, 0, AV_OPT_TYPE_CONST, { .i64 = MFX_TARGETUSAGE_BEST_SPEED  },   INT_MIN, INT_MAX, VE, "preset" },                             \
74 { "medium", NULL, 0, AV_OPT_TYPE_CONST, { .i64 = MFX_TARGETUSAGE_BALANCED  },     INT_MIN, INT_MAX, VE, "preset" },                             \
75 { "slow",   NULL, 0, AV_OPT_TYPE_CONST, { .i64 = MFX_TARGETUSAGE_BEST_QUALITY  }, INT_MIN, INT_MAX, VE, "preset" },                             \
76 { "la_depth", "Number of frames to analyze before encoding.", OFFSET(qsv.la_depth), AV_OPT_TYPE_INT, { .i64 = 9 },   9, 100, VE, "la_depth" },  \
77 { "unset", NULL, 0, AV_OPT_TYPE_CONST, { .i64 = 9 }, INT_MIN, INT_MAX,                                                       VE, "la_depth" },  \
78 { "la_ds", "Downscaling factor for the frames saved for the lookahead analysis", OFFSET(qsv.la_ds), AV_OPT_TYPE_INT,                            \
79                     { .i64 = MFX_LOOKAHEAD_DS_UNKNOWN }, MFX_LOOKAHEAD_DS_UNKNOWN, MFX_LOOKAHEAD_DS_4x, VE, "la_ds" },                          \
80 { "auto", NULL, 0, AV_OPT_TYPE_CONST, { .i64 = MFX_LOOKAHEAD_DS_UNKNOWN }, INT_MIN, INT_MAX,                                     VE, "la_ds" }, \
81 { "off", NULL, 0, AV_OPT_TYPE_CONST, { .i64 = MFX_LOOKAHEAD_DS_OFF }, INT_MIN, INT_MAX,                                          VE, "la_ds" }, \
82 { "2x", NULL, 0, AV_OPT_TYPE_CONST, { .i64 = MFX_LOOKAHEAD_DS_2x }, INT_MIN, INT_MAX,                                            VE, "la_ds" }, \
83 { "4x", NULL, 0, AV_OPT_TYPE_CONST, { .i64 = MFX_LOOKAHEAD_DS_4x }, INT_MIN, INT_MAX,                                            VE, "la_ds" }, \
84 { "vcm",      "Use the video conferencing mode ratecontrol",  OFFSET(qsv.vcm),      AV_OPT_TYPE_INT, { .i64 = 0  },  0, 1,         VE },        \
85 { "rdo",            "Enable rate distortion optimization",    OFFSET(qsv.rdo),            AV_OPT_TYPE_INT, { .i64 = -1 }, -1,          1, VE }, \
86 { "max_frame_size", "Maximum encoded frame size in bytes",    OFFSET(qsv.max_frame_size), AV_OPT_TYPE_INT, { .i64 = -1 }, -1, UINT16_MAX, VE }, \
87 { "max_slice_size", "Maximum encoded slice size in bytes",    OFFSET(qsv.max_slice_size), AV_OPT_TYPE_INT, { .i64 = -1 }, -1, UINT16_MAX, VE }, \
88 { "bitrate_limit",  "Toggle bitrate limitations",             OFFSET(qsv.bitrate_limit),  AV_OPT_TYPE_INT, { .i64 = -1 }, -1,          1, VE }, \
89 { "mbbrc",          "MB level bitrate control",               OFFSET(qsv.mbbrc),          AV_OPT_TYPE_INT, { .i64 = -1 }, -1,          1, VE }, \
90 { "extbrc",         "Extended bitrate control",               OFFSET(qsv.extbrc),         AV_OPT_TYPE_INT, { .i64 = -1 }, -1,          1, VE }, \
91 { "adaptive_i",     "Adaptive I-frame placement",             OFFSET(qsv.adaptive_i),     AV_OPT_TYPE_INT, { .i64 = -1 }, -1,          1, VE }, \
92 { "adaptive_b",     "Adaptive B-frame placement",             OFFSET(qsv.adaptive_b),     AV_OPT_TYPE_INT, { .i64 = -1 }, -1,          1, VE }, \
93 { "b_strategy",     "Strategy to choose between I/P/B-frames", OFFSET(qsv.b_strategy),    AV_OPT_TYPE_INT, { .i64 = -1 }, -1,          1, VE },
94
95 typedef struct QSVEncContext {
96     AVCodecContext *avctx;
97
98     QSVFrame *work_frames;
99
100     mfxSession session;
101     mfxSession internal_session;
102
103     int packet_size;
104     int width_align;
105     int height_align;
106
107     mfxVideoParam param;
108     mfxFrameAllocRequest req;
109
110     mfxExtCodingOption  extco;
111 #if QSV_HAVE_CO2
112     mfxExtCodingOption2 extco2;
113 #endif
114 #if QSV_HAVE_MF
115     mfxExtMultiFrameParam   extmfp;
116     mfxExtMultiFrameControl extmfc;
117 #endif
118     mfxExtOpaqueSurfaceAlloc opaque_alloc;
119     mfxFrameSurface1       **opaque_surfaces;
120     AVBufferRef             *opaque_alloc_buf;
121
122     mfxExtBuffer  *extparam_internal[2 + QSV_HAVE_CO2 + (QSV_HAVE_MF * 2)];
123     int         nb_extparam_internal;
124
125     mfxExtBuffer **extparam;
126
127     AVFifoBuffer *async_fifo;
128
129     QSVFramesContext frames_ctx;
130
131     // options set by the caller
132     int async_depth;
133     int idr_interval;
134     int profile;
135     int preset;
136     int avbr_accuracy;
137     int avbr_convergence;
138     int la_depth;
139     int la_ds;
140     int vcm;
141     int rdo;
142     int max_frame_size;
143     int max_slice_size;
144
145     int aud;
146
147     int single_sei_nal_unit;
148     int max_dec_frame_buffering;
149     int trellis;
150
151     int bitrate_limit;
152     int mbbrc;
153     int extbrc;
154     int adaptive_i;
155     int adaptive_b;
156     int b_strategy;
157     int cavlc;
158
159     int int_ref_type;
160     int int_ref_cycle_size;
161     int int_ref_qp_delta;
162     int recovery_point_sei;
163
164 #if QSV_HAVE_MF
165     int mfmode;
166 #endif
167     char *load_plugins;
168 } QSVEncContext;
169
170 int ff_qsv_enc_init(AVCodecContext *avctx, QSVEncContext *q);
171
172 int ff_qsv_encode(AVCodecContext *avctx, QSVEncContext *q,
173                   AVPacket *pkt, const AVFrame *frame, int *got_packet);
174
175 int ff_qsv_enc_close(AVCodecContext *avctx, QSVEncContext *q);
176
177 #endif /* AVCODEC_QSVENC_H */