]> git.sesse.net Git - ffmpeg/blob - libavcodec/qsvenc_hevc.c
lavc: mark the old audio/video encoding API as deprecated
[ffmpeg] / libavcodec / qsvenc_hevc.c
1 /*
2  * Intel MediaSDK QSV based HEVC encoder
3  *
4  * This file is part of Libav.
5  *
6  * Libav is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU Lesser General Public
8  * License as published by the Free Software Foundation; either
9  * version 2.1 of the License, or (at your option) any later version.
10  *
11  * Libav is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14  * Lesser General Public License for more details.
15  *
16  * You should have received a copy of the GNU Lesser General Public
17  * License along with Libav; if not, write to the Free Software
18  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
19  */
20
21
22 #include <stdint.h>
23 #include <sys/types.h>
24
25 #include <mfx/mfxvideo.h>
26
27 #include "libavutil/common.h"
28 #include "libavutil/opt.h"
29
30 #include "avcodec.h"
31 #include "bytestream.h"
32 #include "get_bits.h"
33 #include "hevc.h"
34 #include "h2645_parse.h"
35 #include "internal.h"
36 #include "qsv.h"
37 #include "qsv_internal.h"
38 #include "qsvenc.h"
39
40 enum LoadPlugin {
41     LOAD_PLUGIN_NONE,
42     LOAD_PLUGIN_HEVC_SW,
43     LOAD_PLUGIN_HEVC_HW,
44 };
45
46 typedef struct QSVHEVCEncContext {
47     AVClass *class;
48     QSVEncContext qsv;
49     int load_plugin;
50 } QSVHEVCEncContext;
51
52 static int generate_fake_vps(QSVEncContext *q, AVCodecContext *avctx)
53 {
54     GetByteContext gbc;
55     PutByteContext pbc;
56
57     GetBitContext gb;
58     H2645NAL sps_nal = { NULL };
59     HEVCSPS sps = { 0 };
60     HEVCVPS vps = { 0 };
61     uint8_t vps_buf[128], vps_rbsp_buf[128];
62     uint8_t *new_extradata;
63     unsigned int sps_id;
64     int ret, i, type, vps_size;
65
66     if (!avctx->extradata_size) {
67         av_log(avctx, AV_LOG_ERROR, "No extradata returned from libmfx\n");
68         return AVERROR_UNKNOWN;
69     }
70
71     /* parse the SPS */
72     ret = ff_h2645_extract_rbsp(avctx->extradata + 4, avctx->extradata_size - 4, &sps_nal);
73     if (ret < 0) {
74         av_log(avctx, AV_LOG_ERROR, "Error unescaping the SPS buffer\n");
75         return ret;
76     }
77
78     ret = init_get_bits8(&gb, sps_nal.data, sps_nal.size);
79     if (ret < 0) {
80         av_freep(&sps_nal.rbsp_buffer);
81         return ret;
82     }
83
84     get_bits(&gb, 1);
85     type = get_bits(&gb, 6);
86     if (type != NAL_SPS) {
87         av_log(avctx, AV_LOG_ERROR, "Unexpected NAL type in the extradata: %d\n",
88                type);
89         av_freep(&sps_nal.rbsp_buffer);
90         return AVERROR_INVALIDDATA;
91     }
92     get_bits(&gb, 9);
93
94     ret = ff_hevc_parse_sps(&sps, &gb, &sps_id, 0, NULL, avctx);
95     av_freep(&sps_nal.rbsp_buffer);
96     if (ret < 0) {
97         av_log(avctx, AV_LOG_ERROR, "Error parsing the SPS\n");
98         return ret;
99     }
100
101     /* generate the VPS */
102     vps.vps_max_layers     = 1;
103     vps.vps_max_sub_layers = sps.max_sub_layers;
104     memcpy(&vps.ptl, &sps.ptl, sizeof(vps.ptl));
105     vps.vps_sub_layer_ordering_info_present_flag = 1;
106     for (i = 0; i < MAX_SUB_LAYERS; i++) {
107         vps.vps_max_dec_pic_buffering[i] = sps.temporal_layer[i].max_dec_pic_buffering;
108         vps.vps_num_reorder_pics[i]      = sps.temporal_layer[i].num_reorder_pics;
109         vps.vps_max_latency_increase[i]  = sps.temporal_layer[i].max_latency_increase;
110     }
111
112     vps.vps_num_layer_sets                  = 1;
113     vps.vps_timing_info_present_flag        = sps.vui.vui_timing_info_present_flag;
114     vps.vps_num_units_in_tick               = sps.vui.vui_num_units_in_tick;
115     vps.vps_time_scale                      = sps.vui.vui_time_scale;
116     vps.vps_poc_proportional_to_timing_flag = sps.vui.vui_poc_proportional_to_timing_flag;
117     vps.vps_num_ticks_poc_diff_one          = sps.vui.vui_num_ticks_poc_diff_one_minus1 + 1;
118
119     /* generate the encoded RBSP form of the VPS */
120     ret = ff_hevc_encode_nal_vps(&vps, sps.vps_id, vps_rbsp_buf, sizeof(vps_rbsp_buf));
121     if (ret < 0) {
122         av_log(avctx, AV_LOG_ERROR, "Error writing the VPS\n");
123         return ret;
124     }
125
126     /* escape and add the startcode */
127     bytestream2_init(&gbc, vps_rbsp_buf, ret);
128     bytestream2_init_writer(&pbc, vps_buf, sizeof(vps_buf));
129
130     bytestream2_put_be32(&pbc, 1);              // startcode
131     bytestream2_put_byte(&pbc, NAL_VPS << 1);   // NAL
132     bytestream2_put_byte(&pbc, 1);              // header
133
134     while (bytestream2_get_bytes_left(&gbc)) {
135         uint32_t b = bytestream2_peek_be24(&gbc);
136         if (b <= 3) {
137             bytestream2_put_be24(&pbc, 3);
138             bytestream2_skip(&gbc, 2);
139         } else
140             bytestream2_put_byte(&pbc, bytestream2_get_byte(&gbc));
141     }
142
143     vps_size = bytestream2_tell_p(&pbc);
144     new_extradata = av_mallocz(vps_size + avctx->extradata_size + AV_INPUT_BUFFER_PADDING_SIZE);
145     if (!new_extradata)
146         return AVERROR(ENOMEM);
147     memcpy(new_extradata, vps_buf, vps_size);
148     memcpy(new_extradata + vps_size, avctx->extradata, avctx->extradata_size);
149
150     av_freep(&avctx->extradata);
151     avctx->extradata       = new_extradata;
152     avctx->extradata_size += vps_size;
153
154     return 0;
155 }
156
157 static av_cold int qsv_enc_init(AVCodecContext *avctx)
158 {
159     QSVHEVCEncContext *q = avctx->priv_data;
160     int ret;
161
162     if (q->load_plugin != LOAD_PLUGIN_NONE) {
163         static const char *uid_hevcenc_sw = "2fca99749fdb49aeb121a5b63ef568f7";
164         static const char *uid_hevcenc_hw = "6fadc791a0c2eb479ab6dcd5ea9da347";
165
166         if (q->qsv.load_plugins[0]) {
167             av_log(avctx, AV_LOG_WARNING,
168                    "load_plugins is not empty, but load_plugin is not set to 'none'."
169                    "The load_plugin value will be ignored.\n");
170         } else {
171             av_freep(&q->qsv.load_plugins);
172
173             if (q->load_plugin == LOAD_PLUGIN_HEVC_SW)
174                 q->qsv.load_plugins = av_strdup(uid_hevcenc_sw);
175             else
176                 q->qsv.load_plugins = av_strdup(uid_hevcenc_hw);
177
178             if (!q->qsv.load_plugins)
179                 return AVERROR(ENOMEM);
180         }
181     }
182
183     ret = ff_qsv_enc_init(avctx, &q->qsv);
184     if (ret < 0)
185         return ret;
186
187     ret = generate_fake_vps(&q->qsv, avctx);
188     if (ret < 0) {
189         ff_qsv_enc_close(avctx, &q->qsv);
190         return ret;
191     }
192
193     return 0;
194 }
195
196 static int qsv_enc_frame(AVCodecContext *avctx, AVPacket *pkt,
197                          const AVFrame *frame, int *got_packet)
198 {
199     QSVHEVCEncContext *q = avctx->priv_data;
200
201     return ff_qsv_encode(avctx, &q->qsv, pkt, frame, got_packet);
202 }
203
204 static av_cold int qsv_enc_close(AVCodecContext *avctx)
205 {
206     QSVHEVCEncContext *q = avctx->priv_data;
207
208     return ff_qsv_enc_close(avctx, &q->qsv);
209 }
210
211 #define OFFSET(x) offsetof(QSVHEVCEncContext, x)
212 #define VE AV_OPT_FLAG_VIDEO_PARAM | AV_OPT_FLAG_ENCODING_PARAM
213 static const AVOption options[] = {
214     QSV_COMMON_OPTS
215
216     { "load_plugin", "A user plugin to load in an internal session", OFFSET(load_plugin), AV_OPT_TYPE_INT, { .i64 = LOAD_PLUGIN_HEVC_SW }, LOAD_PLUGIN_NONE, LOAD_PLUGIN_HEVC_HW, VE, "load_plugin" },
217     { "none",     NULL, 0, AV_OPT_TYPE_CONST, { .i64 = LOAD_PLUGIN_NONE },    0, 0, VE, "load_plugin" },
218     { "hevc_sw",  NULL, 0, AV_OPT_TYPE_CONST, { .i64 = LOAD_PLUGIN_HEVC_SW }, 0, 0, VE, "load_plugin" },
219     { "hevc_hw",  NULL, 0, AV_OPT_TYPE_CONST, { .i64 = LOAD_PLUGIN_HEVC_HW }, 0, 0, VE, "load_plugin" },
220
221     { "load_plugins", "A :-separate list of hexadecimal plugin UIDs to load in an internal session",
222         OFFSET(qsv.load_plugins), AV_OPT_TYPE_STRING, { .str = "" }, 0, 0, VE },
223
224     { "profile", NULL, OFFSET(qsv.profile), AV_OPT_TYPE_INT, { .i64 = MFX_PROFILE_UNKNOWN }, 0, INT_MAX, VE, "profile" },
225     { "unknown", NULL, 0, AV_OPT_TYPE_CONST, { .i64 = MFX_PROFILE_UNKNOWN      }, INT_MIN, INT_MAX,     VE, "profile" },
226     { "main",    NULL, 0, AV_OPT_TYPE_CONST, { .i64 = MFX_PROFILE_HEVC_MAIN    }, INT_MIN, INT_MAX,     VE, "profile" },
227     { "main10",  NULL, 0, AV_OPT_TYPE_CONST, { .i64 = MFX_PROFILE_HEVC_MAIN10  }, INT_MIN, INT_MAX,     VE, "profile" },
228     { "mainsp",  NULL, 0, AV_OPT_TYPE_CONST, { .i64 = MFX_PROFILE_HEVC_MAINSP  }, INT_MIN, INT_MAX,     VE, "profile" },
229
230     { NULL },
231 };
232
233 static const AVClass class = {
234     .class_name = "hevc_qsv encoder",
235     .item_name  = av_default_item_name,
236     .option     = options,
237     .version    = LIBAVUTIL_VERSION_INT,
238 };
239
240 static const AVCodecDefault qsv_enc_defaults[] = {
241     { "b",         "1M"    },
242     { "refs",      "0"     },
243     // same as the x264 default
244     { "g",         "248"   },
245     { "bf",        "8"     },
246
247     { "flags",     "+cgop" },
248 #if FF_API_PRIVATE_OPT
249     { "b_strategy", "-1"   },
250 #endif
251     { NULL },
252 };
253
254 AVCodec ff_hevc_qsv_encoder = {
255     .name           = "hevc_qsv",
256     .long_name      = NULL_IF_CONFIG_SMALL("HEVC (Intel Quick Sync Video acceleration)"),
257     .priv_data_size = sizeof(QSVHEVCEncContext),
258     .type           = AVMEDIA_TYPE_VIDEO,
259     .id             = AV_CODEC_ID_HEVC,
260     .init           = qsv_enc_init,
261     .encode2        = qsv_enc_frame,
262     .close          = qsv_enc_close,
263     .capabilities   = AV_CODEC_CAP_DELAY,
264     .pix_fmts       = (const enum AVPixelFormat[]){ AV_PIX_FMT_NV12,
265                                                     AV_PIX_FMT_QSV,
266                                                     AV_PIX_FMT_NONE },
267     .priv_class     = &class,
268     .defaults       = qsv_enc_defaults,
269     .caps_internal  = FF_CODEC_CAP_INIT_CLEANUP,
270 };