]> git.sesse.net Git - ffmpeg/blob - libavcodec/qsvdec.c
avcodec/hevc_ps: Expose all SPS and PPS range extension flags
[ffmpeg] / libavcodec / qsvdec.c
1 /*
2  * Intel MediaSDK QSV codec-independent code
3  *
4  * copyright (c) 2013 Luca Barbato
5  * copyright (c) 2015 Anton Khirnov <anton@khirnov.net>
6  *
7  * This file is part of FFmpeg.
8  *
9  * FFmpeg is free software; you can redistribute it and/or
10  * modify it under the terms of the GNU Lesser General Public
11  * License as published by the Free Software Foundation; either
12  * version 2.1 of the License, or (at your option) any later version.
13  *
14  * FFmpeg is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
17  * Lesser General Public License for more details.
18  *
19  * You should have received a copy of the GNU Lesser General Public
20  * License along with FFmpeg; if not, write to the Free Software
21  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
22  */
23
24 #include <string.h>
25 #include <sys/types.h>
26
27 #include <mfx/mfxvideo.h>
28
29 #include "libavutil/common.h"
30 #include "libavutil/hwcontext.h"
31 #include "libavutil/hwcontext_qsv.h"
32 #include "libavutil/mem.h"
33 #include "libavutil/log.h"
34 #include "libavutil/pixdesc.h"
35 #include "libavutil/pixfmt.h"
36 #include "libavutil/time.h"
37
38 #include "avcodec.h"
39 #include "internal.h"
40 #include "qsv.h"
41 #include "qsv_internal.h"
42 #include "qsvdec.h"
43
44 const AVCodecHWConfigInternal *ff_qsv_hw_configs[] = {
45     &(const AVCodecHWConfigInternal) {
46         .public = {
47             .pix_fmt     = AV_PIX_FMT_QSV,
48             .methods     = AV_CODEC_HW_CONFIG_METHOD_HW_FRAMES_CTX |
49                            AV_CODEC_HW_CONFIG_METHOD_AD_HOC,
50             .device_type = AV_HWDEVICE_TYPE_QSV,
51         },
52         .hwaccel = NULL,
53     },
54     NULL
55 };
56
57 static int qsv_init_session(AVCodecContext *avctx, QSVContext *q, mfxSession session,
58                             AVBufferRef *hw_frames_ref, AVBufferRef *hw_device_ref)
59 {
60     int ret;
61
62     if (session) {
63         q->session = session;
64     } else if (hw_frames_ref) {
65         if (q->internal_session) {
66             MFXClose(q->internal_session);
67             q->internal_session = NULL;
68         }
69         av_buffer_unref(&q->frames_ctx.hw_frames_ctx);
70
71         q->frames_ctx.hw_frames_ctx = av_buffer_ref(hw_frames_ref);
72         if (!q->frames_ctx.hw_frames_ctx)
73             return AVERROR(ENOMEM);
74
75         ret = ff_qsv_init_session_frames(avctx, &q->internal_session,
76                                          &q->frames_ctx, q->load_plugins,
77                                          q->iopattern == MFX_IOPATTERN_OUT_OPAQUE_MEMORY);
78         if (ret < 0) {
79             av_buffer_unref(&q->frames_ctx.hw_frames_ctx);
80             return ret;
81         }
82
83         q->session = q->internal_session;
84     } else if (hw_device_ref) {
85         if (q->internal_session) {
86             MFXClose(q->internal_session);
87             q->internal_session = NULL;
88         }
89
90         ret = ff_qsv_init_session_device(avctx, &q->internal_session,
91                                          hw_device_ref, q->load_plugins);
92         if (ret < 0)
93             return ret;
94
95         q->session = q->internal_session;
96     } else {
97         if (!q->internal_session) {
98             ret = ff_qsv_init_internal_session(avctx, &q->internal_session,
99                                                q->load_plugins);
100             if (ret < 0)
101                 return ret;
102         }
103
104         q->session = q->internal_session;
105     }
106
107     /* make sure the decoder is uninitialized */
108     MFXVideoDECODE_Close(q->session);
109
110     return 0;
111 }
112
113 static inline unsigned int qsv_fifo_item_size(void)
114 {
115     return sizeof(mfxSyncPoint*) + sizeof(QSVFrame*);
116 }
117
118 static inline unsigned int qsv_fifo_size(const AVFifoBuffer* fifo)
119 {
120     return av_fifo_size(fifo) / qsv_fifo_item_size();
121 }
122
123 static int qsv_decode_init(AVCodecContext *avctx, QSVContext *q)
124 {
125     const AVPixFmtDescriptor *desc;
126     mfxSession session = NULL;
127     int iopattern = 0;
128     mfxVideoParam param = { 0 };
129     int frame_width  = avctx->coded_width;
130     int frame_height = avctx->coded_height;
131     int ret;
132
133     desc = av_pix_fmt_desc_get(avctx->sw_pix_fmt);
134     if (!desc)
135         return AVERROR_BUG;
136
137     if (!q->async_fifo) {
138         q->async_fifo = av_fifo_alloc(q->async_depth * qsv_fifo_item_size());
139         if (!q->async_fifo)
140             return AVERROR(ENOMEM);
141     }
142
143     if (avctx->pix_fmt == AV_PIX_FMT_QSV && avctx->hwaccel_context) {
144         AVQSVContext *user_ctx = avctx->hwaccel_context;
145         session           = user_ctx->session;
146         iopattern         = user_ctx->iopattern;
147         q->ext_buffers    = user_ctx->ext_buffers;
148         q->nb_ext_buffers = user_ctx->nb_ext_buffers;
149     }
150
151     if (avctx->hw_frames_ctx) {
152         AVHWFramesContext    *frames_ctx = (AVHWFramesContext*)avctx->hw_frames_ctx->data;
153         AVQSVFramesContext *frames_hwctx = frames_ctx->hwctx;
154
155         if (!iopattern) {
156             if (frames_hwctx->frame_type & MFX_MEMTYPE_OPAQUE_FRAME)
157                 iopattern = MFX_IOPATTERN_OUT_OPAQUE_MEMORY;
158             else if (frames_hwctx->frame_type & MFX_MEMTYPE_VIDEO_MEMORY_DECODER_TARGET)
159                 iopattern = MFX_IOPATTERN_OUT_VIDEO_MEMORY;
160         }
161     }
162
163     if (!iopattern)
164         iopattern = MFX_IOPATTERN_OUT_SYSTEM_MEMORY;
165     q->iopattern = iopattern;
166
167     ret = qsv_init_session(avctx, q, session, avctx->hw_frames_ctx, avctx->hw_device_ctx);
168     if (ret < 0) {
169         av_log(avctx, AV_LOG_ERROR, "Error initializing an MFX session\n");
170         return ret;
171     }
172
173     ret = ff_qsv_codec_id_to_mfx(avctx->codec_id);
174     if (ret < 0)
175         return ret;
176
177     param.mfx.CodecId      = ret;
178     param.mfx.CodecProfile = ff_qsv_profile_to_mfx(avctx->codec_id, avctx->profile);
179     param.mfx.CodecLevel   = avctx->level == FF_LEVEL_UNKNOWN ? MFX_LEVEL_UNKNOWN : avctx->level;
180
181     param.mfx.FrameInfo.BitDepthLuma   = desc->comp[0].depth;
182     param.mfx.FrameInfo.BitDepthChroma = desc->comp[0].depth;
183     param.mfx.FrameInfo.Shift          = desc->comp[0].depth > 8;
184     param.mfx.FrameInfo.FourCC         = q->fourcc;
185     param.mfx.FrameInfo.Width          = frame_width;
186     param.mfx.FrameInfo.Height         = frame_height;
187     param.mfx.FrameInfo.ChromaFormat   = MFX_CHROMAFORMAT_YUV420;
188
189     switch (avctx->field_order) {
190     case AV_FIELD_PROGRESSIVE:
191         param.mfx.FrameInfo.PicStruct = MFX_PICSTRUCT_PROGRESSIVE;
192         break;
193     case AV_FIELD_TT:
194         param.mfx.FrameInfo.PicStruct = MFX_PICSTRUCT_FIELD_TFF;
195         break;
196     case AV_FIELD_BB:
197         param.mfx.FrameInfo.PicStruct = MFX_PICSTRUCT_FIELD_BFF;
198         break;
199     default:
200         param.mfx.FrameInfo.PicStruct = MFX_PICSTRUCT_UNKNOWN;
201         break;
202     }
203
204     param.IOPattern   = q->iopattern;
205     param.AsyncDepth  = q->async_depth;
206     param.ExtParam    = q->ext_buffers;
207     param.NumExtParam = q->nb_ext_buffers;
208
209     ret = MFXVideoDECODE_Init(q->session, &param);
210     if (ret < 0)
211         return ff_qsv_print_error(avctx, ret,
212                                   "Error initializing the MFX video decoder");
213
214     q->frame_info = param.mfx.FrameInfo;
215
216     return 0;
217 }
218
219 static int alloc_frame(AVCodecContext *avctx, QSVContext *q, QSVFrame *frame)
220 {
221     int ret;
222
223     ret = ff_get_buffer(avctx, frame->frame, AV_GET_BUFFER_FLAG_REF);
224     if (ret < 0)
225         return ret;
226
227     if (frame->frame->format == AV_PIX_FMT_QSV) {
228         frame->surface = *(mfxFrameSurface1*)frame->frame->data[3];
229     } else {
230         frame->surface.Info = q->frame_info;
231
232         frame->surface.Data.PitchLow = frame->frame->linesize[0];
233         frame->surface.Data.Y        = frame->frame->data[0];
234         frame->surface.Data.UV       = frame->frame->data[1];
235     }
236
237     if (q->frames_ctx.mids) {
238         ret = ff_qsv_find_surface_idx(&q->frames_ctx, frame);
239         if (ret < 0)
240             return ret;
241
242         frame->surface.Data.MemId = &q->frames_ctx.mids[ret];
243     }
244     frame->surface.Data.ExtParam    = &frame->ext_param;
245     frame->surface.Data.NumExtParam = 1;
246     frame->ext_param                = (mfxExtBuffer*)&frame->dec_info;
247     frame->dec_info.Header.BufferId = MFX_EXTBUFF_DECODED_FRAME_INFO;
248     frame->dec_info.Header.BufferSz = sizeof(frame->dec_info);
249
250     frame->used = 1;
251
252     return 0;
253 }
254
255 static void qsv_clear_unused_frames(QSVContext *q)
256 {
257     QSVFrame *cur = q->work_frames;
258     while (cur) {
259         if (cur->used && !cur->surface.Data.Locked && !cur->queued) {
260             cur->used = 0;
261             av_frame_unref(cur->frame);
262         }
263         cur = cur->next;
264     }
265 }
266
267 static int get_surface(AVCodecContext *avctx, QSVContext *q, mfxFrameSurface1 **surf)
268 {
269     QSVFrame *frame, **last;
270     int ret;
271
272     qsv_clear_unused_frames(q);
273
274     frame = q->work_frames;
275     last  = &q->work_frames;
276     while (frame) {
277         if (!frame->used) {
278             ret = alloc_frame(avctx, q, frame);
279             if (ret < 0)
280                 return ret;
281             *surf = &frame->surface;
282             return 0;
283         }
284
285         last  = &frame->next;
286         frame = frame->next;
287     }
288
289     frame = av_mallocz(sizeof(*frame));
290     if (!frame)
291         return AVERROR(ENOMEM);
292     frame->frame = av_frame_alloc();
293     if (!frame->frame) {
294         av_freep(&frame);
295         return AVERROR(ENOMEM);
296     }
297     *last = frame;
298
299     ret = alloc_frame(avctx, q, frame);
300     if (ret < 0)
301         return ret;
302
303     *surf = &frame->surface;
304
305     return 0;
306 }
307
308 static QSVFrame *find_frame(QSVContext *q, mfxFrameSurface1 *surf)
309 {
310     QSVFrame *cur = q->work_frames;
311     while (cur) {
312         if (surf == &cur->surface)
313             return cur;
314         cur = cur->next;
315     }
316     return NULL;
317 }
318
319 static int qsv_decode(AVCodecContext *avctx, QSVContext *q,
320                       AVFrame *frame, int *got_frame,
321                       AVPacket *avpkt)
322 {
323     QSVFrame *out_frame;
324     mfxFrameSurface1 *insurf;
325     mfxFrameSurface1 *outsurf;
326     mfxSyncPoint *sync;
327     mfxBitstream bs = { { { 0 } } };
328     int ret;
329
330     if (avpkt->size) {
331         bs.Data       = avpkt->data;
332         bs.DataLength = avpkt->size;
333         bs.MaxLength  = bs.DataLength;
334         bs.TimeStamp  = avpkt->pts;
335         if (avctx->field_order == AV_FIELD_PROGRESSIVE)
336             bs.DataFlag   |= MFX_BITSTREAM_COMPLETE_FRAME;
337     }
338
339     sync = av_mallocz(sizeof(*sync));
340     if (!sync) {
341         av_freep(&sync);
342         return AVERROR(ENOMEM);
343     }
344
345     do {
346         ret = get_surface(avctx, q, &insurf);
347         if (ret < 0) {
348             av_freep(&sync);
349             return ret;
350         }
351
352         ret = MFXVideoDECODE_DecodeFrameAsync(q->session, avpkt->size ? &bs : NULL,
353                                               insurf, &outsurf, sync);
354         if (ret == MFX_WRN_DEVICE_BUSY)
355             av_usleep(500);
356
357     } while (ret == MFX_WRN_DEVICE_BUSY || ret == MFX_ERR_MORE_SURFACE);
358
359     if (ret != MFX_ERR_NONE &&
360         ret != MFX_ERR_MORE_DATA &&
361         ret != MFX_WRN_VIDEO_PARAM_CHANGED &&
362         ret != MFX_ERR_MORE_SURFACE) {
363         av_freep(&sync);
364         return ff_qsv_print_error(avctx, ret,
365                                   "Error during QSV decoding.");
366     }
367
368     /* make sure we do not enter an infinite loop if the SDK
369      * did not consume any data and did not return anything */
370     if (!*sync && !bs.DataOffset) {
371         bs.DataOffset = avpkt->size;
372         ++q->zero_consume_run;
373         if (q->zero_consume_run > 1)
374             ff_qsv_print_warning(avctx, ret, "A decode call did not consume any data");
375     } else if (!*sync && bs.DataOffset) {
376         ++q->buffered_count;
377     } else {
378         q->zero_consume_run = 0;
379     }
380
381     if (*sync) {
382         QSVFrame *out_frame = find_frame(q, outsurf);
383
384         if (!out_frame) {
385             av_log(avctx, AV_LOG_ERROR,
386                    "The returned surface does not correspond to any frame\n");
387             av_freep(&sync);
388             return AVERROR_BUG;
389         }
390
391         out_frame->queued = 1;
392         av_fifo_generic_write(q->async_fifo, &out_frame, sizeof(out_frame), NULL);
393         av_fifo_generic_write(q->async_fifo, &sync,      sizeof(sync),      NULL);
394     } else {
395         av_freep(&sync);
396     }
397
398     if ((qsv_fifo_size(q->async_fifo) >= q->async_depth) ||
399         (!avpkt->size && av_fifo_size(q->async_fifo))) {
400         AVFrame *src_frame;
401
402         av_fifo_generic_read(q->async_fifo, &out_frame, sizeof(out_frame), NULL);
403         av_fifo_generic_read(q->async_fifo, &sync,      sizeof(sync),      NULL);
404         out_frame->queued = 0;
405
406         if (avctx->pix_fmt != AV_PIX_FMT_QSV) {
407             do {
408                 ret = MFXVideoCORE_SyncOperation(q->session, *sync, 1000);
409             } while (ret == MFX_WRN_IN_EXECUTION);
410         }
411
412         av_freep(&sync);
413
414         src_frame = out_frame->frame;
415
416         ret = av_frame_ref(frame, src_frame);
417         if (ret < 0)
418             return ret;
419
420         outsurf = &out_frame->surface;
421
422 #if FF_API_PKT_PTS
423 FF_DISABLE_DEPRECATION_WARNINGS
424         frame->pkt_pts = outsurf->Data.TimeStamp;
425 FF_ENABLE_DEPRECATION_WARNINGS
426 #endif
427         frame->pts = outsurf->Data.TimeStamp;
428
429         frame->repeat_pict =
430             outsurf->Info.PicStruct & MFX_PICSTRUCT_FRAME_TRIPLING ? 4 :
431             outsurf->Info.PicStruct & MFX_PICSTRUCT_FRAME_DOUBLING ? 2 :
432             outsurf->Info.PicStruct & MFX_PICSTRUCT_FIELD_REPEATED ? 1 : 0;
433         frame->top_field_first =
434             outsurf->Info.PicStruct & MFX_PICSTRUCT_FIELD_TFF;
435         frame->interlaced_frame =
436             !(outsurf->Info.PicStruct & MFX_PICSTRUCT_PROGRESSIVE);
437         frame->pict_type = ff_qsv_map_pictype(out_frame->dec_info.FrameType);
438         //Key frame is IDR frame is only suitable for H264. For HEVC, IRAPs are key frames.
439         if (avctx->codec_id == AV_CODEC_ID_H264)
440             frame->key_frame = !!(out_frame->dec_info.FrameType & MFX_FRAMETYPE_IDR);
441
442         /* update the surface properties */
443         if (avctx->pix_fmt == AV_PIX_FMT_QSV)
444             ((mfxFrameSurface1*)frame->data[3])->Info = outsurf->Info;
445
446         *got_frame = 1;
447     }
448
449     return bs.DataOffset;
450 }
451
452 int ff_qsv_decode_close(QSVContext *q)
453 {
454     QSVFrame *cur = q->work_frames;
455
456     if (q->session)
457         MFXVideoDECODE_Close(q->session);
458
459     while (q->async_fifo && av_fifo_size(q->async_fifo)) {
460         QSVFrame *out_frame;
461         mfxSyncPoint *sync;
462
463         av_fifo_generic_read(q->async_fifo, &out_frame, sizeof(out_frame), NULL);
464         av_fifo_generic_read(q->async_fifo, &sync,      sizeof(sync),      NULL);
465
466         av_freep(&sync);
467     }
468
469     while (cur) {
470         q->work_frames = cur->next;
471         av_frame_free(&cur->frame);
472         av_freep(&cur);
473         cur = q->work_frames;
474     }
475
476     av_fifo_free(q->async_fifo);
477     q->async_fifo = NULL;
478
479     av_parser_close(q->parser);
480     avcodec_free_context(&q->avctx_internal);
481
482     if (q->internal_session)
483         MFXClose(q->internal_session);
484
485     av_buffer_unref(&q->frames_ctx.hw_frames_ctx);
486     av_buffer_unref(&q->frames_ctx.mids_buf);
487
488     return 0;
489 }
490
491 int ff_qsv_process_data(AVCodecContext *avctx, QSVContext *q,
492                         AVFrame *frame, int *got_frame, AVPacket *pkt)
493 {
494     uint8_t *dummy_data;
495     int dummy_size;
496     int ret;
497     const AVPixFmtDescriptor *desc;
498
499     if (!q->avctx_internal) {
500         q->avctx_internal = avcodec_alloc_context3(NULL);
501         if (!q->avctx_internal)
502             return AVERROR(ENOMEM);
503
504         q->avctx_internal->codec_id = avctx->codec_id;
505
506         q->parser = av_parser_init(avctx->codec_id);
507         if (!q->parser)
508             return AVERROR(ENOMEM);
509
510         q->parser->flags |= PARSER_FLAG_COMPLETE_FRAMES;
511         q->orig_pix_fmt   = AV_PIX_FMT_NONE;
512     }
513
514     if (!pkt->size)
515         return qsv_decode(avctx, q, frame, got_frame, pkt);
516
517     /* we assume the packets are already split properly and want
518      * just the codec parameters here */
519     av_parser_parse2(q->parser, q->avctx_internal,
520                      &dummy_data, &dummy_size,
521                      pkt->data, pkt->size, pkt->pts, pkt->dts,
522                      pkt->pos);
523
524     avctx->field_order  = q->parser->field_order;
525     /* TODO: flush delayed frames on reinit */
526     if (q->parser->format       != q->orig_pix_fmt    ||
527         FFALIGN(q->parser->coded_width, 16)  != FFALIGN(avctx->coded_width, 16) ||
528         FFALIGN(q->parser->coded_height, 16) != FFALIGN(avctx->coded_height, 16)) {
529         enum AVPixelFormat pix_fmts[3] = { AV_PIX_FMT_QSV,
530                                            AV_PIX_FMT_NONE,
531                                            AV_PIX_FMT_NONE };
532         enum AVPixelFormat qsv_format;
533         AVPacket zero_pkt = {0};
534
535         if (q->buffered_count) {
536             q->reinit_flag = 1;
537             /* decode zero-size pkt to flush the buffered pkt before reinit */
538             q->buffered_count--;
539             return qsv_decode(avctx, q, frame, got_frame, &zero_pkt);
540         }
541
542         q->reinit_flag = 0;
543
544         qsv_format = ff_qsv_map_pixfmt(q->parser->format, &q->fourcc);
545         if (qsv_format < 0) {
546             av_log(avctx, AV_LOG_ERROR,
547                    "Decoding pixel format '%s' is not supported\n",
548                    av_get_pix_fmt_name(q->parser->format));
549             ret = AVERROR(ENOSYS);
550             goto reinit_fail;
551         }
552
553         q->orig_pix_fmt     = q->parser->format;
554         avctx->pix_fmt      = pix_fmts[1] = qsv_format;
555         avctx->width        = q->parser->width;
556         avctx->height       = q->parser->height;
557         avctx->coded_width  = FFALIGN(q->parser->coded_width, 16);
558         avctx->coded_height = FFALIGN(q->parser->coded_height, 16);
559         avctx->level        = q->avctx_internal->level;
560         avctx->profile      = q->avctx_internal->profile;
561
562         ret = ff_get_format(avctx, pix_fmts);
563         if (ret < 0)
564             goto reinit_fail;
565
566         avctx->pix_fmt = ret;
567
568         desc = av_pix_fmt_desc_get(avctx->pix_fmt);
569         if (!desc)
570             goto reinit_fail;
571
572          if (desc->comp[0].depth > 8) {
573             avctx->coded_width =  FFALIGN(q->parser->coded_width, 32);
574             avctx->coded_height = FFALIGN(q->parser->coded_height, 32);
575         }
576
577         ret = qsv_decode_init(avctx, q);
578         if (ret < 0)
579             goto reinit_fail;
580     }
581
582     return qsv_decode(avctx, q, frame, got_frame, pkt);
583
584 reinit_fail:
585     q->orig_pix_fmt = q->parser->format = avctx->pix_fmt = AV_PIX_FMT_NONE;
586     return ret;
587 }
588
589 void ff_qsv_decode_flush(AVCodecContext *avctx, QSVContext *q)
590 {
591     q->orig_pix_fmt = AV_PIX_FMT_NONE;
592 }