]> git.sesse.net Git - ffmpeg/blob - libavcodec/hevc_refs.c
Add HEVC decoder
[ffmpeg] / libavcodec / hevc_refs.c
1 /*
2  * HEVC video decoder
3  *
4  * Copyright (C) 2012 - 2013 Guillaume Martres
5  * Copyright (C) 2012 - 2013 Gildas Cocherel
6  *
7  * This file is part of Libav.
8  *
9  * Libav is free software; you can redistribute it and/or
10  * modify it under the terms of the GNU Lesser General Public
11  * License as published by the Free Software Foundation; either
12  * version 2.1 of the License, or (at your option) any later version.
13  *
14  * Libav is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
17  * Lesser General Public License for more details.
18  *
19  * You should have received a copy of the GNU Lesser General Public
20  * License along with Libav; if not, write to the Free Software
21  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
22  */
23
24 #include "libavutil/pixdesc.h"
25
26 #include "internal.h"
27 #include "thread.h"
28 #include "hevc.h"
29
30 void ff_hevc_unref_frame(HEVCContext *s, HEVCFrame *frame, int flags)
31 {
32     /* frame->frame can be NULL if context init failed */
33     if (!frame->frame || !frame->frame->buf[0])
34         return;
35
36     frame->flags &= ~flags;
37     if (!frame->flags) {
38         ff_thread_release_buffer(s->avctx, &frame->tf);
39
40         av_buffer_unref(&frame->tab_mvf_buf);
41         frame->tab_mvf = NULL;
42
43         av_buffer_unref(&frame->rpl_buf);
44         av_buffer_unref(&frame->rpl_tab_buf);
45         frame->rpl_tab    = NULL;
46         frame->refPicList = NULL;
47
48         frame->collocated_ref = NULL;
49     }
50 }
51
52 RefPicList *ff_hevc_get_ref_list(HEVCContext *s, HEVCFrame *ref, int x0, int y0)
53 {
54     if (x0 < 0 || y0 < 0) {
55         return s->ref->refPicList;
56     } else {
57         int x_cb         = x0 >> s->sps->log2_ctb_size;
58         int y_cb         = y0 >> s->sps->log2_ctb_size;
59         int pic_width_cb = (s->sps->width + (1 << s->sps->log2_ctb_size) - 1) >>
60                            s->sps->log2_ctb_size;
61         int ctb_addr_ts  = s->pps->ctb_addr_rs_to_ts[y_cb * pic_width_cb + x_cb];
62         return (RefPicList *)ref->rpl_tab[ctb_addr_ts];
63     }
64 }
65
66 void ff_hevc_clear_refs(HEVCContext *s)
67 {
68     int i;
69     for (i = 0; i < FF_ARRAY_ELEMS(s->DPB); i++)
70         ff_hevc_unref_frame(s, &s->DPB[i],
71                             HEVC_FRAME_FLAG_SHORT_REF |
72                             HEVC_FRAME_FLAG_LONG_REF);
73 }
74
75 void ff_hevc_flush_dpb(HEVCContext *s)
76 {
77     int i;
78     for (i = 0; i < FF_ARRAY_ELEMS(s->DPB); i++)
79         ff_hevc_unref_frame(s, &s->DPB[i], ~0);
80 }
81
82 static HEVCFrame *alloc_frame(HEVCContext *s)
83 {
84     int i, j, ret;
85     for (i = 0; i < FF_ARRAY_ELEMS(s->DPB); i++) {
86         HEVCFrame *frame = &s->DPB[i];
87         if (frame->frame->buf[0])
88             continue;
89
90         ret = ff_thread_get_buffer(s->avctx, &frame->tf,
91                                    AV_GET_BUFFER_FLAG_REF);
92         if (ret < 0)
93             return NULL;
94
95         frame->rpl_buf = av_buffer_allocz(s->nb_nals * sizeof(RefPicListTab));
96         if (!frame->rpl_buf)
97             goto fail;
98
99         frame->tab_mvf_buf = av_buffer_pool_get(s->tab_mvf_pool);
100         if (!frame->tab_mvf_buf)
101             goto fail;
102         frame->tab_mvf = (MvField *)frame->tab_mvf_buf->data;
103
104         frame->rpl_tab_buf = av_buffer_pool_get(s->rpl_tab_pool);
105         if (!frame->rpl_tab_buf)
106             goto fail;
107         frame->rpl_tab   = (RefPicListTab **)frame->rpl_tab_buf->data;
108         frame->ctb_count = s->sps->ctb_width * s->sps->ctb_height;
109         for (j = 0; j < frame->ctb_count; j++)
110             frame->rpl_tab[j] = (RefPicListTab *)frame->rpl_buf->data;
111
112         return frame;
113
114 fail:
115         ff_hevc_unref_frame(s, frame, ~0);
116         return NULL;
117     }
118     av_log(s->avctx, AV_LOG_ERROR, "Error allocating frame, DPB full.\n");
119     return NULL;
120 }
121
122 int ff_hevc_set_new_ref(HEVCContext *s, AVFrame **frame, int poc)
123 {
124     HEVCFrame *ref;
125     int i;
126
127     /* check that this POC doesn't already exist */
128     for (i = 0; i < FF_ARRAY_ELEMS(s->DPB); i++) {
129         HEVCFrame *frame = &s->DPB[i];
130
131         if (frame->frame->buf[0] && frame->sequence == s->seq_decode &&
132             frame->poc == poc) {
133             av_log(s->avctx, AV_LOG_ERROR, "Duplicate POC in a sequence: %d.\n",
134                    poc);
135             return AVERROR_INVALIDDATA;
136         }
137     }
138
139     ref = alloc_frame(s);
140     if (!ref)
141         return AVERROR(ENOMEM);
142
143     *frame = ref->frame;
144     s->ref = ref;
145
146     ref->poc      = poc;
147     ref->flags    = HEVC_FRAME_FLAG_OUTPUT | HEVC_FRAME_FLAG_SHORT_REF;
148     ref->sequence = s->seq_decode;
149     ref->window   = s->sps->output_window;
150
151     return 0;
152 }
153
154 int ff_hevc_output_frame(HEVCContext *s, AVFrame *out, int flush)
155 {
156     do {
157         int nb_output = 0;
158         int min_poc   = INT_MAX;
159         int i, min_idx, ret;
160
161         for (i = 0; i < FF_ARRAY_ELEMS(s->DPB); i++) {
162             HEVCFrame *frame = &s->DPB[i];
163             if ((frame->flags & HEVC_FRAME_FLAG_OUTPUT) &&
164                 frame->sequence == s->seq_output) {
165                 nb_output++;
166                 if (frame->poc < min_poc) {
167                     min_poc = frame->poc;
168                     min_idx = i;
169                 }
170             }
171         }
172
173         /* wait for more frames before output */
174         if (!flush && s->seq_output == s->seq_decode && s->sps &&
175             nb_output <= s->sps->temporal_layer[s->sps->max_sub_layers - 1].num_reorder_pics)
176             return 0;
177
178         if (nb_output) {
179             HEVCFrame *frame = &s->DPB[min_idx];
180             const AVPixFmtDescriptor *desc = av_pix_fmt_desc_get(frame->frame->format);
181             int pixel_shift;
182
183             if (!desc)
184                 return AVERROR_BUG;
185
186             pixel_shift = desc->comp[0].depth_minus1 > 7;
187
188             ret = av_frame_ref(out, frame->frame);
189             ff_hevc_unref_frame(s, frame, HEVC_FRAME_FLAG_OUTPUT);
190             if (ret < 0)
191                 return ret;
192
193             for (i = 0; i < 3; i++) {
194                 int hshift = (i > 0) ? desc->log2_chroma_w : 0;
195                 int vshift = (i > 0) ? desc->log2_chroma_h : 0;
196                 int off = ((frame->window.left_offset >> hshift) << pixel_shift) +
197                           (frame->window.top_offset   >> vshift) * out->linesize[i];
198                 out->data[i] += off;
199             }
200             av_log(s->avctx, AV_LOG_DEBUG,
201                    "Output frame with POC %d.\n", frame->poc);
202             return 1;
203         }
204
205         if (s->seq_output != s->seq_decode)
206             s->seq_output = (s->seq_output + 1) & 0xff;
207         else
208             break;
209     } while (1);
210
211     return 0;
212 }
213
214 static int init_slice_rpl(HEVCContext *s)
215 {
216     HEVCFrame *frame = s->ref;
217     int ctb_count    = frame->ctb_count;
218     int ctb_addr_ts  = s->pps->ctb_addr_rs_to_ts[s->sh.slice_segment_addr];
219     int i;
220
221     if (s->slice_idx >= frame->rpl_buf->size / sizeof(RefPicListTab))
222         return AVERROR_INVALIDDATA;
223
224     for (i = ctb_addr_ts; i < ctb_count; i++)
225         frame->rpl_tab[i] = (RefPicListTab *)frame->rpl_buf->data + s->slice_idx;
226
227     frame->refPicList = (RefPicList *)frame->rpl_tab[ctb_addr_ts];
228
229     return 0;
230 }
231
232 int ff_hevc_slice_rpl(HEVCContext *s)
233 {
234     SliceHeader *sh = &s->sh;
235
236     uint8_t nb_list = sh->slice_type == B_SLICE ? 2 : 1;
237     uint8_t list_idx;
238     int i, j, ret;
239
240     ret = init_slice_rpl(s);
241     if (ret < 0)
242         return ret;
243
244     if (!(s->rps[ST_CURR_BEF].nb_refs + s->rps[ST_CURR_AFT].nb_refs +
245           s->rps[LT_CURR].nb_refs)) {
246         av_log(s->avctx, AV_LOG_ERROR, "Zero refs in the frame RPS.\n");
247         return AVERROR_INVALIDDATA;
248     }
249
250     for (list_idx = 0; list_idx < nb_list; list_idx++) {
251         RefPicList  rpl_tmp = { { 0 } };
252         RefPicList *rpl     = &s->ref->refPicList[list_idx];
253
254         /* The order of the elements is
255          * ST_CURR_BEF - ST_CURR_AFT - LT_CURR for the L0 and
256          * ST_CURR_AFT - ST_CURR_BEF - LT_CURR for the L1 */
257         int cand_lists[3] = { list_idx ? ST_CURR_AFT : ST_CURR_BEF,
258                               list_idx ? ST_CURR_BEF : ST_CURR_AFT,
259                               LT_CURR };
260
261         /* concatenate the candidate lists for the current frame */
262         while (rpl_tmp.nb_refs < sh->nb_refs[list_idx]) {
263             for (i = 0; i < FF_ARRAY_ELEMS(cand_lists); i++) {
264                 RefPicList *rps = &s->rps[cand_lists[i]];
265                 for (j = 0; j < rps->nb_refs && rpl_tmp.nb_refs < MAX_REFS; j++) {
266                     rpl_tmp.list[rpl_tmp.nb_refs]       = rps->list[j];
267                     rpl_tmp.ref[rpl_tmp.nb_refs]        = rps->ref[j];
268                     rpl_tmp.isLongTerm[rpl_tmp.nb_refs] = i == 2;
269                     rpl_tmp.nb_refs++;
270                 }
271             }
272         }
273
274         /* reorder the references if necessary */
275         if (sh->rpl_modification_flag[list_idx]) {
276             for (i = 0; i < sh->nb_refs[list_idx]; i++) {
277                 int idx = sh->list_entry_lx[list_idx][i];
278
279                 if (idx >= rpl_tmp.nb_refs) {
280                     av_log(s->avctx, AV_LOG_ERROR, "Invalid reference index.\n");
281                     return AVERROR_INVALIDDATA;
282                 }
283
284                 rpl->list[i]       = rpl_tmp.list[idx];
285                 rpl->ref[i]        = rpl_tmp.ref[idx];
286                 rpl->isLongTerm[i] = rpl_tmp.isLongTerm[idx];
287                 rpl->nb_refs++;
288             }
289         } else {
290             memcpy(rpl, &rpl_tmp, sizeof(*rpl));
291             rpl->nb_refs = FFMIN(rpl->nb_refs, sh->nb_refs[list_idx]);
292         }
293
294         if (sh->collocated_list == list_idx &&
295             sh->collocated_ref_idx < rpl->nb_refs)
296             s->ref->collocated_ref = rpl->ref[sh->collocated_ref_idx];
297     }
298
299     return 0;
300 }
301
302 static HEVCFrame *find_ref_idx(HEVCContext *s, int poc)
303 {
304     int i;
305     int LtMask = (1 << s->sps->log2_max_poc_lsb) - 1;
306
307     for (i = 0; i < FF_ARRAY_ELEMS(s->DPB); i++) {
308         HEVCFrame *ref = &s->DPB[i];
309         if (ref->frame->buf[0] && (ref->sequence == s->seq_decode)) {
310             if ((ref->poc & LtMask) == poc)
311                 return ref;
312         }
313     }
314
315     for (i = 0; i < FF_ARRAY_ELEMS(s->DPB); i++) {
316         HEVCFrame *ref = &s->DPB[i];
317         if (ref->frame->buf[0] && ref->sequence == s->seq_decode) {
318             if (ref->poc == poc || (ref->poc & LtMask) == poc)
319                 return ref;
320         }
321     }
322
323     av_log(s->avctx, AV_LOG_ERROR,
324            "Could not find ref with POC %d\n", poc);
325     return NULL;
326 }
327
328 static void mark_ref(HEVCFrame *frame, int flag)
329 {
330     frame->flags &= ~(HEVC_FRAME_FLAG_LONG_REF | HEVC_FRAME_FLAG_SHORT_REF);
331     frame->flags |= flag;
332 }
333
334 static HEVCFrame *generate_missing_ref(HEVCContext *s, int poc)
335 {
336     HEVCFrame *frame;
337     int i, x, y;
338
339     frame = alloc_frame(s);
340     if (!frame)
341         return NULL;
342
343     if (!s->sps->pixel_shift) {
344         for (i = 0; frame->frame->buf[i]; i++)
345             memset(frame->frame->buf[i]->data, 1 << (s->sps->bit_depth - 1),
346                    frame->frame->buf[i]->size);
347     } else {
348         for (i = 0; frame->frame->data[i]; i++)
349             for (y = 0; y < (s->sps->height >> s->sps->vshift[i]); y++)
350                 for (x = 0; x < (s->sps->width >> s->sps->hshift[i]); x++) {
351                     AV_WN16(frame->frame->data[i] + y * frame->frame->linesize[i] + 2 * x,
352                             1 << (s->sps->bit_depth - 1));
353                 }
354     }
355
356     frame->poc      = poc;
357     frame->sequence = s->seq_decode;
358     frame->flags    = 0;
359
360     ff_thread_report_progress(&frame->tf, INT_MAX, 0);
361
362     return frame;
363 }
364
365 /* add a reference with the given poc to the list and mark it as used in DPB */
366 static int add_candidate_ref(HEVCContext *s, RefPicList *list,
367                              int poc, int ref_flag)
368 {
369     HEVCFrame *ref = find_ref_idx(s, poc);
370
371     if (ref == s->ref)
372         return AVERROR_INVALIDDATA;
373
374     if (!ref) {
375         ref = generate_missing_ref(s, poc);
376         if (!ref)
377             return AVERROR(ENOMEM);
378     }
379
380     list->list[list->nb_refs] = ref->poc;
381     list->ref[list->nb_refs]  = ref;
382     list->nb_refs++;
383
384     mark_ref(ref, ref_flag);
385     return 0;
386 }
387
388 int ff_hevc_frame_rps(HEVCContext *s)
389 {
390     const ShortTermRPS *short_rps = s->sh.short_term_rps;
391     const LongTermRPS  *long_rps  = &s->sh.long_term_rps;
392     RefPicList               *rps = s->rps;
393     int i, ret;
394
395     if (!short_rps) {
396         rps[0].nb_refs = rps[1].nb_refs = 0;
397         return 0;
398     }
399
400     /* clear the reference flags on all frames except the current one */
401     for (i = 0; i < FF_ARRAY_ELEMS(s->DPB); i++) {
402         HEVCFrame *frame = &s->DPB[i];
403
404         if (frame == s->ref)
405             continue;
406
407         mark_ref(frame, 0);
408     }
409
410     for (i = 0; i < NB_RPS_TYPE; i++)
411         rps[i].nb_refs = 0;
412
413     /* add the short refs */
414     for (i = 0; i < short_rps->num_delta_pocs; i++) {
415         int poc = s->poc + short_rps->delta_poc[i];
416         int list;
417
418         if (!short_rps->used[i])
419             list = ST_FOLL;
420         else if (i < short_rps->num_negative_pics)
421             list = ST_CURR_BEF;
422         else
423             list = ST_CURR_AFT;
424
425         ret = add_candidate_ref(s, &rps[list], poc, HEVC_FRAME_FLAG_SHORT_REF);
426         if (ret < 0)
427             return ret;
428     }
429
430     /* add the long refs */
431     for (i = 0; i < long_rps->nb_refs; i++) {
432         int poc  = long_rps->poc[i];
433         int list = long_rps->used[i] ? LT_CURR : LT_FOLL;
434
435         ret = add_candidate_ref(s, &rps[list], poc, HEVC_FRAME_FLAG_LONG_REF);
436         if (ret < 0)
437             return ret;
438     }
439
440     /* release any frames that are now unused */
441     for (i = 0; i < FF_ARRAY_ELEMS(s->DPB); i++)
442         ff_hevc_unref_frame(s, &s->DPB[i], 0);
443
444     return 0;
445 }
446
447 int ff_hevc_compute_poc(HEVCContext *s, int poc_lsb)
448 {
449     int max_poc_lsb  = 1 << s->sps->log2_max_poc_lsb;
450     int prev_poc_lsb = s->pocTid0 % max_poc_lsb;
451     int prev_poc_msb = s->pocTid0 - prev_poc_lsb;
452     int poc_msb;
453
454     if (poc_lsb < prev_poc_lsb && prev_poc_lsb - poc_lsb >= max_poc_lsb / 2)
455         poc_msb = prev_poc_msb + max_poc_lsb;
456     else if (poc_lsb > prev_poc_lsb && poc_lsb - prev_poc_lsb > max_poc_lsb / 2)
457         poc_msb = prev_poc_msb - max_poc_lsb;
458     else
459         poc_msb = prev_poc_msb;
460
461     // For BLA picture types, POCmsb is set to 0.
462     if (s->nal_unit_type == NAL_BLA_W_LP   ||
463         s->nal_unit_type == NAL_BLA_W_RADL ||
464         s->nal_unit_type == NAL_BLA_N_LP)
465         poc_msb = 0;
466
467     return poc_msb + poc_lsb;
468 }
469
470 int ff_hevc_frame_nb_refs(HEVCContext *s)
471 {
472     int ret = 0;
473     int i;
474     const ShortTermRPS *rps = s->sh.short_term_rps;
475     LongTermRPS *long_rps   = &s->sh.long_term_rps;
476
477     if (rps) {
478         for (i = 0; i < rps->num_negative_pics; i++)
479             ret += !!rps->used[i];
480         for (; i < rps->num_delta_pocs; i++)
481             ret += !!rps->used[i];
482     }
483
484     if (long_rps) {
485         for (i = 0; i < long_rps->nb_refs; i++)
486             ret += !!long_rps->used[i];
487     }
488     return ret;
489 }