]> git.sesse.net Git - ffmpeg/blob - libavcodec/av1_parser.c
avcodec/av1_parser: set context values outside the OBU parsing loop
[ffmpeg] / libavcodec / av1_parser.c
1 /*
2  * AV1 parser
3  *
4  * Copyright (C) 2018 James Almer <jamrial@gmail.com>
5  *
6  * This file is part of FFmpeg.
7  *
8  * FFmpeg is free software; you can redistribute it and/or
9  * modify it under the terms of the GNU Lesser General Public
10  * License as published by the Free Software Foundation; either
11  * version 2.1 of the License, or (at your option) any later version.
12  *
13  * FFmpeg is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16  * Lesser General Public License for more details.
17  *
18  * You should have received a copy of the GNU Lesser General Public
19  * License along with FFmpeg; if not, write to the Free Software
20  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
21  */
22
23 #include "av1_parse.h"
24 #include "cbs.h"
25 #include "cbs_av1.h"
26 #include "internal.h"
27 #include "parser.h"
28
29 typedef struct AV1ParseContext {
30     CodedBitstreamContext *cbc;
31     CodedBitstreamFragment temporal_unit;
32     int parsed_extradata;
33 } AV1ParseContext;
34
35 static const enum AVPixelFormat pix_fmts_8bit[2][2] = {
36     { AV_PIX_FMT_YUV444P, AV_PIX_FMT_NONE },
37     { AV_PIX_FMT_YUV422P, AV_PIX_FMT_YUV420P },
38 };
39 static const enum AVPixelFormat pix_fmts_10bit[2][2] = {
40     { AV_PIX_FMT_YUV444P10, AV_PIX_FMT_NONE },
41     { AV_PIX_FMT_YUV422P10, AV_PIX_FMT_YUV420P10 },
42 };
43 static const enum AVPixelFormat pix_fmts_12bit[2][2] = {
44     { AV_PIX_FMT_YUV444P12, AV_PIX_FMT_NONE },
45     { AV_PIX_FMT_YUV422P12, AV_PIX_FMT_YUV420P12 },
46 };
47
48 static int av1_parser_parse(AVCodecParserContext *ctx,
49                             AVCodecContext *avctx,
50                             const uint8_t **out_data, int *out_size,
51                             const uint8_t *data, int size)
52 {
53     AV1ParseContext *s = ctx->priv_data;
54     CodedBitstreamFragment *td = &s->temporal_unit;
55     CodedBitstreamAV1Context *av1 = s->cbc->priv_data;
56     AV1RawSequenceHeader *seq;
57     AV1RawColorConfig *color;
58     int ret;
59
60     *out_data = data;
61     *out_size = size;
62
63     ctx->key_frame         = -1;
64     ctx->pict_type         = AV_PICTURE_TYPE_NONE;
65     ctx->picture_structure = AV_PICTURE_STRUCTURE_UNKNOWN;
66
67     s->cbc->log_ctx = avctx;
68
69     if (avctx->extradata_size && !s->parsed_extradata) {
70         s->parsed_extradata = 1;
71
72         ret = ff_cbs_read(s->cbc, td, avctx->extradata, avctx->extradata_size);
73         if (ret < 0) {
74             av_log(avctx, AV_LOG_WARNING, "Failed to parse extradata.\n");
75         }
76
77         ff_cbs_fragment_reset(s->cbc, td);
78     }
79
80     ret = ff_cbs_read(s->cbc, td, data, size);
81     if (ret < 0) {
82         av_log(avctx, AV_LOG_ERROR, "Failed to parse temporal unit.\n");
83         goto end;
84     }
85
86     if (!av1->sequence_header) {
87         av_log(avctx, AV_LOG_ERROR, "No sequence header available\n");
88         goto end;
89     }
90
91     seq = av1->sequence_header;
92     color = &seq->color_config;
93
94     for (int i = 0; i < td->nb_units; i++) {
95         CodedBitstreamUnit *unit = &td->units[i];
96         AV1RawOBU *obu = unit->content;
97         AV1RawFrameHeader *frame;
98         int frame_type;
99
100         if (unit->type == AV1_OBU_FRAME)
101             frame = &obu->obu.frame.header;
102         else if (unit->type == AV1_OBU_FRAME_HEADER)
103             frame = &obu->obu.frame_header;
104         else
105             continue;
106
107         if (obu->header.spatial_id > 0)
108             continue;
109
110         if (frame->show_existing_frame) {
111             AV1ReferenceFrameState *ref = &av1->ref[frame->frame_to_show_map_idx];
112
113             if (!ref->valid) {
114                 av_log(avctx, AV_LOG_ERROR, "Invalid reference frame\n");
115                 goto end;
116             }
117
118             ctx->width  = ref->frame_width;
119             ctx->height = ref->frame_height;
120             frame_type  = ref->frame_type;
121
122             ctx->key_frame = 0;
123         } else if (!frame->show_frame) {
124             continue;
125         } else {
126             ctx->width  = av1->frame_width;
127             ctx->height = av1->frame_height;
128             frame_type  = frame->frame_type;
129
130             ctx->key_frame = frame_type == AV1_FRAME_KEY;
131         }
132
133         switch (frame_type) {
134         case AV1_FRAME_KEY:
135         case AV1_FRAME_INTRA_ONLY:
136             ctx->pict_type = AV_PICTURE_TYPE_I;
137             break;
138         case AV1_FRAME_INTER:
139             ctx->pict_type = AV_PICTURE_TYPE_P;
140             break;
141         case AV1_FRAME_SWITCH:
142             ctx->pict_type = AV_PICTURE_TYPE_SP;
143             break;
144         }
145         ctx->picture_structure = AV_PICTURE_STRUCTURE_FRAME;
146     }
147
148     switch (av1->bit_depth) {
149     case 8:
150         ctx->format = color->mono_chrome ? AV_PIX_FMT_GRAY8
151                                          : pix_fmts_8bit [color->subsampling_x][color->subsampling_y];
152         break;
153     case 10:
154         ctx->format = color->mono_chrome ? AV_PIX_FMT_GRAY10
155                                          : pix_fmts_10bit[color->subsampling_x][color->subsampling_y];
156         break;
157     case 12:
158         ctx->format = color->mono_chrome ? AV_PIX_FMT_GRAY12
159                                          : pix_fmts_12bit[color->subsampling_x][color->subsampling_y];
160         break;
161     }
162     av_assert2(ctx->format != AV_PIX_FMT_NONE);
163
164     avctx->profile = seq->seq_profile;
165     avctx->level   = seq->seq_level_idx[0];
166
167     avctx->colorspace = (enum AVColorSpace) color->matrix_coefficients;
168     avctx->color_primaries = (enum AVColorPrimaries) color->color_primaries;
169     avctx->color_trc = (enum AVColorTransferCharacteristic) color->transfer_characteristics;
170     avctx->color_range = color->color_range ? AVCOL_RANGE_JPEG : AVCOL_RANGE_MPEG;
171
172     if (ctx->width != avctx->width || ctx->height != avctx->height) {
173         ret = ff_set_dimensions(avctx, ctx->width, ctx->height);
174         if (ret < 0)
175             goto end;
176     }
177
178     if (avctx->framerate.num)
179         avctx->time_base = av_inv_q(av_mul_q(avctx->framerate, (AVRational){avctx->ticks_per_frame, 1}));
180
181 end:
182     ff_cbs_fragment_reset(s->cbc, td);
183
184     s->cbc->log_ctx = NULL;
185
186     return size;
187 }
188
189 static const CodedBitstreamUnitType decompose_unit_types[] = {
190     AV1_OBU_TEMPORAL_DELIMITER,
191     AV1_OBU_SEQUENCE_HEADER,
192     AV1_OBU_FRAME_HEADER,
193     AV1_OBU_TILE_GROUP,
194     AV1_OBU_FRAME,
195 };
196
197 static av_cold int av1_parser_init(AVCodecParserContext *ctx)
198 {
199     AV1ParseContext *s = ctx->priv_data;
200     int ret;
201
202     ret = ff_cbs_init(&s->cbc, AV_CODEC_ID_AV1, NULL);
203     if (ret < 0)
204         return ret;
205
206     s->cbc->decompose_unit_types    = (CodedBitstreamUnitType *)decompose_unit_types;
207     s->cbc->nb_decompose_unit_types = FF_ARRAY_ELEMS(decompose_unit_types);
208
209     return 0;
210 }
211
212 static void av1_parser_close(AVCodecParserContext *ctx)
213 {
214     AV1ParseContext *s = ctx->priv_data;
215
216     ff_cbs_fragment_free(s->cbc, &s->temporal_unit);
217     ff_cbs_close(&s->cbc);
218 }
219
220 static int av1_parser_split(AVCodecContext *avctx,
221                             const uint8_t *buf, int buf_size)
222 {
223     AV1OBU obu;
224     const uint8_t *ptr = buf, *end = buf + buf_size;
225
226     while (ptr < end) {
227         int len = ff_av1_extract_obu(&obu, ptr, buf_size, avctx);
228         if (len < 0)
229             break;
230
231         if (obu.type == AV1_OBU_FRAME_HEADER ||
232             obu.type == AV1_OBU_FRAME) {
233             return ptr - buf;
234         }
235         ptr      += len;
236         buf_size -= len;
237     }
238
239     return 0;
240 }
241
242 AVCodecParser ff_av1_parser = {
243     .codec_ids      = { AV_CODEC_ID_AV1 },
244     .priv_data_size = sizeof(AV1ParseContext),
245     .parser_init    = av1_parser_init,
246     .parser_close   = av1_parser_close,
247     .parser_parse   = av1_parser_parse,
248     .split          = av1_parser_split,
249 };