]> git.sesse.net Git - ffmpeg/blob - libavcodec/h264_mp4toannexb_bsf.c
lavc: introduce a new decoding/encoding API with decoupled input/output
[ffmpeg] / libavcodec / h264_mp4toannexb_bsf.c
1 /*
2  * H.264 MP4 to Annex B byte stream format filter
3  * Copyright (c) 2007 Benoit Fouet <benoit.fouet@free.fr>
4  *
5  * This file is part of Libav.
6  *
7  * Libav is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * Libav is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with Libav; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include <string.h>
23
24 #include "libavutil/intreadwrite.h"
25 #include "libavutil/mem.h"
26
27 #include "avcodec.h"
28 #include "bsf.h"
29
30 typedef struct H264BSFContext {
31     uint8_t  length_size;
32     uint8_t  first_idr;
33     int      extradata_parsed;
34 } H264BSFContext;
35
36 static int alloc_and_copy(AVPacket *out,
37                           const uint8_t *sps_pps, uint32_t sps_pps_size,
38                           const uint8_t *in, uint32_t in_size)
39 {
40     uint32_t offset         = out->size;
41     uint8_t nal_header_size = offset ? 3 : 4;
42     int err;
43
44     err = av_grow_packet(out, sps_pps_size + in_size + nal_header_size);
45     if (err < 0)
46         return err;
47
48     if (sps_pps)
49         memcpy(out->data + offset, sps_pps, sps_pps_size);
50     memcpy(out->data + sps_pps_size + nal_header_size + offset, in, in_size);
51     if (!offset) {
52         AV_WB32(out->data + sps_pps_size, 1);
53     } else {
54         (out->data + offset + sps_pps_size)[0] =
55         (out->data + offset + sps_pps_size)[1] = 0;
56         (out->data + offset + sps_pps_size)[2] = 1;
57     }
58
59     return 0;
60 }
61
62 static int h264_extradata_to_annexb(AVBSFContext *ctx, const int padding)
63 {
64     uint16_t unit_size;
65     uint64_t total_size                 = 0;
66     uint8_t *out                        = NULL, unit_nb, sps_done = 0,
67              sps_seen                   = 0, pps_seen = 0;
68     const uint8_t *extradata            = ctx->par_in->extradata + 4;
69     static const uint8_t nalu_header[4] = { 0, 0, 0, 1 };
70     int length_size = (*extradata++ & 0x3) + 1; // retrieve length coded size
71
72     if (length_size == 3)
73         return AVERROR(EINVAL);
74
75     /* retrieve sps and pps unit(s) */
76     unit_nb = *extradata++ & 0x1f; /* number of sps unit(s) */
77     if (!unit_nb) {
78         unit_nb = *extradata++; /* number of pps unit(s) */
79         sps_done++;
80
81         if (unit_nb)
82             pps_seen = 1;
83     } else {
84         sps_seen = 1;
85     }
86
87     while (unit_nb--) {
88         int err;
89
90         unit_size   = AV_RB16(extradata);
91         total_size += unit_size + 4;
92         if (total_size > INT_MAX - padding ||
93             extradata + 2 + unit_size > ctx->par_in->extradata +
94             ctx->par_in->extradata_size) {
95             av_free(out);
96             return AVERROR(EINVAL);
97         }
98         if ((err = av_reallocp(&out, total_size + padding)) < 0)
99             return err;
100         memcpy(out + total_size - unit_size - 4, nalu_header, 4);
101         memcpy(out + total_size - unit_size, extradata + 2, unit_size);
102         extradata += 2 + unit_size;
103
104         if (!unit_nb && !sps_done++) {
105             unit_nb = *extradata++; /* number of pps unit(s) */
106             if (unit_nb)
107                 pps_seen = 1;
108         }
109     }
110
111     if (out)
112         memset(out + total_size, 0, AV_INPUT_BUFFER_PADDING_SIZE);
113
114     if (!sps_seen)
115         av_log(ctx, AV_LOG_WARNING,
116                "Warning: SPS NALU missing or invalid. "
117                "The resulting stream may not play.\n");
118
119     if (!pps_seen)
120         av_log(ctx, AV_LOG_WARNING,
121                "Warning: PPS NALU missing or invalid. "
122                "The resulting stream may not play.\n");
123
124     av_freep(&ctx->par_out->extradata);
125     ctx->par_out->extradata      = out;
126     ctx->par_out->extradata_size = total_size;
127
128     return length_size;
129 }
130
131 static int h264_mp4toannexb_init(AVBSFContext *ctx)
132 {
133     H264BSFContext *s = ctx->priv_data;
134     int ret;
135
136     /* retrieve sps and pps NAL units from extradata */
137     if (ctx->par_in->extradata_size >= 6) {
138         ret = h264_extradata_to_annexb(ctx, AV_INPUT_BUFFER_PADDING_SIZE);
139         if (ret < 0)
140             return ret;
141
142         s->length_size      = ret;
143         s->first_idr        = 1;
144         s->extradata_parsed = 1;
145     }
146
147     return 0;
148 }
149
150 static int h264_mp4toannexb_filter(AVBSFContext *ctx, AVPacket *out)
151 {
152     H264BSFContext *s = ctx->priv_data;
153
154     AVPacket *in;
155     uint8_t unit_type;
156     int32_t nal_size;
157     uint32_t cumul_size    = 0;
158     const uint8_t *buf;
159     const uint8_t *buf_end;
160     int            buf_size;
161     int ret = 0;
162
163     ret = ff_bsf_get_packet(ctx, &in);
164     if (ret < 0)
165         return ret;
166
167     /* nothing to filter */
168     if (!s->extradata_parsed) {
169         av_packet_move_ref(out, in);
170         av_packet_free(&in);
171         return 0;
172     }
173
174     buf      = in->data;
175     buf_size = in->size;
176     buf_end  = in->data + in->size;
177
178     do {
179         if (buf + s->length_size > buf_end)
180             goto fail;
181
182         if (s->length_size == 1) {
183             nal_size = buf[0];
184         } else if (s->length_size == 2) {
185             nal_size = AV_RB16(buf);
186         } else
187             nal_size = AV_RB32(buf);
188
189         buf += s->length_size;
190         unit_type = *buf & 0x1f;
191
192         if (buf + nal_size > buf_end || nal_size < 0)
193             goto fail;
194
195         /* prepend only to the first type 5 NAL unit of an IDR picture */
196         if (s->first_idr && unit_type == 5) {
197             if (alloc_and_copy(out,
198                                ctx->par_out->extradata, ctx->par_out->extradata_size,
199                                buf, nal_size) < 0)
200                 goto fail;
201             s->first_idr = 0;
202         } else {
203             if (alloc_and_copy(out,
204                                NULL, 0, buf, nal_size) < 0)
205                 goto fail;
206             if (!s->first_idr && unit_type == 1)
207                 s->first_idr = 1;
208         }
209
210         buf        += nal_size;
211         cumul_size += nal_size + s->length_size;
212     } while (cumul_size < buf_size);
213
214     ret = av_packet_copy_props(out, in);
215     if (ret < 0)
216         goto fail;
217
218 fail:
219     if (ret < 0)
220         av_packet_unref(out);
221     av_packet_free(&in);
222
223     return ret;
224 }
225
226 static const enum AVCodecID codec_ids[] = {
227     AV_CODEC_ID_H264, AV_CODEC_ID_NONE,
228 };
229
230 const AVBitStreamFilter ff_h264_mp4toannexb_bsf = {
231     .name           = "h264_mp4toannexb",
232     .priv_data_size = sizeof(H264BSFContext),
233     .init           = h264_mp4toannexb_init,
234     .filter         = h264_mp4toannexb_filter,
235     .codec_ids      = codec_ids,
236 };