]> git.sesse.net Git - ffmpeg/blob - libavformat/isom.h
Merge commit 'ec32574209f36467ef0d22c21a7e811ba98c15b6'
[ffmpeg] / libavformat / isom.h
1 /*
2  * ISO Media common code
3  * copyright (c) 2001 Fabrice Bellard
4  * copyright (c) 2002 Francois Revol <revol@free.fr>
5  * copyright (c) 2006 Baptiste Coudurier <baptiste.coudurier@free.fr>
6  *
7  * This file is part of FFmpeg.
8  *
9  * FFmpeg is free software; you can redistribute it and/or
10  * modify it under the terms of the GNU Lesser General Public
11  * License as published by the Free Software Foundation; either
12  * version 2.1 of the License, or (at your option) any later version.
13  *
14  * FFmpeg is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
17  * Lesser General Public License for more details.
18  *
19  * You should have received a copy of the GNU Lesser General Public
20  * License along with FFmpeg; if not, write to the Free Software
21  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
22  */
23
24 #ifndef AVFORMAT_ISOM_H
25 #define AVFORMAT_ISOM_H
26
27 #include "avio.h"
28 #include "internal.h"
29 #include "dv.h"
30
31 /* isom.c */
32 extern const AVCodecTag ff_mp4_obj_type[];
33 extern const AVCodecTag ff_codec_movvideo_tags[];
34 extern const AVCodecTag ff_codec_movaudio_tags[];
35 extern const AVCodecTag ff_codec_movsubtitle_tags[];
36
37 int ff_mov_iso639_to_lang(const char lang[4], int mp4);
38 int ff_mov_lang_to_iso639(unsigned code, char to[4]);
39
40 struct AVAESCTR;
41
42 /* the QuickTime file format is quite convoluted...
43  * it has lots of index tables, each indexing something in another one...
44  * Here we just use what is needed to read the chunks
45  */
46
47 typedef struct MOVStts {
48     int count;
49     int duration;
50 } MOVStts;
51
52 typedef struct MOVStsc {
53     int first;
54     int count;
55     int id;
56 } MOVStsc;
57
58 typedef struct MOVElst {
59     int64_t duration;
60     int64_t time;
61     float rate;
62 } MOVElst;
63
64 typedef struct MOVDref {
65     uint32_t type;
66     char *path;
67     char *dir;
68     char volume[28];
69     char filename[64];
70     int16_t nlvl_to, nlvl_from;
71 } MOVDref;
72
73 typedef struct MOVAtom {
74     uint32_t type;
75     int64_t size; /* total size (excluding the size and type fields) */
76 } MOVAtom;
77
78 struct MOVParseTableEntry;
79
80 typedef struct MOVFragment {
81     unsigned track_id;
82     uint64_t base_data_offset;
83     uint64_t moof_offset;
84     uint64_t implicit_offset;
85     unsigned stsd_id;
86     unsigned duration;
87     unsigned size;
88     unsigned flags;
89     int64_t time;
90 } MOVFragment;
91
92 typedef struct MOVTrackExt {
93     unsigned track_id;
94     unsigned stsd_id;
95     unsigned duration;
96     unsigned size;
97     unsigned flags;
98 } MOVTrackExt;
99
100 typedef struct MOVSbgp {
101     unsigned int count;
102     unsigned int index;
103 } MOVSbgp;
104
105 typedef struct MOVFragmentIndexItem {
106     int64_t moof_offset;
107     int64_t time;
108     int headers_read;
109 } MOVFragmentIndexItem;
110
111 typedef struct MOVFragmentIndex {
112     unsigned track_id;
113     unsigned item_count;
114     unsigned current_item;
115     MOVFragmentIndexItem *items;
116 } MOVFragmentIndex;
117
118 typedef struct MOVStreamContext {
119     AVIOContext *pb;
120     int pb_is_copied;
121     int ffindex;          ///< AVStream index
122     int next_chunk;
123     unsigned int chunk_count;
124     int64_t *chunk_offsets;
125     unsigned int stts_count;
126     MOVStts *stts_data;
127     unsigned int ctts_count;
128     MOVStts *ctts_data;
129     unsigned int stsc_count;
130     MOVStsc *stsc_data;
131     int stsc_index;
132     int stsc_sample;
133     unsigned int stps_count;
134     unsigned *stps_data;  ///< partial sync sample for mpeg-2 open gop
135     MOVElst *elst_data;
136     unsigned int elst_count;
137     int ctts_index;
138     int ctts_sample;
139     unsigned int sample_size; ///< may contain value calculated from stsd or value from stsz atom
140     unsigned int stsz_sample_size; ///< always contains sample size from stsz atom
141     unsigned int sample_count;
142     int *sample_sizes;
143     int keyframe_absent;
144     unsigned int keyframe_count;
145     int *keyframes;
146     int time_scale;
147     int64_t time_offset;  ///< time offset of the edit list entries
148     int current_sample;
149     unsigned int bytes_per_frame;
150     unsigned int samples_per_frame;
151     int dv_audio_container;
152     int pseudo_stream_id; ///< -1 means demux all ids
153     int16_t audio_cid;    ///< stsd audio compression id
154     unsigned drefs_count;
155     MOVDref *drefs;
156     int dref_id;
157     int timecode_track;
158     int width;            ///< tkhd width
159     int height;           ///< tkhd height
160     int dts_shift;        ///< dts shift when ctts is negative
161     uint32_t palette[256];
162     int has_palette;
163     int64_t data_size;
164     uint32_t tmcd_flags;  ///< tmcd track flags
165     int64_t track_end;    ///< used for dts generation in fragmented movie files
166     int start_pad;        ///< amount of samples to skip due to enc-dec delay
167     unsigned int rap_group_count;
168     MOVSbgp *rap_group;
169
170     int nb_frames_for_fps;
171     int64_t duration_for_fps;
172
173     /** extradata array (and size) for multiple stsd */
174     uint8_t **extradata;
175     int *extradata_size;
176     int last_stsd_index;
177     int stsd_count;
178
179     int32_t *display_matrix;
180     uint32_t format;
181
182     int has_sidx;  // If there is an sidx entry for this stream.
183     struct {
184         int use_subsamples;
185         uint8_t* auxiliary_info;
186         uint8_t* auxiliary_info_end;
187         uint8_t* auxiliary_info_pos;
188         uint8_t auxiliary_info_default_size;
189         uint8_t* auxiliary_info_sizes;
190         size_t auxiliary_info_sizes_count;
191         struct AVAESCTR* aes_ctr;
192     } cenc;
193 } MOVStreamContext;
194
195 typedef struct MOVContext {
196     const AVClass *class; ///< class for private options
197     AVFormatContext *fc;
198     int time_scale;
199     int64_t duration;     ///< duration of the longest track
200     int found_moov;       ///< 'moov' atom has been found
201     int found_mdat;       ///< 'mdat' atom has been found
202     int found_hdlr_mdta;  ///< 'hdlr' atom with type 'mdta' has been found
203     int trak_index;       ///< Index of the current 'trak'
204     char **meta_keys;
205     unsigned meta_keys_count;
206     DVDemuxContext *dv_demux;
207     AVFormatContext *dv_fctx;
208     int isom;             ///< 1 if file is ISO Media (mp4/3gp)
209     MOVFragment fragment; ///< current fragment in moof atom
210     MOVTrackExt *trex_data;
211     unsigned trex_count;
212     int itunes_metadata;  ///< metadata are itunes style
213     int handbrake_version;
214     int *chapter_tracks;
215     unsigned int nb_chapter_tracks;
216     int use_absolute_path;
217     int ignore_editlist;
218     int ignore_chapters;
219     int seek_individually;
220     int64_t next_root_atom; ///< offset of the next root atom
221     int export_all;
222     int export_xmp;
223     int *bitrates;          ///< bitrates read before streams creation
224     int bitrates_count;
225     int moov_retry;
226     int use_mfra_for;
227     int has_looked_for_mfra;
228     MOVFragmentIndex** fragment_index_data;
229     unsigned fragment_index_count;
230     int fragment_index_complete;
231     int atom_depth;
232     unsigned int aax_mode;  ///< 'aax' file has been detected
233     uint8_t file_key[20];
234     uint8_t file_iv[20];
235     void *activation_bytes;
236     int activation_bytes_size;
237     void *audible_fixed_key;
238     int audible_fixed_key_size;
239     struct AVAES *aes_decrypt;
240     uint8_t *decryption_key;
241     int decryption_key_len;
242     int enable_drefs;
243 } MOVContext;
244
245 int ff_mp4_read_descr_len(AVIOContext *pb);
246 int ff_mp4_read_descr(AVFormatContext *fc, AVIOContext *pb, int *tag);
247 int ff_mp4_read_dec_config_descr(AVFormatContext *fc, AVStream *st, AVIOContext *pb);
248 void ff_mp4_parse_es_descr(AVIOContext *pb, int *es_id);
249
250 #define MP4ODescrTag                    0x01
251 #define MP4IODescrTag                   0x02
252 #define MP4ESDescrTag                   0x03
253 #define MP4DecConfigDescrTag            0x04
254 #define MP4DecSpecificDescrTag          0x05
255 #define MP4SLDescrTag                   0x06
256
257 #define MOV_TFHD_BASE_DATA_OFFSET       0x01
258 #define MOV_TFHD_STSD_ID                0x02
259 #define MOV_TFHD_DEFAULT_DURATION       0x08
260 #define MOV_TFHD_DEFAULT_SIZE           0x10
261 #define MOV_TFHD_DEFAULT_FLAGS          0x20
262 #define MOV_TFHD_DURATION_IS_EMPTY  0x010000
263 #define MOV_TFHD_DEFAULT_BASE_IS_MOOF 0x020000
264
265 #define MOV_TRUN_DATA_OFFSET            0x01
266 #define MOV_TRUN_FIRST_SAMPLE_FLAGS     0x04
267 #define MOV_TRUN_SAMPLE_DURATION       0x100
268 #define MOV_TRUN_SAMPLE_SIZE           0x200
269 #define MOV_TRUN_SAMPLE_FLAGS          0x400
270 #define MOV_TRUN_SAMPLE_CTS            0x800
271
272 #define MOV_FRAG_SAMPLE_FLAG_DEGRADATION_PRIORITY_MASK 0x0000ffff
273 #define MOV_FRAG_SAMPLE_FLAG_IS_NON_SYNC               0x00010000
274 #define MOV_FRAG_SAMPLE_FLAG_PADDING_MASK              0x000e0000
275 #define MOV_FRAG_SAMPLE_FLAG_REDUNDANCY_MASK           0x00300000
276 #define MOV_FRAG_SAMPLE_FLAG_DEPENDED_MASK             0x00c00000
277 #define MOV_FRAG_SAMPLE_FLAG_DEPENDS_MASK              0x03000000
278
279 #define MOV_FRAG_SAMPLE_FLAG_DEPENDS_NO                0x02000000
280 #define MOV_FRAG_SAMPLE_FLAG_DEPENDS_YES               0x01000000
281
282 #define MOV_TKHD_FLAG_ENABLED       0x0001
283 #define MOV_TKHD_FLAG_IN_MOVIE      0x0002
284 #define MOV_TKHD_FLAG_IN_PREVIEW    0x0004
285 #define MOV_TKHD_FLAG_IN_POSTER     0x0008
286
287 #define TAG_IS_AVCI(tag)                    \
288     ((tag) == MKTAG('a', 'i', '5', 'p') ||  \
289      (tag) == MKTAG('a', 'i', '5', 'q') ||  \
290      (tag) == MKTAG('a', 'i', '5', '2') ||  \
291      (tag) == MKTAG('a', 'i', '5', '3') ||  \
292      (tag) == MKTAG('a', 'i', '5', '5') ||  \
293      (tag) == MKTAG('a', 'i', '5', '6') ||  \
294      (tag) == MKTAG('a', 'i', '1', 'p') ||  \
295      (tag) == MKTAG('a', 'i', '1', 'q') ||  \
296      (tag) == MKTAG('a', 'i', '1', '2') ||  \
297      (tag) == MKTAG('a', 'i', '1', '3') ||  \
298      (tag) == MKTAG('a', 'i', '1', '5') ||  \
299      (tag) == MKTAG('a', 'i', '1', '6') ||  \
300      (tag) == MKTAG('a', 'i', 'v', 'x') ||  \
301      (tag) == MKTAG('A', 'V', 'i', 'n'))
302
303
304 int ff_mov_read_esds(AVFormatContext *fc, AVIOContext *pb);
305 enum AVCodecID ff_mov_get_lpcm_codec_id(int bps, int flags);
306
307 int ff_mov_read_stsd_entries(MOVContext *c, AVIOContext *pb, int entries);
308 void ff_mov_write_chan(AVIOContext *pb, int64_t channel_layout);
309
310 #define FF_MOV_FLAG_MFRA_AUTO -1
311 #define FF_MOV_FLAG_MFRA_DTS 1
312 #define FF_MOV_FLAG_MFRA_PTS 2
313
314 #endif /* AVFORMAT_ISOM_H */