]> git.sesse.net Git - ffmpeg/blob - libavformat/isom.h
mov: Move code shared with CAF to a separate file
[ffmpeg] / libavformat / isom.h
1 /*
2  * ISO Media common code
3  * copyright (c) 2001 Fabrice Bellard
4  * copyright (c) 2002 Francois Revol <revol@free.fr>
5  * copyright (c) 2006 Baptiste Coudurier <baptiste.coudurier@free.fr>
6  *
7  * This file is part of Libav.
8  *
9  * Libav is free software; you can redistribute it and/or
10  * modify it under the terms of the GNU Lesser General Public
11  * License as published by the Free Software Foundation; either
12  * version 2.1 of the License, or (at your option) any later version.
13  *
14  * Libav is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
17  * Lesser General Public License for more details.
18  *
19  * You should have received a copy of the GNU Lesser General Public
20  * License along with Libav; if not, write to the Free Software
21  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
22  */
23
24 #ifndef AVFORMAT_ISOM_H
25 #define AVFORMAT_ISOM_H
26
27 #include <stddef.h>
28 #include <stdint.h>
29
30 #include "libavutil/spherical.h"
31 #include "libavutil/stereo3d.h"
32
33 #include "avio.h"
34 #include "internal.h"
35 #include "dv.h"
36
37 /* isom.c */
38 extern const AVCodecTag ff_mp4_obj_type[];
39 extern const AVCodecTag ff_codec_movvideo_tags[];
40 extern const AVCodecTag ff_codec_movaudio_tags[];
41 extern const AVCodecTag ff_codec_movsubtitle_tags[];
42
43 int ff_mov_iso639_to_lang(const char lang[4], int mp4);
44 int ff_mov_lang_to_iso639(unsigned code, char to[4]);
45
46 /* the QuickTime file format is quite convoluted...
47  * it has lots of index tables, each indexing something in another one...
48  * Here we just use what is needed to read the chunks
49  */
50
51 typedef struct MOVStts {
52     int count;
53     int duration;
54 } MOVStts;
55
56 typedef struct MOVStsc {
57     int first;
58     int count;
59     int id;
60 } MOVStsc;
61
62 typedef struct MOVDref {
63     uint32_t type;
64     char *path;
65     char *dir;
66     char volume[28];
67     char filename[64];
68     int16_t nlvl_to, nlvl_from;
69 } MOVDref;
70
71 typedef struct MOVAtom {
72     uint32_t type;
73     int64_t size; /* total size (excluding the size and type fields) */
74 } MOVAtom;
75
76 struct MOVParseTableEntry;
77
78 typedef struct MOVFragment {
79     unsigned track_id;
80     uint64_t base_data_offset;
81     uint64_t moof_offset;
82     uint64_t implicit_offset;
83     unsigned stsd_id;
84     unsigned duration;
85     unsigned size;
86     unsigned flags;
87 } MOVFragment;
88
89 typedef struct MOVTrackExt {
90     unsigned track_id;
91     unsigned stsd_id;
92     unsigned duration;
93     unsigned size;
94     unsigned flags;
95 } MOVTrackExt;
96
97 typedef struct MOVSbgp {
98     unsigned int count;
99     unsigned int index;
100 } MOVSbgp;
101
102 typedef struct MOVStreamContext {
103     AVIOContext *pb;
104     int ffindex;          ///< AVStream index
105     int next_chunk;
106     unsigned int chunk_count;
107     int64_t *chunk_offsets;
108     unsigned int stts_count;
109     MOVStts *stts_data;
110     unsigned int ctts_count;
111     MOVStts *ctts_data;
112     unsigned int stsc_count;
113     MOVStsc *stsc_data;
114     unsigned int stsc_index;
115     int stsc_sample;
116     unsigned int stps_count;
117     unsigned *stps_data;  ///< partial sync sample for mpeg-2 open gop
118     int ctts_index;
119     int ctts_sample;
120     unsigned int sample_size;
121     unsigned int sample_count;
122     int *sample_sizes;
123     int keyframe_absent;
124     unsigned int keyframe_count;
125     int *keyframes;
126     int time_scale;
127     int64_t time_offset;  ///< time offset of the first edit list entry
128     int current_sample;
129     unsigned int bytes_per_frame;
130     unsigned int samples_per_frame;
131     int dv_audio_container;
132     int pseudo_stream_id; ///< -1 means demux all ids
133     int16_t audio_cid;    ///< stsd audio compression id
134     unsigned drefs_count;
135     MOVDref *drefs;
136     int dref_id;
137     int width;            ///< tkhd width
138     int height;           ///< tkhd height
139     int dts_shift;        ///< dts shift when ctts is negative
140     uint32_t palette[256];
141     int has_palette;
142     int64_t data_size;
143     int64_t track_end;    ///< used for dts generation in fragmented movie files
144     unsigned int rap_group_count;
145     MOVSbgp *rap_group;
146
147     /** extradata array (and size) for multiple stsd */
148     uint8_t **extradata;
149     int *extradata_size;
150     int last_stsd_index;
151     int stsd_count;
152
153     int32_t *display_matrix;
154     AVStereo3D *stereo3d;
155     AVSphericalMapping *spherical;
156     size_t spherical_size;
157 } MOVStreamContext;
158
159 typedef struct MOVContext {
160     const AVClass *class; ///< class for private options
161     AVFormatContext *fc;
162     int time_scale;
163     int64_t duration;     ///< duration of the longest track
164     int found_moov;       ///< 'moov' atom has been found
165     int found_mdat;       ///< 'mdat' atom has been found
166     DVDemuxContext *dv_demux;
167     AVFormatContext *dv_fctx;
168     int isom;             ///< 1 if file is ISO Media (mp4/3gp)
169     MOVFragment fragment; ///< current fragment in moof atom
170     MOVTrackExt *trex_data;
171     unsigned trex_count;
172     int itunes_metadata;  ///< metadata are itunes style
173     int chapter_track;
174     int seek_individually;
175     int64_t next_root_atom; ///< offset of the next root atom
176     int export_all;
177     int export_xmp;
178     int enable_drefs;
179
180     int32_t movie_display_matrix[3][3]; ///< display matrix from mvhd
181 } MOVContext;
182
183 int ff_mp4_read_descr_len(AVIOContext *pb);
184 int ff_mp4_read_descr(AVFormatContext *fc, AVIOContext *pb, int *tag);
185 int ff_mp4_read_dec_config_descr(AVFormatContext *fc, AVStream *st, AVIOContext *pb);
186 void ff_mp4_parse_es_descr(AVIOContext *pb, int *es_id);
187
188 #define MP4ODescrTag                    0x01
189 #define MP4IODescrTag                   0x02
190 #define MP4ESDescrTag                   0x03
191 #define MP4DecConfigDescrTag            0x04
192 #define MP4DecSpecificDescrTag          0x05
193 #define MP4SLDescrTag                   0x06
194
195 #define MOV_TFHD_BASE_DATA_OFFSET       0x01
196 #define MOV_TFHD_STSD_ID                0x02
197 #define MOV_TFHD_DEFAULT_DURATION       0x08
198 #define MOV_TFHD_DEFAULT_SIZE           0x10
199 #define MOV_TFHD_DEFAULT_FLAGS          0x20
200 #define MOV_TFHD_DURATION_IS_EMPTY  0x010000
201 #define MOV_TFHD_DEFAULT_BASE_IS_MOOF 0x020000
202
203 #define MOV_TRUN_DATA_OFFSET            0x01
204 #define MOV_TRUN_FIRST_SAMPLE_FLAGS     0x04
205 #define MOV_TRUN_SAMPLE_DURATION       0x100
206 #define MOV_TRUN_SAMPLE_SIZE           0x200
207 #define MOV_TRUN_SAMPLE_FLAGS          0x400
208 #define MOV_TRUN_SAMPLE_CTS            0x800
209
210 #define MOV_FRAG_SAMPLE_FLAG_DEGRADATION_PRIORITY_MASK 0x0000ffff
211 #define MOV_FRAG_SAMPLE_FLAG_IS_NON_SYNC               0x00010000
212 #define MOV_FRAG_SAMPLE_FLAG_PADDING_MASK              0x000e0000
213 #define MOV_FRAG_SAMPLE_FLAG_REDUNDANCY_MASK           0x00300000
214 #define MOV_FRAG_SAMPLE_FLAG_DEPENDED_MASK             0x00c00000
215 #define MOV_FRAG_SAMPLE_FLAG_DEPENDS_MASK              0x03000000
216
217 #define MOV_FRAG_SAMPLE_FLAG_DEPENDS_NO                0x02000000
218 #define MOV_FRAG_SAMPLE_FLAG_DEPENDS_YES               0x01000000
219
220 #define MOV_TKHD_FLAG_ENABLED       0x0001
221 #define MOV_TKHD_FLAG_IN_MOVIE      0x0002
222 #define MOV_TKHD_FLAG_IN_PREVIEW    0x0004
223 #define MOV_TKHD_FLAG_IN_POSTER     0x0008
224
225 #define TAG_IS_AVCI(tag)                    \
226     ((tag) == MKTAG('a', 'i', '5', 'p') ||  \
227      (tag) == MKTAG('a', 'i', '5', 'q') ||  \
228      (tag) == MKTAG('a', 'i', '5', '2') ||  \
229      (tag) == MKTAG('a', 'i', '5', '3') ||  \
230      (tag) == MKTAG('a', 'i', '5', '5') ||  \
231      (tag) == MKTAG('a', 'i', '5', '6') ||  \
232      (tag) == MKTAG('a', 'i', '1', 'p') ||  \
233      (tag) == MKTAG('a', 'i', '1', 'q') ||  \
234      (tag) == MKTAG('a', 'i', '1', '2') ||  \
235      (tag) == MKTAG('a', 'i', '1', '3') ||  \
236      (tag) == MKTAG('a', 'i', '1', '5') ||  \
237      (tag) == MKTAG('a', 'i', '1', '6') ||  \
238      (tag) == MKTAG('A', 'V', 'i', 'n'))
239
240
241 int ff_mov_read_esds(AVFormatContext *fc, AVIOContext *pb);
242
243 int ff_mov_read_stsd_entries(MOVContext *c, AVIOContext *pb, int entries);
244
245 /**
246  * Compute codec id for 'lpcm' tag.
247  * See CoreAudioTypes and AudioStreamBasicDescription at Apple.
248  */
249 static inline enum AVCodecID ff_mov_get_lpcm_codec_id(int bps, int flags)
250 {
251     /* lpcm flags:
252      * 0x1 = float
253      * 0x2 = big-endian
254      * 0x4 = signed
255      */
256     return ff_get_pcm_codec_id(bps, flags & 1, flags & 2, flags & 4 ? -1 : 0);
257 }
258
259 #endif /* AVFORMAT_ISOM_H */