]> git.sesse.net Git - ffmpeg/blob - avconv.h
h264: Fix decoding delay for Intra only streams
[ffmpeg] / avconv.h
1 /*
2  * This file is part of Libav.
3  *
4  * Libav is free software; you can redistribute it and/or
5  * modify it under the terms of the GNU Lesser General Public
6  * License as published by the Free Software Foundation; either
7  * version 2.1 of the License, or (at your option) any later version.
8  *
9  * Libav is distributed in the hope that it will be useful,
10  * but WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
12  * Lesser General Public License for more details.
13  *
14  * You should have received a copy of the GNU Lesser General Public
15  * License along with Libav; if not, write to the Free Software
16  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
17  */
18
19 #ifndef AVCONV_H
20 #define AVCONV_H
21
22 #include "config.h"
23
24 #include <stdint.h>
25 #include <stdio.h>
26
27 #if HAVE_PTHREADS
28 #include <pthread.h>
29 #endif
30
31 #include "cmdutils.h"
32
33 #include "libavformat/avformat.h"
34 #include "libavformat/avio.h"
35
36 #include "libavcodec/avcodec.h"
37
38 #include "libavfilter/avfilter.h"
39
40 #include "libavutil/avutil.h"
41 #include "libavutil/dict.h"
42 #include "libavutil/fifo.h"
43 #include "libavutil/pixfmt.h"
44 #include "libavutil/rational.h"
45
46 #define VSYNC_AUTO       -1
47 #define VSYNC_PASSTHROUGH 0
48 #define VSYNC_CFR         1
49 #define VSYNC_VFR         2
50
51 enum HWAccelID {
52     HWACCEL_NONE = 0,
53     HWACCEL_AUTO,
54     HWACCEL_VDPAU,
55     HWACCEL_DXVA2,
56     HWACCEL_VDA,
57     HWACCEL_QSV,
58     HWACCEL_VAAPI,
59 };
60
61 typedef struct HWAccel {
62     const char *name;
63     int (*init)(AVCodecContext *s);
64     enum HWAccelID id;
65     enum AVPixelFormat pix_fmt;
66 } HWAccel;
67
68 /* select an input stream for an output stream */
69 typedef struct StreamMap {
70     int disabled;           /* 1 is this mapping is disabled by a negative map */
71     int file_index;
72     int stream_index;
73     int sync_file_index;
74     int sync_stream_index;
75     char *linklabel;       /* name of an output link, for mapping lavfi outputs */
76 } StreamMap;
77
78 /* select an input file for an output file */
79 typedef struct MetadataMap {
80     int  file;      // file index
81     char type;      // type of metadata to copy -- (g)lobal, (s)tream, (c)hapter or (p)rogram
82     int  index;     // stream/chapter/program number
83 } MetadataMap;
84
85 typedef struct OptionsContext {
86     OptionGroup *g;
87
88     /* input/output options */
89     int64_t start_time;
90     const char *format;
91
92     SpecifierOpt *codec_names;
93     int        nb_codec_names;
94     SpecifierOpt *audio_channels;
95     int        nb_audio_channels;
96     SpecifierOpt *audio_sample_rate;
97     int        nb_audio_sample_rate;
98     SpecifierOpt *frame_rates;
99     int        nb_frame_rates;
100     SpecifierOpt *frame_sizes;
101     int        nb_frame_sizes;
102     SpecifierOpt *frame_pix_fmts;
103     int        nb_frame_pix_fmts;
104
105     /* input options */
106     int64_t input_ts_offset;
107     int loop;
108     int rate_emu;
109     int accurate_seek;
110
111     SpecifierOpt *ts_scale;
112     int        nb_ts_scale;
113     SpecifierOpt *dump_attachment;
114     int        nb_dump_attachment;
115     SpecifierOpt *hwaccels;
116     int        nb_hwaccels;
117     SpecifierOpt *hwaccel_devices;
118     int        nb_hwaccel_devices;
119     SpecifierOpt *hwaccel_output_formats;
120     int        nb_hwaccel_output_formats;
121     SpecifierOpt *autorotate;
122     int        nb_autorotate;
123
124     /* output options */
125     StreamMap *stream_maps;
126     int     nb_stream_maps;
127     /* first item specifies output metadata, second is input */
128     MetadataMap (*meta_data_maps)[2];
129     int nb_meta_data_maps;
130     int metadata_global_manual;
131     int metadata_streams_manual;
132     int metadata_chapters_manual;
133     const char **attachments;
134     int       nb_attachments;
135
136     int chapters_input_file;
137
138     int64_t recording_time;
139     uint64_t limit_filesize;
140     float mux_preload;
141     float mux_max_delay;
142     int shortest;
143
144     int video_disable;
145     int audio_disable;
146     int subtitle_disable;
147     int data_disable;
148
149     /* indexed by output file stream index */
150     int   *streamid_map;
151     int nb_streamid_map;
152
153     SpecifierOpt *metadata;
154     int        nb_metadata;
155     SpecifierOpt *max_frames;
156     int        nb_max_frames;
157     SpecifierOpt *bitstream_filters;
158     int        nb_bitstream_filters;
159     SpecifierOpt *codec_tags;
160     int        nb_codec_tags;
161     SpecifierOpt *sample_fmts;
162     int        nb_sample_fmts;
163     SpecifierOpt *qscale;
164     int        nb_qscale;
165     SpecifierOpt *forced_key_frames;
166     int        nb_forced_key_frames;
167     SpecifierOpt *force_fps;
168     int        nb_force_fps;
169     SpecifierOpt *frame_aspect_ratios;
170     int        nb_frame_aspect_ratios;
171     SpecifierOpt *rc_overrides;
172     int        nb_rc_overrides;
173     SpecifierOpt *intra_matrices;
174     int        nb_intra_matrices;
175     SpecifierOpt *inter_matrices;
176     int        nb_inter_matrices;
177     SpecifierOpt *top_field_first;
178     int        nb_top_field_first;
179     SpecifierOpt *metadata_map;
180     int        nb_metadata_map;
181     SpecifierOpt *presets;
182     int        nb_presets;
183     SpecifierOpt *copy_initial_nonkeyframes;
184     int        nb_copy_initial_nonkeyframes;
185     SpecifierOpt *filters;
186     int        nb_filters;
187     SpecifierOpt *filter_scripts;
188     int        nb_filter_scripts;
189     SpecifierOpt *pass;
190     int        nb_pass;
191     SpecifierOpt *passlogfiles;
192     int        nb_passlogfiles;
193 } OptionsContext;
194
195 typedef struct InputFilter {
196     AVFilterContext    *filter;
197     struct InputStream *ist;
198     struct FilterGraph *graph;
199     uint8_t            *name;
200 } InputFilter;
201
202 typedef struct OutputFilter {
203     AVFilterContext     *filter;
204     struct OutputStream *ost;
205     struct FilterGraph  *graph;
206     uint8_t             *name;
207
208     /* temporary storage until stream maps are processed */
209     AVFilterInOut       *out_tmp;
210     enum AVMediaType     type;
211 } OutputFilter;
212
213 typedef struct FilterGraph {
214     int            index;
215     const char    *graph_desc;
216
217     AVFilterGraph *graph;
218
219     InputFilter   **inputs;
220     int          nb_inputs;
221     OutputFilter **outputs;
222     int         nb_outputs;
223 } FilterGraph;
224
225 typedef struct InputStream {
226     int file_index;
227     AVStream *st;
228     int discard;             /* true if stream data should be discarded */
229     int decoding_needed;     /* true if the packets must be decoded in 'raw_fifo' */
230     AVCodecContext *dec_ctx;
231     AVCodec *dec;
232     AVFrame *decoded_frame;
233     AVFrame *filter_frame; /* a ref of decoded_frame, to be sent to filters */
234
235     int64_t       start;     /* time when read started */
236     /* predicted dts of the next packet read for this stream or (when there are
237      * several frames in a packet) of the next frame in current packet */
238     int64_t       next_dts;
239     /* dts of the last packet read for this stream */
240     int64_t       last_dts;
241     int64_t min_pts; /* pts with the smallest value in a current stream */
242     int64_t max_pts; /* pts with the higher value in a current stream */
243     int64_t nb_samples; /* number of samples in the last decoded audio frame before looping */
244     PtsCorrectionContext pts_ctx;
245     double ts_scale;
246     AVDictionary *decoder_opts;
247     AVRational framerate;               /* framerate forced with -r */
248
249     int autorotate;
250     int resample_height;
251     int resample_width;
252     int resample_pix_fmt;
253
254     int      resample_sample_fmt;
255     int      resample_sample_rate;
256     int      resample_channels;
257     uint64_t resample_channel_layout;
258
259     /* decoded data from this stream goes into all those filters
260      * currently video and audio only */
261     InputFilter **filters;
262     int        nb_filters;
263
264     /* hwaccel options */
265     enum HWAccelID hwaccel_id;
266     char  *hwaccel_device;
267     enum AVPixelFormat hwaccel_output_format;
268
269     /* hwaccel context */
270     enum HWAccelID active_hwaccel_id;
271     void  *hwaccel_ctx;
272     void (*hwaccel_uninit)(AVCodecContext *s);
273     int  (*hwaccel_get_buffer)(AVCodecContext *s, AVFrame *frame, int flags);
274     int  (*hwaccel_retrieve_data)(AVCodecContext *s, AVFrame *frame);
275     enum AVPixelFormat hwaccel_pix_fmt;
276     enum AVPixelFormat hwaccel_retrieved_pix_fmt;
277     AVBufferRef *hw_frames_ctx;
278
279     /* stats */
280     // combined size of all the packets read
281     uint64_t data_size;
282     /* number of packets successfully read for this stream */
283     uint64_t nb_packets;
284     // number of frames/samples retrieved from the decoder
285     uint64_t frames_decoded;
286     uint64_t samples_decoded;
287 } InputStream;
288
289 typedef struct InputFile {
290     AVFormatContext *ctx;
291     int eof_reached;      /* true if eof reached */
292     int eagain;           /* true if last read attempt returned EAGAIN */
293     int ist_index;        /* index of first stream in ist_table */
294     int loop;             /* set number of times input stream should be looped */
295     int64_t duration;     /* actual duration of the longest stream in a file
296                              at the moment when looping happens */
297     AVRational time_base; /* time base of the duration */
298     int64_t ts_offset;
299     int64_t start_time;   /* user-specified start time in AV_TIME_BASE or AV_NOPTS_VALUE */
300     int64_t recording_time;
301     int nb_streams;       /* number of stream that avconv is aware of; may be different
302                              from ctx.nb_streams if new streams appear during av_read_frame() */
303     int rate_emu;
304     int accurate_seek;
305
306 #if HAVE_PTHREADS
307     pthread_t thread;           /* thread reading from this file */
308     int finished;               /* the thread has exited */
309     int joined;                 /* the thread has been joined */
310     pthread_mutex_t fifo_lock;  /* lock for access to fifo */
311     pthread_cond_t  fifo_cond;  /* the main thread will signal on this cond after reading from fifo */
312     AVFifoBuffer *fifo;         /* demuxed packets are stored here; freed by the main thread */
313 #endif
314 } InputFile;
315
316 typedef struct OutputStream {
317     int file_index;          /* file index */
318     int index;               /* stream index in the output file */
319     int source_index;        /* InputStream index */
320     AVStream *st;            /* stream in the output file */
321     int encoding_needed;     /* true if encoding needed for this stream */
322     int frame_number;
323     /* input pts and corresponding output pts
324        for A/V sync */
325     // double sync_ipts;        /* dts from the AVPacket of the demuxer in second units */
326     struct InputStream *sync_ist; /* input stream to sync against */
327     int64_t sync_opts;       /* output frame counter, could be changed to some true timestamp */ // FIXME look at frame_number
328     /* pts of the first frame encoded for this stream, used for limiting
329      * recording time */
330     int64_t first_pts;
331     /* dts of the last packet sent to the muxer */
332     int64_t last_mux_dts;
333
334     int                    nb_bitstream_filters;
335     const AVBitStreamFilter **bitstream_filters;
336     AVBSFContext            **bsf_ctx;
337
338     AVCodecContext *enc_ctx;
339     AVCodec *enc;
340     int64_t max_frames;
341     AVFrame *filtered_frame;
342
343     void  *hwaccel_ctx;
344
345     /* video only */
346     AVRational frame_rate;
347     int force_fps;
348     int top_field_first;
349
350     float frame_aspect_ratio;
351
352     /* forced key frames */
353     int64_t *forced_kf_pts;
354     int forced_kf_count;
355     int forced_kf_index;
356     char *forced_keyframes;
357
358     char *logfile_prefix;
359     FILE *logfile;
360
361     OutputFilter *filter;
362     char *avfilter;
363
364     int64_t sws_flags;
365     AVDictionary *encoder_opts;
366     AVDictionary *resample_opts;
367     int finished;        /* no more packets should be written for this stream */
368     int stream_copy;
369     const char *attachment_filename;
370     int copy_initial_nonkeyframes;
371
372     enum AVPixelFormat pix_fmts[2];
373
374     AVCodecParserContext *parser;
375     AVCodecContext       *parser_avctx;
376
377     /* stats */
378     // combined size of all the packets written
379     uint64_t data_size;
380     // number of packets send to the muxer
381     uint64_t packets_written;
382     // number of frames/samples sent to the encoder
383     uint64_t frames_encoded;
384     uint64_t samples_encoded;
385
386     /* packet quality factor */
387     int quality;
388 } OutputStream;
389
390 typedef struct OutputFile {
391     AVFormatContext *ctx;
392     AVDictionary *opts;
393     int ost_index;       /* index of the first stream in output_streams */
394     int64_t recording_time; /* desired length of the resulting file in microseconds */
395     int64_t start_time;     /* start time in microseconds */
396     uint64_t limit_filesize;
397
398     int shortest;
399 } OutputFile;
400
401 extern InputStream **input_streams;
402 extern int        nb_input_streams;
403 extern InputFile   **input_files;
404 extern int        nb_input_files;
405
406 extern OutputStream **output_streams;
407 extern int         nb_output_streams;
408 extern OutputFile   **output_files;
409 extern int         nb_output_files;
410
411 extern FilterGraph **filtergraphs;
412 extern int        nb_filtergraphs;
413
414 extern char *vstats_filename;
415
416 extern float audio_drift_threshold;
417 extern float dts_delta_threshold;
418
419 extern int audio_volume;
420 extern int audio_sync_method;
421 extern int video_sync_method;
422 extern int do_benchmark;
423 extern int do_deinterlace;
424 extern int do_hex_dump;
425 extern int do_pkt_dump;
426 extern int copy_ts;
427 extern int copy_tb;
428 extern int exit_on_error;
429 extern int print_stats;
430 extern int qp_hist;
431
432 extern const AVIOInterruptCB int_cb;
433
434 extern const OptionDef options[];
435
436 extern const HWAccel hwaccels[];
437 extern int hwaccel_lax_profile_check;
438 extern AVBufferRef *hw_device_ctx;
439
440 void reset_options(OptionsContext *o);
441 void show_usage(void);
442
443 void opt_output_file(void *optctx, const char *filename);
444
445 void assert_avoptions(AVDictionary *m);
446
447 int guess_input_channel_layout(InputStream *ist);
448
449 int configure_filtergraph(FilterGraph *fg);
450 int configure_output_filter(FilterGraph *fg, OutputFilter *ofilter, AVFilterInOut *out);
451 int ist_in_filtergraph(FilterGraph *fg, InputStream *ist);
452 FilterGraph *init_simple_filtergraph(InputStream *ist, OutputStream *ost);
453 int init_complex_filtergraph(FilterGraph *fg);
454
455 int avconv_parse_options(int argc, char **argv);
456
457 int vdpau_init(AVCodecContext *s);
458 int dxva2_init(AVCodecContext *s);
459 int vda_init(AVCodecContext *s);
460 int qsv_init(AVCodecContext *s);
461 int qsv_transcode_init(OutputStream *ost);
462 int vaapi_decode_init(AVCodecContext *avctx);
463 int vaapi_device_init(const char *device);
464
465 #endif /* AVCONV_H */