]> git.sesse.net Git - ffmpeg/blob - doc/encoders.texi
libx264: add shortcut for the bluray compatibility option
[ffmpeg] / doc / encoders.texi
1 @chapter Encoders
2 @c man begin ENCODERS
3
4 Encoders are configured elements in Libav which allow the encoding of
5 multimedia streams.
6
7 When you configure your Libav build, all the supported native encoders
8 are enabled by default. Encoders requiring an external library must be enabled
9 manually via the corresponding @code{--enable-lib} option. You can list all
10 available encoders using the configure option @code{--list-encoders}.
11
12 You can disable all the encoders with the configure option
13 @code{--disable-encoders} and selectively enable / disable single encoders
14 with the options @code{--enable-encoder=@var{ENCODER}} /
15 @code{--disable-encoder=@var{ENCODER}}.
16
17 The option @code{-codecs} of the av* tools will display the list of
18 enabled encoders.
19
20 @c man end ENCODERS
21
22 @chapter Audio Encoders
23 @c man begin AUDIO ENCODERS
24
25 A description of some of the currently available audio encoders
26 follows.
27
28 @section ac3 and ac3_fixed
29
30 AC-3 audio encoders.
31
32 These encoders implement part of ATSC A/52:2010 and ETSI TS 102 366, as well as
33 the undocumented RealAudio 3 (a.k.a. dnet).
34
35 The @var{ac3} encoder uses floating-point math, while the @var{ac3_fixed}
36 encoder only uses fixed-point integer math. This does not mean that one is
37 always faster, just that one or the other may be better suited to a
38 particular system. The floating-point encoder will generally produce better
39 quality audio for a given bitrate. The @var{ac3_fixed} encoder is not the
40 default codec for any of the output formats, so it must be specified explicitly
41 using the option @code{-acodec ac3_fixed} in order to use it.
42
43 @subsection AC-3 Metadata
44
45 The AC-3 metadata options are used to set parameters that describe the audio,
46 but in most cases do not affect the audio encoding itself. Some of the options
47 do directly affect or influence the decoding and playback of the resulting
48 bitstream, while others are just for informational purposes. A few of the
49 options will add bits to the output stream that could otherwise be used for
50 audio data, and will thus affect the quality of the output. Those will be
51 indicated accordingly with a note in the option list below.
52
53 These parameters are described in detail in several publicly-available
54 documents.
55 @itemize
56 @item @uref{http://www.atsc.org/cms/standards/a_52-2010.pdf,A/52:2010 - Digital Audio Compression (AC-3) (E-AC-3) Standard}
57 @item @uref{http://www.atsc.org/cms/standards/a_54a_with_corr_1.pdf,A/54 - Guide to the Use of the ATSC Digital Television Standard}
58 @item @uref{http://www.dolby.com/uploadedFiles/zz-_Shared_Assets/English_PDFs/Professional/18_Metadata.Guide.pdf,Dolby Metadata Guide}
59 @item @uref{http://www.dolby.com/uploadedFiles/zz-_Shared_Assets/English_PDFs/Professional/46_DDEncodingGuidelines.pdf,Dolby Digital Professional Encoding Guidelines}
60 @end itemize
61
62 @subsubsection Metadata Control Options
63
64 @table @option
65
66 @item -per_frame_metadata @var{boolean}
67 Allow Per-Frame Metadata. Specifies if the encoder should check for changing
68 metadata for each frame.
69 @table @option
70 @item 0
71 The metadata values set at initialization will be used for every frame in the
72 stream. (default)
73 @item 1
74 Metadata values can be changed before encoding each frame.
75 @end table
76
77 @end table
78
79 @subsubsection Downmix Levels
80
81 @table @option
82
83 @item -center_mixlev @var{level}
84 Center Mix Level. The amount of gain the decoder should apply to the center
85 channel when downmixing to stereo. This field will only be written to the
86 bitstream if a center channel is present. The value is specified as a scale
87 factor. There are 3 valid values:
88 @table @option
89 @item 0.707
90 Apply -3dB gain
91 @item 0.595
92 Apply -4.5dB gain (default)
93 @item 0.500
94 Apply -6dB gain
95 @end table
96
97 @item -surround_mixlev @var{level}
98 Surround Mix Level. The amount of gain the decoder should apply to the surround
99 channel(s) when downmixing to stereo. This field will only be written to the
100 bitstream if one or more surround channels are present. The value is specified
101 as a scale factor.  There are 3 valid values:
102 @table @option
103 @item 0.707
104 Apply -3dB gain
105 @item 0.500
106 Apply -6dB gain (default)
107 @item 0.000
108 Silence Surround Channel(s)
109 @end table
110
111 @end table
112
113 @subsubsection Audio Production Information
114 Audio Production Information is optional information describing the mixing
115 environment.  Either none or both of the fields are written to the bitstream.
116
117 @table @option
118
119 @item -mixing_level @var{number}
120 Mixing Level. Specifies peak sound pressure level (SPL) in the production
121 environment when the mix was mastered. Valid values are 80 to 111, or -1 for
122 unknown or not indicated. The default value is -1, but that value cannot be
123 used if the Audio Production Information is written to the bitstream. Therefore,
124 if the @code{room_type} option is not the default value, the @code{mixing_level}
125 option must not be -1.
126
127 @item -room_type @var{type}
128 Room Type. Describes the equalization used during the final mixing session at
129 the studio or on the dubbing stage. A large room is a dubbing stage with the
130 industry standard X-curve equalization; a small room has flat equalization.
131 This field will not be written to the bitstream if both the @code{mixing_level}
132 option and the @code{room_type} option have the default values.
133 @table @option
134 @item 0
135 @itemx notindicated
136 Not Indicated (default)
137 @item 1
138 @itemx large
139 Large Room
140 @item 2
141 @itemx small
142 Small Room
143 @end table
144
145 @end table
146
147 @subsubsection Other Metadata Options
148
149 @table @option
150
151 @item -copyright @var{boolean}
152 Copyright Indicator. Specifies whether a copyright exists for this audio.
153 @table @option
154 @item 0
155 @itemx off
156 No Copyright Exists (default)
157 @item 1
158 @itemx on
159 Copyright Exists
160 @end table
161
162 @item -dialnorm @var{value}
163 Dialogue Normalization. Indicates how far the average dialogue level of the
164 program is below digital 100% full scale (0 dBFS). This parameter determines a
165 level shift during audio reproduction that sets the average volume of the
166 dialogue to a preset level. The goal is to match volume level between program
167 sources. A value of -31dB will result in no volume level change, relative to
168 the source volume, during audio reproduction. Valid values are whole numbers in
169 the range -31 to -1, with -31 being the default.
170
171 @item -dsur_mode @var{mode}
172 Dolby Surround Mode. Specifies whether the stereo signal uses Dolby Surround
173 (Pro Logic). This field will only be written to the bitstream if the audio
174 stream is stereo. Using this option does @b{NOT} mean the encoder will actually
175 apply Dolby Surround processing.
176 @table @option
177 @item 0
178 @itemx notindicated
179 Not Indicated (default)
180 @item 1
181 @itemx off
182 Not Dolby Surround Encoded
183 @item 2
184 @itemx on
185 Dolby Surround Encoded
186 @end table
187
188 @item -original @var{boolean}
189 Original Bit Stream Indicator. Specifies whether this audio is from the
190 original source and not a copy.
191 @table @option
192 @item 0
193 @itemx off
194 Not Original Source
195 @item 1
196 @itemx on
197 Original Source (default)
198 @end table
199
200 @end table
201
202 @subsection Extended Bitstream Information
203 The extended bitstream options are part of the Alternate Bit Stream Syntax as
204 specified in Annex D of the A/52:2010 standard. It is grouped into 2 parts.
205 If any one parameter in a group is specified, all values in that group will be
206 written to the bitstream.  Default values are used for those that are written
207 but have not been specified.  If the mixing levels are written, the decoder
208 will use these values instead of the ones specified in the @code{center_mixlev}
209 and @code{surround_mixlev} options if it supports the Alternate Bit Stream
210 Syntax.
211
212 @subsubsection Extended Bitstream Information - Part 1
213
214 @table @option
215
216 @item -dmix_mode @var{mode}
217 Preferred Stereo Downmix Mode. Allows the user to select either Lt/Rt
218 (Dolby Surround) or Lo/Ro (normal stereo) as the preferred stereo downmix mode.
219 @table @option
220 @item 0
221 @itemx notindicated
222 Not Indicated (default)
223 @item 1
224 @itemx ltrt
225 Lt/Rt Downmix Preferred
226 @item 2
227 @itemx loro
228 Lo/Ro Downmix Preferred
229 @end table
230
231 @item -ltrt_cmixlev @var{level}
232 Lt/Rt Center Mix Level. The amount of gain the decoder should apply to the
233 center channel when downmixing to stereo in Lt/Rt mode.
234 @table @option
235 @item 1.414
236 Apply +3dB gain
237 @item 1.189
238 Apply +1.5dB gain
239 @item 1.000
240 Apply 0dB gain
241 @item 0.841
242 Apply -1.5dB gain
243 @item 0.707
244 Apply -3.0dB gain
245 @item 0.595
246 Apply -4.5dB gain (default)
247 @item 0.500
248 Apply -6.0dB gain
249 @item 0.000
250 Silence Center Channel
251 @end table
252
253 @item -ltrt_surmixlev @var{level}
254 Lt/Rt Surround Mix Level. The amount of gain the decoder should apply to the
255 surround channel(s) when downmixing to stereo in Lt/Rt mode.
256 @table @option
257 @item 0.841
258 Apply -1.5dB gain
259 @item 0.707
260 Apply -3.0dB gain
261 @item 0.595
262 Apply -4.5dB gain
263 @item 0.500
264 Apply -6.0dB gain (default)
265 @item 0.000
266 Silence Surround Channel(s)
267 @end table
268
269 @item -loro_cmixlev @var{level}
270 Lo/Ro Center Mix Level. The amount of gain the decoder should apply to the
271 center channel when downmixing to stereo in Lo/Ro mode.
272 @table @option
273 @item 1.414
274 Apply +3dB gain
275 @item 1.189
276 Apply +1.5dB gain
277 @item 1.000
278 Apply 0dB gain
279 @item 0.841
280 Apply -1.5dB gain
281 @item 0.707
282 Apply -3.0dB gain
283 @item 0.595
284 Apply -4.5dB gain (default)
285 @item 0.500
286 Apply -6.0dB gain
287 @item 0.000
288 Silence Center Channel
289 @end table
290
291 @item -loro_surmixlev @var{level}
292 Lo/Ro Surround Mix Level. The amount of gain the decoder should apply to the
293 surround channel(s) when downmixing to stereo in Lo/Ro mode.
294 @table @option
295 @item 0.841
296 Apply -1.5dB gain
297 @item 0.707
298 Apply -3.0dB gain
299 @item 0.595
300 Apply -4.5dB gain
301 @item 0.500
302 Apply -6.0dB gain (default)
303 @item 0.000
304 Silence Surround Channel(s)
305 @end table
306
307 @end table
308
309 @subsubsection Extended Bitstream Information - Part 2
310
311 @table @option
312
313 @item -dsurex_mode @var{mode}
314 Dolby Surround EX Mode. Indicates whether the stream uses Dolby Surround EX
315 (7.1 matrixed to 5.1). Using this option does @b{NOT} mean the encoder will actually
316 apply Dolby Surround EX processing.
317 @table @option
318 @item 0
319 @itemx notindicated
320 Not Indicated (default)
321 @item 1
322 @itemx on
323 Dolby Surround EX Off
324 @item 2
325 @itemx off
326 Dolby Surround EX On
327 @end table
328
329 @item -dheadphone_mode @var{mode}
330 Dolby Headphone Mode. Indicates whether the stream uses Dolby Headphone
331 encoding (multi-channel matrixed to 2.0 for use with headphones). Using this
332 option does @b{NOT} mean the encoder will actually apply Dolby Headphone
333 processing.
334 @table @option
335 @item 0
336 @itemx notindicated
337 Not Indicated (default)
338 @item 1
339 @itemx on
340 Dolby Headphone Off
341 @item 2
342 @itemx off
343 Dolby Headphone On
344 @end table
345
346 @item -ad_conv_type @var{type}
347 A/D Converter Type. Indicates whether the audio has passed through HDCD A/D
348 conversion.
349 @table @option
350 @item 0
351 @itemx standard
352 Standard A/D Converter (default)
353 @item 1
354 @itemx hdcd
355 HDCD A/D Converter
356 @end table
357
358 @end table
359
360 @subsection Other AC-3 Encoding Options
361
362 @table @option
363
364 @item -stereo_rematrixing @var{boolean}
365 Stereo Rematrixing. Enables/Disables use of rematrixing for stereo input. This
366 is an optional AC-3 feature that increases quality by selectively encoding
367 the left/right channels as mid/side. This option is enabled by default, and it
368 is highly recommended that it be left as enabled except for testing purposes.
369
370 @end table
371
372 @subheading Floating-Point-Only AC-3 Encoding Options
373
374 These options are only valid for the floating-point encoder and do not exist
375 for the fixed-point encoder due to the corresponding features not being
376 implemented in fixed-point.
377
378 @table @option
379
380 @item -channel_coupling @var{boolean}
381 Enables/Disables use of channel coupling, which is an optional AC-3 feature
382 that increases quality by combining high frequency information from multiple
383 channels into a single channel. The per-channel high frequency information is
384 sent with less accuracy in both the frequency and time domains. This allows
385 more bits to be used for lower frequencies while preserving enough information
386 to reconstruct the high frequencies. This option is enabled by default for the
387 floating-point encoder and should generally be left as enabled except for
388 testing purposes or to increase encoding speed.
389 @table @option
390 @item -1
391 @itemx auto
392 Selected by Encoder (default)
393 @item 0
394 @itemx off
395 Disable Channel Coupling
396 @item 1
397 @itemx on
398 Enable Channel Coupling
399 @end table
400
401 @item -cpl_start_band @var{number}
402 Coupling Start Band. Sets the channel coupling start band, from 1 to 15. If a
403 value higher than the bandwidth is used, it will be reduced to 1 less than the
404 coupling end band. If @var{auto} is used, the start band will be determined by
405 the encoder based on the bit rate, sample rate, and channel layout. This option
406 has no effect if channel coupling is disabled.
407 @table @option
408 @item -1
409 @itemx auto
410 Selected by Encoder (default)
411 @end table
412
413 @end table
414
415 @section libwavpack
416
417 A wrapper providing WavPack encoding through libwavpack.
418
419 Only lossless mode using 32-bit integer samples is supported currently.
420 The @option{compression_level} option can be used to control speed vs.
421 compression tradeoff, with the values mapped to libwavpack as follows:
422
423 @table @option
424
425 @item 0
426 Fast mode - corresponding to the wavpack @option{-f} option.
427
428 @item 1
429 Normal (default) settings.
430
431 @item 2
432 High quality - corresponding to the wavpack @option{-h} option.
433
434 @item 3
435 Very high quality - corresponding to the wavpack @option{-hh} option.
436
437 @item 4-8
438 Same as 3, but with extra processing enabled - corresponding to the wavpack
439 @option{-x} option. I.e. 4 is the same as @option{-x2} and 8 is the same as
440 @option{-x6}.
441
442 @end table
443
444 @c man end AUDIO ENCODERS
445
446 @chapter Video Encoders
447 @c man begin VIDEO ENCODERS
448
449 @section libx264
450
451 x264 H.264/MPEG-4 AVC encoder wrapper
452
453 x264 supports an impressive number of features, including 8x8 and 4x4 adaptive
454 spatial transform, adaptive B-frame placement, CAVLC/CABAC entropy coding,
455 interlacing (MBAFF), lossless mode, psy optimizations for detail retention
456 (adaptive quantization, psy-RD, psy-trellis).
457
458 The Libav wrapper provides a mapping for most of them using global options
459 that match those of the encoders and provides private options for the unique
460 encoder options. Additionally an expert override is provided to directly pass
461 a list of key=value tuples as accepted by x264_param_parse.
462
463 @subsection Option Mapping
464
465 The following options are supported by the x264 wrapper, the x264-equivalent
466 options follow the Libav ones.
467
468 @multitable @columnfractions .2 .2
469 @item b                 @tab bitrate
470 Libav @code{b} option is expressed in bits/s, x264 @code{bitrate} in kilobits/s.
471 @item bf                @tab bframes
472 Maximum number of B-frames.
473 @item g                 @tab keyint
474 Maximum GOP size.
475 @item qmin              @tab qpmin
476 @item qmax              @tab qpmax
477 @item qdiff             @tab qpstep
478 @item qblur             @tab qblur
479 @item qcomp             @tab qcomp
480 @item refs              @tab ref
481 @item sc_threshold      @tab scenecut
482 @item trellis           @tab trellis
483 @item nr                @tab nr
484 Noise reduction.
485 @item me_range          @tab merange
486 @item me_method         @tab me
487 @item subq              @tab subme
488 @item b_strategy        @tab b-adapt
489 @item keyint_min        @tab keyint-min
490 @item coder             @tab cabac
491 Set coder to @code{ac} to use CABAC.
492 @item cmp               @tab chroma-me
493 Set to @code{chroma} to use chroma motion estimation.
494 @item threads           @tab threads
495 @item thread_type       @tab sliced_threads
496 Set to @code{slice} to use sliced threading instead of frame threading.
497 @item flags -cgop       @tab open-gop
498 Set @code{-cgop} to use recovery points to close GOPs.
499 @item rc_init_occupancy @tab vbv-init
500 Initial buffer occupancy.
501 @end multitable
502
503 @subsection Private Options
504 @table @option
505 @item -preset @var{string}
506 Set the encoding preset (cf. x264 --fullhelp).
507 @item -tune @var{string}
508 Tune the encoding params (cf. x264 --fullhelp).
509 @item -profile @var{string}
510 Set profile restrictions (cf. x264 --fullhelp).
511 @item -fastfirstpass @var{integer}
512 Use fast settings when encoding first pass.
513 @item -crf @var{float}
514 Select the quality for constant quality mode.
515 @item -crf_max @var{float}
516 In CRF mode, prevents VBV from lowering quality beyond this point.
517 @item -qp @var{integer}
518 Constant quantization parameter rate control method.
519 @item -aq-mode @var{integer}
520 AQ method
521
522 Possible values:
523 @table @samp
524 @item none
525
526 @item variance
527 Variance AQ (complexity mask).
528 @item autovariance
529 Auto-variance AQ (experimental).
530 @end table
531 @item -aq-strength @var{float}
532 AQ strength, reduces blocking and blurring in flat and textured areas.
533 @item -psy @var{integer}
534 Use psychovisual optimizations.
535 @item -psy-rd @var{string}
536 Strength of psychovisual optimization, in <psy-rd>:<psy-trellis> format.
537 @item -rc-lookahead @var{integer}
538 Number of frames to look ahead for frametype and ratecontrol.
539 @item -weightb @var{integer}
540 Weighted prediction for B-frames.
541 @item -weightp @var{integer}
542 Weighted prediction analysis method.
543
544 Possible values:
545 @table @samp
546 @item none
547
548 @item simple
549
550 @item smart
551
552 @end table
553 @item -ssim @var{integer}
554 Calculate and print SSIM stats.
555 @item -intra-refresh @var{integer}
556 Use Periodic Intra Refresh instead of IDR frames.
557 @item -bluray-compat @var{integer}
558 Configure the encoder to be compatible with the bluray standard.
559 It is a shorthand for setting "bluray-compat=1 force-cfr=1".
560 @item -b-bias @var{integer}
561 Influences how often B-frames are used.
562 @item -b-pyramid @var{integer}
563 Keep some B-frames as references.
564
565 Possible values:
566 @table @samp
567 @item none
568
569 @item strict
570 Strictly hierarchical pyramid.
571 @item normal
572 Non-strict (not Blu-ray compatible).
573 @end table
574 @item -mixed-refs @var{integer}
575 One reference per partition, as opposed to one reference per macroblock.
576 @item -8x8dct @var{integer}
577 High profile 8x8 transform.
578 @item -fast-pskip @var{integer}
579 @item -aud @var{integer}
580 Use access unit delimiters.
581 @item -mbtree @var{integer}
582 Use macroblock tree ratecontrol.
583 @item -deblock @var{string}
584 Loop filter parameters, in <alpha:beta> form.
585 @item -cplxblur @var{float}
586 Reduce fluctuations in QP (before curve compression).
587 @item -partitions @var{string}
588 A comma-separated list of partitions to consider, possible values: p8x8, p4x4, b8x8, i8x8, i4x4, none, all.
589 @item -direct-pred @var{integer}
590 Direct MV prediction mode
591
592 Possible values:
593 @table @samp
594 @item none
595
596 @item spatial
597
598 @item temporal
599
600 @item auto
601
602 @end table
603 @item -slice-max-size @var{integer}
604 Limit the size of each slice in bytes.
605 @item -stats @var{string}
606 Filename for 2 pass stats.
607 @item -nal-hrd @var{integer}
608 Signal HRD information (requires vbv-bufsize; cbr not allowed in .mp4).
609
610 Possible values:
611 @table @samp
612 @item none
613
614 @item vbr
615
616 @item cbr
617
618 @end table
619 @item -x264-params @var{string}
620 Override the x264 configuration using a :-separated list of key=value parameters.
621 @example
622 -x264-params level=30:bframes=0:weightp=0:cabac=0:ref=1:vbv-maxrate=768:vbv-bufsize=2000:analyse=all:me=umh:no-fast-pskip=1:subq=6:8x8dct=0:trellis=0
623 @end example
624 @end table
625
626 Encoding avpresets for common usages are provided so they can be used with the
627 general presets system (e.g. passing the @code{-pre} option).
628
629 @section ProRes
630
631 Apple ProRes encoder.
632
633 @subsection Private Options
634
635 @table @option
636 @item profile @var{integer}
637 Select the ProRes profile to encode
638 @table @samp
639 @item proxy
640 @item lt
641 @item standard
642 @item hq
643 @item 4444
644 @end table
645
646 @item quant_mat @var{integer}
647 Select quantization matrix.
648 @table @samp
649 @item auto
650 @item default
651 @item proxy
652 @item lt
653 @item standard
654 @item hq
655 @end table
656 If set to @var{auto}, the matrix matching the profile will be picked.
657 If not set, the matrix providing the highest quality, @var{default}, will be
658 picked.
659
660 @item bits_per_mb @var{integer}
661 How many bits to allot for coding one macroblock. Different profiles use
662 between 200 and 2400 bits per macroblock, the maximum is 8000.
663
664 @item mbs_per_slice @var{integer}
665 Number of macroblocks in each slice (1-8); the default value (8)
666 should be good in almost all situations.
667
668 @item vendor @var{string}
669 Override the 4-byte vendor ID.
670 A custom vendor ID like @var{apl0} would claim the stream was produced by
671 the Apple encoder.
672
673 @item alpha_bits @var{integer}
674 Specify number of bits for alpha component.
675 Possible values are @var{0}, @var{8} and @var{16}.
676 Use @var{0} to disable alpha plane coding.
677
678 @end table
679
680 @subsection Speed considerations
681
682 In the default mode of operation the encoder has to honor frame constraints
683 (i.e. not produc frames with size bigger than requested) while still making
684 output picture as good as possible.
685 A frame containing a lot of small details is harder to compress and the encoder
686 would spend more time searching for appropriate quantizers for each slice.
687
688 Setting a higher @option{bits_per_mb} limit will improve the speed.
689
690 For the fastest encoding speed set the @option{qscale} parameter (4 is the
691 recommended value) and do not set a size constraint.
692
693 @c man end VIDEO ENCODERS