]> git.sesse.net Git - x264/blob - common/common.c
get_ref_sse2
[x264] / common / common.c
1 /*****************************************************************************
2  * common.c: h264 library
3  *****************************************************************************
4  * Copyright (C) 2003 Laurent Aimar
5  * $Id: common.c,v 1.1 2004/06/03 19:27:06 fenrir Exp $
6  *
7  * Authors: Laurent Aimar <fenrir@via.ecp.fr>
8  *
9  * This program is free software; you can redistribute it and/or modify
10  * it under the terms of the GNU General Public License as published by
11  * the Free Software Foundation; either version 2 of the License, or
12  * (at your option) any later version.
13  *
14  * This program is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
17  * GNU General Public License for more details.
18  *
19  * You should have received a copy of the GNU General Public License
20  * along with this program; if not, write to the Free Software
21  * Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA  02111, USA.
22  *****************************************************************************/
23
24 #include <stdarg.h>
25
26 #ifdef HAVE_MALLOC_H
27 #include <malloc.h>
28 #endif
29
30 #include "common.h"
31 #include "cpu.h"
32
33 static void x264_log_default( void *, int, const char *, va_list );
34
35 /****************************************************************************
36  * x264_param_default:
37  ****************************************************************************/
38 void    x264_param_default( x264_param_t *param )
39 {
40     /* */
41     memset( param, 0, sizeof( x264_param_t ) );
42
43     /* CPU autodetect */
44     param->cpu = x264_cpu_detect();
45     param->i_threads = 1;
46     param->b_deterministic = 1;
47
48     /* Video properties */
49     param->i_csp           = X264_CSP_I420;
50     param->i_width         = 0;
51     param->i_height        = 0;
52     param->vui.i_sar_width = 0;
53     param->vui.i_sar_height= 0;
54     param->vui.i_overscan  = 0;  /* undef */
55     param->vui.i_vidformat = 5;  /* undef */
56     param->vui.b_fullrange = 0;  /* off */
57     param->vui.i_colorprim = 2;  /* undef */
58     param->vui.i_transfer  = 2;  /* undef */
59     param->vui.i_colmatrix = 2;  /* undef */
60     param->vui.i_chroma_loc= 0;  /* left center */
61     param->i_fps_num       = 25;
62     param->i_fps_den       = 1;
63     param->i_level_idc     = 51; /* as close to "unrestricted" as we can get */
64
65     /* Encoder parameters */
66     param->i_frame_reference = 1;
67     param->i_keyint_max = 250;
68     param->i_keyint_min = 25;
69     param->i_bframe = 0;
70     param->i_scenecut_threshold = 40;
71     param->b_bframe_adaptive = 1;
72     param->i_bframe_bias = 0;
73     param->b_bframe_pyramid = 0;
74
75     param->b_deblocking_filter = 1;
76     param->i_deblocking_filter_alphac0 = 0;
77     param->i_deblocking_filter_beta = 0;
78
79     param->b_cabac = 1;
80     param->i_cabac_init_idc = 0;
81
82     param->rc.i_rc_method = X264_RC_NONE;
83     param->rc.i_bitrate = 0;
84     param->rc.f_rate_tolerance = 1.0;
85     param->rc.i_vbv_max_bitrate = 0;
86     param->rc.i_vbv_buffer_size = 0;
87     param->rc.f_vbv_buffer_init = 0.9;
88     param->rc.i_qp_constant = 26;
89     param->rc.f_rf_constant = 0;
90     param->rc.i_qp_min = 10;
91     param->rc.i_qp_max = 51;
92     param->rc.i_qp_step = 4;
93     param->rc.f_ip_factor = 1.4;
94     param->rc.f_pb_factor = 1.3;
95
96     param->rc.b_stat_write = 0;
97     param->rc.psz_stat_out = "x264_2pass.log";
98     param->rc.b_stat_read = 0;
99     param->rc.psz_stat_in = "x264_2pass.log";
100     param->rc.psz_rc_eq = "blurCplx^(1-qComp)";
101     param->rc.f_qcompress = 0.6;
102     param->rc.f_qblur = 0.5;
103     param->rc.f_complexity_blur = 20;
104     param->rc.i_zones = 0;
105
106     /* Log */
107     param->pf_log = x264_log_default;
108     param->p_log_private = NULL;
109     param->i_log_level = X264_LOG_INFO;
110
111     /* */
112     param->analyse.intra = X264_ANALYSE_I4x4 | X264_ANALYSE_I8x8;
113     param->analyse.inter = X264_ANALYSE_I4x4 | X264_ANALYSE_I8x8
114                          | X264_ANALYSE_PSUB16x16 | X264_ANALYSE_BSUB16x16;
115     param->analyse.i_direct_mv_pred = X264_DIRECT_PRED_SPATIAL;
116     param->analyse.i_me_method = X264_ME_HEX;
117     param->analyse.i_me_range = 16;
118     param->analyse.i_subpel_refine = 5;
119     param->analyse.b_chroma_me = 1;
120     param->analyse.i_mv_range_thread = -1;
121     param->analyse.i_mv_range = -1; // set from level_idc
122     param->analyse.i_direct_8x8_inference = -1; // set from level_idc
123     param->analyse.i_chroma_qp_offset = 0;
124     param->analyse.b_fast_pskip = 1;
125     param->analyse.b_dct_decimate = 1;
126     param->analyse.i_luma_deadzone[0] = 21;
127     param->analyse.i_luma_deadzone[1] = 11;
128     param->analyse.b_psnr = 1;
129     param->analyse.b_ssim = 1;
130
131     param->i_cqm_preset = X264_CQM_FLAT;
132     memset( param->cqm_4iy, 16, 16 );
133     memset( param->cqm_4ic, 16, 16 );
134     memset( param->cqm_4py, 16, 16 );
135     memset( param->cqm_4pc, 16, 16 );
136     memset( param->cqm_8iy, 16, 64 );
137     memset( param->cqm_8py, 16, 64 );
138
139     param->b_repeat_headers = 1;
140     param->b_aud = 0;
141 }
142
143 static int parse_enum( const char *arg, const char * const *names, int *dst )
144 {
145     int i;
146     for( i = 0; names[i]; i++ )
147         if( !strcmp( arg, names[i] ) )
148         {
149             *dst = i;
150             return 0;
151         }
152     return -1;
153 }
154
155 static int parse_cqm( const char *str, uint8_t *cqm, int length )
156 {
157     int i = 0;
158     do {
159         int coef;
160         if( !sscanf( str, "%d", &coef ) || coef < 1 || coef > 255 )
161             return -1;
162         cqm[i++] = coef;
163     } while( i < length && (str = strchr( str, ',' )) && str++ );
164     return (i == length) ? 0 : -1;
165 }
166
167 static int x264_atobool( const char *str, int *b_error )
168 {
169     if( !strcmp(str, "1") || 
170         !strcmp(str, "true") || 
171         !strcmp(str, "yes") )
172         return 1;
173     if( !strcmp(str, "0") || 
174         !strcmp(str, "false") || 
175         !strcmp(str, "no") )
176         return 0;
177     *b_error = 1;
178     return 0;
179 }
180
181 static int x264_atoi( const char *str, int *b_error )
182 {
183     char *end;
184     int v = strtol( str, &end, 0 );
185     if( end == str || *end != '\0' )
186         *b_error = 1;
187     return v;
188 }
189
190 static double x264_atof( const char *str, int *b_error )
191 {
192     char *end;
193     double v = strtod( str, &end );
194     if( end == str || *end != '\0' )
195         *b_error = 1;
196     return v;
197 }
198
199 #define atobool(str) ( name_was_bool = 1, x264_atobool( str, &b_error ) )
200 #define atoi(str) x264_atoi( str, &b_error )
201 #define atof(str) x264_atof( str, &b_error )
202
203 int x264_param_parse( x264_param_t *p, const char *name, const char *value )
204 {
205     char *name_buf = NULL;
206     int b_error = 0;
207     int name_was_bool;
208     int value_was_null = !value;
209     int i;
210
211     if( !name )
212         return X264_PARAM_BAD_NAME;
213     if( !value )
214         value = "true";
215
216     if( value[0] == '=' )
217         value++;
218
219     if( strchr( name, '_' ) ) // s/_/-/g
220     {
221         char *p;
222         name_buf = strdup(name);
223         while( (p = strchr( name_buf, '_' )) )
224             *p = '-';
225         name = name_buf;
226     }
227
228     if( (!strncmp( name, "no-", 3 ) && (i = 3)) ||
229         (!strncmp( name, "no", 2 ) && (i = 2)) )
230     {
231         name += i;
232         value = atobool(value) ? "false" : "true";
233     }
234     name_was_bool = 0;
235
236 #define OPT(STR) else if( !strcmp( name, STR ) )
237 #define OPT2(STR0, STR1) else if( !strcmp( name, STR0 ) || !strcmp( name, STR1 ) )
238     if(0);
239     OPT("asm")
240         p->cpu = atobool(value) ? x264_cpu_detect() : 0;
241     OPT("threads")
242     {
243         if( !strcmp(value, "auto") )
244             p->i_threads = 0;
245         else
246             p->i_threads = atoi(value);
247     }
248     OPT2("deterministic", "n-deterministic")
249         p->b_deterministic = atobool(value);
250     OPT2("level", "level-idc")
251     {
252         if( atof(value) < 6 )
253             p->i_level_idc = (int)(10*atof(value)+.5);
254         else
255             p->i_level_idc = atoi(value);
256     }
257     OPT("sar")
258     {
259         b_error = ( 2 != sscanf( value, "%d:%d", &p->vui.i_sar_width, &p->vui.i_sar_height ) &&
260                     2 != sscanf( value, "%d/%d", &p->vui.i_sar_width, &p->vui.i_sar_height ) );
261     }
262     OPT("overscan")
263         b_error |= parse_enum( value, x264_overscan_names, &p->vui.i_overscan );
264     OPT("videoformat")
265         b_error |= parse_enum( value, x264_vidformat_names, &p->vui.i_vidformat );
266     OPT("fullrange")
267         b_error |= parse_enum( value, x264_fullrange_names, &p->vui.b_fullrange );
268     OPT("colorprim")
269         b_error |= parse_enum( value, x264_colorprim_names, &p->vui.i_colorprim );
270     OPT("transfer")
271         b_error |= parse_enum( value, x264_transfer_names, &p->vui.i_transfer );
272     OPT("colormatrix")
273         b_error |= parse_enum( value, x264_colmatrix_names, &p->vui.i_colmatrix );
274     OPT("chromaloc")
275     {
276         p->vui.i_chroma_loc = atoi(value);
277         b_error = ( p->vui.i_chroma_loc < 0 || p->vui.i_chroma_loc > 5 );
278     }
279     OPT("fps")
280     {
281         if( sscanf( value, "%d/%d", &p->i_fps_num, &p->i_fps_den ) == 2 )
282             ;
283         else
284         {
285             float fps = atof(value);
286             p->i_fps_num = (int)(fps * 1000 + .5);
287             p->i_fps_den = 1000;
288         }
289     }
290     OPT2("ref", "frameref")
291         p->i_frame_reference = atoi(value);
292     OPT("keyint")
293     {
294         p->i_keyint_max = atoi(value);
295         if( p->i_keyint_min > p->i_keyint_max )
296             p->i_keyint_min = p->i_keyint_max;
297     }
298     OPT2("min-keyint", "keyint-min")
299     {
300         p->i_keyint_min = atoi(value);
301         if( p->i_keyint_max < p->i_keyint_min )
302             p->i_keyint_max = p->i_keyint_min;
303     }
304     OPT("scenecut")
305         p->i_scenecut_threshold = atoi(value);
306     OPT("pre-scenecut")
307         p->b_pre_scenecut = atobool(value);
308     OPT("bframes")
309         p->i_bframe = atoi(value);
310     OPT("b-adapt")
311         p->b_bframe_adaptive = atobool(value);
312     OPT("b-bias")
313         p->i_bframe_bias = atoi(value);
314     OPT("b-pyramid")
315         p->b_bframe_pyramid = atobool(value);
316     OPT("nf")
317         p->b_deblocking_filter = !atobool(value);
318     OPT2("filter", "deblock")
319     {
320         if( 2 == sscanf( value, "%d:%d", &p->i_deblocking_filter_alphac0, &p->i_deblocking_filter_beta ) ||
321             2 == sscanf( value, "%d,%d", &p->i_deblocking_filter_alphac0, &p->i_deblocking_filter_beta ) )
322         {
323             p->b_deblocking_filter = 1;
324         }
325         else if( sscanf( value, "%d", &p->i_deblocking_filter_alphac0 ) )
326         {
327             p->b_deblocking_filter = 1;
328             p->i_deblocking_filter_beta = p->i_deblocking_filter_alphac0;
329         }
330         else
331             p->b_deblocking_filter = atobool(value);
332     }
333     OPT("cabac")
334         p->b_cabac = atobool(value);
335     OPT("cabac-idc")
336         p->i_cabac_init_idc = atoi(value);
337     OPT("interlaced")
338         p->b_interlaced = atobool(value);
339     OPT("cqm")
340     {
341         if( strstr( value, "flat" ) )
342             p->i_cqm_preset = X264_CQM_FLAT;
343         else if( strstr( value, "jvt" ) )
344             p->i_cqm_preset = X264_CQM_JVT;
345         else
346             p->psz_cqm_file = strdup(value);
347     }
348     OPT("cqmfile")
349         p->psz_cqm_file = strdup(value);
350     OPT("cqm4")
351     {
352         p->i_cqm_preset = X264_CQM_CUSTOM;
353         b_error |= parse_cqm( value, p->cqm_4iy, 16 );
354         b_error |= parse_cqm( value, p->cqm_4ic, 16 );
355         b_error |= parse_cqm( value, p->cqm_4py, 16 );
356         b_error |= parse_cqm( value, p->cqm_4pc, 16 );
357     }
358     OPT("cqm8")
359     {
360         p->i_cqm_preset = X264_CQM_CUSTOM;
361         b_error |= parse_cqm( value, p->cqm_8iy, 64 );
362         b_error |= parse_cqm( value, p->cqm_8py, 64 );
363     }
364     OPT("cqm4i")
365     {
366         p->i_cqm_preset = X264_CQM_CUSTOM;
367         b_error |= parse_cqm( value, p->cqm_4iy, 16 );
368         b_error |= parse_cqm( value, p->cqm_4ic, 16 );
369     }
370     OPT("cqm4p")
371     {
372         p->i_cqm_preset = X264_CQM_CUSTOM;
373         b_error |= parse_cqm( value, p->cqm_4py, 16 );
374         b_error |= parse_cqm( value, p->cqm_4pc, 16 );
375     }
376     OPT("cqm4iy")
377     {
378         p->i_cqm_preset = X264_CQM_CUSTOM;
379         b_error |= parse_cqm( value, p->cqm_4iy, 16 );
380     }
381     OPT("cqm4ic")
382     {
383         p->i_cqm_preset = X264_CQM_CUSTOM;
384         b_error |= parse_cqm( value, p->cqm_4ic, 16 );
385     }
386     OPT("cqm4py")
387     {
388         p->i_cqm_preset = X264_CQM_CUSTOM;
389         b_error |= parse_cqm( value, p->cqm_4py, 16 );
390     }
391     OPT("cqm4pc")
392     {
393         p->i_cqm_preset = X264_CQM_CUSTOM;
394         b_error |= parse_cqm( value, p->cqm_4pc, 16 );
395     }
396     OPT("cqm8i")
397     {
398         p->i_cqm_preset = X264_CQM_CUSTOM;
399         b_error |= parse_cqm( value, p->cqm_8iy, 64 );
400     }
401     OPT("cqm8p")
402     {
403         p->i_cqm_preset = X264_CQM_CUSTOM;
404         b_error |= parse_cqm( value, p->cqm_8py, 64 );
405     }
406     OPT("log")
407         p->i_log_level = atoi(value);
408 #ifdef VISUALIZE
409     OPT("visualize")
410         p->b_visualize = atobool(value);
411 #endif
412     OPT2("analyse", "partitions")
413     {
414         p->analyse.inter = 0;
415         if( strstr( value, "none" ) )  p->analyse.inter =  0;
416         if( strstr( value, "all" ) )   p->analyse.inter = ~0;
417
418         if( strstr( value, "i4x4" ) )  p->analyse.inter |= X264_ANALYSE_I4x4;
419         if( strstr( value, "i8x8" ) )  p->analyse.inter |= X264_ANALYSE_I8x8;
420         if( strstr( value, "p8x8" ) )  p->analyse.inter |= X264_ANALYSE_PSUB16x16;
421         if( strstr( value, "p4x4" ) )  p->analyse.inter |= X264_ANALYSE_PSUB8x8;
422         if( strstr( value, "b8x8" ) )  p->analyse.inter |= X264_ANALYSE_BSUB16x16;
423     }
424     OPT("8x8dct")
425         p->analyse.b_transform_8x8 = atobool(value);
426     OPT2("weightb", "weight-b")
427         p->analyse.b_weighted_bipred = atobool(value);
428     OPT2("direct", "direct-pred")
429         b_error |= parse_enum( value, x264_direct_pred_names, &p->analyse.i_direct_mv_pred );
430     OPT("direct-8x8")
431         p->analyse.i_direct_8x8_inference = atoi(value);
432     OPT("chroma-qp-offset")
433         p->analyse.i_chroma_qp_offset = atoi(value);
434     OPT("me")
435         b_error |= parse_enum( value, x264_motion_est_names, &p->analyse.i_me_method );
436     OPT2("merange", "me-range")
437         p->analyse.i_me_range = atoi(value);
438     OPT2("mvrange", "mv-range")
439         p->analyse.i_mv_range = atoi(value);
440     OPT2("mvrange-thread", "mv-range-thread")
441         p->analyse.i_mv_range_thread = atoi(value);
442     OPT2("subme", "subq")
443         p->analyse.i_subpel_refine = atoi(value);
444     OPT("bime")
445         p->analyse.b_bidir_me = atobool(value);
446     OPT("chroma-me")
447         p->analyse.b_chroma_me = atobool(value);
448     OPT2("b-rdo", "brdo")
449         p->analyse.b_bframe_rdo = atobool(value);
450     OPT("mixed-refs")
451         p->analyse.b_mixed_references = atobool(value);
452     OPT("trellis")
453         p->analyse.i_trellis = atoi(value);
454     OPT("fast-pskip")
455         p->analyse.b_fast_pskip = atobool(value);
456     OPT("dct-decimate")
457         p->analyse.b_dct_decimate = atobool(value);
458     OPT("deadzone-inter")
459         p->analyse.i_luma_deadzone[0] = atoi(value);
460     OPT("deadzone-intra")
461         p->analyse.i_luma_deadzone[1] = atoi(value);
462     OPT("nr")
463         p->analyse.i_noise_reduction = atoi(value);
464     OPT("bitrate")
465     {
466         p->rc.i_bitrate = atoi(value);
467         p->rc.i_rc_method = X264_RC_ABR;
468     }
469     OPT2("qp", "qp_constant")
470     {
471         p->rc.i_qp_constant = atoi(value);
472         p->rc.i_rc_method = X264_RC_CQP;
473     }
474     OPT("crf")
475     {
476         p->rc.f_rf_constant = atof(value);
477         p->rc.i_rc_method = X264_RC_CRF;
478     }
479     OPT2("qpmin", "qp-min")
480         p->rc.i_qp_min = atoi(value);
481     OPT2("qpmax", "qp-max")
482         p->rc.i_qp_max = atoi(value);
483     OPT2("qpstep", "qp-step")
484         p->rc.i_qp_step = atoi(value);
485     OPT("ratetol")
486         p->rc.f_rate_tolerance = !strncmp("inf", value, 3) ? 1e9 : atof(value);
487     OPT("vbv-maxrate")
488         p->rc.i_vbv_max_bitrate = atoi(value);
489     OPT("vbv-bufsize")
490         p->rc.i_vbv_buffer_size = atoi(value);
491     OPT("vbv-init")
492         p->rc.f_vbv_buffer_init = atof(value);
493     OPT2("ipratio", "ip-factor")
494         p->rc.f_ip_factor = atof(value);
495     OPT2("pbratio", "pb-factor")
496         p->rc.f_pb_factor = atof(value);
497     OPT("pass")
498     {
499         int i = x264_clip3( atoi(value), 0, 3 );
500         p->rc.b_stat_write = i & 1;
501         p->rc.b_stat_read = i & 2;
502     }
503     OPT("stats")
504     {
505         p->rc.psz_stat_in = strdup(value);
506         p->rc.psz_stat_out = strdup(value);
507     }
508     OPT("rceq")
509         p->rc.psz_rc_eq = strdup(value);
510     OPT("qcomp")
511         p->rc.f_qcompress = atof(value);
512     OPT("qblur")
513         p->rc.f_qblur = atof(value);
514     OPT2("cplxblur", "cplx-blur")
515         p->rc.f_complexity_blur = atof(value);
516     OPT("zones")
517         p->rc.psz_zones = strdup(value);
518     OPT("psnr")
519         p->analyse.b_psnr = atobool(value);
520     OPT("ssim")
521         p->analyse.b_ssim = atobool(value);
522     OPT("aud")
523         p->b_aud = atobool(value);
524     OPT("sps-id")
525         p->i_sps_id = atoi(value);
526     OPT("global-header")
527         p->b_repeat_headers = !atobool(value);
528     OPT("repeat-headers")
529         p->b_repeat_headers = atobool(value);
530     else
531         return X264_PARAM_BAD_NAME;
532 #undef OPT
533 #undef OPT2
534 #undef atobool
535 #undef atoi
536 #undef atof
537
538     if( name_buf )
539         free( name_buf );
540
541     b_error |= value_was_null && !name_was_bool;
542     return b_error ? X264_PARAM_BAD_VALUE : 0;
543 }
544
545 /****************************************************************************
546  * x264_log:
547  ****************************************************************************/
548 void x264_log( x264_t *h, int i_level, const char *psz_fmt, ... )
549 {
550     if( i_level <= h->param.i_log_level )
551     {
552         va_list arg;
553         va_start( arg, psz_fmt );
554         h->param.pf_log( h->param.p_log_private, i_level, psz_fmt, arg );
555         va_end( arg );
556     }
557 }
558
559 static void x264_log_default( void *p_unused, int i_level, const char *psz_fmt, va_list arg )
560 {
561     char *psz_prefix;
562     switch( i_level )
563     {
564         case X264_LOG_ERROR:
565             psz_prefix = "error";
566             break;
567         case X264_LOG_WARNING:
568             psz_prefix = "warning";
569             break;
570         case X264_LOG_INFO:
571             psz_prefix = "info";
572             break;
573         case X264_LOG_DEBUG:
574             psz_prefix = "debug";
575             break;
576         default:
577             psz_prefix = "unknown";
578             break;
579     }
580     fprintf( stderr, "x264 [%s]: ", psz_prefix );
581     vfprintf( stderr, psz_fmt, arg );
582 }
583
584 /****************************************************************************
585  * x264_picture_alloc:
586  ****************************************************************************/
587 void x264_picture_alloc( x264_picture_t *pic, int i_csp, int i_width, int i_height )
588 {
589     pic->i_type = X264_TYPE_AUTO;
590     pic->i_qpplus1 = 0;
591     pic->img.i_csp = i_csp;
592     pic->img.i_plane = 3;
593     pic->img.plane[0] = x264_malloc( 3 * i_width * i_height / 2 );
594     pic->img.plane[1] = pic->img.plane[0] + i_width * i_height;
595     pic->img.plane[2] = pic->img.plane[1] + i_width * i_height / 4;
596     pic->img.i_stride[0] = i_width;
597     pic->img.i_stride[1] = i_width / 2;
598     pic->img.i_stride[2] = i_width / 2;
599 }
600
601 /****************************************************************************
602  * x264_picture_clean:
603  ****************************************************************************/
604 void x264_picture_clean( x264_picture_t *pic )
605 {
606     x264_free( pic->img.plane[0] );
607
608     /* just to be safe */
609     memset( pic, 0, sizeof( x264_picture_t ) );
610 }
611
612 /****************************************************************************
613  * x264_nal_encode:
614  ****************************************************************************/
615 int x264_nal_encode( void *p_data, int *pi_data, int b_annexeb, x264_nal_t *nal )
616 {
617     uint8_t *dst = p_data;
618     uint8_t *src = nal->p_payload;
619     uint8_t *end = &nal->p_payload[nal->i_payload];
620
621     int i_count = 0;
622
623     /* FIXME this code doesn't check overflow */
624
625     if( b_annexeb )
626     {
627         /* long nal start code (we always use long ones)*/
628         *dst++ = 0x00;
629         *dst++ = 0x00;
630         *dst++ = 0x00;
631         *dst++ = 0x01;
632     }
633
634     /* nal header */
635     *dst++ = ( 0x00 << 7 ) | ( nal->i_ref_idc << 5 ) | nal->i_type;
636
637     while( src < end )
638     {
639         if( i_count == 2 && *src <= 0x03 )
640         {
641             *dst++ = 0x03;
642             i_count = 0;
643         }
644         if( *src == 0 )
645         {
646             i_count++;
647         }
648         else
649         {
650             i_count = 0;
651         }
652         *dst++ = *src++;
653     }
654     *pi_data = dst - (uint8_t*)p_data;
655
656     return *pi_data;
657 }
658
659 /****************************************************************************
660  * x264_nal_decode:
661  ****************************************************************************/
662 int x264_nal_decode( x264_nal_t *nal, void *p_data, int i_data )
663 {
664     uint8_t *src = p_data;
665     uint8_t *end = &src[i_data];
666     uint8_t *dst = nal->p_payload;
667
668     nal->i_type    = src[0]&0x1f;
669     nal->i_ref_idc = (src[0] >> 5)&0x03;
670
671     src++;
672
673     while( src < end )
674     {
675         if( src < end - 3 && src[0] == 0x00 && src[1] == 0x00  && src[2] == 0x03 )
676         {
677             *dst++ = 0x00;
678             *dst++ = 0x00;
679
680             src += 3;
681             continue;
682         }
683         *dst++ = *src++;
684     }
685
686     nal->i_payload = dst - (uint8_t*)p_data;
687     return 0;
688 }
689
690
691
692 /****************************************************************************
693  * x264_malloc:
694  ****************************************************************************/
695 void *x264_malloc( int i_size )
696 {
697 #ifdef SYS_MACOSX
698     /* Mac OS X always returns 16 bytes aligned memory */
699     return malloc( i_size );
700 #elif defined( HAVE_MALLOC_H )
701     return memalign( 16, i_size );
702 #else
703     uint8_t * buf;
704     uint8_t * align_buf;
705     buf = (uint8_t *) malloc( i_size + 15 + sizeof( void ** ) +
706               sizeof( int ) );
707     align_buf = buf + 15 + sizeof( void ** ) + sizeof( int );
708     align_buf -= (long) align_buf & 15;
709     *( (void **) ( align_buf - sizeof( void ** ) ) ) = buf;
710     *( (int *) ( align_buf - sizeof( void ** ) - sizeof( int ) ) ) = i_size;
711     return align_buf;
712 #endif
713 }
714
715 /****************************************************************************
716  * x264_free:
717  ****************************************************************************/
718 void x264_free( void *p )
719 {
720     if( p )
721     {
722 #if defined( HAVE_MALLOC_H ) || defined( SYS_MACOSX )
723         free( p );
724 #else
725         free( *( ( ( void **) p ) - 1 ) );
726 #endif
727     }
728 }
729
730 /****************************************************************************
731  * x264_realloc:
732  ****************************************************************************/
733 void *x264_realloc( void *p, int i_size )
734 {
735 #ifdef HAVE_MALLOC_H
736     return realloc( p, i_size );
737 #else
738     int       i_old_size = 0;
739     uint8_t * p_new;
740     if( p )
741     {
742         i_old_size = *( (int*) ( (uint8_t*) p ) - sizeof( void ** ) -
743                          sizeof( int ) );
744     }
745     p_new = x264_malloc( i_size );
746     if( i_old_size > 0 && i_size > 0 )
747     {
748         memcpy( p_new, p, ( i_old_size < i_size ) ? i_old_size : i_size );
749     }
750     x264_free( p );
751     return p_new;
752 #endif
753 }
754
755 /****************************************************************************
756  * x264_reduce_fraction:
757  ****************************************************************************/
758 void x264_reduce_fraction( int *n, int *d )
759 {
760     int a = *n;
761     int b = *d;
762     int c;
763     if( !a || !b )
764         return;
765     c = a % b;
766     while(c)
767     {
768         a = b;
769         b = c;
770         c = a % b;
771     }
772     *n /= b;
773     *d /= b;
774 }
775
776 /****************************************************************************
777  * x264_slurp_file:
778  ****************************************************************************/
779 char *x264_slurp_file( const char *filename )
780 {
781     int b_error = 0;
782     int i_size;
783     char *buf;
784     FILE *fh = fopen( filename, "rb" );
785     if( !fh )
786         return NULL;
787     b_error |= fseek( fh, 0, SEEK_END ) < 0;
788     b_error |= ( i_size = ftell( fh ) ) <= 0;
789     b_error |= fseek( fh, 0, SEEK_SET ) < 0;
790     if( b_error )
791         return NULL;
792     buf = x264_malloc( i_size+2 );
793     if( buf == NULL )
794         return NULL;
795     b_error |= fread( buf, 1, i_size, fh ) != i_size;
796     if( buf[i_size-1] != '\n' )
797         buf[i_size++] = '\n';
798     buf[i_size] = 0;
799     fclose( fh );
800     if( b_error )
801     {
802         x264_free( buf );
803         return NULL;
804     }
805     return buf;
806 }
807
808 /****************************************************************************
809  * x264_param2string:
810  ****************************************************************************/
811 char *x264_param2string( x264_param_t *p, int b_res )
812 {
813     int len = 1000;
814     char *buf, *s;
815     if( p->rc.psz_zones )
816         len += strlen(p->rc.psz_zones);
817     buf = s = x264_malloc( len );
818
819     if( b_res )
820     {
821         s += sprintf( s, "%dx%d ", p->i_width, p->i_height );
822         s += sprintf( s, "fps=%d/%d ", p->i_fps_num, p->i_fps_den );
823     }
824
825     s += sprintf( s, "cabac=%d", p->b_cabac );
826     s += sprintf( s, " ref=%d", p->i_frame_reference );
827     s += sprintf( s, " deblock=%d:%d:%d", p->b_deblocking_filter,
828                   p->i_deblocking_filter_alphac0, p->i_deblocking_filter_beta );
829     s += sprintf( s, " analyse=%#x:%#x", p->analyse.intra, p->analyse.inter );
830     s += sprintf( s, " me=%s", x264_motion_est_names[ p->analyse.i_me_method ] );
831     s += sprintf( s, " subme=%d", p->analyse.i_subpel_refine );
832     s += sprintf( s, " brdo=%d", p->analyse.b_bframe_rdo );
833     s += sprintf( s, " mixed_ref=%d", p->analyse.b_mixed_references );
834     s += sprintf( s, " me_range=%d", p->analyse.i_me_range );
835     s += sprintf( s, " chroma_me=%d", p->analyse.b_chroma_me );
836     s += sprintf( s, " trellis=%d", p->analyse.i_trellis );
837     s += sprintf( s, " 8x8dct=%d", p->analyse.b_transform_8x8 );
838     s += sprintf( s, " cqm=%d", p->i_cqm_preset );
839     s += sprintf( s, " deadzone=%d,%d", p->analyse.i_luma_deadzone[0], p->analyse.i_luma_deadzone[1] );
840     s += sprintf( s, " chroma_qp_offset=%d", p->analyse.i_chroma_qp_offset );
841     s += sprintf( s, " threads=%d", p->i_threads );
842     s += sprintf( s, " nr=%d", p->analyse.i_noise_reduction );
843     s += sprintf( s, " decimate=%d", p->analyse.b_dct_decimate );
844     s += sprintf( s, " mbaff=%d", p->b_interlaced );
845
846     s += sprintf( s, " bframes=%d", p->i_bframe );
847     if( p->i_bframe )
848     {
849         s += sprintf( s, " b_pyramid=%d b_adapt=%d b_bias=%d direct=%d wpredb=%d bime=%d",
850                       p->b_bframe_pyramid, p->b_bframe_adaptive, p->i_bframe_bias,
851                       p->analyse.i_direct_mv_pred, p->analyse.b_weighted_bipred,
852                       p->analyse.b_bidir_me );
853     }
854
855     s += sprintf( s, " keyint=%d keyint_min=%d scenecut=%d%s",
856                   p->i_keyint_max, p->i_keyint_min, p->i_scenecut_threshold,
857                   p->b_pre_scenecut ? "(pre)" : "" );
858
859     s += sprintf( s, " rc=%s", p->rc.i_rc_method == X264_RC_ABR ?
860                                ( p->rc.b_stat_read ? "2pass" : p->rc.i_vbv_buffer_size ? "cbr" : "abr" )
861                                : p->rc.i_rc_method == X264_RC_CRF ? "crf" : "cqp" );
862     if( p->rc.i_rc_method == X264_RC_ABR || p->rc.i_rc_method == X264_RC_CRF )
863     {
864         if( p->rc.i_rc_method == X264_RC_CRF )
865             s += sprintf( s, " crf=%.1f", p->rc.f_rf_constant );
866         else
867             s += sprintf( s, " bitrate=%d ratetol=%.1f",
868                           p->rc.i_bitrate, p->rc.f_rate_tolerance );
869         s += sprintf( s, " rceq='%s' qcomp=%.2f qpmin=%d qpmax=%d qpstep=%d",
870                       p->rc.psz_rc_eq, p->rc.f_qcompress,
871                       p->rc.i_qp_min, p->rc.i_qp_max, p->rc.i_qp_step );
872         if( p->rc.b_stat_read )
873             s += sprintf( s, " cplxblur=%.1f qblur=%.1f",
874                           p->rc.f_complexity_blur, p->rc.f_qblur );
875         if( p->rc.i_vbv_buffer_size )
876             s += sprintf( s, " vbv_maxrate=%d vbv_bufsize=%d",
877                           p->rc.i_vbv_max_bitrate, p->rc.i_vbv_buffer_size );
878     }
879     else if( p->rc.i_rc_method == X264_RC_CQP )
880         s += sprintf( s, " qp=%d", p->rc.i_qp_constant );
881     if( !(p->rc.i_rc_method == X264_RC_CQP && p->rc.i_qp_constant == 0) )
882     {
883         s += sprintf( s, " ip_ratio=%.2f", p->rc.f_ip_factor );
884         if( p->i_bframe )
885             s += sprintf( s, " pb_ratio=%.2f", p->rc.f_pb_factor );
886         if( p->rc.psz_zones )
887             s += sprintf( s, " zones=%s", p->rc.psz_zones );
888         else if( p->rc.i_zones )
889             s += sprintf( s, " zones" );
890     }
891
892     return buf;
893 }
894