]> git.sesse.net Git - ffmpeg/blob - libavcodec/msmpeg4enc.c
avcodec/msmpeg4enc: Make msmpeg4 encoders init-threadsafe
[ffmpeg] / libavcodec / msmpeg4enc.c
1 /*
2  * MSMPEG4 encoder backend
3  * Copyright (c) 2001 Fabrice Bellard
4  * Copyright (c) 2002-2004 Michael Niedermayer <michaelni@gmx.at>
5  *
6  * msmpeg4v1 & v2 stuff by Michael Niedermayer <michaelni@gmx.at>
7  *
8  * This file is part of FFmpeg.
9  *
10  * FFmpeg is free software; you can redistribute it and/or
11  * modify it under the terms of the GNU Lesser General Public
12  * License as published by the Free Software Foundation; either
13  * version 2.1 of the License, or (at your option) any later version.
14  *
15  * FFmpeg is distributed in the hope that it will be useful,
16  * but WITHOUT ANY WARRANTY; without even the implied warranty of
17  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
18  * Lesser General Public License for more details.
19  *
20  * You should have received a copy of the GNU Lesser General Public
21  * License along with FFmpeg; if not, write to the Free Software
22  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
23  */
24
25 /**
26  * @file
27  * MSMPEG4 encoder backend
28  */
29
30 #include <stdint.h>
31 #include <string.h>
32
33 #include "libavutil/attributes.h"
34 #include "libavutil/avutil.h"
35 #include "libavutil/thread.h"
36 #include "mpegvideo.h"
37 #include "h263.h"
38 #include "internal.h"
39 #include "mpeg4video.h"
40 #include "msmpeg4.h"
41 #include "msmpeg4data.h"
42 #include "put_bits.h"
43 #include "rl.h"
44 #include "vc1data.h"
45
46 static uint8_t rl_length[NB_RL_TABLES][MAX_LEVEL+1][MAX_RUN+1][2];
47
48 /* build the table which associate a (x,y) motion vector to a vlc */
49 static av_cold void init_mv_table(MVTable *tab, uint16_t table_mv_index[4096])
50 {
51     int i, x, y;
52
53     tab->table_mv_index = table_mv_index;
54
55     /* mark all entries as not used */
56     for(i=0;i<4096;i++)
57         tab->table_mv_index[i] = MSMPEG4_MV_TABLES_NB_ELEMS;
58
59     for (i = 0; i < MSMPEG4_MV_TABLES_NB_ELEMS; i++) {
60         x = tab->table_mvx[i];
61         y = tab->table_mvy[i];
62         tab->table_mv_index[(x << 6) | y] = i;
63     }
64 }
65
66 void ff_msmpeg4_code012(PutBitContext *pb, int n)
67 {
68     if (n == 0) {
69         put_bits(pb, 1, 0);
70     } else {
71         put_bits(pb, 1, 1);
72         put_bits(pb, 1, (n >= 2));
73     }
74 }
75
76 static int get_size_of_code(const RLTable *rl, int last, int run,
77                             int level, int intra)
78 {
79     int size=0;
80     int code;
81     int run_diff= intra ? 0 : 1;
82
83     code = get_rl_index(rl, last, run, level);
84     size+= rl->table_vlc[code][1];
85     if (code == rl->n) {
86         int level1, run1;
87
88         level1 = level - rl->max_level[last][run];
89         if (level1 < 1)
90             goto esc2;
91         code = get_rl_index(rl, last, run, level1);
92         if (code == rl->n) {
93             esc2:
94             size++;
95             if (level > MAX_LEVEL)
96                 goto esc3;
97             run1 = run - rl->max_run[last][level] - run_diff;
98             if (run1 < 0)
99                 goto esc3;
100             code = get_rl_index(rl, last, run1, level);
101             if (code == rl->n) {
102             esc3:
103                 /* third escape */
104                 size+=1+1+6+8;
105             } else {
106                 /* second escape */
107                 size+= 1+1+ rl->table_vlc[code][1];
108             }
109         } else {
110             /* first escape */
111             size+= 1+1+ rl->table_vlc[code][1];
112         }
113     } else {
114         size++;
115     }
116     return size;
117 }
118
119 static av_cold void msmpeg4_encode_init_static(void)
120 {
121     int i;
122         static uint16_t mv_index_tables[2][4096];
123         init_mv_table(&ff_mv_tables[0], mv_index_tables[0]);
124         init_mv_table(&ff_mv_tables[1], mv_index_tables[1]);
125
126         for(i=0; i<NB_RL_TABLES; i++){
127             int level;
128             for (level = 1; level <= MAX_LEVEL; level++) {
129                 int run;
130                 for(run=0; run<=MAX_RUN; run++){
131                     int last;
132                     for(last=0; last<2; last++){
133                         rl_length[i][level][run][last] = get_size_of_code(&ff_rl_table[i], last, run, level, 0);
134                     }
135                 }
136             }
137         }
138 }
139
140 av_cold void ff_msmpeg4_encode_init(MpegEncContext *s)
141 {
142     static AVOnce init_static_once = AV_ONCE_INIT;
143
144     ff_msmpeg4_common_init(s);
145     if (s->msmpeg4_version >= 4) {
146         s->min_qcoeff = -255;
147         s->max_qcoeff =  255;
148     }
149
150     /* init various encoding tables */
151     ff_thread_once(&init_static_once, msmpeg4_encode_init_static);
152 }
153
154 static void find_best_tables(MpegEncContext * s)
155 {
156     int i;
157     int best        = 0, best_size        = INT_MAX;
158     int chroma_best = 0, best_chroma_size = INT_MAX;
159
160     for(i=0; i<3; i++){
161         int level;
162         int chroma_size=0;
163         int size=0;
164
165         if(i>0){// ;)
166             size++;
167             chroma_size++;
168         }
169         for(level=0; level<=MAX_LEVEL; level++){
170             int run;
171             for(run=0; run<=MAX_RUN; run++){
172                 int last;
173                 const int last_size= size + chroma_size;
174                 for(last=0; last<2; last++){
175                     int inter_count       = s->ac_stats[0][0][level][run][last] + s->ac_stats[0][1][level][run][last];
176                     int intra_luma_count  = s->ac_stats[1][0][level][run][last];
177                     int intra_chroma_count= s->ac_stats[1][1][level][run][last];
178
179                     if(s->pict_type==AV_PICTURE_TYPE_I){
180                         size       += intra_luma_count  *rl_length[i  ][level][run][last];
181                         chroma_size+= intra_chroma_count*rl_length[i+3][level][run][last];
182                     }else{
183                         size+=        intra_luma_count  *rl_length[i  ][level][run][last]
184                                      +intra_chroma_count*rl_length[i+3][level][run][last]
185                                      +inter_count       *rl_length[i+3][level][run][last];
186                     }
187                 }
188                 if(last_size == size+chroma_size) break;
189             }
190         }
191         if(size<best_size){
192             best_size= size;
193             best= i;
194         }
195         if(chroma_size<best_chroma_size){
196             best_chroma_size= chroma_size;
197             chroma_best= i;
198         }
199     }
200
201     if(s->pict_type==AV_PICTURE_TYPE_P) chroma_best= best;
202
203     memset(s->ac_stats, 0, sizeof(int)*(MAX_LEVEL+1)*(MAX_RUN+1)*2*2*2);
204
205     s->rl_table_index       =        best;
206     s->rl_chroma_table_index= chroma_best;
207
208     if(s->pict_type != s->last_non_b_pict_type){
209         s->rl_table_index= 2;
210         if(s->pict_type==AV_PICTURE_TYPE_I)
211             s->rl_chroma_table_index= 1;
212         else
213             s->rl_chroma_table_index= 2;
214     }
215
216 }
217
218 /* write MSMPEG4 compatible frame header */
219 void ff_msmpeg4_encode_picture_header(MpegEncContext * s, int picture_number)
220 {
221     find_best_tables(s);
222
223     align_put_bits(&s->pb);
224     put_bits(&s->pb, 2, s->pict_type - 1);
225
226     put_bits(&s->pb, 5, s->qscale);
227     if(s->msmpeg4_version<=2){
228         s->rl_table_index = 2;
229         s->rl_chroma_table_index = 2;
230     }
231
232     s->dc_table_index = 1;
233     s->mv_table_index = 1; /* only if P-frame */
234     s->use_skip_mb_code = 1; /* only if P-frame */
235     s->per_mb_rl_table = 0;
236     if(s->msmpeg4_version==4)
237         s->inter_intra_pred= (s->width*s->height < 320*240 && s->bit_rate<=II_BITRATE && s->pict_type==AV_PICTURE_TYPE_P);
238     ff_dlog(s, "%d %"PRId64" %d %d %d\n", s->pict_type, s->bit_rate,
239             s->inter_intra_pred, s->width, s->height);
240
241     if (s->pict_type == AV_PICTURE_TYPE_I) {
242         s->slice_height= s->mb_height/1;
243         put_bits(&s->pb, 5, 0x16 + s->mb_height/s->slice_height);
244
245         if(s->msmpeg4_version==4){
246             ff_msmpeg4_encode_ext_header(s);
247             if(s->bit_rate>MBAC_BITRATE)
248                 put_bits(&s->pb, 1, s->per_mb_rl_table);
249         }
250
251         if(s->msmpeg4_version>2){
252             if(!s->per_mb_rl_table){
253                 ff_msmpeg4_code012(&s->pb, s->rl_chroma_table_index);
254                 ff_msmpeg4_code012(&s->pb, s->rl_table_index);
255             }
256
257             put_bits(&s->pb, 1, s->dc_table_index);
258         }
259     } else {
260         put_bits(&s->pb, 1, s->use_skip_mb_code);
261
262         if(s->msmpeg4_version==4 && s->bit_rate>MBAC_BITRATE)
263             put_bits(&s->pb, 1, s->per_mb_rl_table);
264
265         if(s->msmpeg4_version>2){
266             if(!s->per_mb_rl_table)
267                 ff_msmpeg4_code012(&s->pb, s->rl_table_index);
268
269             put_bits(&s->pb, 1, s->dc_table_index);
270
271             put_bits(&s->pb, 1, s->mv_table_index);
272         }
273     }
274
275     s->esc3_level_length= 0;
276     s->esc3_run_length= 0;
277 }
278
279 void ff_msmpeg4_encode_ext_header(MpegEncContext * s)
280 {
281         unsigned fps = s->avctx->time_base.den / s->avctx->time_base.num / FFMAX(s->avctx->ticks_per_frame, 1);
282         put_bits(&s->pb, 5, FFMIN(fps, 31)); //yes 29.97 -> 29
283
284         put_bits(&s->pb, 11, FFMIN(s->bit_rate/1024, 2047));
285
286         if(s->msmpeg4_version>=3)
287             put_bits(&s->pb, 1, s->flipflop_rounding);
288         else
289             av_assert0(s->flipflop_rounding==0);
290 }
291
292 void ff_msmpeg4_encode_motion(MpegEncContext * s,
293                                   int mx, int my)
294 {
295     int code;
296     MVTable *mv;
297
298     /* modulo encoding */
299     /* WARNING : you cannot reach all the MVs even with the modulo
300        encoding. This is a somewhat strange compromise they took !!!  */
301     if (mx <= -64)
302         mx += 64;
303     else if (mx >= 64)
304         mx -= 64;
305     if (my <= -64)
306         my += 64;
307     else if (my >= 64)
308         my -= 64;
309
310     mx += 32;
311     my += 32;
312     mv = &ff_mv_tables[s->mv_table_index];
313
314     code = mv->table_mv_index[(mx << 6) | my];
315     put_bits(&s->pb,
316              mv->table_mv_bits[code],
317              mv->table_mv_code[code]);
318     if (code == MSMPEG4_MV_TABLES_NB_ELEMS) {
319         /* escape : code literally */
320         put_bits(&s->pb, 6, mx);
321         put_bits(&s->pb, 6, my);
322     }
323 }
324
325 void ff_msmpeg4_handle_slices(MpegEncContext *s){
326     if (s->mb_x == 0) {
327         if (s->slice_height && (s->mb_y % s->slice_height) == 0) {
328             if(s->msmpeg4_version < 4){
329                 ff_mpeg4_clean_buffers(s);
330             }
331             s->first_slice_line = 1;
332         } else {
333             s->first_slice_line = 0;
334         }
335     }
336 }
337
338 static void msmpeg4v2_encode_motion(MpegEncContext * s, int val)
339 {
340     int range, bit_size, sign, code, bits;
341
342     if (val == 0) {
343         /* zero vector */
344         code = 0;
345         put_bits(&s->pb, ff_mvtab[code][1], ff_mvtab[code][0]);
346     } else {
347         bit_size = s->f_code - 1;
348         range = 1 << bit_size;
349         if (val <= -64)
350             val += 64;
351         else if (val >= 64)
352             val -= 64;
353
354         if (val >= 0) {
355             sign = 0;
356         } else {
357             val = -val;
358             sign = 1;
359         }
360         val--;
361         code = (val >> bit_size) + 1;
362         bits = val & (range - 1);
363
364         put_bits(&s->pb, ff_mvtab[code][1] + 1, (ff_mvtab[code][0] << 1) | sign);
365         if (bit_size > 0) {
366             put_bits(&s->pb, bit_size, bits);
367         }
368     }
369 }
370
371 void ff_msmpeg4_encode_mb(MpegEncContext * s,
372                           int16_t block[6][64],
373                           int motion_x, int motion_y)
374 {
375     int cbp, coded_cbp, i;
376     int pred_x, pred_y;
377     uint8_t *coded_block;
378
379     ff_msmpeg4_handle_slices(s);
380
381     if (!s->mb_intra) {
382         /* compute cbp */
383         cbp = 0;
384         for (i = 0; i < 6; i++) {
385             if (s->block_last_index[i] >= 0)
386                 cbp |= 1 << (5 - i);
387         }
388         if (s->use_skip_mb_code && (cbp | motion_x | motion_y) == 0) {
389             /* skip macroblock */
390             put_bits(&s->pb, 1, 1);
391             s->last_bits++;
392             s->misc_bits++;
393             s->skip_count++;
394
395             return;
396         }
397         if (s->use_skip_mb_code)
398             put_bits(&s->pb, 1, 0);     /* mb coded */
399
400         if(s->msmpeg4_version<=2){
401             put_bits(&s->pb,
402                      ff_v2_mb_type[cbp&3][1],
403                      ff_v2_mb_type[cbp&3][0]);
404             if((cbp&3) != 3) coded_cbp= cbp ^ 0x3C;
405             else             coded_cbp= cbp;
406
407             put_bits(&s->pb,
408                      ff_h263_cbpy_tab[coded_cbp>>2][1],
409                      ff_h263_cbpy_tab[coded_cbp>>2][0]);
410
411             s->misc_bits += get_bits_diff(s);
412
413             ff_h263_pred_motion(s, 0, 0, &pred_x, &pred_y);
414             msmpeg4v2_encode_motion(s, motion_x - pred_x);
415             msmpeg4v2_encode_motion(s, motion_y - pred_y);
416         }else{
417             put_bits(&s->pb,
418                      ff_table_mb_non_intra[cbp + 64][1],
419                      ff_table_mb_non_intra[cbp + 64][0]);
420
421             s->misc_bits += get_bits_diff(s);
422
423             /* motion vector */
424             ff_h263_pred_motion(s, 0, 0, &pred_x, &pred_y);
425             ff_msmpeg4_encode_motion(s, motion_x - pred_x,
426                                   motion_y - pred_y);
427         }
428
429         s->mv_bits += get_bits_diff(s);
430
431         for (i = 0; i < 6; i++) {
432             ff_msmpeg4_encode_block(s, block[i], i);
433         }
434         s->p_tex_bits += get_bits_diff(s);
435     } else {
436         /* compute cbp */
437         cbp = 0;
438         coded_cbp = 0;
439         for (i = 0; i < 6; i++) {
440             int val, pred;
441             val = (s->block_last_index[i] >= 1);
442             cbp |= val << (5 - i);
443             if (i < 4) {
444                 /* predict value for close blocks only for luma */
445                 pred = ff_msmpeg4_coded_block_pred(s, i, &coded_block);
446                 *coded_block = val;
447                 val = val ^ pred;
448             }
449             coded_cbp |= val << (5 - i);
450         }
451
452         if(s->msmpeg4_version<=2){
453             if (s->pict_type == AV_PICTURE_TYPE_I) {
454                 put_bits(&s->pb,
455                          ff_v2_intra_cbpc[cbp&3][1], ff_v2_intra_cbpc[cbp&3][0]);
456             } else {
457                 if (s->use_skip_mb_code)
458                     put_bits(&s->pb, 1, 0);     /* mb coded */
459                 put_bits(&s->pb,
460                          ff_v2_mb_type[(cbp&3) + 4][1],
461                          ff_v2_mb_type[(cbp&3) + 4][0]);
462             }
463             put_bits(&s->pb, 1, 0);             /* no AC prediction yet */
464             put_bits(&s->pb,
465                      ff_h263_cbpy_tab[cbp>>2][1],
466                      ff_h263_cbpy_tab[cbp>>2][0]);
467         }else{
468             if (s->pict_type == AV_PICTURE_TYPE_I) {
469                 put_bits(&s->pb,
470                          ff_msmp4_mb_i_table[coded_cbp][1], ff_msmp4_mb_i_table[coded_cbp][0]);
471             } else {
472                 if (s->use_skip_mb_code)
473                     put_bits(&s->pb, 1, 0);     /* mb coded */
474                 put_bits(&s->pb,
475                          ff_table_mb_non_intra[cbp][1],
476                          ff_table_mb_non_intra[cbp][0]);
477             }
478             put_bits(&s->pb, 1, 0);             /* no AC prediction yet */
479             if(s->inter_intra_pred){
480                 s->h263_aic_dir=0;
481                 put_bits(&s->pb, ff_table_inter_intra[s->h263_aic_dir][1], ff_table_inter_intra[s->h263_aic_dir][0]);
482             }
483         }
484         s->misc_bits += get_bits_diff(s);
485
486         for (i = 0; i < 6; i++) {
487             ff_msmpeg4_encode_block(s, block[i], i);
488         }
489         s->i_tex_bits += get_bits_diff(s);
490         s->i_count++;
491     }
492 }
493
494 static void msmpeg4_encode_dc(MpegEncContext * s, int level, int n, int *dir_ptr)
495 {
496     int sign, code;
497     int pred;
498
499     int16_t *dc_val;
500     pred = ff_msmpeg4_pred_dc(s, n, &dc_val, dir_ptr);
501
502     /* update predictor */
503     if (n < 4) {
504         *dc_val = level * s->y_dc_scale;
505     } else {
506         *dc_val = level * s->c_dc_scale;
507     }
508
509     /* do the prediction */
510     level -= pred;
511
512     if(s->msmpeg4_version<=2){
513         if (n < 4) {
514             put_bits(&s->pb,
515                      ff_v2_dc_lum_table[level + 256][1],
516                      ff_v2_dc_lum_table[level + 256][0]);
517         }else{
518             put_bits(&s->pb,
519                      ff_v2_dc_chroma_table[level + 256][1],
520                      ff_v2_dc_chroma_table[level + 256][0]);
521         }
522     }else{
523         sign = 0;
524         if (level < 0) {
525             level = -level;
526             sign = 1;
527         }
528         code = level;
529         if (code > DC_MAX)
530             code = DC_MAX;
531
532         if (s->dc_table_index == 0) {
533             if (n < 4) {
534                 put_bits(&s->pb, ff_table0_dc_lum[code][1], ff_table0_dc_lum[code][0]);
535             } else {
536                 put_bits(&s->pb, ff_table0_dc_chroma[code][1], ff_table0_dc_chroma[code][0]);
537             }
538         } else {
539             if (n < 4) {
540                 put_bits(&s->pb, ff_table1_dc_lum[code][1], ff_table1_dc_lum[code][0]);
541             } else {
542                 put_bits(&s->pb, ff_table1_dc_chroma[code][1], ff_table1_dc_chroma[code][0]);
543             }
544         }
545
546         if (code == DC_MAX)
547             put_bits(&s->pb, 8, level);
548
549         if (level != 0) {
550             put_bits(&s->pb, 1, sign);
551         }
552     }
553 }
554
555 /* Encoding of a block; very similar to MPEG-4 except for a different
556  * escape coding (same as H.263) and more VLC tables. */
557 void ff_msmpeg4_encode_block(MpegEncContext * s, int16_t * block, int n)
558 {
559     int level, run, last, i, j, last_index;
560     int last_non_zero, sign, slevel;
561     int code, run_diff, dc_pred_dir;
562     const RLTable *rl;
563     const uint8_t *scantable;
564
565     if (s->mb_intra) {
566         msmpeg4_encode_dc(s, block[0], n, &dc_pred_dir);
567         i = 1;
568         if (n < 4) {
569             rl = &ff_rl_table[s->rl_table_index];
570         } else {
571             rl = &ff_rl_table[3 + s->rl_chroma_table_index];
572         }
573         run_diff = s->msmpeg4_version>=4;
574         scantable= s->intra_scantable.permutated;
575     } else {
576         i = 0;
577         rl = &ff_rl_table[3 + s->rl_table_index];
578         if(s->msmpeg4_version<=2)
579             run_diff = 0;
580         else
581             run_diff = 1;
582         scantable= s->inter_scantable.permutated;
583     }
584
585     /* recalculate block_last_index for M$ wmv1 */
586     if (s->msmpeg4_version >= 4 && s->block_last_index[n] > 0) {
587         for(last_index=63; last_index>=0; last_index--){
588             if(block[scantable[last_index]]) break;
589         }
590         s->block_last_index[n]= last_index;
591     }else
592         last_index = s->block_last_index[n];
593     /* AC coefs */
594     last_non_zero = i - 1;
595     for (; i <= last_index; i++) {
596         j = scantable[i];
597         level = block[j];
598         if (level) {
599             run = i - last_non_zero - 1;
600             last = (i == last_index);
601             sign = 0;
602             slevel = level;
603             if (level < 0) {
604                 sign = 1;
605                 level = -level;
606             }
607
608             if(level<=MAX_LEVEL && run<=MAX_RUN){
609                 s->ac_stats[s->mb_intra][n>3][level][run][last]++;
610             }
611
612             s->ac_stats[s->mb_intra][n > 3][40][63][0]++; //esc3 like
613
614             code = get_rl_index(rl, last, run, level);
615             put_bits(&s->pb, rl->table_vlc[code][1], rl->table_vlc[code][0]);
616             if (code == rl->n) {
617                 int level1, run1;
618
619                 level1 = level - rl->max_level[last][run];
620                 if (level1 < 1)
621                     goto esc2;
622                 code = get_rl_index(rl, last, run, level1);
623                 if (code == rl->n) {
624                 esc2:
625                     put_bits(&s->pb, 1, 0);
626                     if (level > MAX_LEVEL)
627                         goto esc3;
628                     run1 = run - rl->max_run[last][level] - run_diff;
629                     if (run1 < 0)
630                         goto esc3;
631                     code = get_rl_index(rl, last, run1+1, level);
632                     if (s->msmpeg4_version == 4 && code == rl->n)
633                         goto esc3;
634                     code = get_rl_index(rl, last, run1, level);
635                     if (code == rl->n) {
636                     esc3:
637                         /* third escape */
638                         put_bits(&s->pb, 1, 0);
639                         put_bits(&s->pb, 1, last);
640                         if(s->msmpeg4_version>=4){
641                             if(s->esc3_level_length==0){
642                                 s->esc3_level_length=8;
643                                 s->esc3_run_length= 6;
644                                 //ESCLVLSZ + ESCRUNSZ
645                                 if(s->qscale<8)
646                                     put_bits(&s->pb, 6, 3);
647                                 else
648                                     put_bits(&s->pb, 8, 3);
649                             }
650                             put_bits(&s->pb, s->esc3_run_length, run);
651                             put_bits(&s->pb, 1, sign);
652                             put_bits(&s->pb, s->esc3_level_length, level);
653                         }else{
654                             put_bits(&s->pb, 6, run);
655                             put_sbits(&s->pb, 8, slevel);
656                         }
657                     } else {
658                         /* second escape */
659                         put_bits(&s->pb, 1, 1);
660                         put_bits(&s->pb, rl->table_vlc[code][1], rl->table_vlc[code][0]);
661                         put_bits(&s->pb, 1, sign);
662                     }
663                 } else {
664                     /* first escape */
665                     put_bits(&s->pb, 1, 1);
666                     put_bits(&s->pb, rl->table_vlc[code][1], rl->table_vlc[code][0]);
667                     put_bits(&s->pb, 1, sign);
668                 }
669             } else {
670                 put_bits(&s->pb, 1, sign);
671             }
672             last_non_zero = i;
673         }
674     }
675 }