]> git.sesse.net Git - ffmpeg/blob - libavcodec/arm/dsputil_init_arm.c
Merge remote-tracking branch 'qatar/master'
[ffmpeg] / libavcodec / arm / dsputil_init_arm.c
1 /*
2  * ARM optimized DSP utils
3  * Copyright (c) 2001 Lionel Ulmer
4  *
5  * This file is part of FFmpeg.
6  *
7  * FFmpeg is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * FFmpeg is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with FFmpeg; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20  */
21
22 #include "libavutil/attributes.h"
23 #include "libavutil/arm/cpu.h"
24 #include "libavcodec/dsputil.h"
25 #include "dsputil_arm.h"
26
27 void ff_j_rev_dct_arm(int16_t *data);
28 void ff_simple_idct_arm(int16_t *data);
29
30 /* XXX: local hack */
31 static void (*ff_put_pixels_clamped)(const int16_t *block, uint8_t *pixels, int line_size);
32 static void (*ff_add_pixels_clamped)(const int16_t *block, uint8_t *pixels, int line_size);
33
34 void ff_put_pixels8_arm(uint8_t *block, const uint8_t *pixels, ptrdiff_t line_size, int h);
35 void ff_put_pixels8_x2_arm(uint8_t *block, const uint8_t *pixels, ptrdiff_t line_size, int h);
36 void ff_put_pixels8_y2_arm(uint8_t *block, const uint8_t *pixels, ptrdiff_t line_size, int h);
37 void ff_put_pixels8_xy2_arm(uint8_t *block, const uint8_t *pixels, ptrdiff_t line_size, int h);
38
39 void ff_put_no_rnd_pixels8_x2_arm(uint8_t *block, const uint8_t *pixels, ptrdiff_t line_size, int h);
40 void ff_put_no_rnd_pixels8_y2_arm(uint8_t *block, const uint8_t *pixels, ptrdiff_t line_size, int h);
41 void ff_put_no_rnd_pixels8_xy2_arm(uint8_t *block, const uint8_t *pixels, ptrdiff_t line_size, int h);
42
43 void ff_put_pixels16_arm(uint8_t *block, const uint8_t *pixels, ptrdiff_t line_size, int h);
44
45 CALL_2X_PIXELS(ff_put_pixels16_x2_arm,         ff_put_pixels8_x2_arm,        8)
46 CALL_2X_PIXELS(ff_put_pixels16_y2_arm,         ff_put_pixels8_y2_arm,        8)
47 CALL_2X_PIXELS(ff_put_pixels16_xy2_arm,        ff_put_pixels8_xy2_arm,       8)
48 CALL_2X_PIXELS(ff_put_no_rnd_pixels16_x2_arm,  ff_put_no_rnd_pixels8_x2_arm, 8)
49 CALL_2X_PIXELS(ff_put_no_rnd_pixels16_y2_arm,  ff_put_no_rnd_pixels8_y2_arm, 8)
50 CALL_2X_PIXELS(ff_put_no_rnd_pixels16_xy2_arm, ff_put_no_rnd_pixels8_xy2_arm,8)
51
52 void ff_add_pixels_clamped_arm(const int16_t *block, uint8_t *dest,
53                                int line_size);
54
55 /* XXX: those functions should be suppressed ASAP when all IDCTs are
56    converted */
57 static void j_rev_dct_arm_put(uint8_t *dest, int line_size, int16_t *block)
58 {
59     ff_j_rev_dct_arm (block);
60     ff_put_pixels_clamped(block, dest, line_size);
61 }
62 static void j_rev_dct_arm_add(uint8_t *dest, int line_size, int16_t *block)
63 {
64     ff_j_rev_dct_arm (block);
65     ff_add_pixels_clamped(block, dest, line_size);
66 }
67 static void simple_idct_arm_put(uint8_t *dest, int line_size, int16_t *block)
68 {
69     ff_simple_idct_arm (block);
70     ff_put_pixels_clamped(block, dest, line_size);
71 }
72 static void simple_idct_arm_add(uint8_t *dest, int line_size, int16_t *block)
73 {
74     ff_simple_idct_arm (block);
75     ff_add_pixels_clamped(block, dest, line_size);
76 }
77
78 av_cold void ff_dsputil_init_arm(DSPContext *c, AVCodecContext *avctx)
79 {
80     const int high_bit_depth = avctx->bits_per_raw_sample > 8;
81     int cpu_flags = av_get_cpu_flags();
82
83     ff_put_pixels_clamped = c->put_pixels_clamped;
84     ff_add_pixels_clamped = c->add_pixels_clamped;
85
86     if (!avctx->lowres && avctx->bits_per_raw_sample <= 8) {
87         if(avctx->idct_algo == FF_IDCT_AUTO ||
88            avctx->idct_algo == FF_IDCT_ARM){
89             c->idct_put              = j_rev_dct_arm_put;
90             c->idct_add              = j_rev_dct_arm_add;
91             c->idct                  = ff_j_rev_dct_arm;
92             c->idct_permutation_type = FF_LIBMPEG2_IDCT_PERM;
93         } else if (avctx->idct_algo == FF_IDCT_SIMPLEARM){
94             c->idct_put              = simple_idct_arm_put;
95             c->idct_add              = simple_idct_arm_add;
96             c->idct                  = ff_simple_idct_arm;
97             c->idct_permutation_type = FF_NO_IDCT_PERM;
98         }
99     }
100
101     c->add_pixels_clamped = ff_add_pixels_clamped_arm;
102
103     if (!high_bit_depth) {
104     c->put_pixels_tab[0][0] = ff_put_pixels16_arm;
105     c->put_pixels_tab[0][1] = ff_put_pixels16_x2_arm;
106     c->put_pixels_tab[0][2] = ff_put_pixels16_y2_arm;
107     c->put_pixels_tab[0][3] = ff_put_pixels16_xy2_arm;
108     c->put_pixels_tab[1][0] = ff_put_pixels8_arm;
109     c->put_pixels_tab[1][1] = ff_put_pixels8_x2_arm;
110     c->put_pixels_tab[1][2] = ff_put_pixels8_y2_arm;
111     c->put_pixels_tab[1][3] = ff_put_pixels8_xy2_arm;
112
113     c->put_no_rnd_pixels_tab[0][0] = ff_put_pixels16_arm;
114     c->put_no_rnd_pixels_tab[0][1] = ff_put_no_rnd_pixels16_x2_arm;
115     c->put_no_rnd_pixels_tab[0][2] = ff_put_no_rnd_pixels16_y2_arm;
116     c->put_no_rnd_pixels_tab[0][3] = ff_put_no_rnd_pixels16_xy2_arm;
117     c->put_no_rnd_pixels_tab[1][0] = ff_put_pixels8_arm;
118     c->put_no_rnd_pixels_tab[1][1] = ff_put_no_rnd_pixels8_x2_arm;
119     c->put_no_rnd_pixels_tab[1][2] = ff_put_no_rnd_pixels8_y2_arm;
120     c->put_no_rnd_pixels_tab[1][3] = ff_put_no_rnd_pixels8_xy2_arm;
121     }
122
123     if (have_armv5te(cpu_flags)) ff_dsputil_init_armv5te(c, avctx);
124     if (have_armv6(cpu_flags))   ff_dsputil_init_armv6(c, avctx);
125     if (have_neon(cpu_flags))    ff_dsputil_init_neon(c, avctx);
126 }