]> git.sesse.net Git - ffmpeg/blob - libavutil/internal.h
ARM: ARMv6 optimised FASTDIV
[ffmpeg] / libavutil / internal.h
1 /*
2  * copyright (c) 2006 Michael Niedermayer <michaelni@gmx.at>
3  *
4  * This file is part of FFmpeg.
5  *
6  * FFmpeg is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU Lesser General Public
8  * License as published by the Free Software Foundation; either
9  * version 2.1 of the License, or (at your option) any later version.
10  *
11  * FFmpeg is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14  * Lesser General Public License for more details.
15  *
16  * You should have received a copy of the GNU Lesser General Public
17  * License along with FFmpeg; if not, write to the Free Software
18  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
19  */
20
21 /**
22  * @file internal.h
23  * common internal api header.
24  */
25
26 #ifndef FFMPEG_INTERNAL_H
27 #define FFMPEG_INTERNAL_H
28
29 #if !defined(DEBUG) && !defined(NDEBUG)
30 #    define NDEBUG
31 #endif
32
33 #include <stdint.h>
34 #include <stddef.h>
35 #include <assert.h>
36
37 #ifndef attribute_align_arg
38 #if defined(__GNUC__) && (__GNUC__ > 4 || __GNUC__ == 4 && __GNUC_MINOR__>1)
39 #    define attribute_align_arg __attribute__((force_align_arg_pointer))
40 #else
41 #    define attribute_align_arg
42 #endif
43 #endif
44
45 #ifndef attribute_used
46 #if defined(__GNUC__) && (__GNUC__ > 3 || __GNUC__ == 3 && __GNUC_MINOR__ > 0)
47 #    define attribute_used __attribute__((used))
48 #else
49 #    define attribute_used
50 #endif
51 #endif
52
53 #ifdef HAVE_ALTIVEC
54 #ifdef HAVE_ALTIVEC_VECTOR_BRACES
55 #define AVV(x...) {x}
56 #else
57 #define AVV(x...) (x)
58 #endif
59 #endif
60
61 #ifndef M_PI
62 #define M_PI    3.14159265358979323846
63 #endif
64
65 #ifndef INT16_MIN
66 #define INT16_MIN       (-0x7fff-1)
67 #endif
68
69 #ifndef INT16_MAX
70 #define INT16_MAX       0x7fff
71 #endif
72
73 #ifndef INT32_MIN
74 #define INT32_MIN       (-0x7fffffff-1)
75 #endif
76
77 #ifndef INT32_MAX
78 #define INT32_MAX       0x7fffffff
79 #endif
80
81 #ifndef UINT32_MAX
82 #define UINT32_MAX      0xffffffff
83 #endif
84
85 #ifndef INT64_MIN
86 #define INT64_MIN       (-0x7fffffffffffffffLL-1)
87 #endif
88
89 #ifndef INT64_MAX
90 #define INT64_MAX INT64_C(9223372036854775807)
91 #endif
92
93 #ifndef UINT64_MAX
94 #define UINT64_MAX UINT64_C(0xFFFFFFFFFFFFFFFF)
95 #endif
96
97 #ifndef INT_BIT
98 #    if INT_MAX != 2147483647
99 #        define INT_BIT 64
100 #    else
101 #        define INT_BIT 32
102 #    endif
103 #endif
104
105 #if ( defined(__PIC__) || defined(__pic__) ) && ! defined(PIC)
106 #    define PIC
107 #endif
108
109 #include "config.h"
110 #include "intreadwrite.h"
111 #include "bswap.h"
112
113 #ifndef offsetof
114 #    define offsetof(T,F) ((unsigned int)((char *)&((T *)0)->F))
115 #endif
116
117 #ifdef USE_FASTMEMCPY
118 #    include "libvo/fastmemcpy.h"
119 #    define memcpy(a,b,c) fast_memcpy(a,b,c)
120 #endif
121
122 // Use rip-relative addressing if compiling PIC code on x86-64.
123 #if defined(ARCH_X86_64) && defined(PIC)
124 #    define LOCAL_MANGLE(a) #a "(%%rip)"
125 #else
126 #    define LOCAL_MANGLE(a) #a
127 #endif
128
129 #define MANGLE(a) EXTERN_PREFIX LOCAL_MANGLE(a)
130
131 /* debug stuff */
132
133 /* dprintf macros */
134 #ifdef DEBUG
135 #    define dprintf(pctx, ...) av_log(pctx, AV_LOG_DEBUG, __VA_ARGS__)
136 #else
137 #    define dprintf(pctx, ...)
138 #endif
139
140 #define av_abort()      do { av_log(NULL, AV_LOG_ERROR, "Abort at %s:%d\n", __FILE__, __LINE__); abort(); } while (0)
141
142 /* math */
143
144 extern const uint32_t ff_inverse[256];
145
146 #if defined(ARCH_X86)
147 #    define FASTDIV(a,b) \
148     ({\
149         int ret,dmy;\
150         asm volatile(\
151             "mull %3"\
152             :"=d"(ret),"=a"(dmy)\
153             :"1"(a),"g"(ff_inverse[b])\
154             );\
155         ret;\
156     })
157 #elif defined(HAVE_ARMV6)
158 static inline av_const int FASTDIV(int a, int b)
159 {
160     int r;
161     asm volatile("smmul %0, %1, %2" : "=r"(r) : "r"(a), "r"(ff_inverse[b]));
162     return r;
163 }
164 #elif defined(ARCH_ARMV4L)
165 #    define FASTDIV(a,b) \
166     ({\
167         int ret,dmy;\
168         asm volatile(\
169             "umull %1, %0, %2, %3"\
170             :"=&r"(ret),"=&r"(dmy)\
171             :"r"(a),"r"(ff_inverse[b])\
172             );\
173         ret;\
174     })
175 #elif defined(CONFIG_FASTDIV)
176 #    define FASTDIV(a,b)   ((uint32_t)((((uint64_t)a)*ff_inverse[b])>>32))
177 #else
178 #    define FASTDIV(a,b)   ((a)/(b))
179 #endif
180
181 extern const uint8_t ff_sqrt_tab[256];
182
183 static inline int av_log2_16bit(unsigned int v);
184
185 static inline av_const unsigned int ff_sqrt(unsigned int a)
186 {
187     unsigned int b;
188
189     if(a<255) return (ff_sqrt_tab[a+1]-1)>>4;
190     else if(a<(1<<12)) b= ff_sqrt_tab[a>>4 ]>>2;
191 #ifndef CONFIG_SMALL
192     else if(a<(1<<14)) b= ff_sqrt_tab[a>>6 ]>>1;
193     else if(a<(1<<16)) b= ff_sqrt_tab[a>>8 ]   ;
194 #endif
195     else{
196         int s= av_log2_16bit(a>>16)>>1;
197         unsigned int c= a>>(s+2);
198         b= ff_sqrt_tab[c>>(s+8)];
199         b= FASTDIV(c,b) + (b<<s);
200     }
201
202     return b - (a<b*b);
203 }
204
205 #if defined(ARCH_X86)
206 #define MASK_ABS(mask, level)\
207             asm volatile(\
208                 "cltd                   \n\t"\
209                 "xorl %1, %0            \n\t"\
210                 "subl %1, %0            \n\t"\
211                 : "+a" (level), "=&d" (mask)\
212             );
213 #else
214 #define MASK_ABS(mask, level)\
215             mask= level>>31;\
216             level= (level^mask)-mask;
217 #endif
218
219 #ifdef HAVE_CMOV
220 #define COPY3_IF_LT(x,y,a,b,c,d)\
221 asm volatile (\
222     "cmpl %0, %3        \n\t"\
223     "cmovl %3, %0       \n\t"\
224     "cmovl %4, %1       \n\t"\
225     "cmovl %5, %2       \n\t"\
226     : "+&r" (x), "+&r" (a), "+r" (c)\
227     : "r" (y), "r" (b), "r" (d)\
228 );
229 #else
230 #define COPY3_IF_LT(x,y,a,b,c,d)\
231 if((y)<(x)){\
232      (x)=(y);\
233      (a)=(b);\
234      (c)=(d);\
235 }
236 #endif
237
238 /* avoid usage of various functions */
239 #undef  malloc
240 #define malloc please_use_av_malloc
241 #undef  free
242 #define free please_use_av_free
243 #undef  realloc
244 #define realloc please_use_av_realloc
245 #undef  time
246 #define time time_is_forbidden_due_to_security_issues
247 #undef  rand
248 #define rand rand_is_forbidden_due_to_state_trashing_use_av_random
249 #undef  srand
250 #define srand srand_is_forbidden_due_to_state_trashing_use_av_init_random
251 #undef  random
252 #define random random_is_forbidden_due_to_state_trashing_use_av_random
253 #undef  sprintf
254 #define sprintf sprintf_is_forbidden_due_to_security_issues_use_snprintf
255 #undef  strcat
256 #define strcat strcat_is_forbidden_due_to_security_issues_use_av_strlcat
257 #undef  exit
258 #define exit exit_is_forbidden
259 #if !(defined(LIBAVFORMAT_BUILD) || defined(FFMPEG_FRAMEHOOK_H))
260 #undef  printf
261 #define printf please_use_av_log
262 #undef  fprintf
263 #define fprintf please_use_av_log
264 #undef  puts
265 #define puts please_use_av_log
266 #undef  perror
267 #define perror please_use_av_log_instead_of_perror
268 #endif
269
270 #define CHECKED_ALLOCZ(p, size)\
271 {\
272     p= av_mallocz(size);\
273     if(p==NULL && (size)!=0){\
274         av_log(NULL, AV_LOG_ERROR, "Cannot allocate memory.");\
275         goto fail;\
276     }\
277 }
278
279 #ifndef HAVE_LLRINT
280 static av_always_inline av_const long long llrint(double x)
281 {
282     return rint(x);
283 }
284 #endif /* HAVE_LLRINT */
285
286 #ifndef HAVE_LRINT
287 static av_always_inline av_const long int lrint(double x)
288 {
289     return rint(x);
290 }
291 #endif /* HAVE_LRINT */
292
293 #ifndef HAVE_LRINTF
294 static av_always_inline av_const long int lrintf(float x)
295 {
296     return (int)(rint(x));
297 }
298 #endif /* HAVE_LRINTF */
299
300 #ifndef HAVE_ROUND
301 static av_always_inline av_const double round(double x)
302 {
303     return (x > 0) ? floor(x + 0.5) : ceil(x - 0.5);
304 }
305 #endif /* HAVE_ROUND */
306
307 #ifndef HAVE_ROUNDF
308 static av_always_inline av_const float roundf(float x)
309 {
310     return (x > 0) ? floor(x + 0.5) : ceil(x - 0.5);
311 }
312 #endif /* HAVE_ROUNDF */
313
314 #endif /* FFMPEG_INTERNAL_H */