]> git.sesse.net Git - ffmpeg/blob - libavutil/internal.h
ARM: faster ARMv6 FASTDIV()
[ffmpeg] / libavutil / internal.h
1 /*
2  * copyright (c) 2006 Michael Niedermayer <michaelni@gmx.at>
3  *
4  * This file is part of FFmpeg.
5  *
6  * FFmpeg is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU Lesser General Public
8  * License as published by the Free Software Foundation; either
9  * version 2.1 of the License, or (at your option) any later version.
10  *
11  * FFmpeg is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14  * Lesser General Public License for more details.
15  *
16  * You should have received a copy of the GNU Lesser General Public
17  * License along with FFmpeg; if not, write to the Free Software
18  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
19  */
20
21 /**
22  * @file internal.h
23  * common internal api header.
24  */
25
26 #ifndef AVUTIL_INTERNAL_H
27 #define AVUTIL_INTERNAL_H
28
29 #if !defined(DEBUG) && !defined(NDEBUG)
30 #    define NDEBUG
31 #endif
32
33 #include <stdint.h>
34 #include <stddef.h>
35 #include <assert.h>
36
37 #ifndef attribute_align_arg
38 #if defined(__GNUC__) && (__GNUC__ > 4 || __GNUC__ == 4 && __GNUC_MINOR__>1)
39 #    define attribute_align_arg __attribute__((force_align_arg_pointer))
40 #else
41 #    define attribute_align_arg
42 #endif
43 #endif
44
45 #ifndef attribute_used
46 #if defined(__GNUC__) && (__GNUC__ > 3 || __GNUC__ == 3 && __GNUC_MINOR__ > 0)
47 #    define attribute_used __attribute__((used))
48 #else
49 #    define attribute_used
50 #endif
51 #endif
52
53 #ifndef INT16_MIN
54 #define INT16_MIN       (-0x7fff-1)
55 #endif
56
57 #ifndef INT16_MAX
58 #define INT16_MAX       0x7fff
59 #endif
60
61 #ifndef INT32_MIN
62 #define INT32_MIN       (-0x7fffffff-1)
63 #endif
64
65 #ifndef INT32_MAX
66 #define INT32_MAX       0x7fffffff
67 #endif
68
69 #ifndef UINT32_MAX
70 #define UINT32_MAX      0xffffffff
71 #endif
72
73 #ifndef INT64_MIN
74 #define INT64_MIN       (-0x7fffffffffffffffLL-1)
75 #endif
76
77 #ifndef INT64_MAX
78 #define INT64_MAX INT64_C(9223372036854775807)
79 #endif
80
81 #ifndef UINT64_MAX
82 #define UINT64_MAX UINT64_C(0xFFFFFFFFFFFFFFFF)
83 #endif
84
85 #ifndef INT_BIT
86 #    if INT_MAX != 2147483647
87 #        define INT_BIT 64
88 #    else
89 #        define INT_BIT 32
90 #    endif
91 #endif
92
93 #if ( defined(__PIC__) || defined(__pic__) ) && ! defined(PIC)
94 #    define PIC
95 #endif
96
97 #include "config.h"
98 #include "intreadwrite.h"
99 #include "bswap.h"
100
101 #ifndef offsetof
102 #    define offsetof(T,F) ((unsigned int)((char *)&((T *)0)->F))
103 #endif
104
105 // Use rip-relative addressing if compiling PIC code on x86-64.
106 #if defined(ARCH_X86_64) && defined(PIC)
107 #    define LOCAL_MANGLE(a) #a "(%%rip)"
108 #else
109 #    define LOCAL_MANGLE(a) #a
110 #endif
111
112 #define MANGLE(a) EXTERN_PREFIX LOCAL_MANGLE(a)
113
114 /* debug stuff */
115
116 /* dprintf macros */
117 #ifdef DEBUG
118 #    define dprintf(pctx, ...) av_log(pctx, AV_LOG_DEBUG, __VA_ARGS__)
119 #else
120 #    define dprintf(pctx, ...)
121 #endif
122
123 #define av_abort()      do { av_log(NULL, AV_LOG_ERROR, "Abort at %s:%d\n", __FILE__, __LINE__); abort(); } while (0)
124
125 /* math */
126
127 extern const uint32_t ff_inverse[256];
128
129 #if defined(ARCH_X86)
130 #    define FASTDIV(a,b) \
131     ({\
132         int ret,dmy;\
133         __asm__ volatile(\
134             "mull %3"\
135             :"=d"(ret),"=a"(dmy)\
136             :"1"(a),"g"(ff_inverse[b])\
137             );\
138         ret;\
139     })
140 #elif defined(HAVE_ARMV6)
141 static inline av_const int FASTDIV(int a, int b)
142 {
143     int r, t;
144     __asm__ volatile("cmp     %3, #2               \n\t"
145                      "ldr     %1, [%4, %3, lsl #2] \n\t"
146                      "lsrle   %0, %2, #1           \n\t"
147                      "smmulgt %0, %1, %2           \n\t"
148                      : "=&r"(r), "=&r"(t) : "r"(a), "r"(b), "r"(ff_inverse));
149     return r;
150 }
151 #elif defined(ARCH_ARMV4L)
152 #    define FASTDIV(a,b) \
153     ({\
154         int ret,dmy;\
155         __asm__ volatile(\
156             "umull %1, %0, %2, %3"\
157             :"=&r"(ret),"=&r"(dmy)\
158             :"r"(a),"r"(ff_inverse[b])\
159             );\
160         ret;\
161     })
162 #elif defined(CONFIG_FASTDIV)
163 #    define FASTDIV(a,b)   ((uint32_t)((((uint64_t)a)*ff_inverse[b])>>32))
164 #else
165 #    define FASTDIV(a,b)   ((a)/(b))
166 #endif
167
168 extern const uint8_t ff_sqrt_tab[256];
169
170 static inline int av_log2_16bit(unsigned int v);
171
172 static inline av_const unsigned int ff_sqrt(unsigned int a)
173 {
174     unsigned int b;
175
176     if(a<255) return (ff_sqrt_tab[a+1]-1)>>4;
177     else if(a<(1<<12)) b= ff_sqrt_tab[a>>4 ]>>2;
178 #ifndef CONFIG_SMALL
179     else if(a<(1<<14)) b= ff_sqrt_tab[a>>6 ]>>1;
180     else if(a<(1<<16)) b= ff_sqrt_tab[a>>8 ]   ;
181 #endif
182     else{
183         int s= av_log2_16bit(a>>16)>>1;
184         unsigned int c= a>>(s+2);
185         b= ff_sqrt_tab[c>>(s+8)];
186         b= FASTDIV(c,b) + (b<<s);
187     }
188
189     return b - (a<b*b);
190 }
191
192 #if defined(ARCH_X86)
193 #define MASK_ABS(mask, level)\
194             __asm__ volatile(\
195                 "cltd                   \n\t"\
196                 "xorl %1, %0            \n\t"\
197                 "subl %1, %0            \n\t"\
198                 : "+a" (level), "=&d" (mask)\
199             );
200 #else
201 #define MASK_ABS(mask, level)\
202             mask= level>>31;\
203             level= (level^mask)-mask;
204 #endif
205
206 #ifdef HAVE_CMOV
207 #define COPY3_IF_LT(x,y,a,b,c,d)\
208 __asm__ volatile (\
209     "cmpl %0, %3        \n\t"\
210     "cmovl %3, %0       \n\t"\
211     "cmovl %4, %1       \n\t"\
212     "cmovl %5, %2       \n\t"\
213     : "+&r" (x), "+&r" (a), "+r" (c)\
214     : "r" (y), "r" (b), "r" (d)\
215 );
216 #else
217 #define COPY3_IF_LT(x,y,a,b,c,d)\
218 if((y)<(x)){\
219      (x)=(y);\
220      (a)=(b);\
221      (c)=(d);\
222 }
223 #endif
224
225 /* avoid usage of various functions */
226 #undef  malloc
227 #define malloc please_use_av_malloc
228 #undef  free
229 #define free please_use_av_free
230 #undef  realloc
231 #define realloc please_use_av_realloc
232 #undef  time
233 #define time time_is_forbidden_due_to_security_issues
234 #undef  rand
235 #define rand rand_is_forbidden_due_to_state_trashing_use_av_random
236 #undef  srand
237 #define srand srand_is_forbidden_due_to_state_trashing_use_av_init_random
238 #undef  random
239 #define random random_is_forbidden_due_to_state_trashing_use_av_random
240 #undef  sprintf
241 #define sprintf sprintf_is_forbidden_due_to_security_issues_use_snprintf
242 #undef  strcat
243 #define strcat strcat_is_forbidden_due_to_security_issues_use_av_strlcat
244 #undef  exit
245 #define exit exit_is_forbidden
246 #ifndef LIBAVFORMAT_BUILD
247 #undef  printf
248 #define printf please_use_av_log
249 #undef  fprintf
250 #define fprintf please_use_av_log
251 #undef  puts
252 #define puts please_use_av_log
253 #undef  perror
254 #define perror please_use_av_log_instead_of_perror
255 #endif
256
257 #define CHECKED_ALLOCZ(p, size)\
258 {\
259     p= av_mallocz(size);\
260     if(p==NULL && (size)!=0){\
261         av_log(NULL, AV_LOG_ERROR, "Cannot allocate memory.");\
262         goto fail;\
263     }\
264 }
265
266 #ifndef HAVE_LLRINT
267 static av_always_inline av_const long long llrint(double x)
268 {
269     return rint(x);
270 }
271 #endif /* HAVE_LLRINT */
272
273 #ifndef HAVE_LRINT
274 static av_always_inline av_const long int lrint(double x)
275 {
276     return rint(x);
277 }
278 #endif /* HAVE_LRINT */
279
280 #ifndef HAVE_LRINTF
281 static av_always_inline av_const long int lrintf(float x)
282 {
283     return (int)(rint(x));
284 }
285 #endif /* HAVE_LRINTF */
286
287 #ifndef HAVE_ROUND
288 static av_always_inline av_const double round(double x)
289 {
290     return (x > 0) ? floor(x + 0.5) : ceil(x - 0.5);
291 }
292 #endif /* HAVE_ROUND */
293
294 #ifndef HAVE_ROUNDF
295 static av_always_inline av_const float roundf(float x)
296 {
297     return (x > 0) ? floor(x + 0.5) : ceil(x - 0.5);
298 }
299 #endif /* HAVE_ROUNDF */
300
301 #endif /* AVUTIL_INTERNAL_H */