]> git.sesse.net Git - vlc/blob - src/misc/cpu.c
SSE3 detection (runtime)
[vlc] / src / misc / cpu.c
1 /*****************************************************************************
2  * cpu.c: CPU detection code
3  *****************************************************************************
4  * Copyright (C) 1998-2004 the VideoLAN team
5  * $Id$
6  *
7  * Authors: Samuel Hocevar <sam@zoy.org>
8  *          Christophe Massiot <massiot@via.ecp.fr>
9  *          Eugenio Jarosiewicz <ej0@cise.ufl.eduEujenio>
10  *
11  * This program is free software; you can redistribute it and/or modify
12  * it under the terms of the GNU General Public License as published by
13  * the Free Software Foundation; either version 2 of the License, or
14  * (at your option) any later version.
15  *
16  * This program is distributed in the hope that it will be useful,
17  * but WITHOUT ANY WARRANTY; without even the implied warranty of
18  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
19  * GNU General Public License for more details.
20  *
21  * You should have received a copy of the GNU General Public License
22  * along with this program; if not, write to the Free Software
23  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston MA 02110-1301, USA.
24  *****************************************************************************/
25
26 /*****************************************************************************
27  * Preamble
28  *****************************************************************************/
29 #ifdef HAVE_CONFIG_H
30 # include "config.h"
31 #endif
32
33 #include <vlc_common.h>
34 #include <vlc_cpu.h>
35
36 #include <sys/types.h>
37 #ifndef WIN32
38 #include <unistd.h>
39 #include <sys/wait.h>
40 #endif
41
42 #include "libvlc.h"
43
44 #if defined(__APPLE__) && (defined(__ppc__) || defined(__ppc64__))
45 #include <sys/sysctl.h>
46 #endif
47
48 #if defined( __i386__ ) || defined( __x86_64__ ) || defined( __powerpc__ ) \
49  || defined( __ppc__ ) || defined( __ppc64__ ) || defined( __powerpc64__ )
50 static bool check_OS_capability( const char *psz_capability, pid_t pid )
51 {
52 #ifndef WIN32
53     int status;
54
55     if( pid == -1 )
56         return false; /* fail safe :-/ */
57
58     while( waitpid( pid, &status, 0 ) == -1 );
59
60     if( WIFEXITED( status ) && WEXITSTATUS( status ) == 0 )
61         return true;
62
63     fprintf( stderr, "warning: your CPU has %s instructions, but not your "
64                      "operating system.\n", psz_capability );
65     fprintf( stderr, "         some optimizations will be disabled unless "
66                      "you upgrade your OS\n" );
67     return false;
68 #else
69 # warning FIXME!
70 # define fork() (errno = ENOSYS, -1)
71     (void)pid;
72     (void)psz_capability;
73     return true;
74 #endif
75 }
76 #endif
77
78 /*****************************************************************************
79  * CPUCapabilities: get the CPU capabilities
80  *****************************************************************************
81  * This function is called to list extensions the CPU may have.
82  *****************************************************************************/
83 uint32_t CPUCapabilities( void )
84 {
85     uint32_t i_capabilities = 0;
86
87 #if defined( __i386__ ) || defined( __x86_64__ )
88      unsigned int i_eax, i_ebx, i_ecx, i_edx;
89      bool b_amd;
90
91     /* Needed for x86 CPU capabilities detection */
92 #   if defined( __x86_64__ )
93 #       define cpuid( reg )                    \
94             asm volatile ( "cpuid\n\t"         \
95                            "movl %%ebx,%1\n\t" \
96                          : "=a" ( i_eax ),     \
97                            "=b" ( i_ebx ),     \
98                            "=c" ( i_ecx ),     \
99                            "=d" ( i_edx )      \
100                          : "a"  ( reg )        \
101                          : "cc" );
102 #   else
103 #       define cpuid( reg )                    \
104             asm volatile ( "push %%ebx\n\t"    \
105                            "cpuid\n\t"         \
106                            "movl %%ebx,%1\n\t" \
107                            "pop %%ebx\n\t"     \
108                          : "=a" ( i_eax ),     \
109                            "=r" ( i_ebx ),     \
110                            "=c" ( i_ecx ),     \
111                            "=d" ( i_edx )      \
112                          : "a"  ( reg )        \
113                          : "cc" );
114 #   endif
115
116     i_capabilities |= CPU_CAPABILITY_FPU;
117
118 # if defined (__i386__) && !defined (__i486__) && !defined (__i586__) \
119   && !defined (__i686__) && !defined (__pentium4__) \
120   && !defined (__k6__) && !defined (__athlon__) && !defined (__k8__)
121     /* check if cpuid instruction is supported */
122     asm volatile ( "push %%ebx\n\t"
123                    "pushf\n\t"
124                    "pop %%eax\n\t"
125                    "movl %%eax, %%ebx\n\t"
126                    "xorl $0x200000, %%eax\n\t"
127                    "push %%eax\n\t"
128                    "popf\n\t"
129                    "pushf\n\t"
130                    "pop %%eax\n\t"
131                    "movl %%ebx,%1\n\t"
132                    "pop %%ebx\n\t"
133                  : "=a" ( i_eax ),
134                    "=r" ( i_ebx )
135                  :
136                  : "cc" );
137
138     if( i_eax == i_ebx )
139         goto out;
140 # endif
141
142     /* the CPU supports the CPUID instruction - get its level */
143     cpuid( 0x00000000 );
144
145 # if defined (__i386__) && !defined (__i586__) \
146   && !defined (__i686__) && !defined (__pentium4__) \
147   && !defined (__k6__) && !defined (__athlon__) && !defined (__k8__)
148     if( !i_eax )
149         goto out;
150 #endif
151
152     /* borrowed from mpeg2dec */
153     b_amd = ( i_ebx == 0x68747541 ) && ( i_ecx == 0x444d4163 )
154                     && ( i_edx == 0x69746e65 );
155
156     /* test for the MMX flag */
157     cpuid( 0x00000001 );
158 # if !defined (__MMX__)
159     if( ! (i_edx & 0x00800000) )
160         goto out;
161 # endif
162     i_capabilities |= CPU_CAPABILITY_MMX;
163
164 # if defined (__SSE__)
165     i_capabilities |= CPU_CAPABILITY_MMXEXT | CPU_CAPABILITY_SSE;
166 # else
167     if( i_edx & 0x02000000 )
168     {
169         i_capabilities |= CPU_CAPABILITY_MMXEXT;
170
171 #   ifdef CAN_COMPILE_SSE
172         /* We test if OS supports the SSE instructions */
173         pid_t pid = fork();
174         if( pid == 0 )
175         {
176             /* Test a SSE instruction */
177             __asm__ __volatile__ ( "xorps %%xmm0,%%xmm0\n" : : );
178             exit(0);
179         }
180         if( check_OS_capability( "SSE", pid ) )
181             i_capabilities |= CPU_CAPABILITY_SSE;
182 #   endif
183     }
184 # endif
185
186 # if defined (__SSE2__)
187     i_capabilities |= CPU_CAPABILITY_SSE2;
188 # elif defined (CAN_COMPILE_SSE)
189     if( i_edx & 0x04000000 )
190     {
191         /* We test if OS supports the SSE2 instructions */
192         pid_t pid = fork();
193         if( pid == 0 )
194         {
195             /* Test a SSE2 instruction */
196             __asm__ __volatile__ ( "movupd %%xmm0, %%xmm0\n" : : );
197             exit(0);
198         }
199         if( check_OS_capability( "SSE2", pid ) )
200             i_capabilities |= CPU_CAPABILITY_SSE2;
201     }
202 # endif
203
204 # if defined (__SSE3__)
205     i_capabilities |= CPU_CAPABILITY_SSE3;
206 # elif defined (CAN_COMPILE_SSE3)
207     if( i_ecx & 0x00000001 )
208     {
209         /* We test if OS supports the SSE3 instructions */
210         pid_t pid = fork();
211         if( pid == 0 )
212         {
213             /* Test a SSE3 instruction */
214             __asm__ __volatile__ ( "movsldup %%xmm1, %%xmm0\n" : : );
215             exit(0);
216         }
217         if( check_OS_capability( "SSE3", pid ) )
218             i_capabilities |= CPU_CAPABILITY_SSE3;
219     }
220 # endif
221
222     /* test for additional capabilities */
223     cpuid( 0x80000000 );
224
225     if( i_eax < 0x80000001 )
226         goto out;
227
228     /* list these additional capabilities */
229     cpuid( 0x80000001 );
230
231 # if defined (__3dNOW__)
232     i_capabilities |= CPU_CAPABILITY_3DNOW;
233 # elif defined (CAN_COMPILE_3DNOW)
234     if( i_edx & 0x80000000 )
235     {
236         pid_t pid = fork();
237         if( pid == 0 )
238         {
239             /* Test a 3D Now! instruction */
240             __asm__ __volatile__ ( "pfadd %%mm0,%%mm0\n" "femms\n" : : );
241             exit(0);
242         }
243         if( check_OS_capability( "3D Now!", pid ) )
244             i_capabilities |= CPU_CAPABILITY_3DNOW;
245     }
246 # endif
247
248     if( b_amd && ( i_edx & 0x00400000 ) )
249     {
250         i_capabilities |= CPU_CAPABILITY_MMXEXT;
251     }
252 out:
253
254 #elif defined( __arm__ )
255 #   if defined( __ARM_EABI__ ) && !defined( __SOFTFP__ )
256 //    i_capabilities |= CPU_CAPABILITY_FPU;
257 #   endif
258 #   if defined( __ARM_NEON__ )
259     i_capabilities |= CPU_CAPABILITY_NEON;
260 #   endif
261
262 #elif defined( __powerpc__ ) || defined( __ppc__ ) || defined( __powerpc64__ ) \
263     || defined( __ppc64__ )
264
265     i_capabilities |= CPU_CAPABILITY_FPU;
266
267 #   if defined(__APPLE__)
268     int selectors[2] = { CTL_HW, HW_VECTORUNIT };
269     int i_has_altivec = 0;
270     size_t i_length = sizeof( i_has_altivec );
271     int i_error = sysctl( selectors, 2, &i_has_altivec, &i_length, NULL, 0);
272
273     if( i_error == 0 && i_has_altivec != 0 )
274         i_capabilities |= CPU_CAPABILITY_ALTIVEC;
275
276 #   elif defined( CAN_COMPILE_ALTIVEC )
277     pid_t pid = fork();
278     if( pid == 0 )
279     {
280         asm volatile ("mtspr 256, %0\n\t"
281                       "vand %%v0, %%v0, %%v0"
282                       :
283                       : "r" (-1));
284         exit(0);
285     }
286
287     if( check_OS_capability( "Altivec", pid ) )
288         i_capabilities |= CPU_CAPABILITY_ALTIVEC;
289
290 #   endif
291
292 #elif defined( __sparc__ )
293     i_capabilities |= CPU_CAPABILITY_FPU;
294
295 #elif defined( _MSC_VER ) && !defined( UNDER_CE )
296     i_capabilities |= CPU_CAPABILITY_FPU;
297
298 #endif
299     return i_capabilities;
300 }
301
302 uint32_t cpu_flags = 0;
303
304
305 /*****************************************************************************
306  * vlc_CPU: get pre-computed CPU capability flags
307  ****************************************************************************/
308 unsigned vlc_CPU (void)
309 {
310     return cpu_flags;
311 }
312
313 static vlc_memcpy_t pf_vlc_memcpy = memcpy;
314 static vlc_memset_t pf_vlc_memset = memset;
315
316 void vlc_fastmem_register (vlc_memcpy_t cpy, vlc_memset_t set)
317 {
318     if (cpy)
319         pf_vlc_memcpy = cpy;
320     if (set)
321         pf_vlc_memset = set;
322 }
323
324 /**
325  * vlc_memcpy: fast CPU-dependent memcpy
326  */
327 void *vlc_memcpy (void *tgt, const void *src, size_t n)
328 {
329     return pf_vlc_memcpy (tgt, src, n);
330 }
331
332 /**
333  * vlc_memset: fast CPU-dependent memset
334  */
335 void *vlc_memset (void *tgt, int c, size_t n)
336 {
337     return pf_vlc_memset (tgt, c, n);
338 }