]> git.sesse.net Git - ffmpeg/blob - libavutil/cpu.c
avutil/cpu: Remove deprecated functions
[ffmpeg] / libavutil / cpu.c
1 /*
2  * This file is part of FFmpeg.
3  *
4  * FFmpeg is free software; you can redistribute it and/or
5  * modify it under the terms of the GNU Lesser General Public
6  * License as published by the Free Software Foundation; either
7  * version 2.1 of the License, or (at your option) any later version.
8  *
9  * FFmpeg is distributed in the hope that it will be useful,
10  * but WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
12  * Lesser General Public License for more details.
13  *
14  * You should have received a copy of the GNU Lesser General Public
15  * License along with FFmpeg; if not, write to the Free Software
16  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
17  */
18
19 #include <stddef.h>
20 #include <stdint.h>
21 #include <stdatomic.h>
22
23 #include "attributes.h"
24 #include "cpu.h"
25 #include "cpu_internal.h"
26 #include "config.h"
27 #include "opt.h"
28 #include "common.h"
29
30 #if HAVE_SCHED_GETAFFINITY
31 #ifndef _GNU_SOURCE
32 # define _GNU_SOURCE
33 #endif
34 #include <sched.h>
35 #endif
36 #if HAVE_GETPROCESSAFFINITYMASK || HAVE_WINRT
37 #include <windows.h>
38 #endif
39 #if HAVE_SYSCTL
40 #if HAVE_SYS_PARAM_H
41 #include <sys/param.h>
42 #endif
43 #include <sys/types.h>
44 #include <sys/sysctl.h>
45 #endif
46 #if HAVE_UNISTD_H
47 #include <unistd.h>
48 #endif
49
50 static atomic_int cpu_flags = ATOMIC_VAR_INIT(-1);
51
52 static int get_cpu_flags(void)
53 {
54     if (ARCH_MIPS)
55         return ff_get_cpu_flags_mips();
56     if (ARCH_AARCH64)
57         return ff_get_cpu_flags_aarch64();
58     if (ARCH_ARM)
59         return ff_get_cpu_flags_arm();
60     if (ARCH_PPC)
61         return ff_get_cpu_flags_ppc();
62     if (ARCH_X86)
63         return ff_get_cpu_flags_x86();
64     return 0;
65 }
66
67 void av_force_cpu_flags(int arg){
68     if (ARCH_X86 &&
69            (arg & ( AV_CPU_FLAG_3DNOW    |
70                     AV_CPU_FLAG_3DNOWEXT |
71                     AV_CPU_FLAG_MMXEXT   |
72                     AV_CPU_FLAG_SSE      |
73                     AV_CPU_FLAG_SSE2     |
74                     AV_CPU_FLAG_SSE2SLOW |
75                     AV_CPU_FLAG_SSE3     |
76                     AV_CPU_FLAG_SSE3SLOW |
77                     AV_CPU_FLAG_SSSE3    |
78                     AV_CPU_FLAG_SSE4     |
79                     AV_CPU_FLAG_SSE42    |
80                     AV_CPU_FLAG_AVX      |
81                     AV_CPU_FLAG_AVXSLOW  |
82                     AV_CPU_FLAG_XOP      |
83                     AV_CPU_FLAG_FMA3     |
84                     AV_CPU_FLAG_FMA4     |
85                     AV_CPU_FLAG_AVX2     |
86                     AV_CPU_FLAG_AVX512   ))
87         && !(arg & AV_CPU_FLAG_MMX)) {
88         av_log(NULL, AV_LOG_WARNING, "MMX implied by specified flags\n");
89         arg |= AV_CPU_FLAG_MMX;
90     }
91
92     atomic_store_explicit(&cpu_flags, arg, memory_order_relaxed);
93 }
94
95 int av_get_cpu_flags(void)
96 {
97     int flags = atomic_load_explicit(&cpu_flags, memory_order_relaxed);
98     if (flags == -1) {
99         flags = get_cpu_flags();
100         atomic_store_explicit(&cpu_flags, flags, memory_order_relaxed);
101     }
102     return flags;
103 }
104
105 int av_parse_cpu_caps(unsigned *flags, const char *s)
106 {
107         static const AVOption cpuflags_opts[] = {
108         { "flags"   , NULL, 0, AV_OPT_TYPE_FLAGS, { .i64 = 0 }, INT64_MIN, INT64_MAX, .unit = "flags" },
109 #if   ARCH_PPC
110         { "altivec" , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_ALTIVEC  },    .unit = "flags" },
111 #elif ARCH_X86
112         { "mmx"     , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_MMX      },    .unit = "flags" },
113         { "mmx2"    , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_MMX2     },    .unit = "flags" },
114         { "mmxext"  , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_MMX2     },    .unit = "flags" },
115         { "sse"     , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_SSE      },    .unit = "flags" },
116         { "sse2"    , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_SSE2     },    .unit = "flags" },
117         { "sse2slow", NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_SSE2SLOW },    .unit = "flags" },
118         { "sse3"    , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_SSE3     },    .unit = "flags" },
119         { "sse3slow", NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_SSE3SLOW },    .unit = "flags" },
120         { "ssse3"   , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_SSSE3    },    .unit = "flags" },
121         { "atom"    , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_ATOM     },    .unit = "flags" },
122         { "sse4.1"  , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_SSE4     },    .unit = "flags" },
123         { "sse4.2"  , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_SSE42    },    .unit = "flags" },
124         { "avx"     , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_AVX      },    .unit = "flags" },
125         { "avxslow" , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_AVXSLOW  },    .unit = "flags" },
126         { "xop"     , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_XOP      },    .unit = "flags" },
127         { "fma3"    , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_FMA3     },    .unit = "flags" },
128         { "fma4"    , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_FMA4     },    .unit = "flags" },
129         { "avx2"    , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_AVX2     },    .unit = "flags" },
130         { "bmi1"    , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_BMI1     },    .unit = "flags" },
131         { "bmi2"    , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_BMI2     },    .unit = "flags" },
132         { "3dnow"   , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_3DNOW    },    .unit = "flags" },
133         { "3dnowext", NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_3DNOWEXT },    .unit = "flags" },
134         { "cmov",     NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_CMOV     },    .unit = "flags" },
135         { "aesni",    NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_AESNI    },    .unit = "flags" },
136         { "avx512"  , NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_AVX512   },    .unit = "flags" },
137
138 #define CPU_FLAG_P2 AV_CPU_FLAG_CMOV | AV_CPU_FLAG_MMX
139 #define CPU_FLAG_P3 CPU_FLAG_P2 | AV_CPU_FLAG_MMX2 | AV_CPU_FLAG_SSE
140 #define CPU_FLAG_P4 CPU_FLAG_P3| AV_CPU_FLAG_SSE2
141         { "pentium2", NULL, 0, AV_OPT_TYPE_CONST, { .i64 = CPU_FLAG_P2          },    .unit = "flags" },
142         { "pentium3", NULL, 0, AV_OPT_TYPE_CONST, { .i64 = CPU_FLAG_P3          },    .unit = "flags" },
143         { "pentium4", NULL, 0, AV_OPT_TYPE_CONST, { .i64 = CPU_FLAG_P4          },    .unit = "flags" },
144
145 #define CPU_FLAG_K62 AV_CPU_FLAG_MMX | AV_CPU_FLAG_3DNOW
146 #define CPU_FLAG_ATHLON   CPU_FLAG_K62 | AV_CPU_FLAG_CMOV | AV_CPU_FLAG_3DNOWEXT | AV_CPU_FLAG_MMX2
147 #define CPU_FLAG_ATHLONXP CPU_FLAG_ATHLON | AV_CPU_FLAG_SSE
148 #define CPU_FLAG_K8  CPU_FLAG_ATHLONXP | AV_CPU_FLAG_SSE2
149         { "k6",       NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_MMX      },    .unit = "flags" },
150         { "k62",      NULL, 0, AV_OPT_TYPE_CONST, { .i64 = CPU_FLAG_K62         },    .unit = "flags" },
151         { "athlon",   NULL, 0, AV_OPT_TYPE_CONST, { .i64 = CPU_FLAG_ATHLON      },    .unit = "flags" },
152         { "athlonxp", NULL, 0, AV_OPT_TYPE_CONST, { .i64 = CPU_FLAG_ATHLONXP    },    .unit = "flags" },
153         { "k8",       NULL, 0, AV_OPT_TYPE_CONST, { .i64 = CPU_FLAG_K8          },    .unit = "flags" },
154 #elif ARCH_ARM
155         { "armv5te",  NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_ARMV5TE  },    .unit = "flags" },
156         { "armv6",    NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_ARMV6    },    .unit = "flags" },
157         { "armv6t2",  NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_ARMV6T2  },    .unit = "flags" },
158         { "vfp",      NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_VFP      },    .unit = "flags" },
159         { "vfp_vm",   NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_VFP_VM   },    .unit = "flags" },
160         { "vfpv3",    NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_VFPV3    },    .unit = "flags" },
161         { "neon",     NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_NEON     },    .unit = "flags" },
162         { "setend",   NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_SETEND   },    .unit = "flags" },
163 #elif ARCH_AARCH64
164         { "armv8",    NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_ARMV8    },    .unit = "flags" },
165         { "neon",     NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_NEON     },    .unit = "flags" },
166         { "vfp",      NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_VFP      },    .unit = "flags" },
167 #elif ARCH_MIPS
168         { "mmi",      NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_MMI      },    .unit = "flags" },
169         { "msa",      NULL, 0, AV_OPT_TYPE_CONST, { .i64 = AV_CPU_FLAG_MSA      },    .unit = "flags" },
170 #endif
171         { NULL },
172     };
173     static const AVClass class = {
174         .class_name = "cpuflags",
175         .item_name  = av_default_item_name,
176         .option     = cpuflags_opts,
177         .version    = LIBAVUTIL_VERSION_INT,
178     };
179     const AVClass *pclass = &class;
180
181     return av_opt_eval_flags(&pclass, &cpuflags_opts[0], s, flags);
182 }
183
184 int av_cpu_count(void)
185 {
186     static atomic_int printed = ATOMIC_VAR_INIT(0);
187
188     int nb_cpus = 1;
189 #if HAVE_WINRT
190     SYSTEM_INFO sysinfo;
191 #endif
192 #if HAVE_SCHED_GETAFFINITY && defined(CPU_COUNT)
193     cpu_set_t cpuset;
194
195     CPU_ZERO(&cpuset);
196
197     if (!sched_getaffinity(0, sizeof(cpuset), &cpuset))
198         nb_cpus = CPU_COUNT(&cpuset);
199 #elif HAVE_GETPROCESSAFFINITYMASK
200     DWORD_PTR proc_aff, sys_aff;
201     if (GetProcessAffinityMask(GetCurrentProcess(), &proc_aff, &sys_aff))
202         nb_cpus = av_popcount64(proc_aff);
203 #elif HAVE_SYSCTL && defined(HW_NCPUONLINE)
204     int mib[2] = { CTL_HW, HW_NCPUONLINE };
205     size_t len = sizeof(nb_cpus);
206
207     if (sysctl(mib, 2, &nb_cpus, &len, NULL, 0) == -1)
208         nb_cpus = 0;
209 #elif HAVE_SYSCTL && defined(HW_NCPU)
210     int mib[2] = { CTL_HW, HW_NCPU };
211     size_t len = sizeof(nb_cpus);
212
213     if (sysctl(mib, 2, &nb_cpus, &len, NULL, 0) == -1)
214         nb_cpus = 0;
215 #elif HAVE_SYSCONF && defined(_SC_NPROC_ONLN)
216     nb_cpus = sysconf(_SC_NPROC_ONLN);
217 #elif HAVE_SYSCONF && defined(_SC_NPROCESSORS_ONLN)
218     nb_cpus = sysconf(_SC_NPROCESSORS_ONLN);
219 #elif HAVE_WINRT
220     GetNativeSystemInfo(&sysinfo);
221     nb_cpus = sysinfo.dwNumberOfProcessors;
222 #endif
223
224     if (!atomic_exchange_explicit(&printed, 1, memory_order_relaxed))
225         av_log(NULL, AV_LOG_DEBUG, "detected %d logical cores\n", nb_cpus);
226
227     return nb_cpus;
228 }
229
230 size_t av_cpu_max_align(void)
231 {
232     if (ARCH_MIPS)
233         return ff_get_cpu_max_align_mips();
234     if (ARCH_AARCH64)
235         return ff_get_cpu_max_align_aarch64();
236     if (ARCH_ARM)
237         return ff_get_cpu_max_align_arm();
238     if (ARCH_PPC)
239         return ff_get_cpu_max_align_ppc();
240     if (ARCH_X86)
241         return ff_get_cpu_max_align_x86();
242
243     return 8;
244 }