]> git.sesse.net Git - ffmpeg/blob - libavutil/x86/asm.h
Merge commit 'a16431034d9bd44182bf844d6bbde2c98bc4e6b5'
[ffmpeg] / libavutil / x86 / asm.h
1 /*
2  * copyright (c) 2006 Michael Niedermayer <michaelni@gmx.at>
3  *
4  * This file is part of FFmpeg.
5  *
6  * FFmpeg is free software; you can redistribute it and/or
7  * modify it under the terms of the GNU Lesser General Public
8  * License as published by the Free Software Foundation; either
9  * version 2.1 of the License, or (at your option) any later version.
10  *
11  * FFmpeg is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14  * Lesser General Public License for more details.
15  *
16  * You should have received a copy of the GNU Lesser General Public
17  * License along with FFmpeg; if not, write to the Free Software
18  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
19  */
20
21 #ifndef AVUTIL_X86_ASM_H
22 #define AVUTIL_X86_ASM_H
23
24 #include <stdint.h>
25 #include "config.h"
26
27 typedef struct xmm_reg { uint64_t a, b; } xmm_reg;
28
29 #if ARCH_X86_64
30 #    define OPSIZE "q"
31 #    define REG_a "rax"
32 #    define REG_b "rbx"
33 #    define REG_c "rcx"
34 #    define REG_d "rdx"
35 #    define REG_D "rdi"
36 #    define REG_S "rsi"
37 #    define PTR_SIZE "8"
38 typedef int64_t x86_reg;
39
40 #    define REG_SP "rsp"
41 #    define REG_BP "rbp"
42 #    define REGBP   rbp
43 #    define REGa    rax
44 #    define REGb    rbx
45 #    define REGc    rcx
46 #    define REGd    rdx
47 #    define REGSP   rsp
48
49 #elif ARCH_X86_32
50
51 #    define OPSIZE "l"
52 #    define REG_a "eax"
53 #    define REG_b "ebx"
54 #    define REG_c "ecx"
55 #    define REG_d "edx"
56 #    define REG_D "edi"
57 #    define REG_S "esi"
58 #    define PTR_SIZE "4"
59 typedef int32_t x86_reg;
60
61 #    define REG_SP "esp"
62 #    define REG_BP "ebp"
63 #    define REGBP   ebp
64 #    define REGa    eax
65 #    define REGb    ebx
66 #    define REGc    ecx
67 #    define REGd    edx
68 #    define REGSP   esp
69 #else
70 typedef int x86_reg;
71 #endif
72
73 #define HAVE_7REGS (ARCH_X86_64 || (HAVE_EBX_AVAILABLE && HAVE_EBP_AVAILABLE))
74 #define HAVE_6REGS (ARCH_X86_64 || (HAVE_EBX_AVAILABLE || HAVE_EBP_AVAILABLE))
75
76 #if ARCH_X86_64 && defined(PIC)
77 #    define BROKEN_RELOCATIONS 1
78 #endif
79
80 /*
81  * If gcc is not set to support sse (-msse) it will not accept xmm registers
82  * in the clobber list for inline asm. XMM_CLOBBERS takes a list of xmm
83  * registers to be marked as clobbered and evaluates to nothing if they are
84  * not supported, or to the list itself if they are supported. Since a clobber
85  * list may not be empty, XMM_CLOBBERS_ONLY should be used if the xmm
86  * registers are the only in the clobber list.
87  * For example a list with "eax" and "xmm0" as clobbers should become:
88  * : XMM_CLOBBERS("xmm0",) "eax"
89  * and a list with only "xmm0" should become:
90  * XMM_CLOBBERS_ONLY("xmm0")
91  */
92 #if HAVE_XMM_CLOBBERS
93 #    define XMM_CLOBBERS(...)        __VA_ARGS__
94 #    define XMM_CLOBBERS_ONLY(...) : __VA_ARGS__
95 #else
96 #    define XMM_CLOBBERS(...)
97 #    define XMM_CLOBBERS_ONLY(...)
98 #endif
99
100 /* Use to export labels from asm. */
101 #define LABEL_MANGLE(a) EXTERN_PREFIX #a
102
103 // Use rip-relative addressing if compiling PIC code on x86-64.
104 #if ARCH_X86_64 && defined(PIC)
105 #    define LOCAL_MANGLE(a) #a "(%%rip)"
106 #else
107 #    define LOCAL_MANGLE(a) #a
108 #endif
109
110 #if HAVE_INLINE_ASM_DIRECT_SYMBOL_REFS
111 #   define MANGLE(a) EXTERN_PREFIX LOCAL_MANGLE(a)
112 #   define NAMED_CONSTRAINTS_ADD(...)
113 #   define NAMED_CONSTRAINTS(...)
114 #else
115     /* When direct symbol references are used in code passed to a compiler that does not support them
116      *  then these references need to be converted to named asm constraints instead.
117      * Instead of returning a direct symbol MANGLE now returns a named constraint for that specific symbol.
118      * In order for this to work there must also be a corresponding entry in the asm-interface. To add this
119      *  entry use the macro NAMED_CONSTRAINTS() and pass in a list of each symbol reference used in the
120      *  corresponding block of code. (e.g. NAMED_CONSTRAINTS(var1,var2,var3) where var1 is the first symbol etc. ).
121      * If there are already existing constraints then use NAMED_CONSTRAINTS_ADD to add to the existing constraint list.
122      */
123 #   define MANGLE(a) "%["#a"]"
124     // Intel/MSVC does not correctly expand va-args so we need a rather ugly hack in order to get it to work
125 #   define FE_0(P,X) P(X)
126 #   define FE_1(P,X,X1) P(X), FE_0(P,X1)
127 #   define FE_2(P,X,X1,X2) P(X), FE_1(P,X1,X2)
128 #   define FE_3(P,X,X1,X2,X3) P(X), FE_2(P,X1,X2,X3)
129 #   define FE_4(P,X,X1,X2,X3,X4) P(X), FE_3(P,X1,X2,X3,X4)
130 #   define FE_5(P,X,X1,X2,X3,X4,X5) P(X), FE_4(P,X1,X2,X3,X4,X5)
131 #   define FE_6(P,X,X1,X2,X3,X4,X5,X6) P(X), FE_5(P,X1,X2,X3,X4,X5,X6)
132 #   define FE_7(P,X,X1,X2,X3,X4,X5,X6,X7) P(X), FE_6(P,X1,X2,X3,X4,X5,X6,X7)
133 #   define FE_8(P,X,X1,X2,X3,X4,X5,X6,X7,X8) P(X), FE_7(P,X1,X2,X3,X4,X5,X6,X7,X8)
134 #   define FE_9(P,X,X1,X2,X3,X4,X5,X6,X7,X8,X9) P(X), FE_8(P,X1,X2,X3,X4,X5,X6,X7,X8,X9)
135 #   define GET_FE_IMPL(_0,_1,_2,_3,_4,_5,_6,_7,_8,_9,NAME,...) NAME
136 #   define GET_FE(A) GET_FE_IMPL A
137 #   define GET_FE_GLUE(x, y) x y
138 #   define FOR_EACH_VA(P,...) GET_FE_GLUE(GET_FE((__VA_ARGS__,FE_9,FE_8,FE_7,FE_6,FE_5,FE_4,FE_3,FE_2,FE_1,FE_0)), (P,__VA_ARGS__))
139 #   define NAME_CONSTRAINT(x) [x] "m"(x)
140     // Parameters are a list of each symbol reference required
141 #   define NAMED_CONSTRAINTS_ADD(...) , FOR_EACH_VA(NAME_CONSTRAINT,__VA_ARGS__)
142     // Same but without comma for when there are no previously defined constraints
143 #   define NAMED_CONSTRAINTS(...) FOR_EACH_VA(NAME_CONSTRAINT,__VA_ARGS__)
144 #endif
145
146 #endif /* AVUTIL_X86_ASM_H */