]> git.sesse.net Git - stockfish/blob - src/bitcount.h
4016063383938fe7fbcc9309ff9767a2bfec6a7c
[stockfish] / src / bitcount.h
1 /*
2   Stockfish, a UCI chess playing engine derived from Glaurung 2.1
3   Copyright (C) 2004-2008 Tord Romstad (Glaurung author)
4   Copyright (C) 2008-2009 Marco Costalba
5
6   Stockfish is free software: you can redistribute it and/or modify
7   it under the terms of the GNU General Public License as published by
8   the Free Software Foundation, either version 3 of the License, or
9   (at your option) any later version.
10
11
12   Stockfish is distributed in the hope that it will be useful,
13   but WITHOUT ANY WARRANTY; without even the implied warranty of
14   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15   GNU General Public License for more details.
16
17   You should have received a copy of the GNU General Public License
18   along with this program.  If not, see <http://www.gnu.org/licenses/>.
19 */
20
21
22 #if !defined(BITCOUNT_H_INCLUDED)
23 #define BITCOUNT_H_INCLUDED
24
25 #include "bitboard.h"
26
27
28 // Select type of software bit count function to use
29
30 #if !defined(AUTO_CONFIGURATION) || defined(IS_64BIT)
31
32 //#define USE_COMPACT_ROOK_ATTACKS
33 //#define USE_32BIT_ATTACKS
34 #define USE_FOLDED_BITSCAN
35
36 #define BITCOUNT_SWAR_64
37 //#define BITCOUNT_SWAR_32
38 //#define BITCOUNT_LOOP
39
40 #else
41
42 #define USE_32BIT_ATTACKS
43 #define USE_FOLDED_BITSCAN
44 #define BITCOUNT_SWAR_32
45
46 #endif
47
48
49 // Select type of intrinsic bit count instruction to use
50
51 #if defined(_MSC_VER) // Microsoft compiler
52
53 #include <intrin.h>
54
55 inline bool cpu_has_popcnt() {
56
57   int CPUInfo[4] = {-1};
58   __cpuid(CPUInfo, 0x00000001);
59   return (CPUInfo[2] >> 23) & 1;
60 }
61
62 #define POPCNT_INTRINSIC(x) __popcnt64(x)
63
64 #elif defined(__INTEL_COMPILER) && (defined(__x86_64) || defined(_M_X64)) // Intel compiler
65
66 #include <nmmintrin.h>
67
68 inline bool cpu_has_popcnt() {
69
70   int CPUInfo[4] = {-1};
71   __cpuid(CPUInfo, 0x00000001);
72   return (CPUInfo[2] >> 23) & 1;
73 }
74
75 #define POPCNT_INTRINSIC(x) _mm_popcnt_u64(x)
76
77 #else // Safe fallback for unsupported compilers
78
79 inline bool cpu_has_popcnt() { return false; }
80
81 #define POPCNT_INTRINSIC(x) sw_count_1s(x)
82
83 #endif
84
85
86 /// Software implementation of bit count functions
87
88 #if defined(BITCOUNT_LOOP)
89
90 inline int sw_count_1s(Bitboard b) {
91   int r;
92   for(r = 0; b; r++, b &= b - 1);
93   return r;
94 }
95
96 inline int sw_count_1s_max_15(Bitboard b) {
97   return count_1s(b);
98 }
99
100 #elif defined(BITCOUNT_SWAR_32)
101
102 inline int sw_count_1s(Bitboard b) {
103   unsigned w = unsigned(b >> 32), v = unsigned(b);
104   v -= (v >> 1) & 0x55555555; // 0-2 in 2 bits
105   w -= (w >> 1) & 0x55555555;
106   v = ((v >> 2) & 0x33333333) + (v & 0x33333333); // 0-4 in 4 bits
107   w = ((w >> 2) & 0x33333333) + (w & 0x33333333);
108   v = ((v >> 4) + v) & 0x0F0F0F0F; // 0-8 in 8 bits
109   v += (((w >> 4) + w) & 0x0F0F0F0F);  // 0-16 in 8 bits
110   v *= 0x01010101; // mul is fast on amd procs
111   return int(v >> 24);
112 }
113
114 inline int sw_count_1s_max_15(Bitboard b) {
115   unsigned w = unsigned(b >> 32), v = unsigned(b);
116   v -= (v >> 1) & 0x55555555; // 0-2 in 2 bits
117   w -= (w >> 1) & 0x55555555;
118   v = ((v >> 2) & 0x33333333) + (v & 0x33333333); // 0-4 in 4 bits
119   w = ((w >> 2) & 0x33333333) + (w & 0x33333333);
120   v += w; // 0-8 in 4 bits
121   v *= 0x11111111;
122   return int(v >> 28);
123 }
124
125 #elif defined(BITCOUNT_SWAR_64)
126
127 inline int sw_count_1s(Bitboard b) {
128   b -= ((b>>1) & 0x5555555555555555ULL);
129   b = ((b>>2) & 0x3333333333333333ULL) + (b & 0x3333333333333333ULL);
130   b = ((b>>4) + b) & 0x0F0F0F0F0F0F0F0FULL;
131   b *= 0x0101010101010101ULL;
132   return int(b >> 56);
133 }
134
135 inline int sw_count_1s_max_15(Bitboard b) {
136   b -= (b>>1) & 0x5555555555555555ULL;
137   b = ((b>>2) & 0x3333333333333333ULL) + (b & 0x3333333333333333ULL);
138   b *= 0x1111111111111111ULL;
139   return int(b >> 60);
140 }
141
142 #endif // BITCOUNT
143
144
145 /// count_1s() counts the number of nonzero bits in a bitboard.
146 /// If template parameter is true an intrinsic is called, otherwise
147 /// we fallback on a software implementation.
148
149 template<bool UseIntrinsic>
150 inline int count_1s(Bitboard b) {
151
152   return UseIntrinsic ? POPCNT_INTRINSIC(b) : sw_count_1s(b);
153 }
154
155 template<bool UseIntrinsic>
156 inline int count_1s_max_15(Bitboard b) {
157
158   return UseIntrinsic ? POPCNT_INTRINSIC(b) : sw_count_1s_max_15(b);
159 }
160
161
162 // Global variable initialized at startup that is set to true if
163 // CPU on which application runs support POPCNT intrinsic.
164
165 const bool CpuHasPOPCNT = cpu_has_popcnt();
166
167 #endif // !defined(BITCOUNT_H_INCLUDED)