]> git.sesse.net Git - stockfish/blob - src/misc.h
Optimize the most common update accumalator cases w/o tiling
[stockfish] / src / misc.h
1 /*
2   Stockfish, a UCI chess playing engine derived from Glaurung 2.1
3   Copyright (C) 2004-2023 The Stockfish developers (see AUTHORS file)
4
5   Stockfish is free software: you can redistribute it and/or modify
6   it under the terms of the GNU General Public License as published by
7   the Free Software Foundation, either version 3 of the License, or
8   (at your option) any later version.
9
10   Stockfish is distributed in the hope that it will be useful,
11   but WITHOUT ANY WARRANTY; without even the implied warranty of
12   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13   GNU General Public License for more details.
14
15   You should have received a copy of the GNU General Public License
16   along with this program.  If not, see <http://www.gnu.org/licenses/>.
17 */
18
19 #ifndef MISC_H_INCLUDED
20 #define MISC_H_INCLUDED
21
22 #include <cassert>
23 #include <chrono>
24 #include <cstddef>
25 #include <cstdint>
26 #include <iosfwd>
27 #include <string>
28
29 #define stringify2(x) #x
30 #define stringify(x) stringify2(x)
31
32 namespace Stockfish {
33
34 std::string engine_info(bool to_uci = false);
35 std::string compiler_info();
36 void prefetch(void* addr);
37 void start_logger(const std::string& fname);
38 void* std_aligned_alloc(size_t alignment, size_t size);
39 void std_aligned_free(void* ptr);
40 void* aligned_large_pages_alloc(size_t size); // memory aligned by page size, min alignment: 4096 bytes
41 void aligned_large_pages_free(void* mem); // nop if mem == nullptr
42
43 void dbg_hit_on(bool cond, int slot = 0);
44 void dbg_mean_of(int64_t value, int slot = 0);
45 void dbg_stdev_of(int64_t value, int slot = 0);
46 void dbg_correl_of(int64_t value1, int64_t value2, int slot = 0);
47 void dbg_print();
48
49 using TimePoint = std::chrono::milliseconds::rep; // A value in milliseconds
50 static_assert(sizeof(TimePoint) == sizeof(int64_t), "TimePoint should be 64 bits");
51 inline TimePoint now() {
52   return std::chrono::duration_cast<std::chrono::milliseconds>
53         (std::chrono::steady_clock::now().time_since_epoch()).count();
54 }
55
56
57 enum SyncCout { IO_LOCK, IO_UNLOCK };
58 std::ostream& operator<<(std::ostream&, SyncCout);
59
60 #define sync_cout std::cout << IO_LOCK
61 #define sync_endl std::endl << IO_UNLOCK
62
63
64 // align_ptr_up() : get the first aligned element of an array.
65 // ptr must point to an array of size at least `sizeof(T) * N + alignment` bytes,
66 // where N is the number of elements in the array.
67 template <uintptr_t Alignment, typename T>
68 T* align_ptr_up(T* ptr)
69 {
70   static_assert(alignof(T) < Alignment);
71
72   const uintptr_t ptrint = reinterpret_cast<uintptr_t>(reinterpret_cast<char*>(ptr));
73   return reinterpret_cast<T*>(reinterpret_cast<char*>((ptrint + (Alignment - 1)) / Alignment * Alignment));
74 }
75
76
77 // IsLittleEndian : true if and only if the binary is compiled on a little endian machine
78 static inline const union { uint32_t i; char c[4]; } Le = { 0x01020304 };
79 static inline const bool IsLittleEndian = (Le.c[0] == 4);
80
81
82 template <typename T, std::size_t MaxSize>
83 class ValueList {
84
85 public:
86   std::size_t size() const { return size_; }
87   void push_back(const T& value) { values_[size_++] = value; }
88   const T* begin() const { return values_; }
89   const T* end() const { return values_ + size_; }
90   const T& operator[](int index) const { return values_[index]; }
91
92 private:
93   T values_[MaxSize];
94   std::size_t size_ = 0;
95 };
96
97
98 /// xorshift64star Pseudo-Random Number Generator
99 /// This class is based on original code written and dedicated
100 /// to the public domain by Sebastiano Vigna (2014).
101 /// It has the following characteristics:
102 ///
103 ///  -  Outputs 64-bit numbers
104 ///  -  Passes Dieharder and SmallCrush test batteries
105 ///  -  Does not require warm-up, no zeroland to escape
106 ///  -  Internal state is a single 64-bit integer
107 ///  -  Period is 2^64 - 1
108 ///  -  Speed: 1.60 ns/call (Core i7 @3.40GHz)
109 ///
110 /// For further analysis see
111 ///   <http://vigna.di.unimi.it/ftp/papers/xorshift.pdf>
112
113 class PRNG {
114
115   uint64_t s;
116
117   uint64_t rand64() {
118
119     s ^= s >> 12, s ^= s << 25, s ^= s >> 27;
120     return s * 2685821657736338717LL;
121   }
122
123 public:
124   PRNG(uint64_t seed) : s(seed) { assert(seed); }
125
126   template<typename T> T rand() { return T(rand64()); }
127
128   /// Special generator used to fast init magic numbers.
129   /// Output values only have 1/8th of their bits set on average.
130   template<typename T> T sparse_rand()
131   { return T(rand64() & rand64() & rand64()); }
132 };
133
134 inline uint64_t mul_hi64(uint64_t a, uint64_t b) {
135 #if defined(__GNUC__) && defined(IS_64BIT)
136     __extension__ using uint128 = unsigned __int128;
137     return (uint128(a) * uint128(b)) >> 64;
138 #else
139     uint64_t aL = uint32_t(a), aH = a >> 32;
140     uint64_t bL = uint32_t(b), bH = b >> 32;
141     uint64_t c1 = (aL * bL) >> 32;
142     uint64_t c2 = aH * bL + c1;
143     uint64_t c3 = aL * bH + uint32_t(c2);
144     return aH * bH + (c2 >> 32) + (c3 >> 32);
145 #endif
146 }
147
148 /// Under Windows it is not possible for a process to run on more than one
149 /// logical processor group. This usually means to be limited to use max 64
150 /// cores. To overcome this, some special platform specific API should be
151 /// called to set group affinity for each thread. Original code from Texel by
152 /// Peter Ă–sterlund.
153
154 namespace WinProcGroup {
155   void bindThisThread(size_t idx);
156 }
157
158 namespace CommandLine {
159   void init(int argc, char* argv[]);
160
161   extern std::string binaryDirectory;  // path of the executable directory
162   extern std::string workingDirectory; // path of the working directory
163 }
164
165 } // namespace Stockfish
166
167 #endif // #ifndef MISC_H_INCLUDED