9e96be6eb7fa326d79b91761fe1aae73e232af8d
[stockfish] / src / thread.cpp
1 /*
2   Stockfish, a UCI chess playing engine derived from Glaurung 2.1
3   Copyright (C) 2004-2008 Tord Romstad (Glaurung author)
4   Copyright (C) 2008-2014 Marco Costalba, Joona Kiiski, Tord Romstad
5
6   Stockfish is free software: you can redistribute it and/or modify
7   it under the terms of the GNU General Public License as published by
8   the Free Software Foundation, either version 3 of the License, or
9   (at your option) any later version.
10
11   Stockfish is distributed in the hope that it will be useful,
12   but WITHOUT ANY WARRANTY; without even the implied warranty of
13   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14   GNU General Public License for more details.
15
16   You should have received a copy of the GNU General Public License
17   along with this program.  If not, see <http://www.gnu.org/licenses/>.
18 */
19
20 #include <algorithm> // For std::count
21 #include <cassert>
22
23 #include "movegen.h"
24 #include "search.h"
25 #include "thread.h"
26 #include "ucioption.h"
27
28 using namespace Search;
29
30 ThreadPool Threads; // Global object
31
32 extern void check_time();
33
34 namespace {
35
36  // start_routine() is the C function which is called when a new thread
37  // is launched. It is a wrapper to the virtual function idle_loop().
38
39  extern "C" { long start_routine(ThreadBase* th) { th->idle_loop(); return 0; } }
40
41
42  // Helpers to launch a thread after creation and joining before delete. Must be
43  // outside Thread c'tor and d'tor because the object will be fully initialized
44  // when start_routine (and hence virtual idle_loop) is called and when joining.
45
46  template<typename T> T* new_thread() {
47    T* th = new T();
48    thread_create(th->handle, start_routine, th); // Will go to sleep
49    return th;
50  }
51
52  void delete_thread(ThreadBase* th) {
53    th->exit = true; // Search must be already finished
54    th->notify_one();
55    thread_join(th->handle); // Wait for thread termination
56    delete th;
57  }
58
59 }
60
61
62 // notify_one() wakes up the thread when there is some work to do
63
64 void ThreadBase::notify_one() {
65
66   mutex.lock();
67   sleepCondition.notify_one();
68   mutex.unlock();
69 }
70
71
72 // wait_for() set the thread to sleep until condition 'b' turns true
73
74 void ThreadBase::wait_for(volatile const bool& b) {
75
76   mutex.lock();
77   while (!b) sleepCondition.wait(mutex);
78   mutex.unlock();
79 }
80
81
82 // Thread c'tor just inits data and does not launch any execution thread.
83 // Such a thread will only be started when c'tor returns.
84
85 Thread::Thread() /* : splitPoints() */ { // Value-initialization bug in MSVC
86
87   searching = false;
88   maxPly = splitPointsSize = 0;
89   activeSplitPoint = NULL;
90   activePosition = NULL;
91   idx = Threads.size();
92 }
93
94
95 // cutoff_occurred() checks whether a beta cutoff has occurred in the
96 // current active split point, or in some ancestor of the split point.
97
98 bool Thread::cutoff_occurred() const {
99
100   for (SplitPoint* sp = activeSplitPoint; sp; sp = sp->parentSplitPoint)
101       if (sp->cutoff)
102           return true;
103
104   return false;
105 }
106
107
108 // Thread::available_to() checks whether the thread is available to help the
109 // thread 'master' at a split point. An obvious requirement is that thread must
110 // be idle. With more than two threads, this is not sufficient: If the thread is
111 // the master of some split point, it is only available as a slave to the slaves
112 // which are busy searching the split point at the top of slave's split point
113 // stack (the "helpful master concept" in YBWC terminology).
114
115 bool Thread::available_to(const Thread* master) const {
116
117   if (searching)
118       return false;
119
120   // Make a local copy to be sure it doesn't become zero under our feet while
121   // testing next condition and so leading to an out of bounds access.
122   int size = splitPointsSize;
123
124   // No split points means that the thread is available as a slave for any
125   // other thread otherwise apply the "helpful master" concept if possible.
126   return !size || (splitPoints[size - 1].slavesMask & (1ULL << master->idx));
127 }
128
129
130 // TimerThread::idle_loop() is where the timer thread waits msec milliseconds
131 // and then calls check_time(). If msec is 0 thread sleeps until it's woken up.
132
133 void TimerThread::idle_loop() {
134
135   while (!exit)
136   {
137       mutex.lock();
138
139       if (!exit)
140           sleepCondition.wait_for(mutex, run ? Resolution : INT_MAX);
141
142       mutex.unlock();
143
144       if (run)
145           check_time();
146   }
147 }
148
149
150 // MainThread::idle_loop() is where the main thread is parked waiting to be started
151 // when there is a new search. The main thread will launch all the slave threads.
152
153 void MainThread::idle_loop() {
154
155   while (true)
156   {
157       mutex.lock();
158
159       thinking = false;
160
161       while (!thinking && !exit)
162       {
163           Threads.sleepCondition.notify_one(); // Wake up the UI thread if needed
164           sleepCondition.wait(mutex);
165       }
166
167       mutex.unlock();
168
169       if (exit)
170           return;
171
172       searching = true;
173
174       Search::think();
175
176       assert(searching);
177
178       searching = false;
179   }
180 }
181
182
183 // init() is called at startup to create and launch requested threads, that will
184 // go immediately to sleep due to 'sleepWhileIdle' set to true. We cannot use
185 // a c'tor because Threads is a static object and we need a fully initialized
186 // engine at this point due to allocation of Endgames in Thread c'tor.
187
188 void ThreadPool::init() {
189
190   sleepWhileIdle = true;
191   timer = new_thread<TimerThread>();
192   push_back(new_thread<MainThread>());
193   read_uci_options();
194 }
195
196
197 // exit() cleanly terminates the threads before the program exits
198
199 void ThreadPool::exit() {
200
201   delete_thread(timer); // As first because check_time() accesses threads data
202
203   for (iterator it = begin(); it != end(); ++it)
204       delete_thread(*it);
205 }
206
207
208 // read_uci_options() updates internal threads parameters from the corresponding
209 // UCI options and creates/destroys threads to match the requested number. Thread
210 // objects are dynamically allocated to avoid creating all possible threads
211 // in advance (which include pawns and material tables), even if only a few
212 // are to be used.
213
214 void ThreadPool::read_uci_options() {
215
216   maxThreadsPerSplitPoint = Options["Max Threads per Split Point"];
217   minimumSplitDepth       = Options["Min Split Depth"] * ONE_PLY;
218   size_t requested        = Options["Threads"];
219
220   assert(requested > 0);
221
222   // If zero (default) then set best minimum split depth automatically
223   if (!minimumSplitDepth)
224       minimumSplitDepth = requested < 8 ? 4 * ONE_PLY : 7 * ONE_PLY;
225
226   while (size() < requested)
227       push_back(new_thread<Thread>());
228
229   while (size() > requested)
230   {
231       delete_thread(back());
232       pop_back();
233   }
234 }
235
236
237 // available_slave() tries to find an idle thread which is available as a slave
238 // for the thread 'master'.
239
240 Thread* ThreadPool::available_slave(const Thread* master) const {
241
242   for (const_iterator it = begin(); it != end(); ++it)
243       if ((*it)->available_to(master))
244           return *it;
245
246   return NULL;
247 }
248
249
250 // split() does the actual work of distributing the work at a node between
251 // several available threads. If it does not succeed in splitting the node
252 // (because no idle threads are available), the function immediately returns.
253 // If splitting is possible, a SplitPoint object is initialized with all the
254 // data that must be copied to the helper threads and then helper threads are
255 // told that they have been assigned work. This will cause them to instantly
256 // leave their idle loops and call search(). When all threads have returned from
257 // search() then split() returns.
258
259 template <bool Fake>
260 void Thread::split(Position& pos, const Stack* ss, Value alpha, Value beta, Value* bestValue,
261                    Move* bestMove, Depth depth, int moveCount,
262                    MovePicker* movePicker, int nodeType, bool cutNode) {
263
264   assert(pos.pos_is_ok());
265   assert(-VALUE_INFINITE < *bestValue && *bestValue <= alpha && alpha < beta && beta <= VALUE_INFINITE);
266   assert(depth >= Threads.minimumSplitDepth);
267   assert(searching);
268   assert(splitPointsSize < MAX_SPLITPOINTS_PER_THREAD);
269
270   // Pick the next available split point from the split point stack
271   SplitPoint& sp = splitPoints[splitPointsSize];
272
273   sp.masterThread = this;
274   sp.parentSplitPoint = activeSplitPoint;
275   sp.slavesMask = 1ULL << idx;
276   sp.depth = depth;
277   sp.bestValue = *bestValue;
278   sp.bestMove = *bestMove;
279   sp.alpha = alpha;
280   sp.beta = beta;
281   sp.nodeType = nodeType;
282   sp.cutNode = cutNode;
283   sp.movePicker = movePicker;
284   sp.moveCount = moveCount;
285   sp.pos = &pos;
286   sp.nodes = 0;
287   sp.cutoff = false;
288   sp.ss = ss;
289
290   // Try to allocate available threads and ask them to start searching setting
291   // 'searching' flag. This must be done under lock protection to avoid concurrent
292   // allocation of the same slave by another master.
293   Threads.mutex.lock();
294   sp.mutex.lock();
295
296   ++splitPointsSize;
297   activeSplitPoint = &sp;
298   activePosition = NULL;
299
300   size_t slavesCnt = 1; // This thread is always included
301   Thread* slave;
302
303   while (    (slave = Threads.available_slave(this)) != NULL
304          && ++slavesCnt <= Threads.maxThreadsPerSplitPoint && !Fake)
305   {
306       sp.slavesMask |= 1ULL << slave->idx;
307       slave->activeSplitPoint = &sp;
308       slave->searching = true; // Slave leaves idle_loop()
309       slave->notify_one(); // Could be sleeping
310   }
311
312   // Everything is set up. The master thread enters the idle loop, from which
313   // it will instantly launch a search, because its 'searching' flag is set.
314   // The thread will return from the idle loop when all slaves have finished
315   // their work at this split point.
316   if (slavesCnt > 1 || Fake)
317   {
318       sp.mutex.unlock();
319       Threads.mutex.unlock();
320
321       Thread::idle_loop(); // Force a call to base class idle_loop()
322
323       // In the helpful master concept, a master can help only a sub-tree of its
324       // split point and because everything is finished here, it's not possible
325       // for the master to be booked.
326       assert(!searching);
327       assert(!activePosition);
328
329       // We have returned from the idle loop, which means that all threads are
330       // finished. Note that setting 'searching' and decreasing splitPointsSize is
331       // done under lock protection to avoid a race with Thread::available_to().
332       Threads.mutex.lock();
333       sp.mutex.lock();
334   }
335
336   searching = true;
337   --splitPointsSize;
338   activeSplitPoint = sp.parentSplitPoint;
339   activePosition = &pos;
340   pos.set_nodes_searched(pos.nodes_searched() + sp.nodes);
341   *bestMove = sp.bestMove;
342   *bestValue = sp.bestValue;
343
344   sp.mutex.unlock();
345   Threads.mutex.unlock();
346 }
347
348 // Explicit template instantiations
349 template void Thread::split<false>(Position&, const Stack*, Value, Value, Value*, Move*, Depth, int, MovePicker*, int, bool);
350 template void Thread::split< true>(Position&, const Stack*, Value, Value, Value*, Move*, Depth, int, MovePicker*, int, bool);
351
352
353 // wait_for_think_finished() waits for main thread to go to sleep then returns
354
355 void ThreadPool::wait_for_think_finished() {
356
357   MainThread* t = main();
358   t->mutex.lock();
359   while (t->thinking) sleepCondition.wait(t->mutex);
360   t->mutex.unlock();
361 }
362
363
364 // start_thinking() wakes up the main thread sleeping in MainThread::idle_loop()
365 // so to start a new search, then returns immediately.
366
367 void ThreadPool::start_thinking(const Position& pos, const LimitsType& limits, StateStackPtr& states) {
368
369   wait_for_think_finished();
370
371   SearchTime = Time::now(); // As early as possible
372
373   Signals.stopOnPonderhit = Signals.firstRootMove = false;
374   Signals.stop = Signals.failedLowAtRoot = false;
375
376   RootMoves.clear();
377   RootPos = pos;
378   Limits = limits;
379   if (states.get()) // If we don't set a new position, preserve current state
380   {
381       SetupStates = states; // Ownership transfer here
382       assert(!states.get());
383   }
384
385   for (MoveList<LEGAL> it(pos); *it; ++it)
386       if (   limits.searchmoves.empty()
387           || std::count(limits.searchmoves.begin(), limits.searchmoves.end(), *it))
388           RootMoves.push_back(RootMove(*it));
389
390   main()->thinking = true;
391   main()->notify_one(); // Starts main thread
392 }