Rever count_1s() optimizations
authorMarco Costalba <mcostalba@gmail.com>
Sun, 25 Jan 2009 17:00:57 +0000 (18:00 +0100)
committerMarco Costalba <mcostalba@gmail.com>
Sun, 25 Jan 2009 17:00:57 +0000 (18:00 +0100)
They are wrong for all ones case.

Signed-off-by: Marco Costalba <mcostalba@gmail.com>
src/bitboard.h

index 2280f66c808e4b67722bf81e834e17c723589d3d..1aefd8add5a623729652f70fc21a45076aacb5ee 100644 (file)
@@ -395,21 +395,23 @@ inline int count_1s_max_15(Bitboard b) {
 
 inline int count_1s(Bitboard b) {
   unsigned w = unsigned(b >> 32), v = unsigned(b);
-  v -= (v >> 1) & 0x55555555;
+  v -= (v >> 1) & 0x55555555; // 0-2 in 2 bits
   w -= (w >> 1) & 0x55555555;
-  v += w;
-  v = ((v >> 2) & 0x33333333) + (v & 0x33333333);
-  v = ((v >> 4) + v) & 0x0F0F0F0F;
+  v = ((v >> 2) & 0x33333333) + (v & 0x33333333); // 0-4 in 4 bits
+  w = ((w >> 2) & 0x33333333) + (w & 0x33333333);
+  v = ((v >> 4) + v) & 0x0F0F0F0F; // 0-8 in 8 bits
+  v += (((w >> 4) + w) & 0x0F0F0F0F);  // 0-16 in 8 bits
   v *= 0x01010101; // mul is fast on amd procs
   return int(v >> 24);
 }
 
 inline int count_1s_max_15(Bitboard b) {
   unsigned w = unsigned(b >> 32), v = unsigned(b);
-  v -= (v >> 1) & 0x55555555;
+  v -= (v >> 1) & 0x55555555; // 0-2 in 2 bits
   w -= (w >> 1) & 0x55555555;
-  v += w;
-  v = ((v >> 2) & 0x33333333) + (v & 0x33333333);
+  v = ((v >> 2) & 0x33333333) + (v & 0x33333333); // 0-4 in 4 bits
+  w = ((w >> 2) & 0x33333333) + (w & 0x33333333);
+  v += w; // 0-8 in 4 bits
   v *= 0x11111111;
   return int(v >> 28);
 }