Use packed 32-bit MMX operations for updating the PSQT accumulator

author Fanael Linithien <fanael4@gmail.com>

Tue, 18 May 2021 17:17:59 +0000 (19:17 +0200)

committer Joost VandeVondele <Joost.VandeVondele@gmail.com>

Wed, 19 May 2021 17:34:44 +0000 (19:34 +0200)
author Fanael Linithien <fanael4@gmail.com>
Tue, 18 May 2021 17:17:59 +0000 (19:17 +0200)
committer Joost VandeVondele <Joost.VandeVondele@gmail.com>
Wed, 19 May 2021 17:34:44 +0000 (19:34 +0200)
diff --git a/src/nnue/nnue_feature_transformer.h b/src/nnue/nnue_feature_transformer.h

index 2c0a0c6d3134b61270a9a16a3a1ae199176d9d07..bfa2e25a3e041ea1ef1704f1a8b5d8b48d3e0290 100644 (file)
--- a/src/nnue/nnue_feature_transformer.h
+++ b/src/nnue/nnue_feature_transformer.h
@@ -84,18 +84,18 @@ namespace Stockfish::Eval::NNUE {
  
    #elif USE_MMX
    typedef __m64 vec_t;
-  typedef std::int32_t psqt_vec_t;
+  typedef __m64 psqt_vec_t;
    #define vec_load(a) (*(a))
    #define vec_store(a,b) *(a)=(b)
    #define vec_add_16(a,b) _mm_add_pi16(a,b)
    #define vec_sub_16(a,b) _mm_sub_pi16(a,b)
    #define vec_load_psqt(a) (*(a))
    #define vec_store_psqt(a,b) *(a)=(b)
-  #define vec_add_psqt_32(a,b) a+b
-  #define vec_sub_psqt_32(a,b) a-b
-  #define vec_zero_psqt() 0
+  #define vec_add_psqt_32(a,b) _mm_add_pi32(a,b)
+  #define vec_sub_psqt_32(a,b) _mm_sub_pi32(a,b)
+  #define vec_zero_psqt() _mm_setzero_si64()
    static constexpr IndexType NumRegs = 8;
-  static constexpr IndexType NumPsqtRegs = 8;
+  static constexpr IndexType NumPsqtRegs = 4;
  
    #elif USE_NEON
    typedef int16x8_t vec_t;
author	Fanael Linithien <fanael4@gmail.com>
	Tue, 18 May 2021 17:17:59 +0000 (19:17 +0200)
committer	Joost VandeVondele <Joost.VandeVondele@gmail.com>
	Wed, 19 May 2021 17:34:44 +0000 (19:34 +0200)