More --me tesa optimizations

author Loren Merritt <pengvado@akuvian.org>

Thu, 14 Jan 2010 19:52:12 +0000 (14:52 -0500)

committer Fiona Glaser <fiona@x264.com>

Wed, 20 Jan 2010 21:59:36 +0000 (13:59 -0800)
author Loren Merritt <pengvado@akuvian.org>
Thu, 14 Jan 2010 19:52:12 +0000 (14:52 -0500)
committer Fiona Glaser <fiona@x264.com>
Wed, 20 Jan 2010 21:59:36 +0000 (13:59 -0800)
diff --git a/encoder/me.c b/encoder/me.c

index 8aaf81bb8f1baf6aab8edb02292c9a919829e4ef..4f8f86f346d7893e45568b4cdd66b46c5af8b068 100644 (file)
--- a/encoder/me.c
+++ b/encoder/me.c
@@ -609,8 +609,8 @@ me_hex2:
                              {
                                  COPY1_IF_LT( bsad, sad );
                                  mvsads[nmvsad].sad = sad + ycost;
-                                mvsads[nmvsad].mx = min_x+xs[i+j];
-                                mvsads[nmvsad].my = my;
+                                mvsads[nmvsad].mv[0] = min_x+xs[i+j];
+                                mvsads[nmvsad].mv[1] = my;
                                  nmvsad++;
                              }
                          }
@@ -624,8 +624,8 @@ me_hex2:
                          {
                              COPY1_IF_LT( bsad, sad );
                              mvsads[nmvsad].sad = sad + ycost;
-                            mvsads[nmvsad].mx = mx;
-                            mvsads[nmvsad].my = my;
+                            mvsads[nmvsad].mv[0] = mx;
+                            mvsads[nmvsad].mv[1] = my;
                              nmvsad++;
                          }
                      }
@@ -641,12 +641,22 @@ me_hex2:
                      for( i=0; i<nmvsad && mvsads[i].sad <= sad_thresh; i++ );
                      for( j=i; j<nmvsad; j++ )
                      {
-                        /* mvsad_t is not guaranteed to be 8 bytes on all archs, so check before using explicit write-combining */
-                        if( sizeof( mvsad_t ) == sizeof( uint64_t ) )
-                            CP64( &mvsads[i], &mvsads[j] );
+                        uint32_t sad;
+                        if( WORD_SIZE == 8 && sizeof(mvsad_t) == 8 )
+                        {
+                            uint64_t mvsad = M64( &mvsads[i] ) = M64( &mvsads[j] );
+#ifdef WORDS_BIGENDIAN
+                            mvsad >>= 32;
+#endif
+                            sad = mvsad;
+                        }
                          else
-                            mvsads[i] = mvsads[j];
-                        i += mvsads[j].sad <= sad_thresh;
+                        {
+                            sad = mvsads[j].sad;
+                            CP32( mvsads[i].mv, mvsads[j].mv );
+                            mvsads[i].sad = sad;
+                        }
+                        i += (sad - (sad_thresh+1)) >> 31;
                      }
                      nmvsad = i;
                  }
@@ -663,7 +673,7 @@ me_hex2:
                          mvsads[bi] = mvsads[nmvsad];
                  }
                  for( i=0; i<nmvsad; i++ )
-                    COST_MV( mvsads[i].mx, mvsads[i].my );
+                    COST_MV( mvsads[i].mv[0], mvsads[i].mv[1] );
              }
              else
              {
diff --git a/encoder/me.h b/encoder/me.h

index 591b239fd384e36a23808dc871dbf6efb469f9c9..2f19e613e7189fae215f38c6529a3f4110734e10 100644 (file)
--- a/encoder/me.h
+++ b/encoder/me.h
@@ -54,7 +54,7 @@ typedef struct
  
  typedef struct {
      int sad;
-    int16_t mx, my;
+    int16_t mv[2];
  } mvsad_t;
  
  void x264_me_search_ref( x264_t *h, x264_me_t *m, int16_t (*mvc)[2], int i_mvc, int *p_fullpel_thresh );
author	Loren Merritt <pengvado@akuvian.org>
	Thu, 14 Jan 2010 19:52:12 +0000 (14:52 -0500)
committer	Fiona Glaser <fiona@x264.com>
	Wed, 20 Jan 2010 21:59:36 +0000 (13:59 -0800)
encoder/me.c		patch \| blob \| history
encoder/me.h		patch \| blob \| history