]> git.sesse.net Git - x264/commitdiff
Fix overflow in 8-bit x86 vsad asm function
authorAnton Mitrofanov <BugMaster@narod.ru>
Thu, 8 Dec 2011 21:54:22 +0000 (01:54 +0400)
committerFiona Glaser <fiona@x264.com>
Thu, 8 Dec 2011 22:00:43 +0000 (14:00 -0800)
common/x86/sad-a.asm

index d7e76bb49ec2a2e8ac7724be2c731ee44372fff4..72493641337c0a1fa880684754b9e3dcb646c463 100644 (file)
@@ -287,10 +287,11 @@ cglobal pixel_vsad_mmx2, 3,3
     psadbw    m3, m5
     psadbw    m4, m6
     psadbw    m5, m7
-    paddw     m0, m2
-    paddw     m0, m3
-    paddw     m0, m4
-    paddw     m0, m5
+    ;max sum: 31*16*255(pixel_max)=126480
+    paddd     m0, m2
+    paddd     m0, m3
+    paddd     m0, m4
+    paddd     m0, m5
     mova      m2, m6
     mova      m3, m7
     sub      r2d, 2
@@ -321,7 +322,8 @@ cglobal pixel_vsad_sse2, 3,3
     jg .loop
 .end:
     movhlps   m1, m0
-    paddw     m0, m1
+    ;max sum: 31*16*255(pixel_max)=126480
+    paddd     m0, m1
     movd     eax, m0
     RET