]> git.sesse.net Git - ffmpeg/blobdiff - libavfilter/x86/vf_maskedmerge.asm
Merge commit '46350db737a15910f468d30cf7beda16a4cc8332'
[ffmpeg] / libavfilter / x86 / vf_maskedmerge.asm
index e548d258e18278f9d2bf7fd797fe5a40ed608bf2..7e61935b97b08c50295accb1ebcc07e4c2b413ac 100644 (file)
@@ -22,7 +22,6 @@
 
 %include "libavutil/x86/x86util.asm"
 
-%if ARCH_X86_64
 SECTION_RODATA
 
 pw_128: times 8 dw 128
@@ -31,7 +30,18 @@ pw_256: times 8 dw 256
 SECTION .text
 
 INIT_XMM sse2
-cglobal maskedmerge8, 10, 11, 7, 0, bsrc, osrc, msrc, dst, blinesize, olinesize, mlinesize, dlinesize, w, h
+%if ARCH_X86_64
+cglobal maskedmerge8, 8, 11, 7, bsrc, osrc, msrc, dst, blinesize, olinesize, mlinesize, dlinesize, w, h, x
+    mov         wd, dword wm
+    mov         hd, dword hm
+%else
+cglobal maskedmerge8, 5, 7, 7, bsrc, osrc, msrc, dst, blinesize, w, x
+    mov         wd, r8m
+%define olinesizeq r5mp
+%define mlinesizeq r6mp
+%define dlinesizeq r7mp
+%define hd r9mp
+%endif
     mova        m4, [pw_256]
     mova        m5, [pw_128]
     pxor        m6, m6
@@ -40,14 +50,13 @@ cglobal maskedmerge8, 10, 11, 7, 0, bsrc, osrc, msrc, dst, blinesize, olinesize,
     add      msrcq, wq
     add       dstq, wq
     neg         wq
-    %define      x  r10q
 .nextrow:
-    mov          x, wq
+    mov         xq, wq
 
     .loop:
-        movh            m0, [bsrcq + x]
-        movh            m1, [osrcq + x]
-        movh            m3, [msrcq + x]
+        movh            m0, [bsrcq + xq]
+        movh            m1, [osrcq + xq]
+        movh            m3, [msrcq + xq]
         mova            m2, m4
         punpcklbw       m0, m6
         punpcklbw       m1, m6
@@ -59,8 +68,8 @@ cglobal maskedmerge8, 10, 11, 7, 0, bsrc, osrc, msrc, dst, blinesize, olinesize,
         paddw           m1, m5
         psrlw           m1, 8
         packuswb        m1, m1
-        movh    [dstq + x], m1
-        add           r10q, mmsize / 2
+        movh   [dstq + xq], m1
+        add             xq, mmsize / 2
     jl .loop
 
     add         bsrcq, blinesizeq
@@ -70,4 +79,3 @@ cglobal maskedmerge8, 10, 11, 7, 0, bsrc, osrc, msrc, dst, blinesize, olinesize,
     sub         hd, 1
     jg .nextrow
 REP_RET
-%endif