]> git.sesse.net Git - ffmpeg/commit
vp9: initial attempt at a idct_idct_4x4 12bpp x86 simd (sse2) impl.
authorRonald S. Bultje <rsbultje@gmail.com>
Mon, 12 Oct 2015 14:16:56 +0000 (10:16 -0400)
committerRonald S. Bultje <rsbultje@gmail.com>
Tue, 13 Oct 2015 15:05:58 +0000 (11:05 -0400)
commit235e76aeb877bd1b23c12e74588e86752e3dfbe7
treecd581f35599535342d7ba9d1495dc32c1e520d71
parentf76423d0975dae4bb2513e6b20be2a7803fd7019
vp9: initial attempt at a idct_idct_4x4 12bpp x86 simd (sse2) impl.

The trouble with this function is that intermediates overflow 31+sign
bits, so I've added some helpers (that will also be used in 10/12bpp
8x8, 16x16 and 32x32) to make that easier, basically emulating a half-
assed pmaddqd using 2xpmaddwd. It's currently sse2-only, if anyone sees
potential in adding ssse3, I'd love to hear it.
libavcodec/x86/vp9dsp_init_16bpp_template.c
libavcodec/x86/vp9itxfm_16bpp.asm