]> git.sesse.net Git - ffmpeg/commit
vp9/x86: 16x16 iadst_idct, idct_iadst and iadst_iadst (ssse3+avx).
authorRonald S. Bultje <rsbultje@gmail.com>
Thu, 16 Jan 2014 12:30:15 +0000 (07:30 -0500)
committerClément Bœsch <clement@stupeflix.com>
Thu, 16 Jan 2014 12:49:31 +0000 (13:49 +0100)
commit8173d1ffc0b742972db6c9cffb2cec204e2a1a96
tree0636fe8f54d6a7ed31813716815103a1fc855a9f
parenta64333db5fefdec89533b6bec299fe169ef7d77d
vp9/x86: 16x16 iadst_idct, idct_iadst and iadst_iadst (ssse3+avx).

Sample timings on ped1080p.webm (of the ssse3 functions):
iadst_idct:  4672 -> 1175 cycles
idct_iadst:  4736 -> 1263 cycles
iadst_iadst: 4924 -> 1438 cycles
Total decoding time changed from 6.565s to 6.413s.
libavcodec/x86/vp9dsp_init.c
libavcodec/x86/vp9itxfm.asm