-mc_rep_funcs(pel_pixels, 8, 16, 64, sse4);
-mc_rep_funcs(pel_pixels, 8, 16, 48, sse4);
-mc_rep_funcs(pel_pixels, 8, 16, 32, sse4);
-mc_rep_funcs(pel_pixels, 8, 8, 24, sse4);
-mc_rep_funcs(pel_pixels,10, 8, 64, sse4);
-mc_rep_funcs(pel_pixels,10, 8, 48, sse4);
-mc_rep_funcs(pel_pixels,10, 8, 32, sse4);
-mc_rep_funcs(pel_pixels,10, 8, 24, sse4);
-mc_rep_funcs(pel_pixels,10, 8, 16, sse4);
-mc_rep_funcs(pel_pixels,10, 4, 12, sse4);
-mc_rep_funcs(pel_pixels,12, 8, 64, sse4);
-mc_rep_funcs(pel_pixels,12, 8, 48, sse4);
-mc_rep_funcs(pel_pixels,12, 8, 32, sse4);
-mc_rep_funcs(pel_pixels,12, 8, 24, sse4);
-mc_rep_funcs(pel_pixels,12, 8, 16, sse4);
-mc_rep_funcs(pel_pixels,12, 4, 12, sse4);
-
-mc_rep_funcs(epel_h, 8, 16, 64, sse4);
-mc_rep_funcs(epel_h, 8, 16, 48, sse4);
-mc_rep_funcs(epel_h, 8, 16, 32, sse4);
-mc_rep_funcs(epel_h, 8, 8, 24, sse4);
-mc_rep_funcs(epel_h,10, 8, 64, sse4);
-mc_rep_funcs(epel_h,10, 8, 48, sse4);
-mc_rep_funcs(epel_h,10, 8, 32, sse4);
-mc_rep_funcs(epel_h,10, 8, 24, sse4);
-mc_rep_funcs(epel_h,10, 8, 16, sse4);
-mc_rep_funcs(epel_h,10, 4, 12, sse4);
-mc_rep_funcs(epel_h,12, 8, 64, sse4);
-mc_rep_funcs(epel_h,12, 8, 48, sse4);
-mc_rep_funcs(epel_h,12, 8, 32, sse4);
-mc_rep_funcs(epel_h,12, 8, 24, sse4);
-mc_rep_funcs(epel_h,12, 8, 16, sse4);
-mc_rep_funcs(epel_h,12, 4, 12, sse4);
-mc_rep_funcs(epel_v, 8, 16, 64, sse4);
-mc_rep_funcs(epel_v, 8, 16, 48, sse4);
-mc_rep_funcs(epel_v, 8, 16, 32, sse4);
-mc_rep_funcs(epel_v, 8, 8, 24, sse4);
-mc_rep_funcs(epel_v,10, 8, 64, sse4);
-mc_rep_funcs(epel_v,10, 8, 48, sse4);
-mc_rep_funcs(epel_v,10, 8, 32, sse4);
-mc_rep_funcs(epel_v,10, 8, 24, sse4);
-mc_rep_funcs(epel_v,10, 8, 16, sse4);
-mc_rep_funcs(epel_v,10, 4, 12, sse4);
-mc_rep_funcs(epel_v,12, 8, 64, sse4);
-mc_rep_funcs(epel_v,12, 8, 48, sse4);
-mc_rep_funcs(epel_v,12, 8, 32, sse4);
-mc_rep_funcs(epel_v,12, 8, 24, sse4);
-mc_rep_funcs(epel_v,12, 8, 16, sse4);
-mc_rep_funcs(epel_v,12, 4, 12, sse4);
-mc_rep_funcs(epel_hv, 8, 16, 64, sse4);
-mc_rep_funcs(epel_hv, 8, 16, 48, sse4);
-mc_rep_funcs(epel_hv, 8, 16, 32, sse4);
-mc_rep_funcs(epel_hv, 8, 8, 24, sse4);
-mc_rep_funcs2(epel_hv,8, 8, 4, 12, sse4);
-mc_rep_funcs(epel_hv,10, 8, 64, sse4);
-mc_rep_funcs(epel_hv,10, 8, 48, sse4);
-mc_rep_funcs(epel_hv,10, 8, 32, sse4);
-mc_rep_funcs(epel_hv,10, 8, 24, sse4);
-mc_rep_funcs(epel_hv,10, 8, 16, sse4);
-mc_rep_funcs(epel_hv,10, 4, 12, sse4);
-mc_rep_funcs(epel_hv,12, 8, 64, sse4);
-mc_rep_funcs(epel_hv,12, 8, 48, sse4);
-mc_rep_funcs(epel_hv,12, 8, 32, sse4);
-mc_rep_funcs(epel_hv,12, 8, 24, sse4);
-mc_rep_funcs(epel_hv,12, 8, 16, sse4);
-mc_rep_funcs(epel_hv,12, 4, 12, sse4);
-
-mc_rep_funcs(qpel_h, 8, 16, 64, sse4);
-mc_rep_funcs(qpel_h, 8, 16, 48, sse4);
-mc_rep_funcs(qpel_h, 8, 16, 32, sse4);
-mc_rep_funcs(qpel_h, 8, 8, 24, sse4);
-mc_rep_funcs(qpel_h,10, 8, 64, sse4);
-mc_rep_funcs(qpel_h,10, 8, 48, sse4);
-mc_rep_funcs(qpel_h,10, 8, 32, sse4);
-mc_rep_funcs(qpel_h,10, 8, 24, sse4);
-mc_rep_funcs(qpel_h,10, 8, 16, sse4);
-mc_rep_funcs(qpel_h,10, 4, 12, sse4);
-mc_rep_funcs(qpel_h,12, 8, 64, sse4);
-mc_rep_funcs(qpel_h,12, 8, 48, sse4);
-mc_rep_funcs(qpel_h,12, 8, 32, sse4);
-mc_rep_funcs(qpel_h,12, 8, 24, sse4);
-mc_rep_funcs(qpel_h,12, 8, 16, sse4);
-mc_rep_funcs(qpel_h,12, 4, 12, sse4);
-mc_rep_funcs(qpel_v, 8, 16, 64, sse4);
-mc_rep_funcs(qpel_v, 8, 16, 48, sse4);
-mc_rep_funcs(qpel_v, 8, 16, 32, sse4);
-mc_rep_funcs(qpel_v, 8, 8, 24, sse4);
-mc_rep_funcs(qpel_v,10, 8, 64, sse4);
-mc_rep_funcs(qpel_v,10, 8, 48, sse4);
-mc_rep_funcs(qpel_v,10, 8, 32, sse4);
-mc_rep_funcs(qpel_v,10, 8, 24, sse4);
-mc_rep_funcs(qpel_v,10, 8, 16, sse4);
-mc_rep_funcs(qpel_v,10, 4, 12, sse4);
-mc_rep_funcs(qpel_v,12, 8, 64, sse4);
-mc_rep_funcs(qpel_v,12, 8, 48, sse4);
-mc_rep_funcs(qpel_v,12, 8, 32, sse4);
-mc_rep_funcs(qpel_v,12, 8, 24, sse4);
-mc_rep_funcs(qpel_v,12, 8, 16, sse4);
-mc_rep_funcs(qpel_v,12, 4, 12, sse4);
-mc_rep_funcs(qpel_hv, 8, 8, 64, sse4);
-mc_rep_funcs(qpel_hv, 8, 8, 48, sse4);
-mc_rep_funcs(qpel_hv, 8, 8, 32, sse4);
-mc_rep_funcs(qpel_hv, 8, 8, 24, sse4);
-mc_rep_funcs(qpel_hv, 8, 8, 16, sse4);
-mc_rep_funcs2(qpel_hv,8, 8, 4, 12, sse4);
-mc_rep_funcs(qpel_hv,10, 8, 64, sse4);
-mc_rep_funcs(qpel_hv,10, 8, 48, sse4);
-mc_rep_funcs(qpel_hv,10, 8, 32, sse4);
-mc_rep_funcs(qpel_hv,10, 8, 24, sse4);
-mc_rep_funcs(qpel_hv,10, 8, 16, sse4);
-mc_rep_funcs(qpel_hv,10, 4, 12, sse4);
-mc_rep_funcs(qpel_hv,12, 8, 64, sse4);
-mc_rep_funcs(qpel_hv,12, 8, 48, sse4);
-mc_rep_funcs(qpel_hv,12, 8, 32, sse4);
-mc_rep_funcs(qpel_hv,12, 8, 24, sse4);
-mc_rep_funcs(qpel_hv,12, 8, 16, sse4);
-mc_rep_funcs(qpel_hv,12, 4, 12, sse4);
+mc_rep_funcs(pel_pixels, 8, 16, 64, sse4)
+mc_rep_funcs(pel_pixels, 8, 16, 48, sse4)
+mc_rep_funcs(pel_pixels, 8, 16, 32, sse4)
+mc_rep_funcs(pel_pixels, 8, 8, 24, sse4)
+mc_rep_funcs(pel_pixels,10, 8, 64, sse4)
+mc_rep_funcs(pel_pixels,10, 8, 48, sse4)
+mc_rep_funcs(pel_pixels,10, 8, 32, sse4)
+mc_rep_funcs(pel_pixels,10, 8, 24, sse4)
+mc_rep_funcs(pel_pixels,10, 8, 16, sse4)
+mc_rep_funcs(pel_pixels,10, 4, 12, sse4)
+mc_rep_funcs(pel_pixels,12, 8, 64, sse4)
+mc_rep_funcs(pel_pixels,12, 8, 48, sse4)
+mc_rep_funcs(pel_pixels,12, 8, 32, sse4)
+mc_rep_funcs(pel_pixels,12, 8, 24, sse4)
+mc_rep_funcs(pel_pixels,12, 8, 16, sse4)
+mc_rep_funcs(pel_pixels,12, 4, 12, sse4)
+
+mc_rep_funcs(epel_h, 8, 16, 64, sse4)
+mc_rep_funcs(epel_h, 8, 16, 48, sse4)
+mc_rep_funcs(epel_h, 8, 16, 32, sse4)
+mc_rep_funcs(epel_h, 8, 8, 24, sse4)
+mc_rep_funcs(epel_h,10, 8, 64, sse4)
+mc_rep_funcs(epel_h,10, 8, 48, sse4)
+mc_rep_funcs(epel_h,10, 8, 32, sse4)
+mc_rep_funcs(epel_h,10, 8, 24, sse4)
+mc_rep_funcs(epel_h,10, 8, 16, sse4)
+mc_rep_funcs(epel_h,10, 4, 12, sse4)
+mc_rep_funcs(epel_h,12, 8, 64, sse4)
+mc_rep_funcs(epel_h,12, 8, 48, sse4)
+mc_rep_funcs(epel_h,12, 8, 32, sse4)
+mc_rep_funcs(epel_h,12, 8, 24, sse4)
+mc_rep_funcs(epel_h,12, 8, 16, sse4)
+mc_rep_funcs(epel_h,12, 4, 12, sse4)
+mc_rep_funcs(epel_v, 8, 16, 64, sse4)
+mc_rep_funcs(epel_v, 8, 16, 48, sse4)
+mc_rep_funcs(epel_v, 8, 16, 32, sse4)
+mc_rep_funcs(epel_v, 8, 8, 24, sse4)
+mc_rep_funcs(epel_v,10, 8, 64, sse4)
+mc_rep_funcs(epel_v,10, 8, 48, sse4)
+mc_rep_funcs(epel_v,10, 8, 32, sse4)
+mc_rep_funcs(epel_v,10, 8, 24, sse4)
+mc_rep_funcs(epel_v,10, 8, 16, sse4)
+mc_rep_funcs(epel_v,10, 4, 12, sse4)
+mc_rep_funcs(epel_v,12, 8, 64, sse4)
+mc_rep_funcs(epel_v,12, 8, 48, sse4)
+mc_rep_funcs(epel_v,12, 8, 32, sse4)
+mc_rep_funcs(epel_v,12, 8, 24, sse4)
+mc_rep_funcs(epel_v,12, 8, 16, sse4)
+mc_rep_funcs(epel_v,12, 4, 12, sse4)
+mc_rep_funcs(epel_hv, 8, 16, 64, sse4)
+mc_rep_funcs(epel_hv, 8, 16, 48, sse4)
+mc_rep_funcs(epel_hv, 8, 16, 32, sse4)
+mc_rep_funcs(epel_hv, 8, 8, 24, sse4)
+mc_rep_funcs2(epel_hv,8, 8, 4, 12, sse4)
+mc_rep_funcs(epel_hv,10, 8, 64, sse4)
+mc_rep_funcs(epel_hv,10, 8, 48, sse4)
+mc_rep_funcs(epel_hv,10, 8, 32, sse4)
+mc_rep_funcs(epel_hv,10, 8, 24, sse4)
+mc_rep_funcs(epel_hv,10, 8, 16, sse4)
+mc_rep_funcs(epel_hv,10, 4, 12, sse4)
+mc_rep_funcs(epel_hv,12, 8, 64, sse4)
+mc_rep_funcs(epel_hv,12, 8, 48, sse4)
+mc_rep_funcs(epel_hv,12, 8, 32, sse4)
+mc_rep_funcs(epel_hv,12, 8, 24, sse4)
+mc_rep_funcs(epel_hv,12, 8, 16, sse4)
+mc_rep_funcs(epel_hv,12, 4, 12, sse4)
+
+mc_rep_funcs(qpel_h, 8, 16, 64, sse4)
+mc_rep_funcs(qpel_h, 8, 16, 48, sse4)
+mc_rep_funcs(qpel_h, 8, 16, 32, sse4)
+mc_rep_funcs(qpel_h, 8, 8, 24, sse4)
+mc_rep_funcs(qpel_h,10, 8, 64, sse4)
+mc_rep_funcs(qpel_h,10, 8, 48, sse4)
+mc_rep_funcs(qpel_h,10, 8, 32, sse4)
+mc_rep_funcs(qpel_h,10, 8, 24, sse4)
+mc_rep_funcs(qpel_h,10, 8, 16, sse4)
+mc_rep_funcs(qpel_h,10, 4, 12, sse4)
+mc_rep_funcs(qpel_h,12, 8, 64, sse4)
+mc_rep_funcs(qpel_h,12, 8, 48, sse4)
+mc_rep_funcs(qpel_h,12, 8, 32, sse4)
+mc_rep_funcs(qpel_h,12, 8, 24, sse4)
+mc_rep_funcs(qpel_h,12, 8, 16, sse4)
+mc_rep_funcs(qpel_h,12, 4, 12, sse4)
+mc_rep_funcs(qpel_v, 8, 16, 64, sse4)
+mc_rep_funcs(qpel_v, 8, 16, 48, sse4)
+mc_rep_funcs(qpel_v, 8, 16, 32, sse4)
+mc_rep_funcs(qpel_v, 8, 8, 24, sse4)
+mc_rep_funcs(qpel_v,10, 8, 64, sse4)
+mc_rep_funcs(qpel_v,10, 8, 48, sse4)
+mc_rep_funcs(qpel_v,10, 8, 32, sse4)
+mc_rep_funcs(qpel_v,10, 8, 24, sse4)
+mc_rep_funcs(qpel_v,10, 8, 16, sse4)
+mc_rep_funcs(qpel_v,10, 4, 12, sse4)
+mc_rep_funcs(qpel_v,12, 8, 64, sse4)
+mc_rep_funcs(qpel_v,12, 8, 48, sse4)
+mc_rep_funcs(qpel_v,12, 8, 32, sse4)
+mc_rep_funcs(qpel_v,12, 8, 24, sse4)
+mc_rep_funcs(qpel_v,12, 8, 16, sse4)
+mc_rep_funcs(qpel_v,12, 4, 12, sse4)
+mc_rep_funcs(qpel_hv, 8, 8, 64, sse4)
+mc_rep_funcs(qpel_hv, 8, 8, 48, sse4)
+mc_rep_funcs(qpel_hv, 8, 8, 32, sse4)
+mc_rep_funcs(qpel_hv, 8, 8, 24, sse4)
+mc_rep_funcs(qpel_hv, 8, 8, 16, sse4)
+mc_rep_funcs2(qpel_hv,8, 8, 4, 12, sse4)
+mc_rep_funcs(qpel_hv,10, 8, 64, sse4)
+mc_rep_funcs(qpel_hv,10, 8, 48, sse4)
+mc_rep_funcs(qpel_hv,10, 8, 32, sse4)
+mc_rep_funcs(qpel_hv,10, 8, 24, sse4)
+mc_rep_funcs(qpel_hv,10, 8, 16, sse4)
+mc_rep_funcs(qpel_hv,10, 4, 12, sse4)
+mc_rep_funcs(qpel_hv,12, 8, 64, sse4)
+mc_rep_funcs(qpel_hv,12, 8, 48, sse4)
+mc_rep_funcs(qpel_hv,12, 8, 32, sse4)
+mc_rep_funcs(qpel_hv,12, 8, 24, sse4)
+mc_rep_funcs(qpel_hv,12, 8, 16, sse4)
+mc_rep_funcs(qpel_hv,12, 4, 12, sse4)