- PCKEV_H4_SW(temp0_l, temp0_r, temp1_l, temp1_r, temp2_l, temp2_r,
- temp3_l, temp3_r, temp0_r, temp1_r, temp2_r, temp3_r);
- PCKEV_H4_SW(a0_l, a0_r, a1_l, a1_r, a2_l, a2_r, a3_l, a3_r,
- a0_r, a1_r, a2_r, a3_r);
- temp0_r = (v4i32) CLIP_SH_0_255(temp0_r);
- temp1_r = (v4i32) CLIP_SH_0_255(temp1_r);
- temp2_r = (v4i32) CLIP_SH_0_255(temp2_r);
- temp3_r = (v4i32) CLIP_SH_0_255(temp3_r);
- PCKEV_B4_SW(temp0_r, temp0_r, temp1_r, temp1_r,
- temp2_r, temp2_r, temp3_r, temp3_r,
- temp0_r, temp1_r, temp2_r, temp3_r);
- tmp0 = __msa_copy_u_d((v2i64) temp0_r, 1);
- tmp1 = __msa_copy_u_d((v2i64) temp1_r, 1);
- tmp2 = __msa_copy_u_d((v2i64) temp2_r, 1);
- tmp3 = __msa_copy_u_d((v2i64) temp3_r, 1);
- SD4(tmp0, tmp1, tmp2, tmp3, dst, dst_stride);
- dst += 4 * dst_stride;
- a0_r = (v4i32) CLIP_SH_0_255(a0_r);
- a1_r = (v4i32) CLIP_SH_0_255(a1_r);
- a2_r = (v4i32) CLIP_SH_0_255(a2_r);
- a3_r = (v4i32) CLIP_SH_0_255(a3_r);
- PCKEV_B4_SW(a0_r, a0_r, a1_r, a1_r,
- a2_r, a2_r, a3_r, a3_r, a0_r, a1_r, a2_r, a3_r);
- tmp3 = __msa_copy_u_d((v2i64) a0_r, 1);
- tmp2 = __msa_copy_u_d((v2i64) a1_r, 1);
- tmp1 = __msa_copy_u_d((v2i64) a2_r, 1);
- tmp0 = __msa_copy_u_d((v2i64) a3_r, 1);
+ PCKEV_H4_SH(temp0_l, temp0_r, temp1_l, temp1_r, temp2_l, temp2_r,
+ temp3_l, temp3_r, in0, in1, in2, in3);
+ PCKEV_H4_SH(a0_l, a0_r, a1_l, a1_r, a2_l, a2_r, a3_l, a3_r,
+ in4, in5, in6, in7);
+ CLIP_SH4_0_255(in0, in1, in2, in3);
+ PCKEV_B4_SH(in0, in0, in1, in1, in2, in2, in3, in3,
+ in0, in1, in2, in3);
+ tmp0 = __msa_copy_u_d((v2i64) in0, 1);
+ tmp1 = __msa_copy_u_d((v2i64) in1, 1);
+ tmp2 = __msa_copy_u_d((v2i64) in2, 1);
+ tmp3 = __msa_copy_u_d((v2i64) in3, 1);