arm: Don't clobber callee saved registers in scalarproduct

q4-q7/d8-d15 are supposed to not be clobbered by the callee.

CC: libav-stable@libav.org
Signed-off-by: Martin Storsjö <martin@martin.st>
(cherry picked from commit d307e408d4)
This commit is contained in:
Martin Storsjö 2013-12-20 15:02:35 +02:00 committed by Carl Eugen Hoyos
parent 115efdefc5
commit 8925c44db1
1 changed files with 6 additions and 6 deletions

View File

@ -67,10 +67,10 @@ function ff_scalarproduct_int16_neon, export=1
3: vpadd.s32 d16, d0, d1 3: vpadd.s32 d16, d0, d1
vpadd.s32 d17, d2, d3 vpadd.s32 d17, d2, d3
vpadd.s32 d10, d4, d5 vpadd.s32 d18, d4, d5
vpadd.s32 d11, d6, d7 vpadd.s32 d19, d6, d7
vpadd.s32 d0, d16, d17 vpadd.s32 d0, d16, d17
vpadd.s32 d1, d10, d11 vpadd.s32 d1, d18, d19
vpadd.s32 d2, d0, d1 vpadd.s32 d2, d0, d1
vpaddl.s32 d3, d2 vpaddl.s32 d3, d2
vmov.32 r0, d3[0] vmov.32 r0, d3[0]
@ -107,10 +107,10 @@ function ff_scalarproduct_and_madd_int16_neon, export=1
vpadd.s32 d16, d0, d1 vpadd.s32 d16, d0, d1
vpadd.s32 d17, d2, d3 vpadd.s32 d17, d2, d3
vpadd.s32 d10, d4, d5 vpadd.s32 d18, d4, d5
vpadd.s32 d11, d6, d7 vpadd.s32 d19, d6, d7
vpadd.s32 d0, d16, d17 vpadd.s32 d0, d16, d17
vpadd.s32 d1, d10, d11 vpadd.s32 d1, d18, d19
vpadd.s32 d2, d0, d1 vpadd.s32 d2, d0, d1
vpaddl.s32 d3, d2 vpaddl.s32 d3, d2
vmov.32 r0, d3[0] vmov.32 r0, d3[0]