src/math · d7de8b6d231289b7a6b205508c6f02a5a475cc84 · go / golang

math: fix sqrt regression on AMD64 · 6e703ae7

Ilya Tocar authored Sep 01, 2016

1.7 introduced a significant regression compared to 1.6:

SqrtIndirect-4  2.32ns ± 0%  7.86ns ± 0%  +238.79%        (p=0.000 n=20+18)

This is caused by sqrtsd preserving upper part of destination register.
Which introduces dependency on previous  value of X0.
In 1.6 benchmark loop didn't use X0 immediately after call:

callq  *%rbx
movsd  0x8(%rsp),%xmm2
movsd  0x20(%rsp),%xmm1
addsd  %xmm2,%xmm1
mov    0x18(%rsp),%rax
inc    %rax
jmp    loop

In 1.7 however xmm0 is used just after call:

callq  *%rbx
mov    0x10(%rsp),%rcx
lea    0x1(%rcx),%rax
movsd  0x8(%rsp),%xmm0
movsd  0x18(%rsp),%xmm1

I've  verified that this is caused by dependency, by inserting
XORPS X0,X0 in the beginning of math.Sqrt, which puts performance back on 1.6 level.

Splitting SQRTSD mem,reg into:
MOVSD mem,reg
SQRTSD reg,reg

Removes dependency, because MOVSD (load version)
doesn't need to preserve upper part of a register.
And reg,reg operation is solved by renamer in CPU.

As a result of this change regression is gone:
SqrtIndirect-4  7.86ns ± 0%  2.33ns ± 0%  -70.36%  (p=0.000 n=18+17)

This also removes old Sqrt benchmarks, in favor of benchmarks measuring latency.
Only SqrtIndirect is kept, to show impact of this patch.

Change-Id: Ic7eebe8866445adff5bc38192fa8d64c9a6b8872
Reviewed-on: https://go-review.googlesource.com/28392
Run-TryBot: Ilya Tocar <ilya.tocar@intel.com>
Reviewed-by: Keith Randall <khr@golang.org>

6e703ae7

Name	Last commit	Last update
..
big		Loading commit data...
cmplx		Loading commit data...
rand		Loading commit data...
abs.go		Loading commit data...
acosh.go		Loading commit data...
all_test.go		Loading commit data...
asin.go		Loading commit data...
asin_386.s		Loading commit data...
asin_amd64.s		Loading commit data...
asin_amd64p32.s		Loading commit data...
asin_arm.s		Loading commit data...
asinh.go		Loading commit data...
atan.go		Loading commit data...
atan2.go		Loading commit data...
atan2_386.s		Loading commit data...
atan2_amd64.s		Loading commit data...
atan2_amd64p32.s		Loading commit data...
atan2_arm.s		Loading commit data...
atan_386.s		Loading commit data...
atan_amd64.s		Loading commit data...
atan_amd64p32.s		Loading commit data...
atan_arm.s		Loading commit data...
atanh.go		Loading commit data...
bits.go		Loading commit data...
cbrt.go		Loading commit data...
const.go		Loading commit data...
copysign.go		Loading commit data...
dim.go		Loading commit data...
dim_386.s		Loading commit data...
dim_amd64.s		Loading commit data...
dim_amd64p32.s		Loading commit data...
dim_arm.s		Loading commit data...
dim_s390x.s		Loading commit data...
erf.go		Loading commit data...
exp.go		Loading commit data...
exp2_386.s		Loading commit data...
exp2_amd64.s		Loading commit data...
exp2_amd64p32.s		Loading commit data...
exp2_arm.s		Loading commit data...
exp_386.s		Loading commit data...
exp_amd64.s		Loading commit data...
exp_amd64p32.s		Loading commit data...
exp_arm.s		Loading commit data...
expm1.go		Loading commit data...
expm1_386.s		Loading commit data...
expm1_amd64.s		Loading commit data...
expm1_amd64p32.s		Loading commit data...
expm1_arm.s		Loading commit data...
export_test.go		Loading commit data...
floor.go		Loading commit data...
floor_386.s		Loading commit data...
floor_amd64.s		Loading commit data...
floor_amd64p32.s		Loading commit data...
floor_arm.s		Loading commit data...
floor_asm.go		Loading commit data...
floor_s390x.s		Loading commit data...
frexp.go		Loading commit data...
frexp_386.s		Loading commit data...
frexp_amd64.s		Loading commit data...
frexp_amd64p32.s		Loading commit data...
frexp_arm.s		Loading commit data...
gamma.go		Loading commit data...
hypot.go		Loading commit data...
hypot_386.s		Loading commit data...
hypot_amd64.s		Loading commit data...
hypot_amd64p32.s		Loading commit data...
hypot_arm.s		Loading commit data...
j0.go		Loading commit data...
j1.go		Loading commit data...
jn.go		Loading commit data...
ldexp.go		Loading commit data...
ldexp_386.s		Loading commit data...
ldexp_amd64.s		Loading commit data...
ldexp_amd64p32.s		Loading commit data...
ldexp_arm.s		Loading commit data...
lgamma.go		Loading commit data...
log.go		Loading commit data...
log10.go		Loading commit data...
log10_386.s		Loading commit data...
log10_amd64.s		Loading commit data...
log10_amd64p32.s		Loading commit data...
log10_arm.s		Loading commit data...
log1p.go		Loading commit data...
log1p_386.s		Loading commit data...
log1p_amd64.s		Loading commit data...
log1p_amd64p32.s		Loading commit data...
log1p_arm.s		Loading commit data...
log_386.s		Loading commit data...
log_amd64.s		Loading commit data...
log_amd64p32.s		Loading commit data...
log_arm.s		Loading commit data...
logb.go		Loading commit data...
mod.go		Loading commit data...
mod_386.s		Loading commit data...
mod_amd64.s		Loading commit data...
mod_amd64p32.s		Loading commit data...
mod_arm.s		Loading commit data...
modf.go		Loading commit data...
modf_386.s		Loading commit data...
modf_amd64.s		Loading commit data...
modf_amd64p32.s		Loading commit data...
modf_arm.s		Loading commit data...
nextafter.go		Loading commit data...
pow.go		Loading commit data...
pow10.go		Loading commit data...
remainder.go		Loading commit data...
remainder_386.s		Loading commit data...
remainder_amd64.s		Loading commit data...
remainder_amd64p32.s		Loading commit data...
remainder_arm.s		Loading commit data...
signbit.go		Loading commit data...
sin.go		Loading commit data...
sin_386.s		Loading commit data...
sin_amd64.s		Loading commit data...
sin_amd64p32.s		Loading commit data...
sin_arm.s		Loading commit data...
sincos.go		Loading commit data...
sincos_386.s		Loading commit data...
sincos_amd64.s		Loading commit data...
sincos_amd64p32.s		Loading commit data...
sincos_arm.s		Loading commit data...
sinh.go		Loading commit data...
sqrt.go		Loading commit data...
sqrt_386.s		Loading commit data...
sqrt_amd64.s		Loading commit data...
sqrt_amd64p32.s		Loading commit data...
sqrt_arm.s		Loading commit data...
sqrt_arm64.s		Loading commit data...
sqrt_ppc64x.s		Loading commit data...
sqrt_s390x.s		Loading commit data...
stubs_arm64.s		Loading commit data...
stubs_mips64x.s		Loading commit data...
stubs_ppc64x.s		Loading commit data...
stubs_s390x.s		Loading commit data...
tan.go		Loading commit data...
tan_386.s		Loading commit data...
tan_amd64.s		Loading commit data...
tan_amd64p32.s		Loading commit data...
tan_arm.s		Loading commit data...
tanh.go		Loading commit data...
unsafe.go		Loading commit data...