test · 736390c2bd2d7f00d62ca62f18836f82eb1f51a3 · go / golang

cmd/compile: use intrinsic for LeadingZeros8 on amd64 · c5f0104d

Josh Bleecher Snyder authored Apr 23, 2018

The previous change sped up the pure computation form of LeadingZeros8.
This places it somewhat close to the table lookup form.
Depending on something that varies from toolchain to toolchain
(alignment, perhaps?), the slowdown from ditching the table lookup
is either 20% or 5%.

This benchmark is the best case scenario for the table lookup:
It is in the L1 cache already.

I think we're close enough that we can switch to the computational version,
and trust that the memory effects and binary size savings will be worth it.

Code:

func f8(x uint8)   { z = bits.LeadingZeros8(x) }

Before:

"".f8 STEXT nosplit size=34 args=0x8 locals=0x0
	0x0000 00000 (x.go:7)	TEXT	"".f8(SB), NOSPLIT, $0-8
	0x0000 00000 (x.go:7)	FUNCDATA	$0, gclocals·2a5305abe05176240e61b8620e19a815(SB)
	0x0000 00000 (x.go:7)	FUNCDATA	$1, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB)
	0x0000 00000 (x.go:7)	MOVBLZX	"".x+8(SP), AX
	0x0005 00005 (x.go:7)	MOVBLZX	AL, AX
	0x0008 00008 (x.go:7)	LEAQ	math/bits.len8tab(SB), CX
	0x000f 00015 (x.go:7)	MOVBLZX	(CX)(AX*1), AX
	0x0013 00019 (x.go:7)	ADDQ	$-8, AX
	0x0017 00023 (x.go:7)	NEGQ	AX
	0x001a 00026 (x.go:7)	MOVQ	AX, "".z(SB)
	0x0021 00033 (x.go:7)	RET

After:

"".f8 STEXT nosplit size=30 args=0x8 locals=0x0
	0x0000 00000 (x.go:7)	TEXT	"".f8(SB), NOSPLIT, $0-8
	0x0000 00000 (x.go:7)	FUNCDATA	$0, gclocals·2a5305abe05176240e61b8620e19a815(SB)
	0x0000 00000 (x.go:7)	FUNCDATA	$1, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB)
	0x0000 00000 (x.go:7)	MOVBLZX	"".x+8(SP), AX
	0x0005 00005 (x.go:7)	MOVBLZX	AL, AX
	0x0008 00008 (x.go:7)	LEAL	1(AX)(AX*1), AX
	0x000c 00012 (x.go:7)	BSRL	AX, AX
	0x000f 00015 (x.go:7)	ADDQ	$-8, AX
	0x0013 00019 (x.go:7)	NEGQ	AX
	0x0016 00022 (x.go:7)	MOVQ	AX, "".z(SB)
	0x001d 00029 (x.go:7)	RET

Change-Id: Icc7db50a7820fb9a3da8a816d6b6940d7f8e193e
Reviewed-on: https://go-review.googlesource.com/108942
Run-TryBot: Josh Bleecher Snyder <josharian@gmail.com>
TryBot-Result: Gobot Gobot <gobot@golang.org>
Reviewed-by: Keith Randall <khr@golang.org>

c5f0104d

Name	Last commit	Last update
..
alias3.dir		Loading commit data...
bench		Loading commit data...
chan		Loading commit data...
closure3.dir		Loading commit data...
codegen		Loading commit data...
ddd2.dir		Loading commit data...
dwarf		Loading commit data...
fixedbugs		Loading commit data...
import2.dir		Loading commit data...
import4.dir		Loading commit data...
interface		Loading commit data...
intrinsic.dir		Loading commit data...
ken		Loading commit data...
linkname.dir		Loading commit data...
method4.dir		Loading commit data...
retjmp.dir		Loading commit data...
safe		Loading commit data...
stress		Loading commit data...
syntax		Loading commit data...
uintptrescapes.dir		Loading commit data...
235.go		Loading commit data...
64bit.go		Loading commit data...
README.md		Loading commit data...
alg.go		Loading commit data...
alias.go		Loading commit data...
alias1.go		Loading commit data...
alias2.go		Loading commit data...
alias3.go		Loading commit data...
align.go		Loading commit data...
append.go		Loading commit data...
append1.go		Loading commit data...
args.go		Loading commit data...
armimm.go		Loading commit data...
assign.go		Loading commit data...
assign1.go		Loading commit data...
atomicload.go		Loading commit data...
bigalg.go		Loading commit data...
bigmap.go		Loading commit data...
blank.go		Loading commit data...
blank1.go		Loading commit data...
bom.go		Loading commit data...
bombad.go		Loading commit data...
bounds.go		Loading commit data...
chancap.go		Loading commit data...
chanlinear.go		Loading commit data...
char_lit.go		Loading commit data...
char_lit1.go		Loading commit data...
checkbce.go		Loading commit data...
clearfat.go		Loading commit data...
closedchan.go		Loading commit data...
closure.go		Loading commit data...
closure1.go		Loading commit data...
closure2.go		Loading commit data...
closure3.go		Loading commit data...
cmp.go		Loading commit data...
cmp6.go		Loading commit data...
cmplx.go		Loading commit data...
cmplxdivide.c		Loading commit data...
cmplxdivide.go		Loading commit data...
cmplxdivide1.go		Loading commit data...
complit.go		Loading commit data...
complit1.go		Loading commit data...
compos.go		Loading commit data...
const.go		Loading commit data...
const1.go		Loading commit data...
const2.go		Loading commit data...
const3.go		Loading commit data...
const4.go		Loading commit data...
const5.go		Loading commit data...
const6.go		Loading commit data...
convT2X.go		Loading commit data...
convert.go		Loading commit data...
convert1.go		Loading commit data...
convert2.go		Loading commit data...
convert3.go		Loading commit data...
convlit.go		Loading commit data...
convlit1.go		Loading commit data...
copy.go		Loading commit data...
copy1.go		Loading commit data...
crlf.go		Loading commit data...
ddd.go		Loading commit data...
ddd1.go		Loading commit data...
ddd2.go		Loading commit data...
decl.go		Loading commit data...
declbad.go		Loading commit data...
defer.go		Loading commit data...
deferfin.go		Loading commit data...
deferprint.go		Loading commit data...
deferprint.out		Loading commit data...
devirt.go		Loading commit data...
divide.go		Loading commit data...
divmod.go		Loading commit data...
empty.go		Loading commit data...
env.go		Loading commit data...
eof.go		Loading commit data...
eof1.go		Loading commit data...
errchk		Loading commit data...
escape.go		Loading commit data...
escape2.go		Loading commit data...
escape2n.go		Loading commit data...
escape3.go		Loading commit data...
escape4.go		Loading commit data...
escape5.go		Loading commit data...
escape_array.go		Loading commit data...
escape_because.go		Loading commit data...
escape_calls.go		Loading commit data...
escape_closure.go		Loading commit data...
escape_field.go		Loading commit data...
escape_iface.go		Loading commit data...
escape_indir.go		Loading commit data...
escape_level.go		Loading commit data...
escape_map.go		Loading commit data...
escape_param.go		Loading commit data...
escape_slice.go		Loading commit data...
escape_struct_param1.go		Loading commit data...
escape_struct_param2.go		Loading commit data...
escape_struct_return.go		Loading commit data...
fibo.go		Loading commit data...
finprofiled.go		Loading commit data...
float_lit.go		Loading commit data...
float_lit2.go		Loading commit data...
float_lit3.go		Loading commit data...
floatcmp.go		Loading commit data...
for.go		Loading commit data...
func.go		Loading commit data...
func1.go		Loading commit data...
func2.go		Loading commit data...
func3.go		Loading commit data...
func4.go		Loading commit data...
func5.go		Loading commit data...
func6.go		Loading commit data...
func7.go		Loading commit data...
func8.go		Loading commit data...
funcdup.go		Loading commit data...
funcdup2.go		Loading commit data...
gc.go		Loading commit data...
gc1.go		Loading commit data...
gc2.go		Loading commit data...
gcstring.go		Loading commit data...
goprint.go		Loading commit data...
goprint.out		Loading commit data...
goto.go		Loading commit data...
heapsampling.go		Loading commit data...
helloworld.go		Loading commit data...
helloworld.out		Loading commit data...
if.go		Loading commit data...
import.go		Loading commit data...
import1.go		Loading commit data...
import2.go		Loading commit data...
import4.go		Loading commit data...
import5.go		Loading commit data...
import6.go		Loading commit data...
index.go		Loading commit data...
index0.go		Loading commit data...
index1.go		Loading commit data...
index2.go		Loading commit data...
indirect.go		Loading commit data...
indirect1.go		Loading commit data...
init.go		Loading commit data...
init1.go		Loading commit data...
initcomma.go		Loading commit data...
initialize.go		Loading commit data...
initializerr.go		Loading commit data...
initloop.go		Loading commit data...
inline.go		Loading commit data...
inline_caller.go		Loading commit data...
inline_callers.go		Loading commit data...
inline_literal.go		Loading commit data...
inline_variadic.go		Loading commit data...
int_lit.go		Loading commit data...
intcvt.go		Loading commit data...
intrinsic.go		Loading commit data...
intrinsic_atomic.go		Loading commit data...
iota.go		Loading commit data...
label.go		Loading commit data...
label1.go		Loading commit data...
linkmain.go		Loading commit data...
linkmain_run.go		Loading commit data...
linkname.go		Loading commit data...
linkobj.go		Loading commit data...
linkx.go		Loading commit data...
linkx_run.go		Loading commit data...
literal.go		Loading commit data...
live.go		Loading commit data...
live1.go		Loading commit data...
live2.go		Loading commit data...
live_syscall.go		Loading commit data...
locklinear.go		Loading commit data...
loopbce.go		Loading commit data...
makechan.go		Loading commit data...
makemap.go		Loading commit data...
makenew.go		Loading commit data...
mallocfin.go		Loading commit data...
map.go		Loading commit data...
map1.go		Loading commit data...
maplinear.go		Loading commit data...
mergemul.go		Loading commit data...
method.go		Loading commit data...
method1.go		Loading commit data...
method2.go		Loading commit data...
method3.go		Loading commit data...
method4.go		Loading commit data...
method5.go		Loading commit data...
method6.go		Loading commit data...
method7.go		Loading commit data...
named.go		Loading commit data...
named1.go		Loading commit data...
nil.go		Loading commit data...
nilcheck.go		Loading commit data...
nilptr.go		Loading commit data...
nilptr2.go		Loading commit data...
nilptr3.go		Loading commit data...
nilptr4.go		Loading commit data...
nosplit.go		Loading commit data...
notinheap.go		Loading commit data...
notinheap2.go		Loading commit data...
notinheap3.go		Loading commit data...
nowritebarrier.go		Loading commit data...
nul1.go		Loading commit data...
opt_branchlikely.go		Loading commit data...
parentype.go		Loading commit data...
peano.go		Loading commit data...
phiopt.go		Loading commit data...
print.go		Loading commit data...
print.out		Loading commit data...
printbig.go		Loading commit data...
printbig.out		Loading commit data...
prove.go		Loading commit data...
range.go		Loading commit data...
recover.go		Loading commit data...
recover1.go		Loading commit data...
recover2.go		Loading commit data...
recover3.go		Loading commit data...
recover4.go		Loading commit data...
recover5.go		Loading commit data...
reflectmethod1.go		Loading commit data...
reflectmethod2.go		Loading commit data...
reflectmethod3.go		Loading commit data...
reflectmethod4.go		Loading commit data...
rename.go		Loading commit data...
rename1.go		Loading commit data...
reorder.go		Loading commit data...
reorder2.go		Loading commit data...
retjmp.go		Loading commit data...
return.go		Loading commit data...
rotate.go		Loading commit data...
rotate0.go		Loading commit data...
rotate1.go		Loading commit data...
rotate2.go		Loading commit data...
rotate3.go		Loading commit data...
run.go		Loading commit data...
rune.go		Loading commit data...
runtime.go		Loading commit data...
shift1.go		Loading commit data...
shift2.go		Loading commit data...
sieve.go		Loading commit data...
sigchld.go		Loading commit data...
sigchld.out		Loading commit data...
simassign.go		Loading commit data...
sinit.go		Loading commit data...
sinit_run.go		Loading commit data...
sizeof.go		Loading commit data...
slice3.go		Loading commit data...
slice3err.go		Loading commit data...
slicecap.go		Loading commit data...
sliceopt.go		Loading commit data...
solitaire.go		Loading commit data...
stack.go		Loading commit data...
strength.go		Loading commit data...
string_lit.go		Loading commit data...
stringrange.go		Loading commit data...
struct0.go		Loading commit data...
switch.go		Loading commit data...
switch2.go		Loading commit data...
switch3.go		Loading commit data...
switch4.go		Loading commit data...
switch5.go		Loading commit data...
switch6.go		Loading commit data...
switch7.go		Loading commit data...
tinyfin.go		Loading commit data...
torture.go		Loading commit data...
turing.go		Loading commit data...
typecheck.go		Loading commit data...
typecheckloop.go		Loading commit data...
typeswitch.go		Loading commit data...
typeswitch1.go		Loading commit data...
typeswitch2.go		Loading commit data...
typeswitch3.go		Loading commit data...
uintptrescapes.go		Loading commit data...
uintptrescapes2.go		Loading commit data...
undef.go		Loading commit data...
utf.go		Loading commit data...
varerr.go		Loading commit data...
varinit.go		Loading commit data...
writebarrier.go		Loading commit data...
zerodivide.go		Loading commit data...

README.md