Efficient lowering of vector sdiv when the divisor is a splatted power of two constant.

PR 14848. The lowered sequence is based on the existing sequence the target-independent DAG Combiner creates for the scalar case. Patch by Zvi Rackover. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@171953 91177308-0d34-0410-b5e6-96231b3b80d8
author: Nadav Rotem <nrotem@apple.com> 2013-01-09 05:14:33 +0000
committer: Nadav Rotem <nrotem@apple.com> 2013-01-09 05:14:33 +0000
commit: 13f8cf55d43980e73d6cbb8f4894607709daa311 (patch)
tree: b6296d4371bfd77ef95601a23932e4ca8d96b730 /test/CodeGen/X86/vec_sdiv_to_shift.ll
parent: 9cceede447118852df76e340252387d1a2cce37d (diff)
download: llvm-13f8cf55d43980e73d6cbb8f4894607709daa311.tar.gz
llvm-13f8cf55d43980e73d6cbb8f4894607709daa311.tar.bz2
llvm-13f8cf55d43980e73d6cbb8f4894607709daa311.tar.xz
1 files changed, 72 insertions, 0 deletions
diff --git a/test/CodeGen/X86/vec_sdiv_to_shift.ll b/test/CodeGen/X86/vec_sdiv_to_shift.ll
new file mode 100644
index 0000000000..693463b837
--- /dev/null
+++ b/test/CodeGen/X86/vec_sdiv_to_shift.ll
@@ -0,0 +1,72 @@
+; RUN: llc < %s -mcpu=penryn -mattr=+avx2 | FileCheck %s
+
+
+define <8 x i16> @sdiv_vec8x16(<8 x i16> %var) {
+entry:
+; CHECK: sdiv_vec8x16
+; CHECK: psraw  $15
+; CHECK: vpsrlw  $11
+; CHECK: vpaddw
+; CHECK: vpsraw  $5
+; CHECK: ret
+  %0 = sdiv <8 x i16> %var, <i16 32, i16 32, i16 32, i16 32, i16 32, i16 32, i16 32, i16 32>
+  ret <8 x i16> %0
+}
+
+define <4 x i32> @sdiv_zero(<4 x i32> %var) {
+entry:
+; CHECK: sdiv_zero
+; CHECK-NOT sra
+; CHECK: ret
+  %0 = sdiv <4 x i32> %var, <i32 0, i32 0, i32 0, i32 0>
+  ret <4 x i32> %0
+}
+
+define <4 x i32> @sdiv_vec4x32(<4 x i32> %var) {
+entry:
+; CHECK: sdiv_vec4x32
+; CHECK: vpsrad $31
+; CHECK: vpsrld $28
+; CHECK: vpaddd
+; CHECK: vpsrad $4
+; CHECK: ret
+%0 = sdiv <4 x i32> %var, <i32 16, i32 16, i32 16, i32 16>
+ret <4 x i32> %0
+}
+
+define <4 x i32> @sdiv_negative(<4 x i32> %var) {
+entry:
+; CHECK: sdiv_negative
+; CHECK: vpsrad $31
+; CHECK: vpsrld $28
+; CHECK: vpaddd
+; CHECK: vpsrad $4
+; CHECK: vpsubd
+; CHECK: ret
+%0 = sdiv <4 x i32> %var, <i32 -16, i32 -16, i32 -16, i32 -16>
+ret <4 x i32> %0
+}
+
+define <8 x i32> @sdiv8x32(<8 x i32> %var) {
+entry:
+; CHECK: sdiv8x32
+; CHECK: vpsrad $31
+; CHECK: vpsrld $26
+; CHECK: vpaddd
+; CHECK: vpsrad $6
+; CHECK: ret
+%0 = sdiv <8 x i32> %var, <i32 64, i32 64, i32 64, i32 64, i32 64, i32 64, i32 64, i32 64>
+ret <8 x i32> %0
+}
+
+define <16 x i16> @sdiv16x16(<16 x i16> %var) {
+entry:
+; CHECK: sdiv16x16
+; CHECK: vpsraw  $15
+; CHECK: vpsrlw  $14
+; CHECK: vpaddw
+; CHECK: vpsraw  $2
+; CHECK: ret
+  %a0 = sdiv <16 x i16> %var, <i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4, i16 4>
+  ret <16 x i16> %a0
+}
author	Nadav Rotem <nrotem@apple.com>	2013-01-09 05:14:33 +0000
committer	Nadav Rotem <nrotem@apple.com>	2013-01-09 05:14:33 +0000
commit	13f8cf55d43980e73d6cbb8f4894607709daa311 (patch)
tree	b6296d4371bfd77ef95601a23932e4ca8d96b730 /test/CodeGen/X86/vec_sdiv_to_shift.ll
parent	9cceede447118852df76e340252387d1a2cce37d (diff)
download	llvm-13f8cf55d43980e73d6cbb8f4894607709daa311.tar.gz llvm-13f8cf55d43980e73d6cbb8f4894607709daa311.tar.bz2 llvm-13f8cf55d43980e73d6cbb8f4894607709daa311.tar.xz