Add support for FP_ROUND from v2f64 to v2f32

- Due to the current matching vector elements constraints in ISD::FP_ROUND, rounding from v2f64 to v4f32 (after legalization from v2f32) is scalarized. Add a customized v2f32 widening to convert it into a target-specific X86ISD::VFPROUND to work around this constraints. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@165631 91177308-0d34-0410-b5e6-96231b3b80d8
author: Michael Liao <michael.liao@intel.com> 2012-10-10 16:53:28 +0000
committer: Michael Liao <michael.liao@intel.com> 2012-10-10 16:53:28 +0000
commit: 44c2d61b6703469a95fcd2d5397c5d09a67e75c1 (patch)
tree: ded8fbfaa22a59e8aca8944eb2971cd0e0b42565 /test/CodeGen/X86/fp-load-trunc.ll
parent: 9d796db3e746c31dbdb605510c53b3da98d71b38 (diff)
download: llvm-44c2d61b6703469a95fcd2d5397c5d09a67e75c1.tar.gz
llvm-44c2d61b6703469a95fcd2d5397c5d09a67e75c1.tar.bz2
llvm-44c2d61b6703469a95fcd2d5397c5d09a67e75c1.tar.xz
1 files changed, 61 insertions, 0 deletions
diff --git a/test/CodeGen/X86/fp-load-trunc.ll b/test/CodeGen/X86/fp-load-trunc.ll
new file mode 100644
index 0000000000..8430a31b3a
--- /dev/null
+++ b/test/CodeGen/X86/fp-load-trunc.ll
@@ -0,0 +1,61 @@
+; RUN: llc < %s -march=x86 -mattr=+sse2,-avx | FileCheck %s
+; RUN: llc < %s -march=x86 -mattr=+avx | FileCheck %s --check-prefix=AVX
+
+define <1 x float> @test1(<1 x double>* %p) nounwind {
+; CHECK: test1
+; CHECK: cvtsd2ss
+; CHECK: ret
+; AVX:   test1
+; AVX:   vcvtsd2ss
+; AVX:   ret
+  %x = load <1 x double>* %p
+  %y = fptrunc <1 x double> %x to <1 x float>
+  ret <1 x float> %y
+}
+
+define <2 x float> @test2(<2 x double>* %p) nounwind {
+; CHECK: test2
+; CHECK: cvtpd2ps {{[0-9]*}}(%{{.*}})
+; CHECK: ret
+; AVX:   test2
+; AVX:   vcvtpd2psx {{[0-9]*}}(%{{.*}})
+; AVX:   ret
+  %x = load <2 x double>* %p
+  %y = fptrunc <2 x double> %x to <2 x float>
+  ret <2 x float> %y
+}
+
+define <4 x float> @test3(<4 x double>* %p) nounwind {
+; CHECK: test3
+; CHECK: cvtpd2ps {{[0-9]*}}(%{{.*}})
+; CHECK: cvtpd2ps {{[0-9]*}}(%{{.*}})
+; CHECK: movlhps
+; CHECK: ret
+; AVX:   test3
+; AVX:   vcvtpd2psy {{[0-9]*}}(%{{.*}})
+; AVX:   ret
+  %x = load <4 x double>* %p
+  %y = fptrunc <4 x double> %x to <4 x float>
+  ret <4 x float> %y
+}
+
+define <8 x float> @test4(<8 x double>* %p) nounwind {
+; CHECK: test4
+; CHECK: cvtpd2ps {{[0-9]*}}(%{{.*}})
+; CHECK: cvtpd2ps {{[0-9]*}}(%{{.*}})
+; CHECK: movlhps
+; CHECK: cvtpd2ps {{[0-9]*}}(%{{.*}})
+; CHECK: cvtpd2ps {{[0-9]*}}(%{{.*}})
+; CHECK: movlhps
+; CHECK: ret
+; AVX:   test4
+; AVX:   vcvtpd2psy {{[0-9]*}}(%{{.*}})
+; AVX:   vcvtpd2psy {{[0-9]*}}(%{{.*}})
+; AVX:   vinsertf128
+; AVX:   ret
+  %x = load <8 x double>* %p
+  %y = fptrunc <8 x double> %x to <8 x float>
+  ret <8 x float> %y
+}
+
+
author	Michael Liao <michael.liao@intel.com>	2012-10-10 16:53:28 +0000
committer	Michael Liao <michael.liao@intel.com>	2012-10-10 16:53:28 +0000
commit	44c2d61b6703469a95fcd2d5397c5d09a67e75c1 (patch)
tree	ded8fbfaa22a59e8aca8944eb2971cd0e0b42565 /test/CodeGen/X86/fp-load-trunc.ll
parent	9d796db3e746c31dbdb605510c53b3da98d71b38 (diff)
download	llvm-44c2d61b6703469a95fcd2d5397c5d09a67e75c1.tar.gz llvm-44c2d61b6703469a95fcd2d5397c5d09a67e75c1.tar.bz2 llvm-44c2d61b6703469a95fcd2d5397c5d09a67e75c1.tar.xz