AVX-512: fixed shuffle lowering

in case of BLEND and added VSHUFPS patterns. git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@192055 91177308-0d34-0410-b5e6-96231b3b80d8
author: Elena Demikhovsky <elena.demikhovsky@intel.com> 2013-10-06 06:11:18 +0000
committer: Elena Demikhovsky <elena.demikhovsky@intel.com> 2013-10-06 06:11:18 +0000
commit: a6269ee5fbb6e1237648a47d31f96ba3b4a1bb54 (patch)
tree: 64e73f4e2bd4ff751b43e484b003b96fd2b5e628 /lib
parent: 20b10abf4e88ca532810fbf749b029ce582d6793 (diff)
download: llvm-a6269ee5fbb6e1237648a47d31f96ba3b4a1bb54.tar.gz
llvm-a6269ee5fbb6e1237648a47d31f96ba3b4a1bb54.tar.bz2
llvm-a6269ee5fbb6e1237648a47d31f96ba3b4a1bb54.tar.xz
2 files changed, 15 insertions, 1 deletions
diff --git a/lib/Target/X86/X86ISelLowering.cpp b/lib/Target/X86/X86ISelLowering.cpp
index 5178cad005..7222754fbe 100644
--- a/lib/Target/X86/X86ISelLowering.cpp
+++ b/lib/Target/X86/X86ISelLowering.cpp
@@ -6139,6 +6139,10 @@ LowerVECTOR_SHUFFLEtoBlend(ShuffleVectorSDNode *SVOp,
   MVT EltVT = VT.getVectorElementType();
   unsigned NumElems = VT.getVectorNumElements();
 
+  // There is no blend with immediate in AVX-512.
+  if (VT.is512BitVector())
+    return SDValue();
+
   if (!Subtarget->hasSSE41() || EltVT == MVT::i8)
     return SDValue();
   if (!Subtarget->hasInt256() && VT == MVT::v16i16)
diff --git a/lib/Target/X86/X86InstrAVX512.td b/lib/Target/X86/X86InstrAVX512.td
index 3990e45ff9..e87fbcade4 100644
--- a/lib/Target/X86/X86InstrAVX512.td
+++ b/lib/Target/X86/X86InstrAVX512.td
@@ -618,7 +618,6 @@ defm VPBLENDMQZ : avx512_blendmask<0x64, "vpblendmq", VK8WM, VR512, f512mem,
                                 memopv8i64, vselect, v8i64>, VEX_W, 
                                 EVEX_CD8<64, CD8VF>, EVEX_V512;
 
-
 let Predicates = [HasAVX512] in {
 def : Pat<(v8f32 (vselect (v8i1 VK8WM:$mask), (v8f32 VR256X:$src1),
                             (v8f32 VR256X:$src2))),
@@ -3029,6 +3028,17 @@ defm VSHUFPSZ  : avx512_shufp<VR512, f512mem, v16f32, "vshufps", memopv16f32,
 defm VSHUFPDZ  : avx512_shufp<VR512, f512mem, v8f64, "vshufpd", memopv8f64,
                   SSEPackedDouble>, OpSize, VEX_W, EVEX_V512, EVEX_CD8<64, CD8VF>;
 
+def : Pat<(v16i32 (X86Shufp VR512:$src1, VR512:$src2, (i8 imm:$imm))),
+          (VSHUFPSZrri VR512:$src1, VR512:$src2, imm:$imm)>;
+def : Pat<(v16i32 (X86Shufp VR512:$src1,
+                    (memopv16i32 addr:$src2), (i8 imm:$imm))),
+          (VSHUFPSZrmi VR512:$src1, addr:$src2, imm:$imm)>;
+
+def : Pat<(v8i64 (X86Shufp VR512:$src1, VR512:$src2, (i8 imm:$imm))),
+          (VSHUFPDZrri VR512:$src1, VR512:$src2, imm:$imm)>;
+def : Pat<(v8i64 (X86Shufp VR512:$src1,
+                            (memopv8i64 addr:$src2), (i8 imm:$imm))),
+          (VSHUFPDZrmi VR512:$src1, addr:$src2, imm:$imm)>;
 
 multiclass avx512_alignr<string OpcodeStr, RegisterClass RC,
                        X86MemOperand x86memop> {
author	Elena Demikhovsky <elena.demikhovsky@intel.com>	2013-10-06 06:11:18 +0000
committer	Elena Demikhovsky <elena.demikhovsky@intel.com>	2013-10-06 06:11:18 +0000
commit	a6269ee5fbb6e1237648a47d31f96ba3b4a1bb54 (patch)
tree	64e73f4e2bd4ff751b43e484b003b96fd2b5e628 /lib
parent	20b10abf4e88ca532810fbf749b029ce582d6793 (diff)
download	llvm-a6269ee5fbb6e1237648a47d31f96ba3b4a1bb54.tar.gz llvm-a6269ee5fbb6e1237648a47d31f96ba3b4a1bb54.tar.bz2 llvm-a6269ee5fbb6e1237648a47d31f96ba3b4a1bb54.tar.xz