summaryrefslogtreecommitdiff
diff options
context:
space:
mode:
authorCraig Topper <craig.topper@gmail.com>2016-06-25 07:31:14 +0000
committerCraig Topper <craig.topper@gmail.com>2016-06-25 07:31:14 +0000
commit2a5a1ee012d3bb04365fca242d734c405934edbb (patch)
treeba2edbfd5ca2e5023a197ae3c3655a99b53ebad4
parent8aece08aec99a939e4329ca268b0077ba04ffbd5 (diff)
[X86] Fix pslldq/psrldq intrinsics to not fail compilation with immediates larger than 16. This was accidentally broken in r272246.
git-svn-id: https://llvm.org/svn/llvm-project/cfe/trunk@273775 91177308-0d34-0410-b5e6-96231b3b80d8
-rw-r--r--lib/Headers/avx2intrin.h142
-rw-r--r--lib/Headers/avx512bwintrin.h270
-rw-r--r--lib/Headers/emmintrin.h82
-rw-r--r--test/CodeGen/sse2-builtins.c12
4 files changed, 256 insertions, 250 deletions
diff --git a/lib/Headers/avx2intrin.h b/lib/Headers/avx2intrin.h
index fbca5df7db..f66c0f3100 100644
--- a/lib/Headers/avx2intrin.h
+++ b/lib/Headers/avx2intrin.h
@@ -552,42 +552,41 @@ _mm256_sign_epi32(__m256i __a, __m256i __b)
}
#define _mm256_slli_si256(a, imm) __extension__ ({ \
- ((char)(imm)&0xF0) ? _mm256_setzero_si256() : \
- (__m256i)__builtin_shufflevector( \
- (__v32qi)_mm256_setzero_si256(), \
- (__v32qi)(__m256i)(a), \
- ((char)(imm)>0x0 ? 16 : 32) - (char)(imm), \
- ((char)(imm)>0x1 ? 17 : 33) - (char)(imm), \
- ((char)(imm)>0x2 ? 18 : 34) - (char)(imm), \
- ((char)(imm)>0x3 ? 19 : 35) - (char)(imm), \
- ((char)(imm)>0x4 ? 20 : 36) - (char)(imm), \
- ((char)(imm)>0x5 ? 21 : 37) - (char)(imm), \
- ((char)(imm)>0x6 ? 22 : 38) - (char)(imm), \
- ((char)(imm)>0x7 ? 23 : 39) - (char)(imm), \
- ((char)(imm)>0x8 ? 24 : 40) - (char)(imm), \
- ((char)(imm)>0x9 ? 25 : 41) - (char)(imm), \
- ((char)(imm)>0xA ? 26 : 42) - (char)(imm), \
- ((char)(imm)>0xB ? 27 : 43) - (char)(imm), \
- ((char)(imm)>0xC ? 28 : 44) - (char)(imm), \
- ((char)(imm)>0xD ? 29 : 45) - (char)(imm), \
- ((char)(imm)>0xE ? 30 : 46) - (char)(imm), \
- ((char)(imm)>0xF ? 31 : 47) - (char)(imm), \
- ((char)(imm)>0x0 ? 32 : 48) - (char)(imm), \
- ((char)(imm)>0x1 ? 33 : 49) - (char)(imm), \
- ((char)(imm)>0x2 ? 34 : 50) - (char)(imm), \
- ((char)(imm)>0x3 ? 35 : 51) - (char)(imm), \
- ((char)(imm)>0x4 ? 36 : 52) - (char)(imm), \
- ((char)(imm)>0x5 ? 37 : 53) - (char)(imm), \
- ((char)(imm)>0x6 ? 38 : 54) - (char)(imm), \
- ((char)(imm)>0x7 ? 39 : 55) - (char)(imm), \
- ((char)(imm)>0x8 ? 40 : 56) - (char)(imm), \
- ((char)(imm)>0x9 ? 41 : 57) - (char)(imm), \
- ((char)(imm)>0xA ? 42 : 58) - (char)(imm), \
- ((char)(imm)>0xB ? 43 : 59) - (char)(imm), \
- ((char)(imm)>0xC ? 44 : 60) - (char)(imm), \
- ((char)(imm)>0xD ? 45 : 61) - (char)(imm), \
- ((char)(imm)>0xE ? 46 : 62) - (char)(imm), \
- ((char)(imm)>0xF ? 47 : 63) - (char)(imm)); })
+ (__m256i)__builtin_shufflevector( \
+ (__v32qi)_mm256_setzero_si256(), \
+ (__v32qi)(__m256i)(a), \
+ ((char)(imm)&0xF0) ? 0 : ((char)(imm)>0x0 ? 16 : 32) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 1 : ((char)(imm)>0x1 ? 17 : 33) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 2 : ((char)(imm)>0x2 ? 18 : 34) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 3 : ((char)(imm)>0x3 ? 19 : 35) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 4 : ((char)(imm)>0x4 ? 20 : 36) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 5 : ((char)(imm)>0x5 ? 21 : 37) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 6 : ((char)(imm)>0x6 ? 22 : 38) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 7 : ((char)(imm)>0x7 ? 23 : 39) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 8 : ((char)(imm)>0x8 ? 24 : 40) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 9 : ((char)(imm)>0x9 ? 25 : 41) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 10 : ((char)(imm)>0xA ? 26 : 42) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 11 : ((char)(imm)>0xB ? 27 : 43) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 12 : ((char)(imm)>0xC ? 28 : 44) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 13 : ((char)(imm)>0xD ? 29 : 45) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 14 : ((char)(imm)>0xE ? 30 : 46) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 15 : ((char)(imm)>0xF ? 31 : 47) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 16 : ((char)(imm)>0x0 ? 32 : 48) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 17 : ((char)(imm)>0x1 ? 33 : 49) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 18 : ((char)(imm)>0x2 ? 34 : 50) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 19 : ((char)(imm)>0x3 ? 35 : 51) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 20 : ((char)(imm)>0x4 ? 36 : 52) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 21 : ((char)(imm)>0x5 ? 37 : 53) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 22 : ((char)(imm)>0x6 ? 38 : 54) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 23 : ((char)(imm)>0x7 ? 39 : 55) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 24 : ((char)(imm)>0x8 ? 40 : 56) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 25 : ((char)(imm)>0x9 ? 41 : 57) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 26 : ((char)(imm)>0xA ? 42 : 58) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 27 : ((char)(imm)>0xB ? 43 : 59) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 28 : ((char)(imm)>0xC ? 44 : 60) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 29 : ((char)(imm)>0xD ? 45 : 61) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 30 : ((char)(imm)>0xE ? 46 : 62) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 31 : ((char)(imm)>0xF ? 47 : 63) - (char)(imm)); })
#define _mm256_bslli_epi128(a, count) _mm256_slli_si256((a), (count))
@@ -652,42 +651,41 @@ _mm256_sra_epi32(__m256i __a, __m128i __count)
}
#define _mm256_srli_si256(a, imm) __extension__ ({ \
- ((char)(imm)&0xF0) ? _mm256_setzero_si256() : \
- (__m256i)__builtin_shufflevector( \
- (__v32qi)(__m256i)(a), \
- (__v32qi)_mm256_setzero_si256(), \
- (char)(imm) + ((char)(imm)>0xF ? 16 : 0), \
- (char)(imm) + ((char)(imm)>0xE ? 17 : 1), \
- (char)(imm) + ((char)(imm)>0xD ? 18 : 2), \
- (char)(imm) + ((char)(imm)>0xC ? 19 : 3), \
- (char)(imm) + ((char)(imm)>0xB ? 20 : 4), \
- (char)(imm) + ((char)(imm)>0xA ? 21 : 5), \
- (char)(imm) + ((char)(imm)>0x9 ? 22 : 6), \
- (char)(imm) + ((char)(imm)>0x8 ? 23 : 7), \
- (char)(imm) + ((char)(imm)>0x7 ? 24 : 8), \
- (char)(imm) + ((char)(imm)>0x6 ? 25 : 9), \
- (char)(imm) + ((char)(imm)>0x5 ? 26 : 10), \
- (char)(imm) + ((char)(imm)>0x4 ? 27 : 11), \
- (char)(imm) + ((char)(imm)>0x3 ? 28 : 12), \
- (char)(imm) + ((char)(imm)>0x2 ? 29 : 13), \
- (char)(imm) + ((char)(imm)>0x1 ? 30 : 14), \
- (char)(imm) + ((char)(imm)>0x0 ? 31 : 15), \
- (char)(imm) + ((char)(imm)>0xF ? 32 : 16), \
- (char)(imm) + ((char)(imm)>0xE ? 33 : 17), \
- (char)(imm) + ((char)(imm)>0xD ? 34 : 18), \
- (char)(imm) + ((char)(imm)>0xC ? 35 : 19), \
- (char)(imm) + ((char)(imm)>0xB ? 36 : 20), \
- (char)(imm) + ((char)(imm)>0xA ? 37 : 21), \
- (char)(imm) + ((char)(imm)>0x9 ? 38 : 22), \
- (char)(imm) + ((char)(imm)>0x8 ? 39 : 23), \
- (char)(imm) + ((char)(imm)>0x7 ? 40 : 24), \
- (char)(imm) + ((char)(imm)>0x6 ? 41 : 25), \
- (char)(imm) + ((char)(imm)>0x5 ? 42 : 26), \
- (char)(imm) + ((char)(imm)>0x4 ? 43 : 27), \
- (char)(imm) + ((char)(imm)>0x3 ? 44 : 28), \
- (char)(imm) + ((char)(imm)>0x2 ? 45 : 29), \
- (char)(imm) + ((char)(imm)>0x1 ? 46 : 30), \
- (char)(imm) + ((char)(imm)>0x0 ? 47 : 31)); })
+ (__m256i)__builtin_shufflevector( \
+ (__v32qi)(__m256i)(a), \
+ (__v32qi)_mm256_setzero_si256(), \
+ ((char)(imm)&0xF0) ? 32 : (char)(imm) + ((char)(imm)>0xF ? 16 : 0), \
+ ((char)(imm)&0xF0) ? 33 : (char)(imm) + ((char)(imm)>0xE ? 17 : 1), \
+ ((char)(imm)&0xF0) ? 34 : (char)(imm) + ((char)(imm)>0xD ? 18 : 2), \
+ ((char)(imm)&0xF0) ? 35 : (char)(imm) + ((char)(imm)>0xC ? 19 : 3), \
+ ((char)(imm)&0xF0) ? 36 : (char)(imm) + ((char)(imm)>0xB ? 20 : 4), \
+ ((char)(imm)&0xF0) ? 37 : (char)(imm) + ((char)(imm)>0xA ? 21 : 5), \
+ ((char)(imm)&0xF0) ? 38 : (char)(imm) + ((char)(imm)>0x9 ? 22 : 6), \
+ ((char)(imm)&0xF0) ? 39 : (char)(imm) + ((char)(imm)>0x8 ? 23 : 7), \
+ ((char)(imm)&0xF0) ? 40 : (char)(imm) + ((char)(imm)>0x7 ? 24 : 8), \
+ ((char)(imm)&0xF0) ? 41 : (char)(imm) + ((char)(imm)>0x6 ? 25 : 9), \
+ ((char)(imm)&0xF0) ? 42 : (char)(imm) + ((char)(imm)>0x5 ? 26 : 10), \
+ ((char)(imm)&0xF0) ? 43 : (char)(imm) + ((char)(imm)>0x4 ? 27 : 11), \
+ ((char)(imm)&0xF0) ? 44 : (char)(imm) + ((char)(imm)>0x3 ? 28 : 12), \
+ ((char)(imm)&0xF0) ? 45 : (char)(imm) + ((char)(imm)>0x2 ? 29 : 13), \
+ ((char)(imm)&0xF0) ? 46 : (char)(imm) + ((char)(imm)>0x1 ? 30 : 14), \
+ ((char)(imm)&0xF0) ? 47 : (char)(imm) + ((char)(imm)>0x0 ? 31 : 15), \
+ ((char)(imm)&0xF0) ? 48 : (char)(imm) + ((char)(imm)>0xF ? 32 : 16), \
+ ((char)(imm)&0xF0) ? 49 : (char)(imm) + ((char)(imm)>0xE ? 33 : 17), \
+ ((char)(imm)&0xF0) ? 50 : (char)(imm) + ((char)(imm)>0xD ? 34 : 18), \
+ ((char)(imm)&0xF0) ? 51 : (char)(imm) + ((char)(imm)>0xC ? 35 : 19), \
+ ((char)(imm)&0xF0) ? 52 : (char)(imm) + ((char)(imm)>0xB ? 36 : 20), \
+ ((char)(imm)&0xF0) ? 53 : (char)(imm) + ((char)(imm)>0xA ? 37 : 21), \
+ ((char)(imm)&0xF0) ? 54 : (char)(imm) + ((char)(imm)>0x9 ? 38 : 22), \
+ ((char)(imm)&0xF0) ? 55 : (char)(imm) + ((char)(imm)>0x8 ? 39 : 23), \
+ ((char)(imm)&0xF0) ? 56 : (char)(imm) + ((char)(imm)>0x7 ? 40 : 24), \
+ ((char)(imm)&0xF0) ? 57 : (char)(imm) + ((char)(imm)>0x6 ? 41 : 25), \
+ ((char)(imm)&0xF0) ? 58 : (char)(imm) + ((char)(imm)>0x5 ? 42 : 26), \
+ ((char)(imm)&0xF0) ? 59 : (char)(imm) + ((char)(imm)>0x4 ? 43 : 27), \
+ ((char)(imm)&0xF0) ? 60 : (char)(imm) + ((char)(imm)>0x3 ? 44 : 28), \
+ ((char)(imm)&0xF0) ? 61 : (char)(imm) + ((char)(imm)>0x2 ? 45 : 29), \
+ ((char)(imm)&0xF0) ? 62 : (char)(imm) + ((char)(imm)>0x1 ? 46 : 30), \
+ ((char)(imm)&0xF0) ? 63 : (char)(imm) + ((char)(imm)>0x0 ? 47 : 31)); })
#define _mm256_bsrli_epi128(a, count) _mm256_srli_si256((a), (count))
diff --git a/lib/Headers/avx512bwintrin.h b/lib/Headers/avx512bwintrin.h
index e616534738..f29305aedf 100644
--- a/lib/Headers/avx512bwintrin.h
+++ b/lib/Headers/avx512bwintrin.h
@@ -1761,74 +1761,73 @@ _mm512_maskz_sll_epi16 (__mmask32 __U, __m512i __A, __m128i __B)
(__mmask32)(U)); })
#define _mm512_bslli_epi128(a, imm) __extension__ ({ \
- ((char)(imm)&0xF0) ? _mm512_setzero_si512() : \
- (__m512i)__builtin_shufflevector( \
- (__v64qi)_mm512_setzero_si512(), \
- (__v64qi)(__m512i)(a), \
- ((char)(imm)>0x0 ? 16 : 64) - (char)(imm), \
- ((char)(imm)>0x1 ? 17 : 65) - (char)(imm), \
- ((char)(imm)>0x2 ? 18 : 66) - (char)(imm), \
- ((char)(imm)>0x3 ? 19 : 67) - (char)(imm), \
- ((char)(imm)>0x4 ? 20 : 68) - (char)(imm), \
- ((char)(imm)>0x5 ? 21 : 69) - (char)(imm), \
- ((char)(imm)>0x6 ? 22 : 70) - (char)(imm), \
- ((char)(imm)>0x7 ? 23 : 71) - (char)(imm), \
- ((char)(imm)>0x8 ? 24 : 72) - (char)(imm), \
- ((char)(imm)>0x9 ? 25 : 73) - (char)(imm), \
- ((char)(imm)>0xA ? 26 : 74) - (char)(imm), \
- ((char)(imm)>0xB ? 27 : 75) - (char)(imm), \
- ((char)(imm)>0xC ? 28 : 76) - (char)(imm), \
- ((char)(imm)>0xD ? 29 : 77) - (char)(imm), \
- ((char)(imm)>0xE ? 30 : 78) - (char)(imm), \
- ((char)(imm)>0xF ? 31 : 79) - (char)(imm), \
- ((char)(imm)>0x0 ? 32 : 80) - (char)(imm), \
- ((char)(imm)>0x1 ? 33 : 81) - (char)(imm), \
- ((char)(imm)>0x2 ? 34 : 82) - (char)(imm), \
- ((char)(imm)>0x3 ? 35 : 83) - (char)(imm), \
- ((char)(imm)>0x4 ? 36 : 84) - (char)(imm), \
- ((char)(imm)>0x5 ? 37 : 85) - (char)(imm), \
- ((char)(imm)>0x6 ? 38 : 86) - (char)(imm), \
- ((char)(imm)>0x7 ? 39 : 87) - (char)(imm), \
- ((char)(imm)>0x8 ? 40 : 88) - (char)(imm), \
- ((char)(imm)>0x9 ? 41 : 89) - (char)(imm), \
- ((char)(imm)>0xA ? 42 : 90) - (char)(imm), \
- ((char)(imm)>0xB ? 43 : 91) - (char)(imm), \
- ((char)(imm)>0xC ? 44 : 92) - (char)(imm), \
- ((char)(imm)>0xD ? 45 : 93) - (char)(imm), \
- ((char)(imm)>0xE ? 46 : 94) - (char)(imm), \
- ((char)(imm)>0xF ? 47 : 95) - (char)(imm), \
- ((char)(imm)>0x0 ? 48 : 96) - (char)(imm), \
- ((char)(imm)>0x1 ? 49 : 97) - (char)(imm), \
- ((char)(imm)>0x2 ? 50 : 98) - (char)(imm), \
- ((char)(imm)>0x3 ? 51 : 99) - (char)(imm), \
- ((char)(imm)>0x4 ? 52 : 100) - (char)(imm), \
- ((char)(imm)>0x5 ? 53 : 101) - (char)(imm), \
- ((char)(imm)>0x6 ? 54 : 102) - (char)(imm), \
- ((char)(imm)>0x7 ? 55 : 103) - (char)(imm), \
- ((char)(imm)>0x8 ? 56 : 104) - (char)(imm), \
- ((char)(imm)>0x9 ? 57 : 105) - (char)(imm), \
- ((char)(imm)>0xA ? 58 : 106) - (char)(imm), \
- ((char)(imm)>0xB ? 59 : 107) - (char)(imm), \
- ((char)(imm)>0xC ? 60 : 108) - (char)(imm), \
- ((char)(imm)>0xD ? 61 : 109) - (char)(imm), \
- ((char)(imm)>0xE ? 62 : 110) - (char)(imm), \
- ((char)(imm)>0xF ? 63 : 111) - (char)(imm), \
- ((char)(imm)>0x0 ? 64 : 112) - (char)(imm), \
- ((char)(imm)>0x1 ? 65 : 113) - (char)(imm), \
- ((char)(imm)>0x2 ? 66 : 114) - (char)(imm), \
- ((char)(imm)>0x3 ? 67 : 115) - (char)(imm), \
- ((char)(imm)>0x4 ? 68 : 116) - (char)(imm), \
- ((char)(imm)>0x5 ? 69 : 117) - (char)(imm), \
- ((char)(imm)>0x6 ? 70 : 118) - (char)(imm), \
- ((char)(imm)>0x7 ? 71 : 119) - (char)(imm), \
- ((char)(imm)>0x8 ? 72 : 120) - (char)(imm), \
- ((char)(imm)>0x9 ? 73 : 121) - (char)(imm), \
- ((char)(imm)>0xA ? 74 : 122) - (char)(imm), \
- ((char)(imm)>0xB ? 75 : 123) - (char)(imm), \
- ((char)(imm)>0xC ? 76 : 124) - (char)(imm), \
- ((char)(imm)>0xD ? 77 : 125) - (char)(imm), \
- ((char)(imm)>0xE ? 78 : 126) - (char)(imm), \
- ((char)(imm)>0xF ? 79 : 127) - (char)(imm)); })
+ (__m512i)__builtin_shufflevector( \
+ (__v64qi)_mm512_setzero_si512(), \
+ (__v64qi)(__m512i)(a), \
+ ((char)(imm)&0xF0) ? 0 : ((char)(imm)>0x0 ? 16 : 64) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 1 : ((char)(imm)>0x1 ? 17 : 65) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 2 : ((char)(imm)>0x2 ? 18 : 66) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 3 : ((char)(imm)>0x3 ? 19 : 67) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 4 : ((char)(imm)>0x4 ? 20 : 68) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 5 : ((char)(imm)>0x5 ? 21 : 69) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 6 : ((char)(imm)>0x6 ? 22 : 70) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 7 : ((char)(imm)>0x7 ? 23 : 71) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 8 : ((char)(imm)>0x8 ? 24 : 72) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 9 : ((char)(imm)>0x9 ? 25 : 73) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 10 : ((char)(imm)>0xA ? 26 : 74) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 11 : ((char)(imm)>0xB ? 27 : 75) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 12 : ((char)(imm)>0xC ? 28 : 76) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 13 : ((char)(imm)>0xD ? 29 : 77) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 14 : ((char)(imm)>0xE ? 30 : 78) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 15 : ((char)(imm)>0xF ? 31 : 79) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 16 : ((char)(imm)>0x0 ? 32 : 80) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 17 : ((char)(imm)>0x1 ? 33 : 81) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 18 : ((char)(imm)>0x2 ? 34 : 82) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 19 : ((char)(imm)>0x3 ? 35 : 83) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 20 : ((char)(imm)>0x4 ? 36 : 84) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 21 : ((char)(imm)>0x5 ? 37 : 85) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 22 : ((char)(imm)>0x6 ? 38 : 86) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 23 : ((char)(imm)>0x7 ? 39 : 87) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 24 : ((char)(imm)>0x8 ? 40 : 88) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 25 : ((char)(imm)>0x9 ? 41 : 89) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 26 : ((char)(imm)>0xA ? 42 : 90) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 27 : ((char)(imm)>0xB ? 43 : 91) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 28 : ((char)(imm)>0xC ? 44 : 92) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 29 : ((char)(imm)>0xD ? 45 : 93) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 30 : ((char)(imm)>0xE ? 46 : 94) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 31 : ((char)(imm)>0xF ? 47 : 95) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 32 : ((char)(imm)>0x0 ? 48 : 96) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 33 : ((char)(imm)>0x1 ? 49 : 97) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 34 : ((char)(imm)>0x2 ? 50 : 98) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 35 : ((char)(imm)>0x3 ? 51 : 99) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 36 : ((char)(imm)>0x4 ? 52 : 100) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 37 : ((char)(imm)>0x5 ? 53 : 101) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 38 : ((char)(imm)>0x6 ? 54 : 102) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 39 : ((char)(imm)>0x7 ? 55 : 103) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 40 : ((char)(imm)>0x8 ? 56 : 104) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 41 : ((char)(imm)>0x9 ? 57 : 105) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 42 : ((char)(imm)>0xA ? 58 : 106) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 43 : ((char)(imm)>0xB ? 59 : 107) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 44 : ((char)(imm)>0xC ? 60 : 108) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 45 : ((char)(imm)>0xD ? 61 : 109) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 46 : ((char)(imm)>0xE ? 62 : 110) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 47 : ((char)(imm)>0xF ? 63 : 111) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 48 : ((char)(imm)>0x0 ? 64 : 112) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 49 : ((char)(imm)>0x1 ? 65 : 113) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 50 : ((char)(imm)>0x2 ? 66 : 114) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 51 : ((char)(imm)>0x3 ? 67 : 115) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 52 : ((char)(imm)>0x4 ? 68 : 116) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 53 : ((char)(imm)>0x5 ? 69 : 117) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 54 : ((char)(imm)>0x6 ? 70 : 118) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 55 : ((char)(imm)>0x7 ? 71 : 119) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 56 : ((char)(imm)>0x8 ? 72 : 120) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 57 : ((char)(imm)>0x9 ? 73 : 121) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 58 : ((char)(imm)>0xA ? 74 : 122) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 59 : ((char)(imm)>0xB ? 75 : 123) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 60 : ((char)(imm)>0xC ? 76 : 124) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 61 : ((char)(imm)>0xD ? 77 : 125) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 62 : ((char)(imm)>0xE ? 78 : 126) - (char)(imm), \
+ ((char)(imm)&0xF0) ? 63 : ((char)(imm)>0xF ? 79 : 127) - (char)(imm)); })
static __inline__ __m512i __DEFAULT_FN_ATTRS
_mm512_srlv_epi16 (__m512i __A, __m512i __B)
@@ -1982,74 +1981,73 @@ _mm512_maskz_srl_epi16 (__mmask32 __U, __m512i __A, __m128i __B)
(__mmask32)(U)); })
#define _mm512_bsrli_epi128(a, imm) __extension__ ({ \
- ((char)(imm)&0xF0) ? _mm512_setzero_si512() : \
- (__m512i)__builtin_shufflevector( \
- (__v64qi)(__m512i)(a), \
- (__v64qi)_mm512_setzero_si512(), \
- (char)(imm) + ((char)(imm)>0xF ? 48 : 0), \
- (char)(imm) + ((char)(imm)>0xE ? 49 : 1), \
- (char)(imm) + ((char)(imm)>0xD ? 50 : 2), \
- (char)(imm) + ((char)(imm)>0xC ? 51 : 3), \
- (char)(imm) + ((char)(imm)>0xB ? 52 : 4), \
- (char)(imm) + ((char)(imm)>0xA ? 53 : 5), \
- (char)(imm) + ((char)(imm)>0x9 ? 54 : 6), \
- (char)(imm) + ((char)(imm)>0x8 ? 55 : 7), \
- (char)(imm) + ((char)(imm)>0x7 ? 56 : 8), \
- (char)(imm) + ((char)(imm)>0x6 ? 57 : 9), \
- (char)(imm) + ((char)(imm)>0x5 ? 58 : 10), \
- (char)(imm) + ((char)(imm)>0x4 ? 59 : 11), \
- (char)(imm) + ((char)(imm)>0x3 ? 60 : 12), \
- (char)(imm) + ((char)(imm)>0x2 ? 61 : 13), \
- (char)(imm) + ((char)(imm)>0x1 ? 62 : 14), \
- (char)(imm) + ((char)(imm)>0x0 ? 63 : 15), \
- (char)(imm) + ((char)(imm)>0xF ? 64 : 16), \
- (char)(imm) + ((char)(imm)>0xE ? 65 : 17), \
- (char)(imm) + ((char)(imm)>0xD ? 66 : 18), \
- (char)(imm) + ((char)(imm)>0xC ? 67 : 19), \
- (char)(imm) + ((char)(imm)>0xB ? 68 : 20), \
- (char)(imm) + ((char)(imm)>0xA ? 69 : 21), \
- (char)(imm) + ((char)(imm)>0x9 ? 70 : 22), \
- (char)(imm) + ((char)(imm)>0x8 ? 71 : 23), \
- (char)(imm) + ((char)(imm)>0x7 ? 72 : 24), \
- (char)(imm) + ((char)(imm)>0x6 ? 73 : 25), \
- (char)(imm) + ((char)(imm)>0x5 ? 74 : 26), \
- (char)(imm) + ((char)(imm)>0x4 ? 75 : 27), \
- (char)(imm) + ((char)(imm)>0x3 ? 76 : 28), \
- (char)(imm) + ((char)(imm)>0x2 ? 77 : 29), \
- (char)(imm) + ((char)(imm)>0x1 ? 78 : 30), \
- (char)(imm) + ((char)(imm)>0x0 ? 79 : 31), \
- (char)(imm) + ((char)(imm)>0xF ? 80 : 32), \
- (char)(imm) + ((char)(imm)>0xE ? 81 : 33), \
- (char)(imm) + ((char)(imm)>0xD ? 82 : 34), \
- (char)(imm) + ((char)(imm)>0xC ? 83 : 35), \
- (char)(imm) + ((char)(imm)>0xB ? 84 : 36), \
- (char)(imm) + ((char)(imm)>0xA ? 85 : 37), \
- (char)(imm) + ((char)(imm)>0x9 ? 86 : 38), \
- (char)(imm) + ((char)(imm)>0x8 ? 87 : 39), \
- (char)(imm) + ((char)(imm)>0x7 ? 88 : 40), \
- (char)(imm) + ((char)(imm)>0x6 ? 89 : 41), \
- (char)(imm) + ((char)(imm)>0x5 ? 90 : 42), \
- (char)(imm) + ((char)(imm)>0x4 ? 91 : 43), \
- (char)(imm) + ((char)(imm)>0x3 ? 92 : 44), \
- (char)(imm) + ((char)(imm)>0x2 ? 93 : 45), \
- (char)(imm) + ((char)(imm)>0x1 ? 94 : 46), \
- (char)(imm) + ((char)(imm)>0x0 ? 95 : 47), \
- (char)(imm) + ((char)(imm)>0xF ? 96 : 48), \
- (char)(imm) + ((char)(imm)>0xE ? 97 : 49), \
- (char)(imm) + ((char)(imm)>0xD ? 98 : 50), \
- (char)(imm) + ((char)(imm)>0xC ? 99 : 51), \
- (char)(imm) + ((char)(imm)>0xB ? 100 : 52), \
- (char)(imm) + ((char)(imm)>0xA ? 101 : 53), \
- (char)(imm) + ((char)(imm)>0x9 ? 102 : 54), \
- (char)(imm) + ((char)(imm)>0x8 ? 103 : 55), \
- (char)(imm) + ((char)(imm)>0x7 ? 104 : 56), \
- (char)(imm) + ((char)(imm)>0x6 ? 105 : 57), \
- (char)(imm) + ((char)(imm)>0x5 ? 106 : 58), \
- (char)(imm) + ((char)(imm)>0x4 ? 107 : 59), \
- (char)(imm) + ((char)(imm)>0x3 ? 108 : 60), \
- (char)(imm) + ((char)(imm)>0x2 ? 109 : 61), \
- (char)(imm) + ((char)(imm)>0x1 ? 110 : 62), \
- (char)(imm) + ((char)(imm)>0x0 ? 111 : 63)); })
+ (__m512i)__builtin_shufflevector( \
+ (__v64qi)(__m512i)(a), \
+ (__v64qi)_mm512_setzero_si512(), \
+ ((char)(imm)&0xF0) ? 64 : (char)(imm) + ((char)(imm)>0xF ? 48 : 0), \
+ ((char)(imm)&0xF0) ? 65 : (char)(imm) + ((char)(imm)>0xE ? 49 : 1), \
+ ((char)(imm)&0xF0) ? 66 : (char)(imm) + ((char)(imm)>0xD ? 50 : 2), \
+ ((char)(imm)&0xF0) ? 67 : (char)(imm) + ((char)(imm)>0xC ? 51 : 3), \
+ ((char)(imm)&0xF0) ? 68 : (char)(imm) + ((char)(imm)>0xB ? 52 : 4), \
+ ((char)(imm)&0xF0) ? 69 : (char)(imm) + ((char)(imm)>0xA ? 53 : 5), \
+ ((char)(imm)&0xF0) ? 70 : (char)(imm) + ((char)(imm)>0x9 ? 54 : 6), \
+ ((char)(imm)&0xF0) ? 71 : (char)(imm) + ((char)(imm)>0x8 ? 55 : 7), \
+ ((char)(imm)&0xF0) ? 72 : (char)(imm) + ((char)(imm)>0x7 ? 56 : 8), \
+ ((char)(imm)&0xF0) ? 73 : (char)(imm) + ((char)(imm)>0x6 ? 57 : 9), \
+ ((char)(imm)&0xF0) ? 74 : (char)(imm) + ((char)(imm)>0x5 ? 58 : 10), \
+ ((char)(imm)&0xF0) ? 75 : (char)(imm) + ((char)(imm)>0x4 ? 59 : 11), \
+ ((char)(imm)&0xF0) ? 76 : (char)(imm) + ((char)(imm)>0x3 ? 60 : 12), \
+ ((char)(imm)&0xF0) ? 77 : (char)(imm) + ((char)(imm)>0x2 ? 61 : 13), \
+ ((char)(imm)&0xF0) ? 78 : (char)(imm) + ((char)(imm)>0x1 ? 62 : 14), \
+ ((char)(imm)&0xF0) ? 79 : (char)(imm) + ((char)(imm)>0x0 ? 63 : 15), \
+ ((char)(imm)&0xF0) ? 80 : (char)(imm) + ((char)(imm)>0xF ? 64 : 16), \
+ ((char)(imm)&0xF0) ? 81 : (char)(imm) + ((char)(imm)>0xE ? 65 : 17), \
+ ((char)(imm)&0xF0) ? 82 : (char)(imm) + ((char)(imm)>0xD ? 66 : 18), \
+ ((char)(imm)&0xF0) ? 83 : (char)(imm) + ((char)(imm)>0xC ? 67 : 19), \
+ ((char)(imm)&0xF0) ? 84 : (char)(imm) + ((char)(imm)>0xB ? 68 : 20), \
+ ((char)(imm)&0xF0) ? 85 : (char)(imm) + ((char)(imm)>0xA ? 69 : 21), \
+ ((char)(imm)&0xF0) ? 86 : (char)(imm) + ((char)(imm)>0x9 ? 70 : 22), \
+ ((char)(imm)&0xF0) ? 87 : (char)(imm) + ((char)(imm)>0x8 ? 71 : 23), \
+ ((char)(imm)&0xF0) ? 88 : (char)(imm) + ((char)(imm)>0x7 ? 72 : 24), \
+ ((char)(imm)&0xF0) ? 89 : (char)(imm) + ((char)(imm)>0x6 ? 73 : 25), \
+ ((char)(imm)&0xF0) ? 90 : (char)(imm) + ((char)(imm)>0x5 ? 74 : 26), \
+ ((char)(imm)&0xF0) ? 91 : (char)(imm) + ((char)(imm)>0x4 ? 75 : 27), \
+ ((char)(imm)&0xF0) ? 92 : (char)(imm) + ((char)(imm)>0x3 ? 76 : 28), \
+ ((char)(imm)&0xF0) ? 93 : (char)(imm) + ((char)(imm)>0x2 ? 77 : 29), \
+ ((char)(imm)&0xF0) ? 94 : (char)(imm) + ((char)(imm)>0x1 ? 78 : 30), \
+ ((char)(imm)&0xF0) ? 95 : (char)(imm) + ((char)(imm)>0x0 ? 79 : 31), \
+ ((char)(imm)&0xF0) ? 96 : (char)(imm) + ((char)(imm)>0xF ? 80 : 32), \
+ ((char)(imm)&0xF0) ? 97 : (char)(imm) + ((char)(imm)>0xE ? 81 : 33), \
+ ((char)(imm)&0xF0) ? 98 : (char)(imm) + ((char)(imm)>0xD ? 82 : 34), \
+ ((char)(imm)&0xF0) ? 99 : (char)(imm) + ((char)(imm)>0xC ? 83 : 35), \
+ ((char)(imm)&0xF0) ? 100 : (char)(imm) + ((char)(imm)>0xB ? 84 : 36), \
+ ((char)(imm)&0xF0) ? 101 : (char)(imm) + ((char)(imm)>0xA ? 85 : 37), \
+ ((char)(imm)&0xF0) ? 102 : (char)(imm) + ((char)(imm)>0x9 ? 86 : 38), \
+ ((char)(imm)&0xF0) ? 103 : (char)(imm) + ((char)(imm)>0x8 ? 87 : 39), \
+ ((char)(imm)&0xF0) ? 104 : (char)(imm) + ((char)(imm)>0x7 ? 88 : 40), \
+ ((char)(imm)&0xF0) ? 105 : (char)(imm) + ((char)(imm)>0x6 ? 89 : 41), \
+ ((char)(imm)&0xF0) ? 106 : (char)(imm) + ((char)(imm)>0x5 ? 90 : 42), \
+ ((char)(imm)&0xF0) ? 107 : (char)(imm) + ((char)(imm)>0x4 ? 91 : 43), \
+ ((char)(imm)&0xF0) ? 108 : (char)(imm) + ((char)(imm)>0x3 ? 92 : 44), \
+ ((char)(imm)&0xF0) ? 109 : (char)(imm) + ((char)(imm)>0x2 ? 93 : 45), \
+ ((char)(imm)&0xF0) ? 110 : (char)(imm) + ((char)(imm)>0x1 ? 94 : 46), \
+ ((char)(imm)&0xF0) ? 111 : (char)(imm) + ((char)(imm)>0x0 ? 95 : 47), \
+ ((char)(imm)&0xF0) ? 112 : (char)(imm) + ((char)(imm)>0xF ? 96 : 48), \
+ ((char)(imm)&0xF0) ? 113 : (char)(imm) + ((char)(imm)>0xE ? 97 : 49), \
+ ((char)(imm)&0xF0) ? 114 : (char)(imm) + ((char)(imm)>0xD ? 98 : 50), \
+ ((char)(imm)&0xF0) ? 115 : (char)(imm) + ((char)(imm)>0xC ? 99 : 51), \
+ ((char)(imm)&0xF0) ? 116 : (char)(imm) + ((char)(imm)>0xB ? 100 : 52), \
+ ((char)(imm)&0xF0) ? 117 : (char)(imm) + ((char)(imm)>0xA ? 101 : 53), \
+ ((char)(imm)&0xF0) ? 118 : (char)(imm) + ((char)(imm)>0x9 ? 102 : 54), \
+ ((char)(imm)&0xF0) ? 119 : (char)(imm) + ((char)(imm)>0x8 ? 103 : 55), \
+ ((char)(imm)&0xF0) ? 120 : (char)(imm) + ((char)(imm)>0x7 ? 104 : 56), \
+ ((char)(imm)&0xF0) ? 121 : (char)(imm) + ((char)(imm)>0x6 ? 105 : 57), \
+ ((char)(imm)&0xF0) ? 122 : (char)(imm) + ((char)(imm)>0x5 ? 106 : 58), \
+ ((char)(imm)&0xF0) ? 123 : (char)(imm) + ((char)(imm)>0x4 ? 107 : 59), \
+ ((char)(imm)&0xF0) ? 124 : (char)(imm) + ((char)(imm)>0x3 ? 108 : 60), \
+ ((char)(imm)&0xF0) ? 125 : (char)(imm) + ((char)(imm)>0x2 ? 109 : 61), \
+ ((char)(imm)&0xF0) ? 126 : (char)(imm) + ((char)(imm)>0x1 ? 110 : 62), \
+ ((char)(imm)&0xF0) ? 127 : (char)(imm) + ((char)(imm)>0x0 ? 111 : 63)); })
static __inline__ __m512i __DEFAULT_FN_ATTRS
_mm512_mask_mov_epi16 (__m512i __W, __mmask32 __U, __m512i __A)
diff --git a/lib/Headers/emmintrin.h b/lib/Headers/emmintrin.h
index 3eecb03033..0c2c8546ac 100644
--- a/lib/Headers/emmintrin.h
+++ b/lib/Headers/emmintrin.h
@@ -1089,27 +1089,26 @@ _mm_xor_si128(__m128i __a, __m128i __b)
/// An immediate value specifying the number of bytes to left-shift
/// operand a.
/// \returns A 128-bit integer vector containing the left-shifted value.
-#define _mm_slli_si128(a, imm) __extension__ ({ \
- ((char)(imm)&0xF0) ? _mm_setzero_si128() : \
- (__m128i)__builtin_shufflevector( \
- (__v16qi)_mm_setzero_si128(), \
- (__v16qi)(__m128i)(a), \
- 16 - (char)(imm), \
- 17 - (char)(imm), \
- 18 - (char)(imm), \
- 19 - (char)(imm), \
- 20 - (char)(imm), \
- 21 - (char)(imm), \
- 22 - (char)(imm), \
- 23 - (char)(imm), \
- 24 - (char)(imm), \
- 25 - (char)(imm), \
- 26 - (char)(imm), \
- 27 - (char)(imm), \
- 28 - (char)(imm), \
- 29 - (char)(imm), \
- 30 - (char)(imm), \
- 31 - (char)(imm)); })
+#define _mm_slli_si128(a, imm) __extension__ ({ \
+ (__m128i)__builtin_shufflevector( \
+ (__v16qi)_mm_setzero_si128(), \
+ (__v16qi)(__m128i)(a), \
+ ((char)(imm)&0xF0) ? 0 : 16 - (char)(imm), \
+ ((char)(imm)&0xF0) ? 1 : 17 - (char)(imm), \
+ ((char)(imm)&0xF0) ? 2 : 18 - (char)(imm), \
+ ((char)(imm)&0xF0) ? 3 : 19 - (char)(imm), \
+ ((char)(imm)&0xF0) ? 4 : 20 - (char)(imm), \
+ ((char)(imm)&0xF0) ? 5 : 21 - (char)(imm), \
+ ((char)(imm)&0xF0) ? 6 : 22 - (char)(imm), \
+ ((char)(imm)&0xF0) ? 7 : 23 - (char)(imm), \
+ ((char)(imm)&0xF0) ? 8 : 24 - (char)(imm), \
+ ((char)(imm)&0xF0) ? 9 : 25 - (char)(imm), \
+ ((char)(imm)&0xF0) ? 10 : 26 - (char)(imm), \
+ ((char)(imm)&0xF0) ? 11 : 27 - (char)(imm), \
+ ((char)(imm)&0xF0) ? 12 : 28 - (char)(imm), \
+ ((char)(imm)&0xF0) ? 13 : 29 - (char)(imm), \
+ ((char)(imm)&0xF0) ? 14 : 30 - (char)(imm), \
+ ((char)(imm)&0xF0) ? 15 : 31 - (char)(imm)); })
#define _mm_bslli_si128(a, imm) \
_mm_slli_si128((a), (imm))
@@ -1325,27 +1324,26 @@ _mm_sra_epi32(__m128i __a, __m128i __count)
/// An immediate value specifying the number of bytes to right-shift operand
/// a.
/// \returns A 128-bit integer vector containing the right-shifted value.
-#define _mm_srli_si128(a, imm) __extension__ ({ \
- ((char)(imm)&0xF0) ? _mm_setzero_si128() : \
- (__m128i)__builtin_shufflevector( \
- (__v16qi)(__m128i)(a), \
- (__v16qi)_mm_setzero_si128(), \
- (char)(imm) + 0, \
- (char)(imm) + 1, \
- (char)(imm) + 2, \
- (char)(imm) + 3, \
- (char)(imm) + 4, \
- (char)(imm) + 5, \
- (char)(imm) + 6, \
- (char)(imm) + 7, \
- (char)(imm) + 8, \
- (char)(imm) + 9, \
- (char)(imm) + 10, \
- (char)(imm) + 11, \
- (char)(imm) + 12, \
- (char)(imm) + 13, \
- (char)(imm) + 14, \
- (char)(imm) + 15); })
+#define _mm_srli_si128(a, imm) __extension__ ({ \
+ (__m128i)__builtin_shufflevector( \
+ (__v16qi)(__m128i)(a), \
+ (__v16qi)_mm_setzero_si128(), \
+ ((char)(imm)&0xF0) ? 16 : (char)(imm) + 0, \
+ ((char)(imm)&0xF0) ? 17 : (char)(imm) + 1, \
+ ((char)(imm)&0xF0) ? 18 : (char)(imm) + 2, \
+ ((char)(imm)&0xF0) ? 19 : (char)(imm) + 3, \
+ ((char)(imm)&0xF0) ? 20 : (char)(imm) + 4, \
+ ((char)(imm)&0xF0) ? 21 : (char)(imm) + 5, \
+ ((char)(imm)&0xF0) ? 22 : (char)(imm) + 6, \
+ ((char)(imm)&0xF0) ? 23 : (char)(imm) + 7, \
+ ((char)(imm)&0xF0) ? 24 : (char)(imm) + 8, \
+ ((char)(imm)&0xF0) ? 25 : (char)(imm) + 9, \
+ ((char)(imm)&0xF0) ? 26 : (char)(imm) + 10, \
+ ((char)(imm)&0xF0) ? 27 : (char)(imm) + 11, \
+ ((char)(imm)&0xF0) ? 28 : (char)(imm) + 12, \
+ ((char)(imm)&0xF0) ? 29 : (char)(imm) + 13, \
+ ((char)(imm)&0xF0) ? 30 : (char)(imm) + 14, \
+ ((char)(imm)&0xF0) ? 31 : (char)(imm) + 15); })
#define _mm_bsrli_si128(a, imm) \
_mm_srli_si128((a), (imm))
diff --git a/test/CodeGen/sse2-builtins.c b/test/CodeGen/sse2-builtins.c
index df9893b799..782dbee1a3 100644
--- a/test/CodeGen/sse2-builtins.c
+++ b/test/CodeGen/sse2-builtins.c
@@ -1157,6 +1157,12 @@ __m128i test_mm_slli_si128(__m128i A) {
return _mm_slli_si128(A, 5);
}
+__m128i test_mm_slli_si128_2(__m128i A) {
+ // CHECK-LABEL: test_mm_slli_si128_2
+ // CHECK: shufflevector <16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15>
+ return _mm_slli_si128(A, 17);
+}
+
__m128d test_mm_sqrt_pd(__m128d A) {
// CHECK-LABEL: test_mm_sqrt_pd
// CHECK: call <2 x double> @llvm.x86.sse2.sqrt.pd(<2 x double> %{{.*}})
@@ -1239,6 +1245,12 @@ __m128i test_mm_srli_si128(__m128i A) {
return _mm_srli_si128(A, 5);
}
+__m128i test_mm_srli_si128_2(__m128i A) {
+ // CHECK-LABEL: test_mm_srli_si128_2
+ // CHECK: shufflevector <16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <16 x i32> <i32 16, i32 17, i32 18, i32 19, i32 20, i32 21, i32 22, i32 23, i32 24, i32 25, i32 26, i32 27, i32 28, i32 29, i32 30, i32 31>
+ return _mm_srli_si128(A, 17);
+}
+
void test_mm_store_pd(double* A, __m128d B) {
// CHECK-LABEL: test_mm_store_pd
// CHECK: store <2 x double> %{{.*}}, <2 x double>* %{{.*}}, align 16