Apply suggestions from code review
This commit is contained in:
parent
9ad89bc9d3
commit
1c8ba922ec
3 changed files with 3 additions and 3 deletions
|
@ -194,7 +194,7 @@ static inline __m256i sum_i16_pairs_int32x8(const __m256i x) {
|
||||||
}
|
}
|
||||||
|
|
||||||
static inline __m256i mul_sum_us8_pairs_int32x8(const __m256i ax, const __m256i sy) {
|
static inline __m256i mul_sum_us8_pairs_int32x8(const __m256i ax, const __m256i sy) {
|
||||||
#if defined(__AVX512VNNI__) && defined(__AVX512VL__)
|
#if defined(__AVX512VNNI__) && defined(__AVX512VL__)
|
||||||
const __m256i zero = _mm256_setzero_si256();
|
const __m256i zero = _mm256_setzero_si256();
|
||||||
return _mm256_dpbusd_epi32(zero, ax, sy);
|
return _mm256_dpbusd_epi32(zero, ax, sy);
|
||||||
#elif defined(__AVXVNNI__)
|
#elif defined(__AVXVNNI__)
|
||||||
|
|
|
@ -103,7 +103,7 @@ static inline __m256 sum_i16_pairs_float(const __m256i x) {
|
||||||
}
|
}
|
||||||
|
|
||||||
static inline __m256 mul_sum_us8_pairs_float(const __m256i ax, const __m256i sy) {
|
static inline __m256 mul_sum_us8_pairs_float(const __m256i ax, const __m256i sy) {
|
||||||
#if defined(__AVX512VNNI__) && defined(__AVX512VL__)
|
#if defined(__AVX512VNNI__) && defined(__AVX512VL__)
|
||||||
const __m256i zero = _mm256_setzero_si256();
|
const __m256i zero = _mm256_setzero_si256();
|
||||||
const __m256i summed_pairs = _mm256_dpbusd_epi32(zero, ax, sy);
|
const __m256i summed_pairs = _mm256_dpbusd_epi32(zero, ax, sy);
|
||||||
return _mm256_cvtepi32_ps(summed_pairs);
|
return _mm256_cvtepi32_ps(summed_pairs);
|
||||||
|
|
|
@ -1000,7 +1000,7 @@ class tinyBLAS_Q0_AVX {
|
||||||
|
|
||||||
inline __m256 updot(__m256i u, __m256i s) {
|
inline __m256 updot(__m256i u, __m256i s) {
|
||||||
__m256i res;
|
__m256i res;
|
||||||
#if defined(__AVX512VNNI__) && defined(__AVX512VL__)
|
#if defined(__AVX512VNNI__) && defined(__AVX512VL__)
|
||||||
res = _mm256_dpbusd_epi32(_mm256_setzero_si256(), u, s);
|
res = _mm256_dpbusd_epi32(_mm256_setzero_si256(), u, s);
|
||||||
#elif defined(__AVXVNNI__)
|
#elif defined(__AVXVNNI__)
|
||||||
res = _mm256_dpbusd_avx_epi32(_mm256_setzero_si256(), u, s);
|
res = _mm256_dpbusd_avx_epi32(_mm256_setzero_si256(), u, s);
|
||||||
|
|
Loading…
Add table
Add a link
Reference in a new issue