ggml : fix F16 store (ARM NEON)
This commit is contained in:
parent
e307882c34
commit
58c7f6167c
1 changed files with 2 additions and 2 deletions
4
ggml.c
4
ggml.c
|
@ -874,7 +874,7 @@ inline static float vaddvq_f32(float32x4_t v) {
|
||||||
#define GGML_F16_VEC_ZERO GGML_F16x8_ZERO
|
#define GGML_F16_VEC_ZERO GGML_F16x8_ZERO
|
||||||
#define GGML_F16_VEC_SET1 GGML_F16x8_SET1
|
#define GGML_F16_VEC_SET1 GGML_F16x8_SET1
|
||||||
#define GGML_F16_VEC_LOAD(p, i) GGML_F16x8_LOAD(p)
|
#define GGML_F16_VEC_LOAD(p, i) GGML_F16x8_LOAD(p)
|
||||||
#define GGML_F16_VEC_STORE(p, r, i) GGML_F16x8_STORE(p, r[i])
|
#define GGML_F16_VEC_STORE(p, r, i) GGML_F16x8_STORE((__fp16 *)(p), r[i])
|
||||||
#define GGML_F16_VEC_FMA GGML_F16x8_FMA
|
#define GGML_F16_VEC_FMA GGML_F16x8_FMA
|
||||||
#define GGML_F16_VEC_ADD GGML_F16x8_ADD
|
#define GGML_F16_VEC_ADD GGML_F16x8_ADD
|
||||||
#define GGML_F16_VEC_MUL GGML_F16x8_MUL
|
#define GGML_F16_VEC_MUL GGML_F16x8_MUL
|
||||||
|
@ -900,7 +900,7 @@ inline static float vaddvq_f32(float32x4_t v) {
|
||||||
#define GGML_F16_VEC_ZERO GGML_F32Cx4_ZERO
|
#define GGML_F16_VEC_ZERO GGML_F32Cx4_ZERO
|
||||||
#define GGML_F16_VEC_SET1 GGML_F32Cx4_SET1
|
#define GGML_F16_VEC_SET1 GGML_F32Cx4_SET1
|
||||||
#define GGML_F16_VEC_LOAD(p, i) GGML_F32Cx4_LOAD(p)
|
#define GGML_F16_VEC_LOAD(p, i) GGML_F32Cx4_LOAD(p)
|
||||||
#define GGML_F16_VEC_STORE(p, r, i) GGML_F32Cx4_STORE(p, r[i])
|
#define GGML_F16_VEC_STORE(p, r, i) GGML_F32Cx4_STORE((__fp16 *)(p), r[i])
|
||||||
#define GGML_F16_VEC_FMA GGML_F32Cx4_FMA
|
#define GGML_F16_VEC_FMA GGML_F32Cx4_FMA
|
||||||
#define GGML_F16_VEC_ADD GGML_F32Cx4_ADD
|
#define GGML_F16_VEC_ADD GGML_F32Cx4_ADD
|
||||||
#define GGML_F16_VEC_MUL GGML_F32Cx4_MUL
|
#define GGML_F16_VEC_MUL GGML_F32Cx4_MUL
|
||||||
|
|
Loading…
Add table
Add a link
Reference in a new issue