Remove Q4_3 which is no better than Q5 (#1218)

2023-04-28 23:10:43 +00:00 · 2023-04-28 23:10:43 +00:00 · 36d19a603b
commit 36d19a603b
parent 7f15c5c477
11 changed files with 21 additions and 359 deletions
--- a/llama.h
+++ b/llama.h
@ -73,7 +73,7 @@ extern "C" {
        LLAMA_FTYPE_MOSTLY_Q4_1 = 3,  // except 1d tensors
        LLAMA_FTYPE_MOSTLY_Q4_1_SOME_F16 = 4, // tok_embeddings.weight and output.weight are F16
        LLAMA_FTYPE_MOSTLY_Q4_2 = 5,  // except 1d tensors
-        LLAMA_FTYPE_MOSTLY_Q4_3 = 6,  // except 1d tensors
+        // LLAMA_FTYPE_MOSTLY_Q4_3 (6) support has been removed
        LLAMA_FTYPE_MOSTLY_Q8_0 = 7,  // except 1d tensors
        LLAMA_FTYPE_MOSTLY_Q5_0 = 8,  // except 1d tensors
        LLAMA_FTYPE_MOSTLY_Q5_1 = 9,  // except 1d tensors