metal : add f16 support

2023-06-06 20:16:57 +03:00 · 2023-06-06 20:16:57 +03:00 · 44f906e853
commit 44f906e853
parent d5b111f53d
3 changed files with 31 additions and 11 deletions
--- a/llama.cpp
+++ b/llama.cpp
@ -961,7 +961,6 @@ static void llama_model_load_internal(
    model.hparams = ml->file_loaders.at(0)->hparams;
    llama_file_version file_version = ml->file_loaders.at(0)->file_version;
    auto & hparams = model.hparams;
-    uint32_t n_ff = ((2*(4*hparams.n_embd)/3 + hparams.n_mult - 1)/hparams.n_mult)*hparams.n_mult;

    {
        switch (hparams.n_layer) {
@ -975,6 +974,8 @@ static void llama_model_load_internal(
        hparams.n_ctx = n_ctx;
    }

+    const uint32_t n_ff = ((2*(4*hparams.n_embd)/3 + hparams.n_mult - 1)/hparams.n_mult)*hparams.n_mult;
+
    {
        fprintf(stderr, "%s: format     = %s\n",  __func__, llama_file_version_name(file_version));
        fprintf(stderr, "%s: n_vocab    = %u\n",  __func__, hparams.n_vocab);