llama : support all OpenELM models

* llama : add variable GQA and variable FFN sizes Some metadata keys can now also be arrays to support setting their value per-layer for models like OpenELM.
2024-06-30 23:13:48 -04:00 · 2024-06-30 23:13:48 -04:00 · c8cdb48d10
commit c8cdb48d10
parent 51b2577dd4
5 changed files with 247 additions and 188 deletions
--- a/gguf-py/gguf/constants.py
+++ b/gguf-py/gguf/constants.py
@ -869,8 +869,9 @@ MODEL_TENSORS: dict[MODEL_ARCH, list[MODEL_TENSOR]] = {
        MODEL_TENSOR.ATTN_K_NORM,
        MODEL_TENSOR.ATTN_OUT,
        MODEL_TENSOR.FFN_NORM,
-        MODEL_TENSOR.FFN_UP,
+        MODEL_TENSOR.FFN_GATE,
        MODEL_TENSOR.FFN_DOWN,
+        MODEL_TENSOR.FFN_UP,
    ],
    MODEL_ARCH.ARCTIC: [
        MODEL_TENSOR.TOKEN_EMBD,