Get rope scale from HF models

2023-08-24 15:09:22 -05:00 · 2023-08-24 15:09:22 -05:00 · 8d0d83b391
commit 8d0d83b391
parent d0f77b1353
1 changed files with 22 additions and 16 deletions
--- a/convert.py
+++ b/convert.py
@ -105,6 +105,7 @@ class Params:
    f_norm_eps: float
    f_rope_freq_base: Optional[float] = None
    f_rope_scale: Optional[float] = None
    ftype: Optional[GGMLFileType] = None
@ -167,6 +168,7 @@ class Params:
        n_head       = config["num_attention_heads"]
        n_head_kv    = config["num_key_value_heads"] if "num_key_value_heads" in config else n_head
        f_norm_eps   = config["rms_norm_eps"]
        f_rope_scale = config["rope_scaling"]["factor"] if "rope_scaling" in config and "factor" in config["rope_scaling"] else None
        n_mult = Params.find_n_mult(n_ff, n_embd)
@ -188,6 +190,7 @@ class Params:
            n_head       = n_head,
            n_head_kv    = n_head_kv,
            f_norm_eps   = f_norm_eps,
            f_rope_scale = f_rope_scale,
        )
    # LLaMA v2 70B params.json
@ -771,6 +774,9 @@ class OutputFile:
        if params.f_rope_freq_base:
            self.gguf.add_rope_freq_base(params.f_rope_freq_base)
        if params.f_rope_scale:
            self.gguf.add_rope_scale_linear(params.f_rope_scale)
        if params.ftype:
            self.gguf.add_file_type(params.ftype)