convert-new.py : output gguf (#2635)

* convert-new.py : output gguf (WIP) * convert-new.py : add gguf key-value pairs * llama : add hparams.ctx_train + no longer print ftype * convert-new.py : minor fixes * convert-new.py : vocab-only option should work now * llama : fix tokenizer to use llama_char_to_byte * tests : add new ggml-vocab-llama.gguf * convert-new.py : tensor name mapping * convert-new.py : add map for skipping tensor serialization * convert-new.py : convert script now works * gguf.py : pick some of the refactoring from #2644 * convert-new.py : minor fixes
2023-08-17 17:19:52 +03:00 · 2023-08-17 17:19:52 +03:00 · e0429d38e4
commit e0429d38e4
parent d6fd53afd6
9 changed files with 526 additions and 327 deletions
--- a/convert-llama-7b-pth-to-gguf.py
+++ b/convert-llama-7b-pth-to-gguf.py
@ -298,7 +298,7 @@ for part_name in part_names:

        print( name + ", shape " + str(len(data.shape)) + ", " + str(old_dtype) + " --> " + str(data.dtype))

-        gguf_writer.write_tensor_to_file(data)
+        gguf_writer.write_tensor_data(data)

 gguf_writer.close()