llama : add llama_model_load_from_splits (#11255)

* llama : add `llama_model_load_from_splits` * update
2025-01-16 13:54:08 +01:00 · 2025-01-16 13:54:08 +01:00 · 681149ced2
commit 681149ced2
parent c67cc9837d
5 changed files with 116 additions and 24 deletions
--- a/src/llama-model-loader.h
+++ b/src/llama-model-loader.h
@ -90,7 +90,12 @@ struct llama_model_loader {
    size_t size_data = 0;
    std::vector<std::pair<size_t, size_t>> mmaps_used;

-    llama_model_loader(const std::string & fname, bool use_mmap, bool check_tensors, const struct llama_model_kv_override * param_overrides_p);
+    llama_model_loader(
+        const std::string & fname,
+        std::vector<std::string> & splits, // optional, only need if the split does not follow naming scheme
+        bool use_mmap,
+        bool check_tensors,
+        const struct llama_model_kv_override * param_overrides_p);

    template<typename T>
    typename std::enable_if<std::is_integral<T>::value, bool>::type