Leverage mmap for offloading tensors to GPU (#1597)

* Rebase to latest * Show progress * Add assert to make sure we only allocate temp buffer for non-CPU backend tensor Co-authored-by: Johannes Gäßler <johannesg@5d6.de> --------- Co-authored-by: Johannes Gäßler <johannesg@5d6.de>
2023-06-12 20:44:16 +08:00 · 2023-06-12 20:44:16 +08:00 · 58970a4c39
commit 58970a4c39
parent 8c0a10e64d
5 changed files with 56 additions and 115 deletions
--- a/ggml-opencl.h
+++ b/ggml-opencl.h
@ -18,8 +18,7 @@ void   ggml_cl_host_free(void * ptr);

 void ggml_cl_free_data(const struct ggml_tensor* tensor);

-void ggml_cl_transform_tensor(struct ggml_tensor * tensor);
-void ggml_cl_load_data(const char * fname, struct ggml_tensor * tensor, size_t offset);
+void ggml_cl_transform_tensor(void * data, struct ggml_tensor * tensor);

 #ifdef  __cplusplus
 }