CUDA: fix partial offloading for ne0 % 256 != 0 (#8572)

2024-07-18 23:48:47 +02:00 · 2024-07-18 23:48:47 +02:00 · a15ef8f8a0
commit a15ef8f8a0
parent 705b7ecf60
4 changed files with 29 additions and 15 deletions
--- a/ggml/src/ggml-backend.c
+++ b/ggml/src/ggml-backend.c
@ -134,6 +134,10 @@ void ggml_backend_buffer_set_usage(ggml_backend_buffer_t buffer, enum ggml_backe
    }
 }

+enum ggml_backend_buffer_usage ggml_backend_buffer_get_usage(ggml_backend_buffer_t buffer) {
+    return buffer->usage;
+}
+
 ggml_backend_buffer_type_t ggml_backend_buffer_get_type(ggml_backend_buffer_t buffer) {
    return buffer->buft;
 }