metal : create backend, mostly reuse CPU backend interface

2023-07-19 16:47:43 +03:00 · 2023-07-19 16:47:43 +03:00 · 70c55c17c7
commit 70c55c17c7
parent ed960fa1ab
3 changed files with 61 additions and 29 deletions
--- a/ggml-metal.m
+++ b/ggml-metal.m
@ -993,30 +993,59 @@ void ggml_metal_graph_compute(
    }
 }

+static const char * ggml_backend_metal_name(ggml_backend_context_t ctx) {
+    return "Metal";
+
+    UNUSED(ctx);
+}
+
+static void ggml_backend_metal_graph_compute(ggml_backend_context_t ctx, struct ggml_cgraph * cgraph) {
+    struct ggml_metal_context * ctx_metal = (struct ggml_metal_context *) ctx;
+
+    ggml_metal_graph_compute(ctx_metal, cgraph);
+}
+
 static struct ggml_backend_interface metal_backend_interface = {
-    /* .get_name            = */ //ggml_backend_metal_name,
-    /* .free_context        = */ //ggml_backend_metal_free_context,
-    /* .alloc_buffer        = */ //ggml_backend_metal_alloc_buffer,
-    /* .free_buffer         = */ //ggml_backend_metal_free_buffer,
-    /* .reset_buffer        = */ //ggml_backend_metal_reset_buffer,
-    /* .alloc_tensor        = */ //ggml_backend_metal_alloc_tensor,
-    /* .set_tensor_async    = */ //ggml_backend_metal_set_tensor_async,
-    /* .get_tensor_async    = */ //ggml_backend_metal_get_tensor_async,
-    /* .synchronize         = */ //ggml_backend_metal_synchronize,
-    /* .cpy_tensor_from     = */ //nullptr,
-    /* .cpy_tensor_to       = */ //nullptr,
-    /* .graph_plan_create   = */ //ggml_backend_metal_graph_plan_create,
-    /* .graph_plan_free     = */ //ggml_backend_metal_graph_plan_free,
-    /* .graph_plan_compute  = */ //ggml_backend_metal_graph_plan_compute,
-    /* .graph_compute       = */ //ggml_backend_metal_graph_compute
+    /* .get_name            = */ ggml_backend_metal_name,
+    /* .free_context        = */ NULL, //ggml_backend_metal_free_context,
+    /* .alloc_buffer        = */ NULL, //ggml_backend_metal_alloc_buffer,
+    /* .free_buffer         = */ NULL, //ggml_backend_metal_free_buffer,
+    /* .reset_buffer        = */ NULL, //ggml_backend_metal_reset_buffer,
+    /* .alloc_tensor        = */ NULL, //ggml_backend_metal_alloc_tensor,
+    /* .set_tensor_async    = */ NULL, //ggml_backend_metal_set_tensor_async,
+    /* .get_tensor_async    = */ NULL, //ggml_backend_metal_get_tensor_async,
+    /* .synchronize         = */ NULL, //ggml_backend_metal_synchronize,
+    /* .cpy_tensor_from     = */ NULL, //nullptr,
+    /* .cpy_tensor_to       = */ NULL, //nullptr,
+    /* .graph_plan_create   = */ NULL, //ggml_backend_metal_graph_plan_create,
+    /* .graph_plan_free     = */ NULL, //ggml_backend_metal_graph_plan_free,
+    /* .graph_plan_compute  = */ NULL, //ggml_backend_metal_graph_plan_compute,
+    /* .graph_compute       = */ ggml_backend_metal_graph_compute,
 };

-struct ggml_backend ggml_backend_metal_init(void) {
+struct ggml_backend ggml_backend_metal_init(struct ggml_backend * backend_cpu) {
    struct ggml_metal_context * ctx = malloc(sizeof(struct ggml_metal_context));

-    struct ggml_backend metal_backend = {
-        /* .interface = */ &metal_backend_interface,
-        /* .context   = */ ctx
+    struct ggml_backend backend_metal = {
+        /* .interface     = */ &metal_backend_interface,
+        /* .context       = */ ctx,
+        /* .is_ram_shared = */ true,
    };
-    return metal_backend;
+
+    // reuses CPU calls for now
+    backend_metal.interface->free_context       = backend_cpu->interface->free_context;
+    backend_metal.interface->alloc_buffer       = backend_cpu->interface->alloc_buffer;
+    backend_metal.interface->free_buffer        = backend_cpu->interface->free_buffer;
+    backend_metal.interface->reset_buffer       = backend_cpu->interface->reset_buffer;
+    backend_metal.interface->alloc_tensor       = backend_cpu->interface->alloc_tensor;
+    backend_metal.interface->set_tensor_async   = backend_cpu->interface->set_tensor_async;
+    backend_metal.interface->get_tensor_async   = backend_cpu->interface->get_tensor_async;
+    backend_metal.interface->synchronize        = backend_cpu->interface->synchronize;
+    backend_metal.interface->cpy_tensor_from    = backend_cpu->interface->cpy_tensor_from;
+    backend_metal.interface->cpy_tensor_to      = backend_cpu->interface->cpy_tensor_to;
+    backend_metal.interface->graph_plan_create  = backend_cpu->interface->graph_plan_create;
+    backend_metal.interface->graph_plan_free    = backend_cpu->interface->graph_plan_free;
+    backend_metal.interface->graph_plan_compute = backend_cpu->interface->graph_plan_compute;
+
+    return backend_metal;
 }