Update Vulkan CPU offload for MUL_MAT_ID

2024-06-02 09:05:47 +02:00 · 2024-06-02 09:05:47 +02:00 · 6e0e0beb56
commit 6e0e0beb56
parent 2c3d0b42f3
1 changed files with 2 additions and 7 deletions
--- a/ggml-vulkan.cpp
+++ b/ggml-vulkan.cpp
@ -6516,15 +6516,10 @@ GGML_CALL static bool ggml_backend_vk_supports_op(ggml_backend_t backend, const
 }

 GGML_CALL static bool ggml_backend_vk_offload_op(ggml_backend_t backend, const ggml_tensor * op) {
-    const ggml_tensor * dst = op;
-
    const int min_batch_size = 32;

-    if (dst->ne[1] > min_batch_size && dst->op != GGML_OP_GET_ROWS) {
-        return true;
-    }
-
-    return false;
+    return (op->ne[1] >= min_batch_size && op->op != GGML_OP_GET_ROWS) ||
+           (op->ne[2] >= min_batch_size && op->op == GGML_OP_MUL_MAT_ID);

    UNUSED(backend);
 }