From c42ca8f1b7205b7568d1f223bae649e69e6d5c7a Mon Sep 17 00:00:00 2001
From: Oleksii Maryshchenko <oleksii.maryshchenko@gmail.com>
Date: Fri, 3 Nov 2023 15:06:40 +0100
Subject: [PATCH] GGML_CUDA_FORCE_CUSTOM_MEMORY_POOL was added to force use
 only custom memory pool

---
 ggml-cuda.cu | 8 ++++++--
 1 file changed, 6 insertions(+), 2 deletions(-)

diff --git a/ggml-cuda.cu b/ggml-cuda.cu
index e65f7e95b..1ff327876 100644
--- a/ggml-cuda.cu
+++ b/ggml-cuda.cu
@@ -108,6 +108,10 @@
 #define CUDA_USE_TENSOR_CORES
 #endif
 
+#if !defined(GGML_CUDA_FORCE_CUSTOM_MEMORY_POOL)
+#define CUDA_USE_MEMORY_POOL
+#endif
+
 // max batch size to use MMQ kernels when tensor cores are available
 #define MMQ_MAX_BATCH_SIZE 32
 
@@ -5845,7 +5849,7 @@ void ggml_init_cublas() {
             cudaDeviceProp prop;
             CUDA_CHECK(cudaGetDeviceProperties(&prop, id));
             fprintf(stderr, "  Device %d: %s, compute capability %d.%d", id, prop.name, prop.major, prop.minor);
-
+#if defined(CUDA_USE_MEMORY_POOL)
             // configure memory pool
             if (prop.memoryPoolsSupported == 1) {
                 cudaError_t err = cudaDeviceGetMemPool(&g_cudaMemPools[id], id);
@@ -5859,7 +5863,7 @@ void ggml_init_cublas() {
             } else {
                 fprintf(stderr, ", CUDA memory pool is not supported\n");
             }
-
+#endif
             g_tensor_split[id] = total_vram;
             total_vram += prop.totalGlobalMem;
 #if defined(GGML_USE_HIPBLAS) && defined(__HIP_PLATFORM_AMD__)