disable mmap prefetch/readahead for NUMA systems

2023-05-21 16:33:10 -04:00 · 2023-05-21 16:33:10 -04:00 · 0d23f8ce8d
commit 0d23f8ce8d
parent 6fc5f17e21
1 changed files with 14 additions and 1 deletions
--- a/llama-util.h
+++ b/llama-util.h
@ -163,6 +163,9 @@ static std::string llama_format_win_err(DWORD err) {
 }
 #endif

+extern "C" {
+bool ggml_is_numa();
+}
 struct llama_mmap {
    void * addr;
    size_t size;
@ -176,8 +179,10 @@ struct llama_mmap {
        size = file->size;
        int fd = fileno(file->fp);
        int flags = MAP_SHARED;
+        // prefetch/readahead impairs performance on NUMA systems
+        if (ggml_is_numa()) prefetch = 0;
 #ifdef __linux__
-        flags |= MAP_POPULATE;
+        if (prefetch) flags |= MAP_POPULATE;
 #endif
        addr = mmap(NULL, file->size, PROT_READ, flags, fd, 0);
        if (addr == MAP_FAILED) {
@ -191,6 +196,14 @@ struct llama_mmap {
                        strerror(errno));
            }
        }
+        if (ggml_is_numa()) {
+            // advise the kernel not to use readahead
+            // (because the next page might not belong on the same node)
+            if (madvise(addr, file->size, MADV_RANDOM)) {
+                fprintf(stderr, "warning: madvise(.., MADV_RANDOM) failed: %s\n",
+                        strerror(errno));
+            }
+        }
    }

    ~llama_mmap() {