llama.cpp

History

uvos 3ad5451f3b Add some minimal optimizations for CDNA (#10498 ) * Add some minimal optimizations for CDNA * ggml_cuda: set launch bounds also for GCN as it helps there too		2024-11-27 17:10:08 +01:00
..
cuda.h	cuda : organize vendor-specific headers into vendors directory (#8746 )	2024-07-29 14:56:12 +02:00
hip.h	Add some minimal optimizations for CDNA (#10498 )	2024-11-27 17:10:08 +01:00
musa.h	musa: enable building fat binaries, enable unified memory, and disable Flash Attention on QY1 (MTT S80) (#9526 )	2024-09-22 16:55:49 +02:00