llama.cpp

History

fairydreaming 9394bbd484 llama : Add support for DeepSeek V3 (#11049 ) * convert : extend DEEPSEEK2 model architecture to support DeepseekV3ForCausalLM by adding EXPERT_WEIGHTS_NORM and EXPERT_GATING_FUNC model parameters and FFN_EXP_PROBS_B tensor type * vocab : add DeepSeek V3 pre-tokenizer regexes * unicode : handle ACCENT_MARK and SYMBOL categories in regex * llama : add DeepSeek V3 chat template, handle new model parameters and tensor types --------- Co-authored-by: Stanisław Szymczyk <sszymczy@gmail.com>		2025-01-04 21:06:11 +01:00
..
CMakeLists.txt	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-adapter.cpp	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-adapter.h	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-arch.cpp	llama : Add support for DeepSeek V3 (#11049 )	2025-01-04 21:06:11 +01:00
llama-arch.h	llama : Add support for DeepSeek V3 (#11049 )	2025-01-04 21:06:11 +01:00
llama-batch.cpp	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-batch.h	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-chat.cpp	llama : Add support for DeepSeek V3 (#11049 )	2025-01-04 21:06:11 +01:00
llama-chat.h	llama : Add support for DeepSeek V3 (#11049 )	2025-01-04 21:06:11 +01:00
llama-context.cpp	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-context.h	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-cparams.cpp	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-cparams.h	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-grammar.cpp	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-grammar.h	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-hparams.cpp	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-hparams.h	llama : Add support for DeepSeek V3 (#11049 )	2025-01-04 21:06:11 +01:00
llama-impl.cpp	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-impl.h	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-kv-cache.cpp	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-kv-cache.h	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-mmap.cpp	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-mmap.h	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-model-loader.cpp	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-model-loader.h	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-model.cpp	llama : Add support for DeepSeek V3 (#11049 )	2025-01-04 21:06:11 +01:00
llama-model.h	llama : Add support for DeepSeek V3 (#11049 )	2025-01-04 21:06:11 +01:00
llama-quant.cpp	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-quant.h	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-sampling.cpp	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama-sampling.h	llama : add DRY sampler (#9702 )	2024-10-25 19:07:34 +03:00
llama-vocab.cpp	llama : Add support for DeepSeek V3 (#11049 )	2025-01-04 21:06:11 +01:00
llama-vocab.h	llama : refactor `src/llama.cpp` (#10902 )	2025-01-03 10:18:53 +02:00
llama.cpp	llama : Add support for DeepSeek V3 (#11049 )	2025-01-04 21:06:11 +01:00
unicode-data.cpp	server : better security control for public deployments (#9776 )	2024-10-08 13:27:04 +02:00
unicode-data.h	llama : reduce compile time and binary size (#9712 )	2024-10-02 15:49:55 +02:00
unicode.cpp	llama : Add support for DeepSeek V3 (#11049 )	2025-01-04 21:06:11 +01:00
unicode.h	unicode : improve naming style (#10838 )	2024-12-16 12:31:45 +02:00