cturan/llama.cpp

Автор	SHA1 Сообщение	Дата
Ulrich Drepper	61665277af Allow compiling with CUDA without CUDA runtime installed (#7989)	1 год назад
0cc4m	7c7836d9d4 Vulkan Shader Refactor, Memory Debugging Option (#7947)	1 год назад
Xuan Son Nguyen	0c7b3595b9 Add `cvector-generator` example (#7514)	1 год назад
slaren	f578b86b21 move BLAS to a separate backend (#6210)	1 год назад
Olivier Chafik	1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809)	1 год назад
Johannes Gäßler	7d1a378b8f CUDA: refactor mmq, dmmv, mmvq (#7716)	1 год назад
Georgi Gerganov	554c247caf ggml : remove OpenCL (#7735)	1 год назад
Georgi Gerganov	0cd6bd3483 llama : remove beam search (#7736)	1 год назад
Radoslav Gerganov	bde7cd3cd9 llama : offload to RPC in addition to other backends (#7640)	1 год назад
Masaya, Kato	a5735e4426 ggml : use OpenMP as a thread pool (#7606)	1 год назад
Johannes Gäßler	0b832d53ba make: fix debug options not being applied to NVCC (#7714)	1 год назад
Yazan Agha-Schrader	2e666832e6 server : new UI (#7633)	1 год назад
Johannes Gäßler	9b596417af CUDA: quantized KV support for FA vec (#7527)	1 год назад
Daniele	30e238b246 Improve HIP compatibility (#7672)	1 год назад
Johannes Gäßler	10b1e45876 make: add --device-debug to NVCC debug flags (#7542)	1 год назад
Georgi Gerganov	e84b71c2c6 ggml : drop support for QK_K=64 (#7473)	1 год назад
junchao-loongson	65c58207ec ggml : add loongarch lsx and lasx support (#6454)	1 год назад
slaren	d359f30921 llama : remove MPI backend (#7395)	1 год назад
Gavin Zhao	82ca83db3c ROCm: use native CMake HIP support (#5966)	1 год назад
agray3	bc4bba364f Introduction of CUDA Graphs to LLama.cpp (#6766)	1 год назад
Georgi Gerganov	92139b90af tests : add test-tokenizer-0.sh + fix some tokenizers (#7036)	1 год назад
Georgi Gerganov	f4ab2a4147 llama : fix BPE pre-tokenization (#6920)	1 год назад
Przemysław Pawełczyk	577277ffd2 make : change GNU make default CXX from g++ to c++ (#6966)	1 год назад
Pierrick Hymbert	0c4d489e29 quantize: add imatrix and dataset metadata in GGUF (#6658)	1 год назад
Justine Tunney	192090bae4 llamafile : improve sgemm.cpp (#6796)	1 год назад
Olivier Chafik	5cf5e7d490 `build`: generate hex dump of server assets during build (#6661)	1 год назад
Georgi Gerganov	40f74e4d73 llama : add option to render special/control tokens (#6807)	1 год назад
Georgi Gerganov	3b8f1ec4b1 llamafile : tmp disable + build sgemm.o when needed (#6716)	1 год назад
Georgi Gerganov	666867b799 ggml : fix llamafile sgemm wdata offsets (#6710)	1 год назад
Justine Tunney	8cc91dc63c ggml : add llamafile sgemm (#6414)	1 год назад

Новее Раньше

История коммитов Найти

История коммитов