cturan/llama.cpp

Автор	SHA1 Сообщение	Дата
Xuan Son Nguyen	f7cd13301c ci : use actions from ggml-org (#11140)	1 год назад
Xuan Son Nguyen	4d2b3d8804 lora : improve compat with `mergekit-extract-lora` (#11131)	1 год назад
Georgi Gerganov	c07d437bbd llama : avoid hardcoded QK_K (#11061)	1 год назад
Georgi Gerganov	99a3755a3c sync : ggml	1 год назад
Radoslav Gerganov	c792dcf488 ggml : allow loading backend with env variable (ggml/1059)	1 год назад
Xuan Son Nguyen	80ccf5d725 ci : pin dependency to specific version (#11137)	1 год назад
Georgi Gerganov	a3c1232c3f arg : option to exclude arguments from specific examples (#11136)	1 год назад
amritahs-ibm	8cef75c743 llamafile : ppc64le MMA INT8 implementation (#10912)	1 год назад
Georgi Gerganov	0d52a69e4b ci : fix cmake option (#11125)	1 год назад
Mathieu Baudier	02f0430141 Disable GL_KHR_cooperative_matrix Vulkan extension if not available. (#11117)	1 год назад
ag2s20150909	bec2183f2c fix: Vulkan shader gen binary path when Cross-compiling (#11096)	1 год назад
Johannes Gäßler	53ff6b9b9f GGUF: C++ refactor, backend support, misc fixes (#11030)	1 год назад
Diego Devesa	017cc5f446 ggml-backend : only offload from host buffers (fix) (#11124)	1 год назад
Diego Devesa	a3d50bc022 ggml-backend : only offload from host buffers (#11120)	1 год назад
Radoslav Gerganov	a4dd490069 rpc : code cleanup (#11107)	1 год назад
Akarshan Biswas	c0d6f790d0 SYCL: Use get_multi_ptr instead of deprecated get_pointer in wkv6 (#11087)	1 год назад
Eric Curtin	dc7cef9f37 llama-run : fix context size (#11094)	1 год назад
Georgi Gerganov	ecebbd292d llama : remove unused headers (#11109)	1 год назад
Xuan Son Nguyen	96be8c3264 github : add cmd line field to bug report (#11090)	1 год назад
Georgi Gerganov	e6e7c75d94 server : fix extra BOS in infill endpoint (#11106)	1 год назад
Xuan Son Nguyen	09186fabbe llama : remove check flash_attn with lora (#11104)	1 год назад
Asghar Ghorbani	96a1dc27c3 llama : prevent system info string accumulation across calls (#11101)	1 год назад
Daniel Bevenius	6369f867a4 llama : rename missed batch params/vars to ubatch (#10059)	1 год назад
Georgi Gerganov	47182dd03f llama : update llama_model API names (#11063)	1 год назад
Georgi Gerganov	3e6e7a6bc2 tokenize : escape the prompt (#11058)	1 год назад
Georgi Gerganov	ae2f606bb5 mmap : fix fileno macro clash (#11076)	1 год назад
Georgi Gerganov	727368c60f llama : use LLAMA_TOKEN_NULL (#11062)	1 год назад
Georgi Gerganov	5047dd3546 llama : use _impl suffix instead of _internal (#11060)	1 год назад
Johannes Gäßler	46e3556e01 CUDA: add BF16 support (#11093)	1 год назад
0cc4m	b56f079e28 Vulkan: Add device-specific blacklist for coopmat for the AMD proprietary driver (#11074)	1 год назад

Новее Раньше

История коммитов Найти

История коммитов