cturan/llama.cpp

Автор	SHA1 Сообщение	Дата
Mathieu Geli	daef3ab233 server : add one level list nesting for embeddings (#8936)	1 год назад
compilade	345a686d82 llama : reduce useless copies when saving session (#8916)	1 год назад
compilade	3a14e00366 gguf-py : simplify support for quant types (#8838)	1 год назад
Georgi Gerganov	afd27f01fe scripts : sync cann files (#0)	1 год назад
Georgi Gerganov	366d486c16 scripts : fix sync filenames (#0)	1 год назад
Georgi Gerganov	e44a561ab0 sync : ggml	1 год назад
Borislav Stanimirov	f93d49ab1e ggml : ignore more msvc warnings (ggml/906)	1 год назад
Georgi Gerganov	5b33ea1ee7 metal : fix struct name (ggml/912)	1 год назад
Conrad Kramer	85fca8deb6 metal : add abort callback (ggml/905)	1 год назад
Pablo Duboue	ebd541a570 make : clean llamafile objects (#8923)	1 год назад
slaren	15fa07a5c5 make : use C compiler to build metal embed object (#8899)	1 год назад
slaren	be55695eff ggml-backend : fix async copy from CPU (#8897)	1 год назад
Ouadie EL FAROUKI	0478174d59 [SYCL] Updated SYCL device filtering (#8901)	1 год назад
Johannes Gäßler	a8dbc6f753 CUDA/HIP: fix tests/test-backend-ops (#8896)	1 год назад
Zhenwei Jin	506122d854 llama-bench : add support for getting cpu info on Windows (#8824)	1 год назад
Daniel Bevenius	725e3d9437 quantize : update usage comment in quantize.cpp (#8889)	1 год назад
Nexes the Old	31958546c3 typo correction (#8891)	1 год назад
Xuan Son Nguyen	1e6f6554aa server : add lora hotswap endpoint (WIP) (#8857)	1 год назад
Johannes Gäßler	641f5dd2a6 CUDA: fix padding logic for FP16/FP32 (#8884)	1 год назад
Daniel Bevenius	5f4dcb1e60 simple : update name of executable to llama-simple (#8885)	1 год назад
Jaeden Amero	db20f50cf4 cmake : Link vulkan-shaders-gen with pthreads (#8835)	1 год назад
MaggotHATE	efda90c93a [Vulkan] Fix compilation of `vulkan-shaders-gen` on w64devkit after `e31a4f6` (#8880)	1 год назад
Georgi Gerganov	0bf16de07b contributing : add note about write access	1 год назад
Molly Sophia	2d5dd7bb3f ggml : add epsilon as a parameter for group_norm (#8818)	1 год назад
Douglas Hanley	cdd1889de6 convert : add support for XLMRoberta embedding models (#8658)	1 год назад
Mengqing Cao	c21a896405 [CANN]: Fix ggml_backend_cann_buffer_get_tensor (#8871)	1 год назад
Neo Zhang	d4ff847153 [SYCL] correct cmd name (#8877)	1 год назад
Liu Jia	0a4ce78681 common : Changed tuple to struct (TODO fix) (#8823)	1 год назад
wangshuai09	bc0f887e15 cann: fix buffer_num and runtime speed slowly error (#8865)	1 год назад
Eric Curtin	b42978e7e4 readme : add ramalama to the availables UI (#8811)	1 год назад

Новее Раньше

История коммитов Найти

История коммитов