cturan/llama.cpp

Автор	SHA1 Сообщение	Дата
Georgi Gerganov	ef6dada60c cont : fix whitespaces (#11305)	1 год назад
Kyle Bruene	ae3c1db2f9 llama : re-add LLM_ARCH_PHIMOE (#11305)	1 год назад
Georgi Gerganov	92bc493917 tests : increase timeout when sanitizers are enabled (#11300)	1 год назад
Georgi Gerganov	b9daaffe02 simple-chat : fix BOS being added to each message (#11278)	1 год назад
Nicolò Scipione	99487b57d4 SYCL: Introducing memory host pool (#11251)	1 год назад
Eric Curtin	a1649cc13f Adding linenoise.cpp to llama-run (#11252)	1 год назад
Georgi Gerganov	4dd34ff831 cmake : add sanitizer flags for llama.cpp (#11279)	1 год назад
Xuan Son Nguyen	f30f099228 server : implement cancellable request (#11285)	1 год назад
Georgi Gerganov	f26c874179 scripts : restore hf.sh (#11288)	1 год назад
LostRuins Concedo	6390a998bf tts : add guide tokens support (#11186)	1 год назад
Jeff Bolz	44e18ef939 vulkan: fix coopmat2 flash attention for non-contiguous inputs (#11281)	1 год назад
codezjx	3edfa7d375 llama.android: add field formatChat to control whether to parse special tokens when send message (#11270)	1 год назад
Radoslav Gerganov	667d72846c rpc : early register backend devices (#11262)	1 год назад
Georgi Gerganov	a133566d34 vocab : fix double-eos check (#11273)	1 год назад
David Renshaw	960ec65273 llama : fix deprecation message: vocabable -> vocab (#11269)	1 год назад
musoles	7a689c415e README : added kalavai to infrastructure list (#11216)	1 год назад
Jeff Bolz	bd38ddea01 vulkan: support copy from f32 to q4_0/q4_1/q5_0/q5_1/q8_0/iq4_nl (#11166)	1 год назад
Jeff Bolz	466300fe14 vulkan: optimize coopmat2 q4_k/q5_k dequant functions. (#11206)	1 год назад
Jeff Bolz	206bc53422 vulkan: optimize coopmat2 q2_k dequant function (#11130)	1 год назад
RunningLeon	4dbc8b9cb7 llama : add internlm3 support (#11233)	1 год назад
Johannes Gäßler	9c8dcefe17 CUDA: backwards pass for misc. ops, add tests (#11257)	1 год назад
Xuan Son Nguyen	681149ced2 llama : add `llama_model_load_from_splits` (#11255)	1 год назад
fj-y-saito	c67cc9837d ggml: aarch64: implement SVE kernels for q4_K_q8_K vector dot (#11227)	1 год назад
Eve	adc5dd92e8 vulkan: scale caching for k quants + misc fixes (#11081)	1 год назад
Georgi Gerganov	f11cfdfd7f ci : use -no-cnv in gguf-split tests (#11254)	1 год назад
Junil Kim	1d8504338e fix: ggml: fix vulkan-shaders-gen build (#10448)	1 год назад
Johannes Gäßler	432df2d5f9 RoPE: fix back, CUDA support for back + noncont. (#11240)	1 год назад
Daniel Bevenius	0ccd7f3eb2 examples : add embd_to_audio to tts-outetts.py [no ci] (#11235)	1 год назад
Akarshan Biswas	f446c2cf6a SYCL: Add gated linear attention kernel (#11175)	1 год назад
Xuan Son Nguyen	b4d92a59a2 ci : add -no-cnv for tests (#11238)	1 год назад

Новее Раньше

История коммитов Найти

История коммитов