cturan/llama.cpp

Autor	SHA1 Mensaje	Fecha
Ed Addario	fa4a9f2a1c quantize : handle user-defined pruning of whole layers (blocks) (#13037)	hace 7 meses
Sigbjørn Skjæret	238005c2dc gguf-py : fix SpecialVocab parsing when post_processor is null (#14330)	hace 7 meses
Ruikai Peng	66aba7aca9 run : avoid double tokenization (#14327)	hace 7 meses
Georgi Gerganov	f1f5e82df6 examples : fix is_first logic for tokenization (#14329)	hace 7 meses
uvos	af3373f1ad HIP: enable vec fattn on RDNA4 (#14323)	hace 7 meses
yuiseki	5d5c066de8 mtmd : fix Pixtral OOM with large images by capping image_size to 1024 (#14326)	hace 7 meses
Sigbjørn Skjæret	40bfa04c95 common : use std::string_view now that we target c++17 (#14319)	hace 7 meses
Aman Gupta	aa064b2eb7 CUDA: add mean operation (#14313)	hace 7 meses
Sigbjørn Skjæret	aa0ef5c578 gguf-py : fix Qwen3-Embedding eos token (#14314)	hace 7 meses
Markus Tavenrath	bb16041cae Add support for VK_EXT_debug_utils to add labels to Vulkan objects. (#13792)	hace 7 meses
Sigbjørn Skjæret	58cba76a9a gguf-py : fix TemplateProcessing pair when bos/eos is missing (#14312)	hace 7 meses
Georgi Gerganov	67ae5312e2 metal : fix thread-safety (#14300)	hace 7 meses
Georgi Gerganov	692e3cdd0a memory : rename interface to llama_memory_context_i (#14296)	hace 7 meses
Daniel Han	b23fa0b3f4 convert : fix Llama 4 conversion (#14311)	hace 7 meses
Georgi Gerganov	06cbedfca1 sync : ggml	hace 7 meses
Acly	b7147673f2 Add `ggml_roll` (ggml/1274)	hace 7 meses
David Chiu	d860dd99a4 docs : fix the link to llama.h (#14293)	hace 7 meses
Aman Gupta	c959f462a0 CUDA: add conv_2d_transpose (#14287)	hace 7 meses
Sigbjørn Skjæret	22015b2092 lint : remove trailing whitepace (#14304)	hace 7 meses
Ruikai Peng	dd6e6d0b6a vocab : prevent tokenizer overflow (#14301)	hace 7 meses
Nicolò Scipione	8308f98c7f sycl: add usage of enqueue_functions extension (#14244)	hace 7 meses
Christian Kastner	6369be0735 Implement GGML_CPU_ALL_VARIANTS for PowerPC (#14286)	hace 7 meses
Sigbjørn Skjæret	88fc854b4b llama : improve sep token handling (#14272)	hace 7 meses
Diego Devesa	e28c1b93fd cuda : synchronize graph capture and cublas handle destruction (#14288)	hace 7 meses
Georgi Gerganov	d27b3ca175 ggml : fix repack work size for mul_mat_id (#14292)	hace 7 meses
Charles Xu	9230dbe2c7 ggml: Update KleidiAI to v1.9.0 (#14277)	hace 7 meses
Georgi Gerganov	812939a9e9 model : more uniform output id handling (#14275)	hace 7 meses
Georgi Gerganov	4c9fdfbe15 ubatch : new splitting logic (#14217)	hace 7 meses
Aman Gupta	9eaa51e7f0 CUDA: add conv_2d_dw (#14265)	hace 7 meses
Diego Devesa	8f71d0f3e8 ggml-cpu : remove unnecesary arm feature detection (#14281)	hace 7 meses

Posterior Anterior

Historial de Commits Buscar

Historial de Commits