cturan/llama.cpp

Autor	SHA1 Nachricht	Datum
Georgi Gerganov	6562e5a4d6 context : allow cache-less context for embeddings (#13108)	vor 8 Monaten
Georgi Gerganov	51fb96b1ff context : remove logits_all flag (#13284)	vor 8 Monaten
Georgi Gerganov	d9d398f84f sampling : when top-k <= 0 -> noop (#13173)	vor 9 Monaten
Xuan-Son Nguyen	ecda2ec4b3 mtmd : Support Pixtral 12B (#13065)	vor 9 Monaten
Ed Addario	71e90e8813 quantize: Handle user-defined quantization levels for additional tensors (#12511)	vor 9 Monaten
Xuan-Son Nguyen	1466621e73 llama : Support llama 4 text-only (#12791)	vor 9 Monaten
Diego Devesa	e0e912f49b llama : add option to override model tensor buffers (#11397)	vor 9 Monaten
Sigbjørn Skjæret	2c3f8b850a llama : support BailingMoE (Ling) (#12634)	vor 9 Monaten
Juyoung Suk	b3de7cac73 llama : add Trillion 7B model support (#12556)	vor 9 Monaten
Johannes Gäßler	dd373dd3bf llama: fix error on bad grammar (#12628)	vor 10 Monaten
compilade	00d53800e0 llama-vocab : add SuperBPE pre-tokenizer (#12532)	vor 10 Monaten
fairydreaming	8fcb563613 Load all MoE experts during warmup (#11571)	vor 10 Monaten
Georgi Gerganov	e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181)	vor 10 Monaten
Olivier Chafik	669912d9a5 `tool-call`: fix Qwen 2.5 Coder support, add micro benchmarks, support trigger patterns for lazy grammars (#12034)	vor 10 Monaten
Xuan-Son Nguyen	c43a3e7996 llama : add Phi-4-mini support (supersede #12099) (#12108)	vor 11 Monaten
Vitali Lovich	3e9a2860e9 llama : expose llama_model_n_head_kv in the API (#11997)	vor 11 Monaten
Georgi Gerganov	68ff663a04 repo : update links to new url (#11886)	vor 11 Monaten
Vinesh Janarthanan	27e8a23300 sampling: add Top-nσ sampler (#11223)	vor 11 Monaten
Christian Fillion	7ee953a64a llama : add llama_sampler_init for safe usage of llama_sampler_free (#11727)	vor 11 Monaten
Olivier Chafik	8b576b6c55 Tool call support (generic + native for Llama, Functionary, Hermes, Mistral, Firefunction, DeepSeek) w/ lazy grammars (#9639)	vor 11 Monaten
Olivier Chafik	6171c9d258 Add Jinja template support (#11016)	vor 1 Jahr
Radoslav Gerganov	667d72846c rpc : early register backend devices (#11262)	vor 1 Jahr
David Renshaw	960ec65273 llama : fix deprecation message: vocabable -> vocab (#11269)	vor 1 Jahr
Xuan Son Nguyen	681149ced2 llama : add `llama_model_load_from_splits` (#11255)	vor 1 Jahr
Georgi Gerganov	08f10f69c3 llama : remove notion of CLS token (#11064)	vor 1 Jahr
Georgi Gerganov	afa8a9ec9b llama : add `llama_vocab`, functions -> methods, naming (#11110)	vor 1 Jahr
Georgi Gerganov	47182dd03f llama : update llama_model API names (#11063)	vor 1 Jahr
Georgi Gerganov	727368c60f llama : use LLAMA_TOKEN_NULL (#11062)	vor 1 Jahr
fairydreaming	9394bbd484 llama : Add support for DeepSeek V3 (#11049)	vor 1 Jahr
Georgi Gerganov	f66f582927 llama : refactor `src/llama.cpp` (#10902)	vor 1 Jahr

Neuer Älter

Commit Verlauf Finden

Commit Verlauf