Commit Verlauf

Autor SHA1 Nachricht Datum
  Georgi Gerganov 6562e5a4d6 context : allow cache-less context for embeddings (#13108) vor 8 Monaten
  Georgi Gerganov 51fb96b1ff context : remove logits_all flag (#13284) vor 8 Monaten
  Georgi Gerganov d9d398f84f sampling : when top-k <= 0 -> noop (#13173) vor 9 Monaten
  Xuan-Son Nguyen ecda2ec4b3 mtmd : Support Pixtral 12B (#13065) vor 9 Monaten
  Ed Addario 71e90e8813 quantize: Handle user-defined quantization levels for additional tensors (#12511) vor 9 Monaten
  Xuan-Son Nguyen 1466621e73 llama : Support llama 4 text-only (#12791) vor 9 Monaten
  Diego Devesa e0e912f49b llama : add option to override model tensor buffers (#11397) vor 9 Monaten
  Sigbjørn Skjæret 2c3f8b850a llama : support BailingMoE (Ling) (#12634) vor 9 Monaten
  Juyoung Suk b3de7cac73 llama : add Trillion 7B model support (#12556) vor 9 Monaten
  Johannes Gäßler dd373dd3bf llama: fix error on bad grammar (#12628) vor 10 Monaten
  compilade 00d53800e0 llama-vocab : add SuperBPE pre-tokenizer (#12532) vor 10 Monaten
  fairydreaming 8fcb563613 Load all MoE experts during warmup (#11571) vor 10 Monaten
  Georgi Gerganov e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) vor 10 Monaten
  Olivier Chafik 669912d9a5 `tool-call`: fix Qwen 2.5 Coder support, add micro benchmarks, support trigger patterns for lazy grammars (#12034) vor 10 Monaten
  Xuan-Son Nguyen c43a3e7996 llama : add Phi-4-mini support (supersede #12099) (#12108) vor 11 Monaten
  Vitali Lovich 3e9a2860e9 llama : expose llama_model_n_head_kv in the API (#11997) vor 11 Monaten
  Georgi Gerganov 68ff663a04 repo : update links to new url (#11886) vor 11 Monaten
  Vinesh Janarthanan 27e8a23300 sampling: add Top-nσ sampler (#11223) vor 11 Monaten
  Christian Fillion 7ee953a64a llama : add llama_sampler_init for safe usage of llama_sampler_free (#11727) vor 11 Monaten
  Olivier Chafik 8b576b6c55 Tool call support (generic + native for Llama, Functionary, Hermes, Mistral, Firefunction, DeepSeek) w/ lazy grammars (#9639) vor 11 Monaten
  Olivier Chafik 6171c9d258 Add Jinja template support (#11016) vor 1 Jahr
  Radoslav Gerganov 667d72846c rpc : early register backend devices (#11262) vor 1 Jahr
  David Renshaw 960ec65273 llama : fix deprecation message: vocabable -> vocab (#11269) vor 1 Jahr
  Xuan Son Nguyen 681149ced2 llama : add `llama_model_load_from_splits` (#11255) vor 1 Jahr
  Georgi Gerganov 08f10f69c3 llama : remove notion of CLS token (#11064) vor 1 Jahr
  Georgi Gerganov afa8a9ec9b llama : add `llama_vocab`, functions -> methods, naming (#11110) vor 1 Jahr
  Georgi Gerganov 47182dd03f llama : update llama_model API names (#11063) vor 1 Jahr
  Georgi Gerganov 727368c60f llama : use LLAMA_TOKEN_NULL (#11062) vor 1 Jahr
  fairydreaming 9394bbd484 llama : Add support for DeepSeek V3 (#11049) vor 1 Jahr
  Georgi Gerganov f66f582927 llama : refactor `src/llama.cpp` (#10902) vor 1 Jahr