Historial de Commits

Autor SHA1 Mensaje Fecha
  Diego Devesa e0e912f49b llama : add option to override model tensor buffers (#11397) hace 9 meses
  Sigbjørn Skjæret 2c3f8b850a llama : support BailingMoE (Ling) (#12634) hace 9 meses
  Juyoung Suk b3de7cac73 llama : add Trillion 7B model support (#12556) hace 9 meses
  Johannes Gäßler dd373dd3bf llama: fix error on bad grammar (#12628) hace 9 meses
  compilade 00d53800e0 llama-vocab : add SuperBPE pre-tokenizer (#12532) hace 10 meses
  fairydreaming 8fcb563613 Load all MoE experts during warmup (#11571) hace 10 meses
  Georgi Gerganov e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) hace 10 meses
  Olivier Chafik 669912d9a5 `tool-call`: fix Qwen 2.5 Coder support, add micro benchmarks, support trigger patterns for lazy grammars (#12034) hace 10 meses
  Xuan-Son Nguyen c43a3e7996 llama : add Phi-4-mini support (supersede #12099) (#12108) hace 10 meses
  Vitali Lovich 3e9a2860e9 llama : expose llama_model_n_head_kv in the API (#11997) hace 10 meses
  Georgi Gerganov 68ff663a04 repo : update links to new url (#11886) hace 11 meses
  Vinesh Janarthanan 27e8a23300 sampling: add Top-nσ sampler (#11223) hace 11 meses
  Christian Fillion 7ee953a64a llama : add llama_sampler_init for safe usage of llama_sampler_free (#11727) hace 11 meses
  Olivier Chafik 8b576b6c55 Tool call support (generic + native for Llama, Functionary, Hermes, Mistral, Firefunction, DeepSeek) w/ lazy grammars (#9639) hace 11 meses
  Olivier Chafik 6171c9d258 Add Jinja template support (#11016) hace 1 año
  Radoslav Gerganov 667d72846c rpc : early register backend devices (#11262) hace 1 año
  David Renshaw 960ec65273 llama : fix deprecation message: vocabable -> vocab (#11269) hace 1 año
  Xuan Son Nguyen 681149ced2 llama : add `llama_model_load_from_splits` (#11255) hace 1 año
  Georgi Gerganov 08f10f69c3 llama : remove notion of CLS token (#11064) hace 1 año
  Georgi Gerganov afa8a9ec9b llama : add `llama_vocab`, functions -> methods, naming (#11110) hace 1 año
  Georgi Gerganov 47182dd03f llama : update llama_model API names (#11063) hace 1 año
  Georgi Gerganov 727368c60f llama : use LLAMA_TOKEN_NULL (#11062) hace 1 año
  fairydreaming 9394bbd484 llama : Add support for DeepSeek V3 (#11049) hace 1 año
  Georgi Gerganov f66f582927 llama : refactor `src/llama.cpp` (#10902) hace 1 año
  Georgi Gerganov 0bf2d10c55 tts : add OuteTTS support (#10784) hace 1 año
  Georgi Gerganov 644fd71b44 sampling : refactor + optimize penalties sampler (#10803) hace 1 año
  HimariO ba1cb19cdd llama : add Qwen2VL support + multimodal RoPE (#10361) hace 1 año
  kallewoof 484d2f31ae bug-fix: snprintf prints NULL in place of the last character (#10419) hace 1 año
  Djip007 19d8762ab6 ggml : refactor online repacking (#10446) hace 1 año
  Riccardo Orlando 6fe6247831 llama : add Minerva 7B model support (#10673) hace 1 año