Historial de Commits

Autor SHA1 Mensaje Fecha
  Olivier Chafik 669912d9a5 `tool-call`: fix Qwen 2.5 Coder support, add micro benchmarks, support trigger patterns for lazy grammars (#12034) hace 10 meses
  Vinesh Janarthanan 27e8a23300 sampling: add Top-nσ sampler (#11223) hace 11 meses
  Christian Fillion 7ee953a64a llama : add llama_sampler_init for safe usage of llama_sampler_free (#11727) hace 11 meses
  Olivier Chafik 8b576b6c55 Tool call support (generic + native for Llama, Functionary, Hermes, Mistral, Firefunction, DeepSeek) w/ lazy grammars (#9639) hace 11 meses
  Georgi Gerganov afa8a9ec9b llama : add `llama_vocab`, functions -> methods, naming (#11110) hace 1 año
  Georgi Gerganov 727368c60f llama : use LLAMA_TOKEN_NULL (#11062) hace 1 año
  Georgi Gerganov f66f582927 llama : refactor `src/llama.cpp` (#10902) hace 1 año
  Georgi Gerganov 644fd71b44 sampling : refactor + optimize penalties sampler (#10803) hace 1 año
  wwoodsTM 5107e8cea3 DRY: Fixes clone functionality (#10192) hace 1 año
  Georgi Gerganov 8d8ff71536 llama : remove Tail-Free sampling (#10071) hace 1 año
  wwoodsTM ff252ea48e llama : add DRY sampler (#9702) hace 1 año
  Georgi Gerganov 55e47786e3 llama : default sampling changes + greedy update (#9897) hace 1 año
  Georgi Gerganov 99bd4ac28c llama : infill sampling handle very long tokens (#9924) hace 1 año
  Georgi Gerganov 755a9b2bf0 llama : add infill sampler (#9896) hace 1 año
  MaggotHATE fbc98b748e sampling : add XTC sampler (#9742) hace 1 año
  Georgi Gerganov b0f27361f3 sampling : avoid expensive softmax during greedy sampling (#9605) hace 1 año
  Daniel Bevenius 6443ddd985 llama : use reserve/emplace_back in sampler_sample (#9534) hace 1 año
  Georgi Gerganov 0abc6a2c25 llama : llama_perf + option to disable timings during decode (#9355) hace 1 año
  Gilad S. bd35cb0ae3 feat: remove a sampler from a chain (#9445) hace 1 año
  slaren 49006c67b4 llama : move random seed generation to the samplers (#9398) hace 1 año
  slaren 5fb5e24811 llama : minor sampling refactor (2) (#9386) hace 1 año
  slaren 19f4a7b296 llama : refactor samplers internal implementation (#9370) hace 1 año
  Georgi Gerganov f12295b8a9 llama : fix empty ring buffer push (#9358) hace 1 año
  Georgi Gerganov df270ef745 llama : refactor sampling v2 (#9294) hace 1 año
  Liu Jia 2589292cde Fix a spelling mistake (#9001) hace 1 año
  Georgi Gerganov 938943cdbf llama : move vocab, grammar and sampling into separate files (#8508) hace 1 año