Historie revizí

Autor SHA1 Zpráva Datum
  Alexey Parfenov 6dcc02d244 server : add "samplers" param to control the samplers order (#5494) před 1 rokem
  bmwl f486f6e1e5 ggml : add numa options (#5377) před 1 rokem
  Alexey Parfenov a803333a4e common : use enums for sampler types (#5418) před 1 rokem
  Jared Van Bortel 1ec3332ade YaRN : store rope scaling type as int32_t in memory (#5285) před 1 rokem
  Georgi Gerganov 5cb04dbc16 llama : remove LLAMA_MAX_DEVICES and LLAMA_SUPPORTS_GPU_OFFLOAD (#5240) před 2 roky
  Kawrakow 6f9939d119 KL-divergence (#5076) před 2 roky
  Kawrakow 7dcbe39d36 Add ability to evauate multiple choice tasks (#5047) před 2 roky
  Kawrakow 682986a08e Add Winogrande evaluation (#5015) před 2 roky
  stduhpf e0324285a5 speculative : threading options (#4959) před 2 roky
  Yann Follet 722d33f34e main : add parameter --no-display-prompt (#4541) před 2 roky
  slaren e7e4df031b llama : ggml-backend integration (#4766) před 2 roky
  Georgi Gerganov 7edefbd79c main : better name for variable n_print (#4874) před 2 roky
  Georgi Gerganov 3ca63b4538 main : disable token count by default (#4874) před 2 roky
  pudepiedj 43f76bf1c3 main : print total token count and tokens consumed so far (#4874) před 2 roky
  Georgi Gerganov 52531fdff8 main : add self-extend support (#4815) před 2 roky
  LeonEricsson 7082d24cec lookup : add prompt lookup decoding example (#4484) před 2 roky
  Georgi Gerganov bcc0eb4591 llama : per-layer KV cache + quantum K cache (#4309) před 2 roky
  Kerfuffle 5aa365d88f llama : allow overriding GGUF metadata when loading model (#4092) před 2 roky
  MaggotHATE 52c8bc3cf3 sampling : custom samplers order (#4285) před 2 roky
  Georgi Gerganov 6b0a7420d0 llama : KV cache view API + better KV cache management (#4170) před 2 roky
  Seb C 881800d1f0 main : Add ChatML functionality to main example (#4046) před 2 roky
  Kerfuffle 91f6499393 Respect tokenizer.ggml.add_bos_token value when tokenizing (#4040) před 2 roky
  Georgi Gerganov 8f961abdc4 speculative : change default p_accept to 0.5 + CLI args (#3919) před 2 roky
  Georgi Gerganov 05816027d6 common : YAYF (yet another YARN fix) (#3925) před 2 roky
  cebtenzzre b12fa0d1c1 build : link against build info instead of compiling against it (#3879) před 2 roky
  cebtenzzre 898aeca90a llama : implement YaRN RoPE scaling (#2268) před 2 roky
  bandoti 0e40806c1c common : allow caller to handle help/argument exceptions (#3715) před 2 roky
  Georgi Gerganov d1031cf49c sampling : refactor init to use llama_sampling_params (#3696) před 2 roky
  Georgi Gerganov 0e89203b51 speculative : add tree-based sampling example (#3624) před 2 roky
  staviq 1a159553f9 tokenizer : special token handling (#3538) před 2 roky