Historial de Commits

Autor SHA1 Mensaje Fecha
  Neo Zhang Jianyu d4f220a5cc support/fix OPs GGML_TYPE_IQ4_NL, GGML_TYPE_IQ4_XS, GGML_TYPE_IQ3_XXS, GGML_TYPE_IQ3_S, GGML_TYPE_IQ2_XXS, GGML_TYPE_IQ2_XS, GGML_TYPE_IQ2_S, GGML_TYPE_IQ1_S, GGML_TYPE_IQ1_M (#6521) hace 1 año
  Georgi Gerganov 54ea0698fb sync : ggml hace 1 año
  Daniel Bevenius b66aec675c backend : fix typo in scheduler documentation (ggml/781) hace 1 año
  Clint Herron 57dd02c44b Tests: Added integration tests for GBNF parser (#6472) hace 1 año
  Pierrick Hymbert 75cd4c7729 ci: bench: support sse and fix prompt processing time / server: add tokens usage in stream OAI response (#6495) hace 1 año
  Brian a8bd14d557 gguf.py : add licence and version to gguf writer (#6504) hace 1 año
  Hoang Nguyen d0f5deebf8 readme : update UI list (#6503) hace 1 año
  Ting Sun 87e21bbacd bench : make n_batch and n_ubatch configurable in Batched bench (#6500) hace 1 año
  Ouadie EL FAROUKI 1b496a745c [SYCL] Fixed minor bug when enabling FP16 for non intel targets (#6464) hace 1 año
  alexpinel a307375c02 readme : add Dot to UI list (#6487) hace 1 año
  Jun Jie b660a5729e readme : fix typo (#6481) hace 1 año
  Ed Lepedus 0a1d889e27 server: add cURL support to server Dockerfiles (#6474) hace 1 año
  Minsoo Cheong 7dda1b727e ci: exempt master branch workflows from getting cancelled (#6486) hace 1 año
  Ewout ter Hoeven c666ba26c3 build CI: Name artifacts (#6482) hace 1 año
  Shakhar Dasgupta 2e66913e5f server: allow penalizing repetition of newlines on server webpage (#6431) hace 1 año
  Pierrick Hymbert 8120efee1d ci: bench fix concurrency for workflow trigger dispatch with sha1 (#6478) hace 1 año
  limitedAtonement a74401f0e5 Correct README link (#6458) hace 1 año
  Pierrick Hymbert 7a2c92637a ci: bench: add more ftype, fix triggers and bot comment (#6466) hace 1 año
  Daniel Bevenius 4bcd6b959c common: remove duplicate check for curl (#6471) hace 1 año
  Clint Herron 9b84ae1806 examples : add GBNF validator program (#5948) hace 1 año
  Georgi Gerganov 4399f13fb9 server : remove obsolete --memory-f32 option hace 1 año
  Xiao-Yong Jin 1a43c7254e server : add option to disable KV offload (#6468) hace 1 año
  Clint Herron 72d73af651 convert : fix for lint error complaining of bare except (#6470) hace 1 año
  Fattire 5fb1574c81 A few small fixes to server's README docs (#6428) hace 1 año
  JH23X 60cdf40cc3 server : handle exception on wrong type in request (#6452) hace 1 año
  bryanSwk bb43cf7e9d llama : add SEA-LION support (#6448) hace 1 año
  Ewout ter Hoeven 9f62c0173d ci : update checkout, setup-python and upload-artifact to latest (#6456) hace 1 año
  Ed Lepedus 5d4f12e462 server: add cURL support to `server.Dockerfile` (#6461) hace 1 año
  Francisco Melo 154d4ee39c readme : add feature-rich rust bindings (#6465) hace 1 año
  Joyce e69945d953 security : create policy (#6354) hace 1 año