Historial de Commits

Autor SHA1 Mensaje Fecha
  Georgi Gerganov 3ca63b4538 main : disable token count by default (#4874) hace 2 años
  Georgi Gerganov b037787548 swift : track ggml release branch (#4867) hace 2 años
  Kawrakow 469e75d0a3 llama : restore intended k-quants mixes for MoE models (#4872) hace 2 años
  Kawrakow 49662cbed3 ggml : SOTA 2-bit quants (add IQ2_XS) (#4856) hace 2 años
  Georgi Gerganov 3ba5b8ca8e swift : pin ggml commit + remove ggml.h from spm-headers (#4878) hace 2 años
  Laura 4330bd83fe server : implement credentialed CORS (#4514) hace 2 años
  Michael Coppola 27379455c3 server : support for multiple api keys (#4864) hace 2 años
  Behnam M eab6795006 server : add `LOG_INFO` when model is successfully loaded (#4881) hace 2 años
  Someone d8d90aa343 ci: nix-flake-update: new token with pr permissions (#4879) hace 2 años
  pudepiedj 43f76bf1c3 main : print total token count and tokens consumed so far (#4874) hace 2 años
  Isaac McFadyen 2f043328e3 server : fix typo in model name (#4876) hace 2 años
  Paul Tsochantaris 2a7c94db5f metal : put encoder debug group behind a define (#4873) hace 2 años
  Georgi Gerganov 64802ec00d sync : ggml hace 2 años
  Georgi Gerganov 3267c2abc7 metal : fix deprecation warning (ggml/690) hace 2 años
  Timothy Cronin f85a973aa1 ggml : remove ggml_cpy_inplace and ggml_cont_inplace (ggml/693) hace 2 años
  Jack Mousseau 5362e43962 metal : wrap each operation in debug group (ggml/690) hace 2 años
  leejet e739de7909 ggml : change GGML_MAX_NAME at compile time (ggml/682) hace 2 años
  Halalaluyafail3 c910e3c28a Fix execlp call (ggml/689) hace 2 años
  Erik Scholz f34432ca1e fix : cuda order of synchronization when setting a buffer (ggml/679) hace 2 años
  Behnam M 7a9f75c38b server : update readme to document the new `/health` endpoint (#4866) hace 2 años
  Georgi Gerganov 5c1980d8d4 server : fix build + rename enums (#4870) hace 2 años
  Behnam M cd108e641d server : add a `/health` endpoint (#4860) hace 2 años
  Brian 57d016ba2d llama : add additional suffixes for model params (#4834) hace 2 años
  Austin 329ff61569 llama : recognize 1B phi models (#4847) hace 2 años
  John d34633d8db clip : support more quantization types (#4846) hace 2 años
  Johannes Gäßler 4f56458d34 Python script to compare commits with llama-bench (#4844) hace 2 años
  Austin 6efb8eb30e convert.py : fix vanilla LLaMA model conversion (#4818) hace 2 años
  Justine Tunney 36e5a08b20 llava-cli : don't crash if --image flag is invalid (#4835) hace 2 años
  Georgi Gerganov 4dccb38d9a metal : improve dequantize precision to match CPU (#4836) hace 2 años
  Georgi Gerganov 9a818f7c42 scripts : improve get-pg.sh (#4838) hace 2 años