Historial de Commits

Autor SHA1 Mensaje Fecha
  Neo Zhang 0d5cef78ae [SYCL] update CI with oneapi 2024.1 (#7235) hace 1 año
  Johannes Gäßler dc685be466 CUDA: add FP32 FlashAttention vector kernel (#7188) hace 1 año
  Georgi Gerganov 6f1b63606f cmake : fix version cmp (#7227) hace 1 año
  slaren b228aba91a remove convert-lora-to-ggml.py (#7204) hace 1 año
  Georgi Gerganov 7bd4ffb780 metal : fix warnings (skipme) (#0) hace 1 año
  Georgi Gerganov 1622ac023f sync : ggml hace 1 año
  Georgi Gerganov 6aeff24f8b metal : fix indent (ggml/0) hace 1 año
  Georgi Gerganov 325756d28d ggml : resolve merge (ggml/0) hace 1 año
  Josh Ramer fed0108491 Scripting & documenting debugging one test without anything else in the loop. (#7096) hace 1 año
  Xuan Son Nguyen 72c177c1f6 fix system prompt handling (#7153) hace 1 año
  compilade 5a419926b0 convert-hf : support bfloat16 conversion (#7158) hace 1 año
  Georgi Gerganov fae9d234b6 sync : ggml hace 1 año
  Justina Cho f5ef34e428 feat: implemented sigmoid function (ggml/806) hace 1 año
  Borislav Stanimirov ef0d5e3ec9 build: fix and ignore msvc warnings (ggml/805) hace 1 año
  CrispStrobe 3292733f95 convert : skip unaccessible HF repos (#7210) hace 1 año
  Steve Grubb 988631335a server : free llama_batch on exit (#7212) hace 1 año
  Haoxiang Fei f99e1e456e llama : lookup word in vocab before doing BPE merges (#7193) hace 1 año
  Johannes Gäßler 5ae3426b0b server: fix reported top tokens for temperature 0 (#7203) hace 1 año
  Joan Fontanals b83cc3f5b3 llama : add Jina Embeddings architecture (#6826) hace 1 año
  Georgi Gerganov 9cb317f77e ggml : full ALiBi support (#7192) hace 1 año
  slaren e849648888 llama-bench : add pp+tg test type (#7199) hace 1 año
  Georgi Gerganov 18e437665c metal : fix flash attention kernel requirements (#7169) hace 1 año
  Georgi Gerganov 8c660242d7 convert : print "ignore_merges" field hace 1 año
  slaren 25c6e82e7a llama : use n_vocab to differentiate between mistral 7B and llama3 8B (#7200) hace 1 año
  Justine Tunney 4e3880978f Fix memory bug in grammar parser (#7194) hace 1 año
  HanishKVC f89fe2732c Main+: optionally allow special tokens from user in interactive mode (#7097) hace 1 año
  Andrei d11afd6652 llava : fix moondream support (#7163) hace 1 año
  Ouadie EL FAROUKI 8c570c9496 Minor arithmetic improvement to mmvq wrapper kernel (#7172) hace 1 año
  slaren eaf4bd8b39 eval-callback : fix conversion to float (#7184) hace 1 año
  0cc4m befddd0f15 Vulkan Bugfixes and Improvements (#7084) hace 1 año