История коммитов

Автор SHA1 Сообщение Дата
  divinity76 2aed77eb06 fix typo "RLIMIT_MLOCK" (#5175) 1 год назад
  Wu Jian Ping c82d18e863 server : embeddings compatibility for OpenAI (#5190) 1 год назад
  Georgi Gerganov 14fef85e2d py : fix except (#5194) 1 год назад
  Sang-Kil Park e76627bcce py : improve BPE tokenizer support (#5189) 1 год назад
  slaren fbe7dfa53c ggml : add max buffer sizes to opencl and metal backends (#5181) 1 год назад
  Eve 172ac82629 cmake : fix Vulkan build (#5182) 1 год назад
  Paul Tsochantaris d2f650cb5b metal : free metal objects (#5161) 2 лет назад
  Georgi Gerganov 35dec26cc2 sync : ggml 2 лет назад
  Georgi Gerganov d460510c72 ggml : minor type fix (int64_t -> size_t) 2 лет назад
  0cc4m 2307523d32 ggml : add Vulkan backend (#2059) 2 лет назад
  Abhilash Majumder 0f648573dd ggml : add unified SYCL backend for Intel GPUs (#2690) 2 лет назад
  Georgi Gerganov b764b8f1d0 flake.lock: Update (#5162) 2 лет назад
  Johannes Gäßler 9241c3a2ac Apply min_p to unsorted tokens (#5115) 2 лет назад
  Johannes Gäßler b2b2bf988c Tests for min_p, sampling queue (#5147) 2 лет назад
  Marcus Dunn af4980bfed readme : add link to rust bindings (#5148) 2 лет назад
  sharpHL f2e69d28c0 llama : add support for Orion-14B (#5118) 2 лет назад
  Kyle Mistele 39baaf55a1 docker : add server-first container images (#5157) 2 лет назад
  John 6db2b41a76 llava : support for Yi-VL and fix for mobileVLM (#5093) 2 лет назад
  Georgi Gerganov 753eafed0e sync : ggml 2 лет назад
  Judd e976423005 ggml : check ggml_add src1 type (ggml/708) 2 лет назад
  Michael Klimenko 35a2ee9143 Remove unused data and add fixes (#5154) 2 лет назад
  Maximilian Winter ec903c0341 server : add self-extend support (#5104) 2 лет назад
  0cc4m a1d6df129b Add OpenCL add kernel (#5151) 2 лет назад
  Jared Van Bortel bbe7c56c99 cmake : pass CPU architecture flags to nvcc (#5146) 2 лет назад
  slaren 62fead3ea0 cuda : fix tensor size calculation for non-split buffer (#5145) 2 лет назад
  slaren 15b4538ff2 ggml-alloc : add 10% margin to the buffer sizes (#5149) 2 лет назад
  snadampal 7032f4f634 ggml : update softmax n_task calculation (#5126) 2 лет назад
  Georgi Gerganov 5f1925a8ce scripts : move run-with-preset.py from root to scripts folder 2 лет назад
  Georgi Gerganov 3b7c914de2 tests : gitignore test-c.o 2 лет назад
  Xuan Son Nguyen 48c857aa10 server : refactored the task processing logic (#5065) 2 лет назад