Historie revizí

Autor SHA1 Zpráva Datum
  Kawrakow d25b1c31b0 quantize : be able to override metadata by key (#6321) před 1 rokem
  Minsoo Cheong deb7240100 embedding : adjust `n_ubatch` value (#6296) před 1 rokem
  Jan Boon 3d032ece8e server : add `n_discard` parameter (#6300) před 1 rokem
  Joseph Stahl e190f1fca6 nix: make `xcrun` visible in Nix sandbox for precompiling Metal shaders (#6118) před 1 rokem
  slaren 280345968d cuda : rename build flag to LLAMA_CUDA (#6299) před 1 rokem
  Christian Kögler b06c16ef9f nix: fix blas support (#6281) před 1 rokem
  Kawrakow 1f2fd4e727 tests : include IQ2_XXS and IQ2_XS in test-quantize-fns (#6303) před 1 rokem
  Georgi Gerganov 43139cc528 flake.lock: Update (#6266) před 1 rokem
  slaren 2f34b865b6 cuda : fix LLAMA_CUDA_F16 build (#6298) před 1 rokem
  slaren ae1f211ce2 cuda : refactor into multiple files (#6269) před 1 rokem
  Xuan Son Nguyen ad3a0505e3 Server: clean up OAI params parsing function (#6284) před 1 rokem
  Neo Zhang Jianyu 95ad616cdd [SYCL] fix SYCL backend build on windows is break by LOG() error (#6290) před 1 rokem
  Minsoo Cheong 64e7b47c69 examples : add "retrieval" (#6193) před 1 rokem
  Justine Tunney 7733f0c760 ggml : support AVX512VNNI (#6280) před 1 rokem
  Rick G a32b77c4b2 Fix heap corruption from wmode out-of-bound writes on windows (#6272) před 1 rokem
  Georgi Gerganov a0e584defd imatrix : fix wname for mul_mat_id ops (#6271) před 1 rokem
  Johannes Gäßler 7aed0ffe68 Fixed lookup compilation issues on Windows (#6273) před 1 rokem
  Pierrick Hymbert ea279d5609 ci : close inactive issue, increase operations per run (#6270) před 1 rokem
  Minsoo Cheong 586e7bc561 sampling : deduplicated code for probability distribution access (#6240) před 1 rokem
  Meng, Hengyu ddf6568510 [SYCL] offload op (#6217) před 1 rokem
  Neo Zhang Jianyu d03224ac98 Support build win release for SYCL (#6241) před 1 rokem
  Jared Van Bortel 94d1b3b411 use _wfopen instead of fopen on Windows (#6248) před 1 rokem
  Georgi Gerganov 95562175f8 gitignore : gguf-split před 1 rokem
  Pierrick Hymbert f482bb2e49 common: llama_load_model_from_url split support (#6192) před 1 rokem
  Pierrick Hymbert 1997577d5e server: docs: `--threads` and `--threads`, `--ubatch-size`, `--log-disable` (#6254) před 1 rokem
  Julius Arkenberg 476b0251b2 llama : add grok-1 support (#6204) před 1 rokem
  Pierrick Hymbert 21cad01b6e split: add gguf-split in the make build target (#6262) před 1 rokem
  Pierrick Hymbert 1b26aebe4d server: flush stdout after logging in both text and json layout (#6253) před 1 rokem
  Johannes Gäßler 50ccaf5eac lookup: complement data from context with general text statistics (#5479) před 1 rokem
  Georgi Gerganov 56a00f0a2f common : default --hf-file to --model (#6234) před 1 rokem