Histórico de Commits

Autor SHA1 Mensagem Data
  Kawrakow cbc8343619 Make IQ1_M work for QK_K = 64 (#6327) há 1 ano atrás
  Sigbjørn Skjæret e562b9714b common : change --no-penalize-nl to --penalize-nl (#6334) há 1 ano atrás
  Georgi Gerganov 2ab4f00d25 llama2c : open file as binary (#6332) há 1 ano atrás
  Mateusz Charytoniuk 1740d6dd4e readme : add php api bindings (#6326) há 1 ano atrás
  Eric Zhang 0642b22cd1 server: public: use relative routes for static files (#6325) há 1 ano atrás
  Neo Zhang Jianyu a4f569e8a3 [SYCL] fix no file in win rel (#6314) há 1 ano atrás
  Jared Van Bortel 32c8486e1f wpm : portable unicode tolower (#6305) há 1 ano atrás
  compilade 557410b8f0 llama : greatly reduce output buffer memory usage (#6122) há 1 ano atrás
  Kawrakow 55c1b2a3bb IQ1_M: 1.75 bpw quantization (#6302) há 1 ano atrás
  Pedro Cuenca e097633f63 convert-hf : fix exception in sentencepiece with added tokens (#6320) há 1 ano atrás
  Kawrakow d25b1c31b0 quantize : be able to override metadata by key (#6321) há 1 ano atrás
  Minsoo Cheong deb7240100 embedding : adjust `n_ubatch` value (#6296) há 1 ano atrás
  Jan Boon 3d032ece8e server : add `n_discard` parameter (#6300) há 1 ano atrás
  Joseph Stahl e190f1fca6 nix: make `xcrun` visible in Nix sandbox for precompiling Metal shaders (#6118) há 1 ano atrás
  slaren 280345968d cuda : rename build flag to LLAMA_CUDA (#6299) há 1 ano atrás
  Christian Kögler b06c16ef9f nix: fix blas support (#6281) há 1 ano atrás
  Kawrakow 1f2fd4e727 tests : include IQ2_XXS and IQ2_XS in test-quantize-fns (#6303) há 1 ano atrás
  Georgi Gerganov 43139cc528 flake.lock: Update (#6266) há 1 ano atrás
  slaren 2f34b865b6 cuda : fix LLAMA_CUDA_F16 build (#6298) há 1 ano atrás
  slaren ae1f211ce2 cuda : refactor into multiple files (#6269) há 1 ano atrás
  Xuan Son Nguyen ad3a0505e3 Server: clean up OAI params parsing function (#6284) há 1 ano atrás
  Neo Zhang Jianyu 95ad616cdd [SYCL] fix SYCL backend build on windows is break by LOG() error (#6290) há 1 ano atrás
  Minsoo Cheong 64e7b47c69 examples : add "retrieval" (#6193) há 1 ano atrás
  Justine Tunney 7733f0c760 ggml : support AVX512VNNI (#6280) há 1 ano atrás
  Rick G a32b77c4b2 Fix heap corruption from wmode out-of-bound writes on windows (#6272) há 1 ano atrás
  Georgi Gerganov a0e584defd imatrix : fix wname for mul_mat_id ops (#6271) há 1 ano atrás
  Johannes Gäßler 7aed0ffe68 Fixed lookup compilation issues on Windows (#6273) há 1 ano atrás
  Pierrick Hymbert ea279d5609 ci : close inactive issue, increase operations per run (#6270) há 1 ano atrás
  Minsoo Cheong 586e7bc561 sampling : deduplicated code for probability distribution access (#6240) há 1 ano atrás
  Meng, Hengyu ddf6568510 [SYCL] offload op (#6217) há 1 ano atrás