Commit Verlauf

Autor SHA1 Nachricht Datum
  Douglas Hanley cdd1889de6 convert : add support for XLMRoberta embedding models (#8658) vor 1 Jahr
  Mengqing Cao c21a896405 [CANN]: Fix ggml_backend_cann_buffer_get_tensor (#8871) vor 1 Jahr
  Neo Zhang d4ff847153 [SYCL] correct cmd name (#8877) vor 1 Jahr
  Liu Jia 0a4ce78681 common : Changed tuple to struct (TODO fix) (#8823) vor 1 Jahr
  wangshuai09 bc0f887e15 cann: fix buffer_num and runtime speed slowly error (#8865) vor 1 Jahr
  Eric Curtin b42978e7e4 readme : add ramalama to the availables UI (#8811) vor 1 Jahr
  Justine Tunney b9dfc25ca3 ggml : fix overflows in elu function (#8866) vor 1 Jahr
  Brian 1ef14b3007 py: Add more authorship metadata from model card (#8810) vor 1 Jahr
  fairydreaming d3f0c7166a Stop the generation when <|eom_id|> token is encountered - needed for Llama 3.1 tool call support (#8858) vor 1 Jahr
  stduhpf e31a4f6797 cmake: fix paths for vulkan shaders compilation on Windows (#8573) vor 1 Jahr
  BarfingLemurs 400ae6f65f readme : update model list (#8851) vor 1 Jahr
  Georgi Gerganov f1ea5146d7 llama : better replace_all (#8852) vor 1 Jahr
  0cc4m 064cdc265f vulkan : fix Qantized Mat-Vec Mul on AMD GPUs for ncols < 64 (#8855) vor 1 Jahr
  Georgi Gerganov 5587e57a76 sync : ggml vor 1 Jahr
  0cc4m a3738b2fa7 vulkan : implement Stable Diffusion operators (ggml/904) vor 1 Jahr
  Daniel Bevenius 655858ace0 ggml : move c parameter comment to ggml_rope_ext (ggml/901) vor 1 Jahr
  wangshuai09 c02b0a8a4d cann: support q4_0 model (#8822) vor 1 Jahr
  Brandon Squizzato 0d6fb52be0 Install curl in runtime layer (#8693) vor 1 Jahr
  ardfork 978ba3d83d Server: Don't ignore llama.cpp params (#8754) vor 1 Jahr
  Brian Cunnie ecf6b7f23e batched-bench : handle empty `-npl` (#8839) vor 1 Jahr
  Daniel Bevenius 01aae2b497 baby-llama : remove duplicate vector include vor 1 Jahr
  Georgi Gerganov 4b77ea95f5 flake.lock: Update (#8847) vor 1 Jahr
  jdomke 76614f352e ggml : reading the runtime sve config of the cpu (#8709) vor 1 Jahr
  Sigbjørn Skjæret b72c20b85c Fix conversion of unnormalized BF16->BF16 weights (#7843) vor 1 Jahr
  Mengqing Cao e09a800f9a cann: Fix ggml_cann_im2col for 1D im2col (#8819) vor 1 Jahr
  Ouadie EL FAROUKI 0fbbd88458 [SYCL] Fixing wrong VDR iq4nl value (#8812) vor 1 Jahr
  matteo afbb4c1322 ggml-cuda: Adding support for unified memory (#8035) vor 1 Jahr
  Alex O'Connell b7a08fd5e0 Build: Only include execinfo.h on linux systems that support it (#8783) vor 1 Jahr
  slaren 7a11eb3a26 cuda : fix dmmv cols requirement to 2*GGML_CUDA_DMMV_X (#8800) vor 1 Jahr
  wangshuai09 c8a0090922 cann: support q8_0 for Ascend backend (#8805) vor 1 Jahr