Historie revizí

Autor SHA1 Zpráva Datum
  Georgi Gerganov 46323fa9ef metal : hide debug messages from normal log před 1 rokem
  SXX 5b359bb1e3 ggml: fix zero division in ‘dne’ calculation in CUDA COUNT_EQUAL operator when ‘ne’ is small (#10213) před 1 rokem
  amritahs-ibm e89213492d ggml : optimize llamafile cpu matrix multiplication for ppc64le (#10156) před 1 rokem
  haopeng 8fc393f246 scripts : fix pattern and get n_tokens in one go (#10221) před 1 rokem
  Georgi Gerganov ec450d3bbf metal : opt-in compile flag for BF16 (#10218) před 1 rokem
  Georgi Gerganov 695ad752b2 metal : improve clarity (minor) (#10171) před 1 rokem
  Georgi Gerganov 841f27abdb metal : optimize FA kernels (#10171) před 1 rokem
  Jhen-Jie Hong d05b3127bd swift : exclude ggml-metal-embed.metal (#10211) před 1 rokem
  Xuan Son Nguyen 76c6e7f105 server : minor UI fix (#10207) před 1 rokem
  Xuan Son Nguyen a71d81cf8c server : revamp chat UI with vuejs and daisyui (#10175) před 1 rokem
  Georgi Gerganov eec4d71737 scripts : add amx to sync-ggml.sh [no ci] před 1 rokem
  Georgi Gerganov 3b08828674 sync : ggml před 1 rokem
  Georgi Gerganov a2c6fd747c scripts : sync update před 1 rokem
  Diego Devesa 97404c4a03 ggml : add ggml-cpu.h to the public headers (#10204) před 1 rokem
  Faisal Zaghloul 60e17ce23c Remove identical wte/etw logic for jais (#10203) před 1 rokem
  wwoodsTM 5107e8cea3 DRY: Fixes clone functionality (#10192) před 1 rokem
  snadampal 2319126a70 fix q4_0_8_8 format for corrupted tokens issue (#10198) před 1 rokem
  Zhiyuan Li 3bcd40b3c5 Optimize RWKV6 Operator Naming and Implement Multi-core CPU/ SYCL Acceleration (#10133) před 1 rokem
  Georgi Gerganov 5c333e0140 metal : add BF16 support (#8439) před 1 rokem
  Georgi Gerganov b11f9ba9b8 server : remove hack for extra parallel slot (#10187) před 1 rokem
  Diego Devesa 94d8cb8be1 metal : fix from ptr buffer name (#10189) před 1 rokem
  Georgi Gerganov 1dc04b2dee ggml : adjust is_first_call init value (#10193) před 1 rokem
  Georgi Gerganov a1eaf6a960 metal : add quantized FA support (#10149) před 1 rokem
  Gabe Goodhart b8deef0ec0 llama : add <|tool_call|> formatting to Granite template (#10177) před 1 rokem
  Diego Devesa a9e8a9a030 ggml : fix arch check in bf16_to_fp32 (#10164) před 1 rokem
  Eve 3407364776 Q6_K AVX improvements (#10118) před 1 rokem
  Diego Devesa d5a409e57f ggml : fix gelu tables initialization (#10172) před 1 rokem
  Diego Devesa 401558b7ba ggml : fix q4xx mat mul, increase ggml_aligned_malloc alignment (#10167) před 1 rokem
  Xuan Son Nguyen 9e0ecfb697 server : clarify /slots endpoint, add is_processing (#10162) před 1 rokem
  snadampal 6a066b9978 fix build break on arm64 linux (#10166) před 1 rokem