Histórico de Commits

Autor SHA1 Mensagem Data
  wwoodsTM 5107e8cea3 DRY: Fixes clone functionality (#10192) há 1 ano atrás
  snadampal 2319126a70 fix q4_0_8_8 format for corrupted tokens issue (#10198) há 1 ano atrás
  Zhiyuan Li 3bcd40b3c5 Optimize RWKV6 Operator Naming and Implement Multi-core CPU/ SYCL Acceleration (#10133) há 1 ano atrás
  Georgi Gerganov 5c333e0140 metal : add BF16 support (#8439) há 1 ano atrás
  Georgi Gerganov b11f9ba9b8 server : remove hack for extra parallel slot (#10187) há 1 ano atrás
  Diego Devesa 94d8cb8be1 metal : fix from ptr buffer name (#10189) há 1 ano atrás
  Georgi Gerganov 1dc04b2dee ggml : adjust is_first_call init value (#10193) há 1 ano atrás
  Georgi Gerganov a1eaf6a960 metal : add quantized FA support (#10149) há 1 ano atrás
  Gabe Goodhart b8deef0ec0 llama : add <|tool_call|> formatting to Granite template (#10177) há 1 ano atrás
  Diego Devesa a9e8a9a030 ggml : fix arch check in bf16_to_fp32 (#10164) há 1 ano atrás
  Eve 3407364776 Q6_K AVX improvements (#10118) há 1 ano atrás
  Diego Devesa d5a409e57f ggml : fix gelu tables initialization (#10172) há 1 ano atrás
  Diego Devesa 401558b7ba ggml : fix q4xx mat mul, increase ggml_aligned_malloc alignment (#10167) há 1 ano atrás
  Xuan Son Nguyen 9e0ecfb697 server : clarify /slots endpoint, add is_processing (#10162) há 1 ano atrás
  snadampal 6a066b9978 fix build break on arm64 linux (#10166) há 1 ano atrás
  Diego Devesa ea02c753eb cuda : clear error after changing peer access (#10153) há 1 ano atrás
  Georgi Gerganov 05697f670b metal : simplify f16 and f32 dequant kernels (#0) há 1 ano atrás
  Georgi Gerganov f8e58135cf metal : move dequantize templates to beginning of MSL source (#0) há 1 ano atrás
  leo-pony 329ed914c9 CANN: adjust backend registry refactor. (#10158) há 1 ano atrás
  Georgi Gerganov ce027adfb3 sync : ggml há 1 ano atrás
  Yuri Khrustalev 284e5b0275 cmake : make it possible linking ggml as external lib (ggml/1003) há 1 ano atrás
  Plamen Minev e2292aaa17 metal : fix minor string leaks (ggml/1004) há 1 ano atrás
  Diego Devesa 9f40989351 ggml : move CPU backend to a separate file (#10144) há 1 ano atrás
  Georgi Gerganov 08828a6d7d metal : minor fixup in FA kernel (#10143) há 1 ano atrás
  Georgi Gerganov 1839f69130 flake.lock: Update (#10146) há 1 ano atrás
  Christian Köhnenkamp 9830b6923b Add apple arm to presets (#10134) há 1 ano atrás
  sasha0552 42cadc74bd server : fix slot selection by lru (#10126) há 1 ano atrás
  Georgi Gerganov 45950415ed server : fix endpoint checks (#10135) há 1 ano atrás
  Georgi Gerganov 1926d6e39d llama : adjust default context size + print warnings (#10136) há 1 ano atrás
  Diego Devesa b634f8a26f simple-chat : only add bos on first prompt (#10129) há 1 ano atrás