Historie revizí

Autor SHA1 Zpráva Datum
  Georgi Gerganov 3637576288 server : disable speculative decoding for SWA models (#13970) před 7 měsíci
  Georgi Gerganov ea394d7ab1 metal : use F32 accumulators in FA kernels (#13975) před 7 měsíci
  Georgi Gerganov 5582c49c39 gemma : more consistent attention scaling for v2 and v3 (#13951) před 7 měsíci
  Olivier Chafik c9bbc77931 `server`: update deepseek reasoning format (pass reasoning_content as diffs) (#13933) před 7 měsíci
  Xuan-Son Nguyen bfd322796c mtmd : fix memory leak in mtmd_helper_eval_chunk_single (#13961) před 7 měsíci
  shalinib-ibm 093e3f1feb cmake : Handle mixed-case 'Power' strings in POWER CPU detection (#13966) před 7 měsíci
  Atharva Dubey 663445b0de sycl: quantize and reorder the input to q8_1 when reorder is enabled (#13826) před 7 měsíci
  Johannes Gäßler 7675c555a1 gguf: fix failure on version == 0 (#13956) před 7 měsíci
  Sigbjørn Skjæret 5e1c3aed40 convert : fix nomic-bert-moe mask token (#13757) před 7 měsíci
  Sigbjørn Skjæret c496fe0b1d convert : fix vocab padding code for bert models (#13954) před 7 měsíci
  Aaron Teo e57bb87ced ggml: check if non-native endian model is being loaded (#13943) před 7 měsíci
  Georgi Gerganov f3a4b1659c sync : ggml před 7 měsíci
  Kai Pastor 108009f5c7 vulkan : Remove unexpected ; (ggml/1253) před 7 měsíci
  Kai Pastor d337252acf cmake : Fix broken CMake error messages (ggml/1252) před 7 měsíci
  Radoslav Gerganov af6f91db47 ggml : remove ggml_graph_import and ggml_graph_export declarations (ggml/1247) před 7 měsíci
  Georgi Gerganov a7b8d35f78 sync : whisper.cpp (ggml/1250) před 7 měsíci
  Radoslav Gerganov 6eba72b71c ggml : install dynamic backends (ggml/1240) před 7 měsíci
  Daniel Tang fedf034a98 ggml : Print backtrace on uncaught C++ exceptions (ggml/1232) před 7 měsíci
  ddh0 8726392d3d readme : update bindings (#13950) před 7 měsíci
  Georgi Gerganov c04621711a parallel : fix n_junk == 0 (#13952) před 7 měsíci
  Georgi Gerganov 0fc16b42e8 kv-cache : split implementation in separate sources (#13920) před 7 měsíci
  Max Krasnyansky 053b1539c0 threading: support for GGML_SCHED_PRIO_LOW, update thread info on Windows to avoid throttling (#12995) před 7 měsíci
  Jiří Podivín b3a89c3d9e docs : Note about necessity of having libcurl installed for standard build. (#13945) před 7 měsíci
  Olivier Chafik e15898d1c7 server: allow unclosed thinking tags (#13931) před 7 měsíci
  Georgi Gerganov 803f8baf4f llama : deprecate explicit kv_self defrag/update calls (#13921) před 7 měsíci
  Georgi Gerganov 3600cc2886 llama : use n_swa + n_ubatch cells for SWA cache (#13833) před 7 měsíci
  igardev c7e0a2054b webui : Replace alert and confirm with custom modals. (#13711) před 7 měsíci
  Georgi Gerganov 3f55f781f1 llama : auto-batch preparation (#13845) před 7 měsíci
  Xuan-Son Nguyen 51fa76f172 mtmd : drop `_shared` from `libmtmd` name, merge helpers into libmtmd (⚠️ breaking change) (#13917) před 7 měsíci
  Georgi Gerganov 12d0188c0d kv-cache : refactor + add llama_memory_state_i (#13746) před 7 měsíci