Historie revizí

Autor SHA1 Zpráva Datum
  Ed Addario fa4a9f2a1c quantize : handle user-defined pruning of whole layers (blocks) (#13037) před 6 měsíci
  Ed Addario 30e5b01de2 quantize : change int to unsigned int for KV overrides (#14197) před 7 měsíci
  Ed Addario e5c834f718 quantize : improve tensor-type pattern matching (#13033) před 8 měsíci
  Johannes Gäßler 10d2af0eaa llama/ggml: add LLM training support (#10544) před 8 měsíci
  Ed Addario 71e90e8813 quantize: Handle user-defined quantization levels for additional tensors (#12511) před 9 měsíci
  Diego Devesa e0e912f49b llama : add option to override model tensor buffers (#11397) před 9 měsíci
  Molly Sophia 7dfad387e3 llama: Add support for RWKV v7 architecture (#12412) před 10 měsíci
  Xuan Son Nguyen 681149ced2 llama : add `llama_model_load_from_splits` (#11255) před 1 rokem
  Georgi Gerganov afa8a9ec9b llama : add `llama_vocab`, functions -> methods, naming (#11110) před 1 rokem
  Molly Sophia ee7136c6d1 llama: add support for QRWKV6 model architecture (#11001) před 1 rokem
  Georgi Gerganov c07d437bbd llama : avoid hardcoded QK_K (#11061) před 1 rokem
  Johannes Gäßler 53ff6b9b9f GGUF: C++ refactor, backend support, misc fixes (#11030) před 1 rokem
  Georgi Gerganov 5047dd3546 llama : use _impl suffix instead of _internal (#11060) před 1 rokem
  Georgi Gerganov f66f582927 llama : refactor `src/llama.cpp` (#10902) před 1 rokem