Commit History

Autor SHA1 Mensaxe Data
  Masaya, Kato da3913d8f9 batched: fix n_predict parameter (#8527) hai 1 ano
  Georgi Gerganov d65a8361fe llama : disable context-shift for DeepSeek v2 (#8501) hai 1 ano
  Johannes Gäßler 5e116e8dd5 make/cmake: add missing force MMQ/cuBLAS for HIP (#8515) hai 1 ano
  Brian 1666f92dcd gguf-hash : update clib.json to point to original xxhash repo (#8491) hai 1 ano
  Steve Bonds 37b12f92ab export-lora : handle help argument (#8497) hai 1 ano
  Georgi Gerganov 0efec57787 llama : valign + remove unused ftype (#8502) hai 1 ano
  compilade 7acfd4e8d5 convert_hf : faster lazy safetensors (#8482) hai 1 ano
  Xuan Son Nguyen 97bdd26eee Refactor lora adapter support (#8332) hai 1 ano
  Xuan Son Nguyen 4db8f60fe7 fix ci (#8494) hai 1 ano
  Daniel Bevenius 8fac431b06 ggml : suppress unknown pragma 'GCC' on windows (#8460) hai 1 ano
  M-A f17f39ff9c server: update README.md with llama-server --help output [no ci] (#8472) hai 1 ano
  Georgi Gerganov 9104bc20ed common : add --no-cont-batching arg (#6358) hai 1 ano
  NikolaiLyssogor fc690b018e docs: fix links in development docs [no ci] (#8481) hai 1 ano
  Meng, Hengyu 16bdfa42ac [SYCL] add concat through dim 1/2 (#8483) hai 1 ano
  Georgi Gerganov 3dfda05956 llama : de-duplicate deepseek2 norm hai 1 ano
  0cc4m bda62d7999 Vulkan MMQ Fix (#8479) hai 1 ano
  compilade 090fca7a07 pydantic : replace uses of __annotations__ with get_type_hints (#8474) hai 1 ano
  Georgi Gerganov aaab2419ea flake.lock: Update (#8475) hai 1 ano
  Georgi Gerganov 73cf442e7b llama : fix Gemma-2 Query scaling factors (#8473) hai 1 ano
  Brian e236528e76 gguf_hash.py: Add sha256 (#8470) hai 1 ano
  compilade fa79495bb4 llama : fix pre-tokenization of non-special added tokens (#8228) hai 1 ano
  bandoti 17eb6aa8a9 vulkan : cmake integration (#8119) hai 1 ano
  Georgi Gerganov c917b67f06 metal : template-ify some of the kernels (#8447) hai 1 ano
  Georgi Gerganov 4e24cffd8c server : handle content array in chat API (#8449) hai 1 ano
  Georgi Gerganov 6af51c0d96 main : print error on empty input (#8456) hai 1 ano
  Daniel Bevenius f53226245f llama : suppress unary minus operator warning (#8448) hai 1 ano
  Douglas Hanley c3ebcfa148 server : ensure batches are either all embed or all completion (#8420) hai 1 ano
  Armen Kaleshian 8a4441ea1a docker : fix filename for convert-hf-to-gguf.py in tools.sh (#8441) hai 1 ano
  Jiří Podivín 5aefbce27a convert : remove fsep token from GPTRefactForCausalLM (#8237) hai 1 ano
  Georgi Gerganov 71c1121d11 examples : sprintf -> snprintf (#8434) hai 1 ano