Commit History

Autor SHA1 Mensaxe Data
  slaren c71bfd736e llama : fix compatibility with old 2 expert models (#6735) hai 1 ano
  Georgi Gerganov 3b8f1ec4b1 llamafile : tmp disable + build sgemm.o when needed (#6716) hai 1 ano
  Yaroslav 8dd1ec8b3f readme : add UI (#6724) hai 1 ano
  Zheng.Deng facb8b56f8 convert : fix autoawq gemma (#6704) hai 1 ano
  Georgi Gerganov 532c1737a1 llama : make general.name optional (#6709) hai 1 ano
  Georgi Gerganov 666867b799 ggml : fix llamafile sgemm wdata offsets (#6710) hai 1 ano
  Justine Tunney 8cc91dc63c ggml : add llamafile sgemm (#6414) hai 1 ano
  Ashish dbceec87c0 llama : add StableLM2 12B (#6635) hai 1 ano
  Shijie f4dea7da18 llama : add qwen2moe (#6074) hai 1 ano
  Daniel Bevenius 8a56075b07 gritlm : add --outdir option to hf.sh script (#6699) hai 1 ano
  Georgi Gerganov 58227ffdeb perplexity : require positive --ctx-size arg (#6695) hai 1 ano
  Daniel Bevenius 4fbd8098e6 gguf : add special tokens metadata for FIM/Infill (#6689) hai 1 ano
  Olivier Chafik 7593639ce3 `main`: add --json-schema / -j flag (#6659) hai 1 ano
  compilade 132f55795e llama : fix restoring the number of outputs from state files (#6687) hai 1 ano
  Pierrick Hymbert 3272896d79 server : revert "minor layout improvements" (#6684) hai 1 ano
  Steven Prichard 7fc16a2c32 swift : linux support (#6590) hai 1 ano
  Neo Zhang Jianyu 17e98d4c96 fix mul_mat_id() for new input, make the ut pass (#6682) hai 1 ano
  David Renshaw 1958f7e06c llama : add missing kv clear in llama_beam_search (#6664) hai 1 ano
  Chao Jiang 04fbc5f23e Add Command R chat template (#6650) hai 1 ano
  Georgi Gerganov f184dd9208 flake.lock: Update (#6669) hai 1 ano
  Dave 422c2aff1c Added support for GGML_OP_CLAMP in Metal (#6662) hai 1 ano
  Sigbjørn Skjæret 8800226d65 Fix --split-max-size (#6655) hai 1 ano
  Jaemin Son e689fc4e91 [bug fix] convert github repository_owner to lowercase (#6673) hai 1 ano
  James A Capozzoli a4ec34e1cd convert : enable the `--use-temp-file` cli flag (#6645) hai 1 ano
  Neo Zhang Jianyu de17e3f745 fix memcpy() crash, add missed cmd in guide, fix softmax (#6622) hai 1 ano
  Johannes Gäßler b5e7285baf CUDA: fix matrix multiplication logic for tests (#6667) hai 1 ano
  Pierrick Hymbert 4bd0f93e4a model: support arch `DbrxForCausalLM` (#6515) hai 1 ano
  Olivier Chafik ab9a3240a9 JSON schema conversion: ⚡️ faster repetitions, min/maxLength for strings, cap number length (#6555) hai 1 ano
  slaren fbbc030ba9 metal : unify mul_mv_id kernels (#6556) hai 1 ano
  Daniel Bevenius 4cc120c744 infill : add download instructions for model (#6626) hai 1 ano