Historie revizí

Autor SHA1 Zpráva Datum
  Shelby Jenkins 106045e7bb readme : add llm_client Rust crate to readme bindings (#11628) před 11 měsíci
  Jhen-Jie Hong f117d84b48 swift : fix llama-vocab api usage (#11645) před 11 měsíci
  Jhen-Jie Hong 534c46b53c metal : use residency set for other platforms (#11648) před 11 měsíci
  Georgi Gerganov 387a1598ca authors : update před 11 měsíci
  Georgi Gerganov 7c9e0ca520 sync : ggml před 11 měsíci
  Christian Kastner 8f8290ada9 cmake: Add ability to pass in GGML_BUILD_NUMBER (ggml/1096) před 11 měsíci
  Georgi Gerganov b34aedd558 ci : do not stale-close roadmap issues před 11 měsíci
  Olivier Chafik cde3833239 `tool-call`: allow `--chat-template chatml` w/ `--jinja`, default to chatml upon parsing issue, avoid double bos (#11616) před 11 měsíci
  Xuan-Son Nguyen b3451785ac server : (webui) revert hacky solution from #11626 (#11634) před 11 měsíci
  Woof Dog 1d1e6a90bc server : (webui) allow typing and submitting during llm response (#11626) před 11 měsíci
  Daniel Bevenius 5598f475be server : remove CPPHTTPLIB_NO_EXCEPTIONS define (#11622) před 11 měsíci
  Georgi Gerganov 8ec05832fa sync : ggml před 11 měsíci
  Johannes Gäßler 21c84b5d2d CUDA: fix Volta FlashAttention logic (#11615) před 11 měsíci
  mashdragon d92cb67e37 server : (webui) Fix Shift+Enter handling (#11609) před 11 měsíci
  Johannes Gäßler 6eecde3cc8 HIP: fix flash_attn_stream_k_fixup warning (#11604) před 11 měsíci
  uvos 396856b400 CUDA/HIP: add support for selectable warp size to mmv (#11519) před 11 měsíci
  uvos 4d0598e144 HIP: add GGML_CUDA_CC_IS_* for amd familys as increasing cc archtectures for amd gpus are not supersets of eatch other (#11601) před 11 měsíci
  Olivier Chafik 90f9b88afb nit: more informative crash when grammar sampler fails (#11593) před 11 měsíci
  Johannes Gäßler 864a0b67a6 CUDA: use mma PTX instructions for FlashAttention (#11583) před 11 měsíci
  Eric Curtin 84ec8a58f7 Name colors (#11573) před 11 měsíci
  Olivier Chafik bfcce4d693 `tool-call`: support Command R7B (+ return tool_plan "thoughts" in API) (#11585) před 11 měsíci
  Olivier Chafik 69804487e0 Fix exotic ci env that lacks ostringstream::str (#11581) před 11 měsíci
  Michał Moskal ff227703d6 sampling : support for llguidance grammars (#10224) před 11 měsíci
  piDack 0cec062a63 llama : add support for GLM-Edge and GLM-Edge-V series models (#10573) před 11 měsíci
  Olivier Chafik 53debe6f3c ci: use sccache on windows HIP jobs (#11553) před 11 měsíci
  Olivier Chafik cfd74c86db `sync`: minja (https://github.com/google/minja/commit/418a2364b56dc9be4ed9a1a2b0fb16fb53a7a22e) (#11574) před 11 měsíci
  Eric Curtin ecef206ccb Implement s3:// protocol (#11511) před 11 měsíci
  Olivier Chafik 5bbc7362cb ci: simplify cmake build commands (#11548) před 11 měsíci
  Olivier Chafik aa6fb13213 `ci`: use sccache on windows instead of ccache (#11545) před 11 měsíci
  Olivier Chafik a83f528688 `tool-call`: fix llama 3.x and functionary 3.2, play nice w/ pydantic_ai package, update readme (#11539) před 11 měsíci