Commit historia

Upphovsman SHA1 Meddelande Datum
  Daniel Bevenius 5598f475be server : remove CPPHTTPLIB_NO_EXCEPTIONS define (#11622) 11 månader sedan
  Georgi Gerganov 8ec05832fa sync : ggml 11 månader sedan
  Johannes Gäßler 21c84b5d2d CUDA: fix Volta FlashAttention logic (#11615) 11 månader sedan
  mashdragon d92cb67e37 server : (webui) Fix Shift+Enter handling (#11609) 11 månader sedan
  Johannes Gäßler 6eecde3cc8 HIP: fix flash_attn_stream_k_fixup warning (#11604) 11 månader sedan
  uvos 396856b400 CUDA/HIP: add support for selectable warp size to mmv (#11519) 11 månader sedan
  uvos 4d0598e144 HIP: add GGML_CUDA_CC_IS_* for amd familys as increasing cc archtectures for amd gpus are not supersets of eatch other (#11601) 11 månader sedan
  Olivier Chafik 90f9b88afb nit: more informative crash when grammar sampler fails (#11593) 11 månader sedan
  Johannes Gäßler 864a0b67a6 CUDA: use mma PTX instructions for FlashAttention (#11583) 11 månader sedan
  Eric Curtin 84ec8a58f7 Name colors (#11573) 11 månader sedan
  Olivier Chafik bfcce4d693 `tool-call`: support Command R7B (+ return tool_plan "thoughts" in API) (#11585) 11 månader sedan
  Olivier Chafik 69804487e0 Fix exotic ci env that lacks ostringstream::str (#11581) 11 månader sedan
  Michał Moskal ff227703d6 sampling : support for llguidance grammars (#10224) 11 månader sedan
  piDack 0cec062a63 llama : add support for GLM-Edge and GLM-Edge-V series models (#10573) 11 månader sedan
  Olivier Chafik 53debe6f3c ci: use sccache on windows HIP jobs (#11553) 11 månader sedan
  Olivier Chafik cfd74c86db `sync`: minja (https://github.com/google/minja/commit/418a2364b56dc9be4ed9a1a2b0fb16fb53a7a22e) (#11574) 11 månader sedan
  Eric Curtin ecef206ccb Implement s3:// protocol (#11511) 11 månader sedan
  Olivier Chafik 5bbc7362cb ci: simplify cmake build commands (#11548) 11 månader sedan
  Olivier Chafik aa6fb13213 `ci`: use sccache on windows instead of ccache (#11545) 11 månader sedan
  Olivier Chafik a83f528688 `tool-call`: fix llama 3.x and functionary 3.2, play nice w/ pydantic_ai package, update readme (#11539) 11 månader sedan
  Olivier Chafik b1bcd309fc fix stop regression (#11543) 11 månader sedan
  Olivier Chafik 5783575c9d Fix chatml fallback for unsupported builtin templates (when --jinja not enabled) (#11533) 11 månader sedan
  Olivier Chafik 4a2b196d03 server : fix --jinja when there's no tools or schema (typo was forcing JSON) (#11531) 11 månader sedan
  Steve Grubb 1bd3047a93 common: Add missing va_end (#11529) 11 månader sedan
  Daniel Bevenius a2df2787b3 server : update help metrics processing/deferred (#11512) 11 månader sedan
  Olivier Chafik 553f1e46e9 `ci`: ccache for all github worfklows (#11516) 11 månader sedan
  Olivier Chafik 8b576b6c55 Tool call support (generic + native for Llama, Functionary, Hermes, Mistral, Firefunction, DeepSeek) w/ lazy grammars (#9639) 11 månader sedan
  uvos 27d135c970 HIP: require at least HIP 5.5 11 månader sedan
  uvos 6af1ca48cb HIP: Prepare reduction operators for wave 64 11 månader sedan
  uvos c300e68ef4 CUDA/HIP: add warp_size to cuda_device_info 11 månader sedan