Shelby Jenkins
|
106045e7bb
readme : add llm_client Rust crate to readme bindings (#11628)
|
před 11 měsíci |
Jhen-Jie Hong
|
f117d84b48
swift : fix llama-vocab api usage (#11645)
|
před 11 měsíci |
Jhen-Jie Hong
|
534c46b53c
metal : use residency set for other platforms (#11648)
|
před 11 měsíci |
Georgi Gerganov
|
387a1598ca
authors : update
|
před 11 měsíci |
Georgi Gerganov
|
7c9e0ca520
sync : ggml
|
před 11 měsíci |
Christian Kastner
|
8f8290ada9
cmake: Add ability to pass in GGML_BUILD_NUMBER (ggml/1096)
|
před 11 měsíci |
Georgi Gerganov
|
b34aedd558
ci : do not stale-close roadmap issues
|
před 11 měsíci |
Olivier Chafik
|
cde3833239
`tool-call`: allow `--chat-template chatml` w/ `--jinja`, default to chatml upon parsing issue, avoid double bos (#11616)
|
před 11 měsíci |
Xuan-Son Nguyen
|
b3451785ac
server : (webui) revert hacky solution from #11626 (#11634)
|
před 11 měsíci |
Woof Dog
|
1d1e6a90bc
server : (webui) allow typing and submitting during llm response (#11626)
|
před 11 měsíci |
Daniel Bevenius
|
5598f475be
server : remove CPPHTTPLIB_NO_EXCEPTIONS define (#11622)
|
před 11 měsíci |
Georgi Gerganov
|
8ec05832fa
sync : ggml
|
před 11 měsíci |
Johannes Gäßler
|
21c84b5d2d
CUDA: fix Volta FlashAttention logic (#11615)
|
před 11 měsíci |
mashdragon
|
d92cb67e37
server : (webui) Fix Shift+Enter handling (#11609)
|
před 11 měsíci |
Johannes Gäßler
|
6eecde3cc8
HIP: fix flash_attn_stream_k_fixup warning (#11604)
|
před 11 měsíci |
uvos
|
396856b400
CUDA/HIP: add support for selectable warp size to mmv (#11519)
|
před 11 měsíci |
uvos
|
4d0598e144
HIP: add GGML_CUDA_CC_IS_* for amd familys as increasing cc archtectures for amd gpus are not supersets of eatch other (#11601)
|
před 11 měsíci |
Olivier Chafik
|
90f9b88afb
nit: more informative crash when grammar sampler fails (#11593)
|
před 11 měsíci |
Johannes Gäßler
|
864a0b67a6
CUDA: use mma PTX instructions for FlashAttention (#11583)
|
před 11 měsíci |
Eric Curtin
|
84ec8a58f7
Name colors (#11573)
|
před 11 měsíci |
Olivier Chafik
|
bfcce4d693
`tool-call`: support Command R7B (+ return tool_plan "thoughts" in API) (#11585)
|
před 11 měsíci |
Olivier Chafik
|
69804487e0
Fix exotic ci env that lacks ostringstream::str (#11581)
|
před 11 měsíci |
Michał Moskal
|
ff227703d6
sampling : support for llguidance grammars (#10224)
|
před 11 měsíci |
piDack
|
0cec062a63
llama : add support for GLM-Edge and GLM-Edge-V series models (#10573)
|
před 11 měsíci |
Olivier Chafik
|
53debe6f3c
ci: use sccache on windows HIP jobs (#11553)
|
před 11 měsíci |
Olivier Chafik
|
cfd74c86db
`sync`: minja (https://github.com/google/minja/commit/418a2364b56dc9be4ed9a1a2b0fb16fb53a7a22e) (#11574)
|
před 11 měsíci |
Eric Curtin
|
ecef206ccb
Implement s3:// protocol (#11511)
|
před 11 měsíci |
Olivier Chafik
|
5bbc7362cb
ci: simplify cmake build commands (#11548)
|
před 11 měsíci |
Olivier Chafik
|
aa6fb13213
`ci`: use sccache on windows instead of ccache (#11545)
|
před 11 měsíci |
Olivier Chafik
|
a83f528688
`tool-call`: fix llama 3.x and functionary 3.2, play nice w/ pydantic_ai package, update readme (#11539)
|
před 11 měsíci |