Georgi Gerganov
|
45f2c19cc5
flake.lock: Update (#8610)
|
1 рік тому |
M-A
|
22f281aa16
examples : Rewrite pydantic_models_to_grammar_examples.py (#8493)
|
1 рік тому |
compilade
|
328884f421
gguf-py : fix some metadata name extraction edge cases (#8591)
|
1 рік тому |
compilade
|
c69c63039c
convert_hf : fix Gemma v1 conversion (#8597)
|
1 рік тому |
Johannes Gäßler
|
69c487f4ed
CUDA: MMQ code deduplication + iquant support (#8495)
|
1 рік тому |
Georgi Gerganov
|
07283b1a90
gguf : handle null name during init (#8587)
|
1 рік тому |
Michael Coppola
|
940362224d
llama : add support for Tekken pre-tokenizer (#8579)
|
1 рік тому |
Huifeng Ou
|
69b9945b44
llama.swiftui: fix end of generation bug (#8268)
|
1 рік тому |
Brian
|
c3776cacab
gguf_dump.py: fix markddown kv array print (#8588)
|
1 рік тому |
slaren
|
87e397d00b
ggml : fix quant dot product with odd number of blocks (#8549)
|
1 рік тому |
Brian
|
57b1d4f9eb
convert-*.py: remove add_name from ChatGLMModel class (#8590)
|
1 рік тому |
Georgi Gerganov
|
d197545530
llama : bump max layers from 256 to 512 (#8530)
|
1 рік тому |
Georgi Gerganov
|
be0cfb4175
readme : fix server badge
|
1 рік тому |
Clint Herron
|
b57eb9ca4f
ggml : add friendlier error message to fopen errors (#8575)
|
1 рік тому |
Frank Mai
|
f299aa98ec
fix: typo of chatglm4 chat tmpl (#8586)
|
1 рік тому |
Brian
|
3d0e4367d9
convert-*.py: add general.name kv override (#8571)
|
1 рік тому |
Johannes Gäßler
|
a15ef8f8a0
CUDA: fix partial offloading for ne0 % 256 != 0 (#8572)
|
1 рік тому |
65a
|
705b7ecf60
cmake : install all ggml public headers (#8480)
|
1 рік тому |
Eric Zhang
|
0d2c7321e9
server: use relative routes for static files in new UI (#8552)
|
1 рік тому |
Brian
|
672a6f1018
convert-*.py: GGUF Naming Convention Refactor and Metadata Override Refactor (#7499)
|
1 рік тому |
RunningLeon
|
3807c3de04
server : respect `--special` cli arg (#8553)
|
1 рік тому |
Johannes Gäßler
|
e02b597be3
lookup: fibonacci hashing, fix crashes (#8548)
|
1 рік тому |
Al Mochkin
|
b3283448ce
build : Fix docker build warnings (#8535) (#8537)
|
1 рік тому |
Brian
|
30f80ca0bc
CONTRIBUTING.md : remove mention of noci (#8541)
|
1 рік тому |
hipudding
|
1bdd8ae19f
[CANN] Add Ascend NPU backend (#6035)
|
1 рік тому |
Masaya, Kato
|
da3913d8f9
batched: fix n_predict parameter (#8527)
|
1 рік тому |
Georgi Gerganov
|
d65a8361fe
llama : disable context-shift for DeepSeek v2 (#8501)
|
1 рік тому |
Johannes Gäßler
|
5e116e8dd5
make/cmake: add missing force MMQ/cuBLAS for HIP (#8515)
|
1 рік тому |
Brian
|
1666f92dcd
gguf-hash : update clib.json to point to original xxhash repo (#8491)
|
1 рік тому |
Steve Bonds
|
37b12f92ab
export-lora : handle help argument (#8497)
|
1 рік тому |