Xuan-Son Nguyen
|
c43a3e7996
llama : add Phi-4-mini support (supersede #12099) (#12108)
|
hace 10 meses |
Vitali Lovich
|
3e9a2860e9
llama : expose llama_model_n_head_kv in the API (#11997)
|
hace 10 meses |
Georgi Gerganov
|
51f311e057
llama : skip loading unused tensors (#12004)
|
hace 11 meses |
Georgi Gerganov
|
bdcf8b6a56
cont : fix mmap flag print (#11699)
|
hace 11 meses |
Georgi Gerganov
|
9dd7a0390f
llama : add log about loading model tensors (#11699)
|
hace 11 meses |
piDack
|
0cec062a63
llama : add support for GLM-Edge and GLM-Edge-V series models (#10573)
|
hace 11 meses |
Frank Mai
|
1d8ee06000
rpc: fix register position (#11424)
|
hace 11 meses |
Olivier Chafik
|
6171c9d258
Add Jinja template support (#11016)
|
hace 1 año |
Georgi Gerganov
|
ef6dada60c
cont : fix whitespaces (#11305)
|
hace 1 año |
Kyle Bruene
|
ae3c1db2f9
llama : re-add LLM_ARCH_PHIMOE (#11305)
|
hace 1 año |
Radoslav Gerganov
|
667d72846c
rpc : early register backend devices (#11262)
|
hace 1 año |
Georgi Gerganov
|
afa8a9ec9b
llama : add `llama_vocab`, functions -> methods, naming (#11110)
|
hace 1 año |
Molly Sophia
|
ee7136c6d1
llama: add support for QRWKV6 model architecture (#11001)
|
hace 1 año |
Pierrick Hymbert
|
f8feb4b01a
model: Add support for PhiMoE arch (#11003)
|
hace 1 año |
Georgi Gerganov
|
47182dd03f
llama : update llama_model API names (#11063)
|
hace 1 año |
Georgi Gerganov
|
727368c60f
llama : use LLAMA_TOKEN_NULL (#11062)
|
hace 1 año |
fairydreaming
|
9394bbd484
llama : Add support for DeepSeek V3 (#11049)
|
hace 1 año |
DAN™
|
46be942214
llama : add support for the cohere2 model architecture (#10900)
|
hace 1 año |
Georgi Gerganov
|
f66f582927
llama : refactor `src/llama.cpp` (#10902)
|
hace 1 año |