Xuan Son Nguyen
|
681149ced2
llama : add `llama_model_load_from_splits` (#11255)
|
1 год назад |
Georgi Gerganov
|
afa8a9ec9b
llama : add `llama_vocab`, functions -> methods, naming (#11110)
|
1 год назад |
Molly Sophia
|
ee7136c6d1
llama: add support for QRWKV6 model architecture (#11001)
|
1 год назад |
Georgi Gerganov
|
c07d437bbd
llama : avoid hardcoded QK_K (#11061)
|
1 год назад |
Johannes Gäßler
|
53ff6b9b9f
GGUF: C++ refactor, backend support, misc fixes (#11030)
|
1 год назад |
Georgi Gerganov
|
5047dd3546
llama : use _impl suffix instead of _internal (#11060)
|
1 год назад |
Georgi Gerganov
|
f66f582927
llama : refactor `src/llama.cpp` (#10902)
|
1 год назад |