Faisal Zaghloul
|
42c76d1358
Threadpool: take 2 (#8672)
|
hace 1 año |
Xuan Son Nguyen
|
828d6ff7d7
export-lora : throw error if lora is quantized (#9002)
|
hace 1 año |
Georgi Gerganov
|
45a55b91aa
llama : better replace_all (cont) (#8926)
|
hace 1 año |
Xuan Son Nguyen
|
1e6f6554aa
server : add lora hotswap endpoint (WIP) (#8857)
|
hace 1 año |
Xuan Son Nguyen
|
41cd47caab
examples : export-lora : fix issue with quantized base models (#8687)
|
hace 1 año |
Xuan Son Nguyen
|
de280085e7
examples : Fix `llama-export-lora` example (#8607)
|
hace 1 año |
Steve Bonds
|
37b12f92ab
export-lora : handle help argument (#8497)
|
hace 1 año |
Ananta Bastola
|
6e4e973b26
ci : add an option to fail on compile warning (#3952)
|
hace 1 año |
Georgi Gerganov
|
3b169441df
sync : ggml (#5452)
|
hace 1 año |
Daniel Bevenius
|
930f907d3e
export-lora : use LLAMA_FILE_MAGIC_GGLA (#4894)
|
hace 2 años |
Georgi Gerganov
|
afefa319f1
ggml : change ggml_scale to take a float instead of tensor (#4573)
|
hace 2 años |
Georgi Gerganov
|
4760e7cc0b
sync : ggml (backend v2) (#3912)
|
hace 2 años |
xaedes
|
0e76a8992c
train : finetune LORA (#2632)
|
hace 2 años |