Georgi Gerganov
|
745aa5319b
llama : deprecate llama_kv_self_ API (#14030)
|
7 ay önce |
Georgi Gerganov
|
e0dbec0bc6
llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181)
|
10 ay önce |
Jhen-Jie Hong
|
f117d84b48
swift : fix llama-vocab api usage (#11645)
|
11 ay önce |
Georgi Gerganov
|
afa8a9ec9b
llama : add `llama_vocab`, functions -> methods, naming (#11110)
|
1 yıl önce |
Georgi Gerganov
|
0abc6a2c25
llama : llama_perf + option to disable timings during decode (#9355)
|
1 yıl önce |
slaren
|
5fb5e24811
llama : minor sampling refactor (2) (#9386)
|
1 yıl önce |
Georgi Gerganov
|
df270ef745
llama : refactor sampling v2 (#9294)
|
1 yıl önce |
jaime-m-p
|
213701b51a
Detokenizer fixes (#8039)
|
1 yıl önce |
Georgi Gerganov
|
40f74e4d73
llama : add option to render special/control tokens (#6807)
|
1 yıl önce |
Pedro Cuenca
|
b97bc3966e
llama : support Llama 3 HF conversion (#6745)
|
1 yıl önce |
bmwl
|
f486f6e1e5
ggml : add numa options (#5377)
|
1 yıl önce |
Miwa / Ensan
|
5c9f90cba1
swift : fix prompt tokenization logic (#4321)
|
2 yıl önce |
Miwa / Ensan
|
b220222a64
swift : fix token_to_piece implementation (#4278)
|
2 yıl önce |
eastriver
|
2568a4bf54
main.swift : fix eos checking (#4197)
|
2 yıl önce |
Georgi Gerganov
|
0e89203b51
speculative : add tree-based sampling example (#3624)
|
2 yıl önce |
staviq
|
1a159553f9
tokenizer : special token handling (#3538)
|
2 yıl önce |
Zane Shannon
|
24ba3d829e
examples : add batched.swift + improve CI for swift (#3562)
|
2 yıl önce |