Georgi Gerganov
|
254098a279
common : refactor common_sampler + grammar logic changes (#17937)
|
1 bulan lalu |
Georgi Gerganov
|
745aa5319b
llama : deprecate llama_kv_self_ API (#14030)
|
7 bulan lalu |
Georgi Gerganov
|
79c137f776
examples : allow extracting embeddings from decoder contexts (#13797)
|
7 bulan lalu |
Sigbjørn Skjæret
|
2aa777d86d
examples : switch retrieval to llama_encode (#13685)
|
8 bulan lalu |
Georgi Gerganov
|
e0dbec0bc6
llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181)
|
10 bulan lalu |
Georgi Gerganov
|
afa8a9ec9b
llama : add `llama_vocab`, functions -> methods, naming (#11110)
|
1 tahun lalu |
Georgi Gerganov
|
f66f582927
llama : refactor `src/llama.cpp` (#10902)
|
1 tahun lalu |
Georgi Gerganov
|
152610eda9
server : output embeddings for all tokens when pooling = none (#10861)
|
1 tahun lalu |
Diego Devesa
|
cb13ef85a4
remove CMAKE_WINDOWS_EXPORT_ALL_SYMBOLS (#10797)
|
1 tahun lalu |
Georgi Gerganov
|
d9d54e498d
speculative : refactor and add a simpler example (#10362)
|
1 tahun lalu |
Diego Devesa
|
7eee341bee
common : use common_ prefix for common library functions (#9805)
|
1 tahun lalu |
Georgi Gerganov
|
6262d13e0b
common : reimplement logging (#9418)
|
1 tahun lalu |
Georgi Gerganov
|
0abc6a2c25
llama : llama_perf + option to disable timings during decode (#9355)
|
1 tahun lalu |
Xuan Son Nguyen
|
bfe76d4a17
common : move arg parser code to `arg.cpp` (#9388)
|
1 tahun lalu |
Xuan Son Nguyen
|
1b9ae5189c
common : refactor arg parser (#9308)
|
1 tahun lalu |
Georgi Gerganov
|
df270ef745
llama : refactor sampling v2 (#9294)
|
1 tahun lalu |
gtygo
|
4b9afbbe90
retrieval : fix memory leak in retrieval query handling (#8955)
|
1 tahun lalu |
Liu Jia
|
0a4ce78681
common : Changed tuple to struct (TODO fix) (#8823)
|
1 tahun lalu |
Douglas Hanley
|
80ea089d77
llama : allow pooled embeddings on any model (#7477)
|
1 tahun lalu |
Georgi Gerganov
|
1442677f92
common : refactor cli arg parsing (#7675)
|
1 tahun lalu |
Georgi Gerganov
|
6ff13987ad
common : normalize naming style (#7462)
|
1 tahun lalu |
Minsoo Cheong
|
64e7b47c69
examples : add "retrieval" (#6193)
|
1 tahun lalu |