Georgi Gerganov
|
254098a279
common : refactor common_sampler + grammar logic changes (#17937)
|
hace 1 mes |
Diego Devesa
|
e072b2052e
ggml : add GGML_SCHED_NO_REALLOC option to disable reallocations in ggml_backend_sched (#17276)
|
hace 1 mes |
Sam Malayek
|
1c1409e131
embedding: add raw option for --embd-output-format (#16541)
|
hace 2 meses |
Douglas Hanley
|
b5bd037832
llama : add support for qwen3 reranker (#15824)
|
hace 3 meses |
Georgi Gerganov
|
00131d6eaf
tests : update for LLAMA_SET_ROWS=1 (#14961)
|
hace 5 meses |
Georgi Gerganov
|
225e7a1438
llama : add high-throughput mode (#14363)
|
hace 6 meses |
Sigbjørn Skjæret
|
88fc854b4b
llama : improve sep token handling (#14272)
|
hace 7 meses |
Georgi Gerganov
|
745aa5319b
llama : deprecate llama_kv_self_ API (#14030)
|
hace 7 meses |
Sigbjørn Skjæret
|
d17a809ef0
llama : support multiple classifier outputs and labels (#13940)
|
hace 7 meses |
Georgi Gerganov
|
79c137f776
examples : allow extracting embeddings from decoder contexts (#13797)
|
hace 7 meses |
Georgi Gerganov
|
6562e5a4d6
context : allow cache-less context for embeddings (#13108)
|
hace 8 meses |
Georgi Gerganov
|
226251ed56
embeddings : fix batch sizes (#13076)
|
hace 8 meses |
Georgi Gerganov
|
e0dbec0bc6
llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181)
|
hace 10 meses |
mgroeber9110
|
5bbe6a9fe9
ggml : portability fixes for VS 2017 (#12150)
|
hace 10 meses |
Georgi Gerganov
|
afa8a9ec9b
llama : add `llama_vocab`, functions -> methods, naming (#11110)
|
hace 1 año |
Georgi Gerganov
|
f66f582927
llama : refactor `src/llama.cpp` (#10902)
|
hace 1 año |
Diego Devesa
|
7eee341bee
common : use common_ prefix for common library functions (#9805)
|
hace 1 año |
Georgi Gerganov
|
f4d2b8846a
llama : add reranking support (#9510)
|
hace 1 año |
Georgi Gerganov
|
6262d13e0b
common : reimplement logging (#9418)
|
hace 1 año |
Georgi Gerganov
|
0abc6a2c25
llama : llama_perf + option to disable timings during decode (#9355)
|
hace 1 año |
slaren
|
49006c67b4
llama : move random seed generation to the samplers (#9398)
|
hace 1 año |
Xuan Son Nguyen
|
bfe76d4a17
common : move arg parser code to `arg.cpp` (#9388)
|
hace 1 año |
Xuan Son Nguyen
|
1b9ae5189c
common : refactor arg parser (#9308)
|
hace 1 año |
Georgi Gerganov
|
df270ef745
llama : refactor sampling v2 (#9294)
|
hace 1 año |
fairydreaming
|
7c3f55c100
Add support for encoder-only T5 models (#8900)
|
hace 1 año |
Liu Jia
|
0a4ce78681
common : Changed tuple to struct (TODO fix) (#8823)
|
hace 1 año |
Yann Follet
|
646ef4a9cf
embedding : more cli arguments (#7458)
|
hace 1 año |
Douglas Hanley
|
80ea089d77
llama : allow pooled embeddings on any model (#7477)
|
hace 1 año |
Georgi Gerganov
|
1442677f92
common : refactor cli arg parsing (#7675)
|
hace 1 año |
Georgi Gerganov
|
6ff13987ad
common : normalize naming style (#7462)
|
hace 1 año |