omahs
|
04976db7a8
docs: fix typos (#7124)
|
1 an în urmă |
Olivier Chafik
|
8843a98c2b
Improve usability of --model-url & related flags (#6930)
|
1 an în urmă |
Olivier Chafik
|
7593639ce3
`main`: add --json-schema / -j flag (#6659)
|
1 an în urmă |
Rene Leonhardt
|
5c4d767ac0
chore: Fix markdown warnings (#6625)
|
1 an în urmă |
Ting Sun
|
cfc4d75df6
doc: fix outdated default value of batch size (#6336)
|
1 an în urmă |
slaren
|
280345968d
cuda : rename build flag to LLAMA_CUDA (#6299)
|
1 an în urmă |
Pierrick Hymbert
|
d01b3c4c32
common: llama_load_model_from_url using --model-url (#6098)
|
1 an în urmă |
bmwl
|
f486f6e1e5
ggml : add numa options (#5377)
|
1 an în urmă |
Richard Kiss
|
532dd74e38
Fix some documentation typos/grammar mistakes (#4032)
|
2 ani în urmă |
kalomaze
|
238657db23
samplers : Min-P sampler implementation [alternative to Top P/Top K] (#3841)
|
2 ani în urmă |
slaren
|
16bc66d947
llama.cpp : split llama_context_params into model and context params (#3301)
|
2 ani în urmă |
Roland
|
2d770505a8
llama : remove mtest (#3177)
|
2 ani în urmă |
ZHAOKAI WANG
|
69fdbb9abc
readme : quick start command fix (#2908)
|
2 ani în urmă |
Evan Jones
|
f5fe98d11b
docs : add grammar docs (#2701)
|
2 ani în urmă |
Christian Demsar
|
e59fcb2bc1
Add --n-predict -2 for stopping generation on full context (#2565)
|
2 ani în urmă |
klosax
|
f3c3b4b167
Add --rope-scale parameter (#2544)
|
2 ani în urmă |
Weird Constructor
|
d91f3f0c55
readme : fix the description of the Tail free sampling (TFS) method (#2431)
|
2 ani în urmă |
Howard Su
|
32c5411631
Revert "Support using mmap when applying LoRA (#2095)" (#2206)
|
2 ani în urmă |
Howard Su
|
2347463201
Support using mmap when applying LoRA (#2095)
|
2 ani în urmă |
Howard Su
|
b8c8dda75f
Use unsigned for random seed (#2006)
|
2 ani în urmă |
zrm
|
b853d45601
ggml : add NUMA support (#1556)
|
2 ani în urmă |
Johannes Gäßler
|
254a7a7a5f
CUDA full GPU acceleration, KV cache in VRAM (#1827)
|
2 ani în urmă |
Johannes Gäßler
|
17366df842
Multi GPU support, CUDA refactor, CUDA scratch buffer (#1703)
|
2 ani în urmă |
Kerfuffle
|
1b78ed2081
Only show -ngl option when relevant + other doc/arg handling updates (#1625)
|
2 ani în urmă |
Kerfuffle
|
66874d4fbc
Some improvements to loading the session with --prompt-cache (#1550)
|
2 ani în urmă |
Evan Jones
|
cf348a60e0
main : add option to save full output to session (#1338)
|
2 ani în urmă |
44670
|
2edbdb0f99
main : add --in-suffix option (#1318)
|
2 ani în urmă |
DannyDaemonic
|
db1080876a
Only escape prompts when used with `-e` (#1311)
|
2 ani în urmă |
DannyDaemonic
|
c65a7fbfa9
Update main's README.md with new features (#1296)
|
2 ani în urmă |
Robert Brisita
|
2bb992f034
llama : allow 0 as a seed number. (#1275)
|
2 ani în urmă |