Rich Dougherty
|
6763f713bb
readme : more lora detail in main example readme (#10064)
|
1 jaar geleden |
Georgi Gerganov
|
8d8ff71536
llama : remove Tail-Free sampling (#10071)
|
1 jaar geleden |
wwoodsTM
|
ff252ea48e
llama : add DRY sampler (#9702)
|
1 jaar geleden |
Georgi Gerganov
|
17bb928080
readme : remove --memory-f32 references (#9925)
|
1 jaar geleden |
MaggotHATE
|
fbc98b748e
sampling : add XTC sampler (#9742)
|
1 jaar geleden |
Georgi Gerganov
|
f4b2dcdf49
readme : fix typo [no ci]
|
1 jaar geleden |
Vinesh Janarthanan
|
441b72b91f
main : option to disable context shift (#9484)
|
1 jaar geleden |
Denis Spasyuk
|
a8db2a9ce6
Update llama-cli documentation (#8315)
|
1 jaar geleden |
Olivier Chafik
|
1c641e6aac
`build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809)
|
1 jaar geleden |
arch-btw
|
9973e81c5c
readme : remove -ins (#7759)
|
1 jaar geleden |
Georgi Gerganov
|
1442677f92
common : refactor cli arg parsing (#7675)
|
1 jaar geleden |
Amir
|
11474e756d
examples: cache hf model when --model not provided (#7353)
|
1 jaar geleden |
omahs
|
04976db7a8
docs: fix typos (#7124)
|
1 jaar geleden |
Olivier Chafik
|
8843a98c2b
Improve usability of --model-url & related flags (#6930)
|
1 jaar geleden |
Olivier Chafik
|
7593639ce3
`main`: add --json-schema / -j flag (#6659)
|
1 jaar geleden |
Rene Leonhardt
|
5c4d767ac0
chore: Fix markdown warnings (#6625)
|
1 jaar geleden |
Ting Sun
|
cfc4d75df6
doc: fix outdated default value of batch size (#6336)
|
1 jaar geleden |
slaren
|
280345968d
cuda : rename build flag to LLAMA_CUDA (#6299)
|
1 jaar geleden |
Pierrick Hymbert
|
d01b3c4c32
common: llama_load_model_from_url using --model-url (#6098)
|
1 jaar geleden |
bmwl
|
f486f6e1e5
ggml : add numa options (#5377)
|
1 jaar geleden |
Richard Kiss
|
532dd74e38
Fix some documentation typos/grammar mistakes (#4032)
|
2 jaren geleden |
kalomaze
|
238657db23
samplers : Min-P sampler implementation [alternative to Top P/Top K] (#3841)
|
2 jaren geleden |
slaren
|
16bc66d947
llama.cpp : split llama_context_params into model and context params (#3301)
|
2 jaren geleden |
Roland
|
2d770505a8
llama : remove mtest (#3177)
|
2 jaren geleden |
ZHAOKAI WANG
|
69fdbb9abc
readme : quick start command fix (#2908)
|
2 jaren geleden |
Evan Jones
|
f5fe98d11b
docs : add grammar docs (#2701)
|
2 jaren geleden |
Christian Demsar
|
e59fcb2bc1
Add --n-predict -2 for stopping generation on full context (#2565)
|
2 jaren geleden |
klosax
|
f3c3b4b167
Add --rope-scale parameter (#2544)
|
2 jaren geleden |
Weird Constructor
|
d91f3f0c55
readme : fix the description of the Tail free sampling (TFS) method (#2431)
|
2 jaren geleden |
Howard Su
|
32c5411631
Revert "Support using mmap when applying LoRA (#2095)" (#2206)
|
2 jaren geleden |