Diego Devesa c7499c557c examples : do not use common library in simple example (#9803) 1 tahun lalu
..
baby-llama 42c76d1358 Threadpool: take 2 (#8672) 1 tahun lalu
batched 6262d13e0b common : reimplement logging (#9418) 1 tahun lalu
batched-bench 6262d13e0b common : reimplement logging (#9418) 1 tahun lalu
batched.swift 0abc6a2c25 llama : llama_perf + option to disable timings during decode (#9355) 1 tahun lalu
convert-llama2c-to-ggml 6102037bbb vocab : refactor tokenizer to reduce init overhead (#9449) 1 tahun lalu
cvector-generator cad341d889 metal : reduce command encoding overhead (#9698) 1 tahun lalu
deprecation-warning be6d7c0791 examples : remove `finetune` and `train-text-from-scratch` (#8669) 1 tahun lalu
embedding f4d2b8846a llama : add reranking support (#9510) 1 tahun lalu
eval-callback 6262d13e0b common : reimplement logging (#9418) 1 tahun lalu
export-lora dca1d4b58a ggml : fix BLAS with unsupported types (#9775) 1 tahun lalu
gbnf-validator df270ef745 llama : refactor sampling v2 (#9294) 1 tahun lalu
gen-docs afbbfaa537 server : add more env vars, improve gen-docs (#9635) 1 tahun lalu
gguf 07283b1a90 gguf : handle null name during init (#8587) 1 tahun lalu
gguf-hash 1666f92dcd gguf-hash : update clib.json to point to original xxhash repo (#8491) 1 tahun lalu
gguf-split 76b37d1541 gguf-split : improve --split and --merge logic (#9619) 1 tahun lalu
gritlm 6262d13e0b common : reimplement logging (#9418) 1 tahun lalu
imatrix eca0fab44e imatrix : disable prompt escape by default (#9543) 1 tahun lalu
infill cea1486ecf log : add CONT level for continuing previous log entry (#9610) 1 tahun lalu
jeopardy 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) 1 tahun lalu
llama-bench 7be099fa81 llama-bench: correct argument parsing error message (#9524) 1 tahun lalu
llama.android c81f3bbb05 cmake : do not build common library by default when standalone (#9804) 1 tahun lalu
llama.swiftui 5fb5e24811 llama : minor sampling refactor (2) (#9386) 1 tahun lalu
llava cad341d889 metal : reduce command encoding overhead (#9698) 1 tahun lalu
lookahead 6262d13e0b common : reimplement logging (#9418) 1 tahun lalu
lookup 6262d13e0b common : reimplement logging (#9418) 1 tahun lalu
main f4b2dcdf49 readme : fix typo [no ci] 1 tahun lalu
main-cmake-pkg 07a3fc0608 Removes multiple newlines at the end of files that is breaking the editorconfig step of CI. (#8258) 1 tahun lalu
parallel 6262d13e0b common : reimplement logging (#9418) 1 tahun lalu
passkey 6262d13e0b common : reimplement logging (#9418) 1 tahun lalu
perplexity e7022064ab perplexity : fix integer overflow (#9783) 1 tahun lalu
quantize 63351143b2 quantize : improve type name parsing (#9570) 1 tahun lalu
quantize-stats dca1d4b58a ggml : fix BLAS with unsupported types (#9775) 1 tahun lalu
retrieval 6262d13e0b common : reimplement logging (#9418) 1 tahun lalu
rpc 841713e1e4 rpc : enable vulkan (#9714) 1 tahun lalu
save-load-state bfe76d4a17 common : move arg parser code to `arg.cpp` (#9388) 1 tahun lalu
server 458367a906 server : better security control for public deployments (#9776) 1 tahun lalu
simple c7499c557c examples : do not use common library in simple example (#9803) 1 tahun lalu
speculative b0f27361f3 sampling : avoid expensive softmax during greedy sampling (#9605) 1 tahun lalu
sycl faf67b3de4 [SYCL]set context default value to avoid memory issue, update guide (#9476) 1 tahun lalu
tokenize 6262d13e0b common : reimplement logging (#9418) 1 tahun lalu
CMakeLists.txt 148844fe97 examples : remove benchmark (#9704) 1 tahun lalu
Miku.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) 1 tahun lalu
base-translate.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) 1 tahun lalu
chat-13B.bat d9ad104440 Create chat-13B.bat (#592) 2 tahun lalu
chat-13B.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) 1 tahun lalu
chat-persistent.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) 1 tahun lalu
chat-vicuna.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) 1 tahun lalu
chat.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) 1 tahun lalu
convert_legacy_llama.py 672a6f1018 convert-*.py: GGUF Naming Convention Refactor and Metadata Override Refactor (#7499) 1 tahun lalu
json_schema_pydantic_example.py 3fd62a6b1c py : type-check all Python scripts with Pyright (#8341) 1 tahun lalu
json_schema_to_grammar.py 3fd62a6b1c py : type-check all Python scripts with Pyright (#8341) 1 tahun lalu
llm.vim ad9ddcff6e llm.vim : stop generation at multiple linebreaks, bind to <F2> (#2879) 2 tahun lalu
pydantic_models_to_grammar.py 090fca7a07 pydantic : replace uses of __annotations__ with get_type_hints (#8474) 1 tahun lalu
pydantic_models_to_grammar_examples.py 22f281aa16 examples : Rewrite pydantic_models_to_grammar_examples.py (#8493) 1 tahun lalu
reason-act.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) 1 tahun lalu
regex_to_grammar.py e235b267a2 py : switch to snake_case (#8305) 1 tahun lalu
server-llama2-13B.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) 1 tahun lalu
server_embd.py 3fd62a6b1c py : type-check all Python scripts with Pyright (#8341) 1 tahun lalu
ts-type-to-grammar.sh ab9a3240a9 JSON schema conversion: ⚡️ faster repetitions, min/maxLength for strings, cap number length (#6555) 1 tahun lalu