VoidIsVoid dcdcee3a74 server: add data: [DONE] to /chat/completions stream response (#9459) hace 1 año
..
baby-llama 42c76d1358 Threadpool: take 2 (#8672) hace 1 año
batched 0abc6a2c25 llama : llama_perf + option to disable timings during decode (#9355) hace 1 año
batched-bench 0abc6a2c25 llama : llama_perf + option to disable timings during decode (#9355) hace 1 año
batched.swift 0abc6a2c25 llama : llama_perf + option to disable timings during decode (#9355) hace 1 año
benchmark d6a04f872d ggml : hide ggml_object, ggml_cgraph, ggml_hash_set (#9408) hace 1 año
convert-llama2c-to-ggml 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) hace 1 año
cvector-generator d6a04f872d ggml : hide ggml_object, ggml_cgraph, ggml_hash_set (#9408) hace 1 año
deprecation-warning be6d7c0791 examples : remove `finetune` and `train-text-from-scratch` (#8669) hace 1 año
embedding 0abc6a2c25 llama : llama_perf + option to disable timings during decode (#9355) hace 1 año
eval-callback 0abc6a2c25 llama : llama_perf + option to disable timings during decode (#9355) hace 1 año
export-lora d6a04f872d ggml : hide ggml_object, ggml_cgraph, ggml_hash_set (#9408) hace 1 año
gbnf-validator df270ef745 llama : refactor sampling v2 (#9294) hace 1 año
gen-docs bfe76d4a17 common : move arg parser code to `arg.cpp` (#9388) hace 1 año
gguf 07283b1a90 gguf : handle null name during init (#8587) hace 1 año
gguf-hash 1666f92dcd gguf-hash : update clib.json to point to original xxhash repo (#8491) hace 1 año
gguf-split 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) hace 1 año
gritlm bfe76d4a17 common : move arg parser code to `arg.cpp` (#9388) hace 1 año
imatrix 0abc6a2c25 llama : llama_perf + option to disable timings during decode (#9355) hace 1 año
infill 49006c67b4 llama : move random seed generation to the samplers (#9398) hace 1 año
jeopardy 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) hace 1 año
llama-bench 0abc6a2c25 llama : llama_perf + option to disable timings during decode (#9355) hace 1 año
llama.android 5fb5e24811 llama : minor sampling refactor (2) (#9386) hace 1 año
llama.swiftui 5fb5e24811 llama : minor sampling refactor (2) (#9386) hace 1 año
llava 0abc6a2c25 llama : llama_perf + option to disable timings during decode (#9355) hace 1 año
lookahead bfe76d4a17 common : move arg parser code to `arg.cpp` (#9388) hace 1 año
lookup 0abc6a2c25 llama : llama_perf + option to disable timings during decode (#9355) hace 1 año
main 49006c67b4 llama : move random seed generation to the samplers (#9398) hace 1 año
main-cmake-pkg 07a3fc0608 Removes multiple newlines at the end of files that is breaking the editorconfig step of CI. (#8258) hace 1 año
parallel 0abc6a2c25 llama : llama_perf + option to disable timings during decode (#9355) hace 1 año
passkey 0abc6a2c25 llama : llama_perf + option to disable timings during decode (#9355) hace 1 año
perplexity 0abc6a2c25 llama : llama_perf + option to disable timings during decode (#9355) hace 1 año
quantize ff76e18516 cmake : fixed the order of linking libraries for llama-quantize (#9450) hace 1 año
quantize-stats df270ef745 llama : refactor sampling v2 (#9294) hace 1 año
retrieval 0abc6a2c25 llama : llama_perf + option to disable timings during decode (#9355) hace 1 año
rpc 5ed087573e readme : add LLMUnity to UI projects (#9381) hace 1 año
save-load-state bfe76d4a17 common : move arg parser code to `arg.cpp` (#9388) hace 1 año
server dcdcee3a74 server: add data: [DONE] to /chat/completions stream response (#9459) hace 1 año
simple 0abc6a2c25 llama : llama_perf + option to disable timings during decode (#9355) hace 1 año
speculative 0abc6a2c25 llama : llama_perf + option to disable timings during decode (#9355) hace 1 año
sycl c9c8575a1a enhance run script to be easy to change the parameters (#9448) hace 1 año
tokenize 4af8420afb common : remove duplicate function llama_should_add_bos_token (#8778) hace 1 año
CMakeLists.txt be6d7c0791 examples : remove `finetune` and `train-text-from-scratch` (#8669) hace 1 año
Miku.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) hace 1 año
base-translate.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) hace 1 año
chat-13B.bat d9ad104440 Create chat-13B.bat (#592) hace 2 años
chat-13B.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) hace 1 año
chat-persistent.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) hace 1 año
chat-vicuna.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) hace 1 año
chat.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) hace 1 año
convert_legacy_llama.py 672a6f1018 convert-*.py: GGUF Naming Convention Refactor and Metadata Override Refactor (#7499) hace 1 año
json_schema_pydantic_example.py 3fd62a6b1c py : type-check all Python scripts with Pyright (#8341) hace 1 año
json_schema_to_grammar.py 3fd62a6b1c py : type-check all Python scripts with Pyright (#8341) hace 1 año
llama.vim 125d03a503 llama.vim : added api key support (#5090) hace 2 años
llm.vim ad9ddcff6e llm.vim : stop generation at multiple linebreaks, bind to <F2> (#2879) hace 2 años
pydantic_models_to_grammar.py 090fca7a07 pydantic : replace uses of __annotations__ with get_type_hints (#8474) hace 1 año
pydantic_models_to_grammar_examples.py 22f281aa16 examples : Rewrite pydantic_models_to_grammar_examples.py (#8493) hace 1 año
reason-act.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) hace 1 año
regex_to_grammar.py e235b267a2 py : switch to snake_case (#8305) hace 1 año
server-llama2-13B.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) hace 1 año
server_embd.py 3fd62a6b1c py : type-check all Python scripts with Pyright (#8341) hace 1 año
ts-type-to-grammar.sh ab9a3240a9 JSON schema conversion: ⚡️ faster repetitions, min/maxLength for strings, cap number length (#6555) hace 1 año