cturan/llama.cpp @ 46e3556e01b824e52395fb050b29804b6cff2a7c

Georgi Gerganov f66f582927 llama : refactor `src/llama.cpp` (#10902)		1 год назад
..
batched	644fd71b44 sampling : refactor + optimize penalties sampler (#10803)	1 год назад
batched-bench	7cc2d2c889 ggml : move AMX to the CPU backend (#10570)	1 год назад
batched.swift	0abc6a2c25 llama : llama_perf + option to disable timings during decode (#9355)	1 год назад
convert-llama2c-to-ggml	f66f582927 llama : refactor `src/llama.cpp` (#10902)	1 год назад
cvector-generator	f66f582927 llama : refactor `src/llama.cpp` (#10902)	1 год назад
deprecation-warning	f112d198cd Update deprecation-warning.cpp (#10619)	1 год назад
embedding	f66f582927 llama : refactor `src/llama.cpp` (#10902)	1 год назад
eval-callback	f66f582927 llama : refactor `src/llama.cpp` (#10902)	1 год назад
export-lora	d283d02bf2 examples, ggml : fix GCC compiler warnings (#10983)	1 год назад
gbnf-validator	5cab3e4aaa llama : minor grammar refactor (#10897)	1 год назад
gen-docs	7cc2d2c889 ggml : move AMX to the CPU backend (#10570)	1 год назад
gguf	7cc2d2c889 ggml : move AMX to the CPU backend (#10570)	1 год назад
gguf-hash	7cc2d2c889 ggml : move AMX to the CPU backend (#10570)	1 год назад
gguf-split	f66f582927 llama : refactor `src/llama.cpp` (#10902)	1 год назад
gritlm	152610eda9 server : output embeddings for all tokens when pooling = none (#10861)	1 год назад
imatrix	f66f582927 llama : refactor `src/llama.cpp` (#10902)	1 год назад
infill	f66f582927 llama : refactor `src/llama.cpp` (#10902)	1 год назад
jeopardy	1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809)	1 год назад
llama-bench	cb13ef85a4 remove CMAKE_WINDOWS_EXPORT_ALL_SYMBOLS (#10797)	1 год назад
llama.android	c250ecb315 android : fix llama_batch free (#11014)	1 год назад
llama.swiftui	43ed389a3f llama : use cmake for swift build (#10525)	1 год назад
llava	d408bb9268 clip : disable GPU support (#10896)	1 год назад
lookahead	f66f582927 llama : refactor `src/llama.cpp` (#10902)	1 год назад
lookup	f66f582927 llama : refactor `src/llama.cpp` (#10902)	1 год назад
main	f66f582927 llama : refactor `src/llama.cpp` (#10902)	1 год назад
main-cmake-pkg	7cc2d2c889 ggml : move AMX to the CPU backend (#10570)	1 год назад
parallel	f66f582927 llama : refactor `src/llama.cpp` (#10902)	1 год назад
passkey	7cc2d2c889 ggml : move AMX to the CPU backend (#10570)	1 год назад
perplexity	f66f582927 llama : refactor `src/llama.cpp` (#10902)	1 год назад
quantize	1a31d0dc00 Update README.md (#10772)	1 год назад
quantize-stats	f66f582927 llama : refactor `src/llama.cpp` (#10902)	1 год назад
retrieval	f66f582927 llama : refactor `src/llama.cpp` (#10902)	1 год назад
rpc	86bf31cfe6 rpc-server : add support for the SYCL backend (#10934)	1 год назад
run	6e1531aca5 common, examples, ggml : fix MSYS2 GCC compiler errors and warnings when building with LLAMA_CURL=ON and GGML_OPENCL=ON (#11013)	1 год назад
save-load-state	f66f582927 llama : refactor `src/llama.cpp` (#10902)	1 год назад
server	f66f582927 llama : refactor `src/llama.cpp` (#10902)	1 год назад
simple	7cc2d2c889 ggml : move AMX to the CPU backend (#10570)	1 год назад
simple-chat	7cc2d2c889 ggml : move AMX to the CPU backend (#10570)	1 год назад
speculative	f66f582927 llama : refactor `src/llama.cpp` (#10902)	1 год назад
speculative-simple	f66f582927 llama : refactor `src/llama.cpp` (#10902)	1 год назад
sycl	faf67b3de4 [SYCL]set context default value to avoid memory issue, update guide (#9476)	1 год назад
tokenize	cb13ef85a4 remove CMAKE_WINDOWS_EXPORT_ALL_SYMBOLS (#10797)	1 год назад
tts	f66f582927 llama : refactor `src/llama.cpp` (#10902)	1 год назад
CMakeLists.txt	0bf2d10c55 tts : add OuteTTS support (#10784)	1 год назад
Miku.sh	1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809)	1 год назад
chat-13B.bat	d9ad104440 Create chat-13B.bat (#592)	2 лет назад
chat-13B.sh	1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809)	1 год назад
chat-persistent.sh	8fc393f246 scripts : fix pattern and get n_tokens in one go (#10221)	1 год назад
chat-vicuna.sh	1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809)	1 год назад
chat.sh	1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809)	1 год назад
convert_legacy_llama.py	a0ec17b32e metadata: Detailed Dataset Authorship Metadata (#8875)	1 год назад
json_schema_pydantic_example.py	3fd62a6b1c py : type-check all Python scripts with Pyright (#8341)	1 год назад
json_schema_to_grammar.py	66c2c93082 grammar : fix JSON Schema for string regex with top-level alt. (#9903)	1 год назад
llama.vim	2d3aba9ee8 llama.vim : bump generation time limit to 3s [no ci]	1 год назад
llm.vim	ad9ddcff6e llm.vim : stop generation at multiple linebreaks, bind to <F2> (#2879)	2 лет назад
pydantic_models_to_grammar.py	090fca7a07 pydantic : replace uses of __annotations__ with get_type_hints (#8474)	1 год назад
pydantic_models_to_grammar_examples.py	22f281aa16 examples : Rewrite pydantic_models_to_grammar_examples.py (#8493)	1 год назад
reason-act.sh	1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809)	1 год назад
regex_to_grammar.py	e235b267a2 py : switch to snake_case (#8305)	1 год назад
server-llama2-13B.sh	1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809)	1 год назад
server_embd.py	3fd62a6b1c py : type-check all Python scripts with Pyright (#8341)	1 год назад
ts-type-to-grammar.sh	ab9a3240a9 JSON schema conversion: ⚡️ faster repetitions, min/maxLength for strings, cap number length (#6555)	1 год назад