Georgi Gerganov e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
..
batched afa8a9ec9b llama : add `llama_vocab`, functions -> methods, naming (#11110) il y a 1 an
batched-bench e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
batched.swift e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
convert-llama2c-to-ggml afa8a9ec9b llama : add `llama_vocab`, functions -> methods, naming (#11110) il y a 1 an
cvector-generator e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
deprecation-warning f112d198cd Update deprecation-warning.cpp (#10619) il y a 1 an
embedding e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
eval-callback afa8a9ec9b llama : add `llama_vocab`, functions -> methods, naming (#11110) il y a 1 an
export-lora 6ef79a67ca common : refactor '-o' option (#12278) il y a 10 mois
gbnf-validator 8b576b6c55 Tool call support (generic + native for Llama, Functionary, Hermes, Mistral, Firefunction, DeepSeek) w/ lazy grammars (#9639) il y a 11 mois
gen-docs 7cc2d2c889 ggml : move AMX to the CPU backend (#10570) il y a 1 an
gguf 53ff6b9b9f GGUF: C++ refactor, backend support, misc fixes (#11030) il y a 1 an
gguf-hash 53ff6b9b9f GGUF: C++ refactor, backend support, misc fixes (#11030) il y a 1 an
gguf-split f11cfdfd7f ci : use -no-cnv in gguf-split tests (#11254) il y a 1 an
gritlm e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
imatrix e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
infill e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
jeopardy 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) il y a 1 an
llama-bench e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
llama.android e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
llama.swiftui e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
llava e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
lookahead e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
lookup e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
main e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
parallel e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
passkey e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
perplexity e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
quantize 5bbe6a9fe9 ggml : portability fixes for VS 2017 (#12150) il y a 10 mois
quantize-stats e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
retrieval e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
rpc 86bf31cfe6 rpc-server : add support for the SYCL backend (#10934) il y a 1 an
run e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
save-load-state e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
server e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
simple afa8a9ec9b llama : add `llama_vocab`, functions -> methods, naming (#11110) il y a 1 an
simple-chat e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
simple-cmake-pkg 68ff663a04 repo : update links to new url (#11886) il y a 11 mois
speculative e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
speculative-simple e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) il y a 10 mois
sycl 08d5986290 [SYCL] Optimize mul_mat for Q4_0 on Intel GPU (#12035) il y a 10 mois
tokenize afa8a9ec9b llama : add `llama_vocab`, functions -> methods, naming (#11110) il y a 1 an
tts 5bbe6a9fe9 ggml : portability fixes for VS 2017 (#12150) il y a 10 mois
CMakeLists.txt 0bf2d10c55 tts : add OuteTTS support (#10784) il y a 1 an
Miku.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) il y a 1 an
chat-13B.bat d9ad104440 Create chat-13B.bat (#592) il y a 2 ans
chat-13B.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) il y a 1 an
chat-persistent.sh 8fc393f246 scripts : fix pattern and get n_tokens in one go (#10221) il y a 1 an
chat-vicuna.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) il y a 1 an
chat.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) il y a 1 an
convert_legacy_llama.py a0ec17b32e metadata: Detailed Dataset Authorship Metadata (#8875) il y a 1 an
json_schema_pydantic_example.py 3fd62a6b1c py : type-check all Python scripts with Pyright (#8341) il y a 1 an
json_schema_to_grammar.py 669912d9a5 `tool-call`: fix Qwen 2.5 Coder support, add micro benchmarks, support trigger patterns for lazy grammars (#12034) il y a 10 mois
llama.vim 68ff663a04 repo : update links to new url (#11886) il y a 11 mois
llm.vim ad9ddcff6e llm.vim : stop generation at multiple linebreaks, bind to <F2> (#2879) il y a 2 ans
pydantic_models_to_grammar.py 090fca7a07 pydantic : replace uses of __annotations__ with get_type_hints (#8474) il y a 1 an
pydantic_models_to_grammar_examples.py 68ff663a04 repo : update links to new url (#11886) il y a 11 mois
reason-act.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) il y a 1 an
regex_to_grammar.py e235b267a2 py : switch to snake_case (#8305) il y a 1 an
server-llama2-13B.sh 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) il y a 1 an
server_embd.py 3fd62a6b1c py : type-check all Python scripts with Pyright (#8341) il y a 1 an
ts-type-to-grammar.sh ab9a3240a9 JSON schema conversion: ⚡️ faster repetitions, min/maxLength for strings, cap number length (#6555) il y a 1 an