Georgi Gerganov c41bde6fbd metal : add residency sets keep-alive heartbeat (#17766) 1 месяц назад
..
batched 6ab8eacddf examples : add -kvu to batched usage example [no ci] (#17469) 1 месяц назад
batched.swift 29f538ac63 examples : remove references to `make` in examples [no ci] (#15457) 4 месяцев назад
convert-llama2c-to-ggml a81283820a gguf: gguf_writer refactor (#15691) 4 месяцев назад
deprecation-warning f112d198cd Update deprecation-warning.cpp (#10619) 1 год назад
diffusion 4902eebe33 models : Added support for RND1 Diffusion Language Model (#17433) 1 месяц назад
embedding e072b2052e ggml : add GGML_SCHED_NO_REALLOC option to disable reallocations in ggml_backend_sched (#17276) 1 месяц назад
eval-callback 196f5083ef common : more accurate sampling timing (#17382) 1 месяц назад
gen-docs 7cc2d2c889 ggml : move AMX to the CPU backend (#10570) 1 год назад
gguf 5886f4f545 examples(gguf): GGUF example outputs (#17025) 2 месяцев назад
gguf-hash 53ff6b9b9f GGUF: C++ refactor, backend support, misc fixes (#11030) 1 год назад
idle c41bde6fbd metal : add residency sets keep-alive heartbeat (#17766) 1 месяц назад
llama.android 745aa5319b llama : deprecate llama_kv_self_ API (#14030) 7 месяцев назад
llama.swiftui 745aa5319b llama : deprecate llama_kv_self_ API (#14030) 7 месяцев назад
lookahead 2f37014073 lookahead : add sample command to readme (#15447) 5 месяцев назад
lookup 745aa5319b llama : deprecate llama_kv_self_ API (#14030) 7 месяцев назад
model-conversion ff55414c42 model : Qwen3 Next (#16095) 1 месяц назад
parallel 2adf8d83ac parallel : add option for different RNG seeds (#14757) 6 месяцев назад
passkey 29f538ac63 examples : remove references to `make` in examples [no ci] (#15457) 4 месяцев назад
retrieval 29f538ac63 examples : remove references to `make` in examples [no ci] (#15457) 4 месяцев назад
save-load-state 00131d6eaf tests : update for LLAMA_SET_ROWS=1 (#14961) 5 месяцев назад
simple 1cbd80f8cf examples : support encoder-decoder models in the simple example (#16002) 4 месяцев назад
simple-chat d7f5f4e578 simple-chat : fix context-exceeded condition (#14494) 6 месяцев назад
simple-cmake-pkg 817d743cc1 examples : add missing code block end marker [no ci] (#17756) 1 месяц назад
speculative e92d53b29e sampling : optimize samplers by reusing bucket sort (#15665) 4 месяцев назад
speculative-simple d8914fc47e common : add --override-tensor-draft, --cpu-moe-draft and --n-cpu-moe-draft parameters (#15191) 5 месяцев назад
sycl 7d2add51d8 sycl : support to malloc memory on device more than 4GB, update the doc and script (#17566) 1 месяц назад
training 5cdb27e091 finetune: SGD optimizer, more CLI args (#13873) 5 месяцев назад
CMakeLists.txt c41bde6fbd metal : add residency sets keep-alive heartbeat (#17766) 1 месяц назад
convert_legacy_llama.py a0ec17b32e metadata: Detailed Dataset Authorship Metadata (#8875) 1 год назад
json_schema_pydantic_example.py 3fd62a6b1c py : type-check all Python scripts with Pyright (#8341) 1 год назад
json_schema_to_grammar.py 0874693b44 common : fix json schema with '\' in literals (#17307) 1 месяц назад
llama.vim 9ebebef62f llama : remove KV cache defragmentation logic (#15473) 4 месяцев назад
pydantic_models_to_grammar.py 090fca7a07 pydantic : replace uses of __annotations__ with get_type_hints (#8474) 1 год назад
pydantic_models_to_grammar_examples.py 1d36b3670b llama : move end-user examples to tools directory (#13249) 8 месяцев назад
reason-act.sh e9b6350e61 scripts : make the shell scripts cross-platform (#14341) 6 месяцев назад
regex_to_grammar.py e235b267a2 py : switch to snake_case (#8305) 1 год назад
server-llama2-13B.sh e9b6350e61 scripts : make the shell scripts cross-platform (#14341) 6 месяцев назад
server_embd.py a19b5cef16 llama : fix FA when KV cache is not used (i.e. embeddings) (#12825) 9 месяцев назад
ts-type-to-grammar.sh e9b6350e61 scripts : make the shell scripts cross-platform (#14341) 6 месяцев назад