cturan/llama.cpp @ c0956b09ba845a7cd787d5580d7c8b96e80f40f5

Wouter 7dbdba5690 llama : add llama-3 chat template (#6751)		1 tahun lalu
..
.gitignore	2c4f566c88 tests : gitignore ggml-common.h	1 tahun lalu
CMakeLists.txt	7593639ce3 `main`: add --json-schema / -j flag (#6659)	1 tahun lalu
get-model.cpp	413e7b0559 ci : add model tests + script wrapper (#4586)	2 tahun lalu
get-model.h	413e7b0559 ci : add model tests + script wrapper (#4586)	2 tahun lalu
run-json-schema-to-grammar.mjs	5b7b0ac8df json-schema-to-grammar improvements (+ added to server) (#5978)	1 tahun lalu
test-autorelease.cpp	f486f6e1e5 ggml : add numa options (#5377)	1 tahun lalu
test-backend-ops.cpp	0d56246f4b ggml : group all experts in a single ggml_mul_mat_id (#6505)	1 tahun lalu
test-c.c	fbf1ddec69 Nomic Vulkan backend (#4456)	1 tahun lalu
test-chat-template.cpp	7dbdba5690 llama : add llama-3 chat template (#6751)	1 tahun lalu
test-double-float.cpp	207b51900e ggml : move FP16 <-> FP32 code to ggml-impl.h (#3861)	2 tahun lalu
test-grad0.cpp	5bf3953d7e cuda : improve cuda pool efficiency using virtual memory (#4606)	2 tahun lalu
test-grammar-integration.cpp	cbaadc9294 grammars: 1.5x faster inference w/ complex grammars (vector reserves / reuses) (#6609)	1 tahun lalu
test-grammar-parser.cpp	5d3de51f97 ggml, common, examples, tests : fixed type arguments in printf (#5528)	1 tahun lalu
test-json-schema-to-grammar.cpp	ab9a3240a9 JSON schema conversion: ⚡️ faster repetitions, min/maxLength for strings, cap number length (#6555)	1 tahun lalu
test-llama-grammar.cpp	5d3de51f97 ggml, common, examples, tests : fixed type arguments in printf (#5528)	1 tahun lalu
test-model-load-cancel.cpp	f486f6e1e5 ggml : add numa options (#5377)	1 tahun lalu
test-opt.cpp	ab336a9d5e code : normalize enum names (#5697)	1 tahun lalu
test-quantize-fns.cpp	1f2fd4e727 tests : include IQ2_XXS and IQ2_XS in test-quantize-fns (#6303)	1 tahun lalu
test-quantize-perf.cpp	a07d0fee1f ggml : add mmla kernels for quantized GEMM (#4966)	1 tahun lalu
test-rope.cpp	ec893798b7 llama : custom attention mask + parallel decoding + no context swaps (#3228)	2 tahun lalu
test-sampling.cpp	26d4efd11e sampling: fix top_k <= 0 (#5388)	1 tahun lalu
test-tokenizer-0-falcon.cpp	f486f6e1e5 ggml : add numa options (#5377)	1 tahun lalu
test-tokenizer-0-falcon.py	f23c0359a3 ci : add flake8 to github actions (python linting) (#4129)	2 tahun lalu
test-tokenizer-0-llama.cpp	f486f6e1e5 ggml : add numa options (#5377)	1 tahun lalu
test-tokenizer-0-llama.py	f23c0359a3 ci : add flake8 to github actions (python linting) (#4129)	2 tahun lalu
test-tokenizer-1-bpe.cpp	83796e62bc llama : refactor unicode stuff (#5992)	1 tahun lalu
test-tokenizer-1-llama.cpp	83796e62bc llama : refactor unicode stuff (#5992)	1 tahun lalu