cturan/llama.cpp

Autor	SHA1 Nachricht	Datum
Taikono-Himazin	41a11aaf99 ggml : increased GGML_MAX_PARAMS to allow finetuning of 70b models (#4424)	vor 2 Jahren
Yueh-Po Peng	8a7b2fa528 Update README.md (#4388)	vor 2 Jahren
Xiang (Kevin) Li	e18f7345a3 grammar : revert the replacement of llama_token_to_piece with id_to_token (#4396)	vor 2 Jahren
Georgi Gerganov	fe680e3d10 sync : ggml (new ops, tests, backend, etc.) (#4359)	vor 2 Jahren
Georgi Gerganov	bcc0eb4591 llama : per-layer KV cache + quantum K cache (#4309)	vor 2 Jahren
Hongyu Ouyang	81bc9214a3 train : fix #4227 (double free in examples/train-text-from-scratch/train-text-from-scratch.cpp) (#4351)	vor 2 Jahren
Georgi Gerganov	05cd6e5036 server : recognize cache_prompt parameter in OAI API (#4347)	vor 2 Jahren
Georgi Gerganov	caa9249217 common : fix compile warning	vor 2 Jahren
stduhpf	da5eaef1f3 speculative : support `--color` (#4343)	vor 2 Jahren
Marcus Dunn	5f6e0c0dff grammar : pre-computed pieces + reserve mem + less string copies (#4330)	vor 2 Jahren
Kerfuffle	5aa365d88f llama : allow overriding GGUF metadata when loading model (#4092)	vor 2 Jahren
MaggotHATE	52c8bc3cf3 sampling : custom samplers order (#4285)	vor 2 Jahren
kchro3	e4b76bbe31 swift : revert compiler checks for swift package (#4332)	vor 2 Jahren
Daniel Bevenius	23b5e12eb5 simple : update error message for KV cache check (#4324)	vor 2 Jahren
Miwa / Ensan	d208995c6d swift : fix concatenation method to avoid invalid UTF8 stringfication (#4325)	vor 2 Jahren
Miwa / Ensan	5c9f90cba1 swift : fix prompt tokenization logic (#4321)	vor 2 Jahren
Ikko Eltociear Ashimine	4fa44e84ad grammar-parser : fix typo (#4318)	vor 2 Jahren
Georgi Gerganov	fbbc42827b ggml : reuse ggml_get_n_tasks() in ggml_graph_plan() (#4308)	vor 2 Jahren
Georgi Gerganov	adf3de4f69 ggml : fix soft max out-of-bounds access (#4307)	vor 2 Jahren
Ed Lee	33e171d1e9 server : fix OpenAI API `stop` field to be optional (#4299)	vor 2 Jahren
Rickard Edén	6949b50df5 py : add grammar to oai like api (#4294)	vor 2 Jahren
Georgi Gerganov	d7b800b8bc llama : pad KV cache size (#4280)	vor 2 Jahren
Georgi Gerganov	5a7d3125e7 llama : avoid using "optional" keyword (#4283)	vor 2 Jahren
Georgi Gerganov	d5a1cbde60 llama : support optional tensors (#4283)	vor 2 Jahren
Miwa / Ensan	b220222a64 swift : fix token_to_piece implementation (#4278)	vor 2 Jahren
Jared Van Bortel	511f52c334 build : enable libstdc++ assertions for debug builds (#4275)	vor 2 Jahren
CausalLM	03562f3a86 llama : support attention bias on LLaMA architecture (#4283)	vor 2 Jahren
Shijie	37c746d687 llama : add Qwen support (#4281)	vor 2 Jahren
Georgi Gerganov	880f57973b llama : fix integer overflow during quantization (#4284)	vor 2 Jahren
Daniel Bevenius	8d6d9f033b py : add requirements file for convert-hf-to-gguf.py (#4277)	vor 2 Jahren

Neuer Älter

Commit Verlauf Finden

Commit Verlauf