cturan/llama.cpp

Autor	SHA1 Mensaxe	Data
Georgi Gerganov	40f74e4d73 llama : add option to render special/control tokens (#6807)	hai 1 ano
Jan Boon	e8d35f47cb doc : add link to falcon (#6789)	hai 1 ano
Mohammadreza Hendiani	2cca09d509 readme : add Fedora instructions (#6783)	hai 1 ano
nopperl	9958c81b79 Implement the OLMo architecture (#6741)	hai 1 ano
Yaroslav	8dd1ec8b3f readme : add UI (#6724)	hai 1 ano
Pierrick Hymbert	4bd0f93e4a model: support arch `DbrxForCausalLM` (#6515)	hai 1 ano
Rene Leonhardt	5c4d767ac0 chore: Fix markdown warnings (#6625)	hai 1 ano
Pierrick Hymbert	67fac4b95f docs : how to add a model (#6565)	hai 1 ano
Artem Zinnatullin	29122d32ac readme : fix ROCm link (#6579)	hai 1 ano
sjxx	b231b37b09 readme : update UI list (#6560)	hai 1 ano
Jiří Sejkora	ba5e134e07 readme: fix typo in amdgpu target name (#6573)	hai 1 ano
Jan Boon	beea6e1b16 llama : save and restore kv cache for single seq id (#6341)	hai 1 ano
Firat	d752327c33 Adding KodiBot to UI list (#6535)	hai 1 ano
Mark Fairbairn	855f54402e Change Windows AMD example to release build to make inference much faster. (#6525)	hai 1 ano
DAN™	e0717e751e Add GritLM as supported models. (#6513)	hai 1 ano
Hoang Nguyen	d0f5deebf8 readme : update UI list (#6503)	hai 1 ano
alexpinel	a307375c02 readme : add Dot to UI list (#6487)	hai 1 ano
Jun Jie	b660a5729e readme : fix typo (#6481)	hai 1 ano
bryanSwk	bb43cf7e9d llama : add SEA-LION support (#6448)	hai 1 ano
Francisco Melo	154d4ee39c readme : add feature-rich rust bindings (#6465)	hai 1 ano
Georgi Gerganov	076b08649e readme : update hot topics	hai 1 ano
Georgi Gerganov	c50a82ce0f readme : update hot topics	hai 1 ano
0cc4m	ba0c7c70ab Vulkan k-quant mmq and ggml-backend offload functionality (#6155)	hai 1 ano
hxer7963	069574775c [Model] Add support for xverse (#6301)	hai 1 ano
zhouwg	b910287954 readme : add project (#6356)	hai 1 ano
Georgi Gerganov	bfe7dafc9c readme : add notice for UI list	hai 1 ano
Mateusz Charytoniuk	1740d6dd4e readme : add php api bindings (#6326)	hai 1 ano
compilade	557410b8f0 llama : greatly reduce output buffer memory usage (#6122)	hai 1 ano
slaren	280345968d cuda : rename build flag to LLAMA_CUDA (#6299)	hai 1 ano
Pierrick Hymbert	dba1af6129 llama_model_loader: support multiple split/shard GGUFs (#6187)	hai 1 ano

Posterior Anterior

Commit History Buscar

Commit History