cturan/llama.cpp

Autor	SHA1 Zpráva	Datum
Theia Vogel	877b4d0c62 llama : add support for control vectors (#5970)	před 1 rokem
Andrew Canis	12247f4c69 llama : add Command-R support (#6033)	před 1 rokem
Ting Lou	4e9a7f7f7f llava : change API to pure C style for Rust FFI bindgen (#6079)	před 1 rokem
slaren	3020327f6c cuda : disable unused cudaLaunchHostFunc code (#6078)	před 1 rokem
Neo Zhang Jianyu	46acb36767 fix set main gpu error (#6073)	před 1 rokem
Georgi Gerganov	131b058409 make : ggml-metal.o depends on ggml.h	před 1 rokem
AidanBeltonS	753e36f650 [SYCL] Fix non-intel device selection (#6042)	před 1 rokem
Ondřej Čertík	7ce2c77f88 gguf : add support for I64 and F64 arrays (#6062)	před 1 rokem
Xuan Son Nguyen	aab606a11f llama : add Orion chat template (#6066)	před 1 rokem
slaren	b0bc9f4a9d llama-bench : use random tokens to improve accuracy with mixtral (#6069)	před 1 rokem
Georgi Gerganov	4755afd1cb llama : fix integer overflow during quantization (#6063)	před 1 rokem
Steve Grubb	6e0438da3c gguf : fix resource leaks (#6061)	před 1 rokem
Ondřej Čertík	727107707a gguf-py : bump version to 0.8.0 (#6060)	před 1 rokem
Michael Podvitskiy	69ff61397d llama : support models without vocabulary (#5798)	před 1 rokem
Georgi Gerganov	044ec4b2a5 embedding : add EOS token if not present (#899)	před 1 rokem
Georgi Gerganov	77178eedc8 gguf-py : fix dtype check (#6045)	před 1 rokem
Jian Liao	15a333260a readme : improve readme for Llava-1.6 example (#6044)	před 1 rokem
Pierrick Hymbert	43241adf22 server: disable debug release type sanitizer, simplify trigger (#6047)	před 1 rokem
Georgi Gerganov	a44bc969e4 llama : fix typo	před 1 rokem
Michael Podvitskiy	2c4fb69246 llama : optimize defrag moves + fix fragmentation calculation (#6037)	před 1 rokem
Ondřej Čertík	3ca23481dd gguf-py : add support for I8, I16 and I32 (#6045)	před 1 rokem
Georgi Gerganov	3fe8d7a17f ggml : designate enum vals for integer types (#6050)	před 1 rokem
Georgi Gerganov	68265ebfc6 embedding : print all resulting embeddings (#899)	před 1 rokem
Georgi Gerganov	381da2d9f0 metal : build metallib + fix embed path (#6015)	před 1 rokem
Georgi Gerganov	0fd6c1f015 embedding : print cosine similarity (#899)	před 1 rokem
Linwei Wang	19885d205e readme : update details about running llama in Termux on Android (#6039)	před 1 rokem
Georgi Gerganov	76a936c893 readme : update API changes and hot topics	před 1 rokem
Clint Herron	463628372d grammar : handle missing "root" node (#6004)	před 1 rokem
slaren	f30ea47a87 llama : add pipeline parallelism support (#6017)	před 1 rokem
slaren	d8fd0ccf6a test-backend-ops : skip CPU backend by default (#6028)	před 1 rokem

Novější Starší

Historie revizí Hledat

Historie revizí