cturan/llama.cpp

Autor	SHA1 Permisiunea de a trimite mesaje. Dacă este dezactivată, utilizatorul nu va putea trimite nici un fel de mesaj	Data
Michael Podvitskiy	2c4fb69246 llama : optimize defrag moves + fix fragmentation calculation (#6037)	1 an în urmă
Ondřej Čertík	3ca23481dd gguf-py : add support for I8, I16 and I32 (#6045)	1 an în urmă
Georgi Gerganov	3fe8d7a17f ggml : designate enum vals for integer types (#6050)	1 an în urmă
Georgi Gerganov	68265ebfc6 embedding : print all resulting embeddings (#899)	1 an în urmă
Georgi Gerganov	381da2d9f0 metal : build metallib + fix embed path (#6015)	1 an în urmă
Georgi Gerganov	0fd6c1f015 embedding : print cosine similarity (#899)	1 an în urmă
Linwei Wang	19885d205e readme : update details about running llama in Termux on Android (#6039)	1 an în urmă
Georgi Gerganov	76a936c893 readme : update API changes and hot topics	1 an în urmă
Clint Herron	463628372d grammar : handle missing "root" node (#6004)	1 an în urmă
slaren	f30ea47a87 llama : add pipeline parallelism support (#6017)	1 an în urmă
slaren	d8fd0ccf6a test-backend-ops : skip CPU backend by default (#6028)	1 an în urmă
AidanBeltonS	b3d978600f Update get version (#6025)	1 an în urmă
Xuan Son Nguyen	99b71c068f Server: Use multi-task for embeddings endpoint (#6001)	1 an în urmă
slaren	306d34be7a ci : remove tidy-review (#6021)	1 an în urmă
Georgi Gerganov	8030da7afe ggml : reuse quantum structs across backends (#5943)	1 an în urmă
Georgi Gerganov	184215e783 ggml : fix UB in IQ2_S and IQ3_S (#6012)	1 an în urmă
Georgi Gerganov	48358b2e5b sycl : update IQ1_S kernels (WIP - not working!) (#5995)	1 an în urmă
gliptic	5cdb371731 grammar : fix unnecessarily retained pointer to rules (#6003)	1 an în urmă
Kawrakow	44ca159faf 1.5 bit: we can do even better (#5999)	1 an în urmă
Georgi Gerganov	05b06210c9 llama : more consistent names of count variables (#5994)	1 an în urmă
Georgi Gerganov	83796e62bc llama : refactor unicode stuff (#5992)	1 an în urmă
Jakub N	828defefb6 Update server docker image URLs (#5997)	1 an în urmă
Xuan Son Nguyen	caa106d4e0 Server: format error to json (#5961)	1 an în urmă
Michael Podvitskiy	3202361c5b ggml, ci : Windows ARM runner and build fixes (#5979)	1 an în urmă
Minsoo Cheong	332bdfd798 server : maintain chat completion id for streaming responses (#5988)	1 an în urmă
Gilad S	ecab1c75de cmake : fix subdir for `LLAMA_METAL_EMBED_LIBRARY` (#5985)	1 an în urmă
Georgi Gerganov	ee35600b90 llama : fix F16/F32 downcast + improve names (#5980)	1 an în urmă
Kawrakow	be858f6205 Better 1.5 bit quantization (#5971)	1 an în urmă
Abhilash Majumder	ef3ced26a3 [SYCL] Add q3_s and q1_s (#5886)	1 an în urmă
AidanBeltonS	3814a07392 [SYCL] Add support for SYCL Nvidia target (#5738)	1 an în urmă

Mai nou Mai vechi

Istoricul angajamentelor Găsiți

Istoricul angajamentelor