cturan/llama.cpp

Автор	SHA1 Съобщение	Дата
Jared Van Bortel	fbf1ddec69 Nomic Vulkan backend (#4456)	преди 1 година
divinity76	2aed77eb06 fix typo "RLIMIT_MLOCK" (#5175)	преди 1 година
Wu Jian Ping	c82d18e863 server : embeddings compatibility for OpenAI (#5190)	преди 1 година
Georgi Gerganov	14fef85e2d py : fix except (#5194)	преди 1 година
Sang-Kil Park	e76627bcce py : improve BPE tokenizer support (#5189)	преди 1 година
slaren	fbe7dfa53c ggml : add max buffer sizes to opencl and metal backends (#5181)	преди 1 година
Eve	172ac82629 cmake : fix Vulkan build (#5182)	преди 1 година
Paul Tsochantaris	d2f650cb5b metal : free metal objects (#5161)	преди 1 година
Georgi Gerganov	35dec26cc2 sync : ggml	преди 1 година
Georgi Gerganov	d460510c72 ggml : minor type fix (int64_t -> size_t)	преди 1 година
0cc4m	2307523d32 ggml : add Vulkan backend (#2059)	преди 1 година
Abhilash Majumder	0f648573dd ggml : add unified SYCL backend for Intel GPUs (#2690)	преди 1 година
Georgi Gerganov	b764b8f1d0 flake.lock: Update (#5162)	преди 1 година
Johannes Gäßler	9241c3a2ac Apply min_p to unsorted tokens (#5115)	преди 2 години
Johannes Gäßler	b2b2bf988c Tests for min_p, sampling queue (#5147)	преди 2 години
Marcus Dunn	af4980bfed readme : add link to rust bindings (#5148)	преди 2 години
sharpHL	f2e69d28c0 llama : add support for Orion-14B (#5118)	преди 2 години
Kyle Mistele	39baaf55a1 docker : add server-first container images (#5157)	преди 2 години
John	6db2b41a76 llava : support for Yi-VL and fix for mobileVLM (#5093)	преди 2 години
Georgi Gerganov	753eafed0e sync : ggml	преди 2 години
Judd	e976423005 ggml : check ggml_add src1 type (ggml/708)	преди 2 години
Michael Klimenko	35a2ee9143 Remove unused data and add fixes (#5154)	преди 2 години
Maximilian Winter	ec903c0341 server : add self-extend support (#5104)	преди 2 години
0cc4m	a1d6df129b Add OpenCL add kernel (#5151)	преди 2 години
Jared Van Bortel	bbe7c56c99 cmake : pass CPU architecture flags to nvcc (#5146)	преди 2 години
slaren	62fead3ea0 cuda : fix tensor size calculation for non-split buffer (#5145)	преди 2 години
slaren	15b4538ff2 ggml-alloc : add 10% margin to the buffer sizes (#5149)	преди 2 години
snadampal	7032f4f634 ggml : update softmax n_task calculation (#5126)	преди 2 години
Georgi Gerganov	5f1925a8ce scripts : move run-with-preset.py from root to scripts folder	преди 2 години
Georgi Gerganov	3b7c914de2 tests : gitignore test-c.o	преди 2 години

По-нови По-стари

Commit History Намери

Commit History