cturan/llama.cpp

Автор	SHA1 Сообщение	Дата
Jeff Bolz	a813badbbd vulkan: im2col and matmul optimizations for stable diffusion (#10942)	1 год назад
Jeff Bolz	fdd2188912 vulkan: Use push constant offset to handle misaligned descriptors (#10987)	1 год назад
Isaac McFadyen	f865ea149d server: added more docs for response_fields field (#10995)	1 год назад
Alexey Parfenov	16cdce7b68 server : fix token duplication when streaming with stop strings (#10997)	1 год назад
Eve	d79d8f39b4 vulkan: multi-row k quants (#10846)	1 год назад
Peter	d283d02bf2 examples, ggml : fix GCC compiler warnings (#10983)	1 год назад
Reza Kakhki	9ba399dfa7 server : add support for "encoding_format": "base64" to the */embeddings endpoints (#10967)	1 год назад
Djip007	2cd43f4900 ggml : more perfo with llamafile tinyblas on x86_64 (#10714)	1 год назад
NeverLucky	09fe2e7613 server: allow filtering llama server response fields (#10940)	1 год назад
Georgi Gerganov	30caac3a68 llama : the WPM vocabs use the CLS token as BOS (#10930)	1 год назад
Diego Devesa	60cfa728e2 ggml : use wstring for backend search paths (#10960)	1 год назад
Diego Devesa	3327bb0f8d ggml : fix arm enabled features check (#10961)	1 год назад
Diego Devesa	32d6ee6385 ggml : fix const usage in SSE path (#10962)	1 год назад
Xuan Son Nguyen	14b699ecde server : fix missing model id in /model endpoint (#10957)	1 год назад
Xuan Son Nguyen	485dc01214 server : add system_fingerprint to chat/completion (#10917)	1 год назад
Radoslav Gerganov	86bf31cfe6 rpc-server : add support for the SYCL backend (#10934)	1 год назад
Yun Dou	b92a14a841 llama : support InfiniAI Megrez 3b (#10893)	1 год назад
ymcki	6f0c9e034b llama : support for Llama-3_1-Nemotron-51B (#10669)	1 год назад
Eric Curtin	dab76c92cc llama-run : include temperature option (#10899)	1 год назад
yuri@FreeBSD	7024d59e6a ggml : fix run-time on FreeBSD in get_executable_path() (#10948)	1 год назад
Rudi Servo	7c0e285858 devops : add docker-multi-stage builds (#10832)	1 год назад
Billel Mokeddem	7ae33a616f llama : add Falcon3 support (#10883)	1 год назад
Jeff Bolz	ebdee9478c vulkan: build fixes for 32b (#10927)	1 год назад
Georgi Gerganov	5cd85b5e00 convert : add BertForMaskedLM (#10919)	1 год назад
Jeff Bolz	a91a41364b vulkan: optimize coopmat2 dequant functions (#10855)	1 год назад
Adrien Gallouët	e34c5af43f ggml-cpu: replace NEON asm with intrinsics in ggml_gemv_q4_0_4x8_q8_0() (#10874)	1 год назад
Akarshan Biswas	eb5c3dc64b SYCL: Migrate away from deprecated ggml_tensor->backend (#10840)	1 год назад
Xuan Son Nguyen	0ca416c91a server : (UI) fix copy to clipboard function (#10916)	1 год назад
Diego Devesa	21ae3b9be8 ggml : add test for SVE and disable when it fails (#10906)	1 год назад
Molly Sophia	0a11f8b7b5 convert : fix RWKV v6 model conversion (#10913)	1 год назад

Новее Раньше

История коммитов Найти

История коммитов