cturan/llama.cpp

Автор	SHA1 Съобщение	Дата
Kawrakow	89503dcb5f iq3_xxs: quards for the no-imatrix situation (#5334)	преди 1 година
Jared Van Bortel	1ec3332ade YaRN : store rope scaling type as int32_t in memory (#5285)	преди 1 година
Ian Bull	e1e721094d llama : fix memory leak in llama_batch_free (#5252)	преди 1 година
Guoteng	ce32060198 llama : support InternLM2 (#5184)	преди 1 година
Georgi Gerganov	d3bac7d584 llama : reorder build_orion() at correct place (#5118)	преди 1 година
Georgi Gerganov	5cb04dbc16 llama : remove LLAMA_MAX_DEVICES and LLAMA_SUPPORTS_GPU_OFFLOAD (#5240)	преди 1 година
Yiming Cui	d62520eb2c Fix typos of IQ2_XXS and IQ3_XXS in llama.cpp (#5231)	преди 2 години
Jared Van Bortel	e8dc55d006 kompute : llama-bench support and ggml_cpu_has_kompute() (#5226)	преди 2 години
Kawrakow	f4d7e54974 SOTA 3-bit quants (#5196)	преди 2 години
Jared Van Bortel	6daa69ee81 kompute : fix fallback to CPU (#5201)	преди 2 години
Jared Van Bortel	fbf1ddec69 Nomic Vulkan backend (#4456)	преди 2 години
divinity76	2aed77eb06 fix typo "RLIMIT_MLOCK" (#5175)	преди 2 години
0cc4m	2307523d32 ggml : add Vulkan backend (#2059)	преди 2 години
Abhilash Majumder	0f648573dd ggml : add unified SYCL backend for Intel GPUs (#2690)	преди 2 години
Johannes Gäßler	9241c3a2ac Apply min_p to unsorted tokens (#5115)	преди 2 години
Johannes Gäßler	b2b2bf988c Tests for min_p, sampling queue (#5147)	преди 2 години
sharpHL	f2e69d28c0 llama : add support for Orion-14B (#5118)	преди 2 години
Kawrakow	1182cf4d4f Another bucket sort (#5109)	преди 2 години
l3utterfly	5eaf9964fc llama : dynamic temperature sampling (#4972)	преди 2 години
Kawrakow	faa3526a1e Fix Q3_K_XS for MoE models (#5113)	преди 2 години
slaren	1387ea2117 llama : pre-allocate input tensors in a separate buffer (#5100)	преди 2 години
Georgi Gerganov	89758723c7 minor : clean-up some warnings and style (#5094)	преди 2 години
slaren	011e8ec577 llama : fix not enough space in buffer with Qwen (#5086)	преди 2 години
compilade	d6bd4d46dd llama : support StableLM 2 1.6B (#5052)	преди 2 години
Kawrakow	66d575c45c llama : add Q3_K_XS (#5060)	преди 2 години
Shijie	3466c6ebcf llama : add more qwen2 models (#5071)	преди 2 години
slaren	6df465a91d llama : run all KQV ops on the CPU with no KV offload (#5049)	преди 2 години
Shijie	9b75cb2b3c llama : support upcoming Qwen2 (#5037)	преди 2 години
chiranko	2b3b999cac llama : add CodeShell support (#5016)	преди 2 години
John	57e2a7a52a llama : fix falcon arch for tied output embeddings (#4978)	преди 2 години

По-нови По-стари

Commit History Намери

Commit History