Georgi Gerganov
|
b8e2194efc
sync : ggml
|
7 luni în urmă |
Kai Pastor
|
1a3b5e80f7
Add in-build ggml::ggml ALIAS library (ggml/1260)
|
7 luni în urmă |
Georgi Gerganov
|
1f63e75f3b
metal : use less stack memory in FA kernel (#14088)
|
7 luni în urmă |
Georgi Gerganov
|
40cbf571c9
kv-cache : fix shift and defrag logic (#14081)
|
7 luni în urmă |
Diego Devesa
|
7f4fbe5183
llama : allow building all tests on windows when not using shared libs (#13980)
|
7 luni în urmă |
xctan
|
f470bc36be
ggml-cpu : split arch-specific implementations (#13892)
|
7 luni în urmă |
Diego Devesa
|
8f47e25f56
cuda : fix device sync on buffer clear (#14033)
|
7 luni în urmă |
Georgi Gerganov
|
201b31dc2e
graph : fix geglu (#14077)
|
7 luni în urmă |
Xinpeng Dou
|
e21d2d4ae2
CANN: Simplify the environment variable setting(#13104)
|
7 luni în urmă |
R0CKSTAR
|
dc0623fddb
webui: fix sidebar being covered by main content (#14082)
|
7 luni în urmă |
Georgi Gerganov
|
87d34b381d
server : fix LRU check (#14079)
|
7 luni în urmă |
Nicolò Scipione
|
b460d16ae8
sycl: Add reorder to Q6_K mmvq implementation (#13885)
|
7 luni în urmă |
Đinh Trọng Huy
|
91a8ee6a6f
add geglu activation function (#14074)
|
7 luni în urmă |
Yuanhao Ji
|
056eb74534
CANN: Enable labeler for Ascend NPU (#13914)
|
7 luni în urmă |
Diego Devesa
|
247e5c6e44
cuda : fix buffer type check with integrated GPUs (#14069)
|
7 luni în urmă |
吴小白
|
5787b5da57
ci: add LoongArch cross-compile build (#13944)
|
7 luni în urmă |
Akarshan Biswas
|
228f34c9ce
SYCL: Implement few same quantized type copy kernels (#13739)
|
7 luni în urmă |
Sigbjørn Skjæret
|
0974ad7a7c
llama : fix llama_model_chat_template with template name (LLM_KV with suffix) (#14050)
|
7 luni în urmă |
Georgi Gerganov
|
745aa5319b
llama : deprecate llama_kv_self_ API (#14030)
|
7 luni în urmă |
Georgi Gerganov
|
487a5e0401
context : fix SWA-related warning for multiple sequences (#14045)
|
7 luni în urmă |
Sigbjørn Skjæret
|
d17a809ef0
llama : support multiple classifier outputs and labels (#13940)
|
7 luni în urmă |
Sigbjørn Skjæret
|
1caae7fc6c
gguf-py : add add_classifier_output_labels method to writer (#14031)
|
7 luni în urmă |
Masato Nakasaka
|
669c13e0f6
vulkan: Enable VK_KHR_cooperative_matrix extension for Intel Xe2 GPUs (#14001)
|
7 luni în urmă |
pockers21
|
146b88e8b3
ci: fix CUDA build failure on autodl cloud machines (#14005)
|
7 luni în urmă |
Georgi Gerganov
|
7f37b6cf1e
memory : migrate from llama_kv_cache to more generic llama_memory (#14006)
|
7 luni în urmă |
Diego Devesa
|
3a077146a4
llama : allow using mmap without PrefetchVirtualMemory, apply GGML_WIN_VER to llama.cpp sources (#14013)
|
7 luni în urmă |
Olexandr88
|
d01d112abb
readme : add badge (#13938)
|
7 luni în urmă |
Sigbjørn Skjæret
|
9f47fa5792
vocab : warn about missing mask token (#14022)
|
7 luni în urmă |
Georgi Gerganov
|
9e31bec4fd
context : fix pos_min initialization upon error decode (#14008)
|
7 luni în urmă |
Jeff Bolz
|
5a8ae3053c
vulkan: automatically deduce size of push constants (#13936)
|
7 luni în urmă |