cturan/llama.cpp

Autor	SHA1 Mensaje	Fecha
Bowen Han	38dbdf4c05 CUDA: Optimize PAD_REFLECT_1D (#15957)	hace 4 meses
Johannes Gäßler	368560a1e3 CUDA: fix compilation on CC 6.0 (#16091)	hace 4 meses
Eric Curtin	4ca088b036 Add resumable downloads for llama-server model loading (#15963)	hace 4 meses
Georgi Gerganov	703f9e32c4 metal : use function constants for mul_mv_ext kernels (#16074)	hace 4 meses
Sigbjørn Skjæret	ad6bd9083b cuda : add missing F32<->I32 entries in ggml_cuda_cpy_fn (#16060)	hace 4 meses
Radoslav Gerganov	2b6b55a59f server : include usage statistics only when user request them (#16052)	hace 4 meses
Georgi Gerganov	e58174cecb llama : bump max seq limit from 64 to 256 (#15916)	hace 4 meses
Georgi Gerganov	b213fce89b metal : improve F32, F16 and BF16 mat-vec multiplication (#16057)	hace 4 meses
Jhen-Jie Hong	e00f3fd8ff metal : avoid call free for non-owned buffer (#16067)	hace 4 meses
Georgi Gerganov	f2f28380ea metal : handle nil cv during pipeline creation (#16065)	hace 4 meses
Chenguang Li	62c3b645c5 CANN: Remove print (#16044)	hace 4 meses
Reese Levine	d304f459d8 GGML WebGPU: Support for ADD, MUL, RMS_NORM, GET_ROWS operators (#16018)	hace 4 meses
Georgi Gerganov	0320ac5264 metal : refactor + optimize v2 (#15995)	hace 4 meses
Aleksander Grygier	a7a98e0fff SvelteKit-based WebUI (#14839)	hace 4 meses
Xuan-Son Nguyen	8f8f2274ee convert : add Llama4ForCausalLM (#16042)	hace 4 meses
Johannes Gäßler	c959b676be CUDA: fix FA occupancy, optimize tile kernel (#15982)	hace 4 meses
David Ribeiro Alves	cd08fc3ecc common : Fix corrupted memory error on json grammar initialization (#16038)	hace 4 meses
Eve	cb5bb6cc05 vulkan: automatically remove unsupported devices (#15976)	hace 4 meses
Daniel Bevenius	a91d035b90 ci : revert back to macos-13 for macOS-latest-cmake-x64 (#16040)	hace 4 meses
Jie Fu (傅杰)	745cbcf2fe llama-quant : fix the verification of attention layers for encoder-decoder models (#16023)	hace 4 meses
Jie Fu (傅杰)	1cbd80f8cf examples : support encoder-decoder models in the simple example (#16002)	hace 4 meses
Shane A	85286f3548 model : add OLMo3 support (#16015)	hace 4 meses
Chenguang Li	d5fabe3682 CANN: Optimize ggml_cann_set_device (#15935)	hace 4 meses
jacekpoplawski	8ff206097c llama-bench: add --n-cpu-moe support (#15952)	hace 4 meses
Daniel Bevenius	77475530b8 ci : use macos-latest for arm64 webgpu build (#16029)	hace 4 meses
Daniel Bevenius	3913f8730e ggml : fix padding in timestep embedding kernels (#15932)	hace 4 meses
Daniel Bevenius	76888d202e ci : upload xcframework artifact from ios-xcode-build job (#16010)	hace 4 meses
Bowen Han	f1fbffb5c0 fix: apply clang-format to CUDA macros (#16017)	hace 4 meses
Daniel Bevenius	51abc96bdc ci : update macos-latest* jobs to use macos-latest (#15938)	hace 4 meses
Yuri Khrustalev	07808ebb07 cmake : Do not install tools on iOS targets (#15903)	hace 4 meses

Posterior Anterior

Historial de Commits Buscar

Historial de Commits