cturan/llama.cpp

Автор	SHA1 Сообщение	Дата
Slobodan Josic	756aa1020a HIP : Add HIP 7.0+ compatibility for hipBLAS compute types (#14634)	6 месяцев назад
Georgi Gerganov	aaa088d87f readme : add hot PRs (#14636)	6 месяцев назад
Georgi Gerganov	0d5375d54b llama : move enum llama_vocab_pre_type to implementation (#14631)	6 месяцев назад
Dowon	576c82eda2 vocab : add midm-2.0 model pre-tokenizer (#14626)	6 месяцев назад
Gabe Goodhart	0aedae00e6 model : Granite Four (#13550)	6 месяцев назад
rmatif	6bdda13981 opencl: add tiled mul_mat_f16_f32 (#14535)	6 месяцев назад
lhez	0b8855775c opencl: add `set_rows` for `f16` and `f32` (#14547)	6 месяцев назад
Ryan Mangeno	4bb625b713 Smoldocling support (#14597)	6 месяцев назад
Aman Gupta	11ee0fea2a Docs: script to auto-generate ggml operations docs (#14598)	6 месяцев назад
Eric Zhang	a457551332 cmake : do not search for curl libraries by ourselves (#14613)	6 месяцев назад
Akarshan Biswas	704bb7a71c SYCL: Initial set_rows kernel implementation (#14562)	6 месяцев назад
Xuan-Son Nguyen	435a6d10d6 llama : minor coding style fix for smollm3 (#14605)	6 месяцев назад
Eric Zhang	f9a867f592 cmake : bump llguidance version to v1.0.1 (#14609)	6 месяцев назад
Eric Zhang	ac44eb6c80 cmake : llguidance build parser library only (#14608)	6 месяцев назад
compilade	a57d1bcb3c cuda : support Falcon-H1 state size for SSM_SCAN (#14602)	6 месяцев назад
Xuan-Son Nguyen	cb9178f885 llama : remove llm_graph_input_one (#14603)	6 месяцев назад
compilade	4a5686da22 llama : support Jamba hybrid Transformer-Mamba models (#7531)	6 месяцев назад
Xuan-Son Nguyen	98bab638fb ggml : add ggml_scale_bias (#14417)	6 месяцев назад
Miaoqian Lin	26a48ad699 ggml : prevent integer overflow in gguf tensor size calculation (#14595)	6 месяцев назад
Dowon	ffd59e7d18 model : add skt/A.X-4.0 model vocabulary (#14589)	6 месяцев назад
Sigbjørn Skjæret	105554595f llama : remove unintended whitespace (#14592)	6 месяцев назад
ibrahim khadraoui	04655063c4 model : add support for Falcon-H1 family (#14534)	6 месяцев назад
Xuan-Son Nguyen	20b7bf8a32 convert : fix smollm3 jinja template (#14586)	6 месяцев назад
Jeff Bolz	6efcd65945 vulkan: optimize flash attention split_k_reduce (#14554)	6 месяцев назад
stevenkuang	699f4392a3 model : fix hunyuan moe chat template (#14584)	6 месяцев назад
Xuan-Son Nguyen	08382869a2 model : add SmolLM3 (#14581)	6 месяцев назад
compilade	bb4f7a9e4e memory : fix broken batch splits for recurrent cache (#14575)	6 месяцев назад
Jeff Bolz	b8eeb8741d vulkan : fix rope with partial rotation and non-cont src (#14582)	6 месяцев назад
Alawode Oluwandabira	17a1f0d2d4 server: Add ability to mount server at prefix (#14544)	6 месяцев назад
Xuan-Son Nguyen	8f22dc0a53 model : add hunyuan moe (#14425)	6 месяцев назад

Новее Раньше

История коммитов Найти

История коммитов