cturan/llama.cpp

Автор	SHA1 Сообщение	Дата
Johannes Gäßler	aaa4099925 CUDA: remove bad assert (ggml/972)	1 год назад
Jeff Bolz	641002fba8 vulkan : multithread pipeline creation (ggml/963)	1 год назад
Jeff Bolz	0de8b203f1 vulkan : fix build for GGML_VULKAN_RUN_TESTS, add TFLOPS to log (ggml/961)	1 год назад
Salvatore Mesoraca	544f409b4b vulkan : argsort barriers must be under uniform control flow (ggml/951)	1 год назад
Georgi Gerganov	6084bfb261 ggml : fix GGML_MAX_N_THREADS + improve formatting (ggml/969)	1 год назад
matiaslin	faac0bae26 common : ensure llama_batch size does not exceed max size (#9668)	1 год назад
nopperl	f99d3f8367 py : add model class for Chameleon conversion (#9683)	1 год назад
Georgi Gerganov	589b48d41e contrib : add Resources section (#9675)	1 год назад
Georgi Gerganov	f4d2b8846a llama : add reranking support (#9510)	1 год назад
slaren	1b2f992cd2 test-backend-ops : use flops for some performance tests (#9657)	1 год назад
Georgi Gerganov	739842703e llama : add comment about thread-safety [no ci] (#9449)	1 год назад
Zhenwei Jin	6102037bbb vocab : refactor tokenizer to reduce init overhead (#9449)	1 год назад
nopperl	9a913110cf llama : add support for Chameleon (#8543)	1 год назад
Aarni Koskela	43bcdd9703 readme : add tool (#9655)	1 год назад
Dan Johansson	6a0f779484 ggml : add run-time detection of neon, i8mm and sve (#9331)	1 год назад
Markus Tavenrath	89f9944981 Enable use to the rebar feature to upload buffers to the device. (#9251)	1 год назад
Georgi Gerganov	b5de3b74a5 readme : update hot topics	1 год назад
Borislav Stanimirov	44f59b4301 cmake : add option for common library (#9661)	1 год назад
Neo Zhang Jianyu	95bc82fbc0 [SYCL] add missed dll file in package (#9577)	1 год назад
R0CKSTAR	7691654c68 mtgpu: enable VMM (#9597)	1 год назад
Xuan Son Nguyen	ea9c32be71 ci : fix docker build number and tag name (#9638)	1 год назад
Charles Xu	1e43630218 ggml : remove assert for AArch64 GEMV and GEMM Q4 kernels (#9217)	1 год назад
Xuan Son Nguyen	afbbfaa537 server : add more env vars, improve gen-docs (#9635)	1 год назад
Gabe Goodhart	3d6bf6919f llama : add IBM Granite MoE architecture (#9438)	1 год назад
Dou Xinpeng	904837e0cb cann: fix crash when llama-bench is running on multiple cann devices (#9627)	1 год назад
Eric Zhang	70392f1f81 ggml : add AVX512DQ requirement for AVX512 builds (#9622)	1 год назад
Georgi Gerganov	bb5f819975 sync : ggml	1 год назад
Georgi Gerganov	c038931615 examples : adapt to ggml.h changes (ggml/0)	1 год назад
Georgi Gerganov	31ac5834fe llama : keep track of all EOG tokens in the vocab (#9609)	1 год назад
Georgi Gerganov	cea1486ecf log : add CONT level for continuing previous log entry (#9610)	1 год назад

Новее Раньше

История коммитов Найти

История коммитов