cturan/llama.cpp

Tác giả	SHA1 Thông báo	Ngày
Georgi Gerganov	7a32fcb3b2 ggml : add Q8_0 quantization format (rename the old one to Q8_1) (ARM NEON) (#1179)	2 năm trước cách đây
unbounded	dd0eabc049 ggml : use full range for Q4_0 and Q4_2 quantization (#729)	2 năm trước cách đây
xaedes	54bb60e268 ggml : fix bug in ggml_compute_forward_sum_f32 (#1162)	2 năm trước cách đây
Georgi Gerganov	8a0f8673ba ggml : export symbols (#1155)	2 năm trước cách đây
xaedes	0c5692345d examples : add save_load_state example (#1150)	2 năm trước cách đây
Georgi Gerganov	957c8ae21d llama : increase scratch buffer size for 65B (ref #1152)	2 năm trước cách đây
mgroeber9110	9b0a4d4214 examples/main README improvements and some light refactoring (#1131)	2 năm trước cách đây
Stephan Walter	2ec83428de Fix build for gcc 8 and test in CI (#1154)	2 năm trước cách đây
slaren	e4cf982e0d Fix cuda compilation (#1128)	2 năm trước cách đây
Georgi Gerganov	c4fe84fb0d llama : refactor get / set state + remove redundant kv cache API (#1143)	2 năm trước cách đây
slaren	1d78fecdab Fix LoRA acronym (#1145)	2 năm trước cách đây
Georgi Gerganov	284685f169 scripts : add helper scripts to synch ggml repo	2 năm trước cách đây
DannyDaemonic	edce63baa9 Added README.md for main with examples and explanations (#1139)	2 năm trước cách đây
Georgi Gerganov	ec9cdb6752 ggml : do not print perf ops that have not been used at all	2 năm trước cách đây
Georgi Gerganov	e4422e299c ggml : better PERF prints + support "LLAMA_PERF=1 make"	2 năm trước cách đây
Stephan Walter	53c8434398 Improve AVX2 for vec_dot_q4_3_q8_0 (#1138)	2 năm trước cách đây
Pavol Rusnak	c6524f46eb readme : update gpt4all instructions (#980)	2 năm trước cách đây
Yishuo Wang	c9e2c26f41 A better `packNibbles` and `mul_sum_i8_pairs_float` implementation using AVX512 (#1119)	2 năm trước cách đây
Georgi Gerganov	0e018fe008 ggml : fix Q4_3 cuBLAS	2 năm trước cách đây
Stephan Walter	857308d1e8 ci : trigger CI for drafts, but not most PR actions (#1125)	2 năm trước cách đây
Stephan Walter	c50b628810 Fix CI: ARM NEON, quantization unit tests, editorconfig (#1122)	2 năm trước cách đây
unbounded	5f939498d5 ggml : unit test for quantization functions (#953)	2 năm trước cách đây
wbpxre150	36b4f7e064 llama : print timings on ctrl+c exit (#1021)	2 năm trước cách đây
eiery	10f19c1121 llama : have n_batch default to 512 (#1091)	2 năm trước cách đây
Howard Su	7e312f165c cmake : fix build under Windows when enable BUILD_SHARED_LIBS (#1100)	2 năm trước cách đây
Georgi Gerganov	872c365a91 ggml : fix AVX build + update to new Q8_0 format	2 năm trước cách đây
Georgi Gerganov	955ef9a5d5 ggml : alternative Q4_3 implementation using modified Q8_0 (#1109)	2 năm trước cách đây
Stephan Walter	c5aa5e5777 ggml : AVX2 optimization for vec_dot_q4_3_q8_0 and refactoring (#1099)	2 năm trước cách đây
Clint Herron	e9a9cb0c54 examples : Improve Alpaca Default Repeat Penalty: Better Match Alpaca.cpp Experience (#1107)	2 năm trước cách đây
xaedes	b6e7f9b09e llama : add api for getting/setting the complete state: rng, logits, embedding and kv_cache (#1105)	2 năm trước cách đây

Mới hơn Cũ hơn

Lịch sử commit Tìm kiếm

Lịch sử commit