cturan/llama.cpp

Автор	SHA1 Сообщение	Дата
Pierrick Hymbert	81da18e71c eval-callback: use ggml_op_desc to pretty print unary operator name (#6631)	1 год назад
Georgi Gerganov	9ed2737acc ci : disable Metal for macOS-latest-cmake-x64 (#6628)	1 год назад
Clint Herron	04a5ac211e Optimization: eliminate addition of redundant stacks when advancing grammar. (#6616)	1 год назад
Clint Herron	f7001ccc5a As suggested by @slaren, disabling Metal for test to fix CI build on OSX from #6576 (#6619)	1 год назад
Nikolas	a474f50ebb Refactor Error Handling for CUDA (#6575)	1 год назад
Olivier Chafik	cbaadc9294 grammars: 1.5x faster inference w/ complex grammars (vector reserves / reuses) (#6609)	1 год назад
Hugo Roussel	1bbdaf6ecd ci: download artifacts to release directory (#6612)	1 год назад
Daniel Bevenius	f4183afe6a scripts : add --outdir option to hf.sh (#6600)	1 год назад
Pierrick Hymbert	b804b1ef77 eval-callback: Example how to use eval callback for debugging (#6576)	1 год назад
Daniel Bevenius	8228b66dbc gguf : add option to not check tensor data (#6582)	1 год назад
Ralph Soika	b3a96f27f0 minor layout improvements (#6572)	1 год назад
slaren	4f407a0a35 llama : add model types for mixtral (#6589)	1 год назад
slaren	65c64dc36f convert.py : add consolidated.safetensors for mixtral 8x22b (#6587)	1 год назад
Pierrick Hymbert	67fac4b95f docs : how to add a model (#6565)	1 год назад
Artem Zinnatullin	29122d32ac readme : fix ROCm link (#6579)	1 год назад
sjxx	b231b37b09 readme : update UI list (#6560)	1 год назад
Jiří Sejkora	ba5e134e07 readme: fix typo in amdgpu target name (#6573)	1 год назад
Jared Van Bortel	1b67731e18 BERT tokenizer fixes (#6498)	1 год назад
Georgi Gerganov	c4a3a4ff47 sync : ggml	1 год назад
Ed Lee	400d5d722d server : detect search query to start webchat (#6554)	1 год назад
Carolinabanana	5dc9dd7152 llama : add Command R Plus support (#6491)	1 год назад
Georgi Gerganov	e11a8999b5 license : update copyright notice + add AUTHORS (#6405)	1 год назад
Georgi Gerganov	cc4a95426d llama : fix attention layer count sanity check (#6550)	1 год назад
kunnis	cecd8d3c98 Comment explaining a decision (#6531)	1 год назад
Georgi Gerganov	b73e564b16 quantize : fix precedence of cli args (#6541)	1 год назад
Rick G	e3c337d87c llama : support negative ith in llama_get_ API (#6519)	1 год назад
Jan Boon	beea6e1b16 llama : save and restore kv cache for single seq id (#6341)	1 год назад
Abhilash Majumder	87fb5b4234 remove row=1 cond (#6532)	1 год назад
Firat	d752327c33 Adding KodiBot to UI list (#6535)	1 год назад
Mark Fairbairn	855f54402e Change Windows AMD example to release build to make inference much faster. (#6525)	1 год назад

Новее Раньше

История коммитов Найти

История коммитов