cturan/llama.cpp

Автор	SHA1 Сообщение	Дата
Johannes Gäßler	1613ef8d8e CUDA: CUDART < 11.7 workaround for __hmax, __hmax2 (#7019)	1 год назад
slaren	c4ec9c0d3d ci : exempt confirmed bugs from being tagged as stale (#7014)	1 год назад
Johannes Gäßler	a8f9b07631 perplexity: more statistics, added documentation (#6936)	1 год назад
Kevin Gibbons	f364eb6fb5 switch to using localizedDescription (#7010)	1 год назад
Georgi Gerganov	77e15bec62 metal : remove deprecated error code (#7008)	1 год назад
Kevin Gibbons	a68a1e7ed0 metal : log more info on error (#6987)	1 год назад
Georgi Gerganov	9c67c2773d ggml : add Flash Attention (#5021)	1 год назад
Georgi Gerganov	952d03dbea convert : use utf8 encoding (#7000)	1 год назад
Olivier Chafik	8843a98c2b Improve usability of --model-url & related flags (#6930)	1 год назад
Clint Herron	b8c1476e44 Extending grammar integration tests (#6644)	1 год назад
Daniel Bevenius	5539e6fdd1 main : fix typo in comment in main.cpp (#6985)	1 год назад
Olivier Chafik	b8a7a5a90f build(cmake): simplify instructions (`cmake -B build && cmake --build build ...`) (#6964)	1 год назад
Georgi Gerganov	d2c898f746 ci : tmp disable gguf-split (#6983)	1 год назад
Georgi Gerganov	544f1f10ad ggml : fix __MSC_VER -> _MSC_VER (#6977)	1 год назад
cpumaxx	ffe666572f llava-cli : multiple images (#6969)	1 год назад
Georgi Gerganov	24affa7db3 readme : update hot topics	1 год назад
Georgi Gerganov	f4ab2a4147 llama : fix BPE pre-tokenization (#6920)	1 год назад
David Renshaw	3f167476b1 sampling : use std::random_device{}() for default random seed (#6962)	1 год назад
Christian Zhou-Zheng	3055a41805 convert : fix conversion of some BERT embedding models (#6937)	1 год назад
Przemysław Pawełczyk	577277ffd2 make : change GNU make default CXX from g++ to c++ (#6966)	1 год назад
Przemysław Pawełczyk	ca7f29f568 ci : add building in MSYS2 environments (Windows) (#6967)	1 год назад
Johannes Gäßler	c4f708a93f llama : fix typo LAMMAFILE -> LLAMAFILE (#6974)	1 год назад
DAN™	e00b4a8f81 Fix more int overflow during quant (PPL/CUDA). (#6563)	1 год назад
Xuan Son Nguyen	7bb36ccf91 gguf : enforce that tensor names are unique (#6905)	1 год назад
Neo Zhang	ce023f6f2f add device version in device list (#6959)	1 год назад
github-actions[bot]	6e472f58e4 flake.lock: Update	1 год назад
mgroeber9110	4dba7e8114 Replace "alternative" boolean operator in conditional compilation directive (#6949)	1 год назад
Pierrick Hymbert	b7368332e2 ci: server: tests python env on github container ubuntu latest / fix n_predict (#6935)	1 год назад
agray3	928e0b7013 Reset schedule earlier to allow overlap with ggml graph computation on device (#6933)	1 год назад
Pierrick Hymbert	0c4d489e29 quantize: add imatrix and dataset metadata in GGUF (#6658)	1 год назад

Новее Раньше

История коммитов Найти

История коммитов