cturan/llama.cpp

Pembuat	SHA1 Pesan	Tanggal
Behnam M	cd108e641d server : add a `/health` endpoint (#4860)	2 tahun lalu
Brian	57d016ba2d llama : add additional suffixes for model params (#4834)	2 tahun lalu
Austin	329ff61569 llama : recognize 1B phi models (#4847)	2 tahun lalu
John	d34633d8db clip : support more quantization types (#4846)	2 tahun lalu
Johannes Gäßler	4f56458d34 Python script to compare commits with llama-bench (#4844)	2 tahun lalu
Austin	6efb8eb30e convert.py : fix vanilla LLaMA model conversion (#4818)	2 tahun lalu
Justine Tunney	36e5a08b20 llava-cli : don't crash if --image flag is invalid (#4835)	2 tahun lalu
Georgi Gerganov	4dccb38d9a metal : improve dequantize precision to match CPU (#4836)	2 tahun lalu
Georgi Gerganov	9a818f7c42 scripts : improve get-pg.sh (#4838)	2 tahun lalu
iohub	18adb4e9bb readme : add 3rd party collama reference to UI list (#4840)	2 tahun lalu
Georgi Gerganov	d9653894df scripts : script to get Paul Graham essays in txt format (#4838)	2 tahun lalu
Behnam M	128de3585b server : update readme about token probs (#4777)	2 tahun lalu
Zsapi	8c58330318 server : add api-key flag to documentation (#4832)	2 tahun lalu
Georgi Gerganov	18c2e1752c ggml : fix vld1q_s8_x4 32-bit compat (#4828)	2 tahun lalu
Johannes Gäßler	8f900abfc0 CUDA: faster softmax via shared memory + fp16 math (#4742)	2 tahun lalu
howlger	1fc2f265ff common : fix the short form of `--grp-attn-w`, not `-gat` (#4825)	2 tahun lalu
Georgi Gerganov	a9a8c5de3d readme : add link to SOTA models	2 tahun lalu
Kawrakow	dd5ae06405 SOTA 2-bit quants (#4773)	2 tahun lalu
Georgi Gerganov	668b31fc7d swift : exclude ggml-metal.metal from the package (#4822)	2 tahun lalu
Georgi Gerganov	42ea63c5a3 llama.swiftui : update readme	2 tahun lalu
Georgi Gerganov	52531fdff8 main : add self-extend support (#4815)	2 tahun lalu
Georgi Gerganov	b0034d93ce examples : add passkey test (#3856)	2 tahun lalu
Lars Grammel	b7e7982953 readme : add lgrammel/modelfusion JS/TS client for llama.cpp (#4814)	2 tahun lalu
slaren	226460cc0d llama-bench : add no-kv-offload parameter (#4812)	2 tahun lalu
Johannes Gäßler	d5a410e855 CUDA: fixed redundant value dequantization (#4809)	2 tahun lalu
Georgi Gerganov	9dede37d81 llama : remove unused vars (#4796)	2 tahun lalu
Georgi Gerganov	3c36213df8 llama : remove redundant GQA check (#4796)	2 tahun lalu
Alex Azarov	72d8407b36 llama.swiftui : use llama.cpp as SPM package (#4804)	2 tahun lalu
Georgi Gerganov	d117d4dc5d llama : print tensor meta for debugging	2 tahun lalu
Alex Azarov	3418c03ecc llama.swiftui : add visionOS target (#4805)	2 tahun lalu

Terbaru Lawas

Komit Sejarah Cari

Komit Sejarah