Galunid
|
1af511fc22
Add convert.py removal to hot topics (#7662)
|
hai 1 ano |
Sertaç Özercan
|
0541f06296
[no ci] docs: add aikit to readme (#7650)
|
hai 1 ano |
JohnnyB
|
9022c33646
Fixed painfully slow single process builds. (#7326)
|
hai 1 ano |
Georgi Gerganov
|
5921b8f089
llama : cache llama_token_to_piece (#7587)
|
hai 1 ano |
Martin Delille
|
5dcdf94676
Fix conan badge display [no ci] (#7645)
|
hai 1 ano |
Manuel
|
2e2340de17
Add brew installation instruction to README [no ci] (#7616)
|
hai 1 ano |
Martin Delille
|
7846540bd2
readme : add Conan badge (#7638)
|
hai 1 ano |
Brian
|
e6157f94c8
github: add contact links to issues and convert question into research [no ci] (#7612)
|
hai 1 ano |
Galunid
|
9c4c9cc83f
Move convert.py to examples/convert-legacy-llama.py (#7430)
|
hai 1 ano |
Chris Elrod
|
59b0d07766
faster avx512 exp implementation (#7551)
|
hai 1 ano |
junchao-loongson
|
d5c05821f3
ggml : fix loongarch build (O2 issue) (#7636)
|
hai 1 ano |
Johannes Gäßler
|
972b555ab9
README: explain parallel build [no ci] (#7618)
|
hai 1 ano |
Meng, Hengyu
|
3854c9d07f
[SYCL] fix intel docker (#7630)
|
hai 1 ano |
Galunid
|
eb57fee51f
gguf-py : Add tokenizer.ggml.pre to gguf-new-metadata.py (#7627)
|
hai 1 ano |
Georgi Gerganov
|
55d62262a9
metal : remove invalid asserts (#7617)
|
hai 1 ano |
Georgi Gerganov
|
975ec63ff2
metal : add missing asserts (#7617)
|
hai 1 ano |
Georgi Gerganov
|
fb76ec31a9
ggml : fix YARN + add tests + add asserts (#7617)
|
hai 1 ano |
Georgi Gerganov
|
cce3dcffc5
cuda : non-cont concat support (#7610)
|
hai 1 ano |
Radoslav Gerganov
|
210d99173d
llama-bench : add support for the RPC backend (#7435)
|
hai 1 ano |
slaren
|
87bdf2a199
ggml : use atomic_flag for critical section (#7598)
|
hai 1 ano |
Georgi Gerganov
|
00281b7be3
scripts : remove mpi remnants
|
hai 1 ano |
Georgi Gerganov
|
2ab977282b
sync : ggml
|
hai 1 ano |
Georgi Gerganov
|
72de268bec
ggml : restore ggml_rope_xpos_inplace (ggml/0)
|
hai 1 ano |
Akarshan Biswas
|
0e8d8bfd6c
Add Arc A750 and Arch linux to readme-sycl.md as verified GPU model and Linux distro (#7605)
|
hai 1 ano |
zhouwg
|
504f0c340f
ggml : fix typo in ggml.c (#7603)
|
hai 1 ano |
Meng, Hengyu
|
b864b50ce5
[SYCL] Align GEMM dispatch (#7566)
|
hai 1 ano |
jaime-m-p
|
02c1ecad07
Tokenizer WPM fixes (#7500)
|
hai 1 ano |
Georgi Gerganov
|
6bd12ce409
sycl : fix assert (#7563)
|
hai 1 ano |
Giuseppe Scrivano
|
5442939fcc
llama : support small Granite models (#7481)
|
hai 1 ano |
k.h.lai
|
56411a950f
vulkan: properly initialize vulkan devices for LLAMA_SPLIT_MODE_NONE (#7552)
|
hai 1 ano |