Przemysław Pawełczyk
|
182adefcf3
ggml : expose SSE3 and SSSE3 for MSVC when AVX is available (whisper/2128)
|
1 tahun lalu |
Hong Bo PENG
|
0d26d8ccd8
ggml : optimize for ppc64le using VSX intrinsics (ggml/784)
|
1 tahun lalu |
Steve Grubb
|
4f0263633b
server: free sampling contexts on exit (#7264)
|
1 tahun lalu |
Brian
|
1265c670fd
Revert "move ndk code to a new library (#6951)" (#7282)
|
1 tahun lalu |
Radoslav Gerganov
|
5e31828d3e
ggml : add RPC backend (#6829)
|
1 tahun lalu |
slaren
|
541600201e
llama : disable pipeline parallelism with nkvo (#7265)
|
1 tahun lalu |
Elton Kola
|
efc8f767c8
move ndk code to a new library (#6951)
|
1 tahun lalu |
Haggai Nuchi
|
e0f556186b
Add left recursion check: quit early instead of going into an infinite loop (#7083)
|
1 tahun lalu |
Ryuei
|
27f65d6267
docs: Fix typo and update description for --embeddings flag (#7026)
|
1 tahun lalu |
compilade
|
ee52225067
convert-hf : support direct Q8_0 conversion (#7234)
|
1 tahun lalu |
Georgi Gerganov
|
614d3b914e
llama : less KV padding when FA is off (#7257)
|
1 tahun lalu |
k.h.lai
|
30e70334f7
llava-cli: fix base64 prompt (#7248)
|
1 tahun lalu |
Johannes Gäßler
|
1c570d8bee
perplexity: add BF16 vs. FP16 results (#7150)
|
1 tahun lalu |
Neo Zhang
|
948f4ec7c5
[SYCL] rm wait() (#7233)
|
1 tahun lalu |
Joan Fontanals
|
9aa672490c
llama : rename jina tokenizers to v2 (#7249)
|
1 tahun lalu |
Brian
|
b1f8af1886
convert.py: Outfile default name change and additional metadata support (#4858)
|
1 tahun lalu |
Benjamin Findley
|
e586ee4259
change default temperature of OAI compat API from 0 to 1 (#7226)
|
1 tahun lalu |
Neo Zhang
|
cbf75894d2
[SYCL] Add oneapi runtime dll files to win release package (#7241)
|
1 tahun lalu |
Neo Zhang
|
0d5cef78ae
[SYCL] update CI with oneapi 2024.1 (#7235)
|
1 tahun lalu |
Johannes Gäßler
|
dc685be466
CUDA: add FP32 FlashAttention vector kernel (#7188)
|
1 tahun lalu |
Georgi Gerganov
|
6f1b63606f
cmake : fix version cmp (#7227)
|
1 tahun lalu |
slaren
|
b228aba91a
remove convert-lora-to-ggml.py (#7204)
|
1 tahun lalu |
Georgi Gerganov
|
7bd4ffb780
metal : fix warnings (skipme) (#0)
|
1 tahun lalu |
Georgi Gerganov
|
1622ac023f
sync : ggml
|
1 tahun lalu |
Georgi Gerganov
|
6aeff24f8b
metal : fix indent (ggml/0)
|
1 tahun lalu |
Georgi Gerganov
|
325756d28d
ggml : resolve merge (ggml/0)
|
1 tahun lalu |
Josh Ramer
|
fed0108491
Scripting & documenting debugging one test without anything else in the loop. (#7096)
|
1 tahun lalu |
Xuan Son Nguyen
|
72c177c1f6
fix system prompt handling (#7153)
|
1 tahun lalu |
compilade
|
5a419926b0
convert-hf : support bfloat16 conversion (#7158)
|
1 tahun lalu |
Georgi Gerganov
|
fae9d234b6
sync : ggml
|
1 tahun lalu |