Pierrick Hymbert
|
e6029348e8
ci : schedule slow server tests only on Release or on demand (#5839)
|
1 an în urmă |
Pierrick Hymbert
|
8ef969afce
server : init http requests thread pool with --parallel if set (#5836)
|
1 an în urmă |
Georgi Gerganov
|
fa974646e1
flake.lock: Update (#5842)
|
1 an în urmă |
Pierrick Hymbert
|
9731134296
server: tests: passkey challenge / self-extend with context shift demo (#5832)
|
1 an în urmă |
Michael Podvitskiy
|
4a6e2d6142
llama : add abort_callback to interrupt computation (#5409)
|
1 an în urmă |
Georgi Gerganov
|
494c870326
ggml : fix IQ3_S AVX implementation (#5834)
|
1 an în urmă |
Jared Van Bortel
|
4d4d2366fc
convert : automatically fall back to HfVocab if tokenizer.model doesn't exist (#5821)
|
1 an în urmă |
Jared Van Bortel
|
c7a0ad8ec9
convert-hf : make model class definitions self-contained (#5825)
|
1 an în urmă |
Kawrakow
|
bbde6eb256
ggml : IQ3_S improvements (#5829)
|
1 an în urmă |
Georgi Gerganov
|
ef2cd694c4
scripts : add pod-llama.sh
|
1 an în urmă |
Xuan Son Nguyen
|
6c32d8c7ad
llama : refactor internal quantization functions (#5830)
|
1 an în urmă |
compilade
|
802da0091b
llama : fix segfault from unknown model arch name (#5820)
|
1 an în urmă |
Neo Zhang Jianyu
|
715641391d
Support multiple GPUs (split mode) on SYCL backend (#5806)
|
1 an în urmă |
crasm
|
9bf297a02b
workflows : remove nocleanup arg for check-requirements.sh (#5826)
|
1 an în urmă |
Tushar
|
cb5e8f7fc4
build(nix): Introduce flake.formatter for `nix fmt` (#5687)
|
1 an în urmă |
nold
|
da3b9ba2b7
convert-hf-to-gguf : require einops for InternLM2ForCausalLM (#5792)
|
1 an în urmă |
Sourab Mangrulkar
|
c29af7e225
llama : add StarCoder2 support (#5795)
|
1 an în urmă |
Georgi Gerganov
|
38d16b1426
server : remove api_like_OAI.py proxy script (#5808)
|
1 an în urmă |
ddpasa
|
c2224f003b
ggml-vulkan: fix VULKAN_CHECK_RESULTS flag, which was previously broken (#5813)
|
1 an în urmă |
kunal-vaishnavi
|
e743386728
gemma : fix bfloat16 -> float16 conversion issue (#5810)
|
1 an în urmă |
Miwa / Ensan
|
f49a535686
common : fix flag `--logits-all` to `--all-logits` (#5805)
|
1 an în urmă |
Pierrick Hymbert
|
3ab8b3a92e
llama : cleanup unused mmq flags (#5772)
|
1 an în urmă |
Douglas Hanley
|
9600d59e01
unicode : switch to multimap based nfd_map (#5799)
|
1 an în urmă |
Pierrick Hymbert
|
5cb02b4a01
server: allow to override threads server pool with --threads-http (#5794)
|
1 an în urmă |
Eve
|
6ea0f010ff
ci : add Ubuntu 22 Vulkan CI run (#5789)
|
1 an în urmă |
Georgi Gerganov
|
f105471ef6
server : fix newlines in help (#5785)
|
1 an în urmă |
AidanBeltonS
|
38d1521608
[SYCL] Use batched mul_mat pathway (#5591)
|
1 an în urmă |
Xuan Son Nguyen
|
052051d8ae
Server: normalize naming (#5779)
|
1 an în urmă |
Marcus Dunn
|
d5ab29757e
llama : constified `llama_set_state_data`'s `src` (#5774)
|
1 an în urmă |
Georgi Gerganov
|
87c91c0766
ci : reduce 3b ppl chunks to 1 to avoid timeout (#5771)
|
1 an în urmă |