Ujjawal Panchal
|
4b0eff3df5
docs : Quantum -> Quantized (#8666)
|
1 an în urmă |
Fan Shupei
|
8a4bad50a8
llama: use sliding window for phi3 (#8627)
|
1 an în urmă |
MorganRO8
|
68504f0970
readme : update games list (#8673)
|
1 an în urmă |
Joe Todd
|
f19bf99c01
Build Llama SYCL Intel with static libs (#8668)
|
1 an în urmă |
Thorsten Sommer
|
3a7ac5300a
readme : update UI list [no ci] (#8505)
|
1 an în urmă |
Xuan Son Nguyen
|
96952e7181
llama : fix `llama_chat_format_single` for mistral (#8657)
|
1 an în urmă |
Joe Todd
|
79167d9e49
Re-add erroneously removed -fsycl from GGML_EXTRA_LIBS (#8667)
|
1 an în urmă |
Xuan Son Nguyen
|
b115105f05
add llama_lora_adapter_clear (#8653)
|
1 an în urmă |
Xuan Son Nguyen
|
de280085e7
examples : Fix `llama-export-lora` example (#8607)
|
1 an în urmă |
Vali Malinoiu
|
b841d07408
server : fix URL.parse in the UI (#8646)
|
1 an în urmă |
Joe Todd
|
64cf50a0ed
sycl : Add support for non-release DPC++ & oneMKL (#8644)
|
1 an în urmă |
Georgi Gerganov
|
938943cdbf
llama : move vocab, grammar and sampling into separate files (#8508)
|
1 an în urmă |
0cc4m
|
751fcfc6c3
Vulkan IQ4_NL Support (#8613)
|
1 an în urmă |
Jeroen Mostert
|
46e47417aa
Allow all RDNA2 archs to use sdot4 intrinsic (#8629)
|
1 an în urmă |
Georgi Gerganov
|
e7e6487ba0
contrib : clarify PR squashing + module names (#8630)
|
1 an în urmă |
luoyu-intel
|
063d99ad11
[SYCL] fix scratch size of softmax (#8642)
|
1 an în urmă |
Keke Han
|
081fe431aa
llama : fix codeshell support (#8599)
|
1 an în urmă |
Jason Stillerman
|
d94c6e0ccb
llama : add support for SmolLm pre-tokenizer (#8609)
|
1 an în urmă |
Jiří Podivín
|
566daa5a5b
*.py: Stylistic adjustments for python (#8233)
|
1 an în urmă |
Georgi Gerganov
|
6f11a83e4e
llama : allow overrides for tokenizer flags (#8614)
|
1 an în urmă |
Georgi Gerganov
|
e093dd2382
tests : re-enable tokenizer tests (#8611)
|
1 an în urmă |
Douglas Hanley
|
50e05353e8
llama : add Mistral Nemo inference support (#8604)
|
1 an în urmă |
Jan Boon
|
628154492a
server : update doc to clarify n_keep when there is bos token (#8619)
|
1 an în urmă |
Mark Zhuang
|
04bab6b7da
ggml: fix compile error for RISC-V (#8623)
|
1 an în urmă |
devojony
|
b7c11d36e6
examples: fix android example cannot be generated continuously (#8621)
|
1 an în urmă |
Georgi Gerganov
|
45f2c19cc5
flake.lock: Update (#8610)
|
1 an în urmă |
M-A
|
22f281aa16
examples : Rewrite pydantic_models_to_grammar_examples.py (#8493)
|
1 an în urmă |
compilade
|
328884f421
gguf-py : fix some metadata name extraction edge cases (#8591)
|
1 an în urmă |
compilade
|
c69c63039c
convert_hf : fix Gemma v1 conversion (#8597)
|
1 an în urmă |
Johannes Gäßler
|
69c487f4ed
CUDA: MMQ code deduplication + iquant support (#8495)
|
1 an în urmă |