Xuan Son Nguyen
|
be20e7f49d
Reorganize documentation pages (#8325)
|
преди 1 година |
Georgi Gerganov
|
7ed03b8974
llama : fix compile warning (#8304)
|
преди 1 година |
Natsu
|
1d894a790e
cmake : add GGML_BUILD and GGML_SHARED macro definitions (#8281)
|
преди 1 година |
Ouadie EL FAROUKI
|
1f3e1b66e2
Enabled more data types for oneMKL gemm_batch (#8236)
|
преди 1 година |
Georgi Gerganov
|
148ec970b6
convert : remove AWQ remnants (#8320)
|
преди 1 година |
Georgi Gerganov
|
2cccbaa008
llama : minor indentation during tensor loading (#8304)
|
преди 1 година |
Johannes Gäßler
|
8e558309dc
CUDA: MMQ support for iq4_nl, iq4_xs (#8278)
|
преди 1 година |
Daniele
|
0a423800ff
CUDA: revert part of the RDNA1 optimizations (#8309)
|
преди 1 година |
Douglas Hanley
|
d12f781074
llama : streamline embeddings from "non-embedding" models (#8087)
|
преди 1 година |
Johannes Gäßler
|
bcefa03bc0
CUDA: fix MMQ stream-k rounding if ne00 % 128 != 0 (#8311)
|
преди 1 година |
Pieter Ouwerkerk
|
5a7447c569
readme : fix minor typos [no ci] (#8314)
|
преди 1 година |
Daniel Bevenius
|
61ecafa390
passkey : add short intro to README.md [no-ci] (#8317)
|
преди 1 година |
Georgi Gerganov
|
aa5898dc53
llama : prefer n_ over num_ prefix (#8308)
|
преди 1 година |
Georgi Gerganov
|
6c05752c50
contributing : update guidelines (#8316)
|
преди 1 година |
luoyu-intel
|
a9554e20b6
[SYCL] Fix WARP_SIZE=16 bug of Intel GPU (#8266)
|
преди 1 година |
Georgi Gerganov
|
e235b267a2
py : switch to snake_case (#8305)
|
преди 1 година |
Neo Zhang Jianyu
|
f09b7cb609
rm get_work_group_size() by local cache for performance (#8286)
|
преди 1 година |
Xuan Son Nguyen
|
a38b884c6c
cli: add EOT when user hit Ctrl+C (#8296)
|
преди 1 година |
Icecream95
|
d7fd29fff1
llama : add OpenELM support (#7359)
|
преди 1 година |
Daniel Bevenius
|
6f63d646c1
tokenize : add --show-count (token) option (#8299)
|
преди 1 година |
ditsuke
|
51d2ebadbb
build: Export hf-to-gguf as snakecase
|
преди 1 година |
ditsuke
|
1e920018d3
doc: Add context for why we add an explicit pytorch source
|
преди 1 година |
ditsuke
|
01a5f06550
chore: Remove rebase artifacts
|
преди 1 година |
ditsuke
|
07786a61a2
chore: Fixup requirements and build
|
преди 1 година |
ditsuke
|
de14e2ea2b
chore: ignore all __pychache__
|
преди 1 година |
ditsuke
|
821922916f
fix: Update script paths in CI scripts
|
преди 1 година |
ditsuke
|
b1c3f26e5e
fix: Actually include scripts in build
|
преди 1 година |
ditsuke
|
b0a46993df
build(python): Package scripts with pip-0517 compliance
|
преди 1 година |
fairydreaming
|
807b0c49ff
Inference support for T5 and FLAN-T5 model families (#5763)
|
преди 1 година |
Daniel Bevenius
|
f8c4c0738d
tests : add _CRT_SECURE_NO_WARNINGS for WIN32 (#8231)
|
преди 1 година |