| .. |
|
baby-llama
|
ab336a9d5e
code : normalize enum names (#5697)
|
1 год назад |
|
batched
|
95d576b48e
metal : pad n_ctx by 32 (#6177)
|
1 год назад |
|
batched-bench
|
f30ea47a87
llama : add pipeline parallelism support (#6017)
|
1 год назад |
|
batched.swift
|
f486f6e1e5
ggml : add numa options (#5377)
|
1 год назад |
|
beam-search
|
f486f6e1e5
ggml : add numa options (#5377)
|
1 год назад |
|
benchmark
|
5b09797321
ggml : remove old quantization functions (#5942)
|
1 год назад |
|
convert-llama2c-to-ggml
|
92397d87a4
convert-llama2c-to-ggml : enable conversion of GQA models (#6237)
|
1 год назад |
|
embedding
|
deb7240100
embedding : adjust `n_ubatch` value (#6296)
|
1 год назад |
|
export-lora
|
6e4e973b26
ci : add an option to fail on compile warning (#3952)
|
1 год назад |
|
finetune
|
ab336a9d5e
code : normalize enum names (#5697)
|
1 год назад |
|
gguf
|
6e0438da3c
gguf : fix resource leaks (#6061)
|
1 год назад |
|
gguf-split
|
f482bb2e49
common: llama_load_model_from_url split support (#6192)
|
1 год назад |
|
gritlm
|
b5f4ae09c3
gritlm : add initial README.md (#6086)
|
1 год назад |
|
imatrix
|
280345968d
cuda : rename build flag to LLAMA_CUDA (#6299)
|
1 год назад |
|
infill
|
4d4d2366fc
convert : automatically fall back to HfVocab if tokenizer.model doesn't exist (#5821)
|
1 год назад |
|
jeopardy
|
a8777ad84e
parallel : add option to load external prompt file (#3416)
|
2 лет назад |
|
llama-bench
|
280345968d
cuda : rename build flag to LLAMA_CUDA (#6299)
|
1 год назад |
|
llama.android
|
7ab7b733bb
android : fix utf8 decoding error (#5935)
|
1 год назад |
|
llama.swiftui
|
f30ea47a87
llama : add pipeline parallelism support (#6017)
|
1 год назад |
|
llava
|
280345968d
cuda : rename build flag to LLAMA_CUDA (#6299)
|
1 год назад |
|
lookahead
|
f486f6e1e5
ggml : add numa options (#5377)
|
1 год назад |
|
lookup
|
50ccaf5eac
lookup: complement data from context with general text statistics (#5479)
|
1 год назад |
|
main
|
280345968d
cuda : rename build flag to LLAMA_CUDA (#6299)
|
1 год назад |
|
main-cmake-pkg
|
280345968d
cuda : rename build flag to LLAMA_CUDA (#6299)
|
1 год назад |
|
parallel
|
c2101a2e90
llama : support Mamba Selective State Space Models (#5328)
|
1 год назад |
|
passkey
|
9d533a77d0
llama : fix defrag bugs + add parameter (#5735)
|
1 год назад |
|
perplexity
|
f30ea47a87
llama : add pipeline parallelism support (#6017)
|
1 год назад |
|
quantize
|
d25b1c31b0
quantize : be able to override metadata by key (#6321)
|
1 год назад |
|
quantize-stats
|
52bb63c708
refactor : switch to emplace_back to avoid extra object (#5291)
|
1 год назад |
|
retrieval
|
64e7b47c69
examples : add "retrieval" (#6193)
|
1 год назад |
|
save-load-state
|
df845cc982
llama : minimize size used for state save/load (#4820)
|
2 лет назад |
|
server
|
3d032ece8e
server : add `n_discard` parameter (#6300)
|
1 год назад |
|
simple
|
f486f6e1e5
ggml : add numa options (#5377)
|
1 год назад |
|
speculative
|
586e7bc561
sampling : deduplicated code for probability distribution access (#6240)
|
1 год назад |
|
sycl
|
95ad616cdd
[SYCL] fix SYCL backend build on windows is break by LOG() error (#6290)
|
1 год назад |
|
tokenize
|
f486f6e1e5
ggml : add numa options (#5377)
|
1 год назад |
|
train-text-from-scratch
|
6e0438da3c
gguf : fix resource leaks (#6061)
|
1 год назад |
|
CMakeLists.txt
|
64e7b47c69
examples : add "retrieval" (#6193)
|
1 год назад |
|
Miku.sh
|
019fe257bb
MIKU MAYHEM: Upgrading the Default Model for Maximum Fun 🎉 (#2287)
|
2 лет назад |
|
alpaca.sh
|
a17a2683d8
alpaca.sh : update model file name (#2074)
|
2 лет назад |
|
base-translate.sh
|
96e80dabc6
examples : improve base-translate.sh script (#4783)
|
2 лет назад |
|
chat-13B.bat
|
d9ad104440
Create chat-13B.bat (#592)
|
2 лет назад |
|
chat-13B.sh
|
6daa09d879
examples : read chat prompts from a template file (#1196)
|
2 лет назад |
|
chat-persistent.sh
|
ac2219fef3
llama : fix session saving/loading (#3400)
|
2 лет назад |
|
chat-vicuna.sh
|
c36e81da62
examples : add chat-vicuna.sh (#1854)
|
2 лет назад |
|
chat.sh
|
8341a25957
main : log file (#2748)
|
2 лет назад |
|
gpt4all.sh
|
107980d970
examples : add -n to alpaca and gpt4all scripts (#706)
|
2 лет назад |
|
json-schema-pydantic-example.py
|
5b7b0ac8df
json-schema-to-grammar improvements (+ added to server) (#5978)
|
1 год назад |
|
json-schema-to-grammar.py
|
72114edf06
json-schema-to-grammar : fix order of props + non-str const/enum (#6232)
|
1 год назад |
|
llama.vim
|
125d03a503
llama.vim : added api key support (#5090)
|
2 лет назад |
|
llama2-13b.sh
|
73643f5fb1
gitignore : changes for Poetry users + chat examples (#2284)
|
2 лет назад |
|
llama2.sh
|
73643f5fb1
gitignore : changes for Poetry users + chat examples (#2284)
|
2 лет назад |
|
llm.vim
|
ad9ddcff6e
llm.vim : stop generation at multiple linebreaks, bind to <F2> (#2879)
|
2 лет назад |
|
make-ggml.py
|
ac43576124
make-ggml.py : compatibility with more models and GGUF (#3290)
|
2 лет назад |
|
pydantic-models-to-grammar-examples.py
|
d292f4f204
examples : make pydantic scripts pass mypy and support py3.8 (#5099)
|
2 лет назад |
|
pydantic_models_to_grammar.py
|
d292f4f204
examples : make pydantic scripts pass mypy and support py3.8 (#5099)
|
2 лет назад |
|
reason-act.sh
|
7c2227a197
chmod : make scripts executable (#2675)
|
2 лет назад |
|
regex-to-grammar.py
|
5b7b0ac8df
json-schema-to-grammar improvements (+ added to server) (#5978)
|
1 год назад |
|
server-embd.py
|
2002bc96bf
server : refactor (#5882)
|
1 год назад |
|
server-llama2-13B.sh
|
7c2227a197
chmod : make scripts executable (#2675)
|
2 лет назад |
|
ts-type-to-grammar.sh
|
5b7b0ac8df
json-schema-to-grammar improvements (+ added to server) (#5978)
|
1 год назад |